<?echo(str_replace('

<?echo(trim($value));?>

Кластеризація документів на основі статистичної близькості термів

Амонс О.А., Янов Ю.О., Безпалий І.О.

У статті описано підхід до кластеризації колекції документів з невідомою наперед кількістю кластерів. В основу підходу покладено метод, оснований на статистиці появи ключових термів. Запропоновано модифікацію методу знаходження матриці подібності на основі схожості косинуса. Для аналізу якості й знаходження граничних значень алгоритму використана модифікація функції конкурентної подібності. Підхід реалізований у вигляді прикладного застосування сервера SmartBase. Наведені результати експериментальних досліджень запропонованого підходу до кластеризації інформації з використанням часто вживаного текстового корпусу підтверджують працездатність запропонованих рішень.

Завантажити (pdf)

",$temp_content); $temp_content = $temp_content[1]; $temp_content = explode("

Кластеризація документів на основі статистичної близькості термів

Амонс О.А., Янов Ю.О., Безпалий І.О.

Пошук

Новини