Семантична кластеризація текстових документів методом k–середніх

No Thumbnail Available

Date

2011

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки

Abstract

Запропоновано алгоритм кластеризації текстових документів методом k–середніх у векторному просторі частотних характеристик семантичних полів. Показано ефективність семантичного кластерного аналізу при вивченні класифікацій текстових документів, зокрема за авторством. The algorithm of clusterization of text documents by k–means method in the vector space of frequencies characteristics of semantic fields has been proposed. The effectiveness of semantic cluster analysis for investigation of text documents classifications, particularly authorship has been shown.

Description

Keywords

інтелектуальний аналіз текстів, кластерний аналіз, метод k– середніх, семантичні поля, text mining, cluster analysis, k–means method, semantic fields

Citation

Павлишенко Б. Семантична кластеризація текстових документів методом k–середніх / Б. Павлишенко // Вісник Національного університету "Львівська політехніка". – 2011. – № 710 : Комп’ютерні науки та інформаційні технології. – С. 215-218. – Бібліографія: 7 назв.