Інформаційні системи та мережі. – 2010. – №673

Permanent URI for this collectionhttps://ena.lpnu.ua/handle/ntb/6659

Вісник Національного університету "Львівська політехніка"

Статті, вміщені у Віснику, підготовлено за результатами закінчених науково-дослідних робіт з теоретичних основ інформатики, систем баз даних та знань, інформаційного моделювання, розподілених інформаційних систем та мереж, комп'ютерної та математичної лінгвістики. Для науковців, інженерно-технічних працівників, аспірантів, студентів вищих навчальних закладів.

Вісник Національного університету «Львівська політехніка» : [збірник наукових праць] / Міністерство освіти і науки України, Національний університет «Львівська політехніка». – Львів : Видавництво Львівської політехніки, 2010. – № 673 : Інформаційні системи та мережі / відповідальний редактор В. В. Пасічник. – 395 с. : іл.

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    Категоризація електронних документів
    (Видавництво Львівської політехніки, 2010) Годич, О. В.; Наконечний, Ю. С.; Щербина, Ю. М.
    Nowadays, a number of document clustering algorithms are available with number of benefits and trade-offs. The proposed in this article algorithm is an attempt to provide a compromise between quality and complexity, while remaining independent of the language. It uses keyword-based dimensionality reduction technique to create an input space, and then applies Self-Organizing Map for clustering and visualization.Нині існує багато алгоритмів кластеризації документів, кожен з яких має певні переваги та недоліки. Запропонований у цій статті алгоритм є спробою компромісу між якістю категоризації документів і вимогами до обчислювальних ресурсів, залишаючись незалежним від мови документів. Алгоритм використовує техніку пошуку ключових слів документів для формування вхідних даних та карти Кохонена в поєднанні з ієрархічною кластеризацією для категоризації та візуалізації документів.