Метод лінгвістичного аналізу україномовного комерційного контенту
Loading...
Date
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Abstract
Розв’язано науково-практичну задачу автоматичного виявлення значущих
ключових слів та рубрикації україномовного контенту в інтернет-системах на основі
методу лінгвістичного аналізу текстової інформації. Наведено теоретичне та
експериментальне обґрунтування методу лінгвістичного аналізу україномовного кон-
тенту з використанням стемінгу Портера. Метод спрямовано на автоматичне виявлення
значущих ключових слів україномовного контенту на основі запропонованої фор-
малізації складових аналізу – граматичного (графемного), морфологічного, синтак-
сичного, семантичного, референційного та структурного. The scientific and practical problem of automatic detection of meaningful keywords and
Ukrainian content categorization in Internet systems on the basis of linguistic analysis of text
information is unleashed. The article presents a theoretical and experimental substantiation of
linguistic analysis methods for Ukrainian content using Porter stemming. The method is
directed at the automatic identification of meaningful keywords in the Ukrainian content,
based on the proposed analysis components formalization – the grammatical (grapheme),
morphological, syntactic, semantic, structural and referential.
Description
Keywords
текст, україномовний, алгоритм, контент-моніторінг, ключові слова, контент-аналіз, стеммер Портера, лінгвістичний аналіз, синтаксичний аналіз, text, a Ukrainian, algorithm, content monitoring, keywords, content analysis, Porter stemmer, linguistic analysis, parsing
Citation
Бісікало О. В. Метод лінгвістичного аналізу україномовного комерційного контенту / О. В. Бісікало, В. А. Висоцька // Вісник Національного університету "Львівська політехніка". Серія: Інформаційні системи та мережі. – 2016. – № 854. – С. 185–204. – Бібліографія: 56 назв.