Метод лінгвістичного аналізу україномовного комерційного контенту

Loading...
Thumbnail Image

Date

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки

Abstract

Розв’язано науково-практичну задачу автоматичного виявлення значущих ключових слів та рубрикації україномовного контенту в інтернет-системах на основі методу лінгвістичного аналізу текстової інформації. Наведено теоретичне та експериментальне обґрунтування методу лінгвістичного аналізу україномовного кон- тенту з використанням стемінгу Портера. Метод спрямовано на автоматичне виявлення значущих ключових слів україномовного контенту на основі запропонованої фор- малізації складових аналізу – граматичного (графемного), морфологічного, синтак- сичного, семантичного, референційного та структурного. The scientific and practical problem of automatic detection of meaningful keywords and Ukrainian content categorization in Internet systems on the basis of linguistic analysis of text information is unleashed. The article presents a theoretical and experimental substantiation of linguistic analysis methods for Ukrainian content using Porter stemming. The method is directed at the automatic identification of meaningful keywords in the Ukrainian content, based on the proposed analysis components formalization – the grammatical (grapheme), morphological, syntactic, semantic, structural and referential.

Description

Keywords

текст, україномовний, алгоритм, контент-моніторінг, ключові слова, контент-аналіз, стеммер Портера, лінгвістичний аналіз, синтаксичний аналіз, text, a Ukrainian, algorithm, content monitoring, keywords, content analysis, Porter stemmer, linguistic analysis, parsing

Citation

Бісікало О. В. Метод лінгвістичного аналізу україномовного комерційного контенту / О. В. Бісікало, В. А. Висоцька // Вісник Національного університету "Львівська політехніка". Серія: Інформаційні системи та мережі. – 2016. – № 854. – С. 185–204. – Бібліографія: 56 назв.

Endorsement

Review

Supplemented By

Referenced By