Інформаційні системи та мережі
Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/2105
Browse
4 results
Search Results
Item Метод лінгвістичного аналізу україномовного комерційного контенту(Видавництво Львівської політехніки, 2016) Бісікало, О. В.; Висоцька, В. А.Розв’язано науково-практичну задачу автоматичного виявлення значущих ключових слів та рубрикації україномовного контенту в інтернет-системах на основі методу лінгвістичного аналізу текстової інформації. Наведено теоретичне та експериментальне обґрунтування методу лінгвістичного аналізу україномовного кон- тенту з використанням стемінгу Портера. Метод спрямовано на автоматичне виявлення значущих ключових слів україномовного контенту на основі запропонованої фор- малізації складових аналізу – граматичного (графемного), морфологічного, синтак- сичного, семантичного, референційного та структурного. The scientific and practical problem of automatic detection of meaningful keywords and Ukrainian content categorization in Internet systems on the basis of linguistic analysis of text information is unleashed. The article presents a theoretical and experimental substantiation of linguistic analysis methods for Ukrainian content using Porter stemming. The method is directed at the automatic identification of meaningful keywords in the Ukrainian content, based on the proposed analysis components formalization – the grammatical (grapheme), morphological, syntactic, semantic, structural and referential.Item Експериментальне дослідження пошуку значущих ключових слів україномовного контенту(Видавництво Львівської політехніки, 2015) Бісікало, О. В.; Висоцька, В. А.Проведено порівняльне експериментальне дослідження методів пошуку значущих ключових слів україномовного контенту. В основу підходу до автоматичного визначення ключових слів покладено стемінг Портера слів української мови за відстанню Левенштейна, враховано можливості використання тематичного словника та вилучення заблокованих слів. На експериментальній базі зі 100 наукових публікацій технічного спрямування порівняно з авторськими варіантами отримано числові статистичні характеристики точності результатів пошуку. This article presents the comparative experimental research of methods of relevant keywords finding in Ukrainian-language content. Based approach to automatic determination keywords Porter stemming for Ukrainian language words by distance Lowenstein, take into account the possibility of using a thematic dictionary and removal of blocked words is incorporated. On an experimental basis with 100 scientific publications of technical direction compared to the author's version received numerous statistical characteristics of precision results.Item Статистичний аналіз складних залежностей у тексті(Видавництво Львівської політехніки, 2015) Бісікало, О. В.Розглянуто обґрунтування підходу до застосування складних залежностей між словоформами для розв’язання задач семантичного аналізу тексту. Сформульовані основні положення підходу та визначені у вигляді гіпотез основні його переваги. Запропоновано формальне поняття предметної області. Отримано статистичні та інформаційні оцінки зв’язків між лемами тексту, які технологічно можна визначити за допомогою сучасних лінгвістичних пакетів, зокрема DKPro Core. The approach to the application of complex dependencies between word-forms in resolving the semantic text analysis problems has been grounded in the article. General points and main advantages of the approach have been formulated. A formal notion of the subject area has been suggested. The statistical and information estimates of the relations between lemmas have been obtained.They can be determined technologically using modern language packs (DKPro Core).Item Метод формального визначення якості допису на спеціалізованих сайтах(Видавництво Львівської політехніки, 2014) Бісікало, О. В.; Кириленко, Г. О.Розглянуто метод формального визначення якості посту на основі множини вибраних параметрів. Для вирішення цієї проблеми пропонується застосувати Java-бібліотеку Jsoup для парсингу HTML-коду, а також засоби Matlab для побудови дерева рішень, що використовується для визначення показника якості посту. Post quality assessing algorithm based on the set of chosen parameters is considered in the article. To solve the problem the following next instruments will be used: Java library called Jsoup for HTML-code parsing, and Matlab tools for building the decision tree for post quality assessing.