Аналіз та синтез комп’ютерних лінгвістичних систем опрацювання україномовного текстового контенту

Висоцька, Вікторія Анатоліївна

Аналіз та синтез комп’ютерних лінгвістичних систем опрацювання україномовного текстового контенту

Files

disertaciya-visocka-va.pdf (6.91 MB)

referatvisocka-va.pdf (747 KB)

vidhukopponentnfhairova.pdf (39.01 MB)

vidhukopponentoystryzhak.pdf (8.14 MB)

vidhukopponentvishynkarenko.pdf (1.32 MB)

Date

2023

Authors

Висоцька, Вікторія Анатоліївна

Publisher

Національний університет «Львівська політехніка»

Abstract

У дисертації вирішено важливу науково-прикладну проблему аналізу та синтезу комп’ютерних лінгвістичних систем (КЛС) для розв’язання різних задач опрацювання україномовного текстового контенту на основі розроблення нових та удосконаленні відомих моделей, методів та засобів опрацювання природної мови (ОПМ). Аналіз та синтез КЛС базується на застосуванні лінгвістичного аналізу україномовного текстового контенту, інтелектуальному опрацювання текстового потоку контенту, машинному навчанні системи на достовірних даних та статистичному аналізі для знаходження закономірностей появи лінгвістичних подій. Розроблена інформаційна технологія (ІТ) опрацювання україномовного текстового контенту на відміну від існуючих підтримує принцип модульності типової архітектури КЛС для розв’язку конкретної задачі ОПМ та аналізу множини параметрів та метрик ефективності функціонування системи відповідно до поведінки цільової аудиторії. Розроблено загальну структуру КЛС для опрацювання текстового контенту українською мовою та концептуальну схему/модель функціонування типової КЛС на основі моделювання взаємодії основних процесів і компонентів системи, що дало змогу вдосконалити ІТ інтелектуального аналізу текстового потоку на основі опрацювання інформаційних ресурсів. Наведено приклади розроблених КЛС опрацювання україномовного текстового контенту для розв’язку відповідних задач ОПМ, функціонування яких ґрунтується на розроблених та вдосконалених моделях, методах та алгоритмах. The dissertation solves an important scientific and applied problem of analysis and synthesis of computer linguistic systems (CLS) for solving various problems of processing Ukrainian-language text content. It is based on the development and improvement of new and existing models, methods and tools for natural language processing (NLP). The analysis and synthesis of СLS is based on the application of linguistic analysis of Ukrainian-language textual content, intelligent processing of textual flow of content, machine learning of the system based on reliable data, and statistical analysis to find patterns in the appearance of linguistic events. Developed information technology (IT) for processing of Ukrainian-language textual content, unlike the existing ones, supports the modularity principle of the typical architecture of the CLS for solving a specific task of the NLP and analysing a set of parameters and metrics of effectiveness of the system in accordance with the behaviour of the target audience. The general structure of the CLS for the processing of text content in the Ukrainian language and the conceptual scheme/model of functioning of a typical CLS based on the modelling of the interaction of the main processes and components of the system were developed, which made possible to improve IT intellectual analysis of the text flow based on the processing of information resources. There are examples of developed CLS for processing Ukrainian-language textual content for solving relevant tasks of the NLP, functioning of which is based on developed and improved models, methods and algorithms.

Keywords

NLP, комп’ютерна лінгвістика, текстовий контент, українська мова, графемний аналіз, морфологічний аналіз, лексичний аналіз, синтаксичний аналіз, семантичний аналіз, структурний аналіз, прагматичний аналіз, інформаційна технологія, машинне навчання, опрацювання природної мови, інформаційна система, онтологія, ключові слова, стійкі словосполучення, стиль автора, ідентифікація автора, психологічний аналіз тексту, NLP, computational linguistics, text content, Ukrainian language, grapheme analysis, morphological analysis, lexical analysis, syntactic analysis, semantic analysis, structural analysis, pragmatic analysis, information technology, machine learning, natural language processing, information system, ontology, keywords, stable word phrases, author's style, author identification, psychological analysis of the text

Citation

Висоцька В. А. Аналіз та синтез комп’ютерних лінгвістичних систем опрацювання україномовного текстового контенту : дисертаційна робота на здобуття наукового ступеня доктора технічних наук : 10.02.21 – структурна, прикладна і математична лінгвістика / Вікторія Анатоліївна Висоцька ; Міністерство освіти і науки України, Національний університет «Львівська політехніка». – Львів, 2023. – 480 с. – Бібліографія: с. 347–398 (1044 назви).

URI

https://ena.lpnu.ua/handle/ntb/59975

Collections

Автореферати та дисертаційні роботи

Full item page

Аналіз та синтез комп’ютерних лінгвістичних систем опрацювання україномовного текстового контенту

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By