Особливості бази знань системи автоматизованої побудови логіко-лінгвістичних моделей текстових документів

dc.citation.epage83
dc.citation.issue9
dc.citation.journalTitleВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі
dc.citation.spage75
dc.contributor.affiliationНаціональний авіаційний університет
dc.contributor.affiliationNational Aviation University
dc.contributor.authorВавіленкова, Анастасія
dc.contributor.authorVavilenkova, Anastasiia
dc.coverage.placenameЛьвів
dc.coverage.placenameLviv
dc.date.accessioned2023-06-07T07:02:55Z
dc.date.available2023-06-07T07:02:55Z
dc.date.created2021-03-01
dc.date.issued2021-03-01
dc.description.abstractОкреслено проблему пошуку змістовних одиниць у електронних текстових документах та проаналізовано основні недоліки відомих підходів до видобування знань із текстової інформації. Досліджено особливості побудови логіко-лінгвістичних моделей електронних текстових документів, зокрема описано та досліджено особливості баз знань системи автоматизованої побудови логіко-лінгвістичних моделей україномовних текстових документів. Запропоновано схему формалізації текстової інформації на основі побудови логіко-лінгвістичної моделі електронного текстового документа. У ній першим етапом є формування логіко-лінгвістичних моделей речень природної мови. Для цього використано спеціально розроблений метод автоматизованого формування логіко-лінгвістичних моделей, що ґрунтується на здійсненні синтаксичного аналізу речень природної мови, використанні бази даних у вигляді тезаурусу слів природної мови та бази правил для виявлення логічних зв’язків. Це уможливилось завдяки базі знань 1, яку розробила автор. Ця база використовується для визначення ролі кожного зі слів електронного текстового документа та є продукційною моделлю із формалізованими правилами української мови для формування словосполучень, які можуть утворювати між собою члени речення природної мови. Базу знань 2 створено для пошуку зв’язків між реченнями, що входять до складу електронного текстового документа, вона є сукупністю продукцій, які відображають принципи синтезу логіко-лінгвістичних моделей речень природної мови, тобто правила об’єднання та заміни структурних компонентів логіко-лінгвістичних моделей – речень природної мови. База знань 3, використана для побудови лінгвістичної складової логіко-лінгвістичної моделі текстового документа, є множиною продукцій, що містить правила формування мереж переходів для інтерпретації тематичної прогресії тексту. На конкретних текстових фрагментах продемонстровано застосування розроблених формалізованих правил. Механізм використання запропонованих баз знань дає змогу простежити процес формування логіко-лінгвістичних моделей електронних текстових документів
dc.description.abstractThe article outlines the problem of finding meaningful units in electronic text documents and analyzes the main shortcomings of existing approaches of extracting knowledge from textual information. The article is devoted to the study of the peculiarities of the process of construction of logic and linguistic models of electronic text documents, in particular the description and research of the peculiarities of knowledge bases of the system of automated construction of logic and linguistic models of Ukrainian-language text documents. The author proposes a scheme of formalization of textual information based on the construction of a logic and linguistic model of an electronic text document. The first stage of construction is the formation of logical and linguistic models of natural language sentences, which uses a specially developed method of automated formation of logical and linguistic models. This method is based on parsing sentences of natural language, using words of natural language as a thesaurus database and using a database of rules to identify logical connections. This in turn is made possible by the author's developed knowledge base 1, which is used to determine the role of each word in an electronic text document and serves as a production model with formalized rules of the Ukrainian language for forming phrases that can form members of sentence of natural language. The knowledge base 2 was created by the author to find connections between sentences that are part of an electronic text document and is a set of productions that reflect the principles of synthesis of logic and linguistic models of sentences of natural language, ie the rules of combining and replacing structural components of logic and linguistic models of sentences of natural language. The knowledge base 3, used to build the linguistic component of the logic and linguistic model of a text document, is a set of productions that contains the rules of forming of transition networks to interpret the thematic progression of the text. The application of the developed formalized rules was demonstrated on specific text fragments. Applying the developed knowledge bases allows to trace the process of formation of logic and linguistic models of electronic text documents.
dc.format.extent75-83
dc.format.pages9
dc.identifier.citationВавіленкова А. Особливості бази знань системи автоматизованої побудови логіко-лінгвістичних моделей текстових документів / Анастасія Вавіленкова // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2021. — № 9. — С. 75–83.
dc.identifier.citationenVavilenkova A. Features of the knowledge base of the system of automated construction of logic and linguistic models of text documents / Anastasiia Vavilenkova // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Informatsiini systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2021. — No 9. — P. 75–83.
dc.identifier.doidoi.org/10.23939/sisn2021.09.075
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/59156
dc.language.isouk
dc.publisherВидавництво Львівської політехніки
dc.publisherLviv Politechnic Publishing House
dc.relation.ispartofВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі, 9, 2021
dc.relation.references1. Филиппов, К. А. (2008). Лингвистика текста: курс лекций. Спб.: Изд-во С.-Петерб. ун-та, 336.
dc.relation.references2. Vavilenkova, A. (2020). Modelling of the context links between the natural language sentences. Proceedings of the 9th International Scientific and Practical Conference “Information Control Systems & Technologies” (ICST2020), 282–293.
dc.relation.references3. Bisikalo, O. V., Wojcik, W., Yahimovich, O. V., Smailova, S. (2015). Method of determining of keywords in English texts based on the DKPro Core. Technology Audit and Production Reserves, 1/2(21), 26–30. Retrieved from: https://doi.org/10.15587/2312-8372.2015.37274.
dc.relation.references4. Bengfort,B. Syntax Parsing With CoreNLP and NLTK. Retrieved from: https://www.districtdatalabs.com/syntaxparsing-with-corenlp-and-nltk. (Дата звернення: 05.03.2021).
dc.relation.references5. Gupta, M. Syntactic. Constituency Parsing usiong the CYK algorithm in NLP. Retrieved from: https://medium.com/data-science-in-your-pocket/syntactic-constituency-parsing-using-the-cyk-algorithm-in-nlpeff9c2912b09. (Дата звернення: 04.05.2020).
dc.relation.references6. NLPIR 2020: Proceedings of the 4th International Conference on Natural Language Processing and Information Retrieval, Association for Computing Machinery, New York, United States, Seoul Republic of Korea. Retrieved from: https://dl.acm.org/doi/proceedings/10.1145/3443279. (Дата звернення: 05.03.2021).
dc.relation.references7. NLPAI 2021: 2nd International Conference on Natural Language Processing and Artificial Intelligence. China. Retrieved from: http://www.nlpai.org/. (Дата звернення: 05.03.2021).
dc.relation.references8. Ланде, Д. В. (2014). Елементи комп’ютерної лінгвістики в правовій інформатиці. Київ, НДІІП НАПрН, 168.
dc.relation.references9. Sumam, F., Landeghem, J. V., Moens, M.-F. (2019). Transfer learning for named entity recognition in financial and biomedical documents. Information 2019, 10(8), 248. Retrieved from: https://doi.org/10.3390/info10080248.
dc.relation.references10. Chen, X., Xie. H., Cheng, G., Poon, L., Leng, M., and Wang, F. (2020). Trends and features of the applications of natural language processing techniques for clinical trials text analysis. Applied Sciences, 10, 2157. doi:10.3390/app10062157.
dc.relation.references11. Khairova, N., Mamyrbayev, O., Mukhsina, K. and Kolesnyk, A. (2020). Logical-linguistic model for multilingual Open Information Extraction. Cogent Engineering. doi: 10.1080/23311916.2020.1714829.
dc.relation.references12. Khairova, N., Petrasova, S. and Gautam A. P. S. (2016). The logical-linguistic model of fact extraction from english texts. Communications in Computer and Information Science, Vol. 639. Springer, Cham. Retrieved from: https://doi.org/10.1007/978-3-319-46254-7_51.
dc.relation.references13. Вавіленкова, А. І. (2017), Аналіз і синтез логіко-лінгвістичних моделей речень природної мови: монографія. К.: ТОВ “СІК ГРУП УКРАЇНА”, 152.
dc.relation.references14. Vavilenkova, A. (2015), Basic principles of the synthesis of logical-linguistic models, Cybernetics and systems analysis, Vol. 51(5), 826–834, http:// doi.org/10.1007/s10559-015-9776-z.
dc.relation.referencesen1. Fillipov, К. А. (2008). Text Linguistics. SpB Publisher, 336.
dc.relation.referencesen2. Vavilenkova, A. (2020). Modelling of the context links between the natural language sentences. Proceedings of the 9th International Scientific and Practical Conference “Information Control Systems & Technologies” (ICST2020), 282–293.
dc.relation.referencesen3. Bisikalo, O. V., Wojcik, W., Yahimovich, O. V., Smailova, S. (2015). Method of determining of keywords in English texts based on the DKPro Core. Technology Audit and Production Reserves, 1/2(21), pp. 26–30. Retrieved from: https://doi.org/10.15587/2312-8372.2015.37274.
dc.relation.referencesen4. Bengfort, B. Syntax Parsing With CoreNLP and NLTK. Available at: https://www.districtdatalabs.com/syntaxparsing-with-corenlp-and-nltk. (Accessed: 5 March 2021).
dc.relation.referencesen5. Gupta, M. Syntactic/ Constituency Parsing usiong the CYK algorithm in NLP. Available at: https://medium.com/data-science-in-your-pocket/syntactic-constituency-parsing-using-the-cyk-algorithm-in-nlpeff9c2912b09. (Accessed: 4 May 2020).
dc.relation.referencesen6. NLPIR 2020: Proceedings of the 4th International Conference on Natural Language Processing and Information Retrieval, Association for Computing Machinery, New York, United States, Seoul Republic of Korea. Available at: https://dl.acm.org/doi/proceedings/10.1145/3443279. (Accessed: 5 March 2021).
dc.relation.referencesen7. NLPAI 2021: 2nd International Conference on Natural Language Processing and Artificial Intelligence. China. Available at: http://www.nlpai.org/. (Accessed: 5 March 2021).
dc.relation.referencesen8. Lande, D. V. (2014). The Elements of Computer Linguistics in Legal Informatics. Kyiv, NDIIP NAPrH, 168.
dc.relation.referencesen9. Sumam, F., Landeghem, J. V., Moens, M.-F. (2019). Transfer Learning for Named Entity Recognition in Financial and Biomedical Documents. Information, 10(8), 248. Available at: https://doi.org/10.3390/info10080248.
dc.relation.referencesen10. Chen, X., Xie. H., Cheng, G., Poon, L., Leng, M., and Wang, F. (2020). Trends and features of the applications of natural language processing techniques for clinical trials text analysis. Applied Sciences, 10, 2157. doi:10.3390/app10062157.
dc.relation.referencesen11. Khairova, N., Mamyrbayev, O., Mukhsina, K. and Kolesnyk, A. (2020). Logical-linguistic model for multilingual Open Information Extraction. Cogent Engineering, doi: 10.1080/23311916.2020.1714829.
dc.relation.referencesen12. Khairova, N., Petrasova, S. and Gautam A. P. S. (2016). The logical-linguistic model of fact extraction from english texts. Communications in Computer and Information Science, Vol. 639. Springer, Cham. Available at: https://doi.org/10.1007/978-3-319-46254-7_51.
dc.relation.referencesen13. Vavilenkova, А.І. (2017), Analysis and Synthesis of logic and linguistic models for natural language sentences, TOV “SIK GROUP UKRAINE”, Kyiv, 152.
dc.relation.referencesen14. Vavilenkova, A. (2015), Basic principles of the synthesis of logical-linguistic models, Cybernetics and systems analysis, Vol. 51(5), 826–834. Available at: http://doi.org/10.1007/s10559-015-9776-z.
dc.relation.urihttps://doi.org/10.15587/2312-8372.2015.37274
dc.relation.urihttps://www.districtdatalabs.com/syntaxparsing-with-corenlp-and-nltk
dc.relation.urihttps://medium.com/data-science-in-your-pocket/syntactic-constituency-parsing-using-the-cyk-algorithm-in-nlpeff9c2912b09
dc.relation.urihttps://dl.acm.org/doi/proceedings/10.1145/3443279
dc.relation.urihttp://www.nlpai.org/
dc.relation.urihttps://doi.org/10.3390/info10080248
dc.relation.urihttps://doi.org/10.1007/978-3-319-46254-7_51
dc.relation.urihttp://doi.org/10.1007/s10559-015-9776-z
dc.rights.holder© Національний університет “Львівська політехніка”, 2021
dc.rights.holder© Вавіленкова А., 2021
dc.subjectзмістовні одиниці
dc.subjectприродна мова
dc.subjectелектронний текстовий документ
dc.subjectлогіколінгвістична модель
dc.subjectбаза знань
dc.subjectпродукційна модель
dc.subjectmeaningful units
dc.subjectnatural language
dc.subjectelectronic text document
dc.subjectlogic and linguistic model
dc.subjectknowledge base
dc.subjectproduction model
dc.subject.udc510.635
dc.subject.udc004.891(045)
dc.titleОсобливості бази знань системи автоматизованої побудови логіко-лінгвістичних моделей текстових документів
dc.title.alternativeFeatures of the knowledge base of the system of automated construction of logic and linguistic models of text documents
dc.typeArticle

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
2021n9_Vavilenkova_A-Features_of_the_knowledge_75-83.pdf
Size:
1.41 MB
Format:
Adobe Portable Document Format
Thumbnail Image
Name:
2021n9_Vavilenkova_A-Features_of_the_knowledge_75-83__COVER.png
Size:
372.36 KB
Format:
Portable Network Graphics

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.79 KB
Format:
Plain Text
Description: