Розробка моделі на основі нейронної мережі для виправлення граматичних помилок у текстах українською мовою

No Thumbnail Available

Date

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет «Львівська політехніка»

Abstract

Бакалаврська кваліфікаційна робота виконана студенткою групи КН-413 Гудимою Анастасією Іванівною. Тема “Розробка моделі на основі нейронної мережі для виправлення граматичних помилок в текстах українською мовою”. Робота направлена на здобуття ступеня бакалавра за спеціальністю 122 «Комп’ютерні науки». Метою дипломної роботи є побудова нейронної мережі для виправлення граматичних помилок у текстах українською. Об’єктом дослідження є аналіз текстових даних, визначення а також виправлення граматичних помилок у них. Під час виконання дипломної роботи було протестовано роботу двох моделей-трансформерів mT5 та mBart-50. Тренувальні дані були завантажені з корпусу UA-GEC, з рівнем анотації ‘gec-fluency’. Розмір тренувального датасету становить близько 32 тисяч речень. Окрім того, для покращення ефективності моделей, було згенеровано 10000 речень синтетичних даних за допомогою наступних методів: переклад А-Б-А, заміна слів на схожі за написанням, штучні помилки в пунктуації. У результаті, з огляду на кількість тренувальних даних, модель досягла хорошої точності, та все ж потребує подальших досліджень. The bachelor's qualification work was completed by a student of the KN-413 group Hudyma Anastasiia Ivanivna. The topic is "Developmant of a neural network based model for correcting grammatical errors in Ukrainian texts". The work is aimed at obtaining a bachelor's degree in 122 "Computer Science". The aim of the diploma thesis is to build a neural network for correcting grammatical errors in Ukrainian texts. The object of research is the analysis of textual data, identification, and correction of grammatical errors in them.

Description

Keywords

обробка природних мов, граматичне виправлення помилок, обробка низько-ресурсних мов, natural language processing, grammatical error correction, low-resource language processin.

Citation

Гудима А. І. Розробка моделі на основі нейронної мережі для виправлення граматичних помилок у текстах українською мовою : пояснювальна записка до бакалаврської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Анастасія Іванівна Гудима ; Національний університет «Львівська політехніка». – Львів, 2023. – 62 с.