Browsing by Author "Moskalevskyi, Bohdan"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Using transitivity information for morphological and syntactic disambiguation of pronouns in Ukrainian(Видавництво Львівської політехніки, 2019-02-26) Kotsyba, Natalia; Moskalevskyi, Bohdan; Samsung Research Poland; Institute for UkrainianНаведено короткий опис декількох електронних ресурсів української мови, а саме два синтаксичні корпуси: Золотий стандарт (біля 130 тис. слів), анотований вручну деревами залежностей Universal Dependencies (https://universaldependencies.org/), що становить тренувальні дані для синтаксичного парсера, та великий (майже 3 мільярди слів) автоматично анотований Загальний синтаксичний корпус (Звідусіль), а також валентний словник українських дієслів. Ці мовні ресурси розробляються в Інституті Української, ГО від 2015 року та є доступні для некомерційного вживання під адресою установи https://mova.institute/. Також описано експериметальне використання валентного словника для покращення якості роботи синтаксичного парсера з використанням машинного навчання та ґрунтовної теоретико-лінгвістичної бази. Прикладом були конструкції особово-присвійних займенників “його”, “її”, “їх”, кожен з яких має понад 24 можливі морфологічні таги, у сполученні з ґерундієвими іменниковими формами, що також можуть мати різні граматичні інтерпретації (із ключовими семантичними ролями або без них). Вибір правильної інтерпретації у багатьох випадках вимагає ідентифікації семантичної ролі іменника, що його заступає у тексті займенник, і/або розв’язання кореференції (анафори). З одного боку, це ускладнює процес уоднозначнення; з іншого боку, ми отримуємо бонус для якісного автоматичного аналізу тексту, необхідного для багатьох застосувань в обробці природних мов (NLP). Проаналізовано типові помилки автоматичного парсингу для досліджуваної конструкції та подано практичні рекомендації до створення тренінгових даних для кращого навчання парсера у майбутньому. Стаття є практичним продовженням лінгвістичного дослідження (Kotsyba, Moskalevskyi 2018 [11]), де подано теоретичне обгрунтування рішення проблеми інтерпретації займенників та ґерундієвих іменників для української мови на тлі інших словянських мов.