Overview of the Ukrainian language resources within the multilingual European MULTEXT-East project, v. 4.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Abstract
Подано огляд комп’ютерних ресурсів для української мови, створених у межах багатомовного європейського проекту MULTEXT-East (MTE, http://nl.ijs.si/ME/V4), доступних безкоштовно для дослідницьких цілей від травня 2010 року. Ресурси охоплюють формальну репрезентацію морфологічно-синтаксичних специфікацій 1239 унікальних граматичних тагів у форматі XML, згідно з вимогами TEI-5, та морфологічно-синтаксичний лексикон на понад 200000 словоформ разом з лемами та тагами. The article presents an overview of computational resources for the Ukrainian language within a multilingual European MULTEXT-East project (MTE, http://nl.ijs.si/ME/V4) freely available for researchers since May 2010, including a formal representation of morphosyntactic specifications consisting of 1239 unique grammatical tags in the XML, TEI-5 compatible, format and a morphosyntactic lexicon covering over 200000 wordforms with lemmas and morphosyntactic codes.
Description
Keywords
комп’ютерні мовні ресурси, обробка природної мови, TEI (Ініціатива Кодування Текстів), стандарти, українська мова, морфологічно-синтаксичні специфікації, граматичний таг, лема, морфологічно-синтаксичний лексикон, computational language resources, NLP, TEI, Text Encoding Initiative, standards, Ukrainian language, morphosyntactic specifications, morphosyntactic lexicon
Citation
Kotsyba N. Overview of the Ukrainian language resources within the multilingual European MULTEXT-East project, v. 4 / Natalia Kotsyba // Вісник Національного університету "Львівська політехніка". – 2013. – № 770 : Інформаційні системи та мережі. – С. 122–129. – Бібліографія: 15 назв.