Інформаційні системи та мережі
Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/2105
Browse
2 results
Search Results
Item Парсинг тексту термінологічних словників(Видавництво Львівської політехніки, 2019-02-26) Дорожинська, А. В.; Dorozhynska, Olena; Український мовно-інформаційний фонд НАНУ; Ukrainian Lingua-Information Fund of NAS of UkraineОкреслено коло завдань, підходів і етапів розроблення технології парсинга тексту багатомовного тлумачного термінологічного словника. Дослідження проведено для “Словника української біологічної термінології”. Серед усього словникового розмаїття цей словник обрано тому, що термінологічні словники надають лексико-семантичну базу для подальшого створення систем інтелектуального опрацювання фахових текстів, у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна праця обіймає нормативну загальнонаукову та широковживану термінологію біологічних наук, зафіксовану в сучасних енциклопедичних, загальномовних та спеціальних словниках, у науковій, науково-популярній, навчальній та інформативно-реферативній літературі. Дослідивши обраний словник, ми зможемо узагальнити модель його лексикографічної системи на інші предметні галузі, що створить передумови для формування цілісного багатогалузевого цифрового лексикографічного простору. Робота зі словниками, переведеними у комп’ютерні текстові формати, є дуже неефективною і потребує конвертування їх у формати лексикографічних баз даних, що є спеціальним завданням, не відомим класичній лексикографії. Це і складає зміст терміна “парсинг словників”. У процесі роботи побудовано модель лексикографічної системи, яку покладено в основу XML. Подальша робота із перетворення паперової версії словника на онлайн-систему будується на XML-файлі. Проаналізовано поліграфічне оформлення, організацію і структуру друкованого тексту словника з метою ідентифікації елементів концептуальної моделі Л-системи СУБТ. На основі концептуальної моделі побудовано структуру XML-документа, який пропонується використовувати як посередника між паперовою версією словника та його реалізацією як онлайнової лексикографічної системи. Надалі планується побудова універсальної процедури парсингу з удосконаленням структури XML-документа.Item Лексикографічна база даних збірки Н. Номиса “Українські приказки, прислів’я і таке інше”(Видавництво Львівської політехніки, 2011) Кульчицький, І. М.; Осідач, Н. Б.Досліджено структуру збірки М. Номиса “Українські приказки, прислів’я і таке інше” з метою створення її електронної версії. Запропоновано структурну інформаційну модель лексикографічної бази даних та технологію перетворення збірки з паперової форми у цифрову. The article researches the structure of the collection “Ukrainian adages, proverbs and the like” by M. Nomys with the aim of creating its electronic version. An informational model of the lexicographic database and a technology of transforming the collection from hardcopy into a digital version are suggested.