Aspects in developing of a text analizer for processing unstructured text data

No Thumbnail Available

Date

2015

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки

Abstract

Тhe article presents our approach in the elaboration of the system for processing unstructured text data in order to create a structured data output as computer linguistics resources using a lexicon of markers. First, a description of the research on the proposed topic, as well as its relation to the national and international level research is presented, being followed by the depiction of a useful to this particular research functionality - PoS Tagger for Romanian. A special section is dedicated to the algorithm to be used to elaborate our system. Finally, we describe several ways of marker lexicon completion by means of derivation.

Description

Keywords

computational linguistic resources, information technologies, linguistic Web services, unstructured data, linguistic markers

Citation

Petic M. Aspects in developing of a text analizer for processing unstructured text data / Mircea Petic, Ecaterina Osoian // Людина. Комп'ютер. Комунікація : збірник наукових праць / Національний університет "Львівська політехніка", Інститут комп'ютерних наук та інформаційних технологій, Кафедра прикладної лінгвістики. – Львів : Видавництво Львівської політехніки, 2015. – С. 37–40. – Bibliography: 7 titles.