Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл

dc.contributor.authorНога, Роман Юрійович
dc.date.accessioned2015-06-03T12:24:39Z
dc.date.available2015-06-03T12:24:39Z
dc.date.issued2015
dc.description.abstractУ дисертаційній роботі розв’язано актуальне наукове завдання розроблення математичних методів і програмних засобів аналізу текстів наукових публікацій для виявлення та дослідження результатів функціонування наукових шкіл, що дає змогу підвищити якість прийняття рішень щодо доцільності підтримки наукових досліджень за рахунок виявлення нових знань у слабоструктурованих документах. Проаналізовано методи опрацювання текстової інформації з множини розрізнених інформаційних ресурсів та визначено можливість їх застосування до аналізу наукових публікацій. Удосконалено метод екстракції даних з наукової публікації. Розроблено алгоритм попередньої рубрикації наукових публікацій з метою визначення ймовірної кількості кластерів. Удосконалено метод кластеризації k-середніх для поділу наукових статей за науковими школами. Визначено метрику якості кластерного рішення. Розроблено алгоритми аналізу наукових публікацій та прогнозування зміни кількісних характристик наукових шкіл таких як кількість публікацій, захисти дисертацій. Спроектовано архітектуру системи аналізу текстів публікацій для формування та аналізу наукових шкіл. Апробовано розроблені методи для електронної бібліотеки та для наукової установи. В диссертационной работе решено актуальное научное задание разработки математических методов и программных средств анализа текстов научных публикаций для выявления и исследования результатов функционирования научных школ, что позволяет повысить качество принятия решений о целесообразности поддержки научных исследований за счет выявления новых знаний в слабоструктурированных документах. Проанализированы методы обработки текстовой информации из множества разрозненных информационных ресурсов. Рассматриваются существующие методы анализа и работы с текстовыми данными, их преимущества, области применения, ограничения и проблемы. Проанализирована возможность их применения к анализу научных публикаций. Определены элементы текстовых документов, которые должны быть получены на основе полнотекстового поиска и экстракции. Усовершенствованы методы экстракции данных из научной публикации и кластеризации k-средних для разделения научных статей по научным школами. Определена метрика качества кластерного решения. Разработан метод определения вероятности появления новых публикаций в научных школах. Предложены алгоритмы анализа научных публикаций и прогнозирования изменения количественных характристик научных школ, таких как количества публикаций и защит диссертаций. Разработан алгоритм классификации публикаций по известным научными школами (рубрикам). Спроектирована архитектура системы анализа текстов публикаций для формирования и анализа научных школ. Определено качество кластеризации. Построено схему базы данных и основные программные модули. Они могут использоваться не только для выявления научных школ на базе анализа текстов публикаций, но и библиотеками для хранения и поиска публикаций, и центрами развития и инноваций для выявления тематик, по которым за определенный период больше публикаций. The dissertation solved the problem of current scientific development of mathematical methods and software tools to analyze texts to identify scientific publications and research results of functioning scientific schools, allowing to increase the quality of decision-making regarding the advisability support research through the discovery of new knowledge in semistructured documents. There are described the methods of processing text information from a plurality of disparate information resources. The method of extraction of data from scientific publications is given. The method of k-means clustering to split research papers for academic schools. There is defined the quality metric of cluster solution. The method of determining the likelihood of new publications in scientific schools is described. There is designed system architecture development and evaluation of scientific schools are given. Developed methods were tested for e-libraries and for academic institutions.uk_UA
dc.identifier.citationНога Р. Ю. Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл : автореферат дисертації на здобуття наукового ступеня кандидата технічних наук : 10.02.21 – структурна, прикладна і математична лінгвістика / Роман Юрійович Нога ; Міністерство освіти і науки України, Національний університет “Львівська політехніка”. – Львів, 2015. – 22 с. – Бібліографія: с. 17–18 (14 назв).uk_UA
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/27646
dc.language.isouauk_UA
dc.publisherНаціональний університет "Львівська політехніка"uk_UA
dc.subjectнаукова школаuk_UA
dc.subjectаналіз тексту публікаціїuk_UA
dc.subjectекстракція інформаціїuk_UA
dc.subjectкластеризаціяuk_UA
dc.subjectтематичне моделюванняuk_UA
dc.subjectнаучная школаuk_UA
dc.subjectанализ текста публикацииuk_UA
dc.subjectэкстракция информацииuk_UA
dc.subjectкластеризацияuk_UA
dc.subjectтематическое моделированиеuk_UA
dc.subjectscientific schooluk_UA
dc.subjectpublication text analysisuk_UA
dc.subjectinformation extractionuk_UA
dc.subjectclusteringuk_UA
dc.subjectthematic designuk_UA
dc.titleМетоди та засоби аналізу текстів публікацій для дослідження діяльності наукових шкілuk_UA
dc.title.alternativeМетоды и средства анализа текстов публикаций для исследования деятельности научных школuk_UA
dc.title.alternativeMethods and tools for text analysis publications to identify and study the functioning scientific schoolsuk_UA
dc.typeAutoreferatuk_UA

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
avt_Noha.pdf
Size:
440.16 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: