Автореферати та дисертаційні роботи

Permanent URI for this collectionhttps://ena.lpnu.ua/handle/ntb/2995

Browse

Search Results

Now showing 1 - 3 of 3
  • Thumbnail Image
    Item
    Iндуктивнi методи та алгоритми самоорганiзацiї моделей даних на основi карт Кохонена
    (Національний університет "Львівська політехніка", 2010) Годич, Олесь Васильович
    The goal of this thesis is to advance the state of inductive data modeling methods and algorithms based on Kohonen’s self-organising maps (SOM) with an emphasis on exploratory data analysis, descriptive data models and data visualisation. All developed improvements and new methods have been eva-luated on a number of datasets from UCI Machine Learning Repository. At the same time an important part of the research is related to the practical applications of the developed methods and algorithms, which cover cases of modeling both structured (medical applications) and unstructured (image seg- mentation) data, including visualisation. In light of the recent trends in the CPU industry moving towards multi-core architectures, the developed during the research software incorporates modifications of SOM training algorithms optimised for symmetric multiprocessing. The first chapter of the thesis introduces all important definitions and provides an interpretation of SOM as an algebraic system provided with a self-organising learning process. It also contains a detailed overview of recent theoretical and practical advancements in SOM. The second chapter provides an in-depth review of the main SOM features and the results of the developed methodology for selecting optimal parameter values for a number of training algorithms in application to analysis of the real-life medical data. As the result the classification success has been increased from 81.92% to 91.43%. The details of a new training method “Neural Migration” and a new dynamic interval self-organising map are provided in chapter three. Their application to the test datasets yields significant improvements over alternatives. The improved algorithm for data visualisation based on SOM and a derived from it image segmentation method is discussed in the fourth chapter. The obtained results correlate with the results of U-Matrix, but in addition it determines groups of map elements responsible for modeling of individual data clusters. The last chapter provides a detailed overview of the developed data mining software and the proposed multi-threaded training algorithm, which yields on average up to 2.8 times performance improvement over the sequential version when executing on Intel Xeon E5504 CPU. An important aspect of the developed software is the use of strictly free and open source libraries, programming languages (Java 1.6 and Scala 2.7) and an environment (Eclipse IDE under Ubuntu OS). The Scala programming language was used for its functional features providing a flexible way for implementing actor-based parallel computations while remaining fully compatible with the Java code-base of the developed software.Диссертация посвящена процессам моделирования данных с использованием карт Кохонена. На основании разработанной методики определения оптимальных значений параметров обучающих методов получен прирост качества классификации с 81.92% до 91.43%. Разработан метод “нейронной миграции” обучения, который основан на идее повышения топологического упорядочения карт, а также динамично-интервальная самоорганизуемая карта, которые обеспечили существенный прирост качества классификации. Усовершенствован метод визуализации кластерной структуры данных, результаты работы которого согласуются с методом U-Matrix. На его основании разработан алгоритм сегментации изображений, который был использован при построении тренажера украинского жестового языка. Разработано математическое и программное обеспечение интеллектуального анализа данных, которое включает многопотоковый алгоритм обучения, который на системе с 4-х ядерным процессором обеспечивает увеличение производительности в 2.8 раза, по сравнению с последовательным алгоритмом. Дисертацiю присвячено процесам моделювання даних на основi карт Кохонена. На основi розробленої методики визначення оптимальних значень параметрiв навчальних методiв досягнуто прирiст успiшностi класифiкацiї з 81.92% до 91.43%. Розроблено метод “нейронної мiґрацiї” навчання, що ґрунтується на iдеї пiдвищення топологiчного впорядкування карт, та розроблено динамiчно-iнтервальну самоорганiзовну карту, якi забезпечили iстотний прирiст успiшностi класифiкацiї. Удосконалено метод вiзуалiзацiї кластерної структури даних, результати роботи якого узгоджуються з методом U-Matrix. На його основi розроблено алгоритм сеґментацiї зображень, який використано при побудовi тренажера української жестової мови. Розроблено математичне та програмне забезпечення для iнтелектуального аналiзу даних, яке iнкорпорує багатопотоковий алгоритм навчання карт, що на системi з чотириядерним процесором забезпечує збiльшення швидкодiї у 2.8 раза, порiвняно з послiдовним алгоритмом.
  • Item
    Методи та інформаційні технології класифікації для завдань видобування даних
    (Національний університет "Львівська політехніка", 2008) Дорошенко, Анастасія Володимирівна
    Dissertation is dedicated to the decision of actual scientific and technical task – creation of new methods and information technologies for solution of classification tasks of data mining by geometrical data modeling. The method of penalty and encouragement is developed in dissertation based on geometrical data modeling and on the rule "winner takes all". This method permits to assure higher accuracy of classification by considering the different weight of classification errors. The method of building separating surface is developed. This method lets increase the dimension and measure of training and testing data due to division data on clusters. The method of sequential smoothing of training data by clusters based on class division tree is developed. This method lets increase the accuracy of classification for data irregularly presented in space of realization. The method of training of geometrical data model is modernized due to usage of optimization by simulating annealing algorithm. The information technologies based on described method for solution tasks of e-commerce are developed. Диссертация посвящена решению актуальной научно-прикладной задачи – разработке методов и информационных технологий классификации для задач интеллектуального анализа данных на основе модели геометрических преобразований. В диссертационной работе для того, чтобы учесть такую особенность интеллектуального анализа данных, как разная значимость ошибок во время классификации, созданы новый метод и информационная технология классификации на основе правила „победитель забирает всё” (WTA) с использованием матрицы штрафов и поощрений, которая даёт возможность учитывать неодинаковую значимость ошибок при распознавании объектов разных классов. Разработан метод кусочного построения разделяющих поверхностей на основе дерева деления на классы, который обеспечивает повышение точности распознавания объектов, для которых в заданном пространстве реализаций не выполняется гипотеза компактности. Предложен, исследован и реализован метод последовательного выравнивания тренировочной выборки по кластерам, формирующимся в узлах дерева, который обеспечивает улучшение точности решения задачи классификации для выборок, представленных неравномерно в пространстве реализаций. Метод обучения нейроподобных структур модели геометрических преобразований усовершенствован за счёт дополнения его процедурой оптимизации методом имитации отжига металла по параметрам главных компонент, что дало возможность улучшить качество классификации благодаря использованию других, кроме среднеквадратичного, критериев качества. Разработаны и применены программные скрипты, написанные на языке Python, которые осуществляют предобработку данных и реализуют разработанные метод выравнивания выборки, метод матрицы штрафов и поощрений и кусочный метод построения разделяющих поверхностей. Созданы и применены для решения задач электронной коммерции информационные технологии на основе разработанных методов. Приведены результаты проведенных экспериментов, которые свидетельствуют об эффективности применения разработанных методов.В дисертації вирішується актуальна науково-прикладна задача – розроблення методів та інформаційних технологій класифікації для завдань видобування даних на основі моделі геометричних перетворень. В дисертаційній роботі з метою врахування такої особливості задач видобування даних, як різна вага помилок під час класифікації, розроблено метод та інформаційну технологію класифікації на основі правила „переможець забирає все” (WTA) з використанням матриці штрафів та заохочень, що надає можливість враховувати неоднакову вагу помилок при розпізнаванні об’єктів різних класів. Розроблено метод кускової побудови розділяючих поверхонь на основі дерева поділу на класи, що забезпечує підвищення точності розпізнавання об’єктів, для яких в заданому просторі реалізацій не виконується гіпотеза компактності. Запропоновано, досліджено і реалізовано метод послідовного вирівнювання тренувальної вибірки по кластерах, що формуються у вузлах дерева, який забезпечує покращання точності розв’язання задач класифікації для вибірок, представлених в просторі реалізацій нерівномірно. Вдосконалено метод навчання нейроподібних структур моделі геометричних перетворень доповненням його процедурою оптимізації методом імітації відпалу металу за параметрами головних компонентів, що дало змогу покращити якість класифікації завдяки використанню інших, окрім середньоквадратичного, критеріїв якості. Розроблено та застосовано програмні скрипти мовою Python, які виконують передобробку даних та реалізують розроблені метод вирівнювання вибірки, метод штрафів і заохочень та кусковий метод побудови розділяючих поверхонь. Створено інформаційні технології на основі розроблених методів, які застосовано для задач електронної комерції. Наведено результати проведених експериментів, які свідчать про ефективність застосованих методів.
  • Item
    Компоненти інформаційної системи підтримки рішень для наукових періодичних видань
    (Національний університет "Львівська політехніка", 2009) Мриглод, Олеся Ігорівна
    Дисертація присвячена удосконаленню та розробленню методів і компонент інтелектуального опрацювання даних для синтезу ефективних інформаційних систем моніторингу та підтримки прийняття рішень у роботі з конкрентними науковими періодичними виданнями. У роботі розроблено метод інтелектуального аналізу даних про публікації у науковому виданні, що базується на теорії складних мереж та дає можливість об’єктивно судити про його основну тематичну наукову спрямо­ваність і рівень інтегрованості у міжнародну наукову спільноту. Розроблено метод розширеного інформаційного пошуку близьких за тематикою авторів або публікацій у рамках наукового періодичного видання. Побудовано імітаційну модель опрацювання надісланих матеріалів у редакції наукового періодичного видання, яка дає можливість виявити характерні особливості у формі розподілу часів очікування статей до друку. Розроблено метод аналі­зу роботи редакційної колегії наукового видання, що базується на теорії систем масового обслуговування і використовує дані, доступні безпосередньо з публікацій видання, який дає можливість оцінити ефективність і режим роботи редколегії та виявити наявність етапу незалежного рецензування. Доповнено технологію аналізу та порівняльного оцінювання наукових періодичних видань методами інтелектуального аналізу даних, доступних безпосередньо з публікацій видання. Диссертация посвящена усовершенствованию и разработке методов и компонент интеллектуальной обработки данных для синтеза эффективных информационных систем мониторинга и поддержки принятия решений при работе с избранными научными периодическими изданиями. Существую­щие источники данных о научных изданиях позволяют оценить, в основ­ном, их «видимость» для научного мира, узнать их рейтинг и значения глав­ных количественных показателей, таких, как импакт-фактор или ин­декс цити­рования. Но этих данных недостаточно для проведения комплекс­ной оценки отдельного научного издания и информационной поддержки управленческих решений, связанных с ним. Все данные о избранном науч­ном изда­нии можна условно разделить на внешние и внутренние, где под внеш­ними данными подразумеваються те, которые полученны из внешних источни­ков, в то время как внутренние данные могут быть извлечены непосред­ственно из публикаций издания. Дисертационное исследование посвящено разработке методов для использования и анализа внутренних данных, потенциал которых на сегодняшний день фактически не используеться. Важным преимуществом использования именно внутренних данных есть их доступность. В работе разработан метод интеллектуального анализа данных о публикациях в научном издании, что базируется на теории сложных систем и позволяет обьективно оценивать его основное тематическое направление и уровень интегрированности в международное научное сообщество. Представление данных о публикациях в научном издании в виде сложной сети позволяет акцентировать внимание на их внутренние связи, а также обеспечи­вает удобный способ визуализации данных для их интерпретации экспертом. Также, используя методы работи со сложными сетями и алгоритмом нахожде­ния их природной структуры, разработано метод расширенного информацион­ного поиска близких за тематикой авторов или публикаций внутри научного периоди­ческого издания. Построена имитационную модель обработки присланных материалов в редакции научного периодического издания, которая дает возможность изучить характерные особенности формы распределений времени ожида­ния статей на публикацию. Разработан метод анализа работы редакцион­ной колегии научного издания, который базируется на теории систем массового обслуживания и позволяет использовать данные, доступные непосредственно из публикаций в издании, и дает возможность оценить эффективность и режим работы редколлегии, при этом выявив этап независимого рецензирования. Дополнена технология анализа и сравнительного оценивания научных периодических изданий методами интеллектуального анализа данных, доступных непосредственно из публикаций издания.The methods and components for intellectual data processing are developed and improved in the dissertation. These methods and components form the base for decision support systems of scientific periodicals. The method for intelligent analysis of data about publications in the journal is developed. The method is based on the complex networks theory and it allows to evaluate the main scientific directions in selected journal and its integration into the world scientific community. The advanced information retrieval method for scientific journal is also developed in the work. The imitation model of editorial board work in scientific journal is built. This model allows to study the specific features of waiting time distributions, where the waiting time is the time interval which particular paper is waiting for publication. The method for analysis of editorial board work is developed. This method gives a possibility to use the publicly available data for the evaluation of editorial board effectiveness based on the mass service system theory. It is important to note that developed method allows to detect a presence of the stage of independent review process in the work of scientific edition. Finally, the technology of analysis and comparative evaluation of scientific editions is improved by intellligent methods of data processing using the publicly avalilable data about publications.