Модифікація двокрокового методу інтелектуального аналізу даних: задача класифікації
Loading...
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет ”Львівська політехніка”
Abstract
Магістерська кваліфікаційна робота виконана студентом групи КНСШ-21 Сидором Мар`яном Сергійовичем. Тема «Модифікація двокрокового методу інтелектуального аналізу даних: задача класифікації». Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Мета роботи полягає в удосконаленні двокрокового методу класифікації числових наборів даних для підвищення швидкодії процедури його навчання. Досягнення мети відбуватиметься шляхом формування нового набору даних для фінального класифікатора шляхом заміни початкових входів задачі на прогнозоване значення внаслідок додаткового використання класифікатора та маркерів приналежності поточного спостереження до кожного із кластерів, визначених на першому кроці методу. Це зменшить час навчання обраного класифікатора при збереженні точності його роботи. Апробацію роботи розробленого удосконаленого методу здійснено з використанням різних алгоритмів машинного навчання на основі реального біомедичного набору даних для розв’язання задачі класифікації. Об’єкт дослідження – процеси класифікації даних методами машинного навчання. Предмет дослідження – гібридні методи класифікації табличних наборів даних на основі лінійних алгоритмів машинного навчання. У результаті виконання дипломної роботи створено базову інтелектуальну систему двокрокового методу класифікації та її модифікації; розроблено їх програмну реалізацію, яка дозволяє досліджувати роботу різних методів машинного навчання, підбирати гіперпараметри для оптимальної роботи системи, а також порівнювати результати навчання класифікаторів на представлених шести різних алгоритмах розширених початкових даних. The master’s qualification thesis was completed by the student of the KNSSh 21 group Sydor Marian Serhiiovych. The topic "Modification of the two-step method of intelligent data analysis: the task of classification." The work is aimed at obtaining a master’s degree in the specialty 122 "Computer Science". The purpose of the work is to improve the two-step method of classification of numerical data sets to increase the speed of its training procedure. The goal will be achieved by forming a new data set for the final classifier by replacing the initial inputs of the problem with the predicted value due to the additional use of the classifier and markers of belonging to the current observation to each of the clusters defined in the first step of the method. This will reduce the training time of the selected classifier while maintaining the accuracy of its work. Approbation of the work of the developed improved method was carried out using various machine learning algorithms based on a real biomedical data set for solving the classification problem. The object of research is data classification processes using machine learning methods. The subject of the research is hybrid methods of classification of tabular datasets based on linear machine learning algorithms. As a result of the thesis, a basic intellectual system of the two-step method of classification and its modification was created; their software implementation was developed, which allows you to investigate the operation of various machine learning methods, select hyper parameters for optimal system operation, and also compare the results of training classifiers on six different algorithms of extended initial data.
Description
Keywords
двокроковий метод, класифікація, кластеризація, машинне навчання, two-step method, classification, clustering, machine learning
Citation
Сидор М. С. Модифікація двокрокового методу інтелектуального аналізу даних: задача класифікації : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Мар`ян Сергійович Сидор ; Національний університет «Львівська політехніка». – Львів, 2022. – 103 с.