Ансамблеві методи машинного навчання для класифікації програмних модулів за дефектністю
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет «Львівська політехніка»
Abstract
Дипломна робота виконана студентом групи КНСШ-22 Піцюрою Мирославом Романовичем на тему: “Ансамблеві методи машинного навчання для класифікації програмних модулів за дефектністю”. Робота спрямована на здобуття ступеня магістра за спеціальністю 122 «Комп’ютерні науки». Об’єктом дослідження є процеси класифікації програмного забезпечення із застосуванням ансамблевих методів машинного навчання, що дозволяють підвищити точність аналізу. Предметом дослідження виступають методи, алгоритми та підходи класифікації, орієнтовані на вдосконалення процесу виявлення дефектів у програмних модулях. Мета роботи полягає у розробці ефективної моделі класифікації для прогнозування дефектності програмних модулів шляхом використання ансамблевих методів машинного навчання. У процесі роботи проведено аналіз різних ансамблевих алгоритмів, таких як Gradient Boosting, XGBoost, LightGBM та інші. Виконано порівняння їхньої ефективності на реальних наборах даних, що містять інформацію про дефекти програмного забезпечення. Результати дослідження демонструють, що застосування ансамблевих методів дозволяє суттєво підвищити точність класифікації, зменшити помилкові спрацювання та підвищити адаптивність моделі до нових наборів даних.
У рамках роботи: розроблено програмне забезпечення для реалізації ансамблевих методів класифікації; виконано комплексну оцінку ефективності моделей; створено кінцеву модель класифікації, яка дозволяє оцінити ймовірність наявності дефектів у програмних модулях. Структура роботи: загальний обсяг становить 65 сторінки, включає 11 рисунок, 3 таблиці та 16 джерел літератури. The thesis was completed by the student of the KNSSh-22 group, Myroslav Romanovych Pitsiura, on the topic: “Ensemble Machine Learning Methods for Classifying Software Modules by Defectiveness”. The work aims to obtain a master’s degree in the specialty 122 "Computer Science". The object of research is the process of software classification using ensemble machine learning methods to improve the accuracy of defect detection. The subject of research includes methods, algorithms, and approaches for classification, focused on enhancing the process of identifying defects in software
modules. The objective of this work is to develop an effective classification model for predicting the defectiveness of software modules using ensemble machine learning methods. To achieve this, various approaches that combine the outputs of multiple classifiers to enhance overall model performance were explored and implemented. The study includes a comprehensive analysis of various ensemble algorithms, such as Random Forest, Gradient Boosting, XGBoost, LightGBM, and others. A comparison of their performance on real-world datasets containing information about software defects was conducted. The results of the research demonstrate that the application of ensemble methods significantly improves classification accuracy, reduces false positives, and enhances the model’s adaptability to new datasets. Within the scope of the thesis: software was developed to implement ensemble classification methods; a comprehensive evaluation of model performance was carried out; a final classification model was created, enabling the assessment of the likelihood of defects in software modules. Structure of the work: the total volume is 65 pages, including 11 figures, 3 tables, and 16 references.
Description
Citation
Піцюра М. Р. Ансамблеві методи машинного навчання для класифікації програмних модулів за дефектністю : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Мирослав Романович Піцюра ; Національний університет «Львівська політехніка». – Львів, 2024. – 65 с.