Каскадний класифікатор в задачах аналізу медичних даних великих обсягів
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет “Львівська політехніка”
Abstract
Магістерська кваліфікаційна робота виконана студентом групи КНСШ-21 Музикою Романом Тарасовичем. Тема “Каскадний класифікатор в задачах аналізу медичних даних великих обсягів”. Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Об’єктом дослідження є процеси композиції каскадних класифікаторів на основі машинного навчання. Предметом досліджень методи попереднього опрацювання даних для каскадних класифікаторів. Досягнення мети відбувається за рахунок ряду модифікацій методу каскадування алгоритмів машинного навчання для класифікації медичних даних великих обсягів на основі додаткового застосування PCA на кожному його рівні для зменшення простору вхідних даних, також з використанням нової схеми поділу вибірки даних для кожного рівня каскаду для підвищення точності його роботи, та їх сумісного використання. Апробацію роботи здійснено з використанням різних алгоритмів машинного навчання. Моделювання виконувалося на основі реального медичного набору даних наданих Системою моніторингу факторів ризику захворювання (BRFSS) Сполучених Штатів Америки та Центрами з контролю та запобігання захворюванням (CDC) для розв’язання задачі класифікації. У результаті виконання дипломної роботи створено три різні модифікації методу каскадування алгоритмів машинного навчання для підвищення ефективності класифікації медичних даних великих обсягів. Загальний обсяг роботи: 82 сторінки, 24 рисунки, 36 посилань. The master's qualification work was conducted by Muzyka Roman Tarasovych, a student of the KNSH-21 group, specializing in Computer Science (122). The research focuses on the composition processes of cascade classifiers in the realm of machine learning, specifically addressing the analysis of extensive medical data. The research investigates data preprocessing methods for cascade classifiers, with the aim of achieving the overarching goal through a series of modifications to the cascade algorithm. These modifications include the application of Principal Component Analysis (PCA) at each level to reduce the dimensionality of input data, the introduction of a novel sample splitting scheme at each cascade level to enhance accuracy, and their combined utilization. The work was validated using various machine learning algorithms and modeled on a real medical dataset provided by the Behavioral Risk Factor Surveillance System (BRFSS) of the United States and the Centers for Disease Control and Prevention (CDC) for a classification task.
Description
Citation
Музика Р. Т. Каскадний класифікатор в задачах аналізу медичних даних великих обсягів : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Роман Тарасович Музика ; Національний університет «Львівська політехніка». – Львів, 2023. – 83 с.