Дослідження впливу рівня дрейфу розподілу даних на агентів навчання з підкріпленням
Loading...
Date
2023
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет “Львівська політехніка”
Abstract
Магістерська кваліфікаційна робота виконана студентом групи КНСШ-22 Петровим Дмитром Денисовичем. Тема “Дослідження впливу рівня дрейфу розподілу даних на агентів навчання з підкріпленням”. Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Об’єктом дослідження є процеси впливу дрейфу даних на агентів навчання з підкріпленням. Предметом досліджень є методи виявлення та оцінки дрейфу даних. Досягнення мети відбувається шляхом використання агента навчання з підкріпленням на даних з різним рівнем дрейфу даних та оцінці якості дій цієї нейронної мережі. Подальший опрацювання результатів відбувається із порівнянням найпопулярніших методів оцінки дрейфу та якістю агента на наборах даних з проведенням кореляційного аналізу та моделей прогнозування. Апробацію роботи впливу дрейфу даних на агентів навчання з підкріпленням здійснено з використанням різних алгоритмів виявлення дрейфу даних на основі реального агента покращення якості стільникового зв’язку та реального набору даних із обладнання стільникових сот. У результаті виконання дипломної роботи створено досліджено вплив дрейфу даних на агентів навчання з підкріпленням, оцінено рівень зміни якості дій агента, виявлено оптимальний підхід до виявлення дрейфу, розроблено програмну реалізацію оцінки різного рівня дрейфу; проведено порівняльний аналіз найпопулярніших методів оцінки дрейфу та якості агента. Загальний обсяг роботи: 86 сторінок, 45 рисунки, 19 посилання. Master’s degree work of the student of the group CSAI-22 Petrov Dmytro. The topic is " Investigation of the Impact of Data Distribution Drift on Reinforcement Learning Agents.". The work is aimed at obtaining a master's degree in 122 "Computer Science". To determine the objectives of the current study, an analytical review of scientific sources was conducted according to the standardized PRISMA methodology, which contains general recommendations for reviewing the scientific and basic features of meta-analysis. To search for scientific sources, two scientometric databases were chosen: Scopus and Google Scholar. Search queries were made using the following keywords: data drift, concept drift, distribution shift, reinforcement learning, and deep reinforcement learning.
Description
Keywords
навчання з підкріпленням, дрейф даних, часові ряди, машинне навчання, reinforcement learning, data drift, time series, machine learning
Citation
Петров Д. Д. Дослідження впливу рівня дрейфу розподілу даних на агентів навчання з підкріпленням : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Дмитро Денисович Петров ; Національний університет «Львівська політехніка». – Львів, 2023. – 88 с.