Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок
Loading...
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет ”Львівська політехніка”
Abstract
Магістерська кваліфікаційна робота 54 ст., 23 рис., 4 табл., 30 посилання. Магістерська кваліфікаційна робота виконана студентом групи КНСШ-22 Брусенцовим Георгієм Євгеновичом. Тема роботи: «Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок». Дана робота спрямована на отримання ступеня магістра за спеціальністю 122 «Комп’ютерні науки». Метою цієї роботи полягає в побудові нейронної мережі для рішення популярної онлайн головоломки Wordle застосовуючи методи навчання з підкріпленням. Для цього будуть використані різні підходи до побудови моделей, а саме: наївні підходи та глибокі нейронні мережі. В результаті виконання магістерської кваліфікаційної роботи було реалізовано та описано систему, яка імплементує середовище, що симулює гру-головоломку Wordle з усіма її правилами. Для цього буде визначено простори дій та спостережень, система винагород, система побудови поточного стану в залежності від отриманої дії. Також було розроблено низку моделей для взаємодії з середовищем, а саме: наївна модель, модель на базі інформаційної ентропії та модель на базі алгоритму Advantage Actor Critic. Master's qualification work 54 pages, 23 figures, 4 tables, 30 references. Master's qualification work is made by the student of group CSAI-22 Brusentsov Georgy Evgenievich. The theme of the work: "Application of reinforcement learning tools for solving puzzle games". This work is aimed at obtaining a master's degree in the specialty 122 "Computer Science". In this work, an approach to the development of a test environment and the construction of decision models for the popular puzzle game Wordle is considered and investigated.
Description
Keywords
навчання з підкріпленням, головоломки, глибокі нейронні мережі, інформаційна ентропія, reinforcement learning, puzzles, deep neural networks, information entropy
Citation
Брусенцов Г. Є. Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Георгій Євгенович Брусенцов ; Національний університет «Львівська політехніка». – Львів, 2022. – 62 с.