Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок

Loading...
Thumbnail Image

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет ”Львівська політехніка”

Abstract

Магістерська кваліфікаційна робота 54 ст., 23 рис., 4 табл., 30 посилання. Магістерська кваліфікаційна робота виконана студентом групи КНСШ-22 Брусенцовим Георгієм Євгеновичом. Тема роботи: «Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок». Дана робота спрямована на отримання ступеня магістра за спеціальністю 122 «Комп’ютерні науки». Метою цієї роботи полягає в побудові нейронної мережі для рішення популярної онлайн головоломки Wordle застосовуючи методи навчання з підкріпленням. Для цього будуть використані різні підходи до побудови моделей, а саме: наївні підходи та глибокі нейронні мережі. В результаті виконання магістерської кваліфікаційної роботи було реалізовано та описано систему, яка імплементує середовище, що симулює гру-головоломку Wordle з усіма її правилами. Для цього буде визначено простори дій та спостережень, система винагород, система побудови поточного стану в залежності від отриманої дії. Також було розроблено низку моделей для взаємодії з середовищем, а саме: наївна модель, модель на базі інформаційної ентропії та модель на базі алгоритму Advantage Actor Critic. Master's qualification work 54 pages, 23 figures, 4 tables, 30 references. Master's qualification work is made by the student of group CSAI-22 Brusentsov Georgy Evgenievich. The theme of the work: "Application of reinforcement learning tools for solving puzzle games". This work is aimed at obtaining a master's degree in the specialty 122 "Computer Science". In this work, an approach to the development of a test environment and the construction of decision models for the popular puzzle game Wordle is considered and investigated.

Description

Keywords

навчання з підкріпленням, головоломки, глибокі нейронні мережі, інформаційна ентропія, reinforcement learning, puzzles, deep neural networks, information entropy

Citation

Брусенцов Г. Є. Застосування засобів навчання з підкріпленням для розв'язання ігор-головоломок : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Георгій Євгенович Брусенцов ; Національний університет «Львівська політехніка». – Львів, 2022. – 62 с.

Endorsement

Review

Supplemented By

Referenced By