Архітектура та формально-математичне обґрунтування генеративних змагальних мереж

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет «Львівська політехніка»

Abstract

Мета статті – аналіз особливостей генеративних змагальних мереж. Об’єкт дослідження – процес алгоритмізації машинного навчання. Предмет дослідження – математичні методи, використовувані в генерації семантично пов’язаного тексту. У статті досліджено архітектуру та математичне обґрунтування такого виду генеративних моделей, як генеративні змагальні мережі. Генеративні змагальні мережі є потужним інструментом у галузі штучного інтелекту, який здатен створювати реалістичні дані, зокрема такі як фото, відео, звук тощо. Архітектура генеративних змагальних визначає її структуру, взаємодію компонентів та загальний опис процесу навчання. Математичне обґрунтування охоплює теоретичний аналіз принципів, алгоритмів та функцій, що є основою цих мереж. У статті розглянуто загальну архітектуру генеративних змагальних мереж, кожен її компонент (а саме дві основні моделі-мережі – генератор та дискримінатор, їх вхідні та вихідні вектори даних) та його роль у роботі алгоритму. Визначено також математичні засади генеративних змагальних мереж, із зосередженням на теорії ігор та оптимізаційних методах (зокрема особливу увагу звернено на задачі мінімаксу та максиміну, гру із нульовою сумою, сідлові точки, рівновагу Неша), що використовують в їх навчанні. Описано функцію витрат та її виведення за допомогою рівноваги Неша в грі з нульовою сумою для генеративних змагальних мереж, а також розглянуто алгоритм навчання із використанням методу стохастичного градієнтного спуску та міні-пакетного підходу у вигляді псевдокоду, його ітерації, візуалізовано перебіг процесу навчання цієї архітектури мережі. Зрештою, обґрунтовано висновок, що генеративні змагальні мережі – це ефективний інструмент для створення реалістичних та правдоподібних зразків даних, що ґрунтується на використанні елементів теорії ігор. Завдяки високій якості згенерованих даних генеративні змагальні мережі можна використовувати у різних сферах, зокрема й таких, як кібербезпека, медицина, торгівля, наука, мистецтво тощо. The purpose of the work is to analyze the features of generative adversarial networks. The object of research is the process of machine learning algorithmization. The subject of the research is mathematical methods used in the generation of semantically related text. This article explores the architecture and mathematical justification of such a type of generative models as generative adversarial networks. Generative adversarial networks are a powerful tool in the field of artificial intelligence, capable of generating realistic data, including photos, videos, sounds, etc. The architecture of generative competition defines its structure, the interaction of components and a general description of the learning process. Mathematical justification, in turn, includes a theoretical analysis of the principles, algorithms and functions underlying these networks. The article examines the general architecture of generative adversarial networks, examines each of its components (namely, the two main network models – generator and discriminator, their input and output data vectors) and its role in the operation of the algorithm. The author also defined the mathematical principles of generative adversarial networks, focusing on game theory and optimization methods (in particular, special attention is paid to minimax and maximin problems, zero-sum game, saddle points, Nash equilibrium) used in their study. The cost function and the process of deriving it using the Nash equilibrium in a zero-sum game for generative adversarial networks are described, and the learning algorithm using the method of stochastic gradient descent and the mini-batch approach in the form of a pseudocode, its iterations, is visualized network architecture. Finally, the conclusion that generative adversarial networks is an effective tool for creating realistic and believable data samples based on the use of elements of game theory is substantiated. Due to the high quality of generated data, generative adversarial networks can be used in various fields, including: cyber security, medicine, commerce, science, art, etc.

Description

Citation

Прозур В. Архітектура та формально-математичне обґрунтування генеративних змагальних мереж / Віталій Прозур // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2024. — № 15. — С. 15–22.

Endorsement

Review

Supplemented By

Referenced By