Самоорганізація стратегій у грі переміщення агентів

dc.citation.epage141
dc.citation.issue9
dc.citation.journalTitleВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі
dc.citation.spage131
dc.contributor.affiliationНаціональний університет “Львівська політехніка”
dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.authorКравець, Петро
dc.contributor.authorKravets, Petro
dc.coverage.placenameЛьвів
dc.coverage.placenameLviv
dc.date.accessioned2023-06-07T07:02:50Z
dc.date.available2023-06-07T07:02:50Z
dc.date.created2021-03-01
dc.date.issued2021-03-01
dc.description.abstractРозроблено стохастичну ігрову модель самоорганізації стратегій стохастичної гри мобільних агентів у вигляді циклічних поведінкових патернів, які складаються із узгоджених стратегій переміщення агентів у обмеженому дискретному просторі. Поведінковий патерн багатоагентної системи є візуалізованою формою впорядкованого переміщення агентів, яка виникає із їх початкового хаотичного руху в ході навчання стохастичної гри. Мобільність агентів багатокрокової стохастичної гри забезпечено тим, що у дискретні моменти часу вони випадково, одночасно і незалежно вибирають власну чисту стратегію переміщення в одному із можливих напрямків. Поточні платежі гравців визначено як функції програшів, залежні від стратегій сусідніх гравців. Ці функції сформовано зі штрафу за нерівномірність розміщення агентів у обмеженому дискретному просторі та штрафу за зіткнення під час переміщення агентів. Випадковий вибір чистих стратегій гравців спрямовано на мінімізацію їхніх функцій середніх програшів. Генерування послідовностей чистих стратегій виконано за дискретним розподілом, побудованим на основі векторів змішаних стратегій. Елементи векторів змішаних стратегій є умовними імовірностями вибору відповідних чистих стратегій переміщення. Змішані стратегії змінюються у часі, адаптивно враховуючи значення поточних програшів. Цим забезпечено зростання імовірностей вибору тих чистих стратегій, які приводять до зменшення функцій середніх програшів. Динаміку векторів змішаних стратегій визначено за марковським рекурентним методом, для побудови якого виконано стохастичну апроксимацію модифікованої умови доповняльної нежорсткості, яка справедлива у точках рівноваги за Нешем, та застосовано оператор проєктування на розширюваний одиничний епсилон-симплекс. Збіжність рекурентного ігрового методу забезпечено дотриманням фундаментальних умов та обмежень стохастичної апроксимації. Стохастична гра розпочинається із ненавчених змішаних стратегій, які задають хаотичну картину переміщення агентів. У ході навчання стохастичної гри вектори змішаних стратегій цілеспрямовано змінюються так, щоб забезпечити впорядковане безконфлікне переміщення агентів. У результаті комп’ютерного моделювання стохастичної гри отримано циклічні патерни самоорганізації мобільних агентів на поверхні дискретного тора та у межах прямокутної області на площині. Достовірність експериментальних досліджень підтверджено подібністю отриманих патернів переміщення агентів для різних послідовностей випадкових величин. Результати дослідження запропоновано використати на практиці для побудови розподілених систем із елементами самоорганізації, розв’язування різноманітних потокових і транспортних задач та колективного прийняття рішень в умовах невизначеності.
dc.description.abstractIn this paper, a stochastic game model of self-organization of strategies of stochastic game of mobile agents in the form of cyclic behavioral patterns, which consist of coordinated strategies for moving agents in a limited discrete space, is developed. The behavioral pattern of a multi-agent system is a visualized form of orderly movement of agents that arises from their initial chaotic movement during the learning of a stochastic game. The mobility of multi-step stochastic game agents is ensured by the fact that in discrete moments of time they randomly, simultaneously and independently choose their own pure strategy of moving in one of the possible directions. Current player payments are defined as loss functions that depend on the strategies of neighboring players. These functions are formed from the penalty for irregular spacing of agents in a limited discrete space and the penalty for collisions when moving agents. Random selection of players’ strategies aims to minimize their average loss functions. The generation of sequences of pure strategies is performed by a discrete distribution based on the vectors of mixed strategies. The elements of the vectors of mixed strategies are the conditional probabilities of choosing the appropriate pure displacement strategies. Mixed strategies change over time, adaptively taking into account the value of current losses. This provides an increase in the probability of choosing those strategies that lead to a decrease in the functions of average losses. The dynamics of the vectors of mixed strategies is determined by the Markov recurrent method, for the construction of which a stochastic approximation of the modified condition of complementary nonrigidity, which is valid at Nash equilibrium points, is performed, and a projection operator for expandable unit epsilon simplex is applied. The convergence of the recurrent game method is ensured by compliance with the fundamental conditions and limitations of stochastic approximation. The stochastic game begins with untrained mixed strategies that set a chaotic picture of moving agents. During the learning of the stochastic game, the vectors of mixed strategies are purposefully changed so as to ensure an orderly, conflict-free movement of agents. As a result of computer simulation of stochastic game, cyclic patterns of self-organization of mobile agents on the surface of a discrete torus and within a rectangular region on a plane are obtained. The reliability of the experimental studies was confirmed by the similarity of the obtained patterns of moving agents for different sequences of random variables. The results of the study are proposed to be used in practice for the construction of distributed systems with elements of self-organization, solving various flow and transport problems and collective decision-making in conditions of uncertainty
dc.format.extent131-141
dc.format.pages11
dc.identifier.citationКравець П. Самоорганізація стратегій у грі переміщення агентів / Петро Кравець // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2021. — № 9. — С. 131–141.
dc.identifier.citationenKravets P. Self-organizing strategies in game of agent movement / Petro Kravets // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Informatsiini systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2021. — No 9. — P. 131–141.
dc.identifier.doidoi.org/10.23939/sisn2021.09.131
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/59146
dc.language.isouk
dc.publisherВидавництво Львівської політехніки
dc.publisherLviv Politechnic Publishing House
dc.relation.ispartofВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі, 9, 2021
dc.relation.references1. Gamazine, S., Deneubourg, J.-L., Frank, N. R., Sneyd, J., Theraula, G., Bonabeau, E. (2020). Self-Organization in Biological Systems. Princeton University Press.
dc.relation.references2. Гийо, А., Мейе, Ж.-А. (2013). Бионика. Когда наука имитирует природу. Москва: Техносфера.
dc.relation.references3. Zhang, W. J. (editor). (2013). Self-organization: Theories and Methods. USA: Nova Science Publishers.
dc.relation.references4. Кравець, П. О., Юринець, Р. В., Кісь, Я. П. (2020). Патерни самоорганізації стратегій у грі мобільних агентів. Вісник Нац. ун-ту “Львівська політехніка”. Серія: “Інформаційні системи та мережі”, Вип. 7, 24–34. DOI: 10.23939/sisn2020.07.024.
dc.relation.references5. Kelso, J. A., Scott. (1995). Dynamic patterns: The self-organization of brain and behavior. Cambridge, MA: The Mit Press.
dc.relation.references6. Josselyn, S. A., Tonegawa, S. (2020). Memory engrams: Recalling imagining the future. Review. Science. American Association for the Advancement of Science (AAAS), 367, 6473, 1–14. DOI: 10.1126/science.aaw4325.
dc.relation.references7. Самойлов, В., Бигдай, Е. (2020). Физиология человека для технических специальностей: центральная нервная и сенсорная системы: учеб. пособ для вузов. 2-е изд. Москва: Юрайт.
dc.relation.references8. Галкін, О. Ю., Тітова Л. О. (2018). Основи еволюційної теорії: навч. посіб. Київ: КПІ ім. І. Сікорського.
dc.relation.references9. Adamatzky, A., Komosinski, M. (Eds). (2005). Artificial Life Model in Software. Springer.
dc.relation.references10. Adami, C. (1998). Introduction to Artificial Life. Springer.
dc.relation.references11. Langton, C. G. (1995). Artificial Life. An Overview. Cambridge: The MIT Press.
dc.relation.references12. Sadhu, A. K., Konar, A. (2020). Multi-Agent Coordination. Wiley-IEEE Press.
dc.relation.references13. Sun, Z. (2018). Cooperative Coordination and Formation Control for Multi-agent Systems. Springer.
dc.relation.references14. Yang, S., Xu, J.-X., Li, X., Shen, D. (2017). Iterative Learning Control for Multi-agent Systems Coordination. John Wiley & Sons.
dc.relation.references15. Кравець, П. О. (2015). Ігрова модель самоорганізації мультиагентних систем. Вісник Нац. ун-ту „Львівська політехніка”. Серія: „Інформаційні системи та мережі”, 829, 161–176.
dc.relation.references16. Chen, B.-S. (2020). Stochastic Game Strategies and their Applications. CRC Press.
dc.relation.references17. Ungureanu, V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer.
dc.relation.references18. Neogy, S. K., Bapat, Ravindra, B., Dubey, Dipti. (Eds). (2018). Mathematical Programming and Game Theory. Springer.
dc.relation.references19. Kusuoka, S. (2020). Stochastic Analysis. Springer.
dc.relation.references20. Kushner, H J., Yin, G. G. (2013). Stochastic Approximation Algorithms and Applications. Springer.
dc.relation.references21. Назин, А. В., Позняк, А. С. (1986). Адаптивный выбор вариантов: Рекуррентные алгоритмы. Москва: Наука.
dc.relation.referencesen1. Gamazine, S., Deneubourg, J.-L., Frank, N. R., Sneyd, J., Theraula, G., Bonabeau, E. (2020). Self-Organization in Biological Systems. Princeton University Press.
dc.relation.referencesen2. Guillot, A., Meyer, J.-A. (2013). Bionics. When the Science Imitates the Nature (in russian). Moscow: Technosphere.
dc.relation.referencesen3. Zhang, W. J. (editor) (2013). Self-organization: Theories and Methods. USA: Nova Science Publishers.
dc.relation.referencesen4. Kravets, P.A., Jurinets R.V, Kis, Y.P. (2020). Patterns of self-organizing strategies in the game of mobile agents (in ukrainian). Bulletin of “Lviv polytechnic national university”. Series: “Information systems and networks”, Issue 7, 24–34. DOI: 10.23939/sisn2020.07.024.
dc.relation.referencesen5. Kelso, J. A., Scott. (1995). Dynamic patterns: The self-organization of brain and behavior. Cambridge, MA: The Mit Press.
dc.relation.referencesen6. Josselyn, S. A., Tonegawa, S. (2020). Memory engrams: Recalling imagining the future. Review. Science. American Association for the Advancement of Science (AAAS), 367, 6473, 1–14. DOI: 10.1126/science.aaw4325.
dc.relation.referencesen7. Samoilov, V., Bigdaj, Е. (2020). Human physiology for technical specialities: the central nervous and sensory systems. The manual for high schools. The second edition (in russian). Мoscow: Urait.
dc.relation.referencesen8. Galkin, A. Yu., Titova, L. A. (2018). Fundamentals of evolutionary theory. Tutorial (in ukrainian). Kyiv: Igor Sikorsky Kyiv Polytechnic Institute.
dc.relation.referencesen9. Adamatzky, A., Komosinski, M. (Eds). (2005). Artificial Life Model in Software. Springer.
dc.relation.referencesen10. Adami, C. (1998). Introduction to Artificial Life. Springer.
dc.relation.referencesen11. Langton, C. G. (1995). Artificial Life. An Overview. Cambridge: The MIT Press.
dc.relation.referencesen12. Sadhu, A. K., Konar, A. (2020). Multi-Agent Coordination. Wiley-IEEE Press.
dc.relation.referencesen13. Sun, Z. (2018). Cooperative Coordination and Formation Control for Multi-agent Systems. Springer.
dc.relation.referencesen14. Yang, S., Xu, J.-X., Li, X., Shen, D. (2017). Iterative Learning Control for Multi-agent Systems Coordination. John Wiley & Sons.
dc.relation.referencesen15. Kravets, P. A. (2015). Game model of self-organizing of multiagent systems (in ukrainian). Bulletin of “Lviv polytechnic national university”. Series: “Information systems and networks”, 829, 161–176.
dc.relation.referencesen16. Chen, B.-S. (2020). Stochastic Game Strategies and their Applications. CRC Press.
dc.relation.referencesen17. Ungureanu, V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer.
dc.relation.referencesen18. Neogy, S. K., Bapat, Ravindra, B., Dubey, Dipti. (Eds). (2018). Mathematical Programming and Game Theory. Springer.
dc.relation.referencesen19. Kusuoka, S. (2020). Stochastic Analysis. Springer.
dc.relation.referencesen20. Kushner, H. J., Yin, G. G. (2013). Stochastic Approximation Algorithms and Applications. Springer.
dc.relation.referencesen21. Nazin, A. V., Poznyak, A. S. (1986). Adaptive Choice of Variants: Recurrence Algorithms (in russian). Moscow: Science.
dc.rights.holder© Національний університет “Львівська політехніка”, 2021
dc.rights.holder© Кравець П., 2021
dc.subjectсамоорганізація
dc.subjectциклічний поведінковий патерн
dc.subjectбагатоагентна система
dc.subjectстохастична гра
dc.subjectмарковський рекурентний метод
dc.subjectself-organization
dc.subjectcyclic behavioral pattern
dc.subjectmulti-agent system
dc.subjectstochastic game
dc.subjectMarkov recurrent method
dc.subject.udc004.[852
dc.subject.udc94]
dc.titleСамоорганізація стратегій у грі переміщення агентів
dc.title.alternativeSelf-organizing strategies in game of agent movement
dc.typeArticle

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
2021n9_Kravets_P-Self_organizing_strategies_131-141.pdf
Size:
1.79 MB
Format:
Adobe Portable Document Format
Thumbnail Image
Name:
2021n9_Kravets_P-Self_organizing_strategies_131-141__COVER.png
Size:
349.34 KB
Format:
Portable Network Graphics

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.77 KB
Format:
Plain Text
Description: