Кафедра комп'ютеризованих систем автоматики
Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/62531
Browse
Item Дослідження продуктивності нейронної мережі Колмогорова-Арнольда(Національний університет "Львівська політехніка", 2024) Литвин, Юрій Андрійович; Lytvyn, Yurii Andriiovych; Влах-Вигриновська, Галина Іванівна; Національний університет "Львівська політехніка"Актуальність теми: У сучасних умовах розвитку штучного інтелекту та машинного навчання дослідження нових архітектур нейронних мереж набуває особливої значущості. Нейронна мережа Колмогорова-Арнольда (KAN), яка базується на теоремі Колмогорова, є перспективною моделлю для апроксимації багатовимірних функцій за допомогою одновимірних компонент. Завдяки своїм теоретичним перевагам, таким як здатність зменшувати розмірність задачі, мережі KAN мають потенціал стати ефективним інструментом у багатьох галузях, включаючи обробку сигналів, класифікацію даних та прогнозування. Вивчення їхньої продуктивності є актуальним завданням для вдосконалення алгоритмів машинного навчання Мета і завдання дослідження: підвищення ефективності роботи нейронної мережі Колмогорова-Арнольда шляхом аналізу її продуктивності та порівняння з багатошаровим персептроном (MLP). Завдання дослідження: Уперше виконано порівняльний аналіз продуктивності нейронної мережі Колмогорова-Арнольда (KAN) та багатошарового персептрона (MLP) на основі наборів даних, таких як Beans Dataset, Titanic Dataset та CIFAR-100. Розроблено новий підхід до оцінювання продуктивності, який враховує як метрики точності, так і обчислювальні витрати. Запропоновано методику оптимізації архітектури KAN для покращення результатів у задачах класифікації та регресії. У першому розділі детально розглянуто основи теореми Колмогорова-Арнольда (KAN), яка є фундаментом для побудови нейронної мережі цього типу. Викладено математичні основи теореми, що дозволяє звести багатовимірні функції до суми одновимірних функцій, та обговорено її застосування в 5 контексті машинного навчання. Зосереджено увагу на її теоретичних аспектах, перевагах і обмеженнях. У другому розділі описано підхід до оцінювання продуктивності нейронної мережі Колмогорова-Арнольда (KAN). Наведено методологію проведення експериментів, включаючи вибір наборів даних, метрики продуктивності, критерії порівняння з багатошаровими персептронами (MLP) та налаштування параметрів. Особливу увагу приділено способам оптимізації архітектури мережі KAN. Третій розділ присвячений практичній реалізації нейронних мереж KAN та MLP. Описано архітектури та алгоритми навчання, що застосовувалися у дослідженні. Реалізацію мереж виконано на обраних наборах даних, таких як Beans Dataset, Titanic Dataset, CIFAR-100 тощо, з використанням популярних фреймворків для машинного навчання. Наведено ключові особливості програмної реалізації. У четвертому розділі наведено результати дослідження, включаючи порівняння продуктивності мереж KAN та MLP за ключовими метриками. Висвітлено переваги та обмеження кожного підходу в контексті розв'язання задач з різних наборів даних. Узагальнено отримані висновки щодо продуктивності та доцільності використання нейронних мереж Колмогорова-Арнольда для вирішення задач машинного навчання. П?ятий розділ присвячений розрахунку економічної ефективності впровадження нейронної мережі Колмогорова-Арнольда (KAN) у задачах машинного навчання. Оцінено витрати на реалізацію та використання мережі KAN порівняно з традиційними моделями, такими як багатошаровий персептрон (MLP), у практичних застосуваннях. Проаналізовано переваги та обмеження моделі KAN в реальних умовах, включаючи її продуктивність, обчислювальну вартість та потенціал для інтеграції в сучасні системи аналізу даних. Висновки підсумовують результати виконаної роботи, підкреслюючи доцільність використання нейронної мережі Колмогорова-Арнольда для вирішення задач машинного навчання. Проаналізовано продуктивність мережі 6 KAN порівняно з багатошаровим персептроном (MLP), визначено її переваги у розв'язанні задач з обраних наборів даних, а також окреслено ключові аспекти, що підтверджують ефективність цього підходу. Об’єкт дослідження – продуктивність нейронної мережі Колмогорова-Арнольда в задачах машинного навчання. Предмет дослідження – методи реалізації та оцінки ефективності нейронних мереж Колмогорова-Арнольда у порівнянні з багатошаровим персептроном. Мета дослідження – розробка та оцінка ефективності нейронної мережі Колмогорова-Арнольда для вирішення задач класифікації та регресії в різних наборах даних.