Дослідження фрактальних нейронних мереж для задачі розпізнавання дорожніх знаків
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет «Львівська політехніка»
Abstract
Магістерська кваліфікаційна робота виконана студентом групи КНСШ-21 Сабов Віктором Арпадовичом. Тема “Дослідження фрактальних нейронних мереж для задачі розпізнавання дорожніх знаків”. Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Об’єктом дослідження є використання фрактальних нейронних мереж для локалізації та розпізнавання об’єктів на фотографіях. Предметом досліджень є алгоритми побудови фрактальних нейронних мереж з згортковими шарами. Досягнення мети відбувається за рахунок використання фрактальних нейронних мереж, які згладжують функцію похибки та роблять градієнти більш стабільними без використання надлишкових зв’язків. Також фрактальна нейронна мережа надає можливість динамічно використовувати швидшу або повільнішу підмережу. Після «кодування» зображення, використовується додаткова нейронна мережа, що вже видає певну кількість Одним з важливих результатів дослідження є аналіз стабільності градієнтів під час навчання. Фрактальна нейронна мережа продемонструвала значно кращу стабільність порівняно з VGG16, навіть при більшій глибині. Це підтверджує теоретичні переваги фрактальної архітектури, зокрема її здатність ефективно навчатися без проблеми зникаючого градієнта. Результати експериментальних досліджень показали, що реалізація SSD на базі фрактальної нейронної мережі демонструє кращі результати на виявленні великих об'єктів порівняно з базовою архітектурою VGG-16. Особливо важливим є те, що найглибша колонка фрактальної мережі показує лише незначне зниження точності порівняно з повною мережею, але працює в 10 разів швидше за повну фрактальну та в 2 рази швидше за VGG-16. Загальний обсяг роботи: 86 сторінок, 41 зображення, 12 таблиць. Rapid recognition and classification of objects in images is one of the key tasks of computer vision. After the introduction of deep learning methods into widespread use, great breakthrough was made in these tasks due to their accuracy and speed. For this purpose, many special architectures were created, such as R-CNN, Fast R-CNN, Faster R-CNN from two-stage, or YOLO, SSD and DETR from faster single-stage variants. One of the most common applications for this task in real life is the recognition of traffic signs to provide drivers with information about permitted speed, direction of movement, warning about dangerous situations, etc. From the perspective of object recognition tasks, all traffic signs have a similar nature. First, they are flat objects with an image. Secondly, they stand out from the environment through, for example, red frames, sharp colors, etc. But there are objects that have characteristics very similar to those of traffic signs – advertising banners. Accordingly, incorrect classification of a banner (or part of it) as a traffic sign is a common problem in the context of our application. Another problem is the similarity between objects being classified, and giving the driver, for example, lane direction signs that look similar, but confusing them can lead to critical consequences when the driver loses attention. Another important problem is poor visibility, that is, nighttime or fog - during such times it is also important to correctly recognize traffic signs. The last complexity of the application is the possible high speed of the driver, which may require high speed of the recognition system (one can manage to drive past a sign so that the system doesn't even notice it). To solve this problem, the author proposes using a fractal neural network, which has shown good results in object classification tasks, and can reduce execution time by using only certain "paths" of information passage. Such a system in connection with a detection framework can achieve good performance during slow driving (for example in fog or evening) and during fast driving (using short "paths" of the fractal neural network).
Description
Citation
Сабов В. А. Дослідження фрактальних нейронних мереж для задачі розпізнавання дорожніх знаків : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Віктор Арпадович Сабов ; Національний університет «Львівська політехніка». – Львів, 2024. – 86 с.