Система розпізнавання об’єктів на основі моделі YOLO

Abstract

Побудовано систему розпізнавання об’єктів, знятих у режимі реального часу на відеокамеру в зашумленому та змінному щодо навколишніх умов середовищі. Досліджено методику наповнення бази даних для мобільних військових об’єктів. Для розпізнавання об’єктів використано нейромережу YOLO v8, яка дає змогу відстежувати рухомі та ідентифікувати об’єкти, які потрапляють на відео із відеокамери. Ця нейромережа дає змогу відстежувати об’єкти зі зміною масштабу, під час руху з перешкодами. З’ясовано, що розпізнавання об’єктів здійснюється на основі контурного аналізу, зіставлення із шаблоном та виявлення і встановлення відповідності ознакам. Використано методи штучного інтелекту на основі YOLO v8 для розпізнавання військової техніки. Здійснено навчання для різних моделей YOLO із використанням оптимізаторів Adam W, Adam, SGD та роздільної здатності 512×512, 640×640, 1024×1024 px зображень. Поліпшення розпізнавання об’єктів досягається завдяки аналізу контурів, порівнянню шаблонів і введених особливих точок. Різні роздільні здатності зображень та оптимізатори по-різному впливали на продуктивність моделі, а стандартні метрики оцінки не надають найточнішого вигляду. Найефективнішим оптимізатором є метод градієнтного спуску (SGD), який показав найкращі показники точності для розпізнавання бойових машин. Градієнт зазвичай розглядають як суму градієнтів, зумовлених кожним елементом навчання, і використовують для коригування параметрів моделі. Внаслідок розроблення системи сформовано показники із точністю розпізнавання (accuracy) 92 %, F1-оцінка (F1 score) – 89 %, середній показник точності (mAP) – 90 %. Запропоновано спосіб наповнення набору даних та створення класифікатора. Побудовано модель розпізнавання бойових машин. Наведено графіки, результати розпізнавання рухомих об’єктів у нейромережі Yolo8 x.
A system for recognizing objects that are captured in real time on a video camera in a noisy environment that changes to the surrounding conditions has been built. The method of filling the database for mobile military objects was studied. For object recognition, the YOLO v8 neural network is used, which allows you to track moving and identify objects that fall into the video from the video camera. This neural network makes it possible to track objects with a change in scale, during movement with obstacles. It has been analyzed that the recognition of objects is carried out on the basis of contour analysis, comparison with a template and detection and matching of features. Artificial intelligence methods based on YOLO v8 were used to recognize military equipment. Trained for different YOLO models using Adam W, Adam, SGD optimizers and 512x512, 640x640, 1024x1024 px image resolution. Improved object recognition is achieved by analyzing contours, comparing patterns, and comparing entered special points. Different image resolutions and optimizers have shown different effects on model performance, and standard evaluation metrics do not provide the most accurate view. The most effective optimizer is gradient descent (SGD), which has shown the best accuracy for combat vehicle recognition. The gradient is usually considered as the sum of the gradients caused by each training element and is used to adjust the model parameters. As a result of the development of the system, indicators with recognition accuracy (accuracy) of 92%, F1-estimate (F1 score) – 89%, average indicator of accuracy (mAP) – 90% were formed. A method of filling the data set and creating a classifier is proposed. A model of combat vehicle recognition was built. Graphs, results of recognition of moving objects in the Yolo8 x neural network are presented.

Description

Citation

Назаркевич М. А. Система розпізнавання об’єктів на основі моделі YOLO / М. А. Назаркевич, Н. Т. Олексів // Український журнал інформаційних технологій. — Львів : Видавництво Львівської політехніки, 2024. — Том 6. — № 1. — С. 120–126.

Endorsement

Review

Supplemented By

Referenced By