Інтелектуальна система розпізнавання об’єктів у відеопотоці з використанням методів машинного навчання.
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
З ростом оптимізації виробництва стало необхідним забезпечити роботу багатьох технологічних процесів без участі людини або з її мінімальними зусиллями. В основному це процеси, пов’язані з рутинною роботою, яку потрібно виконати за мінімальний час[1]. За допомогою комп’ютерного зору ви можете контролювати не тільки виробництво, відстеження дефектів, але і роботу самих людей, мінімізуючи їх помилки, або максимально полегшивши їх роботу.
На сьогоднішній день серед найбільш поширених підходів до розпізнавання образів можна виділити: оптичне розпізнавання образів - можна застосувати метод перебору вигляду об'єкта під різними кутами, масштабами, зсувами й т. д; знаходження контуру об'єкта й дослідження його властивостей; використання штучних нейронних мереж. Цей метод вимагає або великої кількості прикладів задачі розпізнавання (із правильними відповідями), або спеціальної структури нейронної мережі, що враховує специфіку даної задачі. В даний час однією із проблем розвитку інтелектуальних систем розпізнавання образів є відсутність доступного технічного оснащення. Камери, що здатні передавати якісні зображення, коштують дуже дорого. Таким чином, мала кількість суб’єктів світової економіки може собі дозволити такі витрати. Часто вони являються недоцільними, беручи до уваги що такі системи зазвичай стають дуже ресурсозатратними[2]. До проблем низькоякісного обладнання додаються фактори освітлення, погодних умов, температурного режиму.
На сьогоднішній день так і не розроблений оптимальний алгоритм розпізнавання, існує декілька відомих бібліотек, які допомагають вирішувати вузькоспеціалізовані проблеми, але стають безсилими при розпізнанні незвичних об’єктів. Проблема розпізнавання образів складається з двох частин: навчання та розпізнавання. Навчання здійснюється шляхом показу незалежних об'єктів з віднесенням їх до того чи іншого класу. За результатами навчання система повинна набути здатності реагувати однаковими реакціями на всі об'єкти одного образу і різними - на всі інші. Важливо, що в процесі навчання вказуються тільки самі об'єкти і їх приналежність образу. За навчанням слідує процес розпізнавання, який характеризує дії вже навченої системи. Автоматизація цих процедур і становить проблему. Провідні світові компанії, такі як Google, Microsoft, Facebook Apple, Intel створили відділи по розробці бібліотек розпізнавання образів[3]. Поки результати їх роботи обмежуються простими додатками з розпізнаванням порід тварин, людей, однак, ймовірність їх розвитку в найближчій перспективі є досить високими.
Об’єкт дослідження – процес розпізнавання рухомих об’єктів у відео потоці.
Предмет дослідження – методи та засоби розпізнавання об’єктів у відео потоці з використання методів машинного навчання
Метою магістерської кваліфікаційної роботи є розроблення інтелектуальної системи, яка призначена для розпізнавання рухомих об’єктів у відео потоці з використанням машинного навчання із збереженням відповідних відрізків відео в файл для контролю зі сторони людини та класифікацією тих чи інших рухомих об’єктів .
Основна логіка програми винесена в 4 окремі модулі:
• модуль розпізнавання рухів;
• модуль машинного навчання;
• модуль розпізнавання образів;
• модуль формування відео файлу.
Кожен модуль виконує свій певний функціонал, а результат роботи перенаправляє наступному. Спочатку модуль розпізнавання рухів відкидає шуми, формує контур зображення та відправляє його до модулю розпізнавання образів. В свою чергу він за допомогою алгоритмів компютерного зору розпізнає контури та співставляє їх з уже навявною моделлю даних для образів людського тіла, таким чином роблячи припущення щодо класифікації обєкта. У разі успіху, машина навчається на уже перевірених обєктах та додає їх у свою модель. Також на цьому етапі відбувається візуальне виділення розпізнаного об’єкту в спеціальну рамку. На останньому етапі модуль формування відео файлу з’єднує кадри в єдиний файл і зберігає на комп’ютері.
Comprehensive optimization of production processes and technological operations using computer vision technology is a feature of modern society. At the same time, among the common approaches to recognition are the following areas based on optical pattern recognition (used mainly in OCR systems), methods of circuit identification (contour analysis algorithms) and the use of artificial neural networks and machine learning technologies [1]. The task of object recognition consists of two parts: learning and recognition. Training is done by displaying independent objects of one class. As a result of the training, the system must be able to respond to all objects of one class. Recognition process that determines the actions of an already trained system goes next. Informatization of this process is the main problem. Leading global companies such as Google, Microsoft, Facebook Apple, Intel have set up departments to develop image recognition libraries, but their results boil down to applications for recognizing animals, humans, and etc [2]. The analysis of the existing software (VLC Media Player, MotionDetect detector, Table View Video Player, dvr-scan, Yawcam) showed their narrow orientation and many disadvantages (commercialization of use, limited functionality, poor quality of recognition). As a result, the urgent task is to create an object recognition information system in the video stream Today, scientific sources widely present various methods of object recognition and computer vision. In particular, Ajeet RamPathak paper[3] demystifies the role of deep learning techniques based on convolutional neural network for object detection. Deep learning frameworks and services available for object detection are also enunciated. Very wide overview of past research on object detection, outline the current main research directions, and discuss open problems and possible future directions described in "Object Detection: Current and Future Directions" [4]. Study object : the process of recognizing moving objects in a video stream. Scope of research: methods and means of object recognition in the video stream using machine learning methods Goal of research: to develop an intelligent system that is designed to recognize moving objects in the video stream using machine learning while saving the relevant sections of video in a file for human control and classification of certain moving objects. The algorithm of the software is as follows. At the beginning of the video, the flow is analyzed for any movement on which noise cancellation (wind fluctuations, slight shifts) is performed. When motion is detected, the object is framed and tracked with further grading. On this step machine learning modules performs several algorithms to detect to what type the object is referred. Selected contours of objects are compared with a large set of data objects that have already been identified and at a certain threshold of convergence, decisions will be developed on the classification of an object[5]. The result of the work is the original image which with high accuracy can determine whether the object belongs to a particular cluster
Comprehensive optimization of production processes and technological operations using computer vision technology is a feature of modern society. At the same time, among the common approaches to recognition are the following areas based on optical pattern recognition (used mainly in OCR systems), methods of circuit identification (contour analysis algorithms) and the use of artificial neural networks and machine learning technologies [1]. The task of object recognition consists of two parts: learning and recognition. Training is done by displaying independent objects of one class. As a result of the training, the system must be able to respond to all objects of one class. Recognition process that determines the actions of an already trained system goes next. Informatization of this process is the main problem. Leading global companies such as Google, Microsoft, Facebook Apple, Intel have set up departments to develop image recognition libraries, but their results boil down to applications for recognizing animals, humans, and etc [2]. The analysis of the existing software (VLC Media Player, MotionDetect detector, Table View Video Player, dvr-scan, Yawcam) showed their narrow orientation and many disadvantages (commercialization of use, limited functionality, poor quality of recognition). As a result, the urgent task is to create an object recognition information system in the video stream Today, scientific sources widely present various methods of object recognition and computer vision. In particular, Ajeet RamPathak paper[3] demystifies the role of deep learning techniques based on convolutional neural network for object detection. Deep learning frameworks and services available for object detection are also enunciated. Very wide overview of past research on object detection, outline the current main research directions, and discuss open problems and possible future directions described in "Object Detection: Current and Future Directions" [4]. Study object : the process of recognizing moving objects in a video stream. Scope of research: methods and means of object recognition in the video stream using machine learning methods Goal of research: to develop an intelligent system that is designed to recognize moving objects in the video stream using machine learning while saving the relevant sections of video in a file for human control and classification of certain moving objects. The algorithm of the software is as follows. At the beginning of the video, the flow is analyzed for any movement on which noise cancellation (wind fluctuations, slight shifts) is performed. When motion is detected, the object is framed and tracked with further grading. On this step machine learning modules performs several algorithms to detect to what type the object is referred. Selected contours of objects are compared with a large set of data objects that have already been identified and at a certain threshold of convergence, decisions will be developed on the classification of an object[5]. The result of the work is the original image which with high accuracy can determine whether the object belongs to a particular cluster
Description
Citation
Рудчик І. В. Інтелектуальна система розпізнавання об’єктів у відеопотоці з використанням методів машинного навчання. : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „3.124.00.00 — Системний аналіз (освітньо-наукова програма)“ / Ілля Валентинович Рудчик. — Львів, 2021. — 95 с.