Методи пошуку та розпізнавання об’єктів у відеозображеннях на мобільній платформі IOS в реальному часі

dc.citation.epage34
dc.citation.issue1
dc.citation.journalTitleКомп’ютерні системи та мережі
dc.citation.spage24
dc.citation.volume1
dc.contributor.affiliationНаціональний університет “Львівська політехніка”
dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.authorКушнір, Д. О.
dc.contributor.authorПарамуд, Я. С.
dc.contributor.authorKushnir, D.
dc.contributor.authorParamud, Y.
dc.coverage.placenameЛьвів
dc.coverage.placenameLviv
dc.date.accessioned2021-04-20T11:41:57Z
dc.date.available2021-04-20T11:41:57Z
dc.date.created2019-03-01
dc.date.issued2019-03-01
dc.description.abstractДосліджено особливості найпоширеніших методів і систем пошуку та розпізнавання об’єктів у відеозображеннях. За результатами дослідження показано доцільність побудови засобів пошуку та розпізнавання для платформи iOS у реальному часі. Запропоновано метод функціональної адаптації алгоритму пошуку та розпізнавання об’єктів до особливостей відеозображень, який полягає в опрацюванні відеозображення згладжуючим та мінімізаційним фільтрами, що забезпечує зменшення часу пошуку та розпізнавання об’єктів. Розроблено базову структурну схему таких засобів та алгоритм функціонування. Розроблено алгоритмічнопрограмні засоби для розв’язання завдання на знаходження та оперативне розпізнавання об’єктів у режимі реального часу мовою Swift під мобільну платформу iOS. Використано особливості згорткової нейронної мережі з архітектурою YOLOv3 та фреймворку для роботи з нейронними мережами під мобільні додатки CoreML. Запропоновано метод поліпшення роботи такої нейронної мережі, який оснований на квантизації вагових коефіцієнтів нейромережі та забезпечує мінімізацію розміру моделі та часу пошуку її об’єктів. Досліджено значення частоти оброблення кадрів зображень із використанням запропонованої моделі YOLOv3-KD та моделей нейронних мереж типу YOLOv3-tiny та YOLOv3-416. Доведено можливість функціонування запропонованих засобів у режимі реального часу.
dc.description.abstractThe features of the most common methods and systems for searching and recognizing objects in video are explored. The research shows the feasibility of building search and recognition tools for the iOS platform in real time. The method of functional adaptation of the algorithm of search and recognition of objects to features of video is offered, which consists in processing of video image by smoothing and minimization filters, which reduces the time of search and recognition of objects. The block diagram and algorithm of system functioning were designed. Developed a program to solve the problem of finding and quickly recognizing objects in real time in Swift language on the iOS mobile platform. A convolutional neural network with YOLOv3 architecture was used along with framework for working with neural networks for mobile CoreML applications. A method of improving the performance of such a neural network is proposed, which is based on the quantization of the neural network weights and minimizes the model size and search time of its objects. The frequencies of image processing using the proposed means and models of neural networks of the type YOLOv3-tiny, YOLOv3-416 and our own model YOLOv3-KD are investigated. The possibility of functioning of the proposed funds in real time is provided.
dc.format.extent24-34
dc.format.pages11
dc.identifier.citationКушнір Д. О. Методи пошуку та розпізнавання об’єктів у відеозображеннях на мобільній платформі IOS в реальному часі / Д. О. Кушнір, Я. С. Парамуд // Комп’ютерні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — Том 1. — № 1. — С. 24–34.
dc.identifier.citationenKushnir D. Methods for real-time object searching and recognizing in video images on IOS mobile platform / D. Kushnir, Y. Paramud // Kompiuterni systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2019. — Vol 1. — No 1. — P. 24–34.
dc.identifier.issn2707-2371
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/56354
dc.language.isouk
dc.publisherВидавництво Львівської політехніки
dc.publisherLviv Politechnic Publishing House
dc.relation.ispartofКомп’ютерні системи та мережі, 1 (1), 2019
dc.relation.references1. Wikipedia. Binary classification [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Binary_classification.
dc.relation.references2. Wikipedia. Support-vector machine [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Support-vector_machine.
dc.relation.references3. Wikipedia. Artificial neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Artificial_neural_network.
dc.relation.references4. Wikipedia. Convolutional neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Convolutional_neural_network.
dc.relation.references5. Rohith Gandhi. R-CNN, Fast R-CNN, Faster R-CNN, YOLO. Object Detection Algorithms [Elektronnyj resurs] / San-Francisco 2018 – Rezhym dostupu: https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e.
dc.relation.references6. Wikipedia. Keras [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Keras.
dc.relation.references7. Hao Gao. Understand Single Shot MultiBox Detector (SSD) and Implement It in Pytorch [Elektronnyj resurs] / San-Francisco 2018. Rezhym dostupu: https://medium.com/@smallfishbigsea/understand-ssd-andimplement-your-own-caa3232cd6ad.
dc.relation.references8. Juan Garcia, Reza Bakhshandeh. Methods and systems for object recognition. [Elektronnyjresurs] / MenloPark2016-Rezhym dostupu: https://patents.google.com/patent/US948940.
dc.relation.references9. Wikipedia. Google Translate [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Google_Translate
dc.relation.referencesen1. Wikipedia. Binary classification [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Binary_classification.
dc.relation.referencesen2. Wikipedia. Support-vector machine [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Support-vector_machine.
dc.relation.referencesen3. Wikipedia. Artificial neural network [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Artificial_neural_network.
dc.relation.referencesen4. Wikipedia. Convolutional neural network [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Convolutional_neural_network.
dc.relation.referencesen5. Rohith Gandhi. R-CNN, Fast R-CNN, Faster R-CNN, YOLO. Object Detection Algorithms [Elektronnyj resurs], San-Francisco 2018 – Rezhym dostupu: https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e.
dc.relation.referencesen6. Wikipedia. Keras [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Keras.
dc.relation.referencesen7. Hao Gao. Understand Single Shot MultiBox Detector (SSD) and Implement It in Pytorch [Elektronnyj resurs], San-Francisco 2018. Rezhym dostupu: https://medium.com/@smallfishbigsea/understand-ssd-andimplement-your-own-caa3232cd6ad.
dc.relation.referencesen8. Juan Garcia, Reza Bakhshandeh. Methods and systems for object recognition. [Elektronnyjresurs], MenloPark2016-Rezhym dostupu: https://patents.google.com/patent/US948940.
dc.relation.referencesen9. Wikipedia. Google Translate [Elektronnyj resurs], Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Google_Translate
dc.relation.urihttps://en.wikipedia.org/wiki/Binary_classification
dc.relation.urihttps://en.wikipedia.org/wiki/Support-vector_machine
dc.relation.urihttps://en.wikipedia.org/wiki/Artificial_neural_network
dc.relation.urihttps://en.wikipedia.org/wiki/Convolutional_neural_network
dc.relation.urihttps://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-detection-algorithms-36d53571365e
dc.relation.urihttps://en.wikipedia.org/wiki/Keras
dc.relation.urihttps://medium.com/
dc.relation.urihttps://patents.google.com/patent/US948940
dc.relation.urihttps://en.wikipedia.org/wiki/Google_Translate
dc.rights.holder© Національний університет “Львівська політехніка”, 2019
dc.rights.holder© Кушнір Д. О., Парамуд Я. С., 2019
dc.subjectчас пошуку об’єктів
dc.subjectчас розпізнавання об’єктів
dc.subjectвідеозображення
dc.subjectмобільна платформа
dc.subjectзгорткова нейронна мережа
dc.subjectреальний масштаб часу
dc.subjectobject search time
dc.subjectobject recognition time
dc.subjectvideo
dc.subjectmobile platform
dc.subjectconvolutional neural network
dc.subjectreal time
dc.subject.udc004.415.2
dc.titleМетоди пошуку та розпізнавання об’єктів у відеозображеннях на мобільній платформі IOS в реальному часі
dc.title.alternativeMethods for real-time object searching and recognizing in video images on IOS mobile platform
dc.typeArticle

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
2019v1n1_Kushnir_D-Methods_for_real_time_object_24-34.pdf
Size:
1.61 MB
Format:
Adobe Portable Document Format
Thumbnail Image
Name:
2019v1n1_Kushnir_D-Methods_for_real_time_object_24-34__COVER.png
Size:
390.9 KB
Format:
Portable Network Graphics

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.99 KB
Format:
Plain Text
Description: