Методи та засоби покращення точності розпізнавання об’єктів на мобільній платформі IOS у реальному часі
dc.citation.epage | 88 | |
dc.citation.issue | 1 | |
dc.citation.journalTitle | Комп’ютерні системи та мережі | |
dc.citation.spage | 80 | |
dc.citation.volume | 3 | |
dc.contributor.affiliation | Національний університет “Львівська політехніка” | |
dc.contributor.affiliation | Lviv Polytechnic National University | |
dc.contributor.author | Кушнір, Д. О. | |
dc.contributor.author | Kushnir, D. | |
dc.coverage.placename | Львів | |
dc.coverage.placename | Lviv | |
dc.date.accessioned | 2023-04-20T10:52:16Z | |
dc.date.available | 2023-04-20T10:52:16Z | |
dc.date.created | 2021-06-06 | |
dc.date.issued | 2021-06-06 | |
dc.description.abstract | За результатами аналізу літературних джерел встановлено що перспективним напрямом пошуку та розпізнавання об’єктів є сім’я моделей Yolo. Проте наявні реалізації не підтримують можливості запуску моделі на платформі iOS. Для досягнення таких цілей розроблено комплексну масштабовану систему конвертації та підвищення точності розпізнавання довільних моделей на базі системи Docker. Методика покращення полягає у додаванні до оригінальної моделі додаткового шару із функцією активації Mish. Методика конвертації полягає в оперативному перетворенні довільної моделі Yolo у формат CoreML. Під час дослідження цих методик була створена модель нейронної мережі Yolov4_TCAR. Крім того, розроблено метод акселерації навантаження на CPU із використанням додаткового шару нейронної мережі з функцією активації Mish мовою Swift під мобільну платформу iOS. В результаті досліджено ефективність функції активації Mish, навантаження CPU мобільного пристрою, кількість використаної оперативної пам’яті та частоту кадрів у разі використання поліпшеної оригінальної моделі Yolov4-TCAR. Результати досліджень підтвердили функціонування алгоритму конвертації та підвищення точності моделі нейронної мережі у реальному часі | |
dc.description.abstract | As a result of the analytical review, it was established that the family of Yolo models is a promising area of search and recognition of objects. However, existing implementations do not support the ability to run the model on the iOS platform. To achieve these goals, a comprehensive scalable conversion system has been developed to improve the recognition accuracy of arbitrary models based on the Docker system. The method of improvement is to add a layer with the Mish activation function to the original model. The method of conversion is to quickly convert any Yolo model to CoreML format. As part of the study of these techniques, a model of the neural network Yolov4_TCAR was created. Additionally, a method of accelerating the load on the CPU using an additional layer of neural network with the function of activating Mish in Swift for the iOS mobile platform was added. As a result, the effectiveness of the Mish activation function, the CPU load of the mobile device, the amount of RAM used, and the frame rate when using the improved original Yolov4- TCAR model were studied. The results of the research confirmed the functioning of the algorithm for conversion and accuracy increase of the neural network model in real-time. | |
dc.format.extent | 80-88 | |
dc.format.pages | 9 | |
dc.identifier.citation | Кушнір Д. О. Методи та засоби покращення точності розпізнавання об’єктів на мобільній платформі IOS у реальному часі / Д. О. Кушнір // Комп’ютерні системи та мережі. — Львів : Видавництво Львівської політехніки, 2021. — Том 3. — № 1. — С. 80–88. | |
dc.identifier.citationen | Kushnir D. (2021) Metody ta zasoby pokrashchennia tochnosti rozpiznavannia obiektiv na mobilnii platformi IOS u realnomu chasi [Methods and means for real-time object recognition accuracy increase in video images on IOS mobile platform]. Kompiuterni systemy ta merezhi (Lviv), vol. 3, no 1, pp. 80-88 [in Ukrainian]. | |
dc.identifier.doi | https://doi.org/10.23939/csn2021.01.080 | |
dc.identifier.uri | https://ena.lpnu.ua/handle/ntb/57964 | |
dc.language.iso | uk | |
dc.publisher | Видавництво Львівської політехніки | |
dc.publisher | Lviv Politechnic Publishing House | |
dc.relation.ispartof | Комп’ютерні системи та мережі, 1 (3), 2021 | |
dc.relation.references | 1. Yuefeng Zhang (2020). Deep Learning for Detecting Objects in an Image on Mobile Devices [Online]. Available at: https://towardsdatascience.com/deep-learning-for-detecting-objects-in-an-image-on-mobile-devices7d5b2e5621f9 (Accessed: April 2020) | |
dc.relation.references | 2. Redmon J., Divvala S., Girshick R. and Farhadi A. (2016), “You Only Look Once: Unified, Real-Time Object Detection”, 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 779–788. DOI: 10.1109/CVPR.2016.91. | |
dc.relation.references | 3. Bochkovskiy A., Redmon J., Sinigardi S., cyy, Hager T., JaledMC, Maaz M., Zhang V., Alasuutari J., Kahn P., Ovodov I., Veitch-Michaelis J., Dujardin A., Aughey J., Patel A., duohappy, Aven, Smith D., White J., … Giordano M. (2021). AlexeyAB/darknet: YOLOv4 (Version yolov4). Zenodo. DOI: https://doi.org/10.5281/ zenodo.5622675. | |
dc.relation.references | 4. Kin-Yiu, W. (2021). Implementation of Scaled-YOLOv4 using PyTorch framework (v1.0.0). Zenodo. DOI: https://doi.org/10.5281/zenodo.5534091. | |
dc.relation.references | 5. Jocher G., Stoken A., Chaurasia A., Borovec J., NanoCode012, Xie Tao, Kwon Y., Kalen M., Changyu L., Fang J., Abhiram V., Laughing, tkianai, yxNONG, Skalski P., Hogan A., Nadar Jebastin, imyhxy, Mammana L., … wanghaoyang0106 (2021). ultralytics/yolov5: v6.0 – YOLOv5n 'Nano' models, Roboflow integration, TensorFlow export, OpenCV DNN support (v6.0). Zenodo. DOI: https://doi.org/10.5281/zenodo.5563715. | |
dc.relation.references | 6. Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao (2021). You Only Learn One Representation: Unified Network for Multiple Tasks [Online]. Available at: https://arxiv.org/abs/2105.04206 (Accessed: May 2021). | |
dc.relation.references | 7. Chamidu Supeshala (2020). YOLO v4 or YOLO v5 or PP-YOLO? [Online]. Available at: https://blog.roboflow.com/yolov5-is-here (Accessed: June 2020). | |
dc.relation.references | 8. Chaity Banerjee, Tathagata Mukherjee, and Eduardo Pasiliao. 2020. The Multi-phase ReLU Activation Function. In Proceedings of the 2020 ACM Southeast Conference (ACM SE '20). Association for Computing Machinery, New York, NY, USA, 239–242. DOI:https://doi.org/10.1145/3374135.3385313. | |
dc.relation.references | 9. Diganta Misra (2019). Mish: A Self Regularized Non-Monotonic Activation Function [Online]. Available at: https://arxiv.org/abs/1908.08681 (Accessed: June 2020). | |
dc.relation.references | 10. Joshi, V., Das, A., Sun, E., Mehta, R. R., Li, J., Gong, Y. (2021). Multiple Softmax Architecture for Streaming Multilingual End-to-End ASR Systems. Proc. Interspeech 2021, 1767–1771. DOI: 10.21437/Interspeech.2021-1298. | |
dc.relation.references | 11. Sridhar Narayan (1997). The generalized sigmoid activation function: Competitive supervised learning [Online]. DOI: https://doi.org/10.1016/S0020-0255(96)00200-9 (Accessed: June 1997). | |
dc.relation.references | 12. Abhishek Mishra. “Machine Learning for iOS Developers”, John Wiley & Sons, 2020. DOI: 10.1002/9781119602927. | |
dc.relation.references | 13. Shuangfeng Li (2020). TensorFlow Lite: On-Device Machine Learning Framework[J]. Journal of Computer Research and Development, 57(9): 1839–1853. DOI: https://doi.org/10.7544/issn1000-1239.2020.20200291. | |
dc.relation.references | 14. Opala M. (2018). TensorLite. Core ML vs TensorflowLite: ML Mobile Frameworks Comparison [Online]. Available at: https://www.netguru.com/blog/coreml-vs-tensorflow-lite-mobile (Accessed: December 2018). | |
dc.relation.references | 15. Merkel D. (2014). “Docker: lightweight Linux containers for consistent development and deployment”. Linux journal, No. 239, 2 [online]. Available at: https://www.linuxjournal.com/content/dockerlightweight-linux-containers-consistent-development-and-deployment (Accessed: May 2014). | |
dc.relation.references | 16. Kushnir D. and Paramud Y. (2020) “Model for Real-Time Object Searching and Recognizing on Mobile Platform”, 2020 IEEE 15th International Conference on Advanced Trends in Radioelectronics, Telecommunications and Computer Engineering (TCSET), 127–130. DOI: 10.1109/TCSET49122.2020.235407. | |
dc.relation.referencesen | 1. Yuefeng Zhang (2020). Deep Learning for Detecting Objects in an Image on Mobile Devices [Online]. Available at: https://towardsdatascience.com/deep-learning-for-detecting-objects-in-an-image-on-mobile-devices7d5b2e5621f9 (Accessed: April 2020) | |
dc.relation.referencesen | 2. Redmon J., Divvala S., Girshick R. and Farhadi A. (2016), "You Only Look Once: Unified, Real-Time Object Detection", 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 779–788. DOI: 10.1109/CVPR.2016.91. | |
dc.relation.referencesen | 3. Bochkovskiy A., Redmon J., Sinigardi S., cyy, Hager T., JaledMC, Maaz M., Zhang V., Alasuutari J., Kahn P., Ovodov I., Veitch-Michaelis J., Dujardin A., Aughey J., Patel A., duohappy, Aven, Smith D., White J., … Giordano M. (2021). AlexeyAB/darknet: YOLOv4 (Version yolov4). Zenodo. DOI: https://doi.org/10.5281/ zenodo.5622675. | |
dc.relation.referencesen | 4. Kin-Yiu, W. (2021). Implementation of Scaled-YOLOv4 using PyTorch framework (v1.0.0). Zenodo. DOI: https://doi.org/10.5281/zenodo.5534091. | |
dc.relation.referencesen | 5. Jocher G., Stoken A., Chaurasia A., Borovec J., NanoCode012, Xie Tao, Kwon Y., Kalen M., Changyu L., Fang J., Abhiram V., Laughing, tkianai, yxNONG, Skalski P., Hogan A., Nadar Jebastin, imyhxy, Mammana L., … wanghaoyang0106 (2021). ultralytics/yolov5: v6.0 – YOLOv5n 'Nano' models, Roboflow integration, TensorFlow export, OpenCV DNN support (v6.0). Zenodo. DOI: https://doi.org/10.5281/zenodo.5563715. | |
dc.relation.referencesen | 6. Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao (2021). You Only Learn One Representation: Unified Network for Multiple Tasks [Online]. Available at: https://arxiv.org/abs/2105.04206 (Accessed: May 2021). | |
dc.relation.referencesen | 7. Chamidu Supeshala (2020). YOLO v4 or YOLO v5 or PP-YOLO? [Online]. Available at: https://blog.roboflow.com/yolov5-is-here (Accessed: June 2020). | |
dc.relation.referencesen | 8. Chaity Banerjee, Tathagata Mukherjee, and Eduardo Pasiliao. 2020. The Multi-phase ReLU Activation Function. In Proceedings of the 2020 ACM Southeast Conference (ACM SE '20). Association for Computing Machinery, New York, NY, USA, 239–242. DOI:https://doi.org/10.1145/3374135.3385313. | |
dc.relation.referencesen | 9. Diganta Misra (2019). Mish: A Self Regularized Non-Monotonic Activation Function [Online]. Available at: https://arxiv.org/abs/1908.08681 (Accessed: June 2020). | |
dc.relation.referencesen | 10. Joshi, V., Das, A., Sun, E., Mehta, R. R., Li, J., Gong, Y. (2021). Multiple Softmax Architecture for Streaming Multilingual End-to-End ASR Systems. Proc. Interspeech 2021, 1767–1771. DOI: 10.21437/Interspeech.2021-1298. | |
dc.relation.referencesen | 11. Sridhar Narayan (1997). The generalized sigmoid activation function: Competitive supervised learning [Online]. DOI: https://doi.org/10.1016/S0020-0255(96)00200-9 (Accessed: June 1997). | |
dc.relation.referencesen | 12. Abhishek Mishra. "Machine Learning for iOS Developers", John Wiley & Sons, 2020. DOI: 10.1002/9781119602927. | |
dc.relation.referencesen | 13. Shuangfeng Li (2020). TensorFlow Lite: On-Device Machine Learning Framework[J]. Journal of Computer Research and Development, 57(9): 1839–1853. DOI: https://doi.org/10.7544/issn1000-1239.2020.20200291. | |
dc.relation.referencesen | 14. Opala M. (2018). TensorLite. Core ML vs TensorflowLite: ML Mobile Frameworks Comparison [Online]. Available at: https://www.netguru.com/blog/coreml-vs-tensorflow-lite-mobile (Accessed: December 2018). | |
dc.relation.referencesen | 15. Merkel D. (2014). "Docker: lightweight Linux containers for consistent development and deployment". Linux journal, No. 239, 2 [online]. Available at: https://www.linuxjournal.com/content/dockerlightweight-linux-containers-consistent-development-and-deployment (Accessed: May 2014). | |
dc.relation.referencesen | 16. Kushnir D. and Paramud Y. (2020) "Model for Real-Time Object Searching and Recognizing on Mobile Platform", 2020 IEEE 15th International Conference on Advanced Trends in Radioelectronics, Telecommunications and Computer Engineering (TCSET), 127–130. DOI: 10.1109/TCSET49122.2020.235407. | |
dc.relation.uri | https://towardsdatascience.com/deep-learning-for-detecting-objects-in-an-image-on-mobile-devices7d5b2e5621f9 | |
dc.relation.uri | https://doi.org/10.5281/ | |
dc.relation.uri | https://doi.org/10.5281/zenodo.5534091 | |
dc.relation.uri | https://doi.org/10.5281/zenodo.5563715 | |
dc.relation.uri | https://arxiv.org/abs/2105.04206 | |
dc.relation.uri | https://blog.roboflow.com/yolov5-is-here | |
dc.relation.uri | https://doi.org/10.1145/3374135.3385313 | |
dc.relation.uri | https://arxiv.org/abs/1908.08681 | |
dc.relation.uri | https://doi.org/10.1016/S0020-0255(96)00200-9 | |
dc.relation.uri | https://doi.org/10.7544/issn1000-1239.2020.20200291 | |
dc.relation.uri | https://www.netguru.com/blog/coreml-vs-tensorflow-lite-mobile | |
dc.relation.uri | https://www.linuxjournal.com/content/dockerlightweight-linux-containers-consistent-development-and-deployment | |
dc.rights.holder | © Національний університет „Львівська політехніка“, 2021 | |
dc.rights.holder | © Кушнір Д. О., 2021 | |
dc.subject | Yolo | |
dc.subject | алгоритм конвертації та покращення вхідної моделі | |
dc.subject | модель нейронної мережі | |
dc.subject | функція активації | |
dc.subject | акселерація CPU | |
dc.subject | масштабована система | |
dc.subject | Mish | |
dc.subject | Docker | |
dc.subject | реальний час | |
dc.subject | Swift | |
dc.subject | Yolo | |
dc.subject | input model conversion and improvement algorithm | |
dc.subject | neural network model | |
dc.subject | activation function | |
dc.subject | CPU acceleration | |
dc.subject | scalable system | |
dc.subject | Mish | |
dc.subject | Docker | |
dc.subject | real time | |
dc.subject | Swift | |
dc.subject.udc | 004.415.2 | |
dc.title | Методи та засоби покращення точності розпізнавання об’єктів на мобільній платформі IOS у реальному часі | |
dc.title.alternative | Methods and means for real-time object recognition accuracy increase in video images on IOS mobile platform | |
dc.type | Article |