Аналіз ефективності камер і алгоритмів комп’ютерного зору
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Бакалаврська кваліфікаційна робота присвячена аналізу сучасних підходів
до аналізу зображень у задачах комп’ютерного зору з метою підвищення
точності та ефективності сегментації об'єктів. У рамках дослідження розглянуто
два основних підходи: застосування промислового сенсора технічного зору IFM
O2V100 та використання штучної нейронної мережі типу U-Net для
семантичної сегментації.
У першому розділі роботи здійснено аналітичний огляд наявних методів
технічного зору, принципів побудови сенсорів, підходів до підвищення точності
розпізнавання зображень у промисловості, автоматизації та робототехніці.
Особливу увагу присвячено перевагам та недолікам традиційних систем
комп’ютерного зору порівняно з методами, що базуються на глибинних
нейронних мережах [1].
У другому розділі розглянуто технологічні та алгоритмічні засоби
вирішення задачі сегментації. Детально описано технічні характеристики
сенсора IFM O2V100 та його налаштування для виконання конкретних завдань.
Паралельно було розроблено підхід на основі архітектури нейронної мережі
U-Net, включаючи етапи підготовки датасету, застосування аугментації, вибір
функції втрат, оптимізатора і параметрів тренування [2].
Третій розділ містить результати практичного експерименту: здійснено
тестування роботи сенсора IFM O2V100 у умовах стабільного освітлення та на
однорідних та неоднорідних об’єктах. Проведено навчання нейромережевої
моделі U-Net на зображеннях, що імітують виробниче середовище. Отримані
6
метрики точності демонструють високу ефективність навченої моделі навіть в
умовах варіативного фону, освітлення та складної структури об’єктів [3].
У четвертому розділі проведено економічну аргументацію виконаної
науково-дослідної роботи, включаючи розрахунки витрат на оплату праці,
використання комп’ютерної техніки, спеціалізованого обладнання, а також
визначення договірної ціни наукової розробки.
У висновках узагальнено переваги та обмеження кожного підходу. Сенсор
IFM O2V100 є ефективним інструментом для вирішення вузьких задач у
стабільних умовах завдяки простоті налаштування, високій швидкості та
можливості автономного функціонування. Водночас U-Net забезпечує модульну
гнучкість, масштабованість і адаптивність до складних середовищ, але потребує
більше ресурсів на етапі розробки та налаштування.
Робота демонструє доцільність комплексного підходу до проєктування
систем комп’ютерного зору та може бути корисною для інженерів і дослідників,
що працюють у сфері автоматизації, контролю якості та промислової інспекції.
This bachelor’s thesis is dedicated to the analysis of modern approaches to image processing in computer vision tasks and aimed at improving the accuracy and efficiency of object segmentation. The study investigates two primary methods: the use of the industrial vision sensor IFM O2V100 and the application of an artificial neural network of the U-Net architecture for semantic segmentation. The first chapter provides a comprehensive analytical review of current computer vision technologies, the principles of sensor construction, and methods for improving image recognition accuracy in industrial, automation, and robotics applications. The advantages and limitations of traditional machine vision systems are compared with those based on deep neural networks [1]. The second chapter focuses on the technological and algorithmic tools used to solve image segmentation tasks. The technical characteristics of the IFM O2V100 sensor are described in detail, along with the process of configuring it for specific tasks. In parallel, a deep learning-based segmentation pipeline was developed using the U-Net model, covering dataset preparation, data augmentation, selection of loss functions, optimizer and training parameters [2]. The third chapter presents practical experimental results. The IFM O2V100 sensor was tested under stable lighting conditions with uniform objects. The U-Net model was trained on a dataset simulating a production environment. The obtained evaluation metrics demonstrate high segmentation performance even under conditions of varying object placement, lighting changes, and complex image structures [3]. 8 The fourth chapter includes an economic analysis of the research and development effort, calculating labor costs, computing resources, specialized equipment usage, and the contractual price of the research project. The final conclusions summarize the strengths and limitations of both approaches. The IFM O2V100 sensor proves effective for narrow tasks in stable environments due to its simplicity, speed, and autonomous operation. Meanwhile, the U-Net neural network offers flexibility of modules, scalability, and adaptability to complex conditions, though it requires more resources during development and training. This work demonstrates the benefits of an integrated approach to designing computer vision systems and may be of practical value to engineers and researchers involved in automation, quality control, and industrial inspection.
This bachelor’s thesis is dedicated to the analysis of modern approaches to image processing in computer vision tasks and aimed at improving the accuracy and efficiency of object segmentation. The study investigates two primary methods: the use of the industrial vision sensor IFM O2V100 and the application of an artificial neural network of the U-Net architecture for semantic segmentation. The first chapter provides a comprehensive analytical review of current computer vision technologies, the principles of sensor construction, and methods for improving image recognition accuracy in industrial, automation, and robotics applications. The advantages and limitations of traditional machine vision systems are compared with those based on deep neural networks [1]. The second chapter focuses on the technological and algorithmic tools used to solve image segmentation tasks. The technical characteristics of the IFM O2V100 sensor are described in detail, along with the process of configuring it for specific tasks. In parallel, a deep learning-based segmentation pipeline was developed using the U-Net model, covering dataset preparation, data augmentation, selection of loss functions, optimizer and training parameters [2]. The third chapter presents practical experimental results. The IFM O2V100 sensor was tested under stable lighting conditions with uniform objects. The U-Net model was trained on a dataset simulating a production environment. The obtained evaluation metrics demonstrate high segmentation performance even under conditions of varying object placement, lighting changes, and complex image structures [3]. 8 The fourth chapter includes an economic analysis of the research and development effort, calculating labor costs, computing resources, specialized equipment usage, and the contractual price of the research project. The final conclusions summarize the strengths and limitations of both approaches. The IFM O2V100 sensor proves effective for narrow tasks in stable environments due to its simplicity, speed, and autonomous operation. Meanwhile, the U-Net neural network offers flexibility of modules, scalability, and adaptability to complex conditions, though it requires more resources during development and training. This work demonstrates the benefits of an integrated approach to designing computer vision systems and may be of practical value to engineers and researchers involved in automation, quality control, and industrial inspection.
Description
Keywords
6.122.00.09, – Machine Vision, Computer Vision, Neural Network, U-Net, Image segmentation.
Перелік використаних джерел:
1. GeeksforGeeks. Difference between Traditional Computer Vision Techniques
and Deep Learning-based Approaches - GeeksforGeeks. GeeksforGeeks. URL:
https://www.geeksforgeeks.org/difference-between-traditional-computer-vision
-techniques-and-deep-learning-based-approaches/ (дата звернення:
18.05.2025).
2. O2V100. ifm - automation made in Germany. URL:
https://www.ifm.com/gb/en/product/O2V100 (дата звернення: 18.05.2025).
3. Research of U-Net-Based CNN Architectures for Metal Surface Defect
Detection. MDPI. URL: https://www.mdpi.com/2075-1702/10/5/327 (дата
звернення: 18.05.2025), – Machine Vision, Computer Vision, Neural Network, U-Net, Image
segmentation.
List of used sources:
1. GeeksforGeeks. Difference between Traditional Computer Vision Techniques
and Deep Learning-based Approaches - GeeksforGeeks. GeeksforGeeks. URL:
https://www.geeksforgeeks.org/difference-between-traditional-computer-vision
-techniques-and-deep-learning-based-approaches/ (date of access: 18.05.2025).
2. O2V100. ifm - automation made in Germany. URL:
https://www.ifm.com/gb/en/product/O2V100 (date of access: 18.05.2025).
3. Research of U-Net-Based CNN Architectures for Metal Surface Defect
Detection. MDPI. URL: https://www.mdpi.com/2075-1702/10/5/327 (date of
access: 18.05.2025)
Citation
Петльований М. І. Аналіз ефективності камер і алгоритмів комп’ютерного зору : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „6.122.00.09 — Системна інженерія (Інтернет речей)“ / Мар'ян Ігорович Петльований. — Львів, 2024. — 64 с.