Розроблення мобільного застосунку розпізнавання породи собаки з використанням згорткової нейронної мережі
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Сфера штучного інтелекту активно проникає в повсякденні сфери життя,
зокрема у зоологію, ветеринарію та догляд за тваринами, де інструменти
комп’ютерного зору дозволяють автоматизувати розпізнавання об’єктів і
прийняття рішень на основі візуальної інформації. Актуальність теми
обумовлена відсутністю доступних інтелектуальних рішень, що дозволяли б
пересічному користувачеві ідентифікувати породу собаки без спеціальних знань
або участі фахівців. Власники тварин, ветеринари та волонтери зоозахисних
організацій потребують швидкого й надійного способу визначення породи на
основі фотографії або камери в реальному часі.
Отже, у даній роботі реалізовано мобільний застосунок на основі глибокої
згорткової нейронної мережі, що здійснює класифікацію зображень собак за
породами. Основу моделі становить архітектура MobileNetV3-Large,
оптимізована для роботи в умовах обмежених ресурсів мобільних пристроїв.
Система охоплює повний життєвий цикл: від передобробки зображень до виводу
результату з докладною інформацією про породу. Реалізовано можливість
обробки фотографій із пам’яті пристрою або в режимі реального часу, додано
модуль генерації текстових описів, а також застосовано алгоритми боротьби з
перенавчанням, включаючи Dropout та early stopping. Проведено порівняльний
аналіз сучасних архітектур (ResNet, EfficientNet, MaxViT), що підтвердив
доцільність обраного рішення.
Об’єктом дослідження є мобільний застосунок розпізнавання породи
собаки з використанням згорткової нейронної мережі.
Предметом дослідження є розроблення мобільного застосунку
розпізнавання породи собаки з використанням згорткової нейронної мережі.
Метою даної роботи є створення ефективного програмного продукту, що
забезпечує автоматичне визначення породи собаки за зображенням із
використанням сучасної нейромережевої моделі, придатної до роботи на
мобільних пристроях.
Проблематика завдання полягає в недостатній точності та обмеженому
функціоналі наявних застосунків, відсутності офлайн-режиму та відкритого
доступу до архітектури моделей, що унеможливлює адаптацію таких рішень до
специфічних вимог або середовищ.
Практичне значення роботи полягає у створенні застосунку, який може
бути використаний у побуті, ветеринарній практиці та волонтерських ініціативах
для прискореного розпізнавання порід собак. Система може бути легко
масштабована або адаптована для класифікації інших тварин чи візуальних
об’єктів із подібною структурою задач.
The field of artificial intelligence is actively penetrating everyday life, including zoology, veterinary medicine, and animal care, where computer vision tools allow automating object recognition and decision-making based on visual information. The topic is relevant due to the lack of available intelligent solutions that would allow an average user to identify a dog's breed without special knowledge or the involvement of specialists. Pet owners, veterinarians, and volunteers of animal protection organizations need a fast and reliable way to identify the breed based on a photo or camera in real time. Thus, this paper implements a mobile application based on a deep convolutional neural network that classifies dog images by breed. The model is based on the MobileNetV3-Large architecture, optimized for operation in conditions of limited resources of mobile devices. The system covers the full life cycle: from image preprocessing to outputting the result with detailed information about the breed. The ability to process photos from the device's memory or in real time has been implemented, a module for generating text descriptions has been added, and anti overlearning algorithms, including Dropout and early stopping, have been applied. A comparative analysis of modern architectures (ResNet, EfficientNet, MaxViT) was conducted, which confirmed the feasibility of the chosen solution. The object of study is a mobile application for dog breed recognition using a convolutional neural network. The subject of the study is development of a mobile application for dog breed recognition using a convolutional neural network. The aim of this work is to create an effective software product that automatically detects the breed of a dog from an image using a modern neural network model suitable for use on mobile devices. The problematic of the task is the lack of accuracy and limited functionality of existing applications, the lack of offline mode and open access to the model architecture, which makes it impossible to adapt such solutions to specific requirements or environments. The practical significance of the work is to create an application that can be used in everyday life, veterinary practice, and volunteer initiatives for accelerated dog breed recognition. The system can be easily scaled or adapted to classify other animals or visual objects with a similar task structure.
The field of artificial intelligence is actively penetrating everyday life, including zoology, veterinary medicine, and animal care, where computer vision tools allow automating object recognition and decision-making based on visual information. The topic is relevant due to the lack of available intelligent solutions that would allow an average user to identify a dog's breed without special knowledge or the involvement of specialists. Pet owners, veterinarians, and volunteers of animal protection organizations need a fast and reliable way to identify the breed based on a photo or camera in real time. Thus, this paper implements a mobile application based on a deep convolutional neural network that classifies dog images by breed. The model is based on the MobileNetV3-Large architecture, optimized for operation in conditions of limited resources of mobile devices. The system covers the full life cycle: from image preprocessing to outputting the result with detailed information about the breed. The ability to process photos from the device's memory or in real time has been implemented, a module for generating text descriptions has been added, and anti overlearning algorithms, including Dropout and early stopping, have been applied. A comparative analysis of modern architectures (ResNet, EfficientNet, MaxViT) was conducted, which confirmed the feasibility of the chosen solution. The object of study is a mobile application for dog breed recognition using a convolutional neural network. The subject of the study is development of a mobile application for dog breed recognition using a convolutional neural network. The aim of this work is to create an effective software product that automatically detects the breed of a dog from an image using a modern neural network model suitable for use on mobile devices. The problematic of the task is the lack of accuracy and limited functionality of existing applications, the lack of offline mode and open access to the model architecture, which makes it impossible to adapt such solutions to specific requirements or environments. The practical significance of the work is to create an application that can be used in everyday life, veterinary practice, and volunteer initiatives for accelerated dog breed recognition. The system can be easily scaled or adapted to classify other animals or visual objects with a similar task structure.
Description
Keywords
6.122.00.00, ЗГОРТКОВІ НЕЙРОННІ МЕРЕЖІ, МОБІЛЬНИЙ
ЗАСТОСУНОК, КОМП’ЮТЕРНИЙ ЗІР, ПОРОДИ СОБАК, DEEP LEARNING, MOBILENET, КЛАСИФІКАЦІЯ ЗОБРАЖЕНЬ, РЕАЛЬНИЙ ЧАС, ТЕНЗОРНЕ
ПРЕДСТАВЛЕННЯ, DROPOUT, EARLY STOPPING.
Перелік використаних джерел:
1.
MDPI
Classification of Dog Breeds Using Convolutional Neural Network //
Bioengineering
[Електронний
https://www.mdpi.com/2306-5354/11/11/1157
2.
ресурс]. –
Режим
доступу:
Fine-Grained Dog Breed Recognition Using MobileNet on Stanford Dogs
// arXiv [Електронний ресурс]. – Режим доступу: https://arxiv.org/pdf/1704.04861
3.
Multi-View Dog Breed Classification: Integrating Image and Metadata //
Asian Federation of Biotechnology Journal of Biological Sciences (AFJBS)
[Електронний
ресурс]. –
Режим
доступу:
https://www.afjbs.com/uploads/paper/feb6e90de95cf1505df4ede9c13b60fb.pdf, CONVOLUTIONAL NEURAL NETWORKS, MOBILE
APPLICATION, COMPUTER VISION, DOG BREEDS, DEEP LEARNING, MOBILENET, IMAGE CLASSIFICATION, REAL TIME, TENSOR
REPRESENTATION, DROPOUT, EARLY STOPPING.
List of used sources:
1.
MDPI
Classification of Dog Breeds Using Convolutional Neural Network //
Bioengineering
[Electronic
resource].
https://www.mdpi.com/2306-5354/11/11/1157
2. –
Resource
access:
Fine-Grained Dog Breed Recognition Using MobileNet on Stanford Dogs
// arXiv [Electronic resource]. – Resource access: https://arxiv.org/pdf/1704.04861
3.
Multi-View Dog Breed Classification: Integrating Image and Metadata //
Asian Federation of Biotechnology Journal of Biological Sciences (AFJBS)
[Electronic
resource]. –
Resource
access:
https://www.afjbs.com/uploads/paper/feb6e90de95cf1505df4ede9c13b60fb.pdf
Citation
Любицька М. Р. Розроблення мобільного застосунку розпізнавання породи собаки з використанням згорткової нейронної мережі : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „6.122.00.00 — Комп'ютерні науки“ / Марта Романівна Любицька. — Львів, 2024. — 75 с.