Інформаційні системи та мережі

Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/2105

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    Comprehensive analysis of few-shot image classification method using triplet loss
    (Видавництво Львівської політехніки, 2022-03-01) Баранов, Микола; Щербина, Юрій; Baranov, Mykola; Shcherbyna, Yurii; Львівський національний університет ім. Івана Франка; Ivan Franko National University of Lviv
    Задача класифікації зображень є дуже важливою сучасною проблемою в області комп’ютерного зору. Перші підходи до розв’язання цієї задачі полягали у використанні класичних алгоритмів. Незважаючи на певний прогрес, отриманий класичними підходами, більшість складніших задач класифікації зображень залишались нерозв’язаними до початку використання алгоритмів машинного навчання. Перші спроби застосування машинного навчання до задачі розпізнавання зображень допомогли класифікувати набори ознак, які опрацювати прямими алгоритмами не вдавалось. Проте видобування множини ознак залишалося за прямими алгоритмами тривалий час. Нещодавний прогрес у сфері глибокого навчання відкрив можливість побудови систем автоматичного видобування множини ознак. Це зумовило значний прогрес у області комп’ютерного бачення і не тільки. Обробка великомасштабних наборів даних призвела до прориву у задачах розпізнавання зображень. Проте з’явилося нове обмеження– залежність від кількості наявних проанотованих даних. Методи глибинного навчання для задачі класифікації зображення зазвичай потребують великої кількості проанотованих зображень. І більше, сучасні моделі схильні до неочікуваної поведінки на наборах даних з іншого домена (нових класів у випадку розпізнавання зображень). Методи навчання на малому наборі даних дозволяють під час тренування глибоких нейронних мереж використовувати значно менше даних, зберігаючи таку саму точність розпізнавання. Незважаючи на це, залишається компроміс між кількістю наявних даних та точністю моделі. В цій роботі ми побудували сіамську нейронну мережу на основі функції втрат трійки і дослідили, як наявна кількість даних впливає на точність розпізнавання сіамської нейронної мережі. Ми порівняли моделі, отримані навчанням на основі метрик, та базову модель, натреновану на великомасштабних наборах даних.