Моделі глибинного навчання для підвищення резолюцій зображень

Loading...
Thumbnail Image

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет ”Львівська політехніка”

Abstract

Магістерська кваліфікаційна робота виконана студентом групи КНСШ-22 Натялгим Андрієм Миколайовичем. Тема “Моделі глибинного навчання для підвищення резолюцій зображень”. Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Метою дипломної роботи є побудова нейронної мережі для покращення чіткості розмитих зображень тексту та розроблення системи для використання побудованої мережі на практиці. Об’єктом дослідження є покращення чіткості розмитих зображень тексту та розробка системи для використання розроблених алгоритмів на практиці. У результаті виконання дипломної роботи було запропоновано нову архітектуру глибокої нейронної мережі, яка володіючи у 25 разів меншою кількості параметрів досягає близький результатів до мережі CNN-L15 на метриках SSIM, PSNR та під час візуального порівняння оброблених зображень. Також, запропоновано модифікації архітектури та функції втрат мережі CNN-L15, які за однакової кількості епох, дозволяють досягти помітно кращих результатів метрик та візуальної різкості зображень. Дана система може використовуватися на практиці для оптимізації опрацювання сфотографованих документів із розмиттям, які потребують людських ресурсів для їх опрацювання. Master’s degree work of the student of the group CSAI-22 Natiahlyi Andrii Mykolaiovych. The topic is "Domain specific image super resolution models". The work is aimed at obtaining a master's degree in 122 "Computer Science". The purpose of the thesis is to build a neural network to improve the clarity of blurred text images and develop a system for using the built network in practice. The object of research is to improve the clarity of blurred text images and to develop a system for using the developed algorithms in practice. As a result of the thesis, a new architecture of a deep neural network was proposed, which with 25 times fewer parameters achieves close results to the CNN-L15 network on the metrics SSIM, PSNR and visual comparison of processed images. Also, modifications of the architecture and loss function of the CNN-L15 network are proposed, which, with the same number of epochs, allow to achieve significantly better results of metrics and visual sharpness of images. This system can be used in practice to optimize the processing of photographed documents with blur, which require human resources for their processing.

Description

Keywords

згорткові нейронні мережі, методи усунення розмиття, машинне навчання, втрата сприйняття, convolutional neural networks, blur removal methods, machine learning, loss of perception

Citation

Натялгий А. М. Моделі глибинного навчання для підвищення резолюцій зображень : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Андрій Миколайович Натялгий ; Національний університет «Львівська політехніка». – Львів, 2022. – 50 с.

Endorsement

Review

Supplemented By

Referenced By