Поєднання методів OCR у задачі розпізнавання рукописного тексту

Loading...
Thumbnail Image

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет ”Львівська політехніка”

Abstract

До магістерської роботи Семковича Володимира Ігоровича «Поєднання методів OCR у задачі розпізнавання рукописного тексту» Актуальність теми. Оптичне розпізнавання образів є одним з завдань, які людина вирішує неперервно. При цьому з органів зору надходить інформація, що обробляється мозком, який забезпечує прийняття рішення про об’єкт розпізнавання. Однією з важливих областей застосування розпізнавання, чи класифікації, є розпізнавання друкованого або рукописного текстів. Навіть із впровадженням нових технологій рукописний текст залишається способом спілкування та збору інформації у повсякденному житті. Крім того, великі історичні колекції недоступні у зручному форматі. В даний час підходи і методи перетворення зображень в цифровий текст швидко розвиваються, хоча ще є можливості для вдосконалення і вирішення багатьох проблем. Рукописні цифри та інтерактивне письмо якісно розпізнаються. Однак сучасний рівень техніки все ще обмежений розпізнаванням зображень тексту різними почерками та мовами.Однак поточні технології все ще знаходиться на обмеженому рівні, щоб розпізнавати текстові зображення різних стилів та мов рукописного вводу. Проблема ефективного розпізнавання тексту посідає важливе місце в сферах інформатизації різних процесів людської діяльності. Текстове представлення інформації, порівняно із графічним, дозволяє істотно скоротити витрати на зберігання та передачу інформації. Тому найбільший інтерес з практичної точки зору представляє саме перетворення інформації з паперових носіїв в текстовий електронний документ. Тому перенесення написаних в ручну чи друкованих текстів є досить актуальним. Збереження важливих документів в електронному форматі, вважається одним з головних способів захисту пам’яті та успадкування того, що нам залишили наші предки. Велика кількість рукописних матеріалів, до цих пір залишається лиш в своєму первісному вигляді, що може становити небезпеку для їх подальшого збереження. Паперові листки не живуть вічно, вони вигорають, знищуються, розпадаються від найменших дотиків, а деякі зберігаються в таких умовах, що людина ніколи більше і не зможе доторкнутись до них. Лиш можна здогадуватись, яка кількість рукописних матеріалів була знищена, тому не варто гаяти час. Саме завдяки цьому завдання перенесення такої інформації в електронний простір дотепер залишається актуальним. І це лиш один приклад, варто також згадати, яка шалена кількість документів, зроблених в паперовому вигляді використовується на робочих місцях. Страшно уявити, які масивні архіви зберігаються в компаніях з багатолітньою історією. To master’s degree work Semkovych Volodymyr Igorovych «Combining OCR methods in the problem of handwritten text recognition» Actuality of theme: Optical pattern recognition is one of the tasks that a person solves continuously. At the same time, information is received from the organs of vision, which is processed by the brain, which provides a decision about the object of recognition. One of the important areas of application of recognition, or classification, is the recognition of printed or handwritten texts. Handwriting remains a means of communication and information gathering in everyday life even with the introduction of new technologies. Moreover, a huge number of historical collections are not available in a convenient format. Currently, approaches and methods of converting images into digital text are developing at a rapid pace, even though there are still opportunities for improvement and solving many problems. In recent years, print recognition systems have become quite effective. Handwritten numbers and interactive writing are recognized qualitatively. However, current technology is still at a limited level to recognize text images of different handwriting styles and languages. The problem of effective text recognition occupies an important place in the fields of informatization of various processes of human activity. The text presentation of information, compared to the graphic one, allows to significantly reduce the costs of storing and transmitting information. Therefore, the greatest interest from a practical point of view is precisely the transformation of information from paper media into a text electronic document. An important element in this process is a neural network and artificial intelligence in general, which in turn is a fairly modern and relevant technology nowadays.

Description

Keywords

OCR, IAM, CNN/RNN, text recognition, handwritten

Citation

Семкович В. І. Поєднання методів OCR у задачі розпізнавання рукописного тексту : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Володимир Ігорович Семкович ; Національний університет «Львівська політехніка». – Львів, 2022. – 76 с.

Endorsement

Review

Supplemented By

Referenced By