Система підтримки прийняття рішень опитувальника для онлайн чату

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Завдяки стрімкому розвитку інформаційних технологій та безперервному збільшенню обсягу доступної інформації в Інтернеті, стає все важливішим питання ефективного пошуку та отримання даних. Зазвичай стандартний пошук за ключовими словами не завжди приносить необхідний результат через відсутність уваги до мовних та смислових зв'язків між словами в запиті. Тому в наш час інтенсивно відбувається прогрес у розвитку технологій обробки природної мови (NLP) та відповідних систем питань-відповідей (Question-Answering Systems, QAS), що використовують ці технології. Natural Language Processing (NLP) - це галузь інформатики та штучного інтелекту, яка займається дослідженням, як комп'ютери можуть розуміти та аналізувати природні (людські) мови. Використовуючи методи машинного навчання, NLP дозволяє комп'ютерам працювати з текстом і мовою. Метою цієї роботи є розробка та імплементація інтелектуального та багатофункціонального Telegram бота, призначеного для поліпшення зручності користування та розширення функціоналу месенджера, за допомогою передових технологій обробки природної мови та машинного навчання. Створений телеграм бот має містити такі функції: • Speech-to-text – конвертація голосових повідомлень користувачів в текст; • Text-to-speech – конвертація текстових повідомлень користувачів в голосові повідомлення; • Text-from-image – розпізнавання тексту на фото та картинках; • Question-answer – знаходження ймовірної відповіді на запитання користувача. На даний час, не існує бота з такою функціональністю, що робить дану ідею інноваційною. Конвертація голосових повідомлень користувачів в текст є актуальним завданням, адже це дуже зручно. Багато людей надсилають голосові повідомлення через те, що це економить час, адже написати текст вручну є довшим процесом ніж записати голосове. Проте, іноді виникають ситуації, коли отримувачі голосових повідомлень не мають можливості прослухати їх. Це може стати серйозною проблемою, особливо, коли отримувач вважає, що це повідомлення може містити важливу інформацію, і він не може досягти спокою, допоки не послухає його. У таких випадках, і не тільки, стане у нагоді створений бот. Користувач може переслати отримане голосове повідомлення боту, який за допомогою своїх функцій перетворить голос на текст і надішле отриману інформацію користувачу після завершення конвертації. Таким чином, користувач зможе дізнатися зміст голосового повідомлення, навіть не прослуховуючи його. Також дана функція дозволить користувачам з обмеженими можливостями, таким як люди з вадами слуху, більш зручно спілкуватися в месенджері. Конвертація текстових повідомлень користувачів в голосові повідомлення може бути корисною функцією для людей, які бажають озвучувати відеоролики власним текстом. Розпізнавання тексту з фото та картинок розширюватиме функціонал телеграму ще більше, і люди можуть отримувати готовий текст не виходячи з додатку та не використовуючи окремі сервіси для цього, які забирають більше часу. Функція «Question-answer» стане корисною для людей, які хотітимуть отримати відповідь на своє запитання, але при цьому не хочуть витрачати багато часу на її пошук використовуючи браузер, в якому є безліч ресурсів та джерел. Дана система несе за собою місію спрощення пошуку відповіді та економію часу користувача. Об’єктом дослідження даної роботи є розробка телеграм бота з функціями speech-to-text, text-to-speech, text-from-image та question-answer. Предметом дослідження є функціональні можливості та ефективність Telegram бота в контексті обробки голосових та текстових повідомлень, розпізнавання тексту на зображеннях та знаходження відповідей на запитання користувачі. Наукова новизна цієї роботи полягає в поєднанні різних технологій для створення корисного та функціонального бота, що може виконувати різні завдання, пов'язані з обробкою природної мови та мультимедіа. В першому розділі було розглянуто предметну область, вивчено ринок та проведено аналіз існуючих аналогів. В другому розділі був проведений системний аналіз та побудовано ряд діаграм, таких як діаграму варіантів використання, діаграму класів, діаграму кооперації, діаграму послідовності, діаграму станів, діаграму компонентів та діаграму розгортання. В розділі номер 3 були проаналізовані методи, які були використані для розробки системи. В четвертому розділі описано реалізацію завдання та проведено тестування результатів. В останньому розділі наведене економічне обґрунтування системи та використані сучасні методи для цього.
With the rapid advancement of information technologies and the continuous growth of available information on the Internet, the effective search and retrieval of data become increasingly crucial. Typically, standard keyword-based searches do not always yield the desired results due to a lack of attention to linguistic and semantic connections between words in the query. Therefore, there is currently significant progress in the development of Natural Language Processing (NLP) technologies and corresponding Question-Answering Systems (QAS) utilizing these technologies. Natural Language Processing (NLP) is a field of computer science and artificial intelligence that explores how computers can understand and analyze natural (human) languages. Leveraging machine learning methods, NLP enables computers to work with text and language. The aim of this work is to design and implement an intelligent and multifunctional Telegram bot to enhance user convenience and expand the messenger's functionality using advanced natural language processing and machine learning technologies. The created Telegram bot should include the following functions: • Speech-to-text – conversion of users' voice messages into text; • Text-to-speech – conversion of users' text messages into voice messages; • Text-from-image – recognition of text on photos and images; • Question-answer – finding a probable answer to users' questions. Currently, there is no bot with such functionality, making this idea innovative. The conversion of users' voice messages into text is a relevant task, providing convenience, especially when recipients are unable to listen to the messages. This situation can be a serious problem when the recipient considers the message to contain important information, and they cannot find peace until they listen to it. In such cases, the created bot will be useful. Users can forward received voice messages to the bot, which will use its functions to convert the voice to text and send the information to the user after completion. Thus, the user can learn the content of the voice message without listening to it. This feature will also make it more convenient for users with disabilities, such as hearing-impaired individuals, to communicate in the messenger. The conversion of users' text messages into voice messages can be a useful function for people who wish to voice their own text in videos. Recognition of text from photos and images will further expand Telegram's functionality, allowing people to receive ready-made text without leaving the application or using separate services, saving more time. The "Question-answer" function will be beneficial for people who want to get an answer to their question without spending much time searching through various resources in a browser. This system aims to simplify the search for answers and save the user's time. The object of this work is the development of a Telegram bot with the functions of speech-to-text, text-to-speech, text-from-image, and question-answer. The subject of the research is the functional capabilities and effectiveness of the Telegram bot in the context of processing voice and text messages, recognizing text in images, and finding answers to user questions. The scientific novelty of this work lies in the combination of different technologies to create a useful and functional bot capable of performing various tasks related to natural language processing and multimedia. In the first chapter, the subject area was considered, the market was studied, and an analysis of existing analogs was conducted. In the second chapter, a systematic analysis was carried out, and a series of diagrams, such as use case diagram, class diagram, collaboration diagram, sequence diagram, state diagram, component diagram, and deployment diagram, were constructed. In the third chapter, the methods used for system development were analyzed. In the fourth chapter, the implementation of the task was described, and the results were tested. In the last chapter, the economic justification of the system was provided, utilizing modern methods for this purpose.

Description

Keywords

Citation

Аксьонов Д. А. Система підтримки прийняття рішень опитувальника для онлайн чату : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.01 — Системи і методи прийняття рішень“ / Денис Андрійович Аксьонов. — Львів, 2023. — 111 с.

Endorsement

Review

Supplemented By

Referenced By