Інтелектуальна система аналізу мовлення і тексту для людей з вадами слуху
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Люди з вадами слуху стикаються зі значними труднощами у повсякденному житті, особливо щодо спілкування. Ця проблема може ускладнити швидкий і ефективний доступ до важливої інформації, впливаючи на їхні повсякденні справи, соціальні взаємодії та загальну якість життя. Тому існує потреба в розробці ефективного рішення для покращення спілкування для людей з вадами слуху. У цьому проєкті я прагну розробити програму, яка може перетворювати мовлення в текст і аналізувати його, щоб надавати швидкі відповіді людям з вадами слуху за допомогою Python, Ubuntu, Kivy, Android, машинного навчання, NLP, Airtable, системного аналізу, UML, Kanban , і Agile методології [2].
Постановка проблеми. Поточні рішення, доступні для людей з вадами слуху, обмежені та часто потребують допомоги сурдоперекладача. Ця проблема може спричинити затримки, непорозуміння та розчарування для обох сторін. Крім того, ці рішення доступні лише іноді, особливо коли потрібна негайна допомога. Тому існує потреба в розробці рішення, яке зможе швидко і точно перетворювати мову в текст і надавати відповіді людям з вадами слуху в реальному часі [3].
Методологія. Буде розроблено програму з використанням Python, мови програмування високого рівня, відомої своєю простотою та легкістю використання, яка може перетворювати мовлення в текст. Цей процес залучатиме алгоритми машинного навчання для аналізу шаблонів мовлення та перетворення їх у текст. Також будуть використовуватись техніки НЛП для підвищення точності процесу перетворення мови в текст. Крім того, буде використовуватись Kivy, бібліотека Python з відкритим вихідним кодом для розробки мультисенсорних додатків, щоб створити зручний інтерфейс для людей з вадами слуху для взаємодії з програмою [1].
Також в цій роботі буде використовуватись Airtable, хмарна система керування базами даних, щоб зберігати й аналізувати дані, щоб забезпечити точність і ефективність програми. Також буде використовуватись UML, графічна система позначень для специфікації, візуалізації та документування систем програмного забезпечення, щоб розробити архітектуру системи. Буде використовуватись Agile-методології, такі як дошки Kanban, щоб керувати процесом розробки проєкту та забезпечити своєчасну реалізацію .
Очікуваний результат. Основним результатом програми буде надання швидких і точних відповідей людям з вадами слуху, покращення їх загального спілкування та якості життя. Крім того, зручний інтерфейс програми дозволить людям з вадами слуху легко взаємодіяти з програмою та швидко й ефективно отримувати необхідну інформацію. Нарешті, архітектура програми, розроблена з використанням UML, забезпечить повне розуміння структури програми, полегшуючи її підтримку та оновлення в майбутньому [4].
Будучи студенткою, яка розробляє таку програму, я отримую знання та досвід у різних областях інформатики та розробки програмного забезпечення. Для розробки такої програми важливо розуміти життєвий цикл розробки програмного забезпечення та важливість системного аналізу та проєктування для розробки комплексної та надійної програми.
Об’єктом дослідження в області програм для людей з вадами слуху є процес перетворення мовлення в текст та аналізу тексту для швидких відповідей.
Предметом дослідження в цій галузі є методи і засоби перетворення мовлення в текст та методи і засоби аналізу мовлення для швидких відповідей.
Практичне значення. Практичні результати досліджень у цій галузі можуть включати розробку нових і більш ефективних комунікаційних технологій, удосконалення та вдосконалення існуючих технологій, а також визначення передового досвіду використання комунікаційних технологій для людей із вадами слуху. Ці результати можуть мати прямий вплив на життя людей з вадами слуху, дозволяючи їм ефективніше спілкуватися, легше отримувати доступ до інформації та повніше брати участь у соціальних, освітніх і професійних умовах.
Висновок. Підсумовуючи, цей магістерський проєкт має на меті розробити програму, яка може перетворювати мовлення в текст і аналізувати його, щоб надавати швидкі відповіді людям з вадами слуху за допомогою Python, Ubuntu, Kivy, Android, машинного навчання, NLP, Airtable, системного аналізу, UML, Kanban , і Agile методології. Основним результатом програми стане покращення комунікації для людей з вадами слуху, що позитивно вплине на їхні повсякденні справи, соціальні взаємодії та загальну якість життя.
People with hearing impairments face significant difficulties in everyday life, especially in communication. This problem can make it difficult to access important information quickly and efficiently, affecting their daily activities, social interactions and overall quality of life. Therefore, there is a need to develop an effective solution to improve communication for the hearing impaired. In this project I aim to develop an application that can convert speech to text and analyze it to provide quick responses to hearing impaired people using Python, Ubuntu, Kivy, Android, Machine Learning, NLP, Airtable, Systems Analysis, UML, Kanban, and Agile methodologies [2]. Formulation of the problem. Current solutions available to the hearing impaired are limited and often require the assistance of a sign language interpreter. This issue can cause delays, misunderstandings and frustration for both parties. Also, these solutions are only sometimes available, especially when immediate help is needed. Therefore, there is a need to develop a solution that can quickly and accurately convert speech into text and provide answers to hearing impaired people in real time [3]. Methodology. A program will be developed using Python, a high-level programming language known for its simplicity and ease of use, that can convert speech to text. This process will involve machine learning algorithms to analyze speech patterns and convert them into text. NLP techniques will also be used to improve the accuracy of the speech-to-text process. In addition, Kivy, an open source Python library for developing multisensory applications, will be used to create a user-friendly interface for the hearing impaired to interact with the program [1]. The work will also use Airtable, a cloud-based database management system, to store and analyze data to ensure program accuracy and efficiency. UML, a graphical notation system for specifying, visualizing, and documenting software systems, will also be used to develop the system architecture. Agile methodologies, such as Kanban boards, will be used to manage the project development process and ensure timely implementation. Expected result. The main outcome of the program will be to provide quick and accurate responses to people with hearing impairments, improving their overall communication and quality of life. In addition, the convenient interface of the program will allow people with hearing impairments to easily interact with the program and quickly and efficiently receive the necessary information. Finally, the application architecture developed using UML will provide a complete understanding of the application structure, making it easier to maintain and upgrade it in the future [4]. As a student developing such a program, I gain knowledge and experience in various areas of computer science and software development. To develop such a program, it is important to understand the software development life cycle and the importance of system analysis and design to develop a comprehensive and reliable program. The object of research in the field of programs for people with hearing impairment is the process of converting speech to text and analyzing text for quick answers. The subject of research in this field is methods and means of converting speech to text and methods and means of speech analysis for quick responses. Practical meaning. Practical outcomes of research in this area may include the development of new and more effective communication technologies, the refinement and improvement of existing technologies, and the identification of best practices in the use of communication technologies for the hearing impaired. These results can have a direct impact on the lives of people with hearing impairments, enabling them to communicate more effectively, access information more easily, and participate more fully in social, educational, and professional settings. Conclusion. In summary, this master project aims to develop an application that can convert speech to text and analyze it to provide quick responses to hearing impaired people using Python, Ubuntu, Kivy, Android, Machine Learning, NLP, Airtable, System Analysis, UML , Kanban , and Agile methodologies. The main outcome of the program will be improved communication for people with hearing impairments, which will positively affect their daily activities, social interactions and overall quality of life.
People with hearing impairments face significant difficulties in everyday life, especially in communication. This problem can make it difficult to access important information quickly and efficiently, affecting their daily activities, social interactions and overall quality of life. Therefore, there is a need to develop an effective solution to improve communication for the hearing impaired. In this project I aim to develop an application that can convert speech to text and analyze it to provide quick responses to hearing impaired people using Python, Ubuntu, Kivy, Android, Machine Learning, NLP, Airtable, Systems Analysis, UML, Kanban, and Agile methodologies [2]. Formulation of the problem. Current solutions available to the hearing impaired are limited and often require the assistance of a sign language interpreter. This issue can cause delays, misunderstandings and frustration for both parties. Also, these solutions are only sometimes available, especially when immediate help is needed. Therefore, there is a need to develop a solution that can quickly and accurately convert speech into text and provide answers to hearing impaired people in real time [3]. Methodology. A program will be developed using Python, a high-level programming language known for its simplicity and ease of use, that can convert speech to text. This process will involve machine learning algorithms to analyze speech patterns and convert them into text. NLP techniques will also be used to improve the accuracy of the speech-to-text process. In addition, Kivy, an open source Python library for developing multisensory applications, will be used to create a user-friendly interface for the hearing impaired to interact with the program [1]. The work will also use Airtable, a cloud-based database management system, to store and analyze data to ensure program accuracy and efficiency. UML, a graphical notation system for specifying, visualizing, and documenting software systems, will also be used to develop the system architecture. Agile methodologies, such as Kanban boards, will be used to manage the project development process and ensure timely implementation. Expected result. The main outcome of the program will be to provide quick and accurate responses to people with hearing impairments, improving their overall communication and quality of life. In addition, the convenient interface of the program will allow people with hearing impairments to easily interact with the program and quickly and efficiently receive the necessary information. Finally, the application architecture developed using UML will provide a complete understanding of the application structure, making it easier to maintain and upgrade it in the future [4]. As a student developing such a program, I gain knowledge and experience in various areas of computer science and software development. To develop such a program, it is important to understand the software development life cycle and the importance of system analysis and design to develop a comprehensive and reliable program. The object of research in the field of programs for people with hearing impairment is the process of converting speech to text and analyzing text for quick answers. The subject of research in this field is methods and means of converting speech to text and methods and means of speech analysis for quick responses. Practical meaning. Practical outcomes of research in this area may include the development of new and more effective communication technologies, the refinement and improvement of existing technologies, and the identification of best practices in the use of communication technologies for the hearing impaired. These results can have a direct impact on the lives of people with hearing impairments, enabling them to communicate more effectively, access information more easily, and participate more fully in social, educational, and professional settings. Conclusion. In summary, this master project aims to develop an application that can convert speech to text and analyze it to provide quick responses to hearing impaired people using Python, Ubuntu, Kivy, Android, Machine Learning, NLP, Airtable, System Analysis, UML , Kanban , and Agile methodologies. The main outcome of the program will be improved communication for people with hearing impairments, which will positively affect their daily activities, social interactions and overall quality of life.
Description
Keywords
Citation
Коштура Д. А. Інтелектуальна система аналізу мовлення і тексту для людей з вадами слуху : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „3.124.00.00 — Системний аналіз (освітньо-наукова програма)“ / Діана Андріянівна Коштура. — Львів, 2022. — 127 с.