Система аналізу медичних текстів і медичних висновків

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Ця магістерська робота спрямована на розробку інформаційної системи, яка автоматизує аналіз медичних текстів, результатів обстежень та лікарських висновків за допомогою сучасних технологій штучного інтелекту (ШІ) та обробки природної мови (NLP). У медичній сфері обсяг текстових даних постійно зростає, що значно ускладнює їх ручну обробку, робить її неефективною та трудомісткою. Виникає потреба в автоматизації аналізу цих даних для забезпечення швидкої та точної обробки, що допомагає значно підвищити якість медичних послуг. Головною метою дослідження є розробка системи, яка сприяє прискоренню діагностики, підвищує точність у прийнятті клінічних рішень та мінімізує ймовірність людських помилок у клінічній практиці. Об'єкт дослідження: процес автоматизації аналізу медичних текстів і даних. Предмет дослідження: методи обробки природної мови та алгоритми машинного навчання, які дозволяють забезпечити швидкий і точний аналіз текстової інформації в медичних записах. Основний зміст роботи: Розроблена інформаційна система складається з декількох функціональних модулів, кожен з яких відповідає за виконання конкретних завдань у процесі автоматизованого аналізу медичних текстів. Модуль розпізнавання симптомів аналізує текстовий опис стану пацієнта, виділяючи ключові симптоми, що полегшує лікарям попереднє визначення діагнозів. Модуль діагностики використовує витягнуту інформацію для співставлення з відомими захворюваннями, що забезпечує точніше та оперативніше встановлення попереднього діагнозу. Також передбачено модуль рекомендацій щодо подальших обстежень або лікування, який дозволяє лікарям ухвалювати обґрунтовані рішення щодо наступних кроків у лікуванні пацієнтів. Система використовує методи обробки природної мови, що дозволяють автоматично виділяти медичні терміни, структури та ключові фрази з текстів. Бібліотека Natural Language Toolkit (NLTK) застосовується для таких завдань, як токенізація, лематизація та попередня обробка текстів, тоді як бібліотека Scikit-learn відповідає за класифікацію та кластеризацію текстових даних. Інтеграція з електронними медичними записами (EMR) дозволяє системі оперативно оновлювати інформацію про стан пацієнта, надаючи лікарям доступ до актуальних даних для прийняття рішень. Це особливо важливо в умовах великих лікарень і клінік, де медичний персонал має справу з великим обсягом записів і обстежень щодня. Автоматизація процесів аналізу даних не тільки підвищує ефективність, але й мінімізує ризик помилок через людський фактор. Окрім цього, розроблена система має зручний інтерфейс для медичного персоналу, що дозволяє легко взаємодіяти з нею без необхідності спеціальних технічних знань. Система забезпечує візуалізацію даних, створюючи графічні звіти про стан пацієнта, його прогрес або зміни у здоров'ї. Завдяки цьому лікарі можуть швидко оцінити стан пацієнта та приймати більш обґрунтовані рішення. Система також здатна інтегруватися з іншими медичними інформаційними системами, що сприяє комплексному підходу до надання медичних послуг. Система має кілька значних переваг порівняно з існуючими рішеннями на ринку. Серед основних переваг — низька вартість впровадження, висока продуктивність, а також можливість масштабування та персоналізації під специфічні потреби медичних установ. Вона відповідає сучасним стандартам захисту медичних даних і забезпечує високий рівень конфіденційності інформації про пацієнтів, що є важливим у медичній сфері. Результати дослідження: Результати тестування показали, що розроблена система значно підвищує швидкість обробки медичних текстів і точність попередньої діагностики. Це може суттєво зменшити навантаження на лікарів, особливо у випадках обробки великих обсягів інформації, наприклад, під час пандемії чи надзвичайних ситуацій. Система також демонструє потенціал для подальшого вдосконалення та адаптації до потреб різних медичних закладів, що робить її перспективним інструментом для впровадження в сучасних лікарнях та клініках.
This master’s thesis focuses on the development of an information system designed to automate the analysis of medical texts, examination results, and medical reports using advanced artificial intelligence (AI) and natural language processing (NLP) technologies. In the healthcare sector, the volume of textual data is constantly increasing, making manual processing inefficient and time-consuming. There is a need for automation to ensure rapid and accurate data analysis, which contributes to the overall improvement of medical service quality. The main objective of this research is to develop a system that accelerates diagnostics, enhances accuracy in clinical decision-making, and minimizes the risk of human error in clinical practice. Object of study: the process of automating the analysis of medical texts and data. Subject of study: NLP methods and machine learning algorithms that enable fast and accurate analysis of textual information in medical records. Main content of the thesis: The developed information system consists of several functional modules, each responsible for a specific task in the automated analysis of medical texts. The symptom recognition module analyzes the textual description of the patient's condition, highlighting key symptoms, which assists doctors in preliminary diagnosis. The diagnostic module uses extracted information to match it with known diseases, ensuring faster and more accurate initial diagnosis. There is also a recommendation module that suggests further tests or treatments, enabling physicians to make informed decisions regarding the patient’s treatment plan. The system employs natural language processing methods that enable the automatic extraction of medical terms, structures, and key phrases from texts. The Natural Language Toolkit (NLTK) library is used for tokenization, lemmatization, and preprocessing of texts, while the Scikit-learn library handles classification and clustering of textual data. This setup ensures efficient processing of large volumes of textual data and allows for in-depth analysis of medical texts with high accuracy. Integration with electronic medical records (EMR) enables the system to update patient information in real-time, providing healthcare professionals with current data for decision-making. This is particularly important in large hospitals and clinics where medical personnel handle substantial volumes of records and examinations daily. The automation of data analysis processes not only increases efficiency but also minimizes the risk of errors due to the human factor. Additionally, the developed system features a user-friendly interface for medical personnel, allowing easy interaction without the need for specialized technical knowledge. The system provides data visualization by generating graphical reports on the patient’s condition, progress, or changes in health. This allows healthcare professionals to quickly assess patient status and make more informed decisions. The system is also capable of integration with other medical information systems, promoting a comprehensive approach to healthcare delivery. The system offers several significant advantages over existing solutions on the market. These include low implementation costs, high productivity, and the ability to scale and customize according to the specific needs of medical institutions. It adheres to modern standards for data protection, ensuring a high level of confidentiality for patient information, which is essential in the medical field. Research outcomes: The test results showed that the developed system significantly increases the speed of processing medical texts and the accuracy of preliminary diagnoses. This can substantially reduce the workload for doctors, especially in cases where large volumes of information need to be processed, such as during pandemics or emergency situations. The system also demonstrates potential for further improvement and adaptation to meet the needs of various medical institutions, making it a promising tool for implementation in modern hospitals and clinics.

Description

Citation

Безкоровайний О. В. Система аналізу медичних текстів і медичних висновків : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Олександр Віталійович Безкоровайний. — Львів, 2024. — 101 с.

Endorsement

Review

Supplemented By

Referenced By