Інтелектуальна інформаційна система прогнозування розвитку серцево-судинних захворювань

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Актуальність. Попри стрімкий розвиток технологій у кожній сфері нашого життя, зокрема медичній, проблема серцево-судинних захворювань щороку посідає перше місце за показником смертності. З кожним роком, проблема лише загострюється, так за результатами дослідження за останні 30 років, показник смертності виріс вдвічі та становить 18,6 мільйона на світовому рівні [1]. В Україні ж серцево-судинні захворювання становлять 67 % усіх смертей, а це близько 450 тисяч осіб щороку. Для зменшення ризику захворювання, слід мінімізувати фактори ризику, такі як: високий рівень холестеролу, високий показник артеріального тиску, куріння, алкоголізм, високий рівень індекс маси тіла, порушення функцій роботи нирок та високий рівень глюкози. Питання, прогнозування серцево-судинних захворюваннь, складно недооцінити, у зв’язку з повномаштабною війною росії проти України. Стрес, у якому щодня перебуває населення, напряму впливає на кожен з цих факторів та максимально підсилює їх негативний наслідок. Об’єкт дослідження являє собою процес прогнозування розвитку серцево-судинних захворювань. Предметом дослідження виступають алгоритми штучного навчання та методи машинного навчання, які використовуються для аналізу медичних даних в цілях прогнозування серцево-судинних захворювань. Мета і задача дослідження – розробка інтелектуальної інформаційної системи, яка на основі аналізу даних про стан здоров'я пацієнтів зможе прогнозувати ризик розвитку серцево-судинних захворювань. Для виконання сформованої задачі дослідження необхідно виконати такі етапи: • Проаналізувати актуальний стан проблеми серцево-судинних захворювань, визначити ключові тренди та перспективні напрямки досліджень, як у медичній галузі так і у сфері штучного інтелекту, визначити та проаналізувати існуючі рішення, встановити основні критерії для розробки інтелектуальної системи. • Застосувавши методології системного аналізу, сформулювати загальні цілі проєкту, побудувати дерево цілей, розробити концептуальну модель системи. • Оцінити доступні технологічні рішення, що можуть бути використані для реалізації проекту, та визначити найефективніші засоби для досягнення поставлених цілей. • Розробити моделі машинного навчання для аналізу медичних даних. • Здійснити валідацію і перевірку створеної системи. Наукова новизна полягає в розробці інтелектуальної інформаційної системи, що інтегрує сучасні технології штучного інтелекту та машинного навчання для прогнозування розвитку серцево-судинних захворювань. Відмінність цієї системи від існуючих полягає в застосуванні комплексного підходу до аналізу медичних даних, включаючи не лише клінічні показники, але й соціально-демографічні фактори, та спосіб життя пацієнтів. Такий підхід дозволяє не тільки точніше визначати ризики, але й розробляти персоналізовані стратегії профілактики та лікування для кожного пацієнта. Практичне значення отриманих результатів полягає у створенні системи у вигляді веб-застосунку, що дозволяє користувачам вводити медичні показники через веб-інтерфейс. Після введення даних, система обробляє їх за допомогою попередньо навченої моделі машинного навчання, яка аналізує інформацію та видає оцінку ризику розвитку розвитку серцево-судинних захворювань. Опис реалізації завдання Для реалізації проєкту було використано набір даних "Heart Failure Prediction Dataset" [2], який містить 1190 спостережень з 11 характеристиками. Цей набір даних є найбільшим наявним на момент дослідження. Першим кроком було імпортування необхідних бібліотек для аналізу, візуалізації, підготовки даних та навчання моделей. Далі відбулося завантаження та підготовка даних, включаючи перетворення категоріальних змінних у числові за допомогою OneHotEncoder та об'єднання їх з числовими змінними для створення набору ознак для навчання. Набір даних було розділено на тренувальну та тестову вибірки для оцінки моделі на даних, які не були використані під час навчання. Було застосовано кілька методів машинного навчання, зокрема логістична регресія, дерева рішень, випадковий ліс, метод опорних векторів та багатошаровий перцептрон. Кожен метод оцінювався за його точністю та ефективністю у прогнозуванні розвитку серцево-судинних захворювань. Значна увага приділялася оптимізації моделей, вибору гіперпараметрів та використанню бібліотек Python, таких як Scikit-learn. У результаті метод випадкового лісу показав найкращий показник точності – 89%. Було створено інтуїтивно зрозумілий веб-інтерфейс для введення медичних показників та перегляду результатів прогнозування. Користувачі можуть вводити дані через веб-інтерфейс, після чого система обробляє їх за допомогою попередньо навченої моделі та видає оцінку ризику розвитку ССЗ.
Actuality. Despite the rapid development of technologies in every sphere of our life, in particular medical, the problem of cardiovascular diseases takes the first place in terms of mortality every year. Every year, the problem only worsens, so according to the results of research over the last 30 years, the death rate has doubled and is 18.6 million at the global level [1]. In Ukraine, cardiovascular diseases account for 67% of all deaths, which is about 450,000 people every year. To reduce the risk of the disease, risk factors such as high cholesterol, high blood pressure, smoking, alcoholism, high body mass index, impaired kidney function, and high glucose should be minimized. The question of predicting cardiovascular diseases is difficult to underestimate, in connection with the full-scale war of russia against Ukraine. The daily stress experienced by the population directly impacts these factors, exacerbating their negative effects. The object of research is the process of predicting the development of cardiovascular diseases. The subject of research is artificial learning algorithms and machine learning methods, which are used to analyze medical data for the purpose of predicting cardiovascular diseases. The goal and task of the research is the development of an intelligent information system that, based on the analysis of data on the health status of patients, will be able to predict the risk of developing cardiovascular diseases. In order to fulfill the established research task, it is necessary to complete the following steps: • To analyze the current state of the problem of cardiovascular diseases, to identify key trends and prospective directions of research, both in the medical field and in the field of artificial intelligence, to identify and analyze existing solutions, to establish the main criteria for the development of an intelligent system. • Applying the methodology of system analysis, formulate the general goals of the project, build a tree of goals, develop a conceptual model of the system. • Evaluate the available technological solutions that can be used to implement the project and determine the most effective means to achieve the set goals. • Develop machine learning models for medical data analysis. • Validate and check the created system. The scientific novelty consists in the development of an intelligent information system that integrates modern technologies of artificial intelligence and machine learning for predicting the development of cardiovascular diseases. The difference between this system and the existing ones lies in the application of a comprehensive approach to the analysis of medical data, including not only clinical indicators, but also socio-demographic factors and the lifestyle of patients. This approach allows not only to more accurately determine risks, but also to develop personalized prevention and treatment strategies for each patient. The practical value of the obtained results lies in the creation of a system in the form of a web application that allows users to enter medical indicators through a web interface. After entering the data, the system processes it using a pre-trained machine learning model that analyzes the information and provides an estimate of the risk of developing cardiovascular disease. Description of task implementation The "Heart Failure Prediction Dataset" [2] data set, which contains 1190 observations with 11 characteristics, was used to implement the project. This data set is the largest available at the time of the study. The first step was to import the necessary libraries for analysis, visualization, data preparation and model training. Data loading and preparation followed, including converting categorical variables to numeric using OneHotEncoder and concatenating them with numeric variables to create a feature set for training. The data set was split into training and test samples to evaluate the model on data that was not used during training. Several machine learning techniques have been applied, including logistic regression, decision trees, random forest, support vector method, and multilayer perceptron. Each method was evaluated for its accuracy and effectiveness in predicting the development of cardiovascular diseases. Considerable attention was paid to model optimization, hyperparameter selection, and the use of Python libraries such as Scikit-learn. As a result, the random forest method showed the best accuracy rate - 89%. An intuitive web interface was created for entering medical parameters and viewing prediction results. Users can enter data through a web interface, after which the system processes it with a pre-trained model and produces a CVD risk score.

Description

Citation

Коник М. І. Інтелектуальна інформаційна система прогнозування розвитку серцево-судинних захворювань : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „3.124.00.00 — Системний аналіз (освітньо-наукова програма)“ / Мирослав Ігорович Коник. — Львів, 2023. — 96 с.

Endorsement

Review

Supplemented By

Referenced By