Моделі та методи підтримки персоналізованих рішень у медичних системах
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет «Львівська політехніка»
Abstract
У дисертаційній роботі вирішено важливу науково-прикладну проблему розроблення та удосконалення моделей, методів і засобів машинного навчання в
задачах класифікації, кластеризації, прогнозування та візуалізація результатів опрацювання персональних даних для адаптації медичних рішень до пацієнта.
У роботі введено поняття персоналізації, персоналізованих рішень та медичних даних пацієнта. Проаналізовано правові вимоги щодо використання персоналізованих
медичних даних, існуючі практичні рішення, що відображають основні підходи до використання медичних даних та урахування персоналізації за результатами аналізу
існуючих систем штучного інтелекту у сфері медицини. Проведено порівняльний аналіз класичних методів та визначені обмеження, що характерні при опрацюванні
медичних персоналізованих даних. Визначено найбільші обмеження під час опрацювання універсальними методами великих та малих мультимодальних медичних
наборів даних, що визначили актуальну науково-прикладну проблему щодо розробки нових чи удосконалення існуючих методів штучного інтелекту щодо підвищення
точності процесу обробки великих та малих мультимодальних медичних даних для. У межах дисертаційної роботи введено модель відображення стану пацієнта, яка
спрощено відображає його структуру, подає інформацію про його стан та поведінку та представлена як система, що консолідує різні елементи, що представлені у вигляді
множин, які взаємнозалежні та залежні від середовища оцінки; визначено, що продукційні правила, які формулюють рішення щодо перегляду та зміни тактики
лікування; представлено простір стану пацієнта як евклідовий простір, що дозволило змоделювати інформаційну модель простору станів, як багатовимірну систему в
тимчасовій області; формалізовано відображення фізичного стану пацієнта з урахуванням часовозалежних та часовонезалежних даних пацієнта, що дає можливість
оцінити його в певний момент часу та приймати сталі показники стану; розроблена модель простору станів пацієнта представлена у вигляді куба, як відображення
функціонального відношення загального стану пацієнта; удосконалено метод пошуку зміни стану пацієнта шляхом використання простору умов та аналізу зміни приросту
значень часовозалежних даних. Розроблено гібридний ансамбль моделей, що містить кілька селекторів за допомогою агрегування результатів, які будуть використовуватися на етапі попередньої обробки; вбудовані алгоритми виконують вибір ознак під час процедури навчання класифікатора та оптимізують набір ознак, що використовуються для досягнення кращої точності; розроблено метод зменшення розмірності вхідних даних на основі ансамблю моделей слабких предикторів для вибору найважливіших ознак, що базується на прирості інформації з урахуванням результатів застосування декількох селекторів та агрегації кінцевих результатів на підставі урахування індекса Жакара для оцінки подібності одержаних підмножин ознак та проведення мажоритарного голосування результатів. Розроблена трирівнева класифікаційна модель ансамблю стекінгу з агрегатом логістичної регресії, яка має такі значення метрик оцінки продуктивності у вибраній підмножині ознак; проведено порівняння точності прогнозування для стандартних моделей зменшення розмірності під час наступних кроків, для цього використано аналіз головних компонентів із вісьмома компонентами. Розроблено архітектуру системи підтримки прийняття медичних рішень щодо прогнозування станів пацієнта на підставі опрацювання та аналізу персоналізованих медичних даних; подано опис імплементації рішень у системі підтримки прийняття рішень для лікування хворих з порушеннями антитілоутворень.
Практичне значення результатів дисертаційного дослідження дають змогу підвищити точність прогнозування цільових показників в підмножині простору умов
на 5 %, підвищити точність класифікації на 4 % порівняно з результатами логістичної регресії як кращого класифікатора у порівнянні з існуючими для набору даних по
COVID - 19 та на 6 %, підвищити точність прогнозування даних на 7-9 % та забезпечити паралелізацію процесу обробки даних як малої, так і великої розмірності,
забезпечити заповнення пропусків даних за рахунок одержання додаткових значень а також зменшити імовірність появи похибки (кількість ліжкоднів) при пошуку шаблонів динаміки стану пацієнта шляхом використання простору умов. Достовірність наукових та практичних результатів підтверджується відповідними
матеріалами про впровадження дисертаційних досліджень, а також за рахунок порівняння одержаних практичних результатів з результатами застосування існуючих
класичних методів та підходів щодо опрацювання персоналізованої інформації про пацієнта. The dissertation solved an important scientific and applied problem of developing and improving models, methods and tools of machine learning in the tasks of classification, clustering, forecasting and visualization of the results of personal data processing for adapting medical solutions to the patient. The work introduces the concepts of personalization, personalized solutions, and patient medical data. Legal requirements for the use of personalized medical data, existing practical solutions reflecting the main approaches to the use of medical data, and taking into account personalization based on the analysis of existing artificial intelligence systems in the field of medicine are analyzed. A comparative analysis of classical methods was carried out and the limitations characteristic of the processing of personalized medical data were determined. The biggest limitations during the processing of large and small multimodal medical data sets by universal methods were determined, which identified an actual scientific and applied problem regarding the development of new or improvement of existing methods of artificial intelligence to increase the accuracy of the process of processing large and small multimodal medical data to find personalized solutions and form tasks scientific research. Within the scope of the dissertation work, a model for displaying the patient's condition was introduced, which simply reflects its structure, provides information about its condition and behavior, and is presented as a system that consolidates various elements, presented in the form of sets, which are interdependent and dependent on the assessment environment; it is determined that the production rules, which formulate decisions regarding the review and change of treatment tactics; the state space of the patient is presented as a Euclidean space, which made it possible to simulate the information model of the state space as a multidimensional system in the time domain; the display of the patient's physical condition is formalized, taking into account the patient's time-dependent and time-independent data, which makes it possible to evaluate him at a certain point in time and take constant state indicators; the developed model of the space of the patient's states is presented in the form of a cube, as a reflection of the functional relationship of the patient's general state; the method of searching for a change in the patient's condition by using the space of conditions and analyzing the change in the increment of time-dependent data values has been improved. A hybrid ensemble of models containing several selectors with the help of aggregation of results, which will be used at the stage of pre-processing, has been developed; built-in algorithms perform feature selection during the classifier training procedure and optimize the set of features used to achieve better accuracy; a method of reducing the dimensionality of input data based on an ensemble of weak predictor models for selecting the most important features was developed, which is based on the increase of information taking into account the results of the application of several selectors and the aggregation of the final results based on the consideration of the Jacquard index to assess the similarity of the obtained subsets of features and conduct majority voting of the results; a model of three-layer stacking of an ensemble of methods is developed and the stages of stacking are described, which provides the opportunity to combine associative classification with weak classifiers into an ensemble to generalize the results. A three-level ensemble stacking classification model with a logistic regression aggregate has been developed, which has the following values of performance assessment metrics in the selected subset of features; compared the prediction accuracy of standard dimensionality reduction models in subsequent steps using principal component analysis with eight components. The architecture of the medical decision-making support system for predicting the patient's condition based on the processing and analysis of personalized medical data has been developed; a description of the implementation of decisions in the decision-making support system for the treatment of patients with disorders of antibody formation is presented. The practical value of the results of the dissertation research makes it possible to increase the accuracy of forecasting targets in a subset of the conditioned space by 5%, to increase the classification accuracy by 4% compared to the results of logistic regression as a better classifier compared to the existing ones for the COVID - 19 data set and by 6%, increase the accuracy of data forecasting by 7-9% and ensure the parallelization of the data processing process of both small and large dimensions, ensure the filling of data gaps due to obtaining additional values, and also reduce the probability of the appearance of an error (number of bed days) when searching for patterns of the dynamics of the patient's condition by using the s ace of conditions. Relevant materials confirm the validity of scientific and practical results on the implementation of dissertation studies, as well as by comparing the obtained empirical results with the results of the application of existing classical methods and approaches for processing personalized information about the patient.
Description
Citation
Мельникова Н. І. Моделі та методи підтримки персоналізованих рішень у медичних системах : дисертаційна робота на здобуття наукового ступеня доктора технічних наук
: 05.13.23 – системи штучного інтелекту / Наталія Іванівна Мельникова ; Міністерство освіти і науки України, Національний університет «Львівська політехніка. – Львів, 2023. – 290 с. – Бібліографія: с. 240–274 (302 назви).