Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. – 2020. – Випуск 8

Permanent URI for this collectionhttps://ena.lpnu.ua/handle/ntb/56904

Вісник Національного університету «Львівська політехніка»

Вісник Національного університету «Львівська політехніка» «Інформаційні системи та мережі» є правонаступником збірника наукових праць «Вісник Національного університету «Львівська політехніка». Серія: «Інформаційні системи та мережі» який започатковано у 1997 р.

Вісник Національного університету «Львівська політехніка». Інформаційні системи та мережі / Національний університет "Львівська політехніка" ; відповідальний редактор В. В. Пасічник. – Львів : Видавництво Львівської політехніки, 2020. – № 8. – 72 с.

Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі

Зміст


1
11
21
27
45
55
65
71

Content


1
11
21
27
45
55
65
71

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    Метод первинної обробки слабоструктурованих медичних даних
    (Видавництво Львівської політехніки, 2020-03-01) Бичко, Дмитро; Шендрик, Віра; Парфененко, Юлія; Bychko, Dmytro; Shendryk, Vira; Parfenenko, Yuliia; Сумський державний університет; Sumy State University
    У статті розглянуто підхід до первинної обробки слабоструктурованих текстових даних медичних протоколів, що зберігаються та розповсюджуються у вигляді файлів у pdf-форматі. Актуальність цієї роботи зумовлена відсутністю універсальної структури подання медичних протоколів та методів їхньої обробки. У ході роботи вирішено задачу первинної обробки даних клінічних протоколів на прикладі уніфікованого клінічного протоколу первинної, вторинної (спеціалізованої) та третинної (високоспеціалізованої) медичної допомоги. Розроблено метод первинної обробки даних для створення чіткої структури симптомів хвороби. Першим етапом структуризації даних клінічного протоколу запропоновано розділення інформації з протоколу на чотири базові частини, що дозволяє пришвидшити його конвертування в інші формати. Цей процес реалізовано за допомогою алгоритму, який розроблено мовою програмування С#. Запропонований алгоритм реалізує парсинг інформації з файлу, що представлений у pdf-форматі, та перетворює її у файл txt. Після цього виконується обробка одержаної інформації, що полягає у синтаксичному аналізі тексту протоколу та виділенні структурних частин протоколу, що відповідають заголовкам розділів: титульний аркуш; вступ; перелік скорочень, що використовуються у протоколі; основна частина протоколу; перелік літературних джерел. Назву хвороби у медичному протоколі ідентифікують, порівнюючи дані з протоколу та переліком назв захворювань, що представлені у світовій класифікації МКХ-10. Було проаналізовано заголовки “Вступ”, “Перелік скорочень, що використовуються у протоколі” та основної частини протоколу і запропоновано алгоритм видалення малоінформативних розділів з початку протоколу, наприклад, літературних джерел. Також розроблено алгоритм пошуку інформації в основній частині медичного протоколу шляхом обробки вхідних даних за таблицями, схемами, заголовками, словами, фразами та спеціальними символами. У результаті роботи алгоритмів обробки клінічного протоколу формується новий файл клінічного протоколу, що має приблизно втричі менший обсяг порівняно з початковим файлом. Він містить у собі лише змістовну інформацію з клінічних протоколів, що прискорить подальшу роботу з цим файлом, а саме його використання в системі підтримки прийняття медичних рішень. Представлено картку хвороби на основі медичного протоколу у форматі JSON.