Review of disease identification methods based on computed tomography imagery
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
Розглянуто методи та підходи до комп’ютерної діагностики різних захворювань легень на підставі автоматизованого аналізу знімків комп’ютерної томографії. Виконано пошук в базі даних Google Scholar за кількома запитами на тему аналізу знімків комп’ютерної томографії за допомогою глибокого навчання та машинного навчання серед статей, опублікованих протягом або після 2017 р. Після відсіювання результатів пошуку сформовано набір із 39 статей. Набір даних розділено за датою публікації на дві категорії: до та після початку пандемії COVID-19. Для кожного дослідження в отриманому наборі зібрано інформацію про розмір використаного набору даних, захворювання, які містяться у ньому, основну ціль класифікації, застосовані підходи та архітектури, метрики, використані для оцінювання результатів, та значення цих метрик. Надано повну інформацію про кожну зі статей у наборі, разом з посиланням. Інформацію наведено в двох таблицях, залежно від публікації до чи після появи COVID-19. Визначено, описано та порівняно популярні методології із найкращими показниками. Вибрані методології порівняно за отриманим показником точності, наведеним у відповідному дослідженні. Надано порівняльну таблицю одержаних показників точності. Вибрано найперспективніші з досліджених у розглянутих статтях методологій за показником точності. На момент укладання цього огляду ResNet його варіації та архітектури, побудовані на його основі, мають найкращі результати, а VGG та Xception є близькими конкурентами. Описано складнощі з оглядом наявних досліджень у цій галузі, найважливішими з яких є різноманітність у способі опису розміру набору даних та виборі метрик оцінювання результатів, що ускладнює порівняння багатьох окремих статей або принаймні погіршує якість такого порівняння. Описано та розглянуто метрики, які часто використовують для вимірювання результативності методів машинного навчання, застосованих у знайдених дослідженнях. Запропоновано напрям подальших досліджень з акцентом на класифікацію з багатьох класів, модульність та прогнозування прогресу захворювання. Запропонований напрям обґрунтовано тим, що більшість виявлених досліджень зосереджені на класифікації за одним класом. Також практично жодне з досліджень не аналізує прогрес захворювання, а майже всі дослідження розглядають жорсткі рішення, малопридатні для розширення з метою підтримки майбутніх захворювань та інших методів класифікації.
Methods and approaches to computational diagnosis of various pulmonary diseases via automated analysis of chest images performed with computed tomography were reviewed. Google Scholar database was searched with several queries focused on deep learning and machine learning chest computed tomography imagery analysis studies published during or after 2017. A collection of 39 papers was collected after screening the search results. The collection was split by publication date into two separate sets based on the date being prior to or after the start of the COVID-19 pandemic. Information about the size of the dataset used in the study, classification categories present in it, primary classification target, employed approaches and architectures, metrics used to judge the performance, and the values of those metrics were collected for each paper in the set of discovered studies. Full collected data, including the citation, on every paper was provided in two tables respective to their publication date being prior or after COVID-19. Popular methodologies with the best metrics were identified, outlined, and described. The selected methodologies were compared by their accuracies in various papers found during this study. The comparison table of the found accuracies was provided. A best-performing approach was selected based on the found accuracies. As of this review, ResNet, its variations, and the architectures built upon it have the most promising results, with VGG and Xception being close contenders. The complications with reviewing existing studies in the field are outlined, the most important of them being the diversity in the way that dataset size is described, as well as diversity in the metrics employed, making a comparison between many individual papers impossible or at least lowering the quality of such a comparison. Metrics commonly used to measure the performance of machine learning approaches used in the found studies are outlined and described. Further research direction is proposed, with an emphasis on multi-class classification, modularity, and disease progress prediction. This proposition is guided by finding that most of the studies found focus on single class classification. Additionally, almost none of the studies discuss disease progression, and almost all of the studies discuss rigid solutions which are hardly extendable for future diseases and other classification methods.
Methods and approaches to computational diagnosis of various pulmonary diseases via automated analysis of chest images performed with computed tomography were reviewed. Google Scholar database was searched with several queries focused on deep learning and machine learning chest computed tomography imagery analysis studies published during or after 2017. A collection of 39 papers was collected after screening the search results. The collection was split by publication date into two separate sets based on the date being prior to or after the start of the COVID-19 pandemic. Information about the size of the dataset used in the study, classification categories present in it, primary classification target, employed approaches and architectures, metrics used to judge the performance, and the values of those metrics were collected for each paper in the set of discovered studies. Full collected data, including the citation, on every paper was provided in two tables respective to their publication date being prior or after COVID-19. Popular methodologies with the best metrics were identified, outlined, and described. The selected methodologies were compared by their accuracies in various papers found during this study. The comparison table of the found accuracies was provided. A best-performing approach was selected based on the found accuracies. As of this review, ResNet, its variations, and the architectures built upon it have the most promising results, with VGG and Xception being close contenders. The complications with reviewing existing studies in the field are outlined, the most important of them being the diversity in the way that dataset size is described, as well as diversity in the metrics employed, making a comparison between many individual papers impossible or at least lowering the quality of such a comparison. Metrics commonly used to measure the performance of machine learning approaches used in the found studies are outlined and described. Further research direction is proposed, with an emphasis on multi-class classification, modularity, and disease progress prediction. This proposition is guided by finding that most of the studies found focus on single class classification. Additionally, almost none of the studies discuss disease progression, and almost all of the studies discuss rigid solutions which are hardly extendable for future diseases and other classification methods.
Description
Citation
Smilianets F. A. Review of disease identification methods based on computed tomography imagery / F. A. Smilianets, O. D. Finogenov // Ukrainian Journal of Information Tecnology. — Lviv : Lviv Politechnic Publishing House, 2024. — Vol 6. — No 1. — P. 95–101.