Distributed data analysis in cloud services for insurance companies

dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.authorLutsenko, Oleksandr
dc.contributor.authorShcherbak, Serhii
dc.coverage.placenameЛьвів
dc.date.accessioned2025-10-28T11:24:48Z
dc.date.issued2024
dc.date.submitted2025
dc.description.abstractThis article embarks on an insightful journey through the realm of advanced data analysis techniques which can be used in the insurance area, with a keen focus on the applications and capabilities of Graph Neural Networks (GNN) in the following sector. The article is structured into several chapters, which include the overview of existing and commonly used approaches of the data representation, the possible ways of data analysis of the data in such a representation, deep dive into the concept of GNN for the graph data analysis and the applicability of each approach in the insurance industry. The initial chapter introduces the two main concepts of the data representation, which are the commonly used relational database and the more modern approach of dimensional data design. Then the focus is moved to the graph data representation, which also can be used for data analysis in the cloud environment. To achieve the best applicability in the insurance industry, particularly in underwriting and claims management, the article analyzes the advantages of each approach to the data representation as well as its drawbacks. To conclude the chapter, the comparison table of the three approaches is presented. Based on the comparison table, the decision to use the graph representation is made as it enables the industry to unravel complex relationships and dependencies amid various data points—such as policyholder history, incident particulars, and third-party information—resulting in more accurate risk assessments and efficient claim resolutions. Then the article presents the concept of Graph Neural Networks, a rather new concept which can be used to analyze the data, represented in a graph form using machine learning algorithms. The potential of using this approach for the data analysis in the insurance area and some possible use cases are described. The advantages of using this approach include ability to effectively capture and leverage the complex relationships inherent in graph-structured data and a powerful framework for analyzing and processing graph-structured data. However, the potential drawbacks of the approach such as complexity to design and difficulties in scaling are also considered. Further along, the article probes the strategic integration of Graph Neural Networks with realtimeand dynamic data environments, examining their adaptability to evolving network patterns and temporal dependencies. We discuss how this adaptability is paramount in contexts like real-time decision-making and predictive analysis, which are crucial for staying agile in a rapidly changing market landscape. Then the exact use cases of the GNN applicability in the insurance area are provided, including the claim assignment and underwriting process are described in detail. Furthermore, the simplified mathematical formulation of the underwriting process is provided, which elaborates the role GNNs play in propelling actuarial science with their capability to incorporate node attributes, edge information, and graph structure into a composite risk assessment algorithm. The article concludes by describing that with the new technologies, the graph representation may become the new standard for the data analysis in the cloud environment, especially for the insurance area, stressing the pivotal role of GNNs in navigating the complexities of interconnected, dynamic data and advocating for their continued research and development to unlock even greater potentials across various sectors. Ця стаття розпочинає проникливу подорож сферою передових методів аналізу даних, які можна використовувати в сфері страхування, з акцентом на застосування та можливості графових нейронних мереж (ГНМ) у цій сфері. Стаття поділена на кілька розділів, які включають огляд існуючих і широко використовуваних підходів до представлення даних, можливі способи аналізу даних у такому представленні, глибоке занурення в концепцію ГНМ для аналізу даних, представлених у вигляді графа і застосовуваність кожного підходу в страховій галузі. У першому розділі представлені дві основні концепції представлення даних, якими є широко використовувана реляційна база даних і більш сучасний підхід проектування даних у розмірностях. Потім фокус переміщується до графічного представлення даних, яке також можна використовувати для аналізу даних у хмарному середовищі. Для досягнення найкращої застосовності в страховій галузі, зокрема в андеррайтингу та управлінні вимогами клієнтів, у статті аналізуються переваги кожного підходу до представлення даних, а також його недоліки. На завершення розділу подано порівняльну таблицю трьох підходів. На основі порівняльної таблиці прийнято рішення про використання графового представлення, оскільки воно дає змогу враховувати складні взаємозв’язки та залежності у даних, такі як історія страхувальників, відомості про інциденти та інформація третіх сторін, що призводить до більш точного визначення ризику. оцінки та ефективного вирішення претензій. Потім у статті представлено концепцію графових нейронних мереж, доволі новий підхід, що може бути використаний для аналізу даних, представлених у формі графа за допомогою алгоритмів які можливі випадки використання. Переваги використання цього підходу включають можливість ефективного охоплення та використання складних зв’язків, притаманних графоструктурованим даним, а також потужну структуру для аналізу та обробки графоструктурованих даних. Однак також розглядаються потенційні недоліки підходу, такі як складність проектування та труднощі масштабування. Далі в статті досліджується стратегічна інтеграція графових нейронних мереж із середовищами даних у реальному часі та динамічними даними, досліджується їх адаптивність до мінливих мережевих шаблонів і часових залежностей. Ми обговорюємо, наскільки ця адаптивність має першочергове значення в таких контекстах, як прийняття рішень у режимі реального часу та прогнозний аналіз, які мають вирішальне значення для збереження гнучкості в ринковому ландшафті, що швидко змінюється. Пізніше у статті надано конкретні приклади застосування ГНМ у сфері страхування, включно з процесом виписування компенсації і детальним описом процесу андеррайтингу. Крім того, надається спрощене математичне формулювання процесу андеррайтингу, яке детально пояснює роль ГНМ у розвитку науки з їхньою здатністю включати атрибути вузлів, інформацію про межі та структуру графа в комплексний алгоритм оцінки ризику. Стаття закінчується висновком, що з новими технологіями представлення графів може стати новим стандартом для аналізу даних у хмарному середовищі, особливо для сфери страхування, наголошуючи на ключовій ролі ГНМ у навігації між складними взаємопов’язаними динамічними даними та виступаючи за продовження досліджень і розробок, щоб розкрити ще більший потенціал у різних секторах.
dc.format.pages341-356
dc.identifier.citationLutsenko O. Distributed data analysis in cloud services for insurance companies / Oleksandr Lutsenko, Serhii Shcherbak // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2024. — № 15. — С. 341–356.
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/115421
dc.language.isoen
dc.publisherНаціональний університет «Львівська політехніка»
dc.relation.references1. Krasowski, M. D. (2015). The Power of the Relational Model. Journal of Information Systems Management, 4(3), 73–78. DOI: https://doi.org/10.1080/07399018808962931 2. Setyawan, R. A., & Prasetyo, E., & Girsang, A. S. (2019). Design and Implementation Data Warehouse in Insurance Company. Journal of Physics: Conference Series, 1175(1), 72–88. DOI: https://doi.org/10.1088/1742- 6596/1175/1/012072 3. Hänel, T., & Schulz, M. (2014). Is there still a need for multidimensional data models. Proceedings of the European Conference on Information Systems (ECIS) 2014. 4. Angles, R., & Hogan, A., & Lassila, O., & Rojas, C., & Schwabe, D., & Szekely, P., & Vrgoc, D. (2022). Multilayer graphs: a unified data model for graph databases. GRADES-NDA '22: Proceedings of the 5th ACM SIGMOD Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA), 5, 1–6. DOI: https://doi.org/10.1145/3534540.3534696. 5. Scarselli, F., & Gori, M., & Tsoi, A. C., & Hagenbuchner, M., & Monfardini, G. (2009). The Graph Neural Network Model. IEEE Transactions on Neural Networks, 20(1), 61–80. DOI: https://doi.org/10.1109/TNN.2008.2005605 6. Zhang, X., & Zhang, L., & Liu, L., & Tang, M. (2021). Graph Neural Networks and Their Current Applications in Bioinformatics. Frontiers in Genetics, 12. DOI: https://doi.org/10.3389/fgene.2021.690049 7. Zhou, J., & Cui, Z., & Hu, S., & Zhang, Z, & Yang, C., & Liu, Z., & Wang, L., & Li, C., & Sun, M. (2020). Graph neural networks: A review of methods and applications. AI Open, 1, 57–81. DOI: https://doi.org/10.1016/j.aiopen.2021.01.001 Distributed data analysis in cloud services for insurance companies 355 8. Ma, Y., & Guo, Z., & Ren, Z., & Tang, J., & Yin, D. (2018). Streaming Graph Neural Networks. arXiv, 1810. DOI: https://doi.org/10.48550/arXiv.1810.10627 9. Chen, C., & Liang, C., & Lin, J., & Wang, L., & Liu, Z., & Yang, X., & Wang, X., & Zhou, J., & Shuang, Y., & Qi, Y. (2020). InfDetect: a Large Scale Graph-based Fraud Detection System for E-Commerce Insurance. arXiv, 2003. DOI: https://doi.org/10.48550/arXiv.2003.02833
dc.relation.references1. Красовські, М. Д. (2015). “Потужність реляційної моделі”. Журнал управління інформаційних систем, 4(3), 73–78. DOI: https://doi.org/10.1080/07399018808962931 2. Сетяван, Р. А., & Прасетіо, Е., & Ґірсанг, С. (2019). “Дизайн та втілення сховища даних для страхової компанії”. Журнал фізики: Серія конференцій, 1175(1), 72–88. DOI: https://doi.org/10.1088/1742- 6596/1175/1/012072 3. Ганел, Т., & Шульц, М. (2014). Чи існує потреба в мультивимірних моделях даних?. Провадження Європейської конференції з Інформаційний Систем (ЄКІС) 2014. 4. Енгельс, Р., & Хоґан, А., & Лассіла, О., & Рохас, К., & Швабе, Д., & Секели, П., & Врґоч, Д. (2022). “Багатошарові графи: уніфікована модель даних для графових БД”. ГРАКДС-МАД '22: Проведення 5-го ACM SIGMOD Міжнародного майстер класу про керування даними графів за допомогою досвіду та систем (ГРАКДМС) та Мережевої Аналітики Даних (МАД), 5, 1–6. DOI: https://doi.org/10.1145/3534540.3534696. 5. Скарселлі, Ф., & Ґорі, М., & Цой, А. Ц., & Гаґенбухнер, М., & Монфардіні, Ґ. (2009). Модель графової нейронної мережі. IEEE Транзакції над нейронними мережами, 20(1), 61–80. DOI: https://doi.org/10.1109/TNN.2008.2005605 6. Жень, К., & Жень, Л., & Лю, Л., & Танґ, М. (2021). Графові нейронні мережі та їх використання в біоінформатиці. Фронтири в генетиці, 12. DOI: https://doi.org/10.3389/fgene.2021.690049 7. Жау, Ж., & Суі, Ґ., & Ху, С., & Жан, Ж., & Ян, Ч., & Лю, Ч., & Ван, Л., & Лі, C., & Сан, М. (2020). Графові нейронні мережі: огляд методів та застосування. ШІ Відкритий,1, 57–81. DOI: https://doi.org/10.1016/j.aiopen.2021.01.001 8. Ма, І., & Ґуо, З., & Рен, З., & Танґ, І., & Їн, Д. (2018). Потокові графові нейронні мережі. arXiv, 1810. DOI: https://doi.org/10.48550/arXiv.1810.10627 9. Чен, Ц., & Лян, С., & Лін, Д., & Ван, Л., & Лю, З., & Ян, К., & Ван, К., & Жау, Д., & Шуан, Й., & Кі, Й. (2020). Інфдетект: великомасштабна система визначення шахрайства на базі графів для Е-комерції страхування. arXiv, 2003. DOI: https://doi.org/10.48550/arXiv.2003.02833
dc.relation.urihttps://doi.org/10.23939/sisn2024.15.341
dc.subjectRelational database; Dimensional data design; Graph; Graph Neural Network (GNN); Underwriting; Insurance, реляційна база даних; розмірність відношення; граф; графові нейронні мережі (гнм); андеррайтинг; страхування.
dc.subject.udc004.6
dc.titleDistributed data analysis in cloud services for insurance companies
dc.title.alternativeРозподілений аналіз даних в хмарних сервісах для страхових компаній
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
maket2402951-345-360.pdf
Size:
836.59 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: