GNN implementation approaches in AWS cloud for risk assessment in the insurance area

dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.authorLutsenko, Oleksandr
dc.contributor.authorShcherbak , Serhii
dc.coverage.placenameЛьвів
dc.date.accessioned2025-10-30T11:31:44Z
dc.date.issued2024
dc.date.submitted2025
dc.description.abstractThis article analyzes three most common approaches to the GNN architecture implementation on the AWS cloud for the use case of the risk assessment in the insurance area. The paper is split to several chapters, with the first one being the overview of 3 approaches to the GNN architecture, the second one describing prerequisites for the implementation, and finally development of the approaches on the cloud infrastructure, testing them on graph insurance data and comparison of all the approaches to select the most suitable for the risk assessment task. The initial chapter introduces the three architectural approaches to GNN implementation being respectively Graph Convolutional Network (GCN), Graph Attention Network (GAT) and GraphSAGE (Graph Sample And AGgregatE). To conclude the chapter, it is decided to proceed with the further implementation of all three models on the AWS infrastructure and analyze the outputs on the same graph data to select the best suit for the risk assessment use case. Then the article proceeds with considering the specifics of a realization of risk assessment in insurance on top of cloud infrastructure and preparing the data to use it for the GNN training and testing. After the analysis of the use case, it is decided to focus on only on the individuals’ insurance. The main goal is to analyze the unique properties of every human which can affect the risk of insuring them as well as their connections with other individuals. Further along, the development of all three approaches for risk assessment solution is described with first being GCN, then GAT and finally GraphSage. The models are then trained, tested and the output analysis is performed. Considering the analysis results, GAT and GraphSage provide the most correct results maintaining the test accuracy. However, considering model statistics, it is found that GraphSage has more distinct probabilities and additional insights through feature importance analysis which makes it the best fit for the risk assessment use case. The article concludes by stating that out of all three analyzed architectures the most suitable for the risk assessment task is the GraphSAGE with a slight difference between this model and GAT, which will be used for further analysis and improvements. Furthermore, the article mentions a few steps for the potential future improvements of the models, which include using class weights or oversampling techniques to ensure the best performance, also mentioning the experiments that can be done with deeper architectures or different GNN layers. The last but not the least would be to focus on the testing and training on the larger dataset to make it more applicable for real-world applications. У статті проаналізовано три найпоширеніші підходи до реалізації архітектури ГНМ у хмарних сервісах AWS для оцінки ризиків у сфері страхування. Стаття поділена на кілька розділів, перший з яких містить огляд 3-х підходів до архітектури ГНМ, другий ‒ описує передумови для впровадження і, нарешті, впровадження та порівняння всіх підходів для вибору найкращого. У першому розділі представлено три архітектурні підходи до впровадження ГНМ, а саме: Графові Мережі Згортки (ГМЗ), Графові Мережі Уваги (ГМУ) і GraphSAGE (Графові збір та агрегація). Архітектури описані з акцентом на математичні формулювання. На завершення розділу вирішено продовжити подальше впровадження всіх трьох моделей в інфраструктуру AWS і проаналізувати результати на тих самих графових даних, щоб вибрати найкращий варіант для оцінки ризику для страхової компанії. Далі стаття продовжує вибір інструментів і підготовку даних для їхнього подальшого використання в цілях навчання та тестування ГНМ. Після аналізу варіантів використання вирішено зосередитися лише на страхуванні фізичних осіб. Основна мета полягає в аналізі унікальних властивостей кожної людини, які можуть впливати на ризик її страхування, а також на її зв’язки з іншими особами. Основними інструментами для використання є NeptuneDB для зберігання графів і Sagemaker для розгортання та навчання моделі. Стаття також зосереджена на виборі відповідного інструменту для реалізації, порівнюючи два найбільш використовувані фреймворки Python PyTorch PyG і Deep Graph Library (DGL). До того ж пріоритет надано PyG. Далі описано процес впровадження всіх трьох підходів: спочатку ГМЗ, потім ГМУ і, нарешті, GraphSage. Далі моделі піддаються навчанню та тестуванню з подальшим аналізом вихідних даних. З огляду на результати аналізу, ГМУ і GraphSage забезпечують найбільш точні результати, зберігаючи точність під час тестування. Однак враховуючи статистичні дані обох моделей, виявлено, що GraphSage має більшу різницю між імовірностями ризиків та додаткові відомості завдяки аналізу важливості особливостей даних, що робить його найкращим для сценарію використання оцінки ризику. На завершення статті зазначено, що з усіх трьох проаналізованих архітектур найбільш придатною для завдання оцінки ризику є GraphSAGE з невеликою перевагою цієї моделі над ГМУ, відповідно її вирішено використати для подальшого аналізу та вдосконалення. Крім того, у статті згадується кілька кроків для потенційного майбутнього вдосконалення моделей, а також зосереджено увагу на тестуванні та навчанні на більшому наборі даних, щоб зробити його більш застосовним для реальних програм.
dc.format.pages251–272
dc.identifier.citationLutsenko O. GNN implementation approaches in AWS cloud for risk assessment in the insurance area / Oleksandr Lutsenko, Serhii Shcherbak // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2024. — № 16. — С. 251–272.
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/116031
dc.language.isoen
dc.publisherВидавництво Львівської політехніки
dc.relation.references1. Danish, A., Xie, Y., Umair, S. B. (2021). Insurers’ risk management as a business process: a prospective competitive advantage or not? Emerald, 31(3), 345–366. DOI: https://doi.org/10.1108/EJMBE-08-2021-0221 2. Sanchez-Lengeling, et al. (2021). A Gentle Introduction to Graph Neural Networks, Distill. DOI: https://doi.org/10.23915/distill.00033 3. Uzair, A. B., Tang, H., Guilu, W., Marjan, S., Hussain, A. (2023). Deep Learning with Graph Convolutional Networks: An Overview and Latest Applications in Computational Intelligence. International Journal of Intelligent Systems. DOI: https://doi.org/10.1155/2023/8342104 4. Kipf, T. N., Welling, M. (2016). Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907 DOI: https://doi.org/10.48550/arXiv.1609.02907. 5. Veličković, P., Cucurull, G., Casanova, A., Romero, A., Liò, P., Bengio, Y. (2017). Graph Attention Networks. arXiv preprint arXiv:1710.10903v3. DOI: https://doi.org/10.48550/arXiv.1710.10903. 6. Totaro, S., Hussain, A., Scardapane, S. (2020). A non-parametric softmax for improving neural attention in time-series forecasting. Neurocomputing, 381, 177–185. DOI: https://doi.org/10.1016/j.neucom.2019.10.084 7. Zeng, H., Zhang, M., Xia, Y., Srivastava, A., Malevich, A., Kannan, R., Prasanna, V., Jin, L., Chen, R. (2022). Decoupling the depth and score of Graph Neural Networks. arXiv preprint arXiv: 2201.07858v1. DOI: http://arxiv.org/abs/2201.07858v1 8. Liu, T., Chen, Y., Li, D., Wu, C., Zhu, Y., He, J., Peng, Y., Chen, H., Guo, G. (2021). BGL: GPUEfficient GNN Training by Optimizing Graph Data I/O and Preprocessing. arXiv preprint arXiv: 2112.08541. DOI: https://doi.org/10.48550/arXiv.2112.08541 9. Tian, Y. (2022). The World of Graph Databases from an Industry Perspective. arXiv preprint arXiv:2211.13170. DOI: https://doi.org/10.48550/arXiv.2211.13170 10. Wang, Z., Ioannidis, V. (2022). How AWS uses graph neural networks to meet customer needs. Amazon Science. https://www.amazon.science/blog/how-aws-uses-graph-neural-networks-to-meet-customer-needs 11. Zhang, Z. (2018). Improved Adam Optimizer for Deep Neural Networks. 2018 IEEE/ACM 26th International Symposium on Quality of Service (IWQoS). DOI: 10.1109/IWQoS.2018.8624183. 12. Cordonnier, J., Loukas, A., Jaggi, M. (2021). Multi-Head Attention: Collaborate Instead of Concatenate. arXiv preprint arXiv:2006.16362. DOI: https://doi.org/10.48550/arXiv.2006.16362 13. Xu, D., Ruan, C., Korpeoglu, E., Kumar, S., Achan, K. (2020). Inductive Representation Learning on Temporal Graphs. arXiv preprint arXiv:2002.07962. DOI: https://doi.org/10.48550/arXiv.2002.07962
dc.relation.references1. Санчез-Ленделінг та ін. (2021). Лагідний вступ до графових нейронних мереж. Distill. DOI: https://doi.org/10.23915/distill.00033 2. Узаір, A. Б., Танг, H., Ґуілу, В., Мар’ян, С., Хуссейн, A. (2023). Глибоке навчання з графовими згортковими мережами: огляд та останні застосування в обчислювальному інтелекті. Міжнародний журнал інтелектуальних систем. DOI: https://doi.org/10.1155/2023/8342104 3. Кіпф, T. Н., Welling, M. (2016). Напівконтрольована класифікація з графовими згортковими мережами. arXiv препринт: arXiv:1609.02907 DOI: https://doi.org/10.48550/arXiv.1609.02907. 4. Велічковіч, П., Кукурулл, Ґ., Казанова, A., Ромеро, A., Ліо, П., Бенґіо, Й. (2017). Графові мережі уваги. arXiv препринт arXiv:1710.10903v3. DOI: https://doi.org/10.48550/arXiv.1710.10903. 5. Тотаро, С., Хуссейн, A., Скардапане, С. (2020). Непараметричний софтмакс для покращення нейронової уваги при прогнозуванні часових рядів. Нейрокомп’ютинг, 381, 177–185. DOI: https://doi.org/10.1016/j.neucom.2019.10.084 6. Зенґ, Х., Жан, М., Чіа, Й., Срівастава, А., Малевіч, A., Каннан, Р., Прасанна, В., Джін, Л., Чен, Р. (2022). Відокремлення глибини та оцінки графових нейронних мереж. arXiv препринт arXiv: 2201.07858v1. DOI: http://arxiv.org/abs/2201.07858v1 7. Лю, T., Чен, Й., Лі, Д., Ву, К., Жу, Й., Хі, Й., Пен, Й., Чен, Х., Ґуо, Ж. (2021). BGL: GPU-ефективне навчання GNN шляхом оптимізації введення-виведення та попередньої опрацювання графових даних. arXiv препринт arXiv: 2112.08541. DOI: https://doi.org/10.48550/arXiv.2112.08541 8. Тіан, Й. (2022). Світ графових баз даних з точки зору індустрії. arXiv препринт: arXiv :2211.13170. DOI: https://doi.org/10.48550/arXiv.2211.13170 9. Ван, З., Йоанідіс, В. (2022). Як AWS використовує графові нейронні мережі для задоволення потреб клієнта. Amazon Science. https://www.amazon.science/blog/how-aws-uses-graph-neural-networks-to-meetcustomer- needs 10. Жан, З. (2018). Вдосконалений Оптимізатор АДАМ для глибоких нейронних мереж. 2018 IEEE/ACM 26-ий Міжнародний Симпозіум по якості послуг (IWQoS). DOI: 10.1109/IWQoS.2018.8624183. 11. Кордоньєр, Х., Лукас, A., Джаґґі, М. (2021). Увага до багатьох вершин: співпраця замість об’єднання. arXiv препринт arXiv:2006.16362. DOI: https://doi.org/10.48550/arXiv.2006.16362 12. Шу, Д., Руан, К., Корпеоґлу, E., Кумар, С., Ашан, K. (2020). Навчання індуктивного представлення на часових графах. arXiv препринт arXiv:2002.07962. DOI: https://doi.org/10.48550/arXiv.2002.07962
dc.relation.urihttps://doi.org/10.23939/sisn2024.16.251
dc.subjectGraph Convolutional Networks (GCN), Graph Attention Networks (GAT), GraphSAGE (Sample and aggreGatE), Graph, Graph Neural Network (GNN), Underwriting, Insurance, Risk Assessment
dc.subjectГрафові Згортальні Мережі (ГЗМ), Графові Мережі Уваги (ГМУ), GraphSAGE (Збір та агрегація), Граф, Графові нейронні мережі (ГНМ), Андеррайтинг, Страху- вання, Оцінка Ризиків
dc.subject.udc004.6
dc.titleGNN implementation approaches in AWS cloud for risk assessment in the insurance area
dc.title.alternativeПідходи впровадження ГНМ у хмарних сервісах AWS для оцінки ризиків у сфері страхування
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
241164maket4-253-274_0.pdf
Size:
1.02 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: