Machine learning for the analysis of quality of life using the World Happiness Index and Human Development Indicators
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
Алгоритми машинного навчання відіграють важливу роль в аналізі складних даних у дослідженнях у різних сферах. У цій статті використовуються алгоритми множинної регресії та статистичні методи для дослідження зв’язку між об’єктивними та суб’єктивними показниками якості життя та виявлення ключових факторів, що впливають на щастя на міжнародному рівні на основі даних індексу людського розвитку та Світового індексу щастя, що охоплюють період з 2015 по 2021 рік. Кореляційний аналіз Пірсона показав, що щастя пов’язане з показником індексу людського розвитку та валовим національним доходом на душу населення. Найефективнішою моделлю для прогнозування щастя була випадкова лісова регресія з показником R20.93667, середньоквадратичною помилкою 0.0033048 і середньоквадратичним значенням 0.05748, за якою йшли регресія XGBoost і регресія дерева рішень відповідно. Ці моделі показали, що валовий національний дохід на душу населення є найважливішою характеристикою для прогнозування щастя.
Machine learning algorithms play an important role in analyzing complex data in research across various fields. In this paper, we employ multiple regression algorithms and statistical techniques to investigate the relationship between objective and subjective quality of life indicators and reveal the key factors affecting happiness at the international level based on data from the Human Development Index and the World Happiness Index covering the period from 2015 to 2021. The Pearson correlation analysis showed that happiness is related to the HDI score and GNI per capita. The best-performing model for forecasting happiness was the random forest regression, with a R2 score of 0.93667, a mean squared error of 0.0033048, and a root mean squared error of 0.05748, followed by the XGBoost regression and the Decision Tree regression, respectively. These models indicated that GNI per capita is the most significant feature in predicting happiness.
Machine learning algorithms play an important role in analyzing complex data in research across various fields. In this paper, we employ multiple regression algorithms and statistical techniques to investigate the relationship between objective and subjective quality of life indicators and reveal the key factors affecting happiness at the international level based on data from the Human Development Index and the World Happiness Index covering the period from 2015 to 2021. The Pearson correlation analysis showed that happiness is related to the HDI score and GNI per capita. The best-performing model for forecasting happiness was the random forest regression, with a R2 score of 0.93667, a mean squared error of 0.0033048, and a root mean squared error of 0.05748, followed by the XGBoost regression and the Decision Tree regression, respectively. These models indicated that GNI per capita is the most significant feature in predicting happiness.
Description
Citation
Jannani A. Machine learning for the analysis of quality of life using the World Happiness Index and Human Development Indicators / A. Jannani, N. Sael, F. Benabbou // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2023. — Vol 10. — No 2. — P. 534–546.