Використання ARIMA моделей для прогнозування загального рівня злочинності в Україні

Abstract

Прогнозування рівня злочинності – важливий аспект розроблення стратегій сталого соціально-економічного розвитку правової держави. Особливої значущості точне прогнозування набуває в умовах економічної нестабільності та геополітичних криз, характерних для України. У статті досліджено проблеми побудови та використання авторегресійних моделей інтегрованого ковзного середнього (ARIMA) для прогнозування загальної кількості злочинів, вчинених на території України. Розрахунки показали, що часовий ряд злочинності (1990–2023 рр.) демонструє ознаки спадного тренду, є нестаціонарним і містить аномальні значення кількості злочинів у 2003, 2013 та 2020 рр. Використання методу інтегрування даних, із взяттям перших різниць між спостереженнями, призводить до втрати автокореляційної структури, яка була притаманна загальному ряду злочинності. Як наслідок, початкову модель ARIMA (1, 0, 0) побудовано на підставі неперетворених вхідних даних. Точність цієї моделі (MAPE = 8,61 %) виявилася вищою порівняно з моделлю, отриманою за методом експоненційного згладжування (MAPE = 9,38 %). Логарифмування часового ряду злочинності та згладжування аномальних рівнів сприяли підвищенню прогностичної валідності, що дало змогу моделі ARIMA врахувати додаткову автокореляцію, уникнувши необхідності введення компоненти ковзного середнього. В результаті модель ARIMA (2, 0, 0) показала найвищу точність (MAPE = 7,04 %) за найменшої складності, що підтверджують результати визначення інформаційних критеріїв. Крім того, модель успішно пройшла перевірку на стійкість за допомогою методу перехресної валідації з вилученням одного спостереження. Прогнозні оцінки, побудовані на основі усіх розглянутих ARIMA моделей, вказують на подальше зростання загального рівня злочинності в Україні, яке розпочалося у 2021 р. після тривалого періоду зниження.
Crime rate forecasting is a critical element in the development of strategies for sustainable socio-economic growth in a rule-of-law state. Accurate forecasting becomes particularly important in times of economic instability and geopolitical crises, as is the case in Ukraine. This article explores the problem of constructing and applying autoregressive integrated moving average (ARIMA) models to predict the total number of crimes committed in Ukraine. The statistical analysis of the crime time series was conducted using the Python programming language, utilizing specialized libraries such as numpy, pandas, matplotlib, statsmodels, pmdarima, and scikit-learn. The calculations indicate that the crime time series (1990–2023) demonstrates a declining trend, is non-stationary, and contains anomalous values in crime rates in 2003, 2013, and 2020, correlating with socio-political crises in Ukraine. Specifically, the anomalous increases in crime rates (in 2003 and 2013) align with heightened public unrest preceding the Orange Revolution (2004–2005) and the Revolution of Dignity (2013–2014). In contrast, the unusually low crime rates observed in 2020 are attributed to restrictive quarantine measures implemented due to the COVID–19 pandemic. The use of data integration by taking the first differences between observations resulted in the loss of autocorrelation structure inherent in the overall crime series. Consequently, the initial ARIMA (1, 0, 0) model was built based on the untransformed input data. The accuracy of this model was higher compared (MAPE = 8.61 %) to the model obtained using the exponential smoothing method (MAPE = 9.38 %). Logarithmic transformation of the crime time series and smoothing of anomalous levels enhanced the predictive validity, allowing the ARIMA model to account for additional autocorrelation while avoiding the need for a moving average component. As a result, the ARIMA (2, 0, 0) model demonstrated the highest accuracy (MAPE = 7.04 %) with minimal complexity, as confirmed by information criteria results. Furthermore, the model successfully passed robustness testing using the cross-validation method with the exclusion of a single observation. The forecasted estimates, derived from all the examined ARIMA models, indicate a continued increase in the overall crime rate in Ukraine, which began in 2021 following a prolonged period of decline

Description

Citation

Використання ARIMA моделей для прогнозування загального рівня злочинності в Україні / А. А. Яровий, О. Ф. Шевчук, А. В. Козловський, Ю. М. Паночишин, С. В. Сімончук // Український журнал інформаційних технологій. — Львів : Видавництво Львівської політехніки, 2024. — Том 6. — № 2. — С. 49–56.

Endorsement

Review

Supplemented By

Referenced By