Розробка методу виявлення аномалій у часових ГНСС-рядах з використанням алгоритмів машинного навчання
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
Метою цього дослідження є розроблення методу виявлення аномалій у часових рядах даних ГНСС з
використанням алгоритмів машинного навчання. Метод забезпечуватиме ідентифікацію аномалій, пов’язаних із
сейсмічною активністю, що сприятиме підвищенню ефективності моніторингу та прогнозування сейсмічних
подій. Об’єктом дослідження є часові ряди даних ГНСС, отримані з різних станцій, розташованих у сейсмічно
активних регіонах. Дані охоплюють щоденний набір просторових координат та інших параметрів, що дають
змогу аналізувати зміну положення об’єктів у часі. Методика. Для досягнення поставленої мети використано
алгоритм машинного навчання Isolation Forest, який реалізовано у середовищі Python. Методика дослідження
передбачає кілька етапів. Попередня обробка даних: очищення даних від шумів та відхилень, нормалізація. Вибір
параметрів алгоритму: налаштування гіперпараметрів моделі Isolation Forest для оптимальної роботи з ГНСС-
даними. Навчання моделі: використання тренувального набору даних для навчання алгоритму Isolation Forest.
Виявлення аномалій: застосування навченої моделі до тестових даних для ідентифікації потенційних аномалій.
Аналіз результатів: оцінювання виявлених аномалій та їх порівняння з відомими сейсмічними подіями для
підтвердження ефективності методу. Результати. Розроблений метод апробовано на даних чотирьох ГНСС-
станцій, розташованих у сейсмічно активних регіонах Японії. Результати показали, що алгоритм Isolation Forest
успішно виявив аномалії, які збігаються із відомими сейсмічними подіями. Зокрема, встановлено, що: алгоритм
виявив 6,9–23,8 % сейсмічних подій з точністю до трьох днів. Ефективність виявлення аномалій може залежати
від географічного розташування та технічних характеристик ГНСС-станцій. Наукова новизна полягає в
адаптації сучасного методу машинного навчання, а саме алгоритму Isolation Forest, для виявлення аномалій у
часових рядах даних ГНСС. Це дає змогу автоматизувати процес виявлення аномалій, підвищити його точність
та ефективність. Практична значущість розробленого методу полягає у можливості його використання для
моніторингу та прогнозування сейсмічної активності. Метод можна застосовувати для запобігання сейсмічним
подіям, що сприятиме зменшенню ризику людських жертв та матеріальних збитків, а також для моніторингу
стабільності великих інженерних споруд, розташованих у сейсмічно активних регіонах.
The purpose of this study is to develop a method for detecting anomalies in GNSS time series using machine learning algorithms. The method should ensure the identification of anomalies associated with seismic activity, which will help to improve the efficiency of monitoring and forecasting seismic events. Object of study is a GNSS time series data obtained from various stations located in seismically active regions. The data include daily 3 dimensional coordinates and other parameters that allow analyzing the change in the position of objects over time. Methodology. To achieve the goal, the Isolation Forest machine learning algorithm was used implemented in Python. The research methodology includes the following steps: Data pre-processing: data cleaning from noise and deviations, normalization. Selection of algorithm parameters: setting up hyperparameters of the IF model for optimal work with GNSS data. Model training: use a training dataset to train the IF algorithm. Anomaly detection: applying the trained model to test data to identify potential anomalies. Analysis of the results: evaluation of the detected anomalies and their comparison with known seismic events to confirm the effectiveness of the method. Results. The developed method was tested on data from four GNSS stations located in seismically active regions of Japan. The results showed that the Isolation Forest algorithm successfully detected anomalies that coincide with known seismic events. In particular, it was found that: the algorithm identified between 6.9 % and 23.8 % of seismic events in the “Excellent” category; The effectiveness of anomaly detection may depend on the geographical location and technical characteristics of GNSS stations. The scientific novelty of the study is the adaptation of a modern machine learning method, namely the Isolation Forest algorithm, to detect anomalies in GNSS time series. This allows automating the anomaly detection process, increasing its accuracy and efficiency. The practical significance of the developed method lies in the possibility of its use for monitoring and forecasting seismic activity. The method can be used to prevent seismic events, which will help reduce the risk of human casualties and material damage. The method can also be used to monitor the stability of large engineering structures located in seismically active regions.
The purpose of this study is to develop a method for detecting anomalies in GNSS time series using machine learning algorithms. The method should ensure the identification of anomalies associated with seismic activity, which will help to improve the efficiency of monitoring and forecasting seismic events. Object of study is a GNSS time series data obtained from various stations located in seismically active regions. The data include daily 3 dimensional coordinates and other parameters that allow analyzing the change in the position of objects over time. Methodology. To achieve the goal, the Isolation Forest machine learning algorithm was used implemented in Python. The research methodology includes the following steps: Data pre-processing: data cleaning from noise and deviations, normalization. Selection of algorithm parameters: setting up hyperparameters of the IF model for optimal work with GNSS data. Model training: use a training dataset to train the IF algorithm. Anomaly detection: applying the trained model to test data to identify potential anomalies. Analysis of the results: evaluation of the detected anomalies and their comparison with known seismic events to confirm the effectiveness of the method. Results. The developed method was tested on data from four GNSS stations located in seismically active regions of Japan. The results showed that the Isolation Forest algorithm successfully detected anomalies that coincide with known seismic events. In particular, it was found that: the algorithm identified between 6.9 % and 23.8 % of seismic events in the “Excellent” category; The effectiveness of anomaly detection may depend on the geographical location and technical characteristics of GNSS stations. The scientific novelty of the study is the adaptation of a modern machine learning method, namely the Isolation Forest algorithm, to detect anomalies in GNSS time series. This allows automating the anomaly detection process, increasing its accuracy and efficiency. The practical significance of the developed method lies in the possibility of its use for monitoring and forecasting seismic activity. The method can be used to prevent seismic events, which will help reduce the risk of human casualties and material damage. The method can also be used to monitor the stability of large engineering structures located in seismically active regions.
Description
Citation
Гайдусь О. Розробка методу виявлення аномалій у часових ГНСС-рядах з використанням алгоритмів машинного навчання / О. Гайдусь, І. Брусак // Сучасні досягнення геодезичної науки та виробництва : збірник наукових праць. — Львів : Видавництво Львівської політехніки, 2024. — № ІІ(48). — С. 67–75.