Оптимізація навчальної вибірки за допомогою випадкових точкових процесів
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
У роботі розглянуто методи оптимізації навчальних вибірок для алгоритмів глибокого навчання
із застосуванням випадкових точкових процесів, таких як Матерна першого і другого типу,
гіббсівський, гауссівський та пуассонівський процеси. Запропоновано підхід до зменшення
навчальних даних без втрати їхньої інформативності, що дає змогу зменшити обчислювальні
витрати та проблеми через перенавчання. Запропоновано новий підхід подання зображень у
вигляді випадкового точкового процесу, який дає можливість перейти від піксельного вигляду
зображення до моделі, яка підходить для аналізу методами випадкових точкових процесів.
Такий перехід до компактнішої емпіричної форми полегшує подальші аналіз та моделювання.
Завдяки цьому уможливлюється використання інструментів статистики для описання
закономірностей, прихованих у зображеннях. Продемонстровано ефективність випадкових
точковиx процесів для формування простору ознак, аналізу покриття та структурованості
навчальної вибірки. Розглянуто вплив різних типів точкових процесів на збалансованість даних
та їхню здатність зменшувати надмірність у вибірці. Увагу звернено зокрема на репрезен-
тативність даних, оскільки вона визначає стійкість і узагальнювальну здатність моделей
глибокого навчання. Наведено алгоритми перетворення зображень на точкові процеси та їх
використання для балансування класів, розрідження даних та підвищення репрезентативності
вибірки. Подано результати оцінювання ймовірності правильної класифікації на прикладі
моделей ResNet, які демонструють переваги застосування точкових процесів порівняно із
випадковим прорідженням даних. Підтверджено ефективність точкових процесів для
оптимізації великих навчальних наборів та підвищення точності глибокого навчання. Отримані
результати свідчать, що застосування таких методів може стати ключовим для створення
ефективніших моделей нейронних мереж. Окреслено перспективи подальших досліджень у
напрямі адаптивної оптимізації навчальних вибірок, під час яких випадкові точкові процеси
можуть стати основою для нових методів підготовки.
The paper considers methods for optimizing training samples for deep learning algorithms through the use of random point processes, such as Matern of the first and second types, Gibbs, Gaussian, and Poisson processes. An approach to reducing training data without sacrificing informativeness is proposed, enabling a decrease in computational costs and mitigating the risk of overfitting. A novel method of representing images as random point processes is introduced, allowing a transition from the pixel based representation of an image to a model more suitable for analysis with point process techniques. This transition to a more compact empirical form facilitates subsequent analysis and modeling. In addition, it enables the use of statistical tools to uncover patterns hidden within images. The effectiveness of random point processes in shaping the feature space, analyzing coverage, and structuring the training dataset is demonstrated. The study also considers the impact of different types of point processes on data balance and their ability to reduce redundancy within the sample. Particular attention is given to the issue of data representativeness, as it directly affects the stability and generalization capability of deep learning models. Algorithms for converting images into point processes and their application for class balancing, data thinning, and enhancing the representativeness of samples are presented. The evaluation of classification accuracy, conducted using ResNet models, highlights the advantages of applying point processes over random data thinning. The results confirm the effectiveness of point processes for optimizing large-scale training datasets and improving the accuracy of deep learning. Furthermore, the findings indicate that these methods may play a key role in developing more lightweight and efficient neural network models. The study outlines promising directions for future research in adaptive optimization of training samples, where random point processes may serve as the foundation for new approaches to data preparation in neural network training.
The paper considers methods for optimizing training samples for deep learning algorithms through the use of random point processes, such as Matern of the first and second types, Gibbs, Gaussian, and Poisson processes. An approach to reducing training data without sacrificing informativeness is proposed, enabling a decrease in computational costs and mitigating the risk of overfitting. A novel method of representing images as random point processes is introduced, allowing a transition from the pixel based representation of an image to a model more suitable for analysis with point process techniques. This transition to a more compact empirical form facilitates subsequent analysis and modeling. In addition, it enables the use of statistical tools to uncover patterns hidden within images. The effectiveness of random point processes in shaping the feature space, analyzing coverage, and structuring the training dataset is demonstrated. The study also considers the impact of different types of point processes on data balance and their ability to reduce redundancy within the sample. Particular attention is given to the issue of data representativeness, as it directly affects the stability and generalization capability of deep learning models. Algorithms for converting images into point processes and their application for class balancing, data thinning, and enhancing the representativeness of samples are presented. The evaluation of classification accuracy, conducted using ResNet models, highlights the advantages of applying point processes over random data thinning. The results confirm the effectiveness of point processes for optimizing large-scale training datasets and improving the accuracy of deep learning. Furthermore, the findings indicate that these methods may play a key role in developing more lightweight and efficient neural network models. The study outlines promising directions for future research in adaptive optimization of training samples, where random point processes may serve as the foundation for new approaches to data preparation in neural network training.
Description
Citation
Луцик О. Оптимізація навчальної вибірки за допомогою випадкових точкових процесів / О. Луцик, Б. Русин, Р. Косаревич // Інфокомунікаційні технології та електронна інженерія. — Львів : Видавництво Львівської політехніки, 2025. — Том 5. — № 2. — С. 109–118.