Система аналізу тарифного плану користувачів мобільного оператора

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Сучасний телекомунікаційний ринок відзначається високою конкуренцією, стрімким розвитком технологій і зміною уподобань споживачів. Ці тенденції створюють додаткові виклики для мобільних операторів, які прагнуть забезпечити стабільність клієнтської бази та підвищити свою конкурентоспроможність. Одним із ключових напрямів вдосконалення бізнес-моделей у цій сфері є персоналізація послуг, що вимагає глибокого розуміння потреб абонентів. Водночас, зростаючі обсяги даних, які оператори отримують від користувачів, відкривають нові можливості для впровадження інтелектуальних систем підтримки рішень. У даній магістерській роботі вирішується завдання прогнозування змін тарифних планів абонентів за допомогою методів машинного навчання Об'єктом дослідження є процес, що впливає на рішення користувача щодо зміни тарифного плану. Предметом дослідження передбачення рішення користувача, щодо зміни тарифного плану Метою роботи є розробка ефективної моделі машинного навчання, яка зможе прогнозувати зміну тарифного плану користувачем на основі аналізу історичних даних та поведінки абонента. Процес розробки системи базується на використанні методології CRISP-DM (Cross-Industry Standard Process for Data Mining), яка охоплює всі етапи роботи з даними: від бізнес-аналізу до впровадження готової моделі. На першому етапі дослідження було виконано аналіз потреб маркетингового відділу оператора. Це включало визначення ключових факторів, які впливають на зміну тарифного плану, таких як історія користування послугами, поведінкові патерни та демографічні дані абонентів. Другий етап передбачав збір та обробку даних. Для формування навчальної вибірки використовувалися історичні дані про тарифні плани, обсяги використання послуг та профілі користувачів. Проведено нормалізацію, кодування категоріальних змінних та обробку пропущених значень за допомогою спеціалізованих алгоритмів. Для підготовки даних використовувалася бібліотека Pandas, що забезпечила ефективну маніпуляцію великими масивами даних. Наступним етапом стала розробка моделі прогнозування. Було випробувано кілька підходів до класифікації, зокрема алгоритми градієнтного бустингу (XGBoost), дерева рішень та ансамблеві методи (bagging, boosting). У процесі роботи враховано проблему незбалансованості даних, оскільки більшість користувачів залишаються на поточному тарифному плані, що створює диспропорцію у вибірці. Особливу увагу було приділено оцінці якості моделей. Для вимірювання точності прогнозів використовувалися метрики точності, повноти, F1-міри та AUC-ROC. Завдяки використанню ROC-кривих було визначено оптимальні пороги класифікації, що підвищило загальну ефективність системи. У процесі оптимізації гіперпараметрів застосовувався метод пошуку по сітці (Grid Search), що дозволило знайти найкращі гіперпараметри для моделі. Оцінка результатів показала, що найкращих результатів досягнуто при використанні XGBoost, який продемонстрував високу точність і здатність до роботи з великими масивами даних. Аналітична система була інтегрована в робочі процеси за допомогою хмарної інфраструктури AWS, що забезпечило її масштабованість і стабільність роботи. Розроблена система має значну практичну цінність. Вона дозволяє мобільному оператору прогнозувати зміни тарифів, що дає змогу своєчасно пропонувати клієнтам персоналізовані пропозиції. Це сприяє підвищенню рівня задоволеності клієнтів, зниженню ризиків відтоку та збільшенню середнього доходу на одного користувача. Наприклад, завдяки аналізу даних про перевищення обсягу інтернет-трафіку можна заздалегідь запропонувати клієнту вигідніший тариф із більшим обсягом послуг. Окрім прогнозування, система сприяє оптимізації маркетингових кампаній, дозволяючи орієнтуватися на цільові сегменти клієнтів. Це знижує витрати на рекламу та підвищує її ефективність, оскільки персоналізовані пропозиції мають більшу конверсію. Наукова новизна роботи полягає у створенні індивідуальної моделі прогнозування, що враховує особливості локального ринку та специфіку даних конкретного оператора. Це дозволяє значно перевищити точність прогнозів, порівняно з універсальними рішеннями. Результати дослідження підкреслюють важливість інтеграції інноваційних методів аналізу даних у бізнес-процеси телекомунікаційних компаній. З урахуванням стрімкого впровадження технологій 5G та зростання обсягів даних, розробка таких систем є вкрай актуальною.
The modern telecommunications market is characterized by high competition, rapid technological development, and changing consumer preferences. These trends create additional challenges for mobile operators seeking to maintain a stable customer base and enhance their competitiveness. One of the key directions for improving business models in this sector is service personalization, which requires a deep understanding of subscriber needs. At the same time, the increasing volumes of user data provide new opportunities for implementing intelligent decision-support systems. This master's thesis addresses the problem of predicting changes in subscribers' tariff plans using machine learning methods. The object of the research is the process influencing users’ decisions to change their tariff plans. The subject of the research is the prediction of users’ decisions regarding tariff plan changes. The goal of the study is to develop an effective machine learning model capable of predicting users’ tariff plan changes based on historical data and subscriber behavior analysis. The system development process is based on the CRISP-DM (Cross-Industry Standard Process for Data Mining) methodology, which covers all stages of working with data, from business analysis to implementing a ready-made model. The first stage of the study involved analyzing the marketing department's needs, including identifying the key factors influencing tariff plan changes, such as service usage history, behavioral patterns, and demographic data of subscribers. The second stage involved data collection and preprocessing. Historical data on tariff plans, service usage volumes, and user profiles were used to form the training dataset. Normalization, encoding of categorical variables, and handling of missing values were performed using specialized algorithms. The Pandas library was utilized for data preparation, enabling efficient manipulation of large data volumes. The next stage was the development of a prediction model. Several classification approaches were tested, including gradient boosting algorithms (XGBoost), decision trees, and ensemble methods (bagging, boosting). The issue of data imbalance, where most users remain on their current tariff plan, was addressed as it creates disproportion in the dataset. Resampling methods such as oversampling for underrepresented classes were applied to address this. Special attention was paid to evaluating the quality of the models. Metrics such as accuracy, recall, F1-score, and AUC-ROC were used to measure predictive performance. By utilizing ROC curves, optimal classification thresholds were identified, improving the system’s overall effectiveness. Grid Search was applied to optimize hyperparameters, which allowed for the identification of the best model configurations. Evaluation results demonstrated that XGBoost provided the best performance, showing high accuracy and robustness in working with large data volumes. The analytical system was integrated into workflows using AWS cloud infrastructure, ensuring scalability and operational stability. The developed system has significant practical value. It allows mobile operators to predict tariff plan changes, enabling timely personalized offers to customers. This increases customer satisfaction, reduces churn risks, and raises the average revenue per user. For example, by analyzing data on exceeding internet traffic limits, the system can proactively recommend a more suitable tariff plan with higher service limits. In addition to forecasting, the system optimizes marketing campaigns by targeting specific customer segments. This reduces advertising costs and improves efficiency, as personalized offers have higher conversion rates. The scientific novelty of the work lies in creating a customized predictive model that considers the specific features of the local market and the unique data of a particular operator. This enables significantly higher forecast accuracy compared to universal solutions. The research findings emphasize the importance of integrating innovative data analysis methods into the business processes of telecommunications companies. Given the rapid implementation of 5G technologies and the growing volumes of data, the development of such systems is highly relevant.

Description

Citation

Мотрунич В. І. Система аналізу тарифного плану користувачів мобільного оператора : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Владислав Іванович Мотрунич. — Львів, 2024. — 112 с.

Endorsement

Review

Supplemented By

Referenced By