Проєкт інформаційної системи із парсингу даних для процедур прогнозування результатів спортивних подій
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
У сучасному світі інформаційні системи відіграють ключову роль у зборі, аналізі та обробці даних. Особливо це стосується спортивної аналітики, де обсяги доступної інформації зростають із кожним роком. Завдяки розвитку технологій стало можливим автоматизувати процеси збору даних із різних джерел, таких як спортивні сайти, бази даних і API. Ця автоматизація відкриває нові перспективи для прогнозування спортивних подій, що є особливо важливим у зв’язку з популяризацією ставок на спорт, спортивної журналістики та аналізу стану команд.
Спорт є однією зі сфер, де обробка і аналіз великих даних можуть принести користь тим, хто зможе ними скористатися, оскільки передбачення результатів спортивних подій стало важливим інструментом для численних зацікавлених сторін – від спортивних аналітиків і журналістів до любителів спорту і букмекерських компаній [3]. Прогнозування результатів спортивних подій вимагає врахування багатьох факторів: від історичних показників команд і статистики гравців до таких змінних, як погодні умови чи місце проведення матчу. Ці параметри є надзвичайно важливими для формування точних прогнозів, що дають користувачам змогу приймати більш обґрунтовані рішення.
У той же час розробка подібних інформаційних систем є актуальною через постійну динамічність і мінливість спортивної галузі. Крім того, деякі з параметрів мають високу ймовірність зміни і стають більш визначеними ближче до старту спортивної події, коли вже залишається мало часу для проведення обчислень на основі щойно оновлених даних. Також проблема ручного збору й обробки даних стає дедалі більшою через складність інтеграції різних форматів інформації. Саме тому автоматизація та впровадження новітніх алгоритмів аналізу, таких як метод Монте-Карло та алгоритми машинного навчання, дозволяють розв’язати ці виклики [4]. Інформаційні системи для парсингу даних дають змогу забезпечити аналітиків, букмекерів та спортивних фанатів якісними прогнозами та швидким доступом до актуальної інформації.
Мета роботи полягає у розробці системи, яка здатна автоматизовано отримувати дані з численних джерел (веб-сайтів, баз даних, API), обробляти їх, зводити до уніфікованої форми та забезпечувати якісне прогнозування спортивних результатів. Це дозволяє підвищити точність прогнозів і приймати обґрунтовані рішення, що є актуальним для зацікавлених сторін.
Об’єктом дослідження є процеси збору, обробки та аналізу даних, що потенційно впливають на результат спортивних змагань.
Предметом дослідження є методи та засоби, які дозволяють підвищити точність прогнозів, забезпечуючи ефективний і своєчасний збір даних з різноманітних джерел з метою їх подальшого використання у алгоритмах прогнозування результатів спортивних подій.
Наукова новизна роботи полягає у створенні системи, яка об'єднує алгоритми машинного навчання, метод Монте-Карло та сучасні технології парсингу для вирішення завдань спортивного прогнозування. Завдяки цьому можливо враховувати складні залежності між параметрами, що впливають на результат спортивної події.
Практичне значення одержаних результатів. Система дозволить аналітикам, беттерам та іншим зацікавленим сторонам швидко та у зручний спосіб отримувати прогнози високої точності. Вона знизить затрати часу на обробку даних і підвищить ефективність прийняття рішень. Крім того, додаткова функція формування коротких дайджестів новин забезпечить зручний доступ до релевантної інформації про команди, спортсменів чи змагання.
Під час написання цієї магістерської кваліфікаційної роботи було проведено аналіз наявних методів та засобів розв’язання поставленої проблеми, а також описано їхні недоліки, які потрібно покращити. За результатами проведеного системного аналізу і створення UML-діаграм сформовано вимоги до системи й розроблено її концептуальну модель. Після цього складено план керування проєктом. На основі проведеної роботи було реалізовано інформаційну систему із парсингу даних для процедур прогнозування результатів спортивних подій у вигляді веб-сторінки під назвою “Predict sport event”, що може використовуватися зацікавленими людбми для отримання точних передбачень спортивних подій.
In the modern world, information systems play a key role in collecting, analyzing, and processing data. This is particularly true for sports analytics, where the volume of available information grows each year. With advancements in technology, it has become possible to automate the processes of data collection from various sources such as sports websites, databases, and APIs. This automation opens new prospects for predicting sports events, which is especially important given the rise in popularity of sports betting, sports journalism, and team performance analysis. Sports is one of the fields where the processing and analysis of big data can benefit those who utilize it effectively, as predicting the outcomes of sports events has become an essential tool for various stakeholders – from sports analysts and journalists to sports enthusiasts and betting companies [1]. Predicting sports event results requires consideration of many factors: historical team performance, player statistics, and variables like weather conditions or match location. These parameters are crucial for forming accurate predictions that enable users to make well-informed decisions. At the same time, developing such information systems is relevant due to the dynamic and ever-changing nature of the sports industry. Furthermore, some parameters are highly variable and become more defined closer to the start of a sports event, leaving limited time for calculations based on newly updated data. The challenge of manual data collection and processing is further compounded by the complexity of integrating information from diverse formats. This is why automation and the implementation of modern analysis algorithms, such as the Monte Carlo method and machine learning algorithms, address these challenges effectively [2]. Data parsing systems provide analysts, bookmakers, and sports fans with quality forecasts and quick access to relevant information. The goal of this work is to develop a system capable of automatically retrieving data from multiple sources (websites, databases, APIs), processing it, normalizing it, and providing quality sports result predictions. This enhances prediction accuracy and supports well-grounded decision-making, which is crucial for stakeholders. The research object is the processes of data collection, processing, and analysis that potentially influence the outcomes of sports competitions. The research subject is the methods and tools that improve prediction accuracy by ensuring efficient and timely data collection from diverse sources for subsequent use in sports event prediction algorithms. The scientific novelty of this work lies in the creation of a system that integrates machine learning algorithms, the Monte Carlo method, and modern parsing technologies to solve sports prediction tasks. This enables accounting for complex interdependencies between parameters affecting sports event outcomes. Practical Value of Results. The system will allow analysts, bettors, and other stakeholders to quickly and conveniently obtain highly accurate predictions. It will reduce the time spent on data processing and enhance decision-making efficiency. Additionally, a feature for generating brief news digests will ensure convenient access to relevant information about teams, athletes, or competitions. During the development of this master’s qualification thesis, an analysis of existing methods and tools for addressing the problem was conducted, and their shortcomings, requiring improvement, were identified. Based on the results of a systematic analysis and the creation of UML diagrams, system requirements were formulated, and a conceptual model was developed. Subsequently, a project management plan was created. Based on the conducted work, an information system for data parsing for sports event prediction procedures was implemented as a web page named "Predict Sport Event," which can be utilized by interested parties to obtain accurate sports event predictions.
In the modern world, information systems play a key role in collecting, analyzing, and processing data. This is particularly true for sports analytics, where the volume of available information grows each year. With advancements in technology, it has become possible to automate the processes of data collection from various sources such as sports websites, databases, and APIs. This automation opens new prospects for predicting sports events, which is especially important given the rise in popularity of sports betting, sports journalism, and team performance analysis. Sports is one of the fields where the processing and analysis of big data can benefit those who utilize it effectively, as predicting the outcomes of sports events has become an essential tool for various stakeholders – from sports analysts and journalists to sports enthusiasts and betting companies [1]. Predicting sports event results requires consideration of many factors: historical team performance, player statistics, and variables like weather conditions or match location. These parameters are crucial for forming accurate predictions that enable users to make well-informed decisions. At the same time, developing such information systems is relevant due to the dynamic and ever-changing nature of the sports industry. Furthermore, some parameters are highly variable and become more defined closer to the start of a sports event, leaving limited time for calculations based on newly updated data. The challenge of manual data collection and processing is further compounded by the complexity of integrating information from diverse formats. This is why automation and the implementation of modern analysis algorithms, such as the Monte Carlo method and machine learning algorithms, address these challenges effectively [2]. Data parsing systems provide analysts, bookmakers, and sports fans with quality forecasts and quick access to relevant information. The goal of this work is to develop a system capable of automatically retrieving data from multiple sources (websites, databases, APIs), processing it, normalizing it, and providing quality sports result predictions. This enhances prediction accuracy and supports well-grounded decision-making, which is crucial for stakeholders. The research object is the processes of data collection, processing, and analysis that potentially influence the outcomes of sports competitions. The research subject is the methods and tools that improve prediction accuracy by ensuring efficient and timely data collection from diverse sources for subsequent use in sports event prediction algorithms. The scientific novelty of this work lies in the creation of a system that integrates machine learning algorithms, the Monte Carlo method, and modern parsing technologies to solve sports prediction tasks. This enables accounting for complex interdependencies between parameters affecting sports event outcomes. Practical Value of Results. The system will allow analysts, bettors, and other stakeholders to quickly and conveniently obtain highly accurate predictions. It will reduce the time spent on data processing and enhance decision-making efficiency. Additionally, a feature for generating brief news digests will ensure convenient access to relevant information about teams, athletes, or competitions. During the development of this master’s qualification thesis, an analysis of existing methods and tools for addressing the problem was conducted, and their shortcomings, requiring improvement, were identified. Based on the results of a systematic analysis and the creation of UML diagrams, system requirements were formulated, and a conceptual model was developed. Subsequently, a project management plan was created. Based on the conducted work, an information system for data parsing for sports event prediction procedures was implemented as a web page named "Predict Sport Event," which can be utilized by interested parties to obtain accurate sports event predictions.
Description
Citation
Кемпник Р. В. Проєкт інформаційної системи із парсингу даних для процедур прогнозування результатів спортивних подій : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.126.00.03 — Управління ІТ проектами“ / Роман Васильович Кемпник. — Львів, 2024. — 108 с.