Web-додаток для інтелектуального аналізу хокейних матчів
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Структура роботи складається з чотирьох взаємодоповнюючих розділів, в яких розкривається тематика дослідження. У першому розділі проводиться літературний пошук та аналіз існуючих робіт, що стосуються вибраного напрямку дослідження. Зроблено узагальнюючий висновок та обрано напрям і методи дослідження. У наступних розділах систематично розкривається структурно-логічна схема та обґрунтування алгоритму роботи системи. В якості інструментів її реалізації обрано мову програмування python з модулями sklearn, pandas та requests, які на сьогоднішній день широко застосовуються для вирішення завдань збору, обробки та аналізу даних. Для забезпечення можливості роботи з створеною системою, користувачу, створено клієнтський веб-застосунок з використанням фреймворку React і доповнення у вигляді бібліотеки Chart.js для візуалізації отриманих в ході дослідження результатів. Дані обчислюються в серверних функціях, після чого завантажуються на клієнт через відповідні запити. Користувач має змогу, з використанням будь якого пристрою, на якому є встановлений браузер – переглядати інформацію про статистику хокейних матчів, дізнатися їх географічних розподіл, кількість проведених в кожній країні, та отримати зображення більш складних аналітичних даних, як поділ методом k-means. Додаток побудований на принципах односторінкових веб застосунків що передбачає швидкість та зручність його використання кінцевим користувачем. Скомпільований код передається через спеціальну мережу доставки контенту, що належить хост провайдеру і дозволяє не турбуватися за доступність при великому напливі користувачів. В якості вихідних даних при розробці системи зібрано відкриту інформацію про проведені хокейні матчі з 2010 по 2022 роки. Після відповідного форматування та обробки, що передбачає собою видалення не важливої для статистики інформації, тобто такої що не представлена в числовому форматі, та, по можливості, бінаризацію комплексних ознак, було зібрано датасет що в подальшому був використаний для використання в алгоритмах машинного навчання. Суть роботи розробленої системи полягає у проведенні збору та комплексного аналізу даних про проведені хокейні матчі за останній десяток років. Практична цінність полягає в зацікавленості широкого кола людей з тих, хто цікавиться хокеєм в тому щоб дізнатися більше не очевидної інформації, доступної тільки за використання алгоритмів машинного навчання. На сьогодні така інформація є доступною лише ветеранам галузі, які можуть самостійно провести аналіз та отримати з нього деякі висновки.
The structure of the work consists of four complementary sections that delve into the research topic. The first section focuses on literary search and analysis of existing works related to the chosen research direction. A comprehensive conclusion is drawn, and the research direction and methods are selected. Subsequent sections systematically unveil the structural and logical scheme, as well as the justification of the system's workflow algorithm. To implement the system, the programming language Python is chosen, along with modules such as sklearn, pandas, and requests, widely used for data collection, processing, and analysis tasks. To facilitate user interaction with the created system, a client-side web application is developed using the React framework, supplemented by the Chart.js library for data visualization during the research. Data computations are performed on server-side functions and then loaded to the client through corresponding requests. Users can access information about hockey match statistics, geographical distribution, the number of matches played in each country, and obtain visual representations of more complex analytical data, such as clustering using the k-means method, on any device with a web browser. The application is built based on principles of single-page web applications, ensuring speed and user convenience. The compiled code is delivered through a content delivery network owned by the hosting provider, ensuring availability even during high user traffic. As input data for system development, publicly available information on conducted hockey matches from 2010 to 2022 is collected. After appropriate formatting and processing, which involves removing non-statistical information and, whenever possible, binarizing complex features, a dataset is created for further utilization in machine learning algorithms. The essence of the developed system lies in the collection and comprehensive analysis of data on hockey matches conducted over the past decade. Its practical value lies in catering to a wide range of people interested in hockey who seek to uncover non-obvious information accessible only through the application of machine learning algorithms. Currently, such information is only available to industry veterans capable of conducting independent analysis and drawing conclusions from it.
The structure of the work consists of four complementary sections that delve into the research topic. The first section focuses on literary search and analysis of existing works related to the chosen research direction. A comprehensive conclusion is drawn, and the research direction and methods are selected. Subsequent sections systematically unveil the structural and logical scheme, as well as the justification of the system's workflow algorithm. To implement the system, the programming language Python is chosen, along with modules such as sklearn, pandas, and requests, widely used for data collection, processing, and analysis tasks. To facilitate user interaction with the created system, a client-side web application is developed using the React framework, supplemented by the Chart.js library for data visualization during the research. Data computations are performed on server-side functions and then loaded to the client through corresponding requests. Users can access information about hockey match statistics, geographical distribution, the number of matches played in each country, and obtain visual representations of more complex analytical data, such as clustering using the k-means method, on any device with a web browser. The application is built based on principles of single-page web applications, ensuring speed and user convenience. The compiled code is delivered through a content delivery network owned by the hosting provider, ensuring availability even during high user traffic. As input data for system development, publicly available information on conducted hockey matches from 2010 to 2022 is collected. After appropriate formatting and processing, which involves removing non-statistical information and, whenever possible, binarizing complex features, a dataset is created for further utilization in machine learning algorithms. The essence of the developed system lies in the collection and comprehensive analysis of data on hockey matches conducted over the past decade. Its practical value lies in catering to a wide range of people interested in hockey who seek to uncover non-obvious information accessible only through the application of machine learning algorithms. Currently, such information is only available to industry veterans capable of conducting independent analysis and drawing conclusions from it.
Description
Keywords
Citation
Подвірний Д. А. Web-додаток для інтелектуального аналізу хокейних матчів : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „6.126.00.01 — Інтелектуальні інформаційні технології“ / Дмитро Анатолійович Подвірний. — Львів, 2022. — 85 с.