Process discovery method for distributed software systems with web interface
Date
2019-02-26
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Abstract
Як прикладна дисципліна, процес-майнинг виник два десятиліття тому, і упродовж
останніх кількох років його методи отримують все ширше застосування на
практиці. Ознакою, яка відрізняє процес-майнинг від класичного дата-майнигу, є
фокусування на процесній природі оброблюваних даних. Активний розвиток ніші ринку
програмного забезпечення процес-майнингу загострив актуальність задач, пов’язаних із
підвищенням масштабованості його методів. Автори пропонують подальший розвиток
методу Fuzzy Miner, що розширює його застосування до розподілених програмних
системах з web-інтерфейсом. Для забезпечення вимог масштабованості розрахункові
процедури реалізовано у різних частинах системи: найбільш ресурсоємні алгоритми
виконуються на стороні сервера, тоді як менш ресурсоємні – на стороні web-клієнта.
Своєю чергою, серверні компоненти належать до одного із логічних рівнів: даних або
сервісів. Рівень даних відповідає за збереження даних у XES-форматі та збирання
процесних метрик. Побудова графу процесу та взаємодія з клієнтською частиною
забезпечується рівнем сервісів. Призначенням клієнтської web-програми є відбраження
графу процесу, який будує сервер. Автоматична перевірка коректності реалізації
розрахункової логіки забезпечується модульними та інтеграційними тестами. Рішення,
реалізоване авторами, ґрунтується на відкритих програмних продуктах, що дає змогу
знизити сумарну вартість програмної системи. На основі порівняння отриманих значень
із результатами, одержаними за допомогою ProM 6.8 (було застосовано плагіни: Fuzzy
Miner and Alpha++ Miner), зроблено висновок, що запропонована адаптація методу
Fuzzy Miner забезпечує відображення поведінки, яка присутня в event-даних (що також
успішно виконують відповідні ProM-плагіни). Своєю чергою, з погляду системної
архітектури запропоноване рішення демонструє кращі характеристики масштабованості,
тобто здатності нарощувати обчислювальні потужності з метою опрацювання
більших обсягів event-даних порівняно із згаданими вище ProM-плагінами.
As an applied discipline, process mining emerged about two decades ago, and its methods have been increasingly used in practice for recent few years. What differentiates process mining from the conventional data mining is considering process nature of the analyzed data. Rapid development of the process mining software market niche has risen relevance of such task as scalability of process mining methods. Adaptation of the process discovery method, called Fuzzy Miner, to distributed software systems with web interface has been proposed by the authors. To address the scalability requirements, the calculation procedures are implemented on different part of the system: the most computer resource consuming algorithms are executed on the server side whilst less resource consuming calculations are placed on the client side. In turns, the server-side components belong either to the data layer or service layer. The data layer is accountable for storing event data in XES format and measuring process metrics. Building a process graph and communication with the client web application is the responsibility of the service layer. The purpose of the client-side web application is to render a process graph generated in the server-side. The calculation logic is covered with unit and integration tests so that its correctness is checked automatically. In order to reduce total cost of ownership of the system, it is implemented with free software. From the performed calculations and comparison of the outcomes with the results received by means of the existing ProM 6.8 plugins (Fuzzy Miner and Alpha++ Miner), it can be concluded that the proposed adaptation of the Fuzzy Miner method ensures representation of the behavior seen in an event log (like the ProM 6.8 plugins successfully do). In turns, from the software architecture standpoint, the proposed solution demonstrates better scalability characteristics, i.e., ability to increase capacity in order to handle bigger amount of event data, in comparison with the mentioned above ProM plugins.
As an applied discipline, process mining emerged about two decades ago, and its methods have been increasingly used in practice for recent few years. What differentiates process mining from the conventional data mining is considering process nature of the analyzed data. Rapid development of the process mining software market niche has risen relevance of such task as scalability of process mining methods. Adaptation of the process discovery method, called Fuzzy Miner, to distributed software systems with web interface has been proposed by the authors. To address the scalability requirements, the calculation procedures are implemented on different part of the system: the most computer resource consuming algorithms are executed on the server side whilst less resource consuming calculations are placed on the client side. In turns, the server-side components belong either to the data layer or service layer. The data layer is accountable for storing event data in XES format and measuring process metrics. Building a process graph and communication with the client web application is the responsibility of the service layer. The purpose of the client-side web application is to render a process graph generated in the server-side. The calculation logic is covered with unit and integration tests so that its correctness is checked automatically. In order to reduce total cost of ownership of the system, it is implemented with free software. From the performed calculations and comparison of the outcomes with the results received by means of the existing ProM 6.8 plugins (Fuzzy Miner and Alpha++ Miner), it can be concluded that the proposed adaptation of the Fuzzy Miner method ensures representation of the behavior seen in an event log (like the ProM 6.8 plugins successfully do). In turns, from the software architecture standpoint, the proposed solution demonstrates better scalability characteristics, i.e., ability to increase capacity in order to handle bigger amount of event data, in comparison with the mentioned above ProM plugins.
Description
Keywords
процес-майнинг, event-дані, логи, XES, ProM, Fuzzy Miner, process mining, event data, event logs, XES, ProM, Fuzzy Miner
Citation
Batyuk A. Process discovery method for distributed software systems with web interface / Anatolii Batyuk, Volodymyr Voityshyn // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — № 5. — С. 70–77.