Дослідження оптимального алгоритму машинного навчання для виявлення банківського шахрайства
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет «Львівська політехніка»
Abstract
Магістерстька кваліфікаційна робота виконана студентом групи КНСШ22 Сидоруком Михайлом Володимировичем. Тема роботи «Дослідження оптимального алгоритму машинного навчання для виявлення банківського шахрайства». Робота направлена на здобуття ступеня магістр за спеціальністю 122 «Комп’ютерні науки». Метою дипломної роботи є написання програми, яка зможе на основі інформації про банківську транзакцію буде точно і швидко визначати чи безпечна вона чи є ризик, що даними карти заволоділи шахраї. Об’єктом дослідження є алгоритми класифікації, зокрема з використанням нейронних мереж. В ході виконання дипломної роботи було розроблено програму, яка класифікує транзакцію як безпечну або ж як потенційно ініційовану шахраєм. В даній роботі пропонується використання ансамблевого методу, який поєднує одразу кілька моделей машинного навчання. Такий підхід дозволить зменшити ймовірність помилкових спрацювань та підвищити точність класифікації. Окрім цього для оптимальної роботи моделі буде проведений препроцесинг даних, зокрема їх нормалізація, балансування класів а також вибір ознак. В ході дослідження важливо не лише досягти високої точності, а й якомога сильніше зменшити кількість шахрайських транзакцій, що будуть помилково класифіковані як нормальні. Це пов’язано з бізнес вимогами банківської сфери, оскільки кожна така транзакція завдає втрат репутації системи а також безпосередньо фінансових збитків. У рамках дослідження обгрунтовано, що використання даного підходу дає кращі результати класифікації, ніж одиночні моделі завдяки компенсації недоліків кожної з них. Також досліджено як саме порядок моделей впливає на кінцеві результати класифікації. The master's thesis was written by a student of the group KNSCH-22 by Mykhailo Volodymyrovych Sydoruk. The topic of the work is ‘Research of the optimal machine learning algorithm for detecting bank fraud’. The work is aimed at obtaining a master's degree in speciality 122 ‘Computer Science’. The purpose of the thesis is to write a programme that will be able to accurately and quickly determine whether a bank transaction is safe or whether there is a risk that fraudsters have taken possession of the card data based on information about the transaction. The object of the research is classification algorithms, in particular, using neural networks. In the course of my thesis, I developed a programme that classifies a transaction as either secure or potentially initiated by a fraudster. This paper proposes to use an ensemble method that combines several machine learning models at once. This approach will reduce the likelihood of false positives and improve classification accuracy. In addition, for optimal model performance, the data will be preprocessed, including normalisation, class balancing, and feature selection. In the course of the study, it is important not only to achieve high accuracy but also to reduce the number of fraudulent transactions that will be mistakenly classified as normal as much as possible. This is due to the business requirements of the banking sector, as each such transaction causes damage to the system's reputation and direct financial losses. The study proves that the use of this approach yields better classification results than single models due to compensation for the shortcomings of each of them. The choice of this approach is also due to its high practicality, compatibility with financial systems, and ease of integration. It was also investigated how exactly the order of the models affects the final classification results.
Description
Citation
Сидорук М. В. Дослідження оптимального алгоритму машинного навчання для виявлення банківського шахрайства : пояснювальна записка до магістерської кваліфікаційної роботи : 122 «Комп’ютерні науки» / Михайло Володимирович Сидорук ; Національний університет «Львівська політехніка». – Львів, 2024. – 64 с.