Інтелектуальна система соціалізації груп користувачів за подібними інтересами
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
Проаналізовано загальну архітектуру системи соціалізації груп користувачів за подібними інтересами та функціональні вимоги до неї. Для опрацювання великої частини інформації систему реалізовано із використанням методів нечіткого пошуку текстової інформації та машинного навчання. Зокрема, застосовано алгоритми N-грам, розширення вибірки та структурованої моделі Noisy Channel. Особливістю інтелектуальної системи є опрацювання тексту, аналіз слів у тексті та формування оцінок. Реалізація згорткової нейронної мережі призначена для визначення справжності користувачів на основі аналізу фотографій із обличчям. Використання алгоритмів нечіткого пошуку дає змогу виконувати опрацювання текстових даних різних обсягів для аналізу інформації про кожного користувача, формування певного рейтингу користувача, порівняння цього користувача з іншими користувачами для спрощення подальшої соціалізації користувачів, інтереси яких збігаються найбільше. Під час експериментальної апробації порівняно точність функціонування розробленої інтелектуальної системи через визначення відсотка подібності поточних користувачів за допомогою алгоритмів N-грам та їх поєднання. Одночасне виконання цих алгоритмів є приблизно на 15 % ефективнішим і точнішим від алгоритму N-грам і на 10 % від інших відомих алгоритмів. Проаналізовано також роботу алгоритму лінійного пошуку тегів у словнику та алгоритму Noisy Channel із використанням BK-дерева. Завдяки цьому вдалося досягти значної переваги в роботі алгоритму, оскільки замість лінійної залежності часу пошуку отримано логарифмічну залежність. Також порівняно роботу синхронних та асинхронних методів системи. На початку роботи відмінність не дуже відчутна, але у міру зростання кількості запитів система навантажується і відмінності стають відчутнішими.
The article develops a general architectural system of socialization of groups of users with similar interests and functional requirements for it. To process a large part of the information, the system is implemented using the methods of fuzzy text information search and machine learning. thus, N-gram, selection expansion and structured Noisy Channel models are applied. A feature of the implementation is the processing of the text, the analysis of words in the text and the formation of evaluations. A convolutional neural network implementation is designed to determine user authenticity based on facial photo analysis. implementation of fuzzy search algorithms – for processing text data of various volumes to analyze information about each user, form a certain user rating, compare this user with other users to promote further socialization of users whose interests coincide the most. When experimentally checking the accuracy of the developed system by determining the percentage of similarity of current users with the help of N-grams and their connections. Running these algorithms simultaneously is about 15 % more accurate than the N-gram algorithm and about 10 % more efficient and accurate than the others algorithm. The operation of the algorithm for linear search of tags in the dictionary and the operation of the Noisy Channel algorithm using the BK-tree are also analyzed. Thanks to which it was possible to achieve significant advantages in the work algorithm, instead of a linear view of the search time, a logarithmic dependence was obtained. A system of synchronous and asynchronous methods also works. At first, the difference is not visible, but the more requests, the faster the system loads and tries to respond to them more by displaying from asynchronous methods.
The article develops a general architectural system of socialization of groups of users with similar interests and functional requirements for it. To process a large part of the information, the system is implemented using the methods of fuzzy text information search and machine learning. thus, N-gram, selection expansion and structured Noisy Channel models are applied. A feature of the implementation is the processing of the text, the analysis of words in the text and the formation of evaluations. A convolutional neural network implementation is designed to determine user authenticity based on facial photo analysis. implementation of fuzzy search algorithms – for processing text data of various volumes to analyze information about each user, form a certain user rating, compare this user with other users to promote further socialization of users whose interests coincide the most. When experimentally checking the accuracy of the developed system by determining the percentage of similarity of current users with the help of N-grams and their connections. Running these algorithms simultaneously is about 15 % more accurate than the N-gram algorithm and about 10 % more efficient and accurate than the others algorithm. The operation of the algorithm for linear search of tags in the dictionary and the operation of the Noisy Channel algorithm using the BK-tree are also analyzed. Thanks to which it was possible to achieve significant advantages in the work algorithm, instead of a linear view of the search time, a logarithmic dependence was obtained. A system of synchronous and asynchronous methods also works. At first, the difference is not visible, but the more requests, the faster the system loads and tries to respond to them more by displaying from asynchronous methods.
Description
Citation
Батюк Т. Інтелектуальна система соціалізації груп користувачів за подібними інтересами / Тарас Батюк, Вікторія Висоцька, Марина Шевченко // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2023. — № 13. — С. 93–120.