Інформаційна технологія інтелектуального пошуку контенту в системах е-комерції

Abstract

Описано розроблення технології інтелектуального пошуку контенту із реалізацією модуля систем е-комерції для формування списку рекомендацій постійному користувачу. Інтелектуальний пошук контенту ґрунтується на методах лінгвістичного аналізу, сучасних алгоритмах розбору і знаходження слів, рекомендаціях на основі вподобань користувачів. Основними складовими такого пошуку є парсинг текстових ланцюжків, виокремлення ключових слів, перевірка правопису, розпізнавання загальних скорочень та акронімів, семантичний аналіз тексту, пошук за релевантністю з використанням синонімів, фільтрів та сортування. Розроблено вебдодаток на базі Java і Elasticsearch з імплементацією рекомендаційної системи на основі алгоритму колаборативної фільтрації. Мета – розроблення технології інтелектуального пошуку товарів із формуванням списку рекомендацій для користувача. Об’єктом дослідження є процеси інтелектуального пошуку з можливістю генерування рекомендацій для користувачів у сфері будь- якої е-комерції без прив’язки до категоризації товару/послуг тощо. Предметом дослідження є методи та засоби інтелектуального пошуку рекомендаційних систем на основі алгоритму Collaborative Filtering для формування рекомендацій щодо товарів для користувачів, що орієнтується на загальні збіги вибору подібних користувачів. Під час експериментальної апробації розробленої системи здійснено низку пошукових запитів із NLP-алгоритмом і без, результати яких продемонстрували покращення роботи системи в межах 15–95 % залежно від ключового слова та наявності/відсутності помилок у словах пошуку. Також виконано порівняння швидкості виконання запитів з уже наявними системами. Кількість даних у сховищі може відрізнятися (похибка під час порівняння 60–70 мс). Наприклад, запит, який складається з одного або двох слів, опрацьовується значно швидше – на 20–70 мс порівняно з аналогами в таких межах. Але якщо слів три і більше, результати приблизно подібні – на 9–20 мс швидше.
The article describes the process of developing intelligent search technology for content for the implementation of the module of e-commerce systems for forming a list of recommendations for regular users. Intelligent search of content is based on methods of linguistic analysis, modern algorithms for parsing and finding words, and recommendations based on user preferences. The main components of such a search are the parsing of text strings, the selection of keywords, the spelling check, the recognition of common abbreviations and acronyms, the semantic analysis of the text, the search by relevance with the extraction of synonyms, filters and sorting. A web application based on Java and Elasticsearch was developed with the implementation of a recommender system based on a collaborative filtering algorithm. The purpose of the work is to develop the technology of intelligent product search with the formation of a list of recommendations for the user. The object of the research is the processes of intelligent search with the possibility of generating recommendations for users in the field of any e-commerce without reference to the categorization of goods/services, etc. The subject of research is the methods and means of intelligent search of recommender systems based on the Collaborative Filtering algorithm for the formation of product recommendations for users, which is oriented on general coincidences of the choices of similar users. During the experimental testing of the developed system, a number of search queries were conducted with and without the NLP algorithm, the results of which demonstrated an improvement in system performance within the range of 15–95 % depending on the keyword and the presence/absence of errors in the search words. A comparison of the speed of execution of requests with already existing systems was also carried out. Yes, the amount of data in the storage may differ (error when comparing 60–70 ms). For example, a query that consists of 1 or 2 words will be found much faster by 20–70 ms compared to its counterparts. But for 3 and more, results are about the same – 9–20 ms faster.

Description

Citation

Інформаційна технологія інтелектуального пошуку контенту в системах е-комерції / Ілля Балуш, Вікторія Висоцька, Марина Шевченко, Оксана Бродяк // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2023. — № 14. — С. 142–166.

Endorsement

Review

Supplemented By

Referenced By