Інформаційна технологія інтелектуального пошуку контенту в системах е-комерції

dc.citation.epage166
dc.citation.issue14
dc.citation.journalTitleВісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі
dc.citation.spage142
dc.contributor.affiliationНаціональний університет “Львівська політехніка”
dc.contributor.affiliationУніверситет Оснабрюка
dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.affiliationOsnabrück University
dc.contributor.authorБалуш, Ілля
dc.contributor.authorВисоцька, Вікторія
dc.contributor.authorШевченко, Марина
dc.contributor.authorБродяк, Оксана
dc.contributor.authorBalush, Illia
dc.contributor.authorVysotska, Victoria
dc.contributor.authorShevchenko, Maryna
dc.contributor.authorBrodyak, Oksana
dc.coverage.placenameЛьвів
dc.coverage.placenameLviv
dc.date.accessioned2025-09-12T07:22:11Z
dc.date.created2023-02-28
dc.date.issued2023-02-28
dc.description.abstractОписано розроблення технології інтелектуального пошуку контенту із реалізацією модуля систем е-комерції для формування списку рекомендацій постійному користувачу. Інтелектуальний пошук контенту ґрунтується на методах лінгвістичного аналізу, сучасних алгоритмах розбору і знаходження слів, рекомендаціях на основі вподобань користувачів. Основними складовими такого пошуку є парсинг текстових ланцюжків, виокремлення ключових слів, перевірка правопису, розпізнавання загальних скорочень та акронімів, семантичний аналіз тексту, пошук за релевантністю з використанням синонімів, фільтрів та сортування. Розроблено вебдодаток на базі Java і Elasticsearch з імплементацією рекомендаційної системи на основі алгоритму колаборативної фільтрації. Мета – розроблення технології інтелектуального пошуку товарів із формуванням списку рекомендацій для користувача. Об’єктом дослідження є процеси інтелектуального пошуку з можливістю генерування рекомендацій для користувачів у сфері будь- якої е-комерції без прив’язки до категоризації товару/послуг тощо. Предметом дослідження є методи та засоби інтелектуального пошуку рекомендаційних систем на основі алгоритму Collaborative Filtering для формування рекомендацій щодо товарів для користувачів, що орієнтується на загальні збіги вибору подібних користувачів. Під час експериментальної апробації розробленої системи здійснено низку пошукових запитів із NLP-алгоритмом і без, результати яких продемонстрували покращення роботи системи в межах 15–95 % залежно від ключового слова та наявності/відсутності помилок у словах пошуку. Також виконано порівняння швидкості виконання запитів з уже наявними системами. Кількість даних у сховищі може відрізнятися (похибка під час порівняння 60–70 мс). Наприклад, запит, який складається з одного або двох слів, опрацьовується значно швидше – на 20–70 мс порівняно з аналогами в таких межах. Але якщо слів три і більше, результати приблизно подібні – на 9–20 мс швидше.
dc.description.abstractThe article describes the process of developing intelligent search technology for content for the implementation of the module of e-commerce systems for forming a list of recommendations for regular users. Intelligent search of content is based on methods of linguistic analysis, modern algorithms for parsing and finding words, and recommendations based on user preferences. The main components of such a search are the parsing of text strings, the selection of keywords, the spelling check, the recognition of common abbreviations and acronyms, the semantic analysis of the text, the search by relevance with the extraction of synonyms, filters and sorting. A web application based on Java and Elasticsearch was developed with the implementation of a recommender system based on a collaborative filtering algorithm. The purpose of the work is to develop the technology of intelligent product search with the formation of a list of recommendations for the user. The object of the research is the processes of intelligent search with the possibility of generating recommendations for users in the field of any e-commerce without reference to the categorization of goods/services, etc. The subject of research is the methods and means of intelligent search of recommender systems based on the Collaborative Filtering algorithm for the formation of product recommendations for users, which is oriented on general coincidences of the choices of similar users. During the experimental testing of the developed system, a number of search queries were conducted with and without the NLP algorithm, the results of which demonstrated an improvement in system performance within the range of 15–95 % depending on the keyword and the presence/absence of errors in the search words. A comparison of the speed of execution of requests with already existing systems was also carried out. Yes, the amount of data in the storage may differ (error when comparing 60–70 ms). For example, a query that consists of 1 or 2 words will be found much faster by 20–70 ms compared to its counterparts. But for 3 and more, results are about the same – 9–20 ms faster.
dc.format.extent142-166
dc.format.pages25
dc.identifier.citationІнформаційна технологія інтелектуального пошуку контенту в системах е-комерції / Ілля Балуш, Вікторія Висоцька, Марина Шевченко, Оксана Бродяк // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2023. — № 14. — С. 142–166.
dc.identifier.citationenInformation technology intelligent search of content in e-commerce systems / Illia Balush, Victoria Vysotska, Maryna Shevchenko, Oksana Brodyak // Information Systems and Networks. — Lviv : Lviv Politechnic Publishing House, 2023. — No 14. — P. 142–166.
dc.identifier.doidoi.org/10.23939/sisn2023.14.142
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/111725
dc.language.isouk
dc.publisherВидавництво Львівської політехніки
dc.publisherLviv Politechnic Publishing House
dc.relation.ispartofВісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі, 14, 2023
dc.relation.ispartofInformation Systems and Networks, 14, 2023
dc.relation.referencesen1. Eileen Pangu. The Search Backend (2020). URL: https://eileen-code4fun.medium.com/system-design-interview-mini-google-search-6fd319cd66ca.
dc.relation.referencesen2. Traditional Database (Forward Indexes) vs Search Engines (Inverted Index) (2020). URL: https://dev.to/search?q=%28Forward%20Indexes%29%20vs%20Search%20Engines. https://dev.to/im_bhatman/introductionto-inverted-indexes-l04
dc.relation.referencesen3. Alex Franz, Thorsten Brants (2006). All Our N-gram are Belong to You, August.
dc.relation.referencesen4. David Guthrie (2017). A Closer Look at Skip-gram. NLP Research group, Department of Computer Science.
dc.relation.referencesen5. Levenshtein V. I. (1986). Binary codes with correction of dropouts, insertions and substitutions, 845–848.
dc.relation.referencesen6. Navarro Gonzalo (2006). A guided tour to approximate string matching. Department of Computer Science, University of Chile, 31–88. DOI: 10.1145/375360.375365
dc.relation.referencesen7. The Levenshtein Algorithm. Example (2021). URL: https://www.cuel.ogic.com/blog/the-levenshteinalgorithm.
dc.relation.referencesen8. Levenshtein distance (2011). URL: https://habr.com/ru/post/114997/.
dc.relation.referencesen9. Ghazanfar, Mustansar Ali; Prügel-Bennett, Adam; Szedmak, Sandor (2012). KernelMapping Recommender system algorithms. School of Electronics and Computer Science, 81–104. DOI: 10.1016/j.ins.2012.04.012
dc.relation.referencesen10. Ricci F., Rokach L., Shapira B. (2011). Introduction to Recommender Systems Handbook, Recommender Systems Handbook, Springer. Faculty of Computer Science, 32–35. DOI: 10.1007/978-0-387-85820-3_1
dc.relation.referencesen11. Linden, Gregory D., Brent Russell Smith, Nida K. Zada (2017). Automated detection and exposure of behavior-based relationships between browsable items, 40–42.
dc.relation.referencesen12. Terveen, Loren Hill (2011). Beyond Recommender Systems: Helping People Help Each Other items. University of Minnesota Twin Cities, February.
dc.relation.referencesen13. Chaitanya Belhekar. Collaborative Filtering Recommender System (2020). URL: https://medium.com/@chaitanyarb619/recommendationsystems-a-walk-trough-33587fecc195.
dc.relation.referencesen14. Introducing intelligence in relevance search (2020). URL: https://powerapps.microsoft.com/.
dc.relation.referencesen15. Robert P. Hanrahan. The IDEF Family of Methods (2020). URL: http://www.sba.oakland.edu/faculty/mathieson/mis524/resources/readings/idef/idef.html.
dc.relation.referencesen16. How search algorithms work. (2022). URL: https://www.google.com/intl/uk/search/howsearchworks/algorithms/.
dc.relation.referencesen17. DFD (2020). URL: https://habr.com/ru/company/trinion/blog/340064.
dc.relation.referencesen18. What is an Elasticsearch index? (2022). URL: https://www.elastic.co/what-is/elasticsearch.
dc.relation.referencesen19. 5 reasons to choose mysql. (2017). URL: https://dataconomy.com/2017/04/5-reasons-challenges-mysql/.
dc.relation.referencesen20. Java (2023). URL: https://techterms.com/definition/java.
dc.relation.referencesen21. Why would you choose Java programming language over others? (2008). URL: https://stackoverflow.com/questions/209555/why-would-you-choose-the-javaprogramming-language-over-others.
dc.relation.referencesen22. A Collaborative Filtering Recommendation System in Java (2022). URL: https://www.baeldung.com/java-collaborative-filtering-recommendations.
dc.relation.referencesen23. Shi, Yue; Larson, Martha; Hanjalic, Alan (2014). Collaborative filtering beyond the user-item matrix: A survey of the state of the art and future challenges. ACM Computing Surveys, 47. DOI: 10.1145/2556270
dc.relation.referencesen24. Figueroa, Alejandro; Atkinson, John (2012). Contextual Language Models for Ranking Answers to Natural Language Definition Questions. Department of Computer Sciences, Universidad de Concepcion, Concepcion, Chile, November, 528–548. DOI: 10.1111/j.1467-8640.2012.00426.x
dc.relation.referencesen25. Features in the Java language 8 (2014). URL: https://javarush.com/groups/posts/1037-osobennosti-java-8--maksimaljhnoe-rukovodstvo-chastjh-1.
dc.relation.referencesen26. Liquibase allows you to perform the following (2022). URL: https://medium.com/search?q=Liquibase.
dc.relation.referencesen27. N Gram (2020). URL: https://stackoverflow.com/questions/18193253/what-exactly-is-an-n-gram.
dc.relation.referencesen28. Raza S., Ding C. (2022). News recommender system: a review of recent progress, challenges, and opportunities. Artif. Intell. Rev., 55, 749–800. DOI: 10.1007/s10462-021-10043-x.
dc.relation.referencesen29. Zuo Y., Zeng J., Gong M., Jiao L. (2016). Tag-aware recommender systems based on deep neural networks. Neurocomputing, 204, 51–60. DOI: 10.1016/j.neucom.2015.10.134.
dc.relation.referencesen30. Lytvyn V., et. al. (2019). Design of a recommendation system based on Collaborative Filtering and machine learning considering personal needs of the user. Eastern-European Journal of Enterprise Technologies, 4(2), 6–28. DOI: 10.15587/1729-4061.2019.175507.
dc.relation.referencesen31. Balush I., Vysotska V., Albota S. (2021). Recommendation System Development Based on Intelligent Search, NLP and Machine Learning Methods. CEUR Workshop Proceedings, 584–617.
dc.relation.referencesen32. Demchuk A., Lytvyn V., Vysotska V., Dilai M. (2020). Methods and Means of Web Content Personalization for Commercial Information Products Distribution. Lecture Notes in Computational Intelligence and Decision Making, Vol. 1020. Springer, Cham. DOI: 10.1007/978-3-030-26474-1_24.
dc.relation.referencesen33. Tulashvili Y., Turbal Y., Abd Alkaleg D., Pasichnyk V., Kunanets N. (2020). The Optimal Tour Problem in Smart Tourism Recommender Systems. In IEEE 15th International Conference on Computer Sciences and Information Technologies (CSIT), Vol. 2, 246–250. DOI: 10.1109/CSIT49958.2020.9322043
dc.relation.urihttps://eileen-code4fun.medium.com/system-design-interview-mini-google-search-6fd319cd66ca
dc.relation.urihttps://dev.to/search?q=%28Forward%20Indexes%29%20vs%20Search%20Engines
dc.relation.urihttps://dev.to/im_bhatman/introductionto-inverted-indexes-l04
dc.relation.urihttps://www.cuel.ogic.com/blog/the-levenshteinalgorithm
dc.relation.urihttps://habr.com/ru/post/114997/
dc.relation.urihttps://medium.com/@chaitanyarb619/recommendationsystems-a-walk-trough-33587fecc195
dc.relation.urihttps://powerapps.microsoft.com/
dc.relation.urihttp://www.sba.oakland.edu/faculty/mathieson/mis524/resources/readings/idef/idef.html
dc.relation.urihttps://www.google.com/intl/uk/search/howsearchworks/algorithms/
dc.relation.urihttps://habr.com/ru/company/trinion/blog/340064
dc.relation.urihttps://www.elastic.co/what-is/elasticsearch
dc.relation.urihttps://dataconomy.com/2017/04/5-reasons-challenges-mysql/
dc.relation.urihttps://techterms.com/definition/java
dc.relation.urihttps://stackoverflow.com/questions/209555/why-would-you-choose-the-javaprogramming-language-over-others
dc.relation.urihttps://www.baeldung.com/java-collaborative-filtering-recommendations
dc.relation.urihttps://javarush.com/groups/posts/1037-osobennosti-java-8--maksimaljhnoe-rukovodstvo-chastjh-1
dc.relation.urihttps://medium.com/search?q=Liquibase
dc.relation.urihttps://stackoverflow.com/questions/18193253/what-exactly-is-an-n-gram
dc.rights.holder© Національний університет “Львівська політехніка”, 2023
dc.rights.holder© Балуш І. І., Висоцька В. А., Шевченко М. М., Бродяк О. Я., 2023
dc.subjectпошукова система
dc.subjectElasticsearch
dc.subjectрекомендаційні системи
dc.subjectколаборативна фільтрація
dc.subjectвебдодаток
dc.subjectпошук
dc.subjectнечіткий пошук
dc.subjectsearch engine
dc.subjectelastic search
dc.subjectreferral systems
dc.subjectcollaborative filtering
dc.subjectweb application
dc.subjectsearch
dc.subjectfuzzy search
dc.subject.udc004.9
dc.titleІнформаційна технологія інтелектуального пошуку контенту в системах е-комерції
dc.title.alternativeInformation technology intelligent search of content in e-commerce systems
dc.typeArticle

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
2023n14_Balush_I-Information_technology_intelligent_142-166.pdf
Size:
18.23 MB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
2023n14_Balush_I-Information_technology_intelligent_142-166__COVER.png
Size:
447.37 KB
Format:
Portable Network Graphics

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.91 KB
Format:
Plain Text
Description: