Система аналізу споживчих переваг продуктових товарів
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Сучасний розвиток інформаційного суспільства тісно пов'язаний із потребою у зборі, обробці та передачі великих обсягів інформації, а також перетворенні інформації на товар, часто значної вартості. Це призвело до глобального переходу від індустріального суспільства до інформаційного. Виникнення Інтернету сприяло зростанню міжнародних комунікацій у різних сферах життя. Процес обробки інформації можна розглядати як технологію, подібно до обробки матеріальних ресурсів. Інформаційні технології передбачають вміння ефективно працювати з даними та обчислювальною технікою.
Проблеми узгодженості даних, швидкості виконання запитів та доступу до інформації можуть бути вирішені за допомогою технологій сховищ даних. Важливість цього полягає в необхідності швидкої аналітичної обробки інформації та ефективної організації великих обсягів даних для формування асортименту товарів в Інтернет-магазинах. Для цього використовуються методи виявлення знань у базах даних (KDD), які охоплюють етапи підготовки даних, вибору ознак, очищення, видобування знань, обробки даних та інтерпретації результатів.
Аналіз ринкового кошика є процесом виявлення типових шаблонів покупок споживачів. Цей аналіз здійснюється через обробку даних транзакцій для визначення зв'язків між продуктами. Наприклад, досліджується, які товари часто купуються разом. Результати аналізу ринкового кошика допомагають покращити асортимент товарів, їх розміщення в магазинах та збільшити обсяги продажів завдяки пропозиції супутніх товарів.
Для виконання задачі аналізу ринкової кошика використовуються асоціативні правила типу «якщо ... то ...». Наприклад, «якщо клієнт купив пиво, то, ймовірно, він купить і чіпси». Кожна покупка вважається транзакцією, на основі великої кількості яких вивчається поведінка клієнтів. Асоціативні правила дозволяють виявляти закономірності між пов'язаними подіями, а ті з них, що перевищують певний поріг підтримки, вважаються значущими.
При використанні методу зазвичай обчислюють ймовірність того, що разом з товаром A буде придбано і товар B. Цей підхід також аналізує ситуацію з іншого боку: якщо спочатку купується продукт B, то яка ймовірність того, що продукт A буде у замовленні? Більшість алгоритмів асоціативних моделей формують остаточні оцінки на основі цих двох ймовірностей. При аналізі даних особливу увагу звертають на інформацію про те, які товари є популярними у різних груп користувачів у певні періоди часу. Ця інформація дозволяє більш ефективно планувати закупівлю товарів, проводити рекламні кампанії та економити час.
Отже, розробка інформаційної системи для аналізу споживчих переваг є важливим завданням.
Мета роботи полягає в створенні інформаційної системи для аналізу споживчих переваг, що сприятиме прийняттю рішень щодо розміщення товарів. Для досягнення цієї мети були визначені такі завдання:
1. аналіз методів і засобів виявлення залежностей у даних;
2. визначення інформаційних потреб для формування асортименту товарів;
3. проектування сховища даних та перенесення даних;
4. розробка прикладної системи для аналізу споживчих переваг.
Об’єктом дослідження є процес аналізу даних споживчих переваг.
Предметом дослідження є методи виявлення залежностей у даних та асортимент товарів, базуючись на споживчих перевагах.
Наукова новизна отриманих результатів:
• Розроблено спосіб побудови транзитивних залежностей, що забезпечує одноразове проходження бази даних під час формування залежностей.
• Впровадження апріорної інформації про значущість ознак у новому методі дозволяє зменшити обсяг пошуку та час на вилучення правил, а також скоротити кількість отриманих правил.
Практичне значення отриманих результатів: На основі запропонованого методу створено програмне забезпечення, яке дозволяє витягувати численні асоціативні правила і вирішувати практичні задачі. Розроблене програмне забезпечення готове до використання в торгових центрах.
The modern development of the information society is closely linked to the need for collecting, processing, and transmitting large volumes of information, as well as transforming information into a commodity, often of significant value. This has led to a global transition from an industrial society to an information society. The emergence of the Internet has fostered the growth of international communications in various spheres of life. The information processing process can be viewed as a technology, similar to the processing of material resources. Information technology entails the ability to work effectively with data and computing equipment. Problems of data consistency, query execution speed, and access to information can be addressed through data warehouse technologies. The importance of this lies in the need for quick analytical processing of information and efficient organization of large volumes of data for forming the assortment of products in online stores. For this purpose, Knowledge Discovery in Databases (KDD) methods are used, covering stages such as data preparation, feature selection, cleaning, knowledge extraction, data processing, and result interpretation. Market basket analysis is the process of identifying typical consumer purchasing patterns. This analysis is performed by processing transaction data to determine relationships between products. For example, it is studied which products are often purchased together. The results of market basket analysis help improve the assortment of products, their placement in stores, and increase sales volumes by offering complementary goods. To perform market basket analysis, associative rules of the "if... then..." type are used. For example, "if a customer buys beer, they are likely to buy chips as well." Each purchase is considered a transaction, and customer behavior is studied based on a large number of such transactions. Associative rules allow identifying patterns between related events, and those that exceed a certain support threshold are considered significant. When using this method, the probability that product B will be purchased along with product A is usually calculated. This approach also analyzes the situation from another perspective: if product B is purchased first, what is the likelihood that product A will be in the order? Most associative model algorithms form final estimates based on these two probabilities. In data analysis, special attention is paid to information about which products are popular among different user groups at specific times. This information allows for more effective product purchasing planning, conducting advertising campaigns, and saving time. Thus, the development of an information system for analyzing consumer preferences is an important task. The aim of the work is to create an information system for analyzing consumer preferences that will facilitate decision-making regarding product placement. To achieve this goal, the following tasks have been identified: 1. Analysis of methods and tools for detecting dependencies in data; 2. Determining information needs for forming the assortment of products; 3. Designing a data warehouse and data transfer; 4. Developing an application system for analyzing consumer preferences. The object of the research is the process of analyzing consumer preference data. The subject of the research is the methods for detecting dependencies in data and the product assortment based on consumer preferences. Scientific novelty of the obtained results: • A method for constructing transitive dependencies has been developed, ensuring a single pass through the database during dependency formation. • Implementing prior information about the significance of features in the new method allows reducing the search volume and the time required for rule extraction, as well as decreasing the number of obtained rules. Practical significance of the obtained results: Based on the proposed method, software has been created that allows extracting numerous associative rules and solving practical problems. The developed software is ready for use in shopping centers.
The modern development of the information society is closely linked to the need for collecting, processing, and transmitting large volumes of information, as well as transforming information into a commodity, often of significant value. This has led to a global transition from an industrial society to an information society. The emergence of the Internet has fostered the growth of international communications in various spheres of life. The information processing process can be viewed as a technology, similar to the processing of material resources. Information technology entails the ability to work effectively with data and computing equipment. Problems of data consistency, query execution speed, and access to information can be addressed through data warehouse technologies. The importance of this lies in the need for quick analytical processing of information and efficient organization of large volumes of data for forming the assortment of products in online stores. For this purpose, Knowledge Discovery in Databases (KDD) methods are used, covering stages such as data preparation, feature selection, cleaning, knowledge extraction, data processing, and result interpretation. Market basket analysis is the process of identifying typical consumer purchasing patterns. This analysis is performed by processing transaction data to determine relationships between products. For example, it is studied which products are often purchased together. The results of market basket analysis help improve the assortment of products, their placement in stores, and increase sales volumes by offering complementary goods. To perform market basket analysis, associative rules of the "if... then..." type are used. For example, "if a customer buys beer, they are likely to buy chips as well." Each purchase is considered a transaction, and customer behavior is studied based on a large number of such transactions. Associative rules allow identifying patterns between related events, and those that exceed a certain support threshold are considered significant. When using this method, the probability that product B will be purchased along with product A is usually calculated. This approach also analyzes the situation from another perspective: if product B is purchased first, what is the likelihood that product A will be in the order? Most associative model algorithms form final estimates based on these two probabilities. In data analysis, special attention is paid to information about which products are popular among different user groups at specific times. This information allows for more effective product purchasing planning, conducting advertising campaigns, and saving time. Thus, the development of an information system for analyzing consumer preferences is an important task. The aim of the work is to create an information system for analyzing consumer preferences that will facilitate decision-making regarding product placement. To achieve this goal, the following tasks have been identified: 1. Analysis of methods and tools for detecting dependencies in data; 2. Determining information needs for forming the assortment of products; 3. Designing a data warehouse and data transfer; 4. Developing an application system for analyzing consumer preferences. The object of the research is the process of analyzing consumer preference data. The subject of the research is the methods for detecting dependencies in data and the product assortment based on consumer preferences. Scientific novelty of the obtained results: • A method for constructing transitive dependencies has been developed, ensuring a single pass through the database during dependency formation. • Implementing prior information about the significance of features in the new method allows reducing the search volume and the time required for rule extraction, as well as decreasing the number of obtained rules. Practical significance of the obtained results: Based on the proposed method, software has been created that allows extracting numerous associative rules and solving practical problems. The developed software is ready for use in shopping centers.
Description
Keywords
Citation
Серватяк М. В. Система аналізу споживчих переваг продуктових товарів : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Максим Віталійович Серватяк. — Львів, 2024. — 78 с.