Рекомендаційна система по підбору навчального медіа-контенту
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
В роботі розглянуто основний метод впровадження рекомендаційної системи. Описано їх функції в системі з рекомендаційною логікою та принципами сучасних методів фільтрації інформації.
Системи з рекомендаційною логікою функціонально корисні як користувачам послуг, так і їх постачальникам, оскільки вони мінімізують транзакційні витрати на збір та пошук інформації [1]. Враховуючи доволі тривалий час існування рекомендаційних систем, можна сказати, що вони також покращують процес прийняття рішень та якість отриманих результатів. Найчастіше такі системи використовуються в електронній комерції, збільшуючи доходи організації. Такі система оперують даними з профілю користувача, щоб мати можливість прогнозувати, чи буде корисним той чи інший елемент користувачу [2].
Системи рекомендацій використовуються в різних сферах, надаючи різноманітний контент: новини, фільми, музику, наукові статті, книги, соціальні теги й продукти. Також існують системи рекомендацій для професіоналів, авторів, гумору, ресторанів, фінансових послуг, одягу, страхування життя чи медичного страхування, онлайн-знайомств та сторінок у Facebook чи інших соціальних мережах.
Проаналізовано проблеми та можливі шляхи розробки таких систем. Було здійснено системний аналіз об’єкту дослідження та предметної області. Побудовано дерево рішень з якого визначено основні критерії якості: доступність, зручність у користуванні, функціональність, гнучкість, надійність. Саме завдяки критеріям якості, скориставшись методом аналізу ієрархій було визначено тип інформаційної системи. В результаті виконання системного аналізу було побудовано діаграми варіантів використання, класів, послідовності, станів діяльності та розгортання системи.
Основною ціллю проекту є створення системи, яка може спростити відбір освітнього медіа-контенту та звести цей процес до безпосереднього використання готових компонентів системи для роботи. Вхідними даними в систему буде інформація аутентифікації та параметри пошуку. Якщо система знайде новий медіаконтент, вхідними даними будуть фактичний медіаконтент та його характеристики. Вихідні дані включатимуть інформаційний запит, що відображає потреби користувачів. Розроблена система повинна забезпечувати користувачам навігацію всіма доступними ресурсами та відображати відповідну інформацію.
Наступним етапом був аналіз інформаційного наповнення сховища даних для функціонування системи. Побудовано логічну модель бази даних, що зберігатиме дані про користувачів та медіа-контент.
В розділі «Методи та засоби вирішення завдання» були переглянуті та проаналізовані існуючі методи рекомендацій та обрано метод спільної фільтрації, який реалізовується через єдиний розклад матриці налаштувань відео користувача системи.
Інформаційна область системи спільної фільтрації складається з користувачів, які висловлюють свої вподобання до різних відео [3]. Оцінки (переваги) зазвичай представлені у вигляді трійки (користувачі, відео, огляди). Системи рекомендацій зазвичай використовують критерії оцінки, наприклад 0-5 зірок. Множина всіх оцінених трійок утворює розріджену матрицю, яку називають матрицею оцінки. Пари (користувач, відео), де користувач не оцінив відео, є невідомими значеннями цієї матриці.
У рамках даної роботи для реалізації методу сингулярної матричної факторізації використовується функція svds() бібліотеки SciPy [4]. Вона формує розріджену матрицю рейтингів відео, створених користувачами системи. Розрідженість матриці означає, що у великій кількості відео кожен користувач отримує лише невелику частину відео, тому більшість значень у матриці порожні. Після обробки вхідних даних функція svds() повертає матрицю, яка містить приблизне оцінене значення прогнозу для кожного відео, заповнюючи пропуски в матриці. Потім, відповідно до користувача, який надіслав запит на рекомендацію щодо розрахунку (авторизований на веб-сайті), щоб отримати прогнозовані дані рейтингу, набір результатів формує відсортований зразок ідентифікатора відео користувача (від найкращого до найгіршого) та готує список URL-адрес цих відео щоб відобразити їх на рекомендованій сторінці веб-інтерфейсу.
У третьому розділі також визначається та здійснюється перевірка методу побудови архітектури системи, проектується та розробляється архітектура інтелектуальної системи вибору вмісту на стороні клієнта. Розроблено структуру системи, а також детально описані її компоненти та використання. Описано системну інтеграцію із сторонніми системами та механізм внутрішньої взаємодії компонентів системи.
В розділі практичної реалізації описано процес розробки інформаційної системи, яка реалізована як веб-додаток, а основним інструментом для її реалізації є веб-фреймворк Django. Доступ до програми можна отримати через будь-який сучасний веб-браузер. У цій роботі доступ до програми здійснюється через локально налаштований веб-сервер.
Програма може працювати на кількох веб-сторінках, де користувачі можуть вводити реєстраційні та авторизаційні дані, пошукові запити відео та оцінки. Останнім кроком у використанні програми є відображення списку рекомендованих відео для авторизованих користувачів.
Останній розділ кваліфікаційної роботи присв’ячений впровадженню рекомендаційної системи по підбору навчального медіа-контенту з точки зору економіки. Обраховано кошторис розроблення системи. Визначено показники якості системи та зроблено порівняльний аналіз з аналогом проектованої системи, визначено комплексний показник якості. На основі комплексного показника якості та цін споживання аналогу і проектованого рішення вирахувано показник конкурентноспроможності.
Об’єкт дослідження: процес пошуку навчального медіа-контенту.
Предмет дослідження: інформаційна технологія підбору навчального медіа-контенту.
Мета дослідження: розробити рекомендаційний інформаційний сервіс підбору навчальних відео матеріалів.
В результаті проведених досліджень була розроблена рекомендаційна інформаційна система для відбору навчального медіа-контенту призначена для пошуку релевантних відео для користувачів системи. Відбір відеороликів здійснюється на основі методу спільної фільтрації та алгоритму матричної декомпозиції, який обробляє дані та надає список пов’язаного медіа-контенту для перегляду конкретним користувачам.
Здійснено експертне оцінювання та аналіз факторів зовнішнього та внутрішнього середовищ. Проаналізовано бюджетування та економічну оцінку розробки продукту. Він має власну позитивну оцінку та принесе позитивний чистий дохід.
The primary method of implementing the recommendation system is considered in work. Their functions in the system with the recommended logic and principles of modern information filtering methods are described. Systems with recommendation logic are functionally helpful for both service users and their providers, as they minimize the transaction costs of collecting and retrieving information [1]. Given the relatively long existence of recommendation systems, it can be said that they also improve the decision-making process and the quality of the results obtained. Such methods are often used in e-commerce, increasing the organization's revenue. Such systems operate on user profile data to be able to predict whether a particular element will be helpful to the user [2]. Guidance systems are used in various fields, providing different content: news, movies, music, scientific articles, books, social tags, and products. There are also referral systems for professionals, authors, humor, restaurants, financial services, clothing, medical or life insurance, online dating, Facebook, and other social networking sites. Problems and possible ways of developing such systems are analyzed. A systematic analysis of the object of study and the subject area was performed. The tree of decisions from which the essential quality criteria are defined is constructed: availability, convenience in use, functionality, flexibility, reliability. Thanks to the quality criteria, the type of information system were determined using the hierarchy analysis method. As a result of the system analysis, diagrams of usage options, classes, sequences, activity states, and system deployments were constructed. The project's primary goal is to create a system that can simplify the selection of educational media content and reduce this process to the direct use of ready-made components of the system for work. The input to the system will be authentication information and search parameters. If the system finds new media content, the input will be the actual media content and its characteristics. The source data will include any information request that reflects the users' needs. The developed system should provide users with navigation of all available resources and display relevant information. The next step was to analyze the information content of the data warehouse for the operation of the system. A logical database model has been built to store user data and media content. In the section "Methods and tools for solving the problem," the existing recommendations methods were reviewed and analyzed. The form of collaborative filtering was chosen, which is implemented through a single schedule of the video user settings matrix of the system user. The information area of the shared filtering system consists of users who express their preferences for different videos [3]. Ratings (benefits) are usually presented in the form of the trinity (users, videos, reviews). Recommendation systems typically use evaluation criteria, such as 0-5 stars. The set of all estimated triplets forms a sparse matrix called the estimation matrix. Pairs (user, video) where the user did not rate the video are unknown values of this matrix. In the framework of this work, the svds() function of the SciPy library is used to implement the method of singular matrix factorization [4]. It forms a disparate matrix of video ratings created by user systems. Matrix diversity means that a large amount of each user's video lacks most of the video, meaning that significant values in the matrix are empty. After processing the input, the svds () function returns a matrix that contains the approximate estimated prediction value for each video, filling in the gaps in the matrix. Then, according to the user who submitted a calculation recommendation request (authorized on the website) to get a predicted rating, the result set generates a sorted user ID (best to worst) and receives a list of the URLs of those videos to display them on the recommended web interface page. The third section also defines and verifies the method of building the system architecture, designs and develops the architecture of the intelligent content selection system on the client-side. The system's structure is developed, and its components and uses are described in detail. System integration with third-party systems and the mechanism of internal interaction of system components are described. The section of practical implementation describes the process of developing an information system, which is implemented as a web application, and the main tool for its implementation is the Django web framework. You can access the program through any modern web browser. The program is accessed through a locally configured web server in this work. The program can run on multiple web pages, where users can enter registration and authorization data, video searches, and ratings. The last step in using the program is to display a list of recommended videos for authorized users. The last section of the qualification work is devoted to introducing a recommendation system for the selection of educational media content from an economic point of view. The estimate of system development is calculated. The quality indicators of the system are determined, and the comparative analysis with the analog of the designed system is made, the complex quality indicator is determined. Based on a comprehensive hand of quality and consumption prices of the analog and the developed solution, the indicator of competitiveness is calculated. Study object: the process of finding educational media content.Предмет дослідження: інформаційна технологія підбору навчального медіа-контенту. Goal of research: to develop a recommendation information service for the selection of educational videos. As a result of the research, a recommendation information system was developed for the selection of educational media content designed to search for relevant videos for users of the system. Videos are selected based on a shared filtering method and a matrix decomposition algorithm that processes data and provides a list of related media content for viewing by specific users. Expert assessment and analysis of external and internal factors have been carried out. Budgeting and economic evaluation of product development are analyzed. It has its positive review and will bring a positive net income.
The primary method of implementing the recommendation system is considered in work. Their functions in the system with the recommended logic and principles of modern information filtering methods are described. Systems with recommendation logic are functionally helpful for both service users and their providers, as they minimize the transaction costs of collecting and retrieving information [1]. Given the relatively long existence of recommendation systems, it can be said that they also improve the decision-making process and the quality of the results obtained. Such methods are often used in e-commerce, increasing the organization's revenue. Such systems operate on user profile data to be able to predict whether a particular element will be helpful to the user [2]. Guidance systems are used in various fields, providing different content: news, movies, music, scientific articles, books, social tags, and products. There are also referral systems for professionals, authors, humor, restaurants, financial services, clothing, medical or life insurance, online dating, Facebook, and other social networking sites. Problems and possible ways of developing such systems are analyzed. A systematic analysis of the object of study and the subject area was performed. The tree of decisions from which the essential quality criteria are defined is constructed: availability, convenience in use, functionality, flexibility, reliability. Thanks to the quality criteria, the type of information system were determined using the hierarchy analysis method. As a result of the system analysis, diagrams of usage options, classes, sequences, activity states, and system deployments were constructed. The project's primary goal is to create a system that can simplify the selection of educational media content and reduce this process to the direct use of ready-made components of the system for work. The input to the system will be authentication information and search parameters. If the system finds new media content, the input will be the actual media content and its characteristics. The source data will include any information request that reflects the users' needs. The developed system should provide users with navigation of all available resources and display relevant information. The next step was to analyze the information content of the data warehouse for the operation of the system. A logical database model has been built to store user data and media content. In the section "Methods and tools for solving the problem," the existing recommendations methods were reviewed and analyzed. The form of collaborative filtering was chosen, which is implemented through a single schedule of the video user settings matrix of the system user. The information area of the shared filtering system consists of users who express their preferences for different videos [3]. Ratings (benefits) are usually presented in the form of the trinity (users, videos, reviews). Recommendation systems typically use evaluation criteria, such as 0-5 stars. The set of all estimated triplets forms a sparse matrix called the estimation matrix. Pairs (user, video) where the user did not rate the video are unknown values of this matrix. In the framework of this work, the svds() function of the SciPy library is used to implement the method of singular matrix factorization [4]. It forms a disparate matrix of video ratings created by user systems. Matrix diversity means that a large amount of each user's video lacks most of the video, meaning that significant values in the matrix are empty. After processing the input, the svds () function returns a matrix that contains the approximate estimated prediction value for each video, filling in the gaps in the matrix. Then, according to the user who submitted a calculation recommendation request (authorized on the website) to get a predicted rating, the result set generates a sorted user ID (best to worst) and receives a list of the URLs of those videos to display them on the recommended web interface page. The third section also defines and verifies the method of building the system architecture, designs and develops the architecture of the intelligent content selection system on the client-side. The system's structure is developed, and its components and uses are described in detail. System integration with third-party systems and the mechanism of internal interaction of system components are described. The section of practical implementation describes the process of developing an information system, which is implemented as a web application, and the main tool for its implementation is the Django web framework. You can access the program through any modern web browser. The program is accessed through a locally configured web server in this work. The program can run on multiple web pages, where users can enter registration and authorization data, video searches, and ratings. The last step in using the program is to display a list of recommended videos for authorized users. The last section of the qualification work is devoted to introducing a recommendation system for the selection of educational media content from an economic point of view. The estimate of system development is calculated. The quality indicators of the system are determined, and the comparative analysis with the analog of the designed system is made, the complex quality indicator is determined. Based on a comprehensive hand of quality and consumption prices of the analog and the developed solution, the indicator of competitiveness is calculated. Study object: the process of finding educational media content.Предмет дослідження: інформаційна технологія підбору навчального медіа-контенту. Goal of research: to develop a recommendation information service for the selection of educational videos. As a result of the research, a recommendation information system was developed for the selection of educational media content designed to search for relevant videos for users of the system. Videos are selected based on a shared filtering method and a matrix decomposition algorithm that processes data and provides a list of related media content for viewing by specific users. Expert assessment and analysis of external and internal factors have been carried out. Budgeting and economic evaluation of product development are analyzed. It has its positive review and will bring a positive net income.
Description
Keywords
Citation
Щепанська С. А. Рекомендаційна система по підбору навчального медіа-контенту : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.01 — Системи і методи прийняття рішень“ / Софія Андріївна Щепанська. — Львів, 2021. — 99 с.