Аналіз алгоритму Apriori для структурованих та неструктурованих даних
Date
2017-03-28
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Abstract
Проаналізовано алгоритм Apriori як метод пошуку асоціативних правил у
структурованих та неструктурованих даних з погляду кількості знайдених правил,
швидкодії та потреб в обчислювальних ресурсах. Неструктуровані дані тісно пов’язані з
терміном Big Data. Актуальним завданням інженерії даних є виявлення ефективних
засобів опрацювання неструктурованої інформації. Для проведення обчислювальних
експериментів розроблено програмну систему, що опрацьовує дані алгоритмом Apriori,
предметною областю якої вибрано торгівлю. Така система може бути прототипом
реальної рекомендаційної системи. Програмне рішення розроблено на стеку технологій
Hadoop.
Apriori algorithm is analyzed as a search method of associative rules in structured and unstructured data in terms of the number of discovered rules, performance and requirements for computing resources. Unstructured data are closely related to the term ’Big Data’. One of the main tasks of data engineering is the detection of unstructured information processing means. There has been developed a software system to perform computational experiments that processes data using Apriori algorithm, which subject area is trade. Such system can be a prototype for real recommendation system. The software solution is developed on stack of Hadoop technology.
Apriori algorithm is analyzed as a search method of associative rules in structured and unstructured data in terms of the number of discovered rules, performance and requirements for computing resources. Unstructured data are closely related to the term ’Big Data’. One of the main tasks of data engineering is the detection of unstructured information processing means. There has been developed a software system to perform computational experiments that processes data using Apriori algorithm, which subject area is trade. Such system can be a prototype for real recommendation system. The software solution is developed on stack of Hadoop technology.
Description
Keywords
алгоритм Apriori, структуровані дані, неструктуровані дані, асоціативне правило, обсяг даних, Apriori algorithm, structured data, unstructured data, associative rule, data volume
Citation
Левус Є. В. Аналіз алгоритму Apriori для структурованих та неструктурованих даних / Є. В. Левус, Н. І. Нечипір, Ю. В. Полиняк // Вісник Національного університету «Львівська політехніка». Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2017. — № 872. — С. 62–68.