Метод дедублікації та розподілу даних у хмарних сховищах під час резервного копіювання даних

dc.citation.journalTitleВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі
dc.contributor.affiliationФізико-механічний інститут імені Г. В. Карпенка НАН України
dc.contributor.affiliationНаціональний університет “Львівська політехніка”
dc.contributor.affiliationKarpenko Physico-Mechanical Institute of the NAS Ukraine
dc.contributor.affiliationLviv Polytechnic National University
dc.contributor.authorРусин, Б. П.
dc.contributor.authorПогрелюк, Л. В.
dc.contributor.authorВисоцька, В. А.
dc.contributor.authorОсипов, М. М.
dc.contributor.authorRusyn, Bohdan
dc.contributor.authorPohreliuk, Liubomyr
dc.contributor.authorVysotska, Victoria
dc.contributor.authorOsypov, Mykhailo
dc.description.abstractРозроблено інтелектуальну систему дедублікації та поширення даних у хмарних сховищах. Сформоване програмне забезпечення має зручний інтерфейс, який дає змогу створювати резервні копії та відновлювати дані. Здійснено аналітичний огляд методологічних засад дослідження, проаналізовано різні підходи до резервного копіювання даних із використанням дедублікації та розподілу даних у хмарному сховищі, висвітлено їхні переваги та недоліки. Детально розглянуто переваги та недоліки сучасних технологій дедублікації даних. Цей аналіз довів ефективність розроблення та впровадження інтелектуальної системи дедублікації та розподілу даних у хмарному сховищі. Виконано систематичний аналіз предметної області. Сформульовано мету функціонування та розвитку системи, мету та місце функціонування системи, визначено очікувані ефекти від впровадження програмного продукту. Розроблено та детально описано концептуальну модель системи. Наведено детальні діаграми прецедентів, стану переходів, послідовностей, компонентів та класів, що разом дають змогу визначити поведінку системи, встановити та сформулювати необхідні бізнес-процеси. Проаналізовано (наведено недоліки та переваги використання різних підходів) та вибрано ефективні методи розв’язання задач: гібридна дедублікація на рівні блока, розбиття даних на основі цифрового відбитка Рабіна, розподіл даних на основі хеш-значень одиниці дублювання та використання розподіленого індексу. Під час аналізу розв’язків задач вибрано мову програмування Rust для написання клієнтської частини, мову програмування Scala для серверної частини, Akka для управління розподіленими обчисленнями та Amazon S3 як хмарне зберігання. Розроблено інтелектуальну систему дедублікації та розподілу даних у хмарному сховищі, здійснено опис програмного забезпечення, розглянуто етапи роботи користувача. Проведено тестування роботи спроєктованої системи та створено кілька контрольних зразків, проаналізовано результати.
dc.description.abstractAn intellectual system of data deduplication and distribution in cloud storage facilities was developed. The resulting software has a user-friendly interface that allows you to backup and restore data. An analytical review of the methodological principles of the research is carried out, existing approaches to data backup with the use of data deduplication and distribution in cloud storage are analyzed, their advantages and disadvantages are highlighted. The advantages and disadvantages of modern data deduplication technologies are considered in details. This analysis has proved the efficiency of the design and implementation of the intellectual system of data deduplication and distribution in cloud storage. A systematic analysis of the subject domain is performed. The purpose of functioning and development of the system, purpose and place of functioning of the system is formulated, the expected effects from the introduction of the software product are determined. A conceptual model of the system has been developed and described in detail. The detailed diagrams of precedents, states of transitions, sequences, components and classes are given, which together allowed to determine the system’s behavior, to define and formulate the necessary business processes. It is analyzed the disadvantages and advantages of using different approaches and the effective methods of solving problems are selected: hybrid deduplication at the block level, data splitting on the basis of Rabin’s digital imprint, data distribution based on the hash values of the duplication units, and the use of the distributed index. During the analysis of task solutions, the Rust programming language for writing a client part, Scala programming language for the server part, Akka for distributed computing management and Amazon S3 as cloud storage are selected. The intellectual system of deduplication and distribution of data in cloud storage is developed, the software description is described, the steps for the user’s operation are considered. The testing of the work of the designed system is carried out and several control samples were given, the results are analyzed.
dc.identifier.citationМетод дедублікації та розподілу даних у хмарних сховищах під час резервного копіювання даних / Б. П. Русин, Л. В. Погрелюк, В. А. Висоцька, М. М. Осипов // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — № 6. — С. 1–12.
dc.identifier.citationenMethod of data dedublication and distribution in cloud warehouses during data backup / Bohdan Rusyn, Liubomyr Pohreliuk, Victoria Vysotska, Mykhailo Osypov // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Informatsiini systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2019. — No 6. — P. 1–12.
dc.publisherВидавництво Львівської політехніки
dc.publisherLviv Politechnic Publishing House
dc.relation.ispartofВісник Національного університету "Львівська політехніка". Інформаційні системи та мережі, 6, 2019
dc.rights.holder© Національний університет “Львівська політехніка”, 2019
dc.rights.holder© Русин Б. П., Погрелюк Л. В., Висоцька В. А., Осипов М. М., 2019
dc.subjectдедублікація даних
dc.subjectрозподіл даних
dc.subjectхмарне середовище
dc.subjectcloud computing
dc.subjectалгоритм Рабіна
dc.subjectхешування даних
dc.subjectгібридна дедублікація
dc.subjectdata deduplication
dc.subjectdata sharing
dc.subjectcloud environment
dc.subjectcloud computing
dc.subjectRabbin algorithm
dc.subjectdata hashing
dc.subjecthybrid deduplication
dc.titleМетод дедублікації та розподілу даних у хмарних сховищах під час резервного копіювання даних
dc.title.alternativeMethod of data dedublication and distribution in cloud warehouses during data backup


