PSOBER: PSO based entity resolution
Journal Title
Journal ISSN
Volume Title
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Пов’язування об’єктів — це задача зіставлення записів у базі даних з відповідними
об’єктами. Задача пов’язування об’єктів є множиною задач через відсутність повної інформації в записах, варіантний розподіл записів для різних об’єктів, а іноді і
перекривання записів різних об’єктів. У цій роботі запропоновано метод вирішення
цієї проблеми без необхідності зовнішнього контролю. Вищезгадана задача подається
як задача про розбиття. Після цього, запропоновано методику на основі алгоритму
оптимізації для вирішення задачі пов’язування об’єктів. Запропонований підхід дозволяє визначити розподіл записів за категоріями. Порівняльний аналіз із генетичним
алгоритмом за наборами даних доводить ефективність запропонованого підходу.
Entity Resolution is the task of mapping the records within a database to their corresponding entities. The entity resolution problem presents a lot of challenges because of the absence of complete information in records, variant distribution of records for different entities and sometimes overlaps between records of different entities. In this paper, we have proposed an unsupervised method to solve this problem. The previously mentioned problem is set as a partitioning problem. Thereafter, an optimization algorithm-based technique is proposed to solve the entity resolution problem. The presented approach enables the partitioning of records across entities. A comparative analysis with the genetic algorithm over datasets proves the efficiency of the considered approach.
Entity Resolution is the task of mapping the records within a database to their corresponding entities. The entity resolution problem presents a lot of challenges because of the absence of complete information in records, variant distribution of records for different entities and sometimes overlaps between records of different entities. In this paper, we have proposed an unsupervised method to solve this problem. The previously mentioned problem is set as a partitioning problem. Thereafter, an optimization algorithm-based technique is proposed to solve the entity resolution problem. The presented approach enables the partitioning of records across entities. A comparative analysis with the genetic algorithm over datasets proves the efficiency of the considered approach.
пов’язування об’єктів, індекс валідності кластера, метод рою частинок, міра відстані, генетичний алгоритм, некерований алгоритм, entity resolution, cluster validity index, particle swarm optimization, distance measure, genetic algorithm, unsupervised algorithm
PSOBER: PSO based entity resolution / Y. Aassem, I. Hafidi, H. Khalfi, N. Aboutabit // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2021. — Vol 8. — No 4. — P. 573–583.