Ігровий метод кластеризації онтологій

Abstract

Розглянуто актуальну проблему кластеризації онтологій для оптимізації операцій інтелектуального опрацювання даних в умовах невизначеності, зумовленої неточністю або неповнотою даних про предметну область. Кластеризація онтологій – це процес автоматичного розділення множини онтологій на групи (кластери) на основі ступеня їхньої подібності. Для розв’язування задачі кластеризації необхідно задати міри близькості онтологій, вибрати або розробити алгоритм кластеризації та виконати змістовну інтерпретацію результатів кластеризації. Для кластеризації онтологій в умовах невизначеності запропоновано застосувати стохастичний ігровий метод. Повторювальна стохастична гра полягає у реалізації керованого випадкового процесу вибору кластерів онтологій. Для цього закріплені за онтологіями інтелектуальні агенти випадково, одночасно і незалежно вибирають один із кластерів у дискретні моменти часу. Для агентів, що обрали один кластер, обчислюють поточну міру подібності онтологій, яка може враховувати близькість концептів, атрибутів та відношень між концептами. Цю міру використовують для адаптивного перерахунку змішаних стратегій гравців. Збільшуються імовірності вибору тих кластерів, поточний склад яких призвів до зростання міри подібності онтологій. У ході повторювальної гри агенти сформують вектори змішаних стратегій, які забезпечать максимізацію усереднених мір подібності розділених на кластери онтологій. Для розв'язування задачі ігрової кластеризації онтологій розроблено адаптивний марківський рекурентний метод на основі стохастичної апроксимації модифікованої умови доповняльної нежорсткості, справедливої у точках рівноваги за Нешем. Запропонований ігровий метод має фільтрувальні властивості щодо викидів у вхідних даних і практично не залежить від закону розподілу випадкових завад. Комп'ютерне моделювання підтвердило можливість застосування моделі стохастичної гри для кластеризації онтологій із врахуванням факторів невизначеності. Збіжність ігрового методу забезпечується дотриманням фундаментальних умов та обмежень стохастичної оптимізації. Достовірність експериментальних досліджень підтверджується повторюваністю отриманих результатів для різних послідовностей випадкових величин. Результати роботи доцільно використати для розв'язування задач інтелектуального аналізу даних, усунення дублювання інформації в базах знань, зменшення невизначеності у межах кластера онтологій, виявлення новизни інформації, організації високорівневої семантичної взаємодії між агентами під час розв’язування ними спільної задачі.
In this paper the important problem of ontology clustering is considered with the purpose of optimization of intelligent data processing in conditions of uncertainty caused by inaccuracy or incompleteness of data in the subject area. The clustering of ontologies is the process of automatic splitting of a set of ontologies into groups (clusters) based on their similarity degree. For the resolution of this problem it is necessary to adopt the set of measures for the affinity of ontologies, to choose or develop an algorithm of clusterization and to execute the thorough interpretation of clusterization results. For the clustering of ontologies in conditions of uncertainty, it is proposed to use a stochastic game method. A repetitive stochastic game consists in the implementation of a controlled random process for selecting clusters of ontologies. To this effect, the intelligent agents, assigned to ontology, randomly, simultaneously and independently choose one of the clusters at discrete moments of time. For agents that have selected a cluster, the current measure of similarity of ontologies is calculated, which takes into account the proximity of concepts, attributes, and relationships between concepts. This measure is used to adapt the recalculation of mixed player strategies. Thus, the probability of selection is increased for clusters having the composition, which led to the growth of the ontologies similarity degree. During the repetitive game, agents will form vectors of mixed strategies that will maximize the averaged measures of similarity to clusters of ontologies. To solve the problem of game clusterization for ontologies, an adaptive Markovian recurrent method was developed based on stochastic approximation of a modified complementary slackness condition, valid at the points of the Nash equilibrium. The proposed game method has filtering properties for spikes in the input data and practically does not depend on the law of distribution of random noises. The computer modeling confirmed the possibility of using a stochastic game model for clustering ontologies, taking into account uncertainty factors. Convergence of the game method is ensured by observing the fundamental conditions and restrictions of stochastic optimization. The reliability of experimental studies is confirmed by the repeatability of results obtained for various sequences of random variables. The results of the work could be used to solve the problems of intellectual data analysis, to eliminate duplication of information in knowledge bases, to reduce uncertainty within the cluster of ontologies, to identify the novelty of information, to organize high-level semantic interaction between agents in the course of executing their common task.

Description

Keywords

стохастична гра, умови невизначеності, кластеризація, онтологія, база знань, інтелектуальний агент, stochastic game, conditions of uncertainty, clusterization, ontology, knowledge base, intellectual agent

Citation

Кравець П. О. Ігровий метод кластеризації онтологій / П. О. Кравець, Є. В. Буров, В. В. Литвин // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — № 5. — С. 26–39.