Метод обмежених структур логічних дерев у задачі класифікації дискретних об’єктів
Loading...
Date
2021-10-10
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Abstract
Розглянуто проблему побудови моделі логічних дерев класифікації на підставі обмеженого методу селекції
елементарних ознак для масивів геологічних даних. Запропоновано метод апроксимації масиву реальних даних набором
елементарних ознак з фіксованим критерієм зупинки процедури розгалуження на етапі побудови дерева класифікації.
Цей підхід дає змогу забезпечити необхідну точність моделі, знизити її структурну складність та досягти потрібних
показників ефективності. Розроблено обмежений метод побудови дерев класифікації, який спрямований на добудову
тільки тих шляхів (ярусів) структури дерева класифікації, де є найбільша кількість помилок (усіх типів) класифікації.
Такий підхід до синтезу моделі розпізнавання дає можливість доволі ефективно регулювати складність (точність) моделі
дерева класифікації, що будується, причому доцільно застосовувати його в ситуаціях з обмеженнями щодо апаратних
ресурсів інформаційної системи, обмеженнями точності та структурної складності моделі, обмеженнями на структуру,
послідовність та глибину розпізнавання масиву даних навчальної вибірки. Обмежена схема синтезу дерев класифікації
дає змогу будувати моделі майже на 20 % швидше. Побудоване логічне дерево класифікації безпомилково класифікуватиме (розпізнаватиме) всю навчальну вибірку, за якою побудована модель, матиме мінімальну структуру
(структурну складність) та складатиметься із компонентів – наборів елементарних ознак як вершини конструкції,
атрибутів дерева. На підставі запропонованої модифікації методу селекції елементарних ознак розроблено програмне
забезпечення, яке дає змогу працювати з набором різнотипних прикладних задач. Запропоновано підхід до синтезу
нових моделей розпізнавання на підставі обмеженої схеми логічних дерев та вибору параметрів препрунінгу. Тобто
розроблена ефективна схема розпізнавання дискретних об’єктів на підставі покрокової оцінки і вибору наборів
атрибутів (узагальнених ознак) за відібраними шляхами в структурі дерева класифікації на кожному кроці синтезу
схеми.
The problem of constructing a model of logical classification trees based on a limited method of selecting elementary features for geological data arrays is considered. A method for approximating an array of real data with a set of elementary features with a fixed criterion for stopping the branching procedure at the stage of constructing a classification tree is proposed. This approach allows to ensure the necessary accuracy of the model, reduce its structural complexity, and achieve the necessary performance indicators. A limited method for constructing classification trees has been developed, which is aimed at completing only those paths (tiers) of the classification tree structure where there are the greatest number of errors (of all types) of classification. This approach to synthesizing the recognition model makes it possible to effectively regulate the complexity (accuracy) of the classification tree model that is being built, and it is advisable to use it in situations with restrictions on the hardware resources of the information system, restrictions on the accuracy and structural complexity of the model, restrictions on the structure, sequence and depth of recognition of the training sample data array. The limited scheme of synthesis of classification trees allows to build models almost 20 % faster. The constructed logical classification tree will accurately classify (recognize) the entire training sample that the model is based on, will have a minimal structure (structural complexity), and will consist of components – sets of elementary features as design vertices, tree attributes. Based on the proposed modification of the elementary feature selection method, software has been developed that allows working with a set of different types of applied problems. An approach to synthesizing new recognition models based on a limited logic tree scheme and selecting pre-pruning parameters is proposed. In other words, an effective scheme for recognizing discrete objects has been developed based on step-by-step evaluation and selection of sets of attributes (generalized features) based on selected paths in the classification tree structure at each stage of scheme synthesis.
The problem of constructing a model of logical classification trees based on a limited method of selecting elementary features for geological data arrays is considered. A method for approximating an array of real data with a set of elementary features with a fixed criterion for stopping the branching procedure at the stage of constructing a classification tree is proposed. This approach allows to ensure the necessary accuracy of the model, reduce its structural complexity, and achieve the necessary performance indicators. A limited method for constructing classification trees has been developed, which is aimed at completing only those paths (tiers) of the classification tree structure where there are the greatest number of errors (of all types) of classification. This approach to synthesizing the recognition model makes it possible to effectively regulate the complexity (accuracy) of the classification tree model that is being built, and it is advisable to use it in situations with restrictions on the hardware resources of the information system, restrictions on the accuracy and structural complexity of the model, restrictions on the structure, sequence and depth of recognition of the training sample data array. The limited scheme of synthesis of classification trees allows to build models almost 20 % faster. The constructed logical classification tree will accurately classify (recognize) the entire training sample that the model is based on, will have a minimal structure (structural complexity), and will consist of components – sets of elementary features as design vertices, tree attributes. Based on the proposed modification of the elementary feature selection method, software has been developed that allows working with a set of different types of applied problems. An approach to synthesizing new recognition models based on a limited logic tree scheme and selecting pre-pruning parameters is proposed. In other words, an effective scheme for recognizing discrete objects has been developed based on step-by-step evaluation and selection of sets of attributes (generalized features) based on selected paths in the classification tree structure at each stage of scheme synthesis.
Description
Keywords
логічне дерево класифікації, розпізнавання образів, класифікація, ознака, критерій розгалуження, logical classification tree, image recognition, classification, attribute, branching criterion
Citation
Повхан І. Ф. Метод обмежених структур логічних дерев у задачі класифікації дискретних об’єктів / І. Ф. Повхан // Український журнал інформаційних технологій. — Львів : Видавництво Львівської політехніки, 2021. — Том 3. — № 1. — С. 22–29.