Statistical analysis of three new measures of relevance redundancy and complementarity

Abstract

Дискримінантний аналіз є частиною статистичного навчання; його мета полягає в тому, щоб розділити класи, визначені апріорі в популяції, і передбачає прогнозування класу заданих точок даних. Дискримінантний аналіз застосовується в різних областях, таких як розпізнавання образів, мікрочипи ДНК тощо. В останні роки проблема дискримінації залишається складною задачею, якій приділяється все більше уваги, особливо для масивів даних великої вимірності. Дійсно, у такому разі необхідний вибір ознак, що передбачає використання критеріїв релевантності, надмірності та комплементарності пояснювальних змінних. Метою цієї статті є представити аналіз трьох нових критеріїв, запропонованих у цьому сенсі, точніше, на основі аналізу основних компонентів вдалося досягнути подвійної мети: вивчити гармонію цих трьох критеріїв, а також візуалізувати клас змінних–кандидатів для більш поглибленого вибору на додаток до усунення шумових змінних у дискримінантній моделі.
Discriminant analysis is part of statistical learning; its goal is to separate classes defined a priori on a population and involves predicting the class of given data points. Discriminant analysis is applied in various fields such as pattern recognition, DNA microarray etc. In recent years, the discrimination problem remains a challenging task that has received increasing attention, especially for high-dimensional data sets. Indeed, in such a case, the feature selection is necessary, which implies the use of criteria of relevance, redundancy and complementarity of explanatory variables. The aim of this paper is to present an analysis of three new criteria proposed in this sense, more precisely based on the Principal Component Analysis we have been able to achieve a double objective: that of studying the harmony of these three criteria and also visualizing the class of candidate variables for a more in-depth selection in addition to eliminating the noise variables in a discriminant model.

Description

Citation

El Mourtji B. Statistical analysis of three new measures of relevance redundancy and complementarity / B. El Mourtji, H. Chamlal, T. Ouaderhman // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2023. — Vol 10. — No 3. — P. 651–659.

Endorsement

Review

Supplemented By

Referenced By