Information technology for gender recognition by voice

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки
Lviv Politechnic Publishing House

Abstract

Розпізнавання статі людини за голосом є складною проблемою в опрацюванні мовлення. Це завдання передбачає виділення значущих ознак із мовних сигналів, класифікацію їх на чоловічі чи жіночі категорії. У статті реалізовано інформаційну технологію розпізнавання статі. Спочатку записали зразки голосу, як чоловічого, так і жіночого, і визначили кепстральні коефіцієнти Mel-частоти (MFCC) як характеристики. Потім, пройшовши навчання, класифікатор опорних векторів (SVM) вивчав ці функції та оцінював їх ефективність, використовуючи показники точності, запам’ятовування та показників F1. Ці експерименти продемонстрували, що запропонована інформаційна технологія повинна досягати високої точності на тестовому наборі та точно передбачати стать мовця на основі прослуховування його голосу. Досліджено використання попередньо навчених моделей, щоб зменшити потребу у великих обсягах навчальних даних, і виявлено, що вони можуть забезпечити високу продуктивність, і потребують менше обчислень. Це дослідження підкреслює потенціал використання методів машинного навчання для розпізнавання статі за голосом і може бути поширене на інші програми опрацювання мовлення.
Gender recognition from voice is a challenging problem in speech processing. This task involves extracting meaningful features from speech signals and classifying them into male or female categories. In this article, was implemented a gender recognition system using Python programming. I first recorded voice samples from both male and female speakers and extracted Mel-frequency cepstral coefficients (MFCC) as features. Then trained, a Support Vector Machine (SVM) classifier was on these features and evaluated its performance using accuracy, precision, recall, and F1-score metrics. These experiments demonstrated that proposed system should achieve high accuracy on the test set and will accurately predict the gender of a speaker based on their voice. I also explored using pre-trained models to reduce the need for large amounts of training data and found that they can provide good performance while requiring less computation. This study highlights the potential of using machine learning techniques for gender recognition from voice and can be extended to other speech processing applications.

Description

Citation

Koshtura D. Information technology for gender recognition by voice / Koshtura Diana // Information Systems and Networks. — Lviv : Lviv Politechnic Publishing House, 2023. — No 13. — P. 350–360.

Endorsement

Review

Supplemented By

Referenced By