Система аналізу та розпізнавання звуків в мегаполісі
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
В сучасних мегаполісах, де шум і гам ніколи не припиняються, виникає важлива проблема розпізнавання звуків. Міста не лише є центрами економічного та культурного розвитку, але також є місцями, де життя завжди на повному ходу, а звуки різних джерел звукового забруднення несумнівно впливають на якість життя мешканців. У цьому контексті визнання та аналіз звуків у мегаполісі стає важливим завданням, яке привертає увагу науковців, інженерів та екологів. Встановлення та оцінка звуків, що оточують нас в міському оточенні, не лише допомагають зрозуміти вплив цих звуків на здоров'я та психоемоційний стан людини, але й відкривають нові перспективи для фермерства, вдосконалення міської інфраструктури, підвищення безпеки та комфорту мешканців, а також розвитку інноваційних технологій у сфері "розумних" міст.
Так, до прикладу, у військовому застосуванні дана система може виявляти перельоти ракет на низьких висотах або безпілотників, таких як Shahed 136. У фермерстві використання технологій може сприяти виявленню тварин та автоматизації заходів щодо відлякування, оскільки фермери втрачають до 35% щорічного врожаю через вплив птахів. Шпаки, горобці, голуби, горлиці та граки виявилися особливо проблемними, завдаючи шкоду культурам, таким як соняшник, кукурудза, виноград і фруктові дерева в садах. В конкретному господарстві зграя птахів може призвести до повної втрати врожаю для фермера та навіть змусити засівати поля знову чи розріджувати посіви до 15%, оскільки граки чи ворони вибирають насіння із землі [1].
У роботі описано дослідження у сфері звуку: дослідження власне звуку та моделей машинного навчання для вирішення проблеми розпізнавання звуку.
Метою роботи є розробка якомога точнішої моделі за допомогою методів машинного навчання для класифікації звуків в мегаполісі.
Об’єктом дослідження є процес розпізнавання звуку.
Було досліджено датасет та зроблено візуалізацію даних, зображено спектри звуків та їх звукові хвилі. Під час обробки даних було проведено аугментацію даних методами: додавання шуму, розтягування часу запису, масштабуванням гучності та іншими, а також проведено вилучення функій методами:
• Коефіцієнти Mel-Frequency (MFCC);
• Спектральний спад;
• Функція кольоровості;
• Спектральний центроїд;
• Спектральна смуга пропускання;
• Швидкість переходу через нуль [2].
Проведено аналіз роботи методів машинного навчання з заданими даними та на основі експерементів обрано найкращу модель. Розробка моделей відбувалась за допомогою мови програмування Python та бібліотеки SkLearn. Методи машинного навчання в досліді:
• SVC;
• ExtraTreesClassifier;
• DecisionTreeClassifier;
• QuadraticDiscriminantAnalysis;
• KNeighborsClassifier;
• RandomForestClassifier;
• MLPClassifier;
• AdaBoostClassifier [3].
Хоч всі моделі показали достатньо низький рівень розпізнавання, проте, найкращою виявився метод SVC.
Зроблено висновки чому розпізнавання показало доволі низький рівень та зроблено план дій, що потрібно зробити в майбутньому.
In modern metropolises, where the noise and bustle never stop, an important problem of sound recognition arises. Cities are not only centers of economic and cultural development, but also places where life is always in full swing, and the sounds of various sources of sound pollution undoubtedly affect the quality of life of residents. In this context, the recognition and analysis of sounds in the metropolis becomes an important task that attracts the attention of scientists, engineers and ecologists. Establishing and evaluating the sounds that surround us in the urban environment not only help to understand the impact of these sounds on the health and psycho-emotional state of a person, but also open new perspectives for farming, improving urban infrastructure, increasing the safety and comfort of residents, as well as the development of innovative technologies in the field of "smart" cities. So, for example, in a military application, this system can detect flights of missiles at low altitudes or drones such as the Shahed 136. In farming, the use of technology can help detect animals and automate deterrence measures, as farmers lose up to 35% of their annual harvest due to the impact of birds . Starlings, sparrows, pigeons, turtledoves and rooks have proved particularly problematic, damaging crops such as sunflowers, maize, grapes and fruit trees in orchards. On a particular farm, a flock of birds can result in total crop loss for a farmer and even force reseeding or thinning of crops by up to 15% as rooks or crows pick seeds from the ground [1]. The paper describes research in the field of sound: audio analysis itself and machine learning models for solving the problem of sound recognition. The aim of the work is to develop the most accurate model possible using machine learning methods for the classification of sounds in the metropolis. The object of research is the process of sound recognition. The dataset was studied and data visualization was done, sound spectra and their sound waves were depicted. During data processing, data augmentation was carried out using the following methods: adding noise, stretching the recording time, volume scaling, and others, as well as feature extraction using the following methods: • Mel-Frequency Cepstral Coefficients; • Spectral Rollof; • Chroma Feature; • Spectral Centroid; • Spectral Bandwidth; • Zero Crossing Rate. An analysis of the operation of machine learning methods with given data was carried out and the best model was chosen based on experiments. Models were developed using the Python programming language and the SkLearn library. Methods of machine learning in the experiment: • SVC; • ExtraTreesClassifier; • DecisionTreeClassifier; • Quadratic Discriminant Analysis; • KNeighborsClassifier; • RandomForestClassifier; • MLPClassifier; • AdaBoostClassifier [3]. Although all models showed a sufficiently low level of recognition, the SVC method turned out to be the best. Conclusions were made as to why the recognition showed a rather low level, and an action plan was made, what needs to be done in the future.
In modern metropolises, where the noise and bustle never stop, an important problem of sound recognition arises. Cities are not only centers of economic and cultural development, but also places where life is always in full swing, and the sounds of various sources of sound pollution undoubtedly affect the quality of life of residents. In this context, the recognition and analysis of sounds in the metropolis becomes an important task that attracts the attention of scientists, engineers and ecologists. Establishing and evaluating the sounds that surround us in the urban environment not only help to understand the impact of these sounds on the health and psycho-emotional state of a person, but also open new perspectives for farming, improving urban infrastructure, increasing the safety and comfort of residents, as well as the development of innovative technologies in the field of "smart" cities. So, for example, in a military application, this system can detect flights of missiles at low altitudes or drones such as the Shahed 136. In farming, the use of technology can help detect animals and automate deterrence measures, as farmers lose up to 35% of their annual harvest due to the impact of birds . Starlings, sparrows, pigeons, turtledoves and rooks have proved particularly problematic, damaging crops such as sunflowers, maize, grapes and fruit trees in orchards. On a particular farm, a flock of birds can result in total crop loss for a farmer and even force reseeding or thinning of crops by up to 15% as rooks or crows pick seeds from the ground [1]. The paper describes research in the field of sound: audio analysis itself and machine learning models for solving the problem of sound recognition. The aim of the work is to develop the most accurate model possible using machine learning methods for the classification of sounds in the metropolis. The object of research is the process of sound recognition. The dataset was studied and data visualization was done, sound spectra and their sound waves were depicted. During data processing, data augmentation was carried out using the following methods: adding noise, stretching the recording time, volume scaling, and others, as well as feature extraction using the following methods: • Mel-Frequency Cepstral Coefficients; • Spectral Rollof; • Chroma Feature; • Spectral Centroid; • Spectral Bandwidth; • Zero Crossing Rate. An analysis of the operation of machine learning methods with given data was carried out and the best model was chosen based on experiments. Models were developed using the Python programming language and the SkLearn library. Methods of machine learning in the experiment: • SVC; • ExtraTreesClassifier; • DecisionTreeClassifier; • Quadratic Discriminant Analysis; • KNeighborsClassifier; • RandomForestClassifier; • MLPClassifier; • AdaBoostClassifier [3]. Although all models showed a sufficiently low level of recognition, the SVC method turned out to be the best. Conclusions were made as to why the recognition showed a rather low level, and an action plan was made, what needs to be done in the future.
Description
Citation
Тчинецький С. А. Система аналізу та розпізнавання звуків в мегаполісі : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Степан Андрійович Тчинецький. — Львів, 2023. — 88 с.