Browsing by Author "Жигайло, Ярослав Олегович"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item Cимуляція природнього мовлення з використанням ансамблю нейронних мереж tacotron2(Національний університет «Львівська політехніка», 2022) Жигайло, Ярослав Олегович; Національний університет «Львівська політехніка»Бакалаврська кваліфікаційна робота виконана студентом групи КН-410 Жигайлом Ярославом Олеговичем. Тема «Cимуляція природнього мовлення з використанням ансамблю нейронних мереж tacotron2». Робота направлена на здобуття ступеня бакалавр за спеціальністю 122 «Комп’ютерні науки». Метою дипломної роботи є розроблення та описання програмного забезпечення, здатного синтезувати правдоподібні зразки людського мовлення на основі тренувальних зразків, а також, тестування отриманої системи шляхом штучного зашумлення тренувальних зразків з метою вивченя впливу шуму на загальну якість роботи та пошуку методів усунення даного впливу за його присутності. Об’єктом дослідження є процес генерації природнього мовлення людини з урахуванням унікальності тональностей, тонів, пауз та інших особливостей. Предметом дослідження є ансамбль нейронних мереж «tacotron2», що є використаним для синтезу природнього мовлення. Загальний обсяг роботи: 59 сторінок, 32 рисунки, 20 посилань. Bachelor's qualification work performed by KN-410 student Zhyhailo Yaroslav. Topic "Simulation of natural speech using the ensemble of neural networks tacotron2". The work's aim is to obtain a bachelor's degree in 122 "Computer Science". The thesis aims to develop and describe software capable of synthesizing plausible human speech samples based on training samples and testing the system by artificial noise of training samples to study the impact of noise on overall quality and find ways to eliminate this impact in its presence. The object of research is the process of natural speech generation, taking into account the uniqueness of tonalities, tones, pauses, and other features. The subject of the study is the ensemble of neural networks "tacotron2", which is used for the synthesis of natural speech. A total volume of work: 59 pages, 32 figures, and 20 links.