Казакова С.А. (науч. рук. Рыбин С.В.) Аугментация аудиоданных на основе технологии синтеза эмоциональной речи методами глубокого обучения
Данная работа проведена в рамках НИРМА №622281 «Разработка методов и алгоритмов для мультимодального распознавания валентности высказываний и доминантности дикторов в полилогах». Рассматриваемые в обзоре методы и алгоритмы предполагается для аугментации данных в ходе создания русскоязычного датасета экспрессивных высказываний и полилогов. Объектом исследования являются публикации 2018-2022 гг., посвященные различным архитектурам синтеза экспрессивной речи и алгоритмы и методы, в них представленные. Целью работы является анализ методов экспрессивного синтеза речи с точки зрения их применимости для решения задачи аугментации сложных данных в ходе дальнейшей работы.
Казакова С.А. (науч. рук. Рыбин С.В.) Аугментация аудиоданных на основе технологии синтеза эмоциональной речи методами глубокого обучения // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/10113