Давыдов Д.А. (науч. рук. Столбов М.Б.) Оценка разборчивости речи с использованием нейросетевой модели
Работа посвящена реализации метода автоматической оценки разборчивости речи с применением нейросетевых моделей, ориентированных исключительно на анализ записей в условиях шума и реверберации. Основной акцент сделан на разработке модели, предназначенной для оценки качества фонограммы диктора в реальных сценариях, где речевой сигнал подвергается воздействию помех и реверберации. Описаны ключевые этапы реализации: обработка входных данных (сырой аудиопоток, спектральные характеристики), выбор метрик оценки (MSE, корреляция с экспертной разметкой) и валидация на специализированных наборах данных с имитацией шумовых артефактов.
Давыдов Д.А. (науч. рук. Столбов М.Б.) Оценка разборчивости речи с использованием нейросетевой модели // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14506