Гусев И.В., Пивоварова А.А. (науч. рук. Матвеев А.Ю.) Автоматическая классификация голосовых данных взрослых с нормативным и искажённым звукопроизношением: диктор-независимая оценка и кросс-языковой перенос
Работа посвящена автоматической бинарной классификации нормативной и дизартрической речи взрослых. Показано, что разбиение по записям приводит к завышенным метрикам из-за утечки дикторской информации, тогда как диктор-независимая валидация (LTSO) даёт более реалистичную оценку. Расширенный набор акустических признаков в сочетании с MLP и XGBoost повышает качество классификации. Кросс-языковые эксперименты выявили ограниченную переносимость модели без языковой адаптации.
Гусев И.В., Пивоварова А.А. (науч. рук. Матвеев А.Ю.) Автоматическая классификация голосовых данных взрослых с нормативным и искажённым звукопроизношением: диктор-независимая оценка и кросс-языковой перенос // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17455