Личный кабинет

Статья

Гусев И.В., Пивоварова А.А. (науч. рук. Матвеев А.Ю.) Автоматическая классификация голосовых данных взрослых с нормативным и искажённым звукопроизношением: диктор-независимая оценка и кросс-языковой перенос
УДК тезиса: УДК 004.8

Работа посвящена автоматической бинарной классификации нормативной и дизартрической речи взрослых. Показано, что разбиение по записям приводит к завышенным метрикам из-за утечки дикторской информации, тогда как диктор-независимая валидация (LTSO) даёт более реалистичную оценку. Расширенный набор акустических признаков в сочетании с MLP и XGBoost повышает качество классификации. Кросс-языковые эксперименты выявили ограниченную переносимость модели без языковой адаптации.

Авторы:

Гусев Иван Владимирович

Пивоварова Анастасия Алексеевна

Руководитель:

Матвеев Антон Юрьевич

Гусев И.В., Пивоварова А.А. (науч. рук. Матвеев А.Ю.) Автоматическая классификация голосовых данных взрослых с нормативным и искажённым звукопроизношением: диктор-независимая оценка и кросс-языковой перенос // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17455