Личный кабинет

Статья

Аникин А.А., Новоселов С.А. (науч. рук. Новоселов С.А.) Aam-sa-asr: компактная архитектура для распознавания речи с атрибуцией диктора
УДК тезиса: 004.8

В работе предложена компактная архитектура AAM-SA-ASR для автоматического распознавания речи с атрибуцией дикторов. Модель объединяет замороженный ASR-модуль и облегчённый спикерский декодер, а также использует AAM-Softmax и дистилляцию знаний. Разработан алгоритм онлайн-генерации синтетических диалогов. Решение обеспечивает сопоставимое качество при снижении вычислительных затрат.

Авторы:

Аникин Александр Алексеевич

Новоселов Сергей Александрович

Руководитель:

Новоселов Сергей Александрович

Аникин А.А., Новоселов С.А. (науч. рук. Новоселов С.А.) Aam-sa-asr: компактная архитектура для распознавания речи с атрибуцией диктора // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17577