Алексеева Д.К. (науч. рук. Тимченко О.В.) Тонкая настройка модели автоматического распознавания речи для языков с ограниченными ресурсами
Модели автоматического распознавания речи решают задачу преобразования устной речи в текст. Проблема распознавания речи на малоресурсных языках заключается в недостатке тренировочных датасетов и сложности сбора данных. В этих условиях для разработки ASR-систем для малоресурсных языков эффективно использование предобученных многоязычных моделей, которые можно тонко настроить для конкретного языка с использованием небольшого количества специфических данных. Для решения поставленной задачи была выбрана модель Massive Multilingual Speech для распознавания речи на кабардинском языке. В процессе эксперимента были индивидуально подобраны гиперпараметры с учётом специфики языковых транскрипций для обеспечения оптимальной точности распознавания. Была получена оценка качества работы модели.
Алексеева Д.К. (науч. рук. Тимченко О.В.) Тонкая настройка модели автоматического распознавания речи для языков с ограниченными ресурсами // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15138