Личный кабинет

Статья

Алексеева Д.К. (науч. рук. Тимченко О.В.) Тонкая настройка модели автоматического распознавания речи для языков с ограниченными ресурсами
УДК тезиса: 004.89

Модели автоматического распознавания речи решают задачу преобразования устной речи в текст. Проблема распознавания речи на малоресурсных языках заключается в недостатке тренировочных датасетов и сложности сбора данных. В этих условиях для разработки ASR-систем для малоресурсных языков эффективно использование предобученных многоязычных моделей, которые можно тонко настроить для конкретного языка с использованием небольшого количества специфических данных. Для решения поставленной задачи была выбрана модель Massive Multilingual Speech для распознавания речи на кабардинском языке. В процессе эксперимента были индивидуально подобраны гиперпараметры с учётом специфики языковых транскрипций для обеспечения оптимальной точности распознавания. Была получена оценка качества работы модели.

Авторы:

Алексеева Дарья Константиновна

Руководитель:

Тимченко Ольга Викторовна

Алексеева Д.К. (науч. рук. Тимченко О.В.) Тонкая настройка модели автоматического распознавания речи для языков с ограниченными ресурсами // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15138