Статья

Капуста К.Л. (науч. рук. Карпов А.А.) Анализ речевых корпусов для обучения систем распознавания русской речи
УДК тезиса: 004.522

Целью работы является анализ речевых корпусов с целью выявления наиболее адекватных из них для обучения современной нейросетевой модели распознавания речи. В анализе учавствовали открытые корпуса аннотированной русской речи, включая популярные – Open STT, Golos, Multilingual TEDx (OpenSLR). Анализ проводился по речевым материалам полученным из разных источников (видеозаписи, аудиокниги, радиоэфиры, публичные выступления, голосовые запросы и др.) с текстовыми транскрипциями созданными вручную, при помощи систем распознавания речи и принудительного выравнивания. Проведенное исследование может быть использовано для оптимизации процесса обучения систем распознавания речи на русском языке и повышения их эффективности в работе.

Авторы:

Капуста Константин Леонидович

Руководитель:

Карпов Алексей Анатольевич

Капуста К.Л. (науч. рук. Карпов А.А.) Анализ речевых корпусов для обучения систем распознавания русской речи // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/11606