С ростом использования аудио-контента возрастает актуальность задачи транскрибирования и анализа звуковых записей. Доклад рассматривает текущие методы транскрибирования, проводит сравнительный анализ сервисов, таких как Vosk, SymblAI, AssemblyAI и RevAI, и предлагает интеграцию для эффективного использования в веб-приложениях. Исследование охватывает точность транскрибирования, обработку языковых особенностей и гибкость интеграции. В результате разработана система, основанная на AssemblyAI, предоставляющая удобный интерфейс для загрузки, создания и поиска транскрипций аудио-контента.
Антоненко А.Е. (науч. рук. Болдырева Е.А.) Использование методов анализа голоса для реализации функциональности по транскрибированию // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12833