Статья

Медведев Е.Д., Меженин А.В. (науч. рук. Меженин А.В.) Методы разработки систем распознавания речи специалистов ИТ индустрии
УДК тезиса: 004.4

Приведены результаты эксперимента по качеству распознавания аудио с речью, содержащей компьютерный сленг, профессионализмы и термины из сферы информационных технологий, и сравнение данного показателя качества со средним значением качества при распознавании речи на общие тематики. Был рассмотрен принцип работы системы автоматизированного распознавания речи, ключевые элементы и метод влияния на качество распознавания. Помимо этого, для эксперимента подготовлен набор данных, содержащий аудио с речью на тематику информационных технологий. Представлен процесс подготовки данного датасета и его состав. Проведена адаптация большой языковой модели от компании Aplhacefei и сравнение результатов качества распознавания модифицированной языковой модели и исходной.

Авторы:

Медведев Егор Дмитриевич

Меженин Александр Владимирович

Руководитель:

Меженин Александр Владимирович

Медведев Е.Д., Меженин А.В. (науч. рук. Меженин А.В.) Методы разработки систем распознавания речи специалистов ИТ индустрии // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2021]. URL: https://kmu.itmo.ru/digests/article/5763