Приведены результаты эксперимента по качеству распознавания аудио с речью, содержащей компьютерный сленг, профессионализмы и термины из сферы информационных технологий, и сравнение данного показателя качества со средним значением качества при распознавании речи на общие тематики. Был рассмотрен принцип работы системы автоматизированного распознавания речи, ключевые элементы и метод влияния на качество распознавания. Помимо этого, для эксперимента подготовлен набор данных, содержащий аудио с речью на тематику информационных технологий. Представлен процесс подготовки данного датасета и его состав. Проведена адаптация большой языковой модели от компании Aplhacefei и сравнение результатов качества распознавания модифицированной языковой модели и исходной.
Медведев Е.Д., Меженин А.В. (науч. рук. Меженин А.В.) Методы разработки систем распознавания речи специалистов ИТ индустрии // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2021]. URL: https://kmu.itmo.ru/digests/article/5763