Личный кабинет

Статья

< Назад

IX Конгресс молодых ученых (ОНЛАЙН ФОРМАТ)

Трансляционные информационные технологии / Биометрические системы

Газизуллина А.Р. (науч. рук. Новоселов С.А.) Улучшение качества текстонезависимого распознавания диктора

УДК тезиса: 004.934

Распознавание диктора по индивидуальным акустическим характеристикам его голоса является задачей применимой в сферах информационной безопасности, процессах связанных с высоким уровнем защищенности. Голос является уникальным для каждого человека, что делает его идеальным элементом для идентификации. Однако современные метода верификации по голосу имеют не маленький доверительный интервал и следовательно требуют улучшений точности. В данной работе мы подходим к решению задачи построения модели распознавания диктора по голосу со стороны перехода от алгоритмов с лидирующей точность реализованных во фреймворке Kaldi к их реализации в Pytorch. Нами было принято взять за основу исследований архитектуру X-векторов так как она дает наиболее стабильную картину точности распознавания диктора.

Авторы:

Газизуллина Алиса Рустамовна

Руководитель:

Новоселов Сергей Александрович

Скачать файл

Газизуллина А.Р. (науч. рук. Новоселов С.А.) Улучшение качества текстонезависимого распознавания диктора // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2020]. URL: https://kmu.itmo.ru/digests/article/4219