Мосунов К.Д. (науч. рук. Шуранов Е.В.) Оптимизация вычислений в нейронных сетях архитектуры "Трансформер" для задачи информационного поиска
Исследования выполнены за счет финансирования университета ИТМО в рамках НИР № 622282 «Разработка русскоязычного персонифицированного диалогового агента с динамической долгосрочной памятью». В ходе проведения исследований рассматриваются различные открытые движки оптимизированного исполнения моделей-трансформеров, а также алгоритмы построения векторных индексов с применением сжатия векторов или же без него и проведено сравнение их эффективности.
Мосунов К.Д. (науч. рук. Шуранов Е.В.) Оптимизация вычислений в нейронных сетях архитектуры "Трансформер" для задачи информационного поиска // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/11178