Личный кабинет

Статья

Тарасевич Н.С. (науч. рук. Ефимова В.А.) Метод автоматического сжатия сверточных нейронных сетей для ускорения инференса на мобильных устройствах
УДК тезиса: 004.89

Работа предполагает разработку метода автоматического сжатия сверточных нейронных сетей, ориентированного на ускорение инференса на мобильных устройствах при заданных ограничениях по задержке и памяти. В отличие от подходов, оптимизирующих преимущественно число параметров или FLOPs, предлагаемый метод учитывает особенности целевого оборудования, оптимизируя не абстрактные показатели, а реальную задержку инференса на устройстве, поскольку одинаковая «степень сжатия» не гарантирует уменьшение времени выполнения на конкретном устройстве. Метод объединяет структурный прунинг каналов, селективную разреженность только в 1×1-свертках, обучение с учетом квантования (QAT), а также дистилляцию знаний для сохранения точности при агрессивной компрессии. Ключевым элементом является автоматический выбор

Авторы:

Тарасевич Никита Сергеевич

Руководитель:

Ефимова Валерия Александровна

Тарасевич Н.С. (науч. рук. Ефимова В.А.) Метод автоматического сжатия сверточных нейронных сетей для ускорения инференса на мобильных устройствах // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/18000