Тарасевич Н.С. (науч. рук. Ефимова В.А.) Метод автоматического сжатия сверточных нейронных сетей для ускорения инференса на мобильных устройствах
Работа предполагает разработку метода автоматического сжатия сверточных нейронных сетей, ориентированного на ускорение инференса на мобильных устройствах при заданных ограничениях по задержке и памяти. В отличие от подходов, оптимизирующих преимущественно число параметров или FLOPs, предлагаемый метод учитывает особенности целевого оборудования, оптимизируя не абстрактные показатели, а реальную задержку инференса на устройстве, поскольку одинаковая «степень сжатия» не гарантирует уменьшение времени выполнения на конкретном устройстве. Метод объединяет структурный прунинг каналов, селективную разреженность только в 1×1-свертках, обучение с учетом квантования (QAT), а также дистилляцию знаний для сохранения точности при агрессивной компрессии. Ключевым элементом является автоматический выбор
Тарасевич Н.С. (науч. рук. Ефимова В.А.) Метод автоматического сжатия сверточных нейронных сетей для ускорения инференса на мобильных устройствах // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/18000