Якушев А.Д. (науч. рук. Кашевник А.М.) Мультизадачная нейросетевая архитектура для непрерывной оценки валентности и возбуждения по видео лица
Представлена лёгковесная мультизадачная нейросетевая модель EffiAtt‑MTL‑VA, предназначенная для непрерывного распознавания эмоций по выражению лица. Для обучения использован сбалансированный поднабор базы AffectNet, что позволило устранить смещение распределения возбуждения. Архитектура построена на EfficientNet‑B3 с интегрированными модулями внимания CBAM и включает регрессионные ветви для оценки валентности и возбуждения. На валидационной выборке достигнуты значения CCC = 0.88 для валентности и 0.74 для возбуждения при размере модели 10.3 млн параметров.
Якушев А.Д. (науч. рук. Кашевник А.М.) Мультизадачная нейросетевая архитектура для непрерывной оценки валентности и возбуждения по видео лица // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17122