В рамках работы решались следующие четыре задачи: задача уменьшения требований к видеопамяти, в ходе которой требования к видеопамяти были сокращены до 6 ГБ; задача оптимизации запроса для LLM, в ходе которой использовались эмоциональные стимулы, изменения формата запроса и изменения наименования говорящих; задача сериализации датасета с сохранением имён участников полилога, в ходе которой были обнаружены и исправлены несоответствия данных в датасете MELD; задача добавления информации о типе личности говорящего, в ходе которой были определены типы личностей говорящих для 91% высказываний в датасете MELD. В результате работы значение F1-Weighted для датасета MELD было увеличено с 69.15% до 70.36% для задачи распознавания эмоций человека в полилоге.
Козлов М.А. (науч. рук. Махныткина О.В.) Распознавание эмоций человека в полилоге с использованием большой языковой модели // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/13475