В данной работе рассматриваются различные архитектуры, ранжирующие диалоговых агентов и проводится сравнительный анализ методов их персонофикации. Персонофикация диалоговых систем частично моделирует долговременную память агента, делает его ответы более конкретными и последовательными. В работе используются свободно распространяемый набор данных «Toloka ru PersonaChat», содержащий 10 000 диалогов и 1505 персон, на русском языке, где каждый участник искусственно моделирует заданную персону. Для проведения сравнительного анализа методов персонофикации использовались различные модели ранжирующих диалоговых систем, в частности: Bi-Encoder, Poly-Encoder, CoBET и др. В рамках данного исследования был проведен анализ работы BERT и GPT представлений, различных типов токенизации и функций подобия,
Посохов П.А. (науч. рук. Махныткина О.В.) Исследование методов персонофикации ранжирующих диалоговых систем // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2022]. URL: https://kmu.itmo.ru/digests/article/7890