Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма для проверки цепочки рассуждения большой языковой модели
Большие языковые модели (LLM) набирают все большую популярность, так как за последние годы показывают высокую точность в задачах генерации текстов на естественном языке. Из-за растущих возможностей работы с генерацией и обработкой текста на естественном языке в сферах финансов, медицины, СМИ, расширяется и перечень возможных угроз и атак на большие языковые модели. За последние годы эволюционировали уже известные типы атак, такие как backdoor и jailbreak атаки, а также появились новые подтипы атак, такие как атаки на цепочку размышлений (Chain-of-thoughts) и мультиагентные атаки (Multi-agent). В данной работе представлена разработка алгоритм для проверки цепочки рассуждения большой языковой модели, который будет использовать логические способности самой модели и поможет обнаружить манипули
Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма для проверки цепочки рассуждения большой языковой модели // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16207