Личный кабинет

Статья

Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма для проверки цепочки рассуждения большой языковой модели
УДК тезиса: 004.056

Большие языковые модели (LLM) набирают все большую популярность, так как за последние годы показывают высокую точность в задачах генерации текстов на естественном языке. Из-за растущих возможностей работы с генерацией и обработкой текста на естественном языке в сферах финансов, медицины, СМИ, расширяется и перечень возможных угроз и атак на большие языковые модели. За последние годы эволюционировали уже известные типы атак, такие как backdoor и jailbreak атаки, а также появились новые подтипы атак, такие как атаки на цепочку размышлений (Chain-of-thoughts) и мультиагентные атаки (Multi-agent). В данной работе представлена разработка алгоритм для проверки цепочки рассуждения большой языковой модели, который будет использовать логические способности самой модели и поможет обнаружить манипули

Авторы:

Гаврилова Вероника Викторовна

Руководитель:

Менщиков Александр Алексеевич

Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма для проверки цепочки рассуждения большой языковой модели // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16207