Рыбинская З.В., Иржанова Ю.И. (науч. рук. Хлопотов М.В.) Оценка качества контекста в агентных llm-системах: сопоставление инженерных принципов и современных бенчмарков
В работе рассматривается проблема оценки качества контекста в агентных LLM-системах в условиях смещения фокуса от запоминания знаний к контекстному обучению и динамическому рассуждению. В качестве отправной точки используются ранее сформулированные инженерные принципы управления качеством контекста, такие как актуальность, непротиворечивость и трассируемость. Эти принципы сопоставляются с требованиями, заложенными в современных бенчмарках context learning, в частности CL-bench. Проводится анализ того, какие аспекты качества контекста оказываются критичными для успешного прохождения задач контекстного обучения и какие из них остаются вне текущих подходов к оценке. Работа направлена на выявление разрыва между инженерным управлением контекстом и существующими методами оценки способностей LLM
Рыбинская З.В., Иржанова Ю.И. (науч. рук. Хлопотов М.В.) Оценка качества контекста в агентных llm-системах: сопоставление инженерных принципов и современных бенчмарков // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16369