Личный кабинет

Статья

< Назад

Искусственный интеллект / Интеллектуальные системы и технологии

Литвинов И.А. (науч. рук. Курилов Ф.К.) Разработка системы семантического кэширования ответов больших языковых моделей на основе графового представления диалогов

УДК тезиса: 004.89

Работа посвящена разработке системы семантического кэширования ответов больших языковых моделей на основе графового представления диалогов. Система — middleware-сервис между RAG-системой и LLM API. При поступлении запроса строится граф, где узлы содержат запросы и варианты ответов, а рёбра — последовательность реплик. Поиск выполняется по траекториям от корневых узлов с использованием предвычисленных эмбеддингов. Реализована мультитенантность с изоляцией данных на основе версий промпта и базы знаний. Стек: Python, FastAPI, PostgreSQL, Qdrant, sentence-transformers. Оценка включает hit rate, BERTScore F1 и нагрузочное тестирование. Система снижает затраты на инференс и латентность за счёт повторного использования ответов для семантически эквивалентных запросов с учётом контекста диалога.

Авторы:

Литвинов Иван Артемович

Руководитель:

Курилов Федор Константинович

Скачать файл

Литвинов И.А. (науч. рук. Курилов Ф.К.) Разработка системы семантического кэширования ответов больших языковых моделей на основе графового представления диалогов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/18144