Хисаметдинова Д.Н., Леманов А.А. (науч. рук. Ходненко И.В.) Разработка и оптимизация llm-сервиса для консультирования пользователей по эксплуатации платформы — сравнение подходов проектирования вопросно-ответных систем
Разработана QA-система, позволяющая пользователю ориентироваться в технической документации сервиса. Исходные данные представляют собой .json с разбивкой на тематические чанки, вопросы и ответы. Добавление генерации вопросов-синонимов сократило семантическое расстояние между запросами и БД. Использование двух LLM показало, что модель с меньшим числом параметров ускорила работу в 4 раза, но снизила точность на 10%. FAISS ускорил поиск на 32%, а BM25+ уменьшил объем кандидатов на 78% перед векторным сравнением. Фильтрация нерелевантных тем и оптимизация параметров модели позволили достичь среднего косинусного сходства между векторами вопросов пользователя и векторами наиболее релевантных вопросов >0.87. Сервис на FastAPI и Angular демонстрирует практическую применимость подхода
Хисаметдинова Д.Н., Леманов А.А. (науч. рук. Ходненко И.В.) Разработка и оптимизация llm-сервиса для консультирования пользователей по эксплуатации платформы — сравнение подходов проектирования вопросно-ответных систем // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15697