За последние годы предобученные языковые модели продемонстрировали свой потенциал в решении задач обработки и генерации текстов на естественном языке. При этом ML-инженеры для получения высоких метрик качества в результате дообучения таких моделей сталкиваются с рядом проблем: (1) генерация недостоверной информации; (2) устаревание знаний в моделе при продолжительном использовании; (3) сложность в интерпретации процесса вынесения предсказаний моделью. Генерация текстов с использованием алгоритмов извлечения дополнительной информации из баз знаний (RAG) последнее время набирает популярность в качестве решения вышеуказанных проблем. В данной работе выполняется анализ существующих RAG-методов для применения к задаче по разработке диалоговой системы по поиску релевантных научных публикаций.
Меньщиков М.А. (науч. рук. Муромцев Д.И.) Анализ RAG-методов для разработки диалоговой системы по поиску релевантных научных публикаций // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12544