В данной работе представлен подход, основанный на больших языковых моделях, для генерации SPARQL-запросов в рамках корпуса Open Research Knowledge Graph (ORKG) для челленджа ISWC SciQA. Данный подход предлагает несколько улучшений к ранее опубликованному методу SPARQLGEN, который ориентирован на генерацию SPARQL-запросов с использованием контекста, передаваемого в большие языковые модели наряду с запросом, сформулированным на естественном языке. В результате исследования были сделаны выводы о высокой точности генерации SPARQL запросов даже без использования подграфа, а также о небольшом повышении точности в случае использования алгоритма извлечения подграфа, основанного на использование описаний статей и результатов исследований.
Плюхин Д.А., Радюш Д.В. (науч. рук. Муромцев Д.И.) Исследование алгоритмов извлечения подграфа для генерации SPARQL запросов с использованием больших языковых моделей // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12062