Гирин А.Р. (науч. рук. Тесля Н.Н.) Подход к локализации мест дтп из текстов новостей с использованием газетира и большой языковой модели llama
Предложен комбинированный подход для локализации мест дорожно-транспортных происшествий (ДТП) из новостных текстов с использованием газетира и большой языковой модели Llama. Метод включает подготовку локального газетира на основе OpenStreetMap, предобработку текста, поиск упоминаний географических объектов через нечеткое сравнение строк и валидацию результатов с помощью LLM Llama-3.2-3B-Instruct. Для повышения точности учитываются пространственные отношения между объектами. Апробация на новостных текстах о ДТП в Санкт-Петербурге показала увеличение точности локализации с 65% до 80% при использовании LLM. Подход применим при сборе данных для анализа ДТП, но также может использоваться и в других областях для решения задачи локализации места события из текста.
Гирин А.Р. (науч. рук. Тесля Н.Н.) Подход к локализации мест дтп из текстов новостей с использованием газетира и большой языковой модели llama // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14309