Личный кабинет

Статья

Копырин Е.А., Сагадеев А.Р. (науч. рук. Глазкова А.В.) Разработка сервиса для лемматизации русскоязычных текстов с помощью больших языковых моделей
УДК тезиса: 004.89

В данном тезисе рассматривается исследовательская часть разработки сервиса для лемматизации русскоязычных текстов с помощью больших языковых моделей. На основе корпуса GramEval-2020 с текстами из социальных сетей были проведены замеры точностей для современных решений, основанных на правилах и эвристиках в рамках задачи лемматизации, а также для двух больших языковых моделей T-lite-instruct-0.1 и Saiga-LLaMa-3 (8b). Подобраны шаблоны запросов для различных подходов к лемматизации с использованием различных техник промптинга. В результате была выбрана лучшая по показателям точности большая языковая модель и реализован сервис для лемматизации, включающий в себя API, WEB-приложение и Telegram Mini App.

Авторы:

Копырин Евгений Александрович

Сагадеев Артур Ринатович

Руководитель:

Глазкова Анна Валерьевна

Копырин Е.А., Сагадеев А.Р. (науч. рук. Глазкова А.В.) Разработка сервиса для лемматизации русскоязычных текстов с помощью больших языковых моделей // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14446