Среди существующих способов решения задачи суммаризации наибольший интерес представляет генерация кратких содержаний с помощью языковых моделей на основе архитектуры Transformer. В исследовании проводится сравнительная оценка качества суммаризации, выполняемой для текстов на русском языке пятью предобученными языковыми моделями: ruT5-large, MBARTRuSumGazeta, ChatGPT, GigaChat, Saiga/Mistral 7B. Модели генерируют краткие версии текстов из десяти наборов данных; полученные краткие содержания автоматически сравниваются с эталонными краткими содержаниями. Согласно результатам работы, GigaChat представляется наиболее эффективной моделью для решения задачи суммаризации русскоязычных текстов.
Карышева А.С. (науч. рук. Лизунова И.А.) Анализ и оценка подходов к решению задачи суммаризации текстов на русском языке // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12826