Личный кабинет

Статья

Верзаков А.Ю., Быковский С.В. (науч. рук. Быковский С.В.) Разработка метода извлечения семантической структуры документов для ии-консультанта
УДК тезиса: УДК 004.93'12

Часто в RAG-системах необходимы алгоритмы извлечения осмысленного текста для формирования качественной информации в базе знаний системы. Это напрямую влияет на качества поиска контекстной информации. В работе были исследованы существующие инструменты и решения задачи извлечения текста из визуальных форматов (PDF-документы, изображения), был проведён сравнительный анализ этих инструментов и разработан гибридный алгоритм, обеспечивающий баланс между скоростью обработки документов и вычислительной эффективностью.

Авторы:

Верзаков Александр Юрьевич

Быковский Сергей Вячеславович

Руководитель:

Быковский Сергей Вячеславович

Верзаков А.Ю., Быковский С.В. (науч. рук. Быковский С.В.) Разработка метода извлечения семантической структуры документов для ии-консультанта // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16259