Ахмад М. (науч. рук. Алиев Т.И., Салех Х.М.) Сравнительный анализ методов извлечения ключевой информации из структурированных документов
В работе представлен сравнительный анализ методов извлечения ключевой информации из структурированных документов (счетов-фактур, удостоверений личности). Рассмотрены два подхода: классический конвейер (предобработка изображения, детекция полей, OCR, постобработка) и подход на основе мультимодальных моделей (Vision-Language) для извлечения значимых атрибутов. Оценка основана на метриках точности извлечения полей, устойчивости к шуму и вариативности макетов. Показаны сильные и слабые стороны подходов и даны рекомендации по выбору метода для практических систем. На основе результатов анализа предложено гибридное решение для улучшения качества извлечения.
Ахмад М. (науч. рук. Алиев Т.И., Салех Х.М.) Сравнительный анализ методов извлечения ключевой информации из структурированных документов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16583