Личный кабинет

Статья

Ахмад М. (науч. рук. Алиев Т.И., Салех Х.М.) Сравнительный анализ методов извлечения ключевой информации из структурированных документов
УДК тезиса: 004.93

В работе представлен сравнительный анализ методов извлечения ключевой информации из структурированных документов (счетов-фактур, удостоверений личности). Рассмотрены два подхода: классический конвейер (предобработка изображения, детекция полей, OCR, постобработка) и подход на основе мультимодальных моделей (Vision-Language) для извлечения значимых атрибутов. Оценка основана на метриках точности извлечения полей, устойчивости к шуму и вариативности макетов. Показаны сильные и слабые стороны подходов и даны рекомендации по выбору метода для практических систем. На основе результатов анализа предложено гибридное решение для улучшения качества извлечения.

Авторы:

Ахмад Махмуд

Руководитель:

Алиев Тауфик Измайлович, Салех Хади Мухаммед

Ахмад М. (науч. рук. Алиев Т.И., Салех Х.М.) Сравнительный анализ методов извлечения ключевой информации из структурированных документов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16583