Данная работа вносит вклад в решение глобальной актуальной проблемы извлечения информации из текстовых документов, не являющихся текстовыми файлами (например, pdf файлов). Работа сфокусирована на решении задачи типизации (классификации) графиков среди всех иллюстраций, которые могут быть распознаны на предшествующем этапе извлечения информации – детектировании объектов на страницах документа (текст, таблицы, иллюстрации и т.д.). Предложенное решение позволяет эффективно типизировать графики, тем самым предоставляя больше информации для извлечения.
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2022].