Баталенков С.С. (науч. рук. Ковальчук М.А., Филатова А.А.) Детекция и распознавание в latex представление формул из неструктурированных документов
Задача парсинга сканов PDF документов заключается в извлечении текстовой и графической информации из изображений, полученных путем сканирования документов. В отличие от PDF с текстовым слоем, где информация о тексте документа сохраняется в виде машиночитаемых данных, сканы представляют собой изображения, что усложняет задачу извлечения содержания. Цель данного исследования - создать метод быстрого и точного парсинга PDF.
Баталенков С.С. (науч. рук. Ковальчук М.А., Филатова А.А.) Детекция и распознавание в latex представление формул из неструктурированных документов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14384