Личный кабинет

Статья

Никишин А.П. (науч. рук. Графеева Н.Г.) Создание открытого набора данных для распознавания кириллических исторических рукописей
УДК тезиса: 004.932.75

Автоматический анализ рукописных исторических документов является одной из ключевых задач сохранения культурного наследия и развития цифровых гуманитарных исследований. Тем не менее, отсутствие надежных ресурсов для анализа структуры документов и сегментации строк текста ограничивает разработку эффективных систем распознавания рукописного текста. В рамках данной работы был создан и опубликован открытый набор данных CyrillicHist, предназначенный для анализа структуры документов в исторических кириллических рукописях XV–XVI вв. Текущая работа посвящена обобщению результатов CyrillicHist, а также описанию направлений развития второй версии корпуса, в которой уточняется разметка и добавляется текстовая аннотация на уровне строк.

Авторы:

Никишин Андрей Павлович

Руководитель:

Графеева Наталья Генриховна

Никишин А.П. (науч. рук. Графеева Н.Г.) Создание открытого набора данных для распознавания кириллических исторических рукописей // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17726