Личный кабинет

Статья

Фастов Д.С., Кученов Е.Н., Мордасов В.А. (науч. рук. Платонов А.А.) Метод сбора информации на основе разбиения информационного пространства источника по частоте обновления рубрик
УДК тезиса: 004.042

Рассматривается проблема гетерогенности рубрикаторов при сборе данных из множества открытых источников. Предлагается метод сбора, основанный на классификации рубрик по частоте обновления: часто (ЧОР), средне (СОР), мало (МОР) и не обновляемые (НОР). Экспериментально подтверждено, что 85% контента сосредоточено в МОР и НОР, тогда как оперативно значимая информация генерируется лишь 15% разделов. Введён показатель оптимальности сбора, позволяющий формализовать выбор рационального множества рубрик. Метод включает этапы первичного сбора, классификации, формирования множества и итеративной оптимизации. Апробация подтвердила снижение дублирования, сокращение времени сбора и повышение эффективности использования ресурсов. Результаты применимы в системах мониторинга СМИ и аналитических платформах.

Авторы:

Фастов Дмитрий Сергеевич

Кученов Егор Николаевич

Мордасов Владимир Антонович

Руководитель:

Платонов Андрей Анатольевич

Фастов Д.С., Кученов Е.Н., Мордасов В.А. (науч. рук. Платонов А.А.) Метод сбора информации на основе разбиения информационного пространства источника по частоте обновления рубрик // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17646