Фастов Д.С., Кученов Е.Н., Мордасов В.А. (науч. рук. Платонов А.А.) Метод сбора информации на основе разбиения информационного пространства источника по частоте обновления рубрик
Рассматривается проблема гетерогенности рубрикаторов при сборе данных из множества открытых источников. Предлагается метод сбора, основанный на классификации рубрик по частоте обновления: часто (ЧОР), средне (СОР), мало (МОР) и не обновляемые (НОР). Экспериментально подтверждено, что 85% контента сосредоточено в МОР и НОР, тогда как оперативно значимая информация генерируется лишь 15% разделов. Введён показатель оптимальности сбора, позволяющий формализовать выбор рационального множества рубрик. Метод включает этапы первичного сбора, классификации, формирования множества и итеративной оптимизации. Апробация подтвердила снижение дублирования, сокращение времени сбора и повышение эффективности использования ресурсов. Результаты применимы в системах мониторинга СМИ и аналитических платформах.
Фастов Д.С., Кученов Е.Н., Мордасов В.А. (науч. рук. Платонов А.А.) Метод сбора информации на основе разбиения информационного пространства источника по частоте обновления рубрик // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17646