Реализация метода улучшения качества исходной разметки текстовых данных, собранных из социальных сетей, с целью повышения качества классификатора на основе использования различных моделей кластеризации (метод k-средних, иерархическая кластеризация, модель гауссовой смеси). Новая разметка для отдельного кластера – это мода из распределения тегов (лейблов) в исходной разметке, попавших в кластер.
Бабиков И.А. (науч. рук. Сохин Т.Р., Насонов Д.А.) Метод оптимальной разметки текстов для улучшения метрики качества классификации // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2021]. URL: https://kmu.itmo.ru/digests/article/6993