В докладе будут рассмотрены подходы к автоматическому выбору моделей предобработки данных для задач машинного обучения. Традиционно предобработка данных выступает в качестве первых шагов в пайплайнах (pipleines) машинного обучения и оказывает существенное влияние на итоговый результат для типовых классов задач: классификации и регрессии. Для решения задачи предлагается использовать два альтернативных подхода: на основе ручного подбора моделей и процедуры кросс-валидации, либо на основе методов автоматического машинного обучения (AutoML).
Бунэхас С. (науч. рук. Иванов С.В.) Automatic selection of data preprocessing models for machine learning tasks // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2022]. URL: https://kmu.itmo.ru/digests/article/9151