В работе рассматривается способ повышения эффективности в задачах обучения с~подкреплением, использующий декомпозицию на обучение с подкреплением на расширенном наборе данных и дальнейший перенос результатов на модель с исходным набором данных.
Андриянов В.А. (науч. рук. Ведяков А.А.) Использование декомпозиции для повышения эффективности обучения с подкреплением // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/10493