Современные методы обучения с подкреплением имеют ряд ограничений, наложенных использующейся парадигмой искусственных нейронных сетей с точечной моделью нейрона. Использование последних достижений нейронаук в рамках теории интеллекта "The Thousand Brains Theory of Intelligence", а также применение модели машинного обучения иерархической темпоральной памяти (HTM), которая реализует некоторые аспекты данной теории, имеют потенциал как для развития уже устоявшихся методов обучения с подкреплением, так и для создания новых подходов решения этой задачи. Целью данной работы является выявление перспектив применения модели машинного обучения HTM в обучении с подкреплением.
Канонир Г. (науч. рук. Фильченков А.А.) Обучение с подкреплением на основе иерархической темпоральной модели // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2022]. URL: https://kmu.itmo.ru/digests/article/8983