Канонир Г. (науч. рук. Фильченков А.А.) Одноуровневая архитектура агента на основе модели иерархической темпоральной памяти
Современные методы машинного обучения с подкреплением имеют ряд ограничений, наложенных использующейся парадигмой искусственных нейронных сетей с точечной моделью нейрона. Использование последних достижений нейронаук в рамках новой теории интеллекта «The Thousand Brains Theory of Intelligence», а также применение модели «иерархической темпоральной памяти» (Hierarchical Temporal Memory, HTM), частично реализующей данную теорию в виде модели машинного обучения, имеют потенциал как для развития уже устоявшихся методов обучения с подкреплением, так и для создания новых подходов решения этой задачи. Целью данной работы является разработка простой и легко интерпретируемой одноуровневой архитектуры агента на основе модели HTM, а также её апробация на задаче о контекстуальном многоруком бандите.
Канонир Г. (науч. рук. Фильченков А.А.) Одноуровневая архитектура агента на основе модели иерархической темпоральной памяти // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/9901