Статья

Черников К.М. (науч. рук. Сухаренко Д.В.) Использование многомерных пространств для определения минимума ошибки и необходимого количества нейронов в архитектуре нейросети
УДК тезиса: 004.852

При решении практических задач с применением AI-алгоритмов возникает проблема определения количества нейронов в слоях при обучении ИНС, а также в поиске минимального значения ошибки. На данный момент наиболее популярный подход для определения минимума ошибки – метод градиентного спуска, суть которого заключается в высчитывании соотношения производной функции нейрона к функции ошибки сети. Особенности и улучшения этого подхода были рассмотрены в работе. Проведя сравнительный анализ методов стохастического градиентного спуска и многомерной оптимизации путём интерполяции было выявлено, что второй подход может помочь в автоматизации подбора не только весов, но и количества нейронов, ввиду включения нуля в возможные значения веса.

Авторы:

Черников Кирилл Михайлович

Руководитель:

Сухаренко Данил Владимирович

Черников К.М. (науч. рук. Сухаренко Д.В.) Использование многомерных пространств для определения минимума ошибки и необходимого количества нейронов в архитектуре нейросети // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12656