Черников К.М. (науч. рук. Сухаренко Д.В.) Использование многомерных пространств для определения минимума ошибки и необходимого количества нейронов в архитектуре нейросети
При решении практических задач с применением AI-алгоритмов возникает проблема определения количества нейронов в слоях при обучении ИНС, а также в поиске минимального значения ошибки. На данный момент наиболее популярный подход для определения минимума ошибки – метод градиентного спуска, суть которого заключается в высчитывании соотношения производной функции нейрона к функции ошибки сети. Особенности и улучшения этого подхода были рассмотрены в работе. Проведя сравнительный анализ методов стохастического градиентного спуска и многомерной оптимизации путём интерполяции было выявлено, что второй подход может помочь в автоматизации подбора не только весов, но и количества нейронов, ввиду включения нуля в возможные значения веса.
Черников К.М. (науч. рук. Сухаренко Д.В.) Использование многомерных пространств для определения минимума ошибки и необходимого количества нейронов в архитектуре нейросети // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/12656