Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма интерпретации модели черного ящика сверточной нейронной сети с помощью метода оценки градиентов
В данной работе разработан алгоритм интерпретации модели черного ящика сверточной нейронной сети с помощью метода оценки градиента. Алгоритм вычисляет атрибуты признаков, создавая запросы путём наложения масок на различные варианты объясняемых данных, равномерно распределённых между объясняемыми данными и начальной точкой. Используя сгенерированные запросы, интерпретатор получает набор наблюдений, позволяющий оценить атрибуты признаков. Точность интерпретации предложенного алгоритма не уступает точности современных методов интерпретации на наборе данных MNIST и уступает на 0.02% методу интерпретации белого ящика на наборе данных ImageNet.
Гаврилова В.В. (науч. рук. Менщиков А.А.) Разработка алгоритма интерпретации модели черного ящика сверточной нейронной сети с помощью метода оценки градиентов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14019