Костюченко Т.Р., Гончаров Р.Р. (науч. рук. Малеев О.) Увеличение производительности алгоритмов уменьшения пространства данных с помощью cuda и суперкомпьютеров
При росте объема данных традиционные методы снижения размерности сталкиваются с проблемами производительности. В работе исследуются два подхода: использование GPU и нейросетевая аппроксимация. Сначала был проведен сравнительный анализ реализаций PCA и t-SNE на CPU и GPU при изменении объема выборки. GPU обеспечивает ускорение t-SNE до 36 раз, а для PCA эффект проявляется при превышении порога в 18000 образцов. Затем был предложен гибридный метод: сверточная нейронная сеть обучается предсказывать низкоразмерные координаты t-SNE на репрезентативных данных и потом применяется к остальным объектам. Эксперименты на датасете объемом 4ГБ показали, что время предсказания для новых данных на 2–3 порядка меньше прямого расчета t-SNE.
Костюченко Т.Р., Гончаров Р.Р. (науч. рук. Малеев О.) Увеличение производительности алгоритмов уменьшения пространства данных с помощью cuda и суперкомпьютеров // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/17293