Личный кабинет

Статья

Дьячков Д.А., Устинова В.Е. (науч. рук. Ефимова В.А.) Интеграция количественных и пространственных признаков в латентное пространство предобученных визуально-лексических нейронных сетей
УДК тезиса: 004.855.5

В статье предложен метод интеграции количественных и пространственных признаков в латентное пространство предобученных визуально-лексических нейронных сетей. Для решения проблемы недостаточного понимания кодировщиками числовых величин и взаимосвязей объектов в изображении предложено дообучение моделей на синтетическом датасете с геометрическими примитивами. Это позволяет улучшить понимание текстовых запросов и повышает качество генерации изображений в диффузионных моделях.

Авторы:

Дьячков Даниил Александрович

Устинова Валерия Евгеньевна

Руководитель:

Ефимова Валерия Александровна

Дьячков Д.А., Устинова В.Е. (науч. рук. Ефимова В.А.) Интеграция количественных и пространственных признаков в латентное пространство предобученных визуально-лексических нейронных сетей // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14199