Text-to-image генерация - это задача, заключающаяся в синтезе изображений произвольных объектов на основе текстовых описаний. Последние достижения в области глубокого обучения и генеративных моделей привели к значительному прогрессу в этой области. Однако создание персонализированных изображений конкретного человека, животного или объекта из текста остается не до конца решенной задачей. В докладе мы изучаем современные методы, обсуждаем их ограничения и будущие направления для улучшения.
Детков Н.С. (науч. рук. Фильченков А.А.) ПЕРСОНАЛИЗАЦИЯ TEXT-TO-IMAGE ГЕНЕРАТИВНЫХ МОДЕЛЕЙ ДЛЯ ГЕНЕРАЦИИ ЛЮДЕЙ // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/10902