Личный кабинет

Статья

Топольницкий А.А. (науч. рук. Михайлова Е.Г.) Исследование применения промежуточных представлений визуальных языковых моделей (vlm) для задач сегментации и детекции объектов с малым количеством экземпляров на сложно структурированных изображениях
УДК тезиса: 004.89

В работе исследуется применение промежуточных представлений визуальных языковых моделей (VLM) для сегментации и детекции объектов на сложно структурированных изображениях с малым количеством экземпляров. Основное внимание уделено анализу фасадов архитектурных сооружений Санкт-Петербурга для выявления стадий эрозии и разрушений. Рассмотрены ограничения традиционных методов, основанных на нейросетях YOLO и SegFormer, и предложен альтернативный подход с использованием VLM и обучения с открытым словарём. Метод позволяет моделям обобщать новые категории объектов, что улучшает точность обработки сложных изображений.

Авторы:

Топольницкий Александр Алексеевич

Руководитель:

Михайлова Елена Георгиевна

Топольницкий А.А. (науч. рук. Михайлова Е.Г.) Исследование применения промежуточных представлений визуальных языковых моделей (vlm) для задач сегментации и детекции объектов с малым количеством экземпляров на сложно структурированных изображениях // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14391