Личный кабинет

Статья

Усман Т.Г. (науч. рук. Антонов А.С.) Метод семантического анализа архитектурных материалов
УДК тезиса: 004.89

В статье представлен метод семантического анализа текстовых архитектурных материалов на основе модели BERTopic. Актуальность метода, позволяющего сократить временные затраты, обусловлена необходимостью обработки больших объемов данных, возникающих в ходе градостроительных конкурсов. В качестве объекта исследования использованы 53 архитектурные концепции, связанные с тюрьмой "Кресты". Методология включает извлечение текста из PDF-файлов с использованием OCR, векторизацию с помощью русскоязычной модели BERT и кластеризацию текстов с применением BERTopic. В результате выделено 5 кластеров, отражающих основные направления проектов. Метод эффективно интерпретирует текстовые данные, возможны перспективы для анализа с включением визуальных данных и мультимодальных подходов, таких как CLIP.

Авторы:

Усман Тимур Геннадьевич

Руководитель:

Антонов Александр Сергеевич

Усман Т.Г. (науч. рук. Антонов А.С.) Метод семантического анализа архитектурных материалов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15498