Усман Т.Г. (науч. рук. Антонов А.С.) Метод семантического анализа архитектурных материалов
В статье представлен метод семантического анализа текстовых архитектурных материалов на основе модели BERTopic. Актуальность метода, позволяющего сократить временные затраты, обусловлена необходимостью обработки больших объемов данных, возникающих в ходе градостроительных конкурсов. В качестве объекта исследования использованы 53 архитектурные концепции, связанные с тюрьмой "Кресты". Методология включает извлечение текста из PDF-файлов с использованием OCR, векторизацию с помощью русскоязычной модели BERT и кластеризацию текстов с применением BERTopic. В результате выделено 5 кластеров, отражающих основные направления проектов. Метод эффективно интерпретирует текстовые данные, возможны перспективы для анализа с включением визуальных данных и мультимодальных подходов, таких как CLIP.
Усман Т.Г. (науч. рук. Антонов А.С.) Метод семантического анализа архитектурных материалов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15498