Ермаков Г.А., Теткин С.В. (науч. рук. Андрушкевич Д.) Подход к классификации текстовой информации
В работе рассматривается подход к классификации текстовой информации с использованием методов обработки естественного языка (NLP) и Универсальной десятичной классификации (УДК). Анализ существующих методов обработки текстов, включая правила, статистические и машинное обучение, выявил необходимость разработки автоматизированного классификатора, обладающего высокой точностью и масштабируемостью. Предлагаемый подход основан на применении архитектур глубокого обучения, в частности трансформеров, что позволяет эффективно анализировать контекстные связи и извлекать ключевые сущности. Разработанный программный комплекс интегрирует модель BERT, обеспечивая автоматическую классификацию текстов и их структурный анализ. Внедрение системы способствует повышению оперативности обработки данных.
Ермаков Г.А., Теткин С.В. (науч. рук. Андрушкевич Д.) Подход к классификации текстовой информации // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/14456