Казанцев О.П., Афанасьев М.А., Колосов Н.А. (науч. рук. Евстафьев О.А.) Исследование систем распознавания отзывов сгенерированных большими языковыми моделями методами классического машинного обучения
В работе рассматривается задача бинарной классификации отзывов (определение происхождения: человек или большая языковая модель). Разработана интерпретируемая система распознавания, показавшая высокую точность. Выявлено, что краткость отзывов и их высокая грамотность снижают качество прогнозирования. Выделены устойчивые маркеры: для текстов, принадлежащих человеку, характерны тематическая лексика и экспрессивная пунктуация, для сгенерированных — разговорные обороты и конструкции с тире. Наибольший вклад в классификацию вносят символьные и лексические признаки (на основе TF‑IDF), вклад эмбеддингов — умеренный, стилометрических показателей — минимальный. Результаты формируют основу вычислительно нетребовательной системы классификации для промышленного применения.
Казанцев О.П., Афанасьев М.А., Колосов Н.А. (науч. рук. Евстафьев О.А.) Исследование систем распознавания отзывов сгенерированных большими языковыми моделями методами классического машинного обучения // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16697