Личный кабинет

Статья

Казанцев О.П., Афанасьев М.А., Колосов Н.А. (науч. рук. Евстафьев О.А.) Исследование систем распознавания отзывов сгенерированных большими языковыми моделями методами классического машинного обучения
УДК тезиса: 004.8

В работе рассматривается задача бинарной классификации отзывов (определение происхождения: человек или большая языковая модель). Разработана интерпретируемая система распознавания, показавшая высокую точность. Выявлено, что краткость отзывов и их высокая грамотность снижают качество прогнозирования. Выделены устойчивые маркеры: для текстов, принадлежащих человеку, характерны тематическая лексика и экспрессивная пунктуация, для сгенерированных — разговорные обороты и конструкции с тире. Наибольший вклад в классификацию вносят символьные и лексические признаки (на основе TF‑IDF), вклад эмбеддингов — умеренный, стилометрических показателей — минимальный. Результаты формируют основу вычислительно нетребовательной системы классификации для промышленного применения.

Авторы:

Казанцев Олег Павлович

Афанасьев Макар Александрович

Колосов Никита Алексеевич

Руководитель:

Евстафьев Олег Александрович

Казанцев О.П., Афанасьев М.А., Колосов Н.А. (науч. рук. Евстафьев О.А.) Исследование систем распознавания отзывов сгенерированных большими языковыми моделями методами классического машинного обучения // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16697