Ярулин Э.С. (науч. рук. Шаламов В.В.) Разработка методов детектирования сгенерированных языковыми моделями текстов
В последние годы проблема автоматической детекции текстов, генерируемых искусственным интеллектом, приобрела особую актуальность в связи с развитием больших языковых моделей (LLM). Такие тексты зачастую трудно отличить от человеческого письма, что создает риски, связанные с достоверностью информации и плагиатом. В данном докладе рассматриваются современные методы выявления машинного происхождения текста, основанные на анализе вероятностных характеристик токенов и синтаксических паттернов. Рассматриваются два ключевых подхода: вычисление перплексии и сопутствующих метрик, а также анализ лингвистических особенностей, включая морфемный разбор и стилистический анализ. Особое внимание уделяется проблемам адаптации детекторов к разным типам текстов и сложностям, связанным с обфускацией и многост
Ярулин Э.С. (науч. рук. Шаламов В.В.) Разработка методов детектирования сгенерированных языковыми моделями текстов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2025]. URL: https://kmu.itmo.ru/digests/article/15080