Работа посвящена сравнению эффективности различных методов анализа тональности текста. На корпусе русскоязычных твитов были протестированы три модели для решения проблемы бинарной классификации: логистическая регрессия (LR), классификатор XGBoost и сверточная нейронная сеть (CNN). Основываясь на полученных результатах CNN показала лучшие результаты, но при этом время, потребовавшееся на обучение LR, существенно меньше.
Звонарев А.А. (науч. рук. Билый А.М.) Методы для автоматизированного определения эмоциональной окраски текста // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2020]. URL: https://kmu.itmo.ru/digests/article/4781