Лещенко С.Д. (науч. рук. Маслюхин С.М.) Разработка методов подготовки обучающих выборок для моделей семантического поиска
В работе рассмотрен подход формирования обучающих выборок на основе продвинутых стратегий отбора и фильтрации сложных негативных примеров для повышения качества обучения моделей семантического поиска. Основным объектом исследования в данной работе является подход model-based hard negative mining, который позволяет формировать максимально информативные обучающие выборки для обучения моделей контрастивным методом. В работе представлены эксперименты на нескольких корпусах данных с использованием нескольких моделей-учителей с различным количеством параметров. В результате было экспериментально показано, что предложенный подход обеспечивает стабильный прирост по метрики ранжирования NDCG@2 по сравнению с базовым in-batch подходом.
Лещенко С.Д. (науч. рук. Маслюхин С.М.) Разработка методов подготовки обучающих выборок для моделей семантического поиска // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2026]. URL: https://kmu.itmo.ru/digests/article/16165