В современных условиях стремительно растет и развивается киберпреступность. Злоумышленники используют персональные данные сотрудников организаций на подготовительных и начальных стадиях компьютерных атак. В докладе представлена схема разработанного программного комплекса для выявления сущностей персональных данных, основанный на объединении нескольких алгоритмов машинного обучения: нейросетевой рекуррентной архитектуры двунаправленной долгой краткосрочной памяти, кодировщика персональных данных и метода ближайших соседей. Результаты оценивания показателей эффективности в сравнении с современным средством обработки текстов естественного языка (Spacy) показали перспективы практического применения программного комплекса.
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2022].