В докладе описывается применение методов машинного обучения для извлечения симптомов из медицинских записей. Представлена методология, которая включает этапы предварительной обработки данных, определения признакового пространства, обучения модели и постобработки для извлечения координат симптомов. Используется датасет, состоящий из XML-файлов эпикризов и JSON-файлов разметки. Точность работы алгоритма достигает F1-меры равной 0,722.
Галай О.О. (науч. рук. Русак А.В.) Извлечение симптомов из эпикризов с использованием методов машинного обучения // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/13168