Для построения современных онтологий всегда актуальным является извлечение семантически связанных слов из текста на естественном языке, однако общим недостатком таких онтологий является отсутствие специализированных терминов. Чаще всего онтологии дополняются специализированными терминами путем ручного занесения узлов и семантических связей, но этот подход является малоэффективным. В рамках научной работы составлена модель обработки документов в унифицированном формате, а также сформулирован подход для преобразования структурированных и слабоструктурированных текстов на естественном языке в информационные узлы семантической сети, отличающийся использованием грамматических конструкций и семантически значимых элементов форматирования, обеспечивающий структуризацию и декомпозицию данных.
Ночевной Д.С. (науч. рук. Клименков С.В.) Автоматизированное извлечение семантических связей из корпуса структурированных текстов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2020]. URL: https://kmu.itmo.ru/digests/article/3200