Статья

Ночевной Д.С. (науч. рук. Клименков С.В.) Автоматизированное извлечение семантических связей из корпуса структурированных текстов
УДК тезиса: 004.822

Для построения современных онтологий всегда актуальным является извлечение семантически связанных слов из текста на естественном языке, однако общим недостатком таких онтологий является отсутствие специализированных терминов. Чаще всего онтологии дополняются специализированными терминами путем ручного занесения узлов и семантических связей, но этот подход является малоэффективным. В рамках научной работы составлена модель обработки документов в унифицированном формате, а также сформулирован подход для преобразования структурированных и слабоструктурированных текстов на естественном языке в информационные узлы семантической сети, отличающийся использованием грамматических конструкций и семантически значимых элементов форматирования, обеспечивающий структуризацию и декомпозицию данных.

Авторы:

Ночевной Дмитрий Сергеевич

Руководитель:

Клименков Сергей Викторович

Ночевной Д.С. (науч. рук. Клименков С.В.) Автоматизированное извлечение семантических связей из корпуса структурированных текстов // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2020]. URL: https://kmu.itmo.ru/digests/article/3200