Статья

Пастухов Н.А. (науч. рук. Менисов А.Б.) Программный комплекс сбора, хранения и анализа информации из открытых источников сети интернет
УДК тезиса: 004.852

В данном исследовании разработан подход к выявлению закономерностей между смысловым содержанием текста HTML-блока документа и его обозначением в разметке страницы. Результатом исследования является прототип программного комплекса по сбору, хранению и анализу информации из открытых источников сети Интернет, которая необходима для оценивания информационной обстановки. Цель исследования – создание алгоритмической базы, которая позволит производить разработку унифицированных web-скраперов, ориентированных на web-документы схожей структуры и не привязанные к конкретному источнику сети Интернет.

Авторы:

Пастухов Никита Александрович

Руководитель:

Менисов Артем Бакытжанович

Пастухов Н.А. (науч. рук. Менисов А.Б.) Программный комплекс сбора, хранения и анализа информации из открытых источников сети интернет // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2021]. URL: https://kmu.itmo.ru/digests/article/5338