Метагеномика - область анализа “омиксных” данных секвенирования ДНК, собранных из окружающей среды. В ней особенно актуальна проблема неполноты научных данных. Эта проблема может быть решена при помощи генерации данных de novo. Существуют программы, основанные на bootstrap-подходе, но алгоритмы вероятностных предсказаний ранее не были реализованы. Полученная модель характеризуется высокой воспроизводимостью. В отличие от реализаций bootstrap-подхода, R2 полученной модели близок к 0, а аккуратность предсказаний и кластеризация искусственных и обучающих образцов - к 1. Генерируемые данные могут использоваться в различных исследованиях микробных сообществ. Созданный алгоритм и ему подобные могут стать ключом к решению проблемы неполноты данных в метагеномике.
Смутин Д.В. (науч. рук. Иванов А.Б.) Samovar: библиотека для генерации метагеномов с заданными свойствами // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/11939