Данные - ценный ресурс современного общества, они генерируются беспрецедентными и постоянно растущими темпами. Необходимость хранить, анализировать и оперативно предоставлять данные множеству пользователей ставит сложные задачи перед современными программными платформами. Каждая система, использующая большие объемы данных, имеет свои особенности в синхронизации, стратегии обработки, гарантий согласованности, отказоустойчивости и упорядочивания. Проблемы, с которыми сталкиваются системы, использующие большие объемы данных, и предлагаемые ими решения часто пересекаются. В данном исследовании будут введены основные понятия современных систем для обработки потоковых данных, рассмотрены существующие решения. Будут показаны существующие способы оптимизации отдельных компонент этих систем
Конанов К.А., Иванов С.Е. (науч. рук. Иванов С.Е.) Методы и технологии для повышения производительности распределенных систем потоковой обработки данных // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2024]. URL: https://kmu.itmo.ru/digests/article/13673