Apache Spark для дата инженеров. Рассказываем о программе

preview_player
Показать описание
Apache Spark – самый популярный инструмент мира Big Data. Он позволяет обрабатывать большие объемы данных в распределенном режиме. При помощи него удобно создавать витрины данных, подключаясь к различным источникам: Kafka, Elasticsearch, Cassandra, а также создавать real-time приложения, позволяющие на лету пересчитывать и готовить свежие матрицы признаков для моделей машинного обучения, чтобы поддерживать их в актуальном состоянии.

Рекомендации по теме