filmov
tv
Apache Spark для дата инженеров. Рассказываем о программе
Показать описание
Apache Spark – самый популярный инструмент мира Big Data. Он позволяет обрабатывать большие объемы данных в распределенном режиме. При помощи него удобно создавать витрины данных, подключаясь к различным источникам: Kafka, Elasticsearch, Cassandra, а также создавать real-time приложения, позволяющие на лету пересчитывать и готовить свежие матрицы признаков для моделей машинного обучения, чтобы поддерживать их в актуальном состоянии.