Apache Spark - Capítulo 3. Un recorrido por el conjunto de herramientas de Spark

preview_player
Показать описание
Presentador: Gonzalo Villena Romero

Chapter 3. A Tour of Spark’s Toolset

Este capítulo cubre lo siguiente:
- Ejecutar aplicaciones de producción con spark-submit
- Conjuntos de datos: API con seguridad de tipos para datos estructurados
- Streaming estructurado
- Machine Learning y analítica avanzada
- Conjuntos de datos distribuidos resistentes (RDD): API de bajo nivel de Spark
- SparkR
- El ecosistema de paquetes de terceros

Una vez que haya realizado el recorrido, podrá saltar a las partes correspondientes del libro para encontrar respuestas a sus preguntas sobre temas particulares.

# Acerca del libro
Título: Spark: The Definitive Guide

Apache Spark es actualmente uno de los sistemas más populares para el procesamiento de datos a gran escala, con API en múltiples lenguajes de programación y una gran cantidad de bibliotecas integradas y de terceros. Aunque el proyecto ha existido durante varios años, primero como un proyecto de investigación que comenzó en UC Berkeley en 2009, luego en la Apache Software Foundation desde 2013, la comunidad de código abierto continúa creando API más potentes y bibliotecas de alto nivel sobre Spark, por lo que todavía hay mucho que escribir sobre el proyecto.

---------------------------------------------------------------------------------------------------------------------
¿Te gustaría compartir y aprender sobre SQL, Bases de datos, Big Data, Cloud, R, Oracle, SQL Server, Hadoop, Hive, Spark, Databricks, Delta Lake, git, Airflow, Apache Hudi, Apache Beam, DVC, lakeFS, Flink, AWS, GCP, Azure, Presto/Trino, Snowflake, Ingeniería de Datos, Machine Learning, MLOps, Data Management, etc con más entusiastas por los datos así como tú?

📣Únete a la comunidad Data Engineering LATAM en las distintas redes que tenemos

Grupos de Estudios:

🎤 English Speaking and stuff
🎤 DAMA's Study Group (Data Management)
🎤 Databricks Certified Associate
🎤 Apache Airflow Study Club
🎤 Power BI como debe ser
🎤 Club de Lectura / Designing data-intensive Applications 🐗

🎤¿Quieres dar charla en la comunidad?

💌Suscríbete a este canal con el botón rojo que está debajo de los videos y pulsa la campana para que te notifique de las novedades.

📢 ¡Pasa la voz y ayúdanos a ser la comunidad más grande y chévere de todas!
Рекомендации по теме
Комментарии
Автор

Muchas gracias, de verdad que son unos aportes bien importantes

cmiloable