CÓMO INSTALAR APACHE SPARK (PYSPARK) en Windows 10 | Big Data en Python - #1

preview_player
Показать описание
👉 Curso de Big Data en Python ✅ Cómo instalar Apache Spark para Python (PySpark) en Windows 10

|| Ayuda para el correcto seguimiento del vídeo: ||

0 - Cómo instalar Python en Windows:

1 - Cómo instalar librerías en Python:

2 - Cómo instalar Jupyter Notebook y Jupyter Lab:

3 - Curso completo (y rápido) de Python para n00bs:

LINKS DE DESCARGA:

y nuestro GitHub con mucho código interesante:

📝 ÍNDICE DEL VÍDEO:
00:00 Introducción
00:26 Requisitos
00:34 Descargas
1:50 Instalaciones
7:24 Prueba en Jupyter Notebook
Рекомендации по теме
Комментарии
Автор

Hola! Muchas gracias por tu video. A mí me salía el error siguiente justo al intentar abrir el jupyter notebook: "'jupyter' no se reconoce como un comando interno o externo, programa operable o archivo por lotes.", para arreglarlo, tuve que poner en el cmd lo siguiente "python -m pip install jupyter" a partir de ahí ya puedes abrir el jupyter.

gaietital
Автор

Hola.

Hermano, muchas gracias, recientemente estoy en un curso de BigData y posterior el de Data Scientist lo estaré cursando, tu video de instalación me ayudo mucho y lo logre con la ultima versión Spark en windows 8 y todavia arranca jejeje, me suscribiré a tu canal.

Saludos desde México.

sabiopensanteepistemologic
Автор

Literal, TE AMO. Eres el unico que explica de la manera correcta. Gracias. :)

manuelcoaguila
Автор

Gracias, me ha ayudado bastante tu video. Estuve tratando de instalar pyspark en Windows y siempre me botaba error por no instalas el findspark, cosa que nunca lo explicaban en otros videos.

santiagogamarragarro
Автор

buen video pero ademas de lo que dice que hay q instalar, tambien es necesario instalar python y para instalar las librerias tienen q usar el comando python -m pip install pyspark findspark jupyter. Saludos

javiertolin
Автор

Una consulta ¿Qué diferencias notables hay entre las builds 2.7 y 3.3 de hadoop a día de hoy?

zetsuboulynn
Автор

Excelente explicación, muy cortito pero muy bien explicado. Saludos ya me suscribí. Un abrazo

MegaLobo
Автор

Muchísimas gracias!! Después de muchos intentos, esto me ha ayudado muchísimo :)

estefaniagarciajimenez
Автор

Grande!! Maquina !! Crack!! Idolo!! Bestia!!! Gracias a tu video pude instalar finalmente spark te lo agradezco un monton

LaHuevaDeDani
Автор

Que grande, llevaba horas intentando hacer que me funcionara y nada, ahora me sirve perfecto la conexión con PySpark. Muchas gracias.

Sankr
Автор

No sabes cuanto me has ayudado, sigue así <3

josemata
Автор

Excelente Video. De lo mejor que he visto sobre como ayudar a preparar el ambiente para Pyspark (y Spark en general). Eres un crack, Muchas gracias!

jasonaraosfuentes
Автор

Buenas me, esta saliendo este error :
ModuleNotFoundError Traceback (most recent call last)
Input In [3], in <cell line: 1>()
----> 1 import findsparks
2 findspark.init()

ModuleNotFoundError: No module named 'findsparks'

Si alguien me puede ayudar se lo agradezco

danielalfonso
Автор

Excelente tutorial Errodringer, he logrado levantar las herramientas y he realizado pruebas de concepto con grandes ficheros usando spark, pyspark y jupyter. pero tengo una duda, al crear un archivo nuevo py3, escribo codigo abundante para una solucion etl, y al ejecutar por primera vez el archivo, solo la primera vez demora 6 segundos en procesar 2 millones de lineas de un archivo, posterior a esa ejecucion, lee otros archivos con las misma cantidad de informacion y algunos con mas pero los procesos los ejecuta en menos de 1 segundo. dandome resultados muy favorables, tendras algun conocimiento del porque solo la primera vez demora mas ? te voy a agradecer infinitamente. Saludos!!!

rafafallo
Автор

Muchas Gracias!!!! estaba sufriendo instalándolo hasta que vi tu video :'D.

brendapaolaquintanasilva
Автор

Muchas gracias Maestro. Mi anterior Version de Spark ya no funcionaba . Ya pude de nuevo usar Spark

bezant
Автор

Buenas, esta confiado en que ya estaba todo en orden pero ahora cuando quise empezar a utilizar Apache Spark me salta este error:


ModuleNotFoundError Traceback (most recent call last)
in <module>
----> 1 import findspark
2 findspark.init()

ModuleNotFoundError: No module named 'findspark'

Por favor ayuda!

mauriciorostagno
Автор

Deseo manejar data limpiar y arreglar para que pueda ser visualizado. Generar EtL, es posible hacerlo aquí? Conectarme a la BD y enviar la data limpia? Gracias

Erick-vqxk
Автор

muy bueno, preciso y claro.
Gracias, va mi like!

nicolasrosso
Автор

Hola, estoy teniendo un problema a la hora de ejecutar el comando "winutils chmod 777 C:\tmp\hive", pues al dar enter me aparece el error 'winutils.exe - Error de la aplicacion, La aplicación no se pudo iniciar correctamente
Cabe mencionar que el enlace para descargar el JDK de Java ya no funciona, así que tuve que buscar la versión mas reciente desde la pagina de Oracle.
Alguien mas tiene este problema?

susejking