Despegando con PySpark
Aceptada
Introducción práctica a Apache Spark y PySpark, explorando MapReduce, Spark SQL, y Spark Streaming para procesamiento de datos masivos.
Tipo: Charla estandard, 25 minutos
Nivel: Medio
Disertantes: Facundo Ferro
Biografiá del Disertante: Tech Lead del equipo de Search Manager & Sorting en Despegar.com, donde lidero iniciativas clave para optimizar el procesamiento masivo de datos. Apasionado por Scala y Python, con un enfoque en aplicar estas tecnologías para resolver desafíos complejos en big data. Comprometido con la mejora continua y la adopción de nuevas tecnologías para potenciar la eficiencia y precisión en la toma de decisiones. https://www.linkedin.com/in/facundo-ferro-lp/
Horario: 09:30 - 10:00 - 14/09/2024
Sala: Salón de Actos
Etiquetas/Tags: spark python scala mapreduce
Descripción completa
Esta presentación ofrece una introducción a Apache Spark y su uso con PySpark, una poderosa combinación para el procesamiento masivo de datos. Comenzaremos explorando el modelo de MapReduce, que sienta las bases del procesamiento distribuido. Luego, nos adentraremos en Spark SQL, una herramienta esencial para manejar grandes volúmenes de datos estructurados. Finalmente, discutiremos Spark Streaming, que permite el procesamiento en tiempo real de flujos de datos, demostrando cómo Spark puede manejar tanto datos estáticos como dinámicos de manera eficiente.