Despegando con PySpark

Aceptada

Introducción práctica a Apache Spark y PySpark, explorando MapReduce, Spark SQL, y Spark Streaming para procesamiento de datos masivos.


Tipo: Charla estandard, 25 minutos

Nivel: Medio

Disertantes: Facundo Ferro

Biografiá del Disertante: Tech Lead del equipo de Search Manager & Sorting en Despegar.com, donde lidero iniciativas clave para optimizar el procesamiento masivo de datos. Apasionado por Scala y Python, con un enfoque en aplicar estas tecnologías para resolver desafíos complejos en big data. Comprometido con la mejora continua y la adopción de nuevas tecnologías para potenciar la eficiencia y precisión en la toma de decisiones. https://www.linkedin.com/in/facundo-ferro-lp/

Horario: 09:30 - 10:00 - 14/09/2024

Sala: Salón de Actos

Etiquetas/Tags: spark python scala mapreduce

Descripción completa

Esta presentación ofrece una introducción a Apache Spark y su uso con PySpark, una poderosa combinación para el procesamiento masivo de datos. Comenzaremos explorando el modelo de MapReduce, que sienta las bases del procesamiento distribuido. Luego, nos adentraremos en Spark SQL, una herramienta esencial para manejar grandes volúmenes de datos estructurados. Finalmente, discutiremos Spark Streaming, que permite el procesamiento en tiempo real de flujos de datos, demostrando cómo Spark puede manejar tanto datos estáticos como dinámicos de manera eficiente.