Airflow para Data Scientists

Aceptada

Data Scientists: amantes de los notebooks, en eterna enemistad con los entornos productivos. Pero hay un patrón común a muchos proyectos de DS: el de un ET(F)L. Obtener los datos, preprocesarlos, modelar y disponibilizar el modelado es el núcleo que los define. Veamos como podemos agilizar y simplificar este flujo.


Tipo: Charla estandard, 25 minutos

Nivel: Principiante

Disertantes: Ignacio Javier Mermet

Biografiá del Disertante: Soy estudiante de Ingeniería en Informática en FIUBA, trabajo como Data Scientist Ssr. Me encanta leer, estudiar y experimentar sobre ideas nuevas y ciencias que no conozco.

Horario: 16:00 - 16:30 - 05/12/2019

Sala: D - Invgate

Etiquetas/Tags: data science apache airflow etfl

Descripción completa

Con la intención de predecir la disponibilidad de bicicletas públicas en cada parada, pensaremos un flujo de trabajo para llevarlo a cabo. Veremos que el núcleo del proyecto son conceptos comunes a muchos proyectos de DS: obtener, preprocesar, modelar y disponibilizar. Entra Apache Airflow en escena para definir flujos de tareas programáticamente en Python, revisando los operadores más básicos que permiten que nuestro proyecto camine por sí solo.