Airflow para Data Scientists
Aceptada
Data Scientists: amantes de los notebooks, en eterna enemistad con los entornos productivos. Pero hay un patrón común a muchos proyectos de DS: el de un ET(F)L. Obtener los datos, preprocesarlos, modelar y disponibilizar el modelado es el núcleo que los define. Veamos como podemos agilizar y simplificar este flujo.
Tipo: Charla estandard, 25 minutos
Nivel: Principiante
Disertantes: Ignacio Javier Mermet
Biografiá del Disertante: Soy estudiante de Ingeniería en Informática en FIUBA, trabajo como Data Scientist Ssr. Me encanta leer, estudiar y experimentar sobre ideas nuevas y ciencias que no conozco.
Horario: 16:00 - 16:30 - 05/12/2019
Sala: D - Invgate
Etiquetas/Tags: data science apache airflow etfl
Descripción completa
Con la intención de predecir la disponibilidad de bicicletas públicas en cada parada, pensaremos un flujo de trabajo para llevarlo a cabo. Veremos que el núcleo del proyecto son conceptos comunes a muchos proyectos de DS: obtener, preprocesar, modelar y disponibilizar. Entra Apache Airflow en escena para definir flujos de tareas programáticamente en Python, revisando los operadores más básicos que permiten que nuestro proyecto camine por sí solo.