Airflow para Data Scientists

Accepted

Data Scientists: amantes de los notebooks, en eterna enemistad con los entornos productivos. Pero hay un patrón común a muchos proyectos de DS: el de un ET(F)L. Obtener los datos, preprocesarlos, modelar y disponibilizar el modelado es el núcleo que los define. Veamos como podemos agilizar y simplificar este flujo.


Type: Charla estandard, 25 minutos

Level: Beginner

Speakers: Ignacio Javier Mermet

Speakers Bio: Soy estudiante de Ingeniería en Informática en FIUBA, trabajo como Data Scientist Ssr. Me encanta leer, estudiar y experimentar sobre ideas nuevas y ciencias que no conozco.

Time: 16:00 - 16:30 - 12/05/2019

Room: D

Labels: data science apache airflow etfl

Description

Con la intención de predecir la disponibilidad de bicicletas públicas en cada parada, pensaremos un flujo de trabajo para llevarlo a cabo. Veremos que el núcleo del proyecto son conceptos comunes a muchos proyectos de DS: obtener, preprocesar, modelar y disponibilizar. Entra Apache Airflow en escena para definir flujos de tareas programáticamente en Python, revisando los operadores más básicos que permiten que nuestro proyecto camine por sí solo.