Airflow para Data Scientists
Accepted
Data Scientists: amantes de los notebooks, en eterna enemistad con los entornos productivos. Pero hay un patrón común a muchos proyectos de DS: el de un ET(F)L. Obtener los datos, preprocesarlos, modelar y disponibilizar el modelado es el núcleo que los define. Veamos como podemos agilizar y simplificar este flujo.
Type: Charla estandard, 25 minutos
Level: Beginner
Speakers: Ignacio Javier Mermet
Speakers Bio: Soy estudiante de Ingeniería en Informática en FIUBA, trabajo como Data Scientist Ssr. Me encanta leer, estudiar y experimentar sobre ideas nuevas y ciencias que no conozco.
Time: 16:00 - 16:30 - 12/05/2019
Room: D - Invgate
Labels: data science apache airflow etfl
Description
Con la intención de predecir la disponibilidad de bicicletas públicas en cada parada, pensaremos un flujo de trabajo para llevarlo a cabo. Veremos que el núcleo del proyecto son conceptos comunes a muchos proyectos de DS: obtener, preprocesar, modelar y disponibilizar. Entra Apache Airflow en escena para definir flujos de tareas programáticamente en Python, revisando los operadores más básicos que permiten que nuestro proyecto camine por sí solo.