Pipeline Jungles: Es una selva ahí fuera

Accepted

Alguna vez deployaste un modelo de ML a producción? Y 20 en simultáneo? En esta charla vamos a hablar de todos los anti-patterns y dolores de cabeza que surgen a la hora de orquestar el deploy y reentrenamiento de N modelos a producción, cuando N es mayor a 100. Vamos a aprender qué son los pipelines jungles, la deuda técnica de integración, y nuestra solución en ASAPP para resolverlo.


Type: Charla estandard, 25 minutos

Level: Beginner

Speakers: Axel Sirota

Speakers Bio: Axel Sirota es licenciado en matemáticas con un profundo interés en Deep Learning y el ciclo de vida de los modelos. Actualmente trabaja en ASAPP como Machine Learning Engineer acelerando y mejorando la plataforma de reentrenamiento de modelos para tener un pipeline prolijo, claro, fault tolerant y escalable. Aparte de eso, trabajé +5 años en el CI/CD pipeline del software desde la configuracion de Jenkins hasta produccion.

Time: 12:30 - 13:00 - 12/06/2019

Room: D

Labels: machine learning deuda tecnica orquestración de modelos deep learning

Description

En esta charla vamos a hablar sobre toda la deuda tecnica que es generada por el machine learning de manera encubierta. Como el pipeline del reentrenamiento de modelos y datos usualmente conlleva mucho "glue code" entre diferentes librerias y como ese glue code resulta muy dificil de testear, modularizar, orquestar y suele traer muchos problemas de regresion. Luego vamos a avanzar a discutir sobre diferentes formas de orquestar la plataforma de rentrenamientos, diversos fallos que tuvimos en ASAPP, lecciones aprendidas y caminos a seguir.