Data-science a escala, con Python, en Mercadolibre

Accepted

El foco de la charla está en las diferencias entre el desarrollo de un prototipo o POC de machine-learning y un servicio productivo, a escala. Para eso, voy a contar sobre el desarrollo que hicimos, en Mercadolibre, de una plataforma para agilizar el desarrollo y despliegue de modelos entrenados.


Type: Charla estandard, 25 minutos

Level: Medium

Speakers: Carlos Matías de la Torre (a.k.a. Litox)

Speakers Bio: Vivo en la capital nacional de la doma y el folklore, junto a mi pareja y mis 2 hijos León (de 4 años) y Astor (de 6 meses). Desde el PyCamp de 2018, reemplacé el Aikido por el tiro con arco. Tengo +10 años de experiencia profesional con Python. Soy Licenciado en Cs. de la Computación, de la UNC. Trabajé haciendo sitios en Plone (cuando era cool), hice mi tesis procesando imágenes satelitales en Francia, trabajé en la industria aeroespacial, colaboré con los líderes técnicos de Machinalis construyendo soluciones con machine-learning y ahora continúo ese camino en Mercadolibre (a escala regional).

Time: 16:30 - 17:00 - 12/05/2019

Room: AB

Labels: data science machine learning jupyter

Description

Para tratar el tema de la distancia entre el desarrollo experimental de un modelo de machine-learning y los desafíos de servirlo como un servicio production-ready, voy a aprovechar una experiencia de la vida real. En Mercadolibre existe Fury: una plataforma de infraestructura y desarrollo, para el despliegue de microservicios. La misma provee features para build, deploy, gestión de entornos de desarrollo, automatización de la creación de infraestructura, monitoreo, métricas, servicios, etc. Es uno de los principales factores que permitió crecer de 400 desarrolladores a los ~3000 que somos ahora, en pocos años. El problema es que dicha infraestructura no fue diseñada para lidiar con las particularidades asociadas a los sistemas de machine-learning: entornos de experimentación para data-scientists, procesos de ETL, entrenamiento de modelos, acceso a infraestructura específica como GPU, etc. Entonces, en un esfuerzo transversal a la organización, con la colaboración de varios equipos, desarrollamos Fury Data Apps: una extensión a Fury que provee herramientas y servicios para que cualquiera pueda diseñar, experimentar, desarrollar y desplegar sistemas basados en machine-learning, a la escala que Mercadolibre necesita. En esta charla voy a presentar: * las características principales de la plataforma * los problemas que soluciona * el stack tecnológico que la soporta * en general, cómo cubre el gap entre un POC y un sistema production-ready