Buenas prácticas para lograr que el trabajo en Jupyter notebooks sea reproducible
Aceptada
Una charla en la que intentaré mostrar buenas prácticas aplicadas en el día a día de mi trabajo para poder reproducir Jupyter notebooks dentro de un equipo de Data Scientists.
Tipo: Charla estandard, 25 minutos
Nivel: Principiante
Disertantes: Diego Piloni
Biografiá del Disertante: Licenciado en Ciencias de la Computación de FaMAF, Córdoba. Actualmente trabajando en Mercado Libre como Data Scientist y programador Python
Horario: 10:30 - 11:00 - 05/12/2019
Sala: AB - Onapsis
Etiquetas/Tags: jupyter python git
Descripción completa
El análisis y experimentación en Jupyter Labs es cada vez más común en empresas que necesitan explorar datos. Sin embargo la gran mayoría de ese trabajo es ejecutado pocas veces, ya que termina siendo muy difícil o incluso imposible de reproducir en el tiempo. Para resolver este problema propondré un flujo de trabajo que combina: * Identificadores de Issues/Tickets (Jira, Trello, Github Projects, etc.) * Sistemas de control de versiones (git) * Acceso a datos (Queries, S3, gdrive, etc.) * Manejo de dependencias en python