Buenas prácticas para lograr que el trabajo en Jupyter notebooks sea reproducible

Aceptada

Una charla en la que intentaré mostrar buenas prácticas aplicadas en el día a día de mi trabajo para poder reproducir Jupyter notebooks dentro de un equipo de Data Scientists.


Tipo: Charla estandard, 25 minutos

Nivel: Principiante

Disertantes: Diego Piloni

Biografiá del Disertante: Licenciado en Ciencias de la Computación de FaMAF, Córdoba. Actualmente trabajando en Mercado Libre como Data Scientist y programador Python

Horario: 10:30 - 11:00 - 05/12/2019

Sala: AB - Onapsis

Etiquetas/Tags: jupyter python git

Descripción completa

El análisis y experimentación en Jupyter Labs es cada vez más común en empresas que necesitan explorar datos. Sin embargo la gran mayoría de ese trabajo es ejecutado pocas veces, ya que termina siendo muy difícil o incluso imposible de reproducir en el tiempo. Para resolver este problema propondré un flujo de trabajo que combina:  * Identificadores de Issues/Tickets (Jira, Trello, Github Projects, etc.)  * Sistemas de control de versiones (git) * Acceso a datos (Queries, S3, gdrive, etc.) * Manejo de dependencias en python