Buenas prácticas para lograr que el trabajo en Jupyter notebooks sea reproducible

Accepted

Una charla en la que intentaré mostrar buenas prácticas aplicadas en el día a día de mi trabajo para poder reproducir Jupyter notebooks dentro de un equipo de Data Scientists.


Type: Charla estandard, 25 minutos

Level: Beginner

Speakers: Diego Piloni

Speakers Bio: Licenciado en Ciencias de la Computación de FaMAF, Córdoba. Actualmente trabajando en Mercado Libre como Data Scientist y programador Python

Time: 10:30 - 11:00 - 12/05/2019

Room: AB

Labels: jupyter python git

Description

El análisis y experimentación en Jupyter Labs es cada vez más común en empresas que necesitan explorar datos. Sin embargo la gran mayoría de ese trabajo es ejecutado pocas veces, ya que termina siendo muy difícil o incluso imposible de reproducir en el tiempo. Para resolver este problema propondré un flujo de trabajo que combina:  * Identificadores de Issues/Tickets (Jira, Trello, Github Projects, etc.)  * Sistemas de control de versiones (git) * Acceso a datos (Queries, S3, gdrive, etc.) * Manejo de dependencias en python