Datawarehousing para datos genéticos, socioeconómicos y fenotípicos, con visualización 3D

Aceptada

Se presenta una aplicación para el almacenamiento, análisis, y visualización interactiva de datos heterogéneos pertenecientes al biobanco de la Patagonia (proyecto RAICES), basado en herramientas libres como Django Rest Framework, Vue.js, Bokeh, THREE.js, y contenedores de Docker.


Tipo: Charla estandard, 25 minutos

Nivel: Medio

Disertantes: Luciano Serruya Aloisi, Pablo Toledo Margalef

Biografiá del Disertante: Luciano Serruya Aloisi – Estudiante en la UNPSJB. Linux, Python, y Javascript Pablo Toledo Margalef – Estudiante de la UNPSJB. Linux y Python. Entusiasta de la programación funcional.

Horario: 10:30 - 11:00 - 24/11/2018

Sala: C - J.P. Morgan

Etiquetas/Tags: datawarehouse django mongo desarrollo docker

Descripción completa

El Instituto Patagónico de Ciencias Sociales y Humanas de Ciencias Sociales y Humanas ([IPCSH-CONICET](http://www.ipcsh.conicet.gob.ar/)) estudia cómo se relacionan las costumbres y herencias de la región con variables físicas de interés médico, en particular con rasgos de riesgo para enfermedades complejas como obesidad, sobrepeso y síndrome metabólico, entre otras. El proyecto [RAICES](https://www.facebook.com/proyecto.raices.patagonia/) (iniciativa propia del IPCSH-CONICET) busca generar un banco de datos genéticos o biobanco de la Patagonia que pueda servir para futuras aplicaciones en el diseño de políticas públicas de salud. Este trabajo, realizado a través de una pasantía promovida por el Laboratorio de Ciencias de las Imágenes (LCI) de la Universidad Nacional del Sur, presenta la implementación de un datawarehouse (basado en Python y MongoDB) que permite a los investigadores del proyecto almacenar, consultar y analizar datos heterogéneos propios de la colecta (encuestas socioeconómicas, información geográfica y genética, hábitos alimenticios, modelos 3D, vídeos de cuerpo completo, medidas antropométricas, entre otros). Dado que las fuentes de datos eran diversas, se trabajó en un módulo de *ETL* (*Extract, Transform and Load*) para normalizar los datos y adaptarlos al modelo del datawarehouse. Junto con el datawarehouse se diseñó y desarrolló una [aplicación web](https://youtu.be/CIpbHRLAG0I) para la carga masiva de datos y acceso a los mismos en forma selectiva, brindando también una plataforma interactiva de visualización de datos exploratoria (gráficos y modelos 3D). Se tiene como resultado un framework fácilmente generalizable basado en tecnologías libres disponible para ser utilizado en otros ámbitos científicos Las tecnologías utilizadas para el desarrollo del trabajo fueron las siguientes: Django Rest Framework, Vue.js, Bokeh, THREE.js, Pandas, pyocr, pillow, Mongoengine, Docker Este trabajo fue realizado a través de una pasantía promovida por el Laboratorio de Ciencias de las Imágenes (LCI) de la Universidad Nacional del Sur.