Machine Learning y grafos

Accepted

La charla tiene como objetivo hacer una introducción sobre el tema del aprendizaje automático y mostrar cómo aplicarlo a datasets que sean redes. Usando ejemplos open source y datos de citas y redes sociales (Twitter), mostraremos cómo estas técnicas y algoritmos permiten obtener mejores performance en tareas diarias de aprendizaje automático.


Type: Charla estandard, 25 minutos

Level: Medium

Speakers: Federico Albanese, Leandro Lombardi

Speakers Bio: Federico Albanese es analista de datos, miembro del Instituto de Calculo y estudiante doctoral en Ciencias de la Computación en la Universidad de Buenos Aires. En particular, estudia cómo diseñar y adaptar modelos de aprendizaje automático (machine learning) a datos que están estructurados como redes. Es decir, cuando las instancias (nodos) están relacionadas entre si (aristas). Estas nuevas metodologías son validadas usando datasets de origen biológico como el protein data bank o de origen social como redes telefónicas y de tweets. Leandro Lombardi es doctor en matemática por la Universidad de Buenos Aires e investigador CONICET en el Instituto de Calculo de dicha universidad. Con experiencia tanto en el sector publico como privado, actualmente su investigación se centra en el análisis de modelos de aprendizaje automático y sus aplicaciones biológicas. Además, Leandro es docente de la materia "Aprendizaje Automático en Grafos" en la maestría de data mining de la UBA.

Time: 12:30 - 13:00 - 12/05/2019

Room: D

Labels: machine learning redes grafos análisis de datos

Description

En los últimos años, la cantidad de datos disponibles ha aumentado drásticamente. Sin embargo, etiquetar dichos datos es muy costoso. En este escenario, el aprendizaje semi-supervisado emerge como una herramienta de vital importancia, que combina datos etiquetados (aprendizaje automático supervisado) y datos no etiquetados (aprendizaje no supervisado) para hacer mejores predicciones. En particular, los algoritmos basados en grafos tienen en cuenta las relaciones entre las instancias de los datos y las estructuras de gráficos subyacentes para hacer esas predicciones.Además, en el contexto del análisis de datos, hay escenarios que pueden considerarse naturalmente como grafos. Esto ocurre en situaciones donde además de las propiedades individuales de cada instancia, la conectividad entre los elementos del conjunto de datos también es importante (como por ejemplo personas en una red social). Por lo tanto, es lógico que los modelos de aprendizaje automático incluyan información tanto de un nodo como de sus vecinos al hacer una predicción. En esta charla, haremos una breve introducción al aprendizaje automático, recapitularemos distintos modelos y algoritmos para atacar el problema (redes convolucionales en grafos y términos de regularización dependientes de la red) y mostraremos ejemplos y aplicaciones con la intención de que los participantes puedan comenzar a entender y aplicar dichas herramientas y técnicas en sus problemas de aprendizaje automático. Los ejemplos que contaremos incluirán desde redes de citas de papers hasta redes de discusión política en twitter.