La Universitat de Waterloo premia un treball pioner en l'anàlisi de dades en sistemes complexos elaborat amb la participació de I'IFISC

El premi reconeix una nova eina d'animació gràfica que permet detectar i visualitzar quins són els canvis més rellevants en una xarxa en evolució

Przemyslaw A. Grabowicz, investigador de l’IFISC (CSIC-UIB), Lucca M. Aiello (Yahoo! Research Barcelona) i Filippo Menczer (Universitat d’Indiana, Bloomington) han estat reconeguts amb el premi CAD WICI Data Challenge, dotat amb 10.000 dòlars, pel treball «Fast visualisation of relevant portions of large dynamic networks». El guardó, que atorga l'Institut Waterloo per a la Complexitat i la Innovació de la Universitat de Waterloo (Ontario, Canadà), reconeix la novetat i utilitat del treball especialment per a la futura labor de la comunitat científica a la xarxa. 

En l'època del Big Data, de les grans concentracions de dades, el desafiament és com podem visualitzar-les per poder-les analitzar amb facilitat. El treball premiat presenta un algorisme ràpid que selecciona subconjunts d'elements que representen millor un gràfic en evolució i permeten visualitzar-lo, bé amb la creació d'una pel·lícula, bé reproduint-lo en temps real, amb una eina interactiva de visualització de la xarxa. Aquest mètode, que ja està disponible a la pàgina web <http://truthy.indiana.edu/movies>, utilitza poca memòria i temps de processador. També es pot consultar un article amb més informació a l’enllaç següent: <http://arxiv.org/abs/1308.0309>.

Un exemple a les xarxes socials

Un exemple de xarxa en moviment el podem trobar a Twitter. En aquest cas, el projecte permet introduir una etiqueta (hashtag) i conèixer com ha evolucionat a la xarxa en un període de temps concret. L'algorisme crea automàticament un gràfic, a manera de videoclip, que permet veure els moments de major concentració d’etiquetes, com evolucionen al costat d'altres etiquetes i a través de quins usuaris es propaga més.

A manera d'exemple introduïm l’etiqueta: #superbowl des d'unes hores abans de l'esdeveniment fins que acaba. En el primer gràfic veiem com amb prou feines hi ha moviment. Només tuitegen els Baltimore Ravens #Ravens i els San Francisco 49ers #49ers, els equips en competició. 

Durant el partit l'activitat és més alta, i surten comentaris relacionats amb els anuncis publicitaris que s'emeten en les pauses.

I més endavant també surten nombroses etiquetes relacionades amb #blackout, ja que es va produir una apagada de llum en un dels descansos.

Es poden consultar aquest i altres vídeos d'exemple a: http://www.youtube.com/channel/ucuckahiqkfhrscn2iwqubvq

Un treball nou

El fet que avui dia disposem d'una gran quantitat de dades com les procedents de xarxes socials ha motivat el desenvolupament d'eines per processar i visualitzar gràficament l'evolució de les xarxes que conformen. Encara que hi ha una mica de literatura sobre el disseny dinàmic dels gràfics, no hi ha molts treballs que ens diguin en quins hem de fixar-nos, com es poden seleccionar, quins són els elements més importants a seguir, que estan en contínua evolució.

El treball contribueix a omplir aquest buit mitjançant la presentació d'una nova eina d'animació gràfica que processa una seqüència cronològica de les interaccions entre els elements del gràfic; selecciona dinàmicament les parts més rellevants de la xarxa per visualitzar, diferenciant entre els elements més antics i els que mostren nova activitat; produeix un arxiu que representa l'evolució de la xarxa o, alternativament, es connecta a la interfície gràfica Gephi, una eina útil per a la visualització en viu de la gràfica en evolució, i és prou ràpida per ser aplicada a grans fluxos de dades en línia i visualitzar la seva representació en forma de xarxa.

En paraules del comitè encarregat del premi, aquest treball contribueix d'una manera molt notable a l'exploració i visualització de xarxes complexes, destacant especialment el senzill format d'accés a l'algorisme, cosa que fa que sigui fàcil d'usar en diversos contextos. A més, permet una àmplia flexibilitat de maneig de la sortida de l'algorisme, fet que, unit als senzills i funcionals mecanismes de filtratge de què disposa, permet centrar l'atenció visual en els aspectes clau del sistema en evolució. Finalment, l'excel·lent escalabilitat i el rendiment del mètode el converteixen en una eina que suposa un avanç substancial en aquest camp.

El jurat destaca l'amplitud de possibilitats d'ús d'aquest algorisme, atès que es podria utilitzar en anàlisis longitudinals de les xarxes socials, però també en ciències socials i ciències computacionals, entre d’altres.

Els autors del treball guardonat el presentaran amb una demostració pràctica la propera tardor a la seu del Waterloo Institute.

Documents relacionats

Data de l'esdeveniment: 03/09/2013

Data de publicació: 03/09/2013