Tertúlies: Rercerca i big data

Big data i genòmica

A càrrec de Modesto Orozco i Cedric Notredame (Centre de Regulació Genònmica)

Big Bang Data

La biologia s’està convertint en un dels principals usuaris de la informàtica d’alt rendiment i en un dels majors generadors de grans volums de dades. Els bytes biològics provenen de dues fonts diferents: i) de simulació i ii) d’experiments d’òmiques. Avui les simulacions es duen a terme en un escenari de diversos nivells, des de la resolució atomista fins al nivell cel·lular o fins i tot d’òrgans.


Una senzilla simulació de dinàmica molecular pot generar des de gigues fins a terabytes de dades, i milers d’aquestes simulacions es realitzen cada dia arreu del món. Com homologar, emmagatzemar, organitzar i minar aquestes dades és un problema important sense resoldre. Les òmiques són, però, el primer productor de biobytes, ja que els seqüenciadors estan superant la llei de Moore i estan generant dades de seqüència a una velocitat sense precedents. Petabytes i exabytes òmics no només han de poder ser emmagatzemats, organitzats i minats, sinó que han de poder ser compartits sota estrictes normes de seguretat i confidencialitat. En general, la gestió de les biodades és un dels majors reptes per a la computació científica.

Informació pràctica

Activitats relacionades