Big Bang Data
Big data y genómica
A cargo de Modesto Orozco y Cedric Notredame (Centro de Regulación Genómica)
Debates
Gratuito
La biología está convirtiendo en uno de los principales usuarios de la informática de alto rendimiento y en uno de los mayores generadores de grandes volúmenes de datos. Los bytes biológicos provienen de dos fuentes diferentes: i) de simulación y ii) de experimentos de ómicas. Hoy las simulaciones se llevan a cabo en un escenario de varios niveles, desde la resolución atomista hasta el nivel celular o incluso de órganos.
Una sencilla simulación de dinámica molecular puede generar desde gigas hasta terabytes de datos, y miles de estas simulaciones se realizan cada día en todo el mundo. Cómo homologar, almacenar, organizar y minar estos datos es un problema importante sin resolver. Las ómicas son, sin embargo, el primer productor de biobytes, ya que los secuenciadores están superando la ley de Moore y están generando datos de secuencia a una velocidad sin precedentes. Petabytes y exabytes ómicos no solo deben poder ser almacenados, organizados y minados, sino que deben poder ser compartidos bajo estrictas normas de seguridad y confidencialidad. En general, la gestión de los biodatos es uno de los mayores retos para la computación científica.
Participantes: Modesto Orozco, Cédric Notredame
Esta actividad forma parte de Big Bang Data, Tertulias: Investigación y big data