Ciencia y tecnología

ADN en Google y las brechas de seguridad

Por Prodavinci | 12 de abril, 2013

google adn textoFragmento de un artículo de Luis Miguel Ariza, publicado en El País.

En marzo del año pasado, el genético Yaniv Erlich se sentó delante de la pantalla de su ordenador para enfrentarse a un rompecabezas casi imposible: identificar a los donantes anónimos del Proyecto 1.000 Genomas, que persigue poner a disposición de los investigadores la secuencia completa del ADN de mil personas. Antes de convertirse en genetista, Erlich había trabajado como un pirata informático de guante blanco, asesorando a entidades financieras y compañías de tarjetas de crédito contra los ataques cibernéticos. A su lado tenía a Melissa Gymrek, una estudiante de doctorado del Instituto Tecnológico de Massachusetts (MIT), la cual le había ayudado a desarrollar un algoritmo matemático especial.

Erlich y Gymrek examinaron los genomas de 32 hombres anónimos. Solo conocían su edad y que habían residido en Utah (Estados Unidos). Se fijaron en unos patrones de repetición de secuencias que aparecen en sus cromosomas masculinos, Y (los cuales solo pasan de padres a hijos). Después compararon estas señas de identidad sin nombre con los marcadores genéticos existentes en las bases genealógicas públicas, que tienen nombres y apellidos. Estos bancos de datos son accesibles mediante Google. Son genealogías con un fin recreativo, formadas por participantes que quieren saber más de su árbol genealógico. Estos participantes suelen pagan unos doscientos dólares por los test para averiguar sus marcadores genéticos asociados al cromosoma masculino, e introducen esta información junto con sus apellidos. Los dos expertos lanzaron las huellas genéticas anónimas de sus donantes de Utah como cebo para ver si podían pescar alguna identificación en un mar de 135.000 apellidos.

Hubo suerte. La pesca se cobró ocho peces. Pero Erlich y Gymrek todavía no podían averiguar qué apellido se correspondía con cada marcador. Los científicos del MIT rebuscaron en otras bases de datos, en obituarios y en directorios online. Cruzaron la información y finalmente asociaron con éxito 50 marcadores masculinos con 50 apellidos reales. Publicaron la investigación el pasado enero en la revista Science. El mundo científico se quedó boquiabierto. Con datos disponibles en Internet, Erlich y Gymrek habían logrado bautizar con éxito una secuencia genética de un donante anónimo sin que este tuviera que prestar su ADN para hacer la comparación. En vez de hacer públicos los nombres, advirtieron al Instituto Nacional de la Salud de Estados Unidos (NIH) sobre la brecha de seguridad.

En un mundo virtual donde hay cada vez más datos genéticos en línea, la privacidad empieza a ser casi imposible. Aunque los responsables de Proyecto 1.000 Genomas retiraron de sus bancos de datos la edad de los donantes –que permitió la caza de apellidos de Erlich–, admitieron que era un parche temporal. “Compartir los datos es esencial para el progreso científico, pero tenemos que compaginar esto y buscar soluciones para preservar el anonimato”, indicó Gymrek en una entrevista de Science. “No creemos que la solución estribe en bloquear el acceso a los bancos públicos de datos y las genealogías. La clave consiste en encontrar la manera de regular esta información para que no sea usada de forma maliciosa y sirva para el progreso de la ciencia”.

***

Puede leer el texto completo aquí.

Prodavinci 

Envíenos su comentario

Política de comentarios

Usted es el único responsable del comentario que realice en esta página. No se permitirán comentarios que contengan ofensas, insultos, ataques a terceros, lenguaje inapropiado o con contenido discriminatorio. Tampoco se permitirán comentarios que no estén relacionados con el tema del artículo. La intención de Prodavinci es promover el diálogo constructivo.