Ciencia y tecnología

El ADN: una base de datos compacta y eficaz

Por Prodavinci | 24 de Agosto, 2012

Artículo publicado en El País (España), escrito por Javier Sampedro. A continuación un extracto:

La proeza de escribir el Quijote en la cabeza de una cerilla ha quedado superada. Los genetistas George Church y Sriram Kosuri, de la Universidad de Harvard en Boston, acaban de escribir un libro en una molécula de ADN, el mismísimo material genético que los seres vivos usamos como base de datos desde hace 3.000 millones de años. El ADN se revela así como el soporte más compacto, con una densidad de información muy superior a la de los chips de silicio. Tendría su gracia que el futuro de la nanotecnología acabara estando en la biología.

El sistema ideado por los científicos de Harvard —cuyo departamento lleva el significativo nombre de Instituto Wyss de Ingeniería Inspirada en la Biología— es demasiado caro para resultar viable comercialmente por el momento. Requiere sintetizar moléculas de ADN con la secuencia requerida (atccagtt…) y después leerlas (secuenciarlas, en la jerga), ambas cosas con muy alta precisión. Sin embargo, los costes de sintetizar y secuenciar ADN están cayendo en picado desde hace años, y de forma acelerada, por lo que el archivo de datos en ADN puede alcanzar la viabilidad económica en unos años más. La investigación se publica en Science.

 

Y todo lo demás son ventajas. El ADN permite empaquetar la información con una densidad —cantidad de bits empaquetados por unidad de espacio— que no tiene competidor conocido en la computación convencional ni en la cuántica. No se mide en megas (megabytes, o millones de bytes) ni en gigas (miles de millones de bytes); ni siquiera en teras (billones de bytes) ni en petas (miles de billones de bytes). Hay que medirla en exas (exabytes, o trillones de bytes). En concreto, un gramo de ADN puede empaquetar 455 exabytes, superando a los discos duros actuales en un millón de veces.

Otra ventaja del ADN es su estabilidad. No tanto en los sistemas vivos, como las bacterias o las células humanas, en los que va acumulando mutaciones (cambios de letra) cada vez que se replica. Pero los científicos de Boston no utilizan células vivas en su sistema: sintetizan, manejan y archivan las moléculas de ADN en el tubo de ensayo. La reciente lectura de los genomas del mamut y del hombre de neandertal demuestra que el ADN aguanta en un estado legible al menos 40.000 años. Quizá los chips duren más, pero llevará tiempo demostrarlo.

Lo virtual es real

El salto de lo virtual a lo real parece en verdad trascendente, y suele poner en aprietos a los guionistas de ciencia-ficción, que tienen que hacer encaje de bolillos para que una trama que sólo existe en los ámbitos virtuales de Second Life acabe por hacer explotar algo en el mundo real. Por eso puede parecer extraño que una información incorpórea, como el código html del libro de Church, se pueda traducir en un objeto físico como el ADN, un componente de nuestros cuerpos. Pero en biología no hay tal salto.

La oposición entre virtual y real que todos llevamos grabada en el piloto automático está llena de trampas. El saber ocupa lugar, aun cuando sea un lugar fantasma, difuso y distribuido como la nube, o conjunto de las memorias disponibles en la red. La nube está hecha de cosas físicas, como toda información.

Este principio se revela con particular claridad en el ADN, que es soporte de la información genética en los seres vivos: la parte virtual de la biología. Y que al mismo tiempo es, obviamente, una cosa, la famosa doble hélice que exhiben los museos de la ciencia y los envases de cosméticos.

Church señala aún otra ventaja más: “El papel biológico esencial del ADN provee acceso a las enzimas naturales que sirven para escribirlo y leerlo, y garantiza que el ADN se mantendrá como un estándar de lectura de datos en cualquier futuro previsible”. Hay futuros previsibles en los que no existirá Intel ni Windows, ni siquiera Silicon Valley, pero no hay ninguno en que no existan los sistemas de codificación y lectura de ADN. Ninguno, esto es, salvo la extinción masiva de la vida en la Tierra.

El libro que Church ha elegido para inmortalizarlo en su cabeza de cerilla genética merece mención aparte. “Consideramos varios posibles textos digitales”, explican los genetistas, “incluyendo algunos clásicos que ya se utilizaron para otros avances del almacenamiento de datos, como la Historia de dos ciudades, de Dickens”.

Pero al final Church se decidió por el borrador del libro que él mismo publicará en octubre, Regénesis, que lleva uno de esos subtítulos que nadie podrá rechazar: “Cómo la bilogía sintética va a reinventar la naturaleza y a nosotros mismos”. Church ha inventado de esta forma el marketing genético, o utilización del ADN como campaña de lanzamiento editorial. En octubre sabremos si funciona.

Las técnicas de síntesis y secuenciación de ADN han experimentado avances espectaculares en la última década, y entre los más importantes está su exponencial abaratamiento. El coste de sintetizar ADN —o escribir la información que se quiere almacenar— está cayendo a un ritmo de cinco veces al año, y el de secuenciar, o leer la información, se divide cada año por 12. El coste de los soportes electrónicos solo se divide por 1,6 cada año.

Las técnicas que han puesto a punto los investigadores de Harvard, que representan el estado del arte, o al menos del arte comercialmente disponible, tienen incluso ahora un coste 100.000 veces menor que las primeras que se utilizaron para estos propósitos, hace 15 años. A este ritmo, es cuestión de unos pocos años que el archivo de información en moléculas de ADN empiece a ser rentable, al menos para almacenamiento de muy larga duración.

Church partió, como queda dicho, del borrador de su propio libro Regénesis, que tiene 53.426 palabras, en versión html, el lenguaje estándar de Internet. Su punto de partida, por tanto, es una ristra de unos y ceros, el código binario que, en último término, manejan las tripas de todos los ordenadores.

El paso siguiente es convertir esa ristra de unos y ceros en una molécula de ADN del mundo real, que es como convertir una información abstracta en un objeto físico. Este sistema, como otros anteriores, aprovecha que el ADN es, literalmente, un texto: una ristra de letras (bases, en la jerga) cuyo significado depende del orden exacto que ocupan en la ristra, como el significado de una novela depende del orden exacto de las letras en el texto.

El ADN consiste en largas ristras de cuatro tipos de bases (a, g, c y t, por las iniciales de sus nombres químicos). Usando palabras de dos bases, solo salen 16 (4 elevado a 2) palabras distintas. Con palabras de tres bases, salen 64 (4 elevado a 3) palabras distintas, y esta es justo la estructura del código genético real, donde cada palabra de tres bases significa un aminoácido (los bloques con que se construyen las proteínas).

El sistema de los científicos de Boston se desentiende de esas sutilezas biológicas y se limita a traducir cada cero de la información binaria por las bases ‘a’ o ‘c’; y cada uno de la ristra binaria por las bases ‘g’ o ‘t’. El resultado no tiene ningún significado biológico. Solo significa un libro.

*******

Lea el artículo completo aquí.

Prodavinci 

Envíenos su comentario

Política de comentarios

Usted es el único responsable del comentario que realice en esta página. No se permitirán comentarios que contengan ofensas, insultos, ataques a terceros, lenguaje inapropiado o con contenido discriminatorio. Tampoco se permitirán comentarios que no estén relacionados con el tema del artículo. La intención de Prodavinci es promover el diálogo constructivo.