El sistema ideado por los científicos de Harvard —cuyo departamento lleva el significativo nombre de Instituto Wyss de Ingeniería Inspirada en la Biología— es demasiado caro para resultar viable comercialmente por el momento. Requiere sintetizar moléculas de ADN con la secuencia requerida (atccagtt...) y después leerlas (secuenciarlas, en la jerga), ambas cosas con muy alta precisión. Sin embargo, los costes de sintetizar y secuenciar ADN están cayendo en picado desde hace años, y de forma acelerada, por lo que el archivo de datos en ADN puede alcanzar la viabilidad económica en unos años más. La investigación se publica en Science.
Y todo lo demás son ventajas. El ADN permite empaquetar la información con una densidad —cantidad de bits empaquetados por unidad de espacio— que no tiene competidor conocido en la computación convencional ni en la cuántica. No se mide en megas (megabytes, o millones de bytes) ni en gigas (miles de millones de bytes); ni siquiera en teras (billones de bytes) ni en petas (miles de billones de bytes). Hay que medirla en exas (exabytes, o trillones de bytes). En concreto, un gramo de ADN puede empaquetar 455 exabytes, superando a los discos duros actuales en un millón de veces.
Otra ventaja del ADN es su estabilidad. No tanto en los sistemas vivos, como las bacterias o las células humanas, en los que va acumulando mutaciones (cambios de letra) cada vez que se replica. Pero los científicos de Boston no utilizan células vivas en su sistema: sintetizan, manejan y archivan las moléculas de ADN en el tubo de ensayo. La reciente lectura de los genomas del mamut y del hombre de neandertal demuestra que el ADN aguanta en un estado legible al menos 40.000 años. Quizá los chips duren más, pero llevará tiempo demostrarlo.
Church señala aún otra ventaja más: “El papel biológico esencial del ADN provee acceso a las enzimas naturales que sirven para escribirlo y leerlo, y garantiza que el ADN se mantendrá como un estándar de lectura de datos en cualquier futuro previsible”. Hay futuros previsibles en los que no existirá Intel ni Windows, ni siquiera Silicon Valley, pero no hay ninguno en que no existan los sistemas de codificación y lectura de ADN. Ninguno, esto es, salvo la extinción masiva de la vida en la Tierra.
El libro que Church ha elegido para inmortalizarlo en su cabeza de cerilla genética merece mención aparte. “Consideramos varios posibles textos digitales”, explican los genetistas, “incluyendo algunos clásicos que ya se utilizaron para otros avances del almacenamiento de datos, como la Historia de dos ciudades, de Dickens”.
Pero al final Church se decidió por el borrador del libro que él mismo publicará en octubre, Regénesis, que lleva uno de esos subtítulos que nadie podrá rechazar: “Cómo la bilogía sintética va a reinventar la naturaleza y a nosotros mismos”. Church ha inventado de esta forma el marketing genético, o utilización del ADN como campaña de lanzamiento editorial. En octubre sabremos si funciona.
Las técnicas de síntesis y secuenciación de ADN han experimentado avances espectaculares en la última década, y entre los más importantes está su exponencial abaratamiento. El coste de sintetizar ADN —o escribir la información que se quiere almacenar— está cayendo a un ritmo de cinco veces al año, y el de secuenciar, o leer la información, se divide cada año por 12. El coste de los soportes electrónicos solo se divide por 1,6 cada año.
Las técnicas que han puesto a punto los investigadores de Harvard, que representan el estado del arte, o al menos del arte comercialmente disponible, tienen incluso ahora un coste 100.000 veces menor que las primeras que se utilizaron para estos propósitos, hace 15 años. A este ritmo, es cuestión de unos pocos años que el archivo de información en moléculas de ADN empiece a ser rentable, al menos para almacenamiento de muy larga duración.
Church partió, como queda dicho, del borrador de su propio libro Regénesis, que tiene 53.426 palabras, en versión html, el lenguaje estándar de Internet. Su punto de partida, por tanto, es una ristra de unos y ceros, el código binario que, en último término, manejan las tripas de todos los ordenadores.
El paso siguiente es convertir esa ristra de unos y ceros en una molécula de ADN del mundo real, que es como convertir una información abstracta en un objeto físico. Este sistema, como otros anteriores, aprovecha que el ADN es, literalmente, un texto: una ristra de letras (bases, en la jerga) cuyo significado depende del orden exacto que ocupan en la ristra, como el significado de una novela depende del orden exacto de las letras en el texto.
El ADN consiste en largas ristras de cuatro tipos de bases (a, g, c y t, por las iniciales de sus nombres químicos). Usando palabras de dos bases, solo salen 16 (4 elevado a 2) palabras distintas. Con palabras de tres bases, salen 64 (4 elevado a 3) palabras distintas, y esta es justo la estructura del código genético real, donde cada palabra de tres bases significa un aminoácido (los bloques con que se construyen las proteínas).
El sistema de los científicos de Boston se desentiende de esas sutilezas biológicas y se limita a traducir cada cero de la información binaria por las bases ‘a’ o ‘c’; y cada uno de la ristra binaria por las bases ‘g’ o ‘t’. El resultado no tiene ningún significado biológico. Solo significa un libro.
No hay comentarios.:
Publicar un comentario