Inovações e Descobertas

Adicionar novas letras ao alfabeto de DNA duplica a densidade de armazenamento de dados

dnaalfabeto103/03/2022 - Como na maioria das coisas, o sistema de armazenamento de dados da natureza, o DNA, supera em muito tudo o que criamos. Agora, pesquisadores da Universidade de Illinois Urbana-Champaign dobraram sua já incrível capacidade de armazenamento adicionando letras extras ao seu “alfabeto” e desenvolveram uma nova maneira de lê-lo de volta. O DNA é naturalmente composto de combinações de quatro nucleobases: adenina, guanina, citosina e timina.

Representadas pelas letras A, G, C e T, essas bases se agrupam em diferentes sequências para formar plantas para cada organismo vivo. E esse sistema de armazenamento de informações é incrivelmente denso, com um único grama de DNA capaz de armazenar até 215 petabytes (215 milhões de GB) de dados.

Isso, obviamente, o torna uma solução de armazenamento em potencial muito atraente para as enormes quantidades de dados que a sociedade moderna produz diariamente – todo o conteúdo da Internet poderia caber em uma caixa de sapatos cheia de DNA. E como se esse armazenamento não fosse denso o suficiente, os pesquisadores do novo estudo encontraram uma maneira de duplicá-lo. Juntamente com as usuais A, G, C e T, a equipe efetivamente adicionou sete “letras” extras ao alfabeto do DNA. Estes assumem a forma de nucleotídeos quimicamente modificados, abrindo combinações mais variadas que permitem que mais informações sejam armazenadas dentro do mesmo espaço físico.

“Imagine o alfabeto inglês”, disse Kasra Tabatabaei, coautora do estudo. “Se você tivesse apenas quatro letras para usar, só poderia criar tantas palavras. Se você tivesse o alfabeto completo, poderia produzir combinações ilimitadas de palavras. É o mesmo com o DNA. Em vez de converter zeros e uns em A, G, C e T, podemos converter zeros e uns em A, G, C, T e as sete novas letras do alfabeto de armazenamento.”

Leia também - Você comeria bifes produzidos em impressoras 3D?

Obviamente, adicionar nucleotídeos extras significa que os sistemas existentes de leitura de dados não os reconhecerão, então a equipe também desenvolveu um novo sistema que pode. A fita de DNA passa por um nanoporo em uma proteína especialmente projetada, que pode detectar as unidades individuais, independentemente de serem naturais ou sintéticas. Os algoritmos de aprendizado de máquina decodificam as informações armazenadas.

“Tentamos 77 combinações diferentes dos 11 nucleotídeos e nosso método foi capaz de diferenciar cada um deles perfeitamente”, disse Chao Pan, coautor do estudo. “A estrutura de aprendizado profundo como parte de nosso método para identificar diferentes nucleotídeos é universal, o que permite a generalização de nossa abordagem para muitas outras aplicações.” Além da densidade, o novo método também melhora a velocidade de gravação dos dados, que normalmente é um processo bastante lento para o DNA. Esse sistema reduziu pela metade o tempo necessário para gravar informações no DNA.

Esse trabalho pode ajudar a tornar o DNA um sistema de armazenamento de dados viável, embora ainda haja muito trabalho a ser feito.

A pesquisa foi publicada na revista Nano Letters.

Fonte: Universidade de Illinois Urbana-Champaign