2023 - Recentemente, surgiram avanços significativos na área de supercomputadores que têm o potencial de superar as limitações dos sistemas atuais. Desde novembro de 2022, o ChatGPT impressionou a comunidade com suas notáveis funcionalidades, evidenciando a eficácia da inteligência artificial generativa. Menos de um ano após seu lançamento, uma equipe do MIT apresentou um sistema capaz de fornecer comandos ainda mais robustos do que os suportados pelo ChatGPT, ampliando as capacidades dos programas de aprendizado de máquina.
Adicionalmente, o sistema desenvolvido pela equipe demonstra uma eficiência energética superior em comparação aos supercomputadores modernos que executam modelos de aprendizado de máquina. De acordo com um artigo publicado na revista Nature Photonics, os pesquisadores realizaram a primeira demonstração experimental desse sistema inovador.
O novo supercomputador realiza seus cálculos com base no movimento da luz, em contraste com os sistemas tradicionais que utilizam elétrons. Essa abordagem envolve o uso de centenas de lasers em escala de mícrons. Os resultados da pesquisa revelam uma melhoria de mais de 100 vezes em eficiência energética e 25 vezes na densidade de computação em comparação com os supercomputadores digitais convencionais voltados para o aprendizado de máquina. A equipe destaca a possibilidade de "substancialmente diversas outras ordens de magnitude para melhorias futuras".
Os pesquisadores indicam que essa inovação pode permitir que smartphones e dispositivos de pequeno porte executem programas que atualmente demandam grandes centros de dados. Além disso, como os componentes do sistema podem ser fabricados utilizando processos já existentes, a equipe antecipa sua implementação comercial em poucos anos. Zaijun Chen, principal autor da pesquisa, enfatiza a aplicabilidade potencial em telefones celulares e comunicação de dados, mencionando que as matrizes de laser são amplamente utilizadas nesses dispositivos.
Dirk Englund, professor associado do Departamento de Engenharia Elétrica e Ciência da Computação (EECS) do MIT e líder do projeto, destaca a limitação do ChatGPT em tamanho devido à potência dos supercomputadores atuais. Ele menciona que a nova tecnologia poderá viabilizar modelos de aprendizado de máquina que, de outra forma, seriam economicamente inviáveis. Englund expressa o potencial desse avanço para impulsionar a próxima geração do ChatGPT e outras descobertas nesse domínio tecnológico.
Salto Necessário
As arquiteturas neurais profundas (DNNs), como a empregada no funcionamento do ChatGPT, fundamentam-se em extensos modelos de aprendizado de máquina capazes de emular o processamento de informações do cérebro humano. Entretanto, as tecnologias contemporâneas que impulsionam as DNNs estão se aproximando de seu limite, apesar do contínuo crescimento nesse campo. Além disso, demandam uma quantidade significativa de energia e estão restritas a grandes centros de dados. Esse cenário tem instigado o desenvolvimento de novos paradigmas computacionais.
Benefícios da computação baseada em luz
A nova tecnologia tem o potencial de eliminar os obstáculos atuais. Computações ópticas, por exemplo, têm a capacidade de consumir consideravelmente menos energia em comparação às baseadas em eletrônica. Além disso, com a óptica, é possível alcançar larguras de banda e densidades de computação substancialmente superiores, conforme destacado por Chen. A luz transmite uma quantidade significativamente maior de informações em uma área menor. No entanto, as redes neurais ópticas (ONNs) enfrentam desafios consideráveis. Um exemplo é o consumo excessivo de energia devido à ineficiência na conversão de dados recebidos, inicialmente baseados em energia elétrica, para o formato de luz.
Além disso, os componentes utilizados são volumosos e ocupam um espaço considerável. Mesmo que as ONNs se destaquem em cálculos lineares, como adição, não apresentam o mesmo desempenho quando se trata de cálculos não-lineares, como multiplicação e comandos condicionais.
No entanto, o novo projeto apresenta uma arquitetura compacta que, pela primeira vez, supera todos os desafios anteriores e mais dois adicionais. Essa arquitetura baseia-se em matrizes de última geração de lasers emissores de superfície vertical (VCSELs), uma tecnologia relativamente recente utilizada em aplicações como sensoriamento remoto LiDAR e impressão a laser.
Esses VCSELs específicos foram desenvolvidos em colaboração com o grupo Reitzenstein da Technische Universitat Berlin. A equipe já solicitou a patente do projeto.
"É evidente que a geração atual está distante da escala e do custo necessários para dispositivos práticos. No entanto, estou otimista sobre o que pode ser alcançado nos próximos anos, especialmente considerando o potencial desses sistemas para acelerar IA em grande escala e dispendiosa, como aquelas utilizadas em sistemas textuais 'GPT', como o ChatGPT", afirma Logan Wright, professor assistente da Universidade de Yale, que não participou do projeto.
REFERENCIAS: YOUTUBE
CIENCIA E DADOS
IDEAL MARKETING
TEMPO.COM
CIENCIA HOJE
TECEVOLUÇÃO