Por Shelly Fan – 15/jun/2021
A IA finalmente completou o círculo.
Um novo conjunto de algoritmos do Google Brain pode agora projetar chips de computador – aqueles especificamente adaptados para executar software de IA – que superam amplamente os projetados por especialistas humanos. E o sistema funciona em apenas algumas horas, reduzindo drasticamente o processo de semanas ou meses que normalmente atrapalha a inovação digital.
No centro desses designers de chips robóticos está um tipo de aprendizado de máquina chamado aprendizado por reforço profundo. Esta família de algoritmos, vagamente baseada no funcionamento do cérebro humano, triunfou sobre suas inspirações neurais biológicas em jogos como Xadrez, Go e quase todo o catálogo Atari.
Mas o jogo era apenas o treinamento de jardim de infância desses agentes de IA. Mais recentemente, eles cresceram para enfrentar novos medicamentos para Covid-19, resolver um dos maiores desafios da biologia e revelar segredos do cérebro humano.
No novo estudo, ao elaborar o hardware que permite que ele funcione com mais eficiência, o aprendizado por reforço profundo está flexionando seus músculos no mundo real mais uma vez. A equipe habilmente adotou elementos de jogabilidade no desafio de design de chips, resultando em concepções que eram totalmente “estranhas e alheias” aos designers humanos, mas que funcionaram perfeitamente.
Não é apenas teoria. Uma série de elementos de design do chip de IA foram incorporados à unidade de processamento de tensor (TPU) do Google, o chip acelerador de IA da empresa, que foi projetado para ajudar os algoritmos de IA a serem executados de forma mais rápida e eficiente.
“Essa era a nossa visão com este trabalho”, disse a autora do estudo, Anna Goldie. “Agora que o aprendizado de máquina se tornou tão capaz, isso é tudo graças aos avanços em hardware e sistemas, podemos usar IA para projetar sistemas melhores para executar os algoritmos de IA do futuro?”
A ciência e a arte do design de chips
Eu geralmente não penso sobre os microchips no meu telefone, laptop e um zilhão de outros dispositivos espalhados pela minha casa. Mas eles são a base – o “cérebro” do hardware – que controla esses dispositivos amados.
Frequentemente do tamanho de uma unha, os microchips são feitos requintados de engenharia que embalam dezenas de milhões de componentes para otimizar cálculos. Em termos cotidianos, um chip mal projetado significa tempos de carregamento lentos e a roda da morte girando – algo que ninguém quer.
O ponto crucial do projeto do chip é um processo denominado “planejamento básico”, disse o Dr. Andrew Kahng, da Universidade da Califórnia, em San Diego, que não esteve envolvido neste estudo. Semelhante a organizar seus móveis após a mudança para um novo espaço, o planejamento do chip envolve a mudança da localização de diferentes componentes lógicos e de memória em um chip para otimizar a velocidade de processamento e a eficiência energética.
É uma tarefa terrivelmente difícil. Cada chip contém milhões de portas lógicas, que são usadas para computação. Espalhados ao lado deles estão milhares de blocos de memória, chamados blocos de macro, que salvam dados. Esses dois componentes principais são então interligados por dezenas de quilômetros de fiação para que o chip tenha o melhor desempenho possível – em termos de velocidade, geração de calor e consumo de energia.
“Dada essa complexidade impressionante, o próprio processo de design do chip é outro milagre – no qual os esforços dos engenheiros, auxiliados por ferramentas de software especializadas, mantêm a complexidade sob controle”, explicou Kahng. Freqüentemente, a planta baixa leva semanas ou até meses de tentativas e erros meticulosos por especialistas humanos.
No entanto, mesmo com seis décadas de estudo, o processo ainda é uma mistura de ciência e arte. “Até agora, a tarefa de planejamento de piso, em particular, tem desafiado todas as tentativas de automação”, disse Kahng. Uma estimativa mostra que o número de configurações diferentes apenas para a colocação de blocos de macro de “memória” é de cerca de 102.500 – magnitudes maiores do que o número de estrelas no universo.
Jogo para o resgate
Dada essa complexidade, parece loucura tentar automatizar o processo. Mas o Google Brain fez exatamente isso, com um toque inteligente.
Se você pensar em blocos macro e outros componentes como peças de xadrez, o design das fichas se tornará uma espécie de jogo, semelhante aos anteriormente dominados pelo aprendizado por reforço profundo. A tarefa do agente é colocar sequencialmente blocos de macro, um por um, em um chip de maneira otimizada para ganhar o jogo. Claro, qualquer agente ingênuo de IA teria dificuldades. Como aprendizado de fundo, a equipe treinou seu agente com mais de 10.000 plantas baixas de chips. Com essa biblioteca de conhecimento, o agente pode então explorar várias alternativas.
Durante o design, funcionou com um tipo de processo de “tentativa e erro” semelhante a como aprendemos. Em qualquer estágio do desenvolvimento da planta baixa, o agente de IA avalia como está se saindo usando uma estratégia aprendida e decide a maneira mais ideal de seguir em frente, ou seja, onde colocar o próximo componente.
“Ele começa com uma tela em branco e coloca cada componente do chip, um de cada vez, na tela. No final, ele recebe uma pontuação – uma recompensa – com base em seu desempenho ”, explicou Goldie. O feedback é então usado para atualizar toda a rede neural artificial, que forma a base do agente de IA, e prepará-la para outra tentativa.
A pontuação é cuidadosamente elaborada para seguir as restrições do design do chip, que nem sempre são as mesmas. Cada ficha é seu próprio jogo. Alguns, por exemplo, se implantados em um data center, precisarão otimizar o consumo de energia. Mas um chip para carros autônomos deve se preocupar mais com a latência para que possa detectar rapidamente quaisquer perigos potenciais.
O Bio-Chip
Usando essa abordagem, a equipe não encontrou apenas uma solução de design de chip único. Seu agente de IA foi capaz de se adaptar e generalizar, precisando de apenas seis horas extras de computação para identificar soluções otimizadas para quaisquer necessidades específicas.
“Fazer nosso algoritmo generalizar esses diferentes contextos foi um desafio muito maior do que apenas ter um algoritmo que funcionasse para um chip específico”, disse Goldie.
É uma espécie de modo de aprendizado “único”, disse Kahng, na medida em que pode produzir plantas baixas “superiores às desenvolvidas por especialistas humanos para os chips existentes”. Uma linha de pensamento principal parecia ser que o agente de IA estabeleceu macroblocos em ordem decrescente de tamanho. Mas o que se destacou foi o quão estranhos os designs eram. As colocações eram “arredondadas e orgânicas”, uma grande diferença em relação aos designs de chips convencionais com bordas angulares e cantos agudos.
Os designers humanos pensaram “não havia como isso ser de alta qualidade. Eles quase não quiseram avaliá-los”, disse Goldie.
Mas a equipe levou o projeto da teoria à prática. Em janeiro o Google integrou alguns elementos projetados por IA em seus processadores de IA de próxima geração. Embora as especificações sejam mantidas em segredo, as soluções eram intrigantes o suficiente para que milhões de cópias fossem fabricadas fisicamente.
A equipe planeja lançar seu código para a comunidade mais ampla para otimizar ainda mais – e entender – o cérebro da máquina para o design de chips. O que parece mágico hoje pode fornecer insights sobre projetos de plantas baixas ainda melhores, estendendo a Lei de Moore que diminui gradualmente (ou morre) para reforçar ainda mais nosso hardware computacional. Mesmo pequenas melhorias na velocidade ou no consumo de energia na computação podem fazer uma enorme diferença.
“Podemos … esperar que a indústria de semicondutores redobre seu interesse em replicar o trabalho dos autores e busque uma série de aplicações semelhantes em todo o processo de design de chips”, disse Kahng.
“O nível de impacto que [uma nova geração de chips] pode ter na pegada de carbono do aprendizado de máquina, uma vez que é implantado em todos os tipos de data centers diferentes, é realmente valioso. Mesmo um dia antes, isso faz uma grande diferença ”, disse Goldie.
Texto publicado originalmente em Singularity Hub em 15/06/2021
Crédito da Imagem: Laura Ockel / Unsplash