A computação neuromórfica ou engenharia neuromórfica é um conceito desenvolvido por Carver Mead, no final dos anos 1980 para descrever o uso de sistemas de integração em escala muito grande (VLSI) contendo sistemas eletrônicos e circuitos analógicos que imitam arquiteturas neuro-biológicas presentes no sistema nervoso.
Para se aprofundar mais no assunto, falaremos de um grupo de pesquisadores de inteligência artificial que exibiu uma bicicleta autônoma que podia contornar obstáculos, seguir uma pessoa e responder a comandos de voz.
Enquanto a bicicleta autônoma parecia ser pouco útil, a tecnologia de IA ligada a um chip neuromórfico por trás dela era notável, demonstrando um tipo especial de computador de IA.
A computação neuromórfica não é nova, tendo aparecido pela primeira vez na década de 1980, porém, desenvolvimentos recentes no setor de inteligência artificial renovaram o interesse em computadores neuromórficos.
A crescente popularidade do aprendizado profundo e das redes neurais impulsionou uma corrida entre as grandes empresas de tecnologia para desenvolver hardware de IA especializado em cálculos de redes neurais.
Entre as poucas tendências que surgiram nos últimos anos está a computação neuromórfica, que se mostrou promissora devido às suas semelhanças com as redes neurais biológicas e artificiais.
Como as redes neurais profundas funcionam?
No coração dos recentes avanços na inteligência artificial estão as redes neurais artificiais (RNA), um software de IA que segue aproximadamente a estrutura do cérebro humano.
As redes neurais são compostas de neurônios artificiais, pequenas unidades de computação que executam funções matemáticas simples.
Neurônios artificiais não são muito úteis sozinhos, mas quando você os empilha em camadas, eles podem executar tarefas notáveis, como detectar objetos em imagens e transformar áudio de voz em texto.
As redes neurais profundas podem conter centenas de milhões de neurônios, espalhadas por dezenas de camadas.
Ao treinar um algoritmo de aprendizado profundo, os desenvolvedores executam muitos exemplos através da rede neural junto com o resultado esperado.
O modelo de IA ajusta cada um dos neurônios artificiais à medida que analisa cada vez mais dados, gradualmente, tornando-se mais preciso nas tarefas específicas para as quais foi projetado como detectar câncer em slides ou sinalizar transações bancárias fraudulentas.
Os desafios de executar redes neurais no hardware tradicional
Os computadores tradicionais contam com uma ou várias unidades de processamento central CPUs, as CPUs consomem muita energia e podem executar operações complexas em alta velocidade.
Dada a natureza distribuída das redes neurais, executá-las em computadores clássicos é complicado, suas CPUs devem emular milhões de neurônios artificiais através de registros e locais de memória e calcular cada um deles por vez.
As unidades de processamento gráfico GPUs, o hardware usado em jogos e softwares 3D, podem executar muito processamento paralelo e são especialmente bons em realizar a multiplicação de matrizes, operação principal das redes neurais, as matrizes de GPU provaram ser muito úteis em operações de rede neural.
O aumento da popularidade das redes neurais e o aprendizado profundo foram um benefício para os fabricantes de GPU, a empresa de hardware gráfico NVidia viu seu preço subir várias vezes nos últimos anos.
No entanto, as GPUs também não possuem a estrutura física das redes neurais e ainda devem emular neurônios no software, embora a uma velocidade vertiginosa, as diferenças entre GPUs e redes neurais causam muitas ineficiências, como consumo excessivo de energia.
Chips neuromórficos
Ao contrário dos processadores de uso geral, os chips neuromórficos são fisicamente estruturados como redes neurais artificiais, todo chip neuromórfico consiste em muitas pequenas unidades de computação que correspondem a um neurônio artificial.
Ao contrário das CPUs, as unidades de computação em chips neuromórficos não podem realizar muitas operações diferentes, eles têm energia suficiente para desempenhar a função matemática de um único neurônio.
Outra característica essencial dos chips neuromórficos são as conexões físicas entre os neurônios artificiais. Essas conexões tornam os chips neuromórficos mais parecidos com os cérebros orgânicos, que consistem em neurônios biológicos e suas conexões, chamados sinapses.
Criar uma série de neurônios artificiais conectados fisicamente é o que dá aos computadores neuromórficos sua força real.
A estrutura dos computadores neuromórficos os tornam muito mais eficientes no treinamento e na administração de redes neurais.
Eles podem executar modelos de IA a uma velocidade mais rápida do que CPUs e GPUs equivalentes, consumindo menos energia, isso é importante, pois o consumo de energia já é um dos desafios essenciais da IA.
O tamanho menor e o baixo consumo de energia dos computadores neuromórficos os tornam adequados para casos de uso que exigem a execução de algoritmos de IA no limite, em oposição à nuvem.
Os chips neuromórficos são caracterizados pelo número de neurônios que eles contêm, o chip Tianjic, o chip neuromórfico usado na bicicleta autônoma mencionada no início, continha cerca de 40.000 neurônios artificiais e 10 milhões de sinapses em uma área de 3,8 milímetros quadrados.
Comparado a uma GPU executando um número igual de neurônios, Tianjic executou 1,6-100x mais rápido e consome 12-10.000x menos energia, mas 40.000 é um número limitado de neurônios, tanto quanto o cérebro de um peixe, o cérebro humano contém aproximadamente 100 bilhões de neurônios.
AlexNet, uma rede popular de classificação de imagens usada em muitas aplicações, possui mais de 62 milhões de parâmetros, o modelo de linguagem GPT-2 da OpenAI contém mais de um bilhão de parâmetros.
Mas o chip Tianjic era mais uma prova do conceito do que um computador neuromórfico é destinado a usos comerciais.
Além disso, outras empresas já estão desenvolvendo chips neuromórficos prontos para serem usados em diferentes aplicações de IA.
Um exemplo são os chips Loihi da Intel e os computadores Pohoiki Beach, cada chip Loihi contém 131.000 neurônios e 130 milhões de sinapses, o computador Pohoiki, lançado em julho, possui 8,3 milhões de neurônios, o Pohoiki oferece desempenho 1000x melhor e é 10.000x mais eficiente em termos de energia do que as GPUs.
Computação neuromórfica e inteligência artificial geral
Em um artigo publicado na Nature, os pesquisadores de IA que criaram o chip Tianjic, observaram que seu trabalho poderia ajudar a nos aproximar da inteligência artificial geral (IAG).
A IAG deve replicar as capacidades do cérebro humano, para melhorar as atuais tecnologias de IA que são limitadas. Elas podem resolver problemas específicos, mas são ruins em generalizar seus conhecimentos.
Por exemplo, um modelo de IA projetado para jogar um jogo como StarCraft II ficará perdido quando apresentado a outro jogo, como o Dota 2.
Isso exigirá um algoritmo de IA totalmente diferente, de acordo com os designers da Tianjic, seu chip de IA conseguiu resolver vários problemas, incluindo detecção de objetos, reconhecimento de fala, navegação e prevenção de obstáculos, tudo em um único dispositivo.
Mas, embora os chips neuromórficos possam nos aproximar da emulação do cérebro humano, ainda temos um longo caminho a percorrer, a inteligência geral artificial requer mais do que agrupar vários modelos de IA estreitos.
As redes neurais artificiais, em sua essência, são máquinas estatísticas, e as estatísticas não podem ajudar a resolver problemas que exigem raciocínio, entendimento e solução geral de problemas.
Os exemplos incluem a compreensão da linguagem natural e a navegação em mundos abertos. Criar um hardware ANN mais eficiente não resolverá esses problemas, mas talvez ter chips de IA que se pareçam muito mais com nossos cérebros abrirá novos caminhos para entender e criar inteligência.