TecFoco / Inteligência Artificial / Apple e NVIDIA se unem para melhorar modelos de linguagem

Apple e NVIDIA se unem para melhorar modelos de linguagem

Imagem de: Apple e NVIDIA se unem para melhorar modelos de linguagem

A Apple e a NVIDIA firmaram uma parceria para otimizar o desempenho de Modelos de Linguagem de Grande Escala (LLMs).

O foco dessa colaboração é a técnica ReDrafter, uma abordagem que visa acelerar a geração de texto, reduzir a latência e minimizar o consumo de energia, tudo isso mantendo alta eficiência.

A técnica, também conhecida como Recurrent Drafter, combina duas metodologias avançadas. A busca de feixe, ou beam search, otimiza a escolha de palavras durante a geração de texto, garantindo maior coerência e relevância.

Já a atenção em árvores, ou tree-based attention, organiza os dados de forma hierárquica, o que reduz a complexidade computacional e melhora a velocidade de processamento.

Essa combinação viabiliza resultados de última geração para o mercado de inteligência artificial (IA). A Apple é conhecida por usar seu silício personalizado, mas a empresa uniu esforços com a NVIDIA para integrar o ReDrafter à ferramenta TensorRT-LLM.

Essa ferramenta é muito utilizada para otimizar a execução de LLMs nas GPUs da NVIDIA. Durante o processo, novos operadores foram criados e os já existentes foram adaptados, aumentando a flexibilidade e a capacidade do TensorRT-LLM de lidar com modelos complexos e métodos de decodificação mais sofisticados.

Os benefícios dessa integração são impressionantes. A geração de tokens por segundo teve um aumento de 2,7 vezes em tarefas de decodificação gananciosa, que é uma abordagem simples e eficiente para gerar texto.

Além disso, houve uma redução expressiva na latência, o que significa respostas mais rápidas para os usuários finais.

Tudo isso foi alcançado com menor consumo de energia, uma vantagem necessária em tempos de demanda crescente por eficiência sustentável. O maior impacto dessa inovação é sua aplicação prática em ambientes de produção.

Desenvolvedores de aprendizado de máquina que utilizam GPUs NVIDIA vão poder aproveitar essa tecnologia para construir aplicações mais rápidas e eficientes, ampliando as possibilidades de uso em diversas áreas, como chatbots, sistemas de recomendação e geração de conteúdo.

Apesar do sucesso dessa colaboração, é improvável que a parceria entre Apple e NVIDIA se torne algo comum. As empresas têm um histórico de competição e abordagens tecnológicas distintas.

Mas, essa colaboração mostra que, quando o objetivo é comum, mesmo gigantes da tecnologia podem se unir para impulsionar a inovação.