iPhone 17 Pro consegue executar modelo de IA que exige 200 GB de memória

iPhone 17 Pro executa modelo de linguagem com 400 bilhões de parâmetros, quebra barreira de memória e mostra futuro da IA nos dispositivos móveis.

Romário Leite

25/03/2026, às 17:20

Imagem de: iPhone 17 Pro consegue executar modelo de IA que exige 200 GB de memória

O iPhone 17 Pro conseguiu executar um modelo de linguagem com 400 bilhões de parâmetros, algo que normalmente exige um hardware com grande quantidade de memória.

Modelos desse tamanho costumam precisar de pelo menos 200 GB de RAM, mesmo quando comprimidos ou quantizados. Por causa dessas exigências, um smartphone não seria a escolha mais provável para esse tipo de tarefa.

Ainda assim, um vídeo mostrou que a nova geração da Apple conseguiu realizar esse teste usando alguns métodos específicos. A demonstração foi feita com o projeto de código aberto Flash‑MoE, apresentado por @anemll.

O resultado mostrou que o aparelho consegue executar o modelo, mas com limitações. A velocidade de geração foi de apenas 0,6 tokens por segundo, o que representa aproximadamente uma palavra a cada 1,5 a 2 segundos.

Leia tambem: iPhone 17 Pro aparece no espaço durante missão lunar da NASA

Esse ritmo é considerado muito lento para uso cotidiano. Mesmo assim, o teste chama atenção por mostrar que um modelo com 400 bilhões de parâmetros conseguiu rodar em um smartphone.

O desempenho é baixo, mas a demonstração indica que, com mais ajustes e melhorias, pode ser possível executar modelos de linguagem diretamente no dispositivo no futuro.

Para tornar isso possível, os desenvolvedores não carregaram todo o modelo na memória do aparelho. O iPhone 17 Pro possui apenas 12 GB de memória LPDDR5X, valor muito abaixo do necessário.

Em vez disso, o Flash-MoE utilizou o armazenamento interno SSD do aparelho para transmitir dados diretamente para a GPU. Além disso, o sistema usa a arquitetura MoE, sigla para "Mixture of Experts".

Leia tambem: Honor adiciona câmera falsa no Power2 para imitar design do iPhone 17 Pro

Esse método ativa apenas parte dos 400 bilhões de parâmetros durante a geração de cada palavra, reduzindo a carga de processamento.

Running 400B model on iPhone!
0.6 t/s
Credit @danveloper @alexintosh @danpacary @anemll pic.twitter.com/LZCLqsvSUP

— Anemll (@anemll) March 23, 2026

Outro ponto é que executar um modelo localmente oferece mais privacidade, já que as respostas são geradas diretamente no dispositivo, sem necessidade de conexão com a internet.

Por outro lado, esse tipo de operação exige bastante da bateria do aparelho, o que pode reduzir a autonomia durante o uso.

Mesmo com versões comprimidas dos modelos, um sistema com 400 bilhões de parâmetros ainda precisaria de cerca de 200 GB de RAM.

Leia tambem: Apple tira modo Retrato com Night Mode do iPhone 17 Pro e Pro Max — e ninguém sabe o motivo

Esse valor continua muito acima da capacidade do smartphone, o que explica a necessidade das técnicas usadas no teste.

A demonstração mostra que é possível executar um modelo de linguagem extremamente grande em um smartphone, mas a experiência ainda está longe do uso prático.

A diferença entre conseguir rodar o modelo e utilizá-lo de forma funcional ainda é grande, principalmente por causa da velocidade muito baixa.

O teste com o iPhone 17 Pro mostra um avanço técnico importante ao executar um modelo de 400 bilhões de parâmetros em um smartphone.

Leia tambem: Apple mostra como a nova câmara de vapor funciona no iPhone 17 Pro

Mesmo com limitações de velocidade, consumo de bateria e memória, a demonstração indica um caminho para o futuro da inteligência artificial rodando diretamente nos dispositivos móveis, sem depender de servidores externos.