A NVIDIA perdeu espaço entre engenheiros de IA por causa dos custos de energia e refrigeração, segundo analistas da Evercore ISI.
Mesmo com a ideia de que as GPUs da empresa entregam um custo total de operação melhor que chips personalizados para IA, o relatório aponta que muitos profissionais da área não estão totalmente convencidos disso.
O CEO da NVIDIA, Jensen Huang, já comentou várias vezes que os chips de IA da empresa custam mais caro porque entregam melhor eficiência de desempenho em comparação com concorrentes.
Ainda assim, a Evercore diz que engenheiros de IA também analisam outros fatores na hora de escolher o hardware, como os custos de energia e refrigeração dos servidores.
- Leia tambem: Intel e NVIDIA podem começar a fabricar GPUs juntas
Consumo de energia e refrigeração pesam no custo dos chips
A análise da Evercore apareceu pouco depois de um relatório do Morgan Stanley tratar do mesmo assunto. Segundo o banco, montar um data center com GPUs Blackwell da NVIDIA pode custar o dobro em comparação com chips personalizados de IA.
Em compensação, o desempenho por watt das GPUs Blackwell seria até oito vezes maior. Mesmo assim, a Evercore aponta que engenheiros de IA não analisam apenas desempenho por watt na comparação entre chips.
Com base em conversas com profissionais da área e empresas hyperscaler, o relatório diz que os usuários também consideram outros custos ligados à operação dos sistemas com hardware da NVIDIA.

Empresas buscam alternativas para reduzir custos
Segundo a Evercore, a mudança de um mercado focado em treinamento de IA para um cenário mais voltado à inferência aumentou a atenção para métricas como custo por token, retorno sobre investimento e custo total de operação.
Isso estaria acelerando o interesse de hyperscalers em ASICs próprios e aceleradores alternativos. A análise segue a mesma linha de comentários feitos por um especialista da Nebius.
Ele comentou que GPUs passaram a ser avaliadas usando métricas como custo por milhão de tokens gerados. O relatório também diz que o avanço da inferência mudou os critérios de compra.
Em vez de focar apenas em largura de banda e desempenho máximo, empresas passaram a considerar custo por token, consumo de energia, refrigeração, taxa de uso e custo total de operação.
A Evercore ainda cita que os argumentos da NVIDIA sobre ganhos de até 35 vezes em desempenho não têm chamado tanta atenção entre engenheiros de IA, que também consideram elevadas as margens brutas da empresa, estimadas em cerca de 70%.
- Leia tambem: CEO da Intel ameaça demitir equipes após estágio B0 para evitar atrasos na produção de chips
Por causa disso, a análise aponta que muitos profissionais estão mais abertos ao uso de ASICs ou alternativas consideradas "boas o suficiente" para reduzir custos operacionais.
O especialista da Nebius também comentou que a demanda por inferência já representa cerca de 95% dos casos de uso corporativos. Segundo ele, chips da Groq têm ganhado preferência em alguns cenários por entregarem maior taxa de processamento.
Evercore ISI: channel checks on GPUs vs ASICs/optics:
"NVDA inference to decline to 50% by 2028 as $AMD, TPU, Trainium, Maia, SRAM chips improve
"average AI engineer willing to use ASICs or “good enough” alternatives to improve economics"
B300 lead times stretched to 12-16 weeks… https://t.co/CZYShl8oFb pic.twitter.com/e5pQB9QPhQ— Sean (@sean_________) May 19, 2026
