A AMD anunciou a nova GPU aceleradora AMD Instinct MI350P no formato PCIe. É a primeira placa da linha Instinct com esse padrão em vários anos e foi criada para cargas de trabalho de inteligência artificial.
A Instinct MI350P usa parte da configuração da MI350X, mas em uma versão reduzida. A placa conta com arquitetura CDNA 4, até 4,6 PFLOPs de desempenho em IA, 144 GB de memória HBM3E e consumo de até 600 W.
A conta de energia provavelmente vai pesar no bolso. Segundo a AMD, a proposta da MI350P é ampliar a capacidade de processamento para IA sem exigir mudanças caras na infraestrutura já existente.
O modelo PCIe funciona como uma solução de encaixe direto em servidores padrão com refrigeração a ar e ocupando dois slots. De acordo com a empresa:
"Projetadas para ajudar na era da IA agentic, as placas AMD Instinct MI350P PCIe são modelos dual-slot para servidores padrão com refrigeração a ar. Elas foram criadas para executar inferência localmente dentro da infraestrutura atual de energia, refrigeração e racks do data center. As GPUs AMD Instinct em placas PCIe de menor custo ampliam o portfólio de computação para IA da AMD, oferecendo diferentes opções para empresas em seus processos de adoção de IA."

Entre os principais recursos da Instinct MI350P estão:
- Suporte nativo aos formatos MXFP6 e MXFP4 de baixa precisão;
- Aceleração por sparsity para formatos de 8 e 16 bits;
- Até 2.299 TFLOPs estimados e pico de 4.600 TFLOPs em MXFP4;
- 144 GB de memória HBM3E com largura de banda de até 4 TB/s;
- Ecossistema aberto com opções de desenvolvimento de baixo custo.
Especificações da AMD Instinct MI350P
A AMD Instinct MI350P usa arquitetura CDNA 4 e fabricação de 3nm da TSMC em uma configuração com quatro XCDs, metade do que existe na MI350X. O chip também inclui um die de entrada e saída produzido em 6nm.
A GPU conta com 128 unidades computacionais, equivalentes a 8.192 Stream Processors e 512 núcleos Matrix. O clock pode chegar a 2.200 MHz. No total, o chip possui 73 bilhões de transistores.
Na parte de memória, a placa traz 128 MB de Infinity Cache e 144 GB de memória HBM3E usando barramento de 4.096 bits, com largura de banda de 4 TB/s. A MI350X, em comparação, possui 288 GB de HBM3E e barramento de 8.192 bits.
O modelo mede 267 mm de comprimento e usa refrigeração passiva, algo comum em servidores. A alimentação é feita por um conector de 16 pinos para suportar o TBP de 600 W, mas a placa também pode operar em configuração reduzida de 450 W.
- Leia tambem: Samsung e SK hynix usam estratégias diferentes para desenvolver nova geração de memória DRAM voltada para IA

Desempenho da GPU para IA
A AMD divulgou os seguintes números de desempenho para a Instinct MI350P:
- 4,6 PFLOPs em MXFP4;
- 4,6 PFLOPs em MXFP6;
- 2,3 PFLOPs em MXFP8;
- 2,3 PFLOPs FP16 com sparsity;
- 1,15 PFLOPs FP16;
- 72 TFLOPs FP16;
- 72 TFLOPs FP32;
- 36 TFLOPs FP64;
- 2,3 POPs INT8;
- 4,6 POPs INT8 com sparsity;
- 1,15 PFLOPs BFloat16;
- 2,30 PFLOPs BFloat16 com sparsity.
Segundo a AMD, a linha MI350 possui aceleração nativa para diferentes formatos usados em IA corporativa, incluindo MXFP6 e MXFP4.

Concorrência com NVIDIA H200 NVL
A AMD Instinct MI350P vai disputar espaço com a NVIDIA H200 NVL, último acelerador PCIe da NVIDIA voltado para servidores. O modelo da NVIDIA usa GPU Hopper H200 e conta com 141 GB de memória HBM3E.
A NVIDIA também lançou a RTX PRO 6000 Blackwell na versão para servidores, mas ela utiliza o chip GB202 em vez do GB200, voltado diretamente para data centers. Esse modelo traz 96 GB de memória GDDR7.
Os modelos H200 NVL custam entre US$ 30 mil e US$ 40 mil, algo entre R$ 170 mil e R$ 227 mil na cotação atual, sem contar impostos e aquela tradicional "taxa invisível" do mercado corporativo.
A AMD disse que as GPUs Instinct MI350P PCIe já estão disponíveis por meio de parceiros e contam com ecossistema aberto e suporte à plataforma ROCm para softwares corporativos de IA.