Nos últimos dias, começaram a surgir rumores sobre o novo modelo de inteligência artificial da DeepSeek, chamado DeepSeek R2.
Parece que a empresa chinesa está preparando algo grande que pode causar um novo impacto no mercado de IA, principalmente por dois motivos: custos bem mais baixos e uso de chips potentes da Huawei.
Para quem não sabe, a DeepSeek ficou famosa quando lançou o modelo R1, que mostrou ao mundo que a China também sabe fazer IA de ponta. Na época, o lançamento derrubou bilhões em valor das ações no mercado americano.
Além disso, o R1 provou que criar modelos de inteligência artificial não precisa custar tanto quanto gigantes como a OpenAI deixavam entender.
Agora, os veículos de comunicação chineses começaram a comentar sobre o DeepSeek R2. E, pelo que está sendo falado, a novidade pode ser ainda mais surpreendente.
Antes de tudo, é bom lembrar que essas informações ainda são rumores, já que a DeepSeek não confirmou oficialmente os números.
Mas as notícias indicam que o R2 deve adotar uma arquitetura híbrida do tipo MoE (Mixture of Experts), que é uma versão mais avançada do que já existe.
Essa tecnologia mistura camadas densas e mecanismos inteligentes para lidar com tarefas mais pesadas de forma eficiente. O novo modelo deve ter o dobro de parâmetros do R1, chegando a 1,2 trilhão de parâmetros.
Para quem não está tão familiarizado, parâmetros são como "peças" que ajudam a IA a entender e gerar informações. Quanto mais parâmetros, mais capacidade o modelo tem.
Com esse tamanho, o R2 poderá competir de frente com pesos-pesados como o GPT-4 Turbo da OpenAI e o Gemini 2.0 Pro do Google. Além da parte técnica, outro ponto que chama a atenção é o custo.
Segundo os rumores, o custo por token (que seria como cada "pedacinho" de uma mensagem) do R2 será 97,4% menor do que o do GPT-4.
Para se ter uma ideia: custo por 1 milhão de tokens de entrada US$ 0,07 e custo por 1 milhão de tokens de saída US$ 0,27. Isso é uma diferença gigantesca.
🚨Viral rumors of DeepSeek R2 leaked!
—1.2T param, 78B active, hybrid MoE
—97.3% cheaper than GPT 4o ($0.07/M in, $0.27/M out)
—5.2PB training data. 89.7% on C-Eval2.0
—Better vision. 92.4% on COCO
—82% utilization in Huawei Ascend 910BBig shift away from US supply chain. pic.twitter.com/Jncg0PvEYU
— Deedy (@deedydas) April 26, 2025
Se esses valores se confirmarem, o DeepSeek R2 será o modelo mais barato do mercado, oferecendo uma oportunidade excelente para empresas que precisam de IA de alta qualidade gastando bem menos.
Outro detalhe interessante é que o DeepSeek R2 teria sido treinado quase totalmente usando os chips Ascend 910B da Huawei.
Esses chips conseguiram uma utilização de 82%, atingindo uma capacidade impressionante de 512 PetaFLOPS (em precisão FP16, para quem gosta dos detalhes técnicos).
Isso mostra que a DeepSeek está apostando em recursos próprios e da Huawei para não depender de fornecedores externos. Essa estratégia de "fazer tudo dentro de casa" é conhecida como integração vertical, e pode dar à empresa uma vantagem enorme no futuro.
Mesmo sendo rumores, tudo indica que o DeepSeek R2 pode ser uma verdadeira virada de jogo para o mercado de IA. Se tudo isso for confirmado, empresas de todo o mundo terão acesso a uma inteligência artificial de altíssimo nível, pagando muito menos por isso.
Os próximos meses serão decisivos para ver como a OpenAI, Google e outras gigantes vão reagir. O mundo da tecnologia está de olho no que vem da China.