DeepSeek R2 tem custo 97% menor que o GPT-4, diz relatório

Imagem de: DeepSeek R2 tem custo 97% menor que o GPT-4, diz relatório

Nos últimos dias, começaram a surgir rumores sobre o novo modelo de inteligência artificial da DeepSeek, chamado DeepSeek R2.

Parece que a empresa chinesa está preparando algo grande que pode causar um novo impacto no mercado de IA, principalmente por dois motivos: custos bem mais baixos e uso de chips potentes da Huawei.

Para quem não sabe, a DeepSeek ficou famosa quando lançou o modelo R1, que mostrou ao mundo que a China também sabe fazer IA de ponta. Na época, o lançamento derrubou bilhões em valor das ações no mercado americano.

Além disso, o R1 provou que criar modelos de inteligência artificial não precisa custar tanto quanto gigantes como a OpenAI deixavam entender.

Agora, os veículos de comunicação chineses começaram a comentar sobre o DeepSeek R2. E, pelo que está sendo falado, a novidade pode ser ainda mais surpreendente.

Antes de tudo, é bom lembrar que essas informações ainda são rumores, já que a DeepSeek não confirmou oficialmente os números.

Mas as notícias indicam que o R2 deve adotar uma arquitetura híbrida do tipo MoE (Mixture of Experts), que é uma versão mais avançada do que já existe.

Essa tecnologia mistura camadas densas e mecanismos inteligentes para lidar com tarefas mais pesadas de forma eficiente. O novo modelo deve ter o dobro de parâmetros do R1, chegando a 1,2 trilhão de parâmetros.

Para quem não está tão familiarizado, parâmetros são como "peças" que ajudam a IA a entender e gerar informações. Quanto mais parâmetros, mais capacidade o modelo tem.

Com esse tamanho, o R2 poderá competir de frente com pesos-pesados como o GPT-4 Turbo da OpenAI e o Gemini 2.0 Pro do Google. Além da parte técnica, outro ponto que chama a atenção é o custo.

Segundo os rumores, o custo por token (que seria como cada "pedacinho" de uma mensagem) do R2 será 97,4% menor do que o do GPT-4.

Para se ter uma ideia: custo por 1 milhão de tokens de entrada US$ 0,07 e custo por 1 milhão de tokens de saída US$ 0,27. Isso é uma diferença gigantesca.

Se esses valores se confirmarem, o DeepSeek R2 será o modelo mais barato do mercado, oferecendo uma oportunidade excelente para empresas que precisam de IA de alta qualidade gastando bem menos.

Outro detalhe interessante é que o DeepSeek R2 teria sido treinado quase totalmente usando os chips Ascend 910B da Huawei.

Esses chips conseguiram uma utilização de 82%, atingindo uma capacidade impressionante de 512 PetaFLOPS (em precisão FP16, para quem gosta dos detalhes técnicos).

Isso mostra que a DeepSeek está apostando em recursos próprios e da Huawei para não depender de fornecedores externos. Essa estratégia de "fazer tudo dentro de casa" é conhecida como integração vertical, e pode dar à empresa uma vantagem enorme no futuro.

Mesmo sendo rumores, tudo indica que o DeepSeek R2 pode ser uma verdadeira virada de jogo para o mercado de IA. Se tudo isso for confirmado, empresas de todo o mundo terão acesso a uma inteligência artificial de altíssimo nível, pagando muito menos por isso.

Os próximos meses serão decisivos para ver como a OpenAI, Google e outras gigantes vão reagir. O mundo da tecnologia está de olho no que vem da China.

Romário Leite
Fundador do TecFoco. Atua na área de tecnologia há mais de 10 anos, com rotina constante de criação de conteúdo, análise técnica e desenvolvimento de código. Tem ampla experiência com linguagens de programação, sistemas e jogos. Estudou nas universidades UNIPÊ e FIS, tendo passagem também pela UFPB e UEPB. Hoje, usa todo seu conhecimento e experiência para produzir conteúdo focado em tecnologia.