Home / Inteligência Artificial / DeepSeek R2 tem custo 97% menor que o GPT-4, diz relatório

DeepSeek R2 tem custo 97% menor que o GPT-4, diz relatório

Imagem de: DeepSeek R2 tem custo 97% menor que o GPT-4, diz relatório

Nos últimos dias, começaram a surgir rumores sobre o novo modelo de inteligência artificial da DeepSeek, chamado DeepSeek R2.

Parece que a empresa chinesa está preparando algo grande que pode causar um novo impacto no mercado de IA, principalmente por dois motivos: custos bem mais baixos e uso de chips potentes da Huawei.

Para quem não sabe, a DeepSeek ficou famosa quando lançou o modelo R1, que mostrou ao mundo que a China também sabe fazer IA de ponta. Na época, o lançamento derrubou bilhões em valor das ações no mercado americano.

Além disso, o R1 provou que criar modelos de inteligência artificial não precisa custar tanto quanto gigantes como a OpenAI deixavam entender.

Agora, os veículos de comunicação chineses começaram a comentar sobre o DeepSeek R2. E, pelo que está sendo falado, a novidade pode ser ainda mais surpreendente.

Antes de tudo, é bom lembrar que essas informações ainda são rumores, já que a DeepSeek não confirmou oficialmente os números.

Mas as notícias indicam que o R2 deve adotar uma arquitetura híbrida do tipo MoE (Mixture of Experts), que é uma versão mais avançada do que já existe.

Essa tecnologia mistura camadas densas e mecanismos inteligentes para lidar com tarefas mais pesadas de forma eficiente. O novo modelo deve ter o dobro de parâmetros do R1, chegando a 1,2 trilhão de parâmetros.

Para quem não está tão familiarizado, parâmetros são como "peças" que ajudam a IA a entender e gerar informações. Quanto mais parâmetros, mais capacidade o modelo tem.

Com esse tamanho, o R2 poderá competir de frente com pesos-pesados como o GPT-4 Turbo da OpenAI e o Gemini 2.0 Pro do Google. Além da parte técnica, outro ponto que chama a atenção é o custo.

Segundo os rumores, o custo por token (que seria como cada "pedacinho" de uma mensagem) do R2 será 97,4% menor do que o do GPT-4.

Para se ter uma ideia: custo por 1 milhão de tokens de entrada US$ 0,07 e custo por 1 milhão de tokens de saída US$ 0,27. Isso é uma diferença gigantesca.

Se esses valores se confirmarem, o DeepSeek R2 será o modelo mais barato do mercado, oferecendo uma oportunidade excelente para empresas que precisam de IA de alta qualidade gastando bem menos.

Outro detalhe interessante é que o DeepSeek R2 teria sido treinado quase totalmente usando os chips Ascend 910B da Huawei.

Esses chips conseguiram uma utilização de 82%, atingindo uma capacidade impressionante de 512 PetaFLOPS (em precisão FP16, para quem gosta dos detalhes técnicos).

Isso mostra que a DeepSeek está apostando em recursos próprios e da Huawei para não depender de fornecedores externos. Essa estratégia de "fazer tudo dentro de casa" é conhecida como integração vertical, e pode dar à empresa uma vantagem enorme no futuro.

Mesmo sendo rumores, tudo indica que o DeepSeek R2 pode ser uma verdadeira virada de jogo para o mercado de IA. Se tudo isso for confirmado, empresas de todo o mundo terão acesso a uma inteligência artificial de altíssimo nível, pagando muito menos por isso.

Os próximos meses serão decisivos para ver como a OpenAI, Google e outras gigantes vão reagir. O mundo da tecnologia está de olho no que vem da China.