O evento Made by Google 2024 trouxe uma série de novidades, com destaque especial para a apresentação do Gemini Live, a nova versão do assistente de voz do Google para interagir com dispositivos Android.
Inicialmente, o evento parecia ter como foco os lançamentos de hardware, mas foi o Gemini que realmente roubou a cena, demonstrando como a tecnologia de IA da empresa está evoluindo e se integrando ao seu ecossistema.
O Google como um dos gigantes na vanguarda da tecnologia, anunciou oficialmente a substituição do Google Assistant pelo Gemini Live.
Este novo assistente de voz permite que os usuários tenham conversas mais naturais e fluidas, graças ao seu sistema de IA avançado.
O evento foi palco da primeira demonstração ao vivo do Gemini, que, apesar de alguns pequenos desafios técnicos iniciais, mostrou ao público todo o potencial dessa ferramenta.
A grande novidade é que o Gemini Live não será exclusivo dos dispositivos Pixel. O Google demonstrou o assistente em diversos aparelhos, o que evidencia sua estratégia de integrar essa tecnologia em todo o seu ecossistema.
Além disso, a empresa revelou que o Gemini Live estará disponível para dispositivos Android para os assinantes do plano Gemini Advanced, incluído no Google One AI Premium Plan.
Para os proprietários dos novos Pixel 9 Pro e Pro XL, o primeiro ano será gratuito, uma oferta que deve atrair muitos usuários.
Uma das características mais marcantes do Gemini Live é seu recurso de voz aprofundada, que utiliza um mecanismo de fala alimentado por IA para proporcionar um chatbot mais responsivo e emocionalmente inteligente.
Esse assistente é capaz de entender nuances de tom e ajustar suas respostas de acordo, tornando a interação mais humana e menos robótica.
Além disso, os usuários podem interromper o assistente a qualquer momento para fazer perguntas de acompanhamento, tornando a experiência ainda mais dinâmica.
O Gemini Live é impulsionado pelos modelos de IA generativa Gemini 1.5 Pro e Gemini 1.5 Flash, possibilitando ao assistente interpretar e responder a uma quantidade maior de informações contextuais.
Isso viabiliza conversas mais longas e envolventes. No entanto, uma funcionalidade que ainda está ausente é a entrada multimodal, que, segundo rumores, poderá ser introduzida até o final do ano.