A Apple desenvolveu uma nova ferramenta de inteligência artificial (IA) que pode animar imagens estáticas com base em comandos de texto do usuário.
A ferramenta, chamada de Keyframer, pode ser uma grande aliada para os criadores de conteúdo digital, pois permite criar animações rápidas e personalizadas a partir de imagens em formato SVG (Scalable Vector Graphic).
Keyframer funciona com os modelos de linguagem de grande porte (LLMs) da Apple, que são capazes de gerar código CSS (Cascading Style Sheets) para animar as imagens.
O usuário só precisa enviar uma imagem SVG, como um foguete, por exemplo, e digitar um comando de texto, como "gerar três designs onde o céu muda de cor e as estrelas piscam".
A ferramenta então gera uma nova imagem usando um código CSS correspondente, que pode ser editado ou estendido pelo usuário com novos prompts, uma abordagem muito semelhante a do ChatGPT.
Segundo o artigo de pesquisa da Apple, Keyframer permite que o usuário refine suas animações por meio de comandos sequenciais, em vez de ter que especificar todo o design de uma vez.
O artigo também afirma que a ferramenta foi inspirada por entrevistas com profissionais de design e engenharia de animação, e que os participantes do estudo ficaram impressionados com a rapidez e a facilidade de uso da ferramenta.
A nova ferramenta de IA da Apple é mais uma das inovações da empresa no campo da IA, que apesar de estar muito atrás de empresas como Google e OpenAI, vem investindo em oferecer recursos exclusivos para seus produtos.
Anteriormente, a Apple já havia revelado outra ferramenta de IA que pode editar e manipular imagens com base em comandos de linguagem natural, chamada de MGIE (MLLM-Guided Image Editing).
A Apple ainda não anunciou quando ou como irá disponibilizar Keyframer para o público, mas há rumores de que a empresa irá apresentar algumas dessas ferramentas de IA no evento WWDC 2024, em junho.
Enquanto isso, os usuários do iOS podem experimentar o recurso de IA Gemini do Google, que é oferecido pelo Google App e está disponível nos iPhones.
O Gemini é um modelo de IA conversacional que pode auxiliar em diversas tarefas, como fornecer inspiração criativa, traduzir idiomas, aprender novos assuntos e muito mais.
O Gemini está disponível no Google App para iOS desde fevereiro de 2024, e pode ser acessado pelo ícone de estrela na tela inicial do aplicativo. Ele também pode ser usado pelo navegador, acessando o site gemini.google.com.