Apple revela novo modelo de IA capaz de editar imagens com gestos

Imagem de: Apple revela novo modelo de IA capaz de editar imagens com gestos

A Apple é uma das empresas líderes em tecnologia, mas ainda está atrás de concorrentes como ChatGPT e Google Gemini em alguns aspectos, principalmente quando se trata de Inteligência Artificial (IA).

No entanto, a empresa tem investido pesado em IA e pretende trazer a tecnologia para a linha iPhone 16 ainda este ano, com o lançamento do iOS 18.

Agora, foi divulgado que os pesquisadores da Apple lançaram um novo modelo de IA que pode editar imagens com base em comandos de linguagem natural do usuário. A tecnologia possivelmente será apresentada no evento WWDC 2024 da empresa em junho.

O novo modelo de IA da Apple, chamado de "MGIE", ou MLLM-Guided Image Editing, é um modelo de linguagem grande multimodal que pode interpretar e executar comandos do usuário em um nível de pixel.

A ferramenta pode manipular e editar diversas áreas de uma imagem, incluindo brilho, nitidez, contraste e muito mais. Ela também pode manipular uma imagem para adicionar efeitos artísticos, como esboços.

Além disso, a edição local pode alterar a forma, a cor, o tamanho e a textura de regiões ou objetos específicos em uma foto. A edição no estilo Photoshop inclui redimensionar, cortar, girar e adicionar filtros à imagem.

Apple AI

Os usuários também podem mudar o fundo da imagem. O modelo de IA da Apple entende o contexto e o raciocínio comum. Por exemplo, você pode adicionar uma imagem de uma pizza e um comando para torná-la mais saudável.

O modelo de IA irá automaticamente adicionar vegetais à imagem, entendendo que a saúde está associada aos vegetais na comida.

Usando os comandos de otimização global, a ferramenta pode manipular a iluminação e o contraste de uma imagem. Além disso, a edição no estilo Photoshop também pode eliminar objetos do fundo da imagem, mediante solicitação do usuário.

Apple IA Manipulando Imagens

A empresa se associou aos pesquisadores da Universidade da Califórnia para criar o MGIE, e uma vez que a tecnologia esteja pronta, a empresa criará várias aplicações para seus dispositivos.

O artigo foi apresentado na Conferência Internacional sobre Representações de Aprendizagem (ICLR) 2024. Os interessados podem conferir o modelo de IA, o código e os dados com modelos pré-treinados no GitHub.

A Apple vem trabalhando em IA há algum tempo, e apesar de estar atrasada neste tipo de tecnologia, seus recursos podem ser diferentes dos já existentes na indústria.

Em dezembro do ano passado, a empresa inventou a técnica de utilização de memória flash, permitindo que modelos de linguagem grandes funcionem no iPhone e em outros produtos da Apple com memória limitada.

Nos últimos meses, a Apple vem testando o "Apple GPT" que poderia competir com o ChatGPT. De acordo com Mark Gurman, da Bloomberg, o trabalho em IA é uma prioridade para a Apple, que está projetando uma estrutura "Ajax" para modelos de linguagem grandes.

Tanto o The Information quanto o analista Jeff Pu afirmam que a Apple terá algum tipo de recurso de IA gerativo disponível no iPhone e no iPad por volta do final de 2024, que é quando o iOS 18 será lançado.

O iOS 18 deve incluir uma versão aprimorada da Siri com funcionalidade de IA gerativa semelhante ao ChatGPT, e tem o potencial de ser a "maior" atualização de software da história do iPhone, segundo Gurman.

Via: VentureBeat