Apple cria IA que edita fotos com base comando de texto

Apple cria IA que edita fotos com base comando de texto
photo_2023-04-04_18-01-39

Uma equipe de pesquisadores da Apple criou um novo modelo de inteligência artificial capaz de cortar, redimensionar, aplicar filtros, modificar objetos inteiros e fazer uma série de edições avançadas em fotos.

iPhone SE 4 pode herdar Dynamic Island do iPhone 15 Alemanha barra pessoas que tentaram comprar Apple Vision Pro sem taxas

A novidade foi batizada de MLLM-Guided Image Editing (MGIE) e projetada em parceria com a Universidade da Califórnia, nos Estados Unidos. Essa é uma das primeiras iniciativas públicas envolvendo inteligência artificial “moderna” por parte da empresa.

Pedido simples, resultado complexo

Em tese, o MGIE não foge ao que tecnologias semelhantes como DALL-3 e Midjourney já conseguem entregar atualmente. Contudo, o diferencial do modelo de IA da Apple seria a sua alta capacidade de interpretação: ele consegue identificar e executar qualquer pedido do usuário — tornando-se acessível mesmo para quem jamais tocou em um programa de edição.


Siga o Canaltech no Twitter e seja o primeiro a saber tudo o que acontece no mundo da tecnologia.

Explicando melhor, a inteligência artificial da Maçã combina dois diferentes modelos de linguagem multimodal, sendo o primeiro capaz de interpretar solicitações e o segundo voltado para “desvendar” o que a pessoa tem em mente, mesmo que a descrição enviada não tenha sido técnica o suficiente.

Por exemplo, se alguém pedir um “céu mais azul em uma foto”, o MGIE pode compreender que o brilho da foto deve ser aumentado. Ou se o usuário solicitar que a foto de uma pizza de calabresa aparente ser mais saudável, a IA pode substituir a carne por uma cobertura de legumes e vegetais.

Exemplos de edições de imagens com base nas capacidades do MGIE (Imagem: Divulgação/Apple)

Se o resultado não for o desejado, o usuário pode solicitar uma nova interpretação, cabendo à inteligência artificial generativa mexer em outros aspectos da imagem até que chegue em um resultado satisfatório.

Apesar de oferecer tal nível de precisão, a Gigante de Cupertino destaca que os prompts devem ser claros e detalhados, a fim de que as edições cheguem o mais próximo possível do resultado esperado.

Onde baixar o MGIE

Desenvolvedores e entusiastas de tecnologia já pode acessar o MGIE, que foi disponibilizado para download através do GitHub no endereço github.com/apple/ml-mgie. Outro repositório que conta com a novidade da Apple é o Hugging Face Spaces, disponível em huggingface.co.

A Big Tech não deu detalhes quanto à aplicação do novo modelo em seus produtos, abrindo brechas para uma infinidade de especulações —  quem sabe o MGIE não integre o iOS 18 e também venha equipado no iPhone 16 e no recém-lançado Apple Vision Pro. Resta aguardar para saber mais detalhes.

Leia a matéria no Canaltech.

Trending no Canaltech:

Mulher-Maravilha diz quem realmente venceria a luta Batman vs Superman Brahma Phone: conheça o celular descartável para o Carnaval Modo Carnaval do Nubank promete mais segurança aos foliões WhatsApp lança pacote de figurinhas para o Carnaval 12 aplicativos antigos que ainda existem e funcionam Os 45 filmes mais esperados de 2024  

Posted in ,
bannerrsm

photo_2023-04-04_18-00-57
Rolar para cima
× Como posso te ajudar?