Conheça a nova versão do Stable Diffusion e outras ferramentas de inteligência artificial

O novo Stable Diffusion XL produz imagens realistas e caracteres quase perfeitos. Veja também outras das ferramentas mais legais de IA generativa

Crédito: Stability AI

Jesus Diaz 4 minutos de leitura

Acabamos de receber a maior notícia sobre inteligência artificial do ano até agora: o lançamento do Stable Diffusion XL. Este software é tão incrível que está acelerando a evolução da IA generativa para os próximos 10 anos. Aqui, vamos destacar algumas das mais interessantes novidades e usos criativos da IA dos últimos dias.

O Stable Diffusion XL oferece um realismo impressionante e textos legíveis

O Stable Diffusion XL (SDXL) é incrível. Seu desempenho é tão superior que faz com que outras ferramentas, como o Midjourney V5, pareçam coisa do passado. O realismo das imagens ultrapassa o “vale da estranheza” e atinge um nível de credibilidade surpreendente. Além disso, o texto gerado é totalmente legível, sem aqueles caracteres confusos que costumam aparecer em outros softwares.

Crédito: Stability AI

Essa melhoria se deve, em grande parte, ao novo modelo, que é muito melhor em lidar com questões como controle, precisão e consistência – alguns dos maiores desafios da IA generativa atualmente. O SDXL usa um modelo muito mais complexo. Ele foi treinado com 2,3 bilhões de parâmetros, enquanto os anteriores estavam na faixa de 900 milhões.

Crédito: Stability AI

De acordo com a Stability, a nova versão (que está disponível no DreamStudio) oferece “composição de imagem aprimorada, geração de rosto, visuais ricos e estética impressionante”. Outra vantagem é que o modelo XL requer menos “engenharia de prompt”.

Crédito: Stability AI

“O modelo responde melhor a comandos mais curtos e naturais. Ele também possui um conjunto de padrões de estilo que tornam seus recursos ainda mais fáceis de acessar”, afirma Scott Draves, vice-presidente de engenharia da Stability AI.

Crédito: Stability AI

Desperte sua criatividade com o Create-a-tron

Desenvolvido por Matt Reed – o tecnólogo criativo da agência de marketing Redpepper que criou o filtro HoriZuck para o Snapchat, que transforma o rosto das pessoas em uma versão do avatar de Mark Zuckerberg no jogo Horizon Worlds – , o Create-a-tron é um aplicativo divertido que utiliza o ChatGPT-4 e o DALL-E para ajudar a gerar ideias para uma ampla gama de usos, desde campanhas publicitárias até criação de conteúdo.

“Como trabalho em uma agência de marketing, estamos sempre pensando e fazendo brainstorms de ideias para clientes, então decidi criar este aplicativo para fazer nossos cérebros pensarem ainda mais”, diz Reed. “Ele usa IA para gerar uma grande quantidade de ideias.”

Embora a interface lembre um pouco o jogo clássico Robotron: 2084 e possa parecer um pouco confusa no início (Reed promete que a experiência do usuário será aprimorada em breve), é bastante simples de usar e vale a pena experimentar. 

Após criar uma conta, basta escolher no menu suspenso o tópico que você deseja. Em seguida, é só inserir palavras-chave no campo de texto ao lado e clicar em criar. Eu, por exemplo, escolhi “stories” e digitei “busca por inteligência extraterrestre”.

Crédito: captura de tela/ Jesus Diaz

Ao passar o mouse sobre uma das imagens, aparecerá um link que o levará para a página da ideia. Após clicar nele, você verá um botão escrito “Tell me more” (conte-me mais, em português).

Este botão faz com que o ChatGPT gere uma breve explicação sobre como a ideia funciona e por que faz sentido. Lembre-se de que o Create-a-tron não é uma ferramenta de produção, mas sim uma maneira de estimular sua criatividade de maneiras inesperadas.

A musa musical do Staccato

Se música é a sua praia, existe um monte de IAs generativas especializadas em compor canções e partituras completas. Mas o Staccato serve mais como uma musa do que um gerador automatizado de conteúdo.

Pense nele como um assistente que o ajuda a escrever suas próximas estrofes ou acordes quando você está passando por um bloqueio criativo. Basta fazer upload de qualquer faixa MIDI que você tenha composto e a IA vai sugerir ideias.

O Staccato também funciona com letras, como você pode ver no vídeo acima. A interface é clara e fácil de usar para qualquer pessoa com um ouvido musical ou que já tenha usado o Garage Band alguma vez.

Transforme rostos com o SadTalker

Você já viu o vídeo dos personagens de Harry Potter como modelos da Balenciaga? Se não, confira abaixo:

Este vídeo foi feito com a mesma tecnologia do SadTalker, um novo aplicativo web hospedado na plataforma Hugging Face (site que oferece ferramentas para desenvolvedores construírem e hospedarem aplicativos que usam machine learning). Ele é produto de um artigo científico sobre a mais avançada técnica de animação facial baseada em uma única imagem e produzida por faixas de voz reais.

Mas o que tudo isso significa? Não se preocupe, clique aqui para experimentá-lo.

A interface é meio crua, mas autoexplicativa. Basta fazer o upload de uma imagem estática que você deseja animar, a faixa de voz em formato MP3 ou WAV e o texto. Clique em “gerar” e veja o resultado (é gratuito, embora você possa pagar para acelerar o processamento e não precisar esperar na fila).

Viu como é fácil? Como um passe de mágica.


SOBRE O AUTOR

Jesus Diaz fundou o novo Sploid para a Gawker Media depois de sete anos trabalhando no Gizmodo. É diretor criativo, roteirista e produ... saiba mais