IA pode criar imagens impressionantes – mas é arte?

O que significa arte quando um algoritmo automatiza grande parte do processo criativo?

Crédito: Vadim Bogulov/ Luis Villasmil/ Paul Blenkhorn/ Unsplash

Aaron Hertzmann 4 minutos de leitura

Uma imagem pode valer mais que mil palavras. Mas, graças a um programa de inteligência artificial chamado DALL-E 2, você pode criar uma imagem com aparência profissional com muito menos.

DALL-E 2 é um novo algoritmo de rede neural que cria uma imagem a partir de palavras ou frases curtas. O programa, que foi anunciado pelo laboratório de pesquisa de inteligência artificial OpenAI em abril, não foi divulgado ao público. Mas um número pequeno de pessoas – inclusive eu – teve a oportunidade de experimentá-lo.

Após horas testando, fica claro que o DALL-E 2 está muito à frente de outras tecnologias de geração de imagem. E isso imediatamente levanta questões sobre como essas tecnologias vão mudar a forma como a arte é produzida e consumida. Também sobre o que significa ser criativo quando DALL-E 2 parece automatizar grande parte do próprio processo criativo.

UMA GAMA INCRÍVEL DE ESTILOS

Os pesquisadores da OpenAI construíram o DALL-E 2 a partir de uma enorme coleção de imagens com legendas. Usá-lo é bastante parecido com pesquisar uma imagem na internet: você digita uma frase curta em uma barra de pesquisa e logo aparecem seis imagens.

Mas, em vez de mostrar imagens que já existem, o programa cria seis imagens totalmente novas, cada uma trazendo uma versão diferente da frase digitada.

Por exemplo, quando alguns amigos e eu demos ao DALL-E 2 a frase “gatos usando chapéus”, ele gerou dez imagens em estilos diferentes. Quase todas poderiam se passar por fotografias ou desenhos profissionais de verdade.

O DALL-E 2 também é capaz de imitar estilos específicos com uma precisão notável. Se você quiser que as imagens se pareçam com fotografias, ele gerará seis imagens realistas. Se quiser pinturas rupestres do Shrek, serão geradas seis imagens dele como se tivessem sido desenhadas por um artista pré-histórico. Cada conjunto de imagens leva menos de um minuto para ser gerado.

No entanto, nem todas as imagens são agradáveis aos olhos, tampouco necessariamente refletem o que você tinha em mente. Mas, mesmo com a necessidade de testar várias combinações de palavras e estilos para chegar ao resultado pretendido, não há outra maneira de produzir tantas imagens incríveis tão rápido – nem mesmo contratando um artista. E, por vezes, os resultados inesperados são os melhores.

É fácil imaginar essas ferramentas transformando a maneira como as pessoas criam imagens e se comunicam, seja por meio de memes, cartões de datas comemorativas, publicidade – e, por que não, arte.

MAS ONDE ESTÁ A ARTE NISSO?

Nenhum ser humano é capaz de fazer o que o DALL-E 2 faz: criar uma gama de imagens tão variada e de alta qualidade em segundos. Se alguém lhe dissesse que uma pessoa desenhou aquilo tudo, você certamente diria que ela é muito criativa.

Mas isso não faz do DALL-E 2 um artista. Mesmo que às vezes pareça mágica, por trás dele ainda há um algoritmo, seguindo rigidamente as instruções dos desenvolvedores da OpenAI.

É fácil imaginar essas ferramentas transformando a maneira como as pessoas criam imagens e se comunicam

Se essas imagens forem consideradas como arte, elas ainda assim são o produto de como o algoritmo foi projetado, das imagens com que ele foi treinado e, o mais importante, de como os artistas o usam.

Na minha opinião, é similar à visão clássica de que a fotografia não pode ser considerada arte porque foi uma máquina que fez todo o trabalho. Hoje, a autoria humana e as técnicas envolvidas na fotografia artística são reconhecidas. Os críticos entendem que a arte da fotografia vai muito além de apertar um botão.

Mesmo assim, muitas vezes discutimos obras de arte como se elas fossem o produto direto da intenção do artista de mostrar uma coisa, contar uma história ou expressar uma emoção. O DALL-E 2 encurta radicalmente esse processo: você tem uma ideia, digita e pronto.

No entanto, quando pintamos à moda antiga, as telas são construídas por meio de um processo de exploração, não apenas executamos nossos objetivos iniciais. E isso é verdade para muitos artistas.

Em minhas próprias explorações com o DALL-E 2, uma ideia levava à outra, que, por sua vez, levava à outra. Por fim, eu acabava em um novo terreno mágico e completamente inesperado, muito longe de onde havia começado.

PROCESSO COMO ARTE

Eu diria que a arte, ao usar um sistema como esse, não se dá apenas a partir da frase digitada, mas sim de todo o processo

O DALL-E 2 encurta radicalmente o processo. Você tem uma ideia, digita e pronto.

criativo que levou a ela. Diferentes artistas seguirão diferentes processos e encontrarão resultados que refletem suas próprias abordagens, habilidades e gostos.

Assim, comecei a considerar o DALL-E 2 como uma forma de exploração e também de arte, mesmo que muitas vezes seja uma arte amadora, como os desenhos que faço no meu iPad.

Trabalhar com o DALL-E 2, ou com qualquer um dos novos sistemas de conversão de texto em imagem, significa aprender suas peculiaridades e desenvolver estratégias para evitar armadilhas comuns. Também é importante estar ciente de seus possíveis danos, como sua dependência de estereótipos e usos potenciais para desinformação.

Usando o DALL-E 2, você também descobrirá correlações surpreendentes, como a maneira como tudo se torna ultrapassado quando se usa o estilo de um antigo pintor, cineasta ou fotógrafo.

Os softwares de arte de IA se desenvolveram tão rapidamente que há novidades técnicas e artísticas a todo momento. Parece que, a cada ano, surge uma oportunidade de explorar uma nova tecnologia empolgante – cada uma melhor que a anterior e, aparentemente, capaz de transformar a arte e a sociedade.


SOBRE O AUTOR

Aaron Hertzmann é professor de ciência da computação na Universidade de Washington. saiba mais