Modelo resolve a questão dos direitos sobre dados de treinamento de IA

Ele foi treinado exclusivamente com conteúdo da Shutterstock, que é remunerada por cada imagem gerada

Crédito: Freepik

Mark Sullivan 3 minutos de leitura

A Databricks e a Shutterstock criaram um novo modelo de IA para geração de imagens, semelhante ao DALL-E e ao Stable Diffusion, mas sem o risco de violação de direitos autorais.

A maioria dos geradores de imagens é treinada com conteúdo extraído da internet, mas o ImageAI, como é chamado, foi treinado apenas com imagens da Shutterstock. Isso significa que não há risco de processos por violação de direitos autorais decorrentes da produção de imagens baseadas em trabalhos de criadores não remunerados.

Naveen Rao, chefe do departamento de IA generativa da Databricks, acredita que este novo modelo pode fazer pelas imagens geradas por IA o que a Apple fez pelos MP3s no início dos anos 2000. Naquela época, sites como o Napster tornaram os MP3s praticamente gratuitos – o que não era um bom negócio para gravadoras e artistas.

“A Apple resolveu esse problema ao encontrar uma maneira de pagar os criadores  oferecendo uma plataforma que permitia às pessoas comprar música de forma fácil”, lembra Rao. “Estamos fazendo algo semelhante. A única diferença é que não estamos apenas pegando e vendendo as imagens, estamos construindo modelos que podem produzir conteúdo com base nelas – é como um derivado dos dados.”

Enquanto o iTunes era voltado para consumidores, o ImageAI é mais direcionado para empresas que usam geradores de imagens e têm uma motivação muito maior para realmente pagar pelo conteúdo. Uma empresa pode recorrer a imagens geradas por IA para publicidade em mídia impressa, social e outros meios. Cancelar uma campanha por medo de violação de direitos autorais pode sair muito caro.

O uso de geradores de imagens para criar materiais de marketing, conteúdo publicitário, sites e aplicativos é cada vez mais comum.

“Não quero esbarrar em questões legais por produzir um conteúdo que, acidentalmente, tenha o Mickey Mouse; quero garantir que tudo o que foi usado esteja absolutamente de acordo com os termos de permissão de uso”, afirma Rao. “Tudo isso precisa ser feito antecipadamente.”

O modelo ImageAI fica hospedado nos servidores da Databricks e as empresas podem acessar o gerador de imagens por meio de seus próprios aplicativos usando uma API. A Databricks é conhecida como uma nuvem de dados para grandes empresas, mas, nos últimos anos, tem se tornado ativa no desenvolvimento e hospedagem de modelos de IA, que são mantidos no mesmo ambiente seguro dos dados.

De acordo com Aimee Egan, diretora de operações empresariais da Shutterstock, as duas empresas venderão acesso ao ImageAI e usarão suas próprias tabelas de preços. A Shutterstock receberá um valor não divulgado por cada imagem gerada.

No lançamento, os clientes não poderão ajustar o modelo com suas próprias diretrizes de marca e estilo, mas isso provavelmente será adicionado em breve, segundo Egan.

O uso de geradores de imagens para criar rapidamente materiais de marketing personalizados, conteúdo publicitário, sites e aplicativos está cada vez mais comum.

As empresas de tecnologia que desenvolvem modelos generativos os treinam com uma combinação de imagens proprietárias e extraídas da internet em grandes quantidades. Mas criadores cujos imagens foram retiradas da web para treinamento estão começando a processá-las por violação de direitos autorais.

Essas empresas argumentam que, como os modelos “transformam” as imagens em algo novo, estão legalmente protegidas pelas cláusulas de uso justo da lei de direitos autorais dos EUA. Mas, para evitar esse tipo de situação, desenvolvedores como a OpenAI têm firmado acordos pagos com certos proprietários de conteúdo e veículos de mídia.

Para empresas como a Shutterstock, este tipo de licenciamento de conteúdo se tornou uma importante fonte de receita. Em 2023, ela ganhou US$ 104 milhões com o licenciamento de seus catálogos de imagens e vídeos para a OpenAI, Meta e outros, segundo a “Bloomberg”.


SOBRE O AUTOR

Mark Sullivan é redator sênior da Fast Company e escreve sobre tecnologia emergente, política, inteligência artificial, grandes empres... saiba mais