Escritores processam Anthropic por “roubo em grande escala” de suas obras
Autores como Andrea Bartz, Charles Graeber e Kirk Wallace Johnson acusam a empresa de infringir direitos autorais para treinar o chatbot Claude
Um grupo de escritores está processando a startup de inteligência artificial Anthropic, alegando que a empresa cometeu "roubo em grande escala" ao treinar seu chatbot Claude com cópias pirateadas de livros protegidos por direitos autorais.
Embora processos semelhantes tenham se acumulado por mais de um ano contra a concorrente OpenAI, criadora do ChatGPT, este é o primeiro movido por escritores contra a Anthropic e seu chatbot Claude.
Sediada em São Francisco, na Califórnia, e fundada por ex-líderes da OpenAI, a Anthropic tem se promovido como uma desenvolvedora mais responsável e focada em segurança de modelos de IA generativa que podem escrever e-mails, resumir documentos e interagir com pessoas de forma natural.
No entanto, a ação judicial apresentada na segunda-feira (dia 19) alega que as atitudes da empresa "zombaram de seus objetivos elevados" ao acessar repositórios de livros pirateados para construir seu produto de IA.
"Não é exagero dizer que o modelo da Anthropic busca lucrar ao explorar a expressão humana e a criatividade por trás de cada uma dessas obras", diz o processo. Até o fechamento deste texto a Anthropic não havia respondido a um pedido para comentar o assunto.
O processo foi movido por um trio de escritores — Andrea Bartz, Charles Graeber e Kirk Wallace Johnson — que buscam representar uma classe de autores de ficção e não-ficção em situação semelhante.
Embora seja o primeiro caso contra a Anthropic movido por autores de livros, a empresa também está enfrentando uma ação judicial movida por grandes editoras de música que alegam que o Claude recicla as letras de músicas protegidas por direitos autorais.
O caso dos escritores se junta a um número crescente de processos movidos contra desenvolvedores de grandes modelos de linguagem.
A OpenAI e seu parceiro comercial, a Microsoft, enfrentam um processo por violação de direitos autorais movido por um grupo liderado por nomes como John Grisham, Jodi Picoult e George R. R. Martin (autor de "Game of Thrones"), além de outras ações judiciais de veículos de mídia como The New York Times, Chicago Tribune e Mother Jones.
o modelo da Anthropic busca lucrar ao explorar a expressão humana e a criatividade por trás de cada uma dessas obras.
O que liga todos os casos é a alegação de que as empresas coletaram grandes quantidades de dados produzidos por humanos para treinar chatbots de IA a produzir trechos de texto semelhantes aos escritos por pessoas de verdade, só que sem pedir permissão ou compensar quem escreveu os textos originais.
Os desafios legais não vêm apenas de escritores, mas também de artistas visuais, gravadoras e outros criadores de conteúdo que alegam que os lucros da IA generativa foram gerados com base em apropriação indevida de informações.
A Anthropic e outras empresas de tecnologia argumentam que o treinamento de modelos de IA se encaixa na doutrina de "uso justo" das leis dos EUA, que permite o uso limitado de materiais protegidos por direitos autorais, como para ensino, pesquisa ou transformação da obra protegida em algo diferente.
No entanto, o processo contra a Anthropic a acusa de usar um conjunto de dados chamado The Pile, que incluía um grande número de livros pirateados. Também contesta a ideia de que os sistemas de IA estão aprendendo da mesma maneira que os humanos.
"Os humanos que aprendem com livros compram cópias legais, ou os pegam emprestados de bibliotecas que os compram, proporcionando ao menos alguma medida de compensação aos autores e criadores", diz o processo.