O que pode acontecer se o NY Times ganhar o processo contra a OpenAI?
A ação pode criar precedentes sobre os direitos e responsabilidades das empresas de IA
Desde o lançamento do ChatGPT, a inteligência artificial vem ganhando destaque. Em 2024, a indústria da tecnologia planeja desenvolver novos modelos de linguagem que realizem tarefas cada vez mais importantes e que gerem real valor.
Contudo, esses planos podem ser seriamente prejudicados pela forma como as empresas de IA normalmente treinam seus modelos – a partir de grandes quantidades de dados extraídos da internet, alguns dos quais protegidos por direitos autorais.
Em 2023, várias ações judiciais foram movidas contra empresas de IA, mas o processo do “The New York Times” contra a OpenAI e a Microsoft é o primeiro de um grande veículo de notícias. Este caso pode ser considerado um marco que criará precedentes sobre os direitos e responsabilidades dos detentores de direitos autorais e das empresas de IA.
A questão central gira em torno da doutrina do uso justo da legislação de direitos autorais dos EUA e de como ela se aplica ao uso de informações coletadas da internet para treinar modelos de IA. A OpenAI e a Microsoft alegarão que, de modo geral, o uso de dados protegidos por direitos autorais, incluindo o conteúdo do “The New York Times”, está coberto pelo uso justo.
“A utilização de materiais protegidos por direitos autorais disponíveis publicamente na internet para treinar modelos de IA é considerada uso justo, respaldado por precedentes antigos e amplamente aceitos”, afirmou a OpenAI em um post no blog da empresa intitulado “OpenAI and Journalism” (OpenAI e Jornalismo). “Vemos esse princípio como justo para os criadores, necessário para os inovadores e crucial para a competitividade nos EUA.”
as empresas de IA podem ter enfraquecido o argumento de uso justo ao concordarem previamente em pagar a alguns veículos por seu conteúdo.
Os advogados do jornal vão argumentar que o uso que os réus fazem do seu jornalismo ultrapassa os limites do uso justo. “Uma das coisas mais importantes na análise de uma defesa de uso justo é o potencial prejuízo ao mercado do produtor original do material protegido por direitos autorais”, explica o advogado de propriedade intelectual Thomas C. Carey.
A queixa aponta dois principais prejuízos. “Um deles é: se as pessoas podem obter seu conteúdo gratuitamente perguntando ao ChatGPT, por que assinariam o ‘The New York Times’?” questiona Carey. “E o outro é que o ChatGPT poderia gerar alucinações que atribuem falsamente ao NY Times coisas que eles não escreveram.”
As duas partes estavam discutindo um acordo de licenciamento que permitiria à OpenAI usar o conteúdo do jornal (a empresa já assinou acordos semelhantes com outros veículos), e, segundo o periódico, o processo resultou na interrupção das negociações sobre o custo.
CHATGPT "TRANSFORMA" O CONTEÚDO?
Durante o julgamento, os advogados de defesa podem argumentar que a maior parte do conteúdo gerado pelo ChatGPT ou pelo Copilot, da Microsoft, é “original”, sendo influenciado – mas não copiado – pelos materiais de treinamento. Assim, as respostas dos chatbots não poderiam ser vistas como uma substituição ou concorrência ao conteúdo do “The New York Times”.
No entanto, a queixa apresentada contém inúmeros exemplos em que o ChatGPT gerou respostas que parecem reproduzir grandes trechos de artigos quase palavra por palavra. E, como alega o jornal, o bot às vezes faz isso sem citá-lo como fonte.
A OpenAI afirma que essas reproduções diretas foram resultado de uma “falha rara no processo de aprendizado” que ela está “continuamente” tentando corrigir. A empresa diz que esse tipo de erro é mais provável de ocorrer com conteúdo que aparece várias vezes nos dados de treinamento do modelo, “como se partes dele aparecessem em muitos sites públicos diferentes”.
Mas, de acordo com Carey, “há uma chance razoavelmente boa de que a OpenAI e a Microsoft acabem tendo que pagar uma grande quantia ao The New York Times”.
Elas também podem ser orientadas pelo tribunal a fazer ajustes em seus modelos para impedir que reproduzam o conteúdo do jornal. A OpenAI já fez alterações em seus modelos de geração de imagens DALL-E para evitar que a tecnologia imite artistas vivos.
CRIANDO PRECEDENTES
Além disso, as empresas de IA podem ter enfraquecido seu argumento de uso justo ao concordarem previamente em pagar a alguns veículos por seu conteúdo, segundo a advogada Katie Gardner. A OpenAI já fechou acordos de licenciamento semelhantes com a “Associated Press” e a “Axel Springer”.
Os veículos de notícias viram seus lucros serem reduzidos pelas redes sociais e por restrições à forma como os anúncios interativos podem ser direcionados. Eles estão muito interessados em encontrar novas maneiras de monetizar seu conteúdo.
Licenciar conteúdo para desenvolvedores de IA pode ser a chave para sua sobrevivência, conforme os consumidores passam a buscar mais notícias e informações em motores de inteligência artificial.
Enquanto isso, a OpenAI e a Microsoft parecem estar em uma posição confortável. A gigante da tecnologia investiu US$ 10 bilhões na OpenAI há um ano, e a desenvolvedora estaria supostamente se preparando para levantar mais dinheiro, com uma avaliação de até US$ 100 bilhões.
Com acesso fácil a bilhões em financiamento, muitas empresas de IA podem ver os acordos de licenciamento com os veículos de notícias como uma boa forma de gerenciar riscos e evitar processos.
Com centenas de empresas de tecnologia agora investindo grandes cifras em pesquisa e desenvolvimento de novos modelos de IA, e milhares de startups construindo negócios em cima dos modelos básicos já lançados, qualquer clareza fornecida pelo resultado da ação será bem-vinda.
O pior resultado pode ser que apenas as maiores e mais ricas empresas de IA possam pagar por grandes acordos de licenciamento, deixando as menores com dados de treinamento inferiores e concentrando o controle dos modelos básicos mais poderosos em poucas mãos.