A internet começou a criar armadilhas contra IAs

Empresas de IA enfrentam reação crescente contra coleta não autorizada de dados para treinamento de modelos de linguagem

ferramentas para envenenamento de IAs
Créditos: Dmitry/ Tim Barnes/ Adobe Stock/ Deagreez/ Getty Images/ Tobi/ Unsplash

Michael Grothaus 3 minutos de leitura

Para que um chatbot se torne mais inteligente – e, portanto, mais útil para o usuário final –, ele precisa assimilar dados continuamente. Esse processo é conhecido como “treinamento”.

O problema é que muitas empresas de IA nunca pedem consentimento explícito aos donos dos dados antes de raspar páginas da internet e incorporar essas informações aos corpora dos grandes modelos de linguagem (LLMs) que alimentam os chatbots.

Mas parte desses proprietários de dados, também conhecidos como criadores de conteúdo ou detentores de propriedade intelectual, começou a reagir.

Eles estão fazendo isso com ferramentas chamadas “tarpits”. O objetivo? Envenenar o modelo de linguagem por trás do chatbot e, assim, degradar a qualidade das respostas, potencialmente afastando usuários.

O QUE É “ENVENENAR ” UMA IA?

Envenenar uma IA (AI poisoning) é o processo de corromper o grande modelo de linguagem que sustenta um chatbot para que ele passe a gerar respostas incorretas, enganosas ou completamente absurdas.

Essa corrupção acontece ao induzir o LLM a assimilar dados errados durante o treinamento – processo que, muitas vezes, envolve raspar praticamente todos os sites e imagens possíveis na internet.

Existem várias formas de envenenar um LLM, dependendo das capacidades do modelo que se deseja atacar.

Nightshade, ferramenta que engana IAs que coletam imagens
Crédito: Getty Images

Por exemplo: se alguém quiser contaminar um gerador de imagens baseado em IA, pode recorrer a uma técnica conhecida como “nightshading”. Ela utiliza um software chamado Nightshade para adicionar uma camada invisível a uma imagem.

Essa camada contém pixels imperceptíveis ao olho humano, mas visíveis para rastreadores de IA. Esses pixels fazem com que , para o LLM, a obra pareça ser de um estilo diferente do real (por exemplo, abstrato em vez de realista) impedindo que ele imite corretamente o estilo original do artista.

Claro que a maioria dos chatbots trabalha com texto, não com imagens, o que torna ferramentas como o Nightshade inúteis contra raspagem não autorizada de artigos e blogs. Mas, nos últimos anos, um novo tipo de ferramenta para envenenar de IAs começou a ganhar espaço: os chamados tarpits.

O QUE SÃO "TARPITS" de IA?

A tradução de tarpit é “poço de areia movediça”. No contexto da computação, é um serviço que intencionalmente insere um atraso, fazendo com que os clientes que estão se conectando sejam forçados a esperar.

Tarpits de IA são um tipo específico de ferramenta para envenenar IAs, criada para enganar os rastreadores usados pelos LLMs e fazê-los coletar dados inúteis.

Como o modelo passa a usar esse lixo informacional para gerar respostas, o resultado tende a ser incorreto, reduzindo a qualidade das respostas da IA e, teoricamente, desestimulando o uso do chatbot.

O objetivo é envenenar o modelo de linguagem por trás do chatbot e, assim, degradar a qualidade das respostas.

Existem diversas armadilhas desse tipo que criadores de conteúdo e donos de propriedade intelectual podem incorporar aos seus sites, incluindo Nepenthes, Iocaine e Quixotic.

Quando um rastreador de LLM visita um site com um tarpit embutido no código, ele é redirecionado para assimilar textos gerados automaticamente e sem utilidade prática.

Esses textos podem conter informações flagrantemente erradas – como “Steve Jobs fundou a Microsoft em 1834” – ou totalmente sem sentido, como “a cor da água é pepperoni”.

Além disso, essas páginas contaminadas contêm links para outras páginas igualmente contaminadas, sem nenhuma rota de saída. Assim como um poço de areia movediça real prende animais, o tarpit digital prende o rastreador de IA em um ciclo interminável de assimilação de dados incorretos, sem conseguir escapar da armadilha.

COMO USUÁRIOS COMUNS PODEM PROTEGER SEUS DADOS

Criadores de conteúdo e detentores de propriedade intelectual usam tarpits para desperdiçar recursos valiosos das empresas de IA e impedir que modelos assimilem dados sem consentimento.

Mas, mesmo que você não seja criador de conteúdo, vale lembrar: empresas de IA também usam seus dados para treinar modelos.

Cada prompt digitado em um chatbot ou conversa mantida com ele pode ser assimilado ao corpus do LLM para análises futuras, com o objetivo de tornar o modelo ainda mais robusto.

Leia mais: E-mail é seguro? Não é bem assim. Aprenda a se proteger

A boa notícia é que você não precisa recorrer a ferramentas sofisticadas como tarpits para proteger seus dados.

Você pode instruir os chatbots a não treinarem com seus dados, usar esses sistemas por meio de proxies para ocultar sua identidade ou empregar softwares comuns para remover informações sensíveis antes de enviar documentos para análise em plataformas de IA.


SOBRE O AUTOR

Michael Grothaus é escritor, jornalista, ex-roteirista e autor do romance "Epiphany Jones". saiba mais