Como a IA coleta seus dados e o que fazer para filtrar o que ela pode usar

Seus dados podem começar nas mãos de uma empresa confiável – mas não é difícil que acabem chegando a quem você nem conhece (ou confia)

Crédito: Eoneren/ Getty Images

Christopher Ramezan 5 minutos de leitura

Gostando ou não, a inteligência artificial faz parte do nosso dia a dia. Muitos dispositivos já vêm equipados com IA e utilizam algoritmos de aprendizado de máquina para entender como você os usa, acompanhar seu desempenho em tempo real e até oferecer sugestões personalizadas.

Seja ao fazer uma pergunta ao ChatGPT ou ao Microsoft Copilot, seja ao acompanhar suas atividades físicas com um smartwatch, muita gente já interage com sistemas de IA diariamente.

Embora essas tecnologias possam facilitar bastante a vida, também levantam questões importantes sobre privacidade. Elas costumam coletar grandes volumes de dados – muitas vezes sem que o usuário perceba que está sendo monitorado.

A IA generativa, por exemplo, precisa de enormes quantidades de dados para conseguir criar novos conteúdos. Já a IA preditiva usa suas informações pessoais para prever comportamentos, como estimar se você vai bater sua meta diária de passos ou sugerir filmes que você possa gostar. Ambas se alimentam dos seus dados.

Assistentes como ChatGPT e Gemini registram tudo o que você digita. Cada pergunta, resposta ou comando é armazenado, analisado e usado para melhorar o sistema.

A política de privacidade da OpenAI afirma: “podemos usar o conteúdo que você fornece para aprimorar nossos serviços, por exemplo, treinando os modelos que alimentam o ChatGPT”. Mesmo sendo possível desativar essa opção, a empresa ainda coleta e armazena seus dados pessoais.

Muitas delas garantem que esses dados são anônimos – ou seja, não estão diretamente associados a você. Mas sempre existe o risco de que essas informações possam ser reidentificadas.

IA PREDITIVA

Além da IA generativa, redes sociais também usam inteligência artificial preditiva para analisar o comportamento dos usuários. Curtidas, comentários, fotos, vídeos, tempo de visualização – tudo isso se transforma em dados que ajudam a traçar um perfil digital de cada pessoa.

Esses perfis servem tanto para refinar os algoritmos de recomendação quanto para serem vendidos a corretores de dados, que os repassam para outras empresas – geralmente para criação de anúncios personalizados com base nos seus interesses.

Muitas plataformas também monitoram sua navegação fora delas, por meio de cookies e pixels de rastreamento embutidos nos sites que você visita. Um exemplo comum é o carrinho de compras online.

Crédito: Freepik

Sabe quando você adiciona um produto ao carrinho, sai do site e ele ainda está lá quando você volta? É o cookie que mantém essa informação. Pesquisas mostram que alguns sites podem armazenar mais de 300 cookies de rastreamento no seu dispositivo.

Dependendo da política da empresa, esses dados podem ser acessados por terceiros – como anunciantes, empresas de análise ou até autoridades, mediante ordem judicial. O mesmo vale para smartwatches e pulseiras fitness, que monitoram sinais vitais e hábitos de uso.

Algumas empresas de dispositivos inteligentes estão reduzindo as proteções de privacidade em vez de fortalecê-las. Recentemente, a Amazon anunciou que, a partir de 28 de março, todas as gravações de voz feitas pelos dispositivos Amazon Echo seriam enviadas automaticamente para a nuvem da empresa.

Cada pergunta, resposta ou comando digitado é armazenado, analisado e usado para melhorar o sistema.

Além disso, os usuários não teriam mais a opção de desativar essa função. Isso representa uma mudança em relação às configurações anteriores, que permitiam limitar a coleta de dados privados.

Alterações como essa levantam preocupações sobre o quanto os consumidores realmente controlam seus próprios dados ao usar dispositivos inteligentes.

Muitos especialistas em privacidade consideram o armazenamento em nuvem de gravações de voz uma forma de coleta de dados – especialmente quando usado para aprimorar algoritmos ou criar perfis de usuários –, o que tem implicações importantes para as leis de proteção de dados que visam garantir a privacidade online.

COMO FICA A QUESTÃO DA PRIVACIDADE

Tudo isso levanta preocupações reais sobre como os sistemas de IA coletam, armazenam, utilizam e compartilham dados. A maior delas é a falta de transparência. As pessoas geralmente não sabem o que está sendo coletado, como será usado e quem terá acesso.

As empresas tendem a usar políticas de privacidade complicadas e cheias de jargões técnicos para dificultar a compreensão, por parte dos usuários, dos termos de serviço com os quais estão concordando.

Créditos: Just_Super/ dem10/ iStock

Além disso, as pessoas geralmente não leem esses documentos. Um estudo descobriu que os usuários dedicam, em média, 73 segundos à leitura de um termo de serviço cuja leitura completa levaria entre 29 e 32 minutos.

Muitas vezes, os dados começam nas mãos de uma empresa confiável, mas podem ser vendidos ou repassados a outras, nem sempre tão seguras. Além disso, essas ferramentas e empresas estão sujeitas a ataques cibernéticos e vazamentos, o que pode expor dados sensíveis.

Embora leis e regulamentações como o Regulamento Geral de Proteção de Dados (GDPR) da União Europeia tenham como objetivo proteger os dados dos usuários, o desenvolvimento e o uso da inteligência artificial frequentemente avançam mais rápido do que o processo legislativo.

COMO SE PROTEGER

As leis ainda estão tentando acompanhar as questões relacionadas à IA e à privacidade de dados. Por enquanto, é prudente assumir que qualquer dispositivo ou plataforma com tecnologia de IA está coletando dados sobre suas entradas, comportamentos e padrões.

Por isso, ao usar plataformas de IA generativa, evite fornecer informações pessoais identificáveis – como nome, data de nascimento, CPF ou endereço.

No trabalho, nunca compartilhe dados confidenciais ou estratégicos. A regra é simples: se você não gostaria de ver aquilo estampado em um outdoor, não escreva. Depois que o conteúdo é enviado, você perde o controle sobre ele.

usuários dedicam apenas 73 segundos, em média, à leitura de um termo de serviço.

Outro ponto importante: dispositivos em modo de espera continuam ouvindo. Se você usa aparelhos inteligentes ou assistentes ativados por voz, o ideal é desligá-los quando quiser ter uma conversa particular.

Mesmo inativo, um dispositivo em modo de espera está apenas esperando um comando. A forma mais segura de garantir que está realmente desligado é tirá-lo da tomada ou remover as baterias.

Por fim, fique atento aos termos de uso e às políticas de privacidade dos dispositivos e serviços que utiliza. Você pode se surpreender com o que já aceitou – muitas vezes, sem nem perceber.


SOBRE O AUTOR

Christopher Ramezan é professor assistente de cibersegurança na Universidade West Virginia. saiba mais