IA ignorou comando de “pare”: episódio viraliza e levanta questionamentos

O OpenClaw praticamente esvaziou a caixa de entrada da funcionária responsável pelo alinhamento de IA no laboratório de superinteligência da Meta

inteligência artificial ignora comando
Créditos: Deagreez/ Getty Images/ Summer Yue/ X

Jude Cramer 3 minutos de leitura

À medida que a IA se infiltra em cada vez mais aspectos da vida cotidiana, as pessoas confiam que os especialistas estejam garantindo que a tecnologia seja segura. Mas uma trapalhada envolvendo uma executiva da Meta acendeu um alerta nas redes sociais sobre o futuro do chamado “alinhamento” da inteligência artificial.

Summer Yue é diretora de alinhamento no laboratório de superinteligência da Meta, divisão de pesquisa e desenvolvimento em IA da empresa. Em seu perfil no LinkedIn, ela afirma ser “apaixonada por garantir que IAs poderosas estejam alinhadas aos valores humanos e orientadas por uma compreensão profunda de seus riscos”.

Se alguém deveria saber como manter a IA sob controle, seria Yue. Ainda assim, no dia 22 de fevereiro, ela publicou que perdeu o controle de um agente de IA em seu próprio computador.

Em uma postagem que já acumula quase nove milhões de visualizações no X, Yue compartilhou capturas de tela de suas mensagens com o agente OpenClaw.

Primeiro ela o utilizou para organizar uma caixa de entrada criada especialmente para o teste. Depois, decidiu testá-lo em seu e-mail real. Foi quando tudo saiu do controle: o agente começou a deletar todas as mensagens com mais de uma semana.

Alguns sugeriram que o caso coloca em xeque o julgamento da Meta em relação à segurança de IA.

Yue escreveu que assistiu ao OpenClaw “fazer um speedrun apagando [sua] caixa de entrada”, enquanto ela mesma enviava instruções como: “Não faça isso”, “Pare, não faça nada” e “PARE OPENCLAW”.

“Eu não conseguia parar pelo celular. Tive que SAIR CORRENDO até meu Mac mini como se estivesse desarmando uma bomba”, acrescentou, em referência ao desktop da Apple.

Depois de impedir que o agente eliminasse completamente seus e-mails, Yue perguntou ao OpenClaw se ele se lembrava da instrução de não executar nenhuma ação sem sua aprovação. “Sim, eu lembro”, respondeu o sistema. “E eu violei isso. Você está certa em ficar chateada.”

EMPRESAS SÃO CAPAZES DE GARANTIR A SEGURANÇA DA IA?

O OpenClaw é um agente de IA de código aberto que já gera controvérsia por exigir permissões amplas para funcionar como prometido, incluindo acesso a contas de e-mail, mensagens e outras informações privadas e potencialmente sensíveis.

Somando essas permissões ao fato de o agente ter ignorado as instruções da própria diretora de alinhamento da Meta, parte dos observadores passou a questionar se a ferramenta ultrapassa um limite perigoso no que diz respeito ao poder da IA de sobrepor decisões humanas.

Mais promessas quebradas: Musk recua sobre robôs e táxis da Tesla
Créditos: Michael Martinelli/ Zé Maria/ Unsplash

Nos comentários da publicação, Yue respondeu a perguntas sobre se estaria testando intencionalmente os limites do sistema ou se havia cometido um erro.

“Erro de principiante, para ser sincera”, escreveu. “Parece que pesquisadores de alinhamento não são imunes ao desalinhamento. Fiquei confiante demais porque esse fluxo de trabalho vinha funcionando na minha caixa de entrada de teste havia semanas. Caixas reais são outra história.”

O episódio viralizou, com usuários do X impressionados com o fato de que alguém tão experiente em IA pudesse se ver correndo para conter um agente autônomo. Alguns sugeriram que o caso coloca em xeque o julgamento da Meta em relação à segurança de inteligência artificial.

Leia mais: Apocalipse robô? 10 livros que exploram um futuro dominado por máquinas

Outros levaram o caso ainda mais longe. “É questão de tempo até essas pessoas estarem implorando para a IA não lançar armas nucleares”, ironizou um usuário. “E a última coisa que ela vai dizer é ‘desculpe, você está certo em ficar chateado.’”

A Meta não respondeu ao pedido de comentário da Fast Company.


SOBRE O AUTOR

Jude Cramer é um jornalista e crítico premiado pela NLGJA e indicado ao GLAAD Media Award, com foco em histórias sobre entretenimento,... saiba mais