STJ investiga tentativas de prompt injection; entenda o caso

A apuração envolve processos judiciais analisados pela Corte

Fachada do STJ
As tentativas foram neutralizadas pelo sistema do STJ. Foto: Marcello Casal Jr / Agência Brasil

Lilian Campos 2 minutos de leitura

O Superior Tribunal de Justiça (STJ) abriu uma investigação para apurar tentativas de uso de prompt injection em processos judiciais analisados pela Corte. A medida foi anunciada após os técnicos do tribunal identificarem a entrada de petições com comandos ocultos.

O caso ganhou repercussão, pois envolve tentativas de manipulação de ferramentas de IA usadas no ambiente do Judiciário brasileiro. Segundo nota do STJ, as tentativas foram neutralizadas pelas camadas de segurança do sistema, mas agora também serão alvo de investigação criminal e administrativa.

O QUE É PROMPT INJECTION

O chamado prompt injection é uma técnica usada para tentar enganar sistemas de inteligência artificial (IA) por meio de instruções escondidas dentro de textos, documentos ou comandos.

Ou seja, os usuários inserem ordens invisíveis ou disfarçadas dentro de arquivos comuns (como petições judiciais) com o objetivo de fazer a IA ignorar regras originais e executar essas ações específicas.

STJ IDENTIFICOU TENTATIVAS

De acordo com o STJ, os técnicos identificaram petições contendo comandos ocultos voltados ao STJ Logos, sistema de inteligência artificial desenvolvido pela própria Corte e lançado em 2025.

O presidente do STJ, ministro Herman Benjamin, determinou a abertura de inquérito policial e procedimento administrativo para investigar advogados e escritórios eventualmente envolvidos nas tentativas de fraude processual.

Segundo o tribunal, o sistema já possui mecanismos de proteção que impedem que comandos externos sobreponham as regras centrais da plataforma.

CAMADAS DE SEGURANÇA

O STJ afirmou que o Logos opera com três níveis de proteção para evitar manipulações.

Na primeira camada, o sistema realiza um pré-processamento dos documentos recebidos. O mecanismo separa instruções legítimas de possíveis comandos maliciosos e tenta neutralizar conteúdos suspeitos antes mesmo que eles cheguem ao modelo de inteligência artificial.

A segunda camada funciona como uma barreira contextual. O sistema impede que comandos inseridos externamente consigam alterar ou sobrepor as regras centrais de funcionamento da IA utilizada pelo tribunal.

Já a terceira camada atua sobre o resultado final gerado pela inteligência artificial. O sistema aplica um filtro de conformidade para revisar as respostas produzidas e verificar se elas seguem as políticas de segurança definidas pelo tribunal.

Em resumo, essas barreiras impediram que as tentativas identificadas de prompt injection conseguissem alterar o funcionamento do Logos ou influenciar as análises processuais da Corte.


SOBRE A AUTORA

Lilian Campos é jornalista colaboradora da Fast Company Brasil. saiba mais