STJ investiga tentativas de manipulação de IA em petições judiciais
Tribunal identificou tentativas de manipular sistemas de inteligência artificial por meio de comandos ocultos em petições judiciais.

O Superior Tribunal de Justiça (STJ) iniciou uma apuração sobre tentativas de manipulação de sistemas de inteligência artificial por meio da técnica conhecida como “prompt injection” em petições judiciais. Segundo o tribunal, os casos foram identificados nas últimas semanas e bloqueados pelas camadas de segurança do STJ Logos, plataforma de IA generativa desenvolvida pela Corte e lançada em fevereiro de 2025. De acordo com o presidente do STJ, Herman Benjamin, todas as ocorrências estão sendo mapeadas para possível responsabilização dos envolvidos nas esferas processual, administrativa e criminal. A prática consiste na inserção de comandos ocultos em documentos jurídicos com o objetivo de influenciar ou alterar respostas produzidas por sistemas de inteligência artificial utilizados pelo Judiciário. O que é prompt injection? O “prompt injection” é uma técnica usada para tentar manipular modelos de IA generativa, especialmente os chamados LLMs (Large Language Models). Na prática, instruções são escondidas em textos aparentemente comuns — como petições, recursos ou documentos processuais — para induzir a IA a ignorar regras internas ou produzir respostas favoráveis a determinada parte. Esse tipo de ataque vem sendo debatido mundialmente devido ao avanço do uso de inteligência artificial em ambientes corporativos, acadêmicos e institucionais. Medidas adotadas pelo STJ Além da investigação, o tribunal determinou que as tentativas de manipulação sejam registradas oficialmente nos autos dos processos. A medida permitirá que ministros avaliem eventual aplicação de sanções processuais. O STJ também informou que poderá haver instauração de inquérito policial e procedimentos administrativos para apuração das responsabilidades, incluindo a oitiva de advogados e escritórios eventualmente envolvidos. Sistema possui camadas de proteção Segundo o tribunal, o STJ Logos conta com diferentes níveis de segurança para impedir a execução de comandos maliciosos inseridos em documentos processuais. Entre as medidas adotadas estão: • filtragem e separação de instruções suspeitas durante o pré-processamento dos documentos; • limitação de contexto para impedir que comandos externos se sobreponham às regras do sistema; • revisão final das respostas geradas pela IA para garantir conformidade com protocolos de segurança. O tema ganhou repercussão nacional após relatos semelhantes envolvendo a Tribunal Regional do Trabalho da 8ª Região no início de maio. Fonte: Migalhas e informações do STJ.