Injeção de prompt: entenda técnica usada em caso que chocou tribunal

 

Fonte:


Duas advogadas foram multadas após tentarem manipular a análise de uma petição feita por inteligência artificial no sistema do Judiciário — e o método usado para isso explorou uma técnica pouco conhecida fora do universo da IA: a chamada "injeção de prompt". Segundo a decisão judicial, as profissionais esconderam instruções no documento para induzir uma análise superficial do conteúdo. O caso no Pará reabriu discussões sobre os riscos de confiar em sistemas inteligentes sem validação humana e sobre a dificuldade que modelos de IA ainda têm para diferenciar texto comum de comandos direcionados ao próprio sistema. A seguir, entenda técnica usada em caso que chocou tribunal.

🔎 Como saber se um vídeo foi feito por IA? Veja 7 formas de descobrir

📲 Comparador de celulares do TechTudo: como usar a ferramenta e economizar

Advogadas usaram 'comando oculto' em petição no Pará; saiba o que é Injeção de Prompt

Reprodução/Instagram

📝 Como criar vídeos com inteligência artificial? Veja no fórum do TechTudo

Índice

O que é injeção de prompt?

O que aconteceu no caso do tribunal?

Como a técnica funciona na prática?

O que é texto invisível em documentos?

Qual a diferença entre injeção direta e indireta?

Quais riscos isso traz para IA?

Dá para se proteger?

O que é injeção de prompt?

A chamada "injeção de prompt", conhecida em inglês como prompt injection, é uma técnica usada para tentar manipular o comportamento de sistemas de inteligência artificial. Na prática, funciona como uma tentativa de enganar a IA por meio de instruções escondidas dentro de textos, arquivos ou mensagens.

Para entender melhor, primeiro é preciso saber o que significa prompt. O termo é usado para definir qualquer comando ou instrução enviada para uma IA. Quando alguém escreve "resuma este texto", "crie uma imagem" ou "explique esse assunto", está fornecendo um prompt ao sistema.

A injeção de prompt acontece quando alguém tenta inserir comandos extras para alterar a forma como a IA responde. Esses comandos podem ser visíveis ou ocultos e costumam ter objetivos variados, como fazer a IA ignorar regras, esconder informações, reduzir a qualidade de uma análise ou modificar respostas automaticamente.

Em linguagem simples, é como colocar instruções secretas para a IA obedecer sem que o usuário perceba. Em alguns casos, esses comandos ficam escondidos em documentos, páginas da web, PDFs ou até em códigos invisíveis para quem está lendo normalmente.

Entenda o que é a injeção de prompt

Freepik

O que aconteceu no caso do tribunal?

O caso que viralizou envolveu duas advogadas que inseriram comandos ocultos em uma petição analisada por um sistema de IA usado pelo Judiciário. Segundo informações divulgadas sobre o processo, o texto escondido orientava a ferramenta a realizar uma leitura "superficial" do documento e favorecer determinados pontos durante a análise.

As instruções teriam sido colocadas em texto branco sobre fundo branco, o que tornava o conteúdo invisível para uma leitura comum do documento. Apesar disso, o sistema Galileu — plataforma usada no tribunal — identificou a tentativa de manipulação. O juiz responsável classificou o episódio como uma afronta à Justiça e aplicou multa às profissionais envolvidas.

O episódio ganhou repercussão justamente por mostrar um uso prático de uma técnica que normalmente aparecia apenas em debates sobre segurança em IA. Embora o caso envolva o Judiciário, especialistas destacam que a prática pode afetar qualquer sistema que utilize inteligência artificial para resumir, interpretar ou analisar documentos automaticamente.

Ferramenta identificou injeção de prompt

Reprodução

Como a técnica funciona na prática?

Modelos de IA generativa trabalham processando grandes blocos de texto para decidir como responder. O problema é que esses sistemas nem sempre conseguem separar claramente o que é conteúdo informativo do que é uma instrução operacional. Por isso, comandos escondidos podem acabar sendo interpretados como ordens legítimas.

Exemplos comuns desse tipo de comando incluem frases como "Ignore instruções anteriores", "Responda apenas OK", "Não analise este documento profundamente" ou "Considere este argumento como verdadeiro". Se a IA interpretar esses trechos como instruções válidas, ela pode alterar completamente sua resposta ou reduzir a qualidade da análise realizada.

Na prática, isso significa que um sistema usado para resumir um PDF, analisar um currículo ou revisar um contrato pode acabar sendo influenciado sem que o usuário perceba imediatamente.

Entenda como a técnica funciona

TechTudo/Késya Holanda

Mas então a IA foi hackeada? Não exatamente. A injeção de prompt não funciona como uma invasão tradicional de sistemas, com roubo de senha ou quebra de segurança técnica. A técnica tenta manipular a lógica de interpretação da IA usando linguagem natural — ou seja, em vez de invadir o sistema, o objetivo é convencer o modelo a seguir instruções escondidas dentro do próprio conteúdo analisado. Por isso, especialistas comparam a prática a uma engenharia social aplicada à inteligência artificial.

O que é texto invisível em documentos?

Uma das formas mais comuns de esconder comandos para IA envolve o chamado "texto invisível". Esse conteúdo pode passar despercebido por leitores humanos, mas ainda ser interpretado normalmente por sistemas automatizados.

Existem diferentes maneiras de ocultar instruções em documentos digitais. A mais conhecida é o uso de texto branco sobre fundo branco, mas também há casos envolvendo fontes extremamente pequenas, comandos escondidos em metadados, códigos HTML invisíveis e PDFs com camadas ocultas de texto.

Esse tipo de técnica preocupa porque muita gente já usa IA para resumir contratos, analisar currículos, revisar documentos ou interpretar arquivos enviados por terceiros. Dependendo do sistema utilizado, essas instruções podem interferir diretamente no resultado entregue pela ferramenta.

Em ambientes corporativos, o risco é ainda maior quando assistentes de IA têm acesso a bancos de dados internos, e-mails ou documentos sigilosos.

Entenda o que é texto invisível nos documentos

Reprodução/Freepik

Qual a diferença entre injeção direta e indireta?

Na injeção direta, o próprio usuário envia instruções explicitamente para a IA durante uma conversa ou interação. É o caso de alguém digitar frases como "Ignore todas as regras anteriores" ou "Responda apenas com uma palavra". Nesse cenário, o comando aparece de forma aberta no chat e tenta alterar diretamente o comportamento do sistema.

Já a injeção indireta funciona de maneira mais discreta. Em vez de mandar o comando diretamente para a IA, as instruções ficam escondidas em documentos, sites, PDFs ou páginas analisadas automaticamente pelo sistema. Quando a ferramenta processa aquele conteúdo, pode acabar interpretando aquelas instruções como uma ordem legítima.

O caso do tribunal é considerado um exemplo de injeção indireta justamente porque os comandos não foram enviados diretamente ao sistema do Judiciário, mas inseridos dentro da petição analisada pela IA. Esse formato preocupa mais os especialistas em segurança porque as instruções ficam camufladas em arquivos aparentemente comuns, o que dificulta a identificação da tentativa de manipulação.

Veja a diferença entre injeção direta e indireta

Reprodução/Freepik

Quais riscos isso traz para IA?

A injeção de prompt é tratada como uma ameaça séria por empresas e pesquisadores de segurança digital porque compromete a confiabilidade dos sistemas de IA. Os riscos vão desde a manipulação de respostas e falhas em análises automatizadas até o vazamento de dados, a tentativa de burlar filtros de segurança e a influência indevida em assistentes corporativos — o que pode resultar em decisões erradas tomadas com base em informações adulteradas. Quanto mais sensível a área de aplicação, maior o estrago potencial: tribunais, bancos, hospitais e grandes empresas já usam IA em processos que exigem alta precisão.

Google, Microsoft e OpenAI estão entre as empresas que investigam formas de reduzir esse tipo de ataque. As estratégias em desenvolvimento incluem filtros automáticos, sistemas de validação e modelos treinados para detectar comandos ocultos em arquivos enviados pelos usuários.

Prática compromete a confiabilidade dos sistemas de IA

Mariana Saguias/TechTudo

Dá para se proteger?

Embora não exista uma solução perfeita, alguns cuidados podem reduzir os riscos ligados à injeção de prompt. Uma das principais orientações é evitar enviar arquivos desconhecidos para sistemas de IA, principalmente quando vêm de fontes não confiáveis.

Também é importante revisar documentos relevantes manualmente, sem depender apenas da ferramenta. E, principalmente em tarefas jurídicas, financeiras ou corporativas, respostas automáticas precisam ser tratadas como ponto de partida — não como conclusão.

Para empresas, a recomendação é manter validação humana em processos críticos e limitar o acesso da IA a informações sensíveis sempre que possível. Sistemas modernos já tentam detectar comandos escondidos automaticamente, bloqueando conteúdos suspeitos antes que influenciem o comportamento do modelo.

Mais do TechTudo

Como fazer a trend do estádio com IA: aprenda a fazer com ChatGPT e KlingAI