A segurança dos agentes de inteligência artificial está se tornando uma verdadeira dor de cabeça para os desenvolvedores. Se você já deixou um agente operando de forma autônoma, sabe o medo que dá que alguém consiga injetar um comando malicioso. Para atacar esse problema, acabaram de sair no mercado duas ferramentas que prometem colocar um cadeado nos seus fluxos de trabalho: Arc Gate e Arc Sentry.
Lançadas no início de novembro, essas duas soluções trabalham em equipe para filtrar e vigiar quais instruções chegam aos seus agentes e o que eles executam, finalmente. Basicamente, funcionam como um guarda de segurança e um sistema de câmeras para seus modelos.
O que fazem exatamente?
O funcionamento se divide em duas camadas defensivas:
- Arc Gate: É a barreira de entrada. Atua como um filtro rigoroso que rejeita qualquer instrução que não atenda aos parâmetros de segurança que você definiu previamente. Se o comando parece uma tentativa de manipular o agente (o clássico prompt injection), o Arc Gate simplesmente fecha a porta.
- Arc Sentry: Se o Arc Gate é a porta, o Sentry é a vigilância interna. Ele se encarrega de monitorar como o agente processa as instruções já validadas, garantindo que a execução não se desvie para comportamentos estranhos ou fora de seus limites programados.
A equipe por trás desse lançamento garante que em suas simulações conseguiram taxas de bloqueio altíssimas frente a ataques complexos, mantendo os falsos positivos ao mínimo. Este é um detalhe chave, porque a ninguém serve um sistema de segurança tão paranoico que acabe bloqueando usuários legítimos.
Preços e como testar
O interessante dessa proposta é como estruturaram o acesso. Se você quer montar a segurança em sua própria infraestrutura, Arc Sentry é de código aberto e completamente gratuito para uso auto-hospedado através de seu repositório no GitHub.
Por outro lado, a barreira de filtragem, Arc Gate, funciona sob um modelo de assinatura que custa R$29 mensais. Eles também têm uma demo web habilitada para que você possa testar alguns comandos e ver como o sistema reage antes de pegar o cartão de crédito.
Vale a pena?
Até pouco tempo atrás, ferramentas como LLM Guard eram uma das poucas opções confiáveis para proteger agentes de IA. No entanto, a dupla Arc Gate e Sentry chega com força, especialmente pela facilidade de implementar o Sentry de forma local sem gastar um centavo.
Se você está construindo automações onde um agente de IA interage com dados sensíveis ou toma decisões reais, testar essa nova camada de segurança pode te poupar mais de um susto no futuro.
