La seguridad de los agentes de inteligencia artificial se está convirtiendo en un verdadero dolor de cabeza para los desarrolladores. Si alguna vez has dejado un agente operando de forma autónoma, sabes el miedo que da que alguien logre inyectarle un comando malicioso. Para atacar este problema, acaban de salir al mercado dos herramientas que prometen ponerle un candado a tus flujos de trabajo: Arc Gate y Arc Sentry.
Lanzadas a principios de noviembre, estas dos soluciones trabajan en equipo para filtrar y vigilar qué instrucciones llegan a tus agentes y qué ejecutan finalmente. Básicamente, funcionan como un guardia de seguridad y un sistema de cámaras para tus modelos.
¿Qué hacen exactamente?
El funcionamiento se divide en dos capas defensivas:
- Arc Gate: Es la barrera de entrada. Actúa como un filtro estricto que rebota cualquier instrucción que no cumpla con los parámetros de seguridad que hayas definido previamente. Si el comando parece un intento de manipular al agente (el clásico prompt injection), Arc Gate simplemente le cierra la puerta.
- Arc Sentry: Si Arc Gate es la puerta, Sentry es la vigilancia interna. Se encarga de monitorear cómo el agente procesa las instrucciones ya validadas, asegurándose de que la ejecución no se desvíe hacia comportamientos extraños o fuera de sus límites programados.
El equipo detrás de este lanzamiento asegura que en sus simulaciones han logrado tasas de bloqueo altísimas frente a ataques complejos, manteniendo los falsos positivos al mínimo. Esto es un detalle clave, porque a nadie le sirve un sistema de seguridad tan paranoico que termine bloqueando a los usuarios legítimos.
Precios y cómo probarlo
Lo interesante de esta propuesta es cómo han estructurado el acceso. Si quieres montar la seguridad en tu propia infraestructura, Arc Sentry es de código abierto y completamente gratuito para uso autoalojado a través de su repositorio en GitHub.
Por otro lado, la barrera de filtrado, Arc Gate, funciona bajo un modelo de suscripción que cuesta $29 mensuales. También tienen una demo web habilitada para que puedas tirar un par de comandos y ver cómo reacciona el sistema antes de sacar la tarjeta de crédito.
¿Vale la pena?
Hasta hace poco, herramientas como LLM Guard eran de las pocas opciones confiables para proteger agentes de IA. Sin embargo, la dupla de Arc Gate y Sentry llega pisando fuerte, especialmente por lo fácil que resulta implementar Sentry de forma local sin gastar un peso.
Si estás construyendo automatizaciones donde un agente de IA interactúa con datos sensibles o toma decisiones reales, probar esta nueva capa de seguridad puede ahorrarte más de un susto a futuro.
