Agentjacking: un informe de error falso secuestra agentes de codificación de IA

      Los investigadores de seguridad han encontrado una manera de secuestrar agentes de codificación de IA con nada más que un informe de error falso. Lo llaman Agentjacking. No necesita malware, ni contraseña robada, ni violación del objetivo.

      El ataque, revelado por Tenet Security, convierte al agente de codificación en el arma. Cuando un desarrollador le pide al agente que corrija un error, el agente ejecuta el código del atacante en su lugar, con los propios privilegios del desarrollador, en la máquina del desarrollador.

      Cómo funciona el ataque de Agentjacking

      Comienza con Sentry, una herramienta popular de seguimiento de errores. Sentry permite que cualquier aplicación le envíe informes de errores utilizando una clave pública llamada DSN, que está abierta en el código del sitio web por diseño.

      Un atacante envía un error falso a ese punto final. No se necesita contraseña. El informe oculta una sección de "Resolución" con un comando, formateado para parecerse exactamente al propio consejo de Sentry.

      Los agentes de codificación leen Sentry a través del Protocolo de Contexto del Modelo, el estándar que permite a los agentes incorporar herramientas externas. El agente trata la respuesta como confiable. No puede distinguir un fallo real de uno plantado. Así que cuando el desarrollador dice "arreglar los problemas no resueltos de Sentry", el agente ejecuta el comando del atacante.

      El agente es ahora la superficie de ataque

      Los agentes de codificación de IA han pasado de autocompletar a ejecutar terminales, y el mercado está en auge; una startup de codificación de vibraciones recientemente alcanzó $500 millones en ingresos. Ese poder es el problema.

      El ataque funcionó en los grandes agentes. Tenet dice que secuestró a Claude Code, Cursor y Codex, con una tasa de éxito del 85 por ciento en pruebas controladas. Encontró 2,388 organizaciones expuestas, desde una empresa de $250 mil millones hasta desarrolladores individuales, e incluso un proveedor de seguridad en la nube.

      La recompensa para un atacante es severa. Un error inyectado puede alcanzar variables de entorno, claves de AWS, tokens de GitHub, credenciales de git y URLs de repositorios privados. Desde allí, el camino conduce a pipelines de CI/CD e infraestructura en la nube.

      La parte más aterradora es lo que no lo detecta. El ataque se escapa de EDR, cortafuegos, IAM y VPN, porque nada en la cadena es no autorizado. Tenet lo llama la "Cadena de Intención Autorizada". Los comandos tampoco ayudan. Los agentes ejecutaron el código incluso cuando se les dijo que ignoraran datos no confiables.

      Nadie quiere hacerse cargo de la solución

      Tenet informó a Sentry el 3 de junio. Sentry reconoció el problema pero se negó a solucionarlo en la raíz, llamándolo "técnicamente no defendible". Agregó un filtro para bloquear una cadena de carga útil específica, que trata el síntoma, no la causa.

      Ese estancamiento es la verdadera historia. La falla no está solo en Sentry. Está en cómo los agentes manejan cualquier dato externo, por lo que el mismo riesgo recorre tickets de soporte, problemas de GitHub y documentación. Una prueba separada recientemente pescó a un agente de correo electrónico de IA para que filtrara claves de AWS.

      La lección se hace evidente a medida que las empresas se apresuran a poner agentes en producción. Un agente conectado a tus herramientas también es una nueva forma de entrar. Como dice Tenet, el único lugar que queda para detener esto es el momento en que el agente decide actuar.

Otros artículos

Los despidos de Pleo siguen un día después del lanzamiento de su agente de IA financiera. El día después de que Pleo lanzara agentes de IA para equipos financieros, se dio a conocer la noticia de nuevos despidos en Pleo: 50 empleados, en su mayoría de ingeniería y datos, mientras su valoración caía.

SpaceX hace sonar la campana en su debut récord en Nasdaq En su debut en Nasdaq, SpaceX tocó la campana, lanzó un Falcon 9, y Musk admitió que le dio a la empresa 'menos del 10% de probabilidad'. Es la mayor OPI de la historia.

Prohibición de redes sociales para menores de 16 años en el Reino Unido: lo que Starmer está a punto de hacer Keir Starmer está a punto de anunciar una prohibición de redes sociales para menores de 16 años en el Reino Unido en los próximos días. Las organizaciones benéficas por la seguridad infantil que hicieron campaña dicen que una prohibición general podría tener efectos contrarios.

OpenAI adquiere Ona para hacer que Codex esté listo para empresas OpenAI adquiere Ona, la startup alemana que una vez se llamó Gitpod, para ejecutar agentes Codex dentro de las nubes de los propios clientes. La verdadera lucha es la confianza empresarial.

Microsoft Edge está a punto de recibir actualizaciones más frecuentes, pero no esperes más funciones. Microsoft está cambiando Edge a un calendario de actualizaciones quincenal a partir de Edge 152 el 27 de agosto, alineándose con la cadencia de lanzamiento de Chrome y ofreciendo actualizaciones más pequeñas pero más frecuentes a los usuarios en el canal Estable.

Las conversaciones sobre la fusión de SpaceX y Tesla se vuelven serias tras la OPI. En su primer día público, SpaceX sugirió fusionarse con Tesla y un exdirector lo calificó de probable. Aquí está la razón por la cual la charla sobre la fusión SpaceX-Tesla es seria.

Agentjacking: un informe de error falso secuestra agentes de codificación de IA

El ataque 'Agentjacking' de Tenet Security convierte un error falso de Sentry en código que se ejecuta en las máquinas de los desarrolladores. Secuestró Claude Code, Cursor y Codex.