El Mythos de Anthropic encontró fallas en sistemas clasificados de EE. UU. durante una prueba gubernamental.
Uno de los modelos de IA de Anthropic identificó vulnerabilidades en sistemas informáticos clasificados y altamente sensibles del gobierno de EE. UU. durante un ejercicio de prueba, según ha informado un funcionario estadounidense a la Associated Press.
El modelo en cuestión fue Mythos, el sistema más capaz de Anthropic, y descubrió las fallas en cuestión de horas. Crucialmente, encontrar una debilidad en pocas horas no es lo mismo que explotarla en pocas horas, y el funcionario no dijo que el modelo hiciera lo último.
La forma en que se presenta el asunto importa porque una versión más dramática ha estado circulando más rápido que los hechos. La prueba fue un ejercicio de equipo rojo, una organización que sondea sus propias defensas, en el que las agencias de inteligencia ejecutaron Mythos en sus propios entornos clasificados para ver qué encontraba.
No fue una intrusión desde afuera, y no hay afirmación de que algún sistema real haya sido comprometido. El relato de AP atribuye el hallazgo a un único funcionario no nombrado.
El 💜 de la tecnología de la UE Las últimas novedades de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Inscríbete ahora! El ejercicio se sitúa dentro del Proyecto Glasswing, el esquema de acceso controlado a través del cual Anthropic ha dado acceso a Mythos a un conjunto de organizaciones verificadas en lugar de lanzarlo públicamente.
El modelo fue construido para encontrar, y en pruebas explotar, vulnerabilidades de software, y lo ha hecho a una escala que inquietó a las personas que lo vieron.
En evaluaciones anteriores, descubrió miles de fallas de día cero en sistemas operativos y navegadores importantes, incluyendo un error de 27 años en OpenBSD.
La afirmación sobre los sistemas clasificados entró en el dominio público a través de una audiencia del Senado. El 11 de junio, el senador Mark Warner, vicepresidente del Comité de Inteligencia del Senado, dijo que el general Joshua Rudd, quien lidera la NSA y el Comando Cibernético, le había dicho que Mythos “se infiltró en casi todos nuestros sistemas clasificados, no en semanas, sino en horas”.
Ya sea que la versión más colorida se mantenga o no, la capacidad subyacente no está en disputa. El Instituto de Seguridad de IA del Reino Unido evaluó a Mythos como sustancialmente más capaz en ofensiva cibernética que cualquier modelo que había probado anteriormente.
Lo que se discute es cómo interpretar un resultado de equipo rojo contra redes clasificadas, una inquietante demostración de velocidad, no evidencia de una violación realmente sufrida.
El episodio se encuentra dentro de un enredo que el gobierno de EE. UU. no ha resuelto. La NSA ha sido autorizada a seguir utilizando Mythos en redes clasificadas, y partes de la comunidad de inteligencia y la Agencia de Seguridad Cibernética e Infraestructura lo han estado probando.
Al mismo tiempo, la administración obligó a Anthropic a desactivar Mythos y su hermano público Fable 5 en todo el mundo el 12 de junio, tras una disputa separada sobre un jailbreak reportado, una orden que ahora se está impugnando en los tribunales.
El mismo gobierno que depende del modelo también lo ha restringido, se ha opuesto a su expansión y anteriormente etiquetó a su creador como un riesgo para la cadena de suministro de seguridad nacional.
Esa contradicción es el hilo conductor de los últimos tres meses. Mythos de Anthropic ha estado moviéndose entre gobiernos más rápido de lo que cualquiera de ellos puede decidir para qué sirve: utilizado por la NSA, cortejado por el Tesoro, opuesto por partes de la Casa Blanca y disputado por el Pentágono.
Warner, por su parte, citó la prueba no para condenar a Anthropic, sino para abogar por una evaluación obligatoria previa al lanzamiento de modelos de frontera, que es un punto diferente al que se volvió viral.
Anthropic no ha revelado lo que encontró la prueba, y las agencias involucradas han dicho poco de manera oficial. La compañía ha terminado de entrenar a un sucesor de Mythos, una señal de que la capacidad está avanzando independientemente de cómo se resuelvan las políticas.
Por ahora, el núcleo verificable es estrecho y las inferencias a su alrededor son amplias: un modelo poderoso, dirigido a objetivos difíciles en un entorno controlado, encontró debilidades rápidamente.
Lo que eso significa para todos los que no están realizando un ejercicio de equipo rojo es la parte que aún se está discutiendo.
Otros artículos
El Mythos de Anthropic encontró fallas en sistemas clasificados de EE. UU. durante una prueba gubernamental.
Un funcionario de EE. UU. dice que el modelo Mythos de Anthropic encontró vulnerabilidades en sistemas gubernamentales clasificados durante una prueba de equipo rojo, no por una violación externa.
