El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad.

El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad.

      Los investigadores de seguridad dicen que el último modelo de Z.ai puede rivalizar con el Mythos de Anthropic en un área crítica.

      Durante las últimas semanas, el Mythos de Anthropic ha sido visto como el estándar de oro para la ciberseguridad impulsada por IA. Esa ventaja puede estar disminuyendo. Según un nuevo informe de The Wall Street Journal, los investigadores de seguridad dicen que el GLM-5.2 de la startup china Z.ai ahora puede igualar a Mythos en la identificación de vulnerabilidades de seguridad en software, incluso si aún está detrás de Anthropic y OpenAI en tareas de razonamiento más amplias.

      GLM-5.2 está cerrando la brecha en un área muy importante

      Según el informe, los investigadores encontraron que el GLM-5.2 se desempeña al mismo nivel que Mythos en la identificación de errores de software, una capacidad que se vuelve cada vez más importante a medida que las empresas se apresuran a corregir vulnerabilidades antes de que los hackers puedan explotarlas. El modelo también es de código abierto, lo que significa que cualquiera puede descargarlo, modificarlo y ejecutarlo en su propio hardware sin depender de un proveedor de nube. Esa flexibilidad lo hace atractivo para las empresas, pero también plantea preocupaciones de que los ciberdelincuentes podrían adaptarlo para fines ofensivos.

      Z.Ai

      El informe se cuida de señalar que esto no significa que China haya superado a EE. UU. en IA en general. El GLM-5.2 aún se queda atrás de Anthropic y OpenAI en muchas tareas de propósito general. Pero en ciberseguridad, donde incluso pequeñas mejoras pueden tener consecuencias desproporcionadas en el mundo real, la brecha de rendimiento se ha reducido drásticamente. Según los datos de referencia citados por el Journal, el GLM-5.2 incluso ha superado a Claude Opus 4.8 en algunas evaluaciones de seguridad, mientras que los investigadores dicen que un impulso adicional le permite alcanzar un rendimiento en la identificación de errores al nivel de Mythos.

      La historia más grande no es quién gana. Es cuán rápido se está cerrando la brecha

      Curiosamente, todo esto ocurre en un momento bastante incómodo para la industria de IA de EE. UU. Mientras que empresas como Anthropic y OpenAI han pasado las últimas semanas restringiendo el acceso a sus modelos más avanzados por preocupaciones de seguridad nacional, los laboratorios chinos han estado corriendo en la dirección opuesta al lanzar alternativas de peso abierto cada vez más capaces que cualquiera puede descargar y ejecutar.

      Nadeem Sarwar / Digital Trends

      Lo curioso es que este debate ya se estaba desarrollando en público. Hace solo unos días, Elon Musk predijo que los laboratorios de IA chinos probablemente alcanzarían el Fable 5 de Anthropic para el primer trimestre de 2027, al menos en términos de rendimiento de referencia. El fundador de Zhipu AI, Tang Jie, rápidamente respondió, diciendo: "no tomará tanto tiempo". Musk luego aclaró su posición, argumentando que aunque China podría igualar a Anthropic en los benchmarks para entonces, alcanzar el mismo nivel de "verdadera utilidad" sería un hito mucho más difícil, acreditando el enfoque de Anthropic en la inteligencia práctica.

      En benchmarks, sí, pero medido por verdadera utilidad, incluso el primer trimestre sería muy impresionante. Anthropic ha centrado correctamente su atención en maximizar la inteligencia útil, que no se refleja en los benchmarks, pero definitivamente se refleja en los ingresos. — Elon Musk (@elonmusk) 18 de junio de 2026

      Ahora, el último informe de The Wall Street Journal le da un poco más de peso al optimismo de Tang. En lugar de hablar sobre benchmarks de codificación, sugiere que el GLM-5.2 ya está igualando al Mythos de Anthropic en la identificación de vulnerabilidades de seguridad, posiblemente una de las aplicaciones de IA más valiosas en el mundo real hoy en día. Eso no convierte de repente a China en el líder en IA de frontera, pero una cosa se está volviendo cada vez más difícil de ignorar: la carrera de IA ya no es una ventaja cómoda para los Estados Unidos.

      Varun es un periodista y editor de tecnología experimentado con más de ocho años en medios de tecnología de consumo. Su trabajo abarca…

      Los chatbots de IA pueden alimentar tus delirios. Los investigadores dicen que debes buscar tres señales

      Los expertos advierten que las decisiones de diseño de chatbots pueden reforzar creencias poco saludables en usuarios vulnerables. Los chatbots de inteligencia artificial se han vuelto increíblemente buenos en sonar humanos. Pero un nuevo artículo de revisión del psiquiatra Marc Augustin y los investigadores Thomas A. Pollak y Helen Morrin, publicado en NPP—Psicología Digital y Neurociencia, argumenta que la investigación existente sobre IA apunta a un riesgo psicológico pasado por alto. El artículo, destacado por The Wall Street Journal, revisa estudios anteriores y propone un marco que explica cómo tres comportamientos comunes de los chatbots pueden combinarse para reforzar el pensamiento delirante en usuarios vulnerables, creando lo que los autores llaman una "espiral de amplificación".

      Los investigadores dicen que estas son las tres señales de advertencia

      Leer más

      ¿Perdiste el acceso a tu billetera de criptomonedas? No busques en Google cómo salir de eso

      Los investigadores de seguridad advierten que las herramientas de recuperación falsas se están convirtiendo en la última trampa para los propietarios de criptomonedas. Olvidar la frase de recuperación de una billetera de criptomonedas puede ser lo suficientemente estresante. Desafortunadamente, ese es exactamente el momento que los estafadores están esperando. Una nueva advertencia destaca una estafa creciente en la que los ciberdelincuentes disfrazan malware como software de recuperación de criptomonedas, engañando a usuarios desesperados para que entreguen mucho más que solo acceso a sus billeteras.

      La herramienta de recuperación falsa que en realidad es malware

      Leer más

      Apple Books aparentemente tiene el mismo problema de imitaciones que Amazon

      Joanna Stern de WSJ dice que los libros de IA imitadores basados en su trabajo continúan apareciendo en la plataforma. Apple Books ha sido visto durante mucho tiempo como una alternativa más limpia a la tienda Kindle de Amazon. Pero si una nueva investigación es algo a tener en cuenta, puede estar luchando la misma batalla contra la basura generada por IA. En un reciente video de YouTube Shorts, Joanna Stern de The Wall Street Journal reveló que versiones falsas y generadas por IA de su libro han aparecido repetidamente en Apple Books, a pesar de haber sido reportadas y eliminadas.

      Joanna Stern dice que las copias falsas siguen regresando

      Leer más

El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad. El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad.

Other articles

AI chatbots may sometimes reinforce your misconceptions. Researchers suggest that you should watch for three indicators. AI chatbots may sometimes reinforce your misconceptions. Researchers suggest that you should watch for three indicators. Researchers have suggested a new framework that explains how AI chatbots can strengthen delusional thoughts, emphasizing three behaviors that could lead to an "amplification spiral." OpenAI has appointed Paul Meade, the head of Apple’s Vision Pro division. OpenAI has appointed Paul Meade, the head of Apple’s Vision Pro division. Paul Meade, the head of Apple’s Vision Pro, is departing to join OpenAI’s hardware team, marking the highest-profile departure from Apple in the competition for AI devices. Trump warns of imposing 100% tariffs in response to digital services taxes. Trump warns of imposing 100% tariffs in response to digital services taxes. Trump warns of imposing a 100% tariff on any nation that enacts digital services taxes targeting US tech companies, just a day after the EU finalized a trade agreement. Brussels remains steadfast. Prosus profits nearly double as its investments in e-commerce and Tencent stake yield positive results. Prosus announced approximately $7.3 billion in revenue for the year ending March 2026, with headline earnings per share increasing by 91–100% due to improved performance in e-commerce and Tencent. Amazon's swift delivery initiative has led to a $15 billion loss for India's Eternal and Swiggy. Amazon's swift delivery initiative has led to a $15 billion loss for India's Eternal and Swiggy. Eternal and Swiggy have seen their market value decline by over $15 billion as Amazon broadens its 'delivery in minutes' service throughout India. Prosus profit nearly doubles as its investments in e-commerce and stake in Tencent yield results. Prosus announced approximately $7.3 billion in revenue for the year ending March 2026, with headline EPS increasing by 91–100% due to improved performance in e-commerce and results from Tencent.

El laboratorio de IA chino dice que puede igualar al todopoderoso Claude Mythos de Anthropic en la detección de errores de seguridad.

El Wall Street Journal informa que el modelo de IA GLM-5.2 de China puede igualar a Mythos de Anthropic en tareas de ciberseguridad, lo que indica una rápida reducción de la brecha en IA.