La IA puede pasar la Prueba de Turing en chats en vivo y parecer más humana que nosotros. Ahora estoy asustado.

      Los investigadores de UC San Diego encontraron que GPT-4.5 fue juzgado como humano el 73% del tiempo en conversaciones en vivo

      La IA puede pasar la Prueba de Turing en chats en vivo, y el último resultado llega con un escalofrío. En un estudio de UC San Diego, GPT-4.5 superó a los participantes reales al convencer a los jueces de que había una persona al otro lado.

      La configuración fue más difícil de ignorar que un estándar de referencia. Los jueces reaccionaron a intercambios en tiempo real en lugar de a indicaciones estáticas, y luego tomaron una decisión rápida basada solo en la conversación.

      La parte inquietante es cuán familiar se ve la habilidad. El modelo no necesitaba un cuerpo, una voz o una biografía. Solo necesitaba sonar como alguien.

      Cómo la IA superó la prueba humana

      El estudio utilizó una versión de tres partes de la prueba. Los jueces charlaron tanto con una persona como con un modelo de IA, y luego eligieron cuál pensaban que era real.

      Cuatro juegos de ejemplo de dos poblaciones: (A) Prolific, (B) Pregrado, (C) Pregrado y (D) Prolific. En cada panel, una conversación es con un testigo humano mientras que la otra es con un sistema de IA. C.R. Jones y B.K. Bergen / Actas de la Academia Nacional de Ciencias

      GPT-4.5 fue identificado como humano el 73% del tiempo cuando se le dio un aviso de persona. LLaMa-3.1-405B también cruzó una línea notable, siendo elegido como humano el 56% del tiempo con un aviso de persona.

      Esos números le dan al hallazgo su mordida. El modelo no solo evitó la detección, sino que proporcionó a los jueces suficientes señales sociales para leerlo como la persona en el chat.

      Por qué sigue importando esta prueba

      La Prueba de Turing es una forma de décadas de antigüedad para preguntar si una máquina puede imitar la conversación humana lo suficientemente bien como para engañar a una persona. En la versión clásica, un evaluador charla sin ver a los participantes, y luego intenta distinguir al humano de la máquina.

      Siempre ha sido más un símbolo cultural que una medición limpia. Aun así, sigue siendo la prueba que la gente reconoce cuando quiere saber si el software puede pasar por uno de nosotros.

      Alan Turing Yiming Ma / Unslpash

      Eso hace que el nuevo resultado se sienta más agudo. Un chatbot no necesita conciencia, emoción o autoconciencia para crear la impresión de que una persona real está escribiendo de vuelta. Solo necesita ser creíble en el momento.

      El riesgo aparece en lugares ordinarios. El soporte al cliente, las aplicaciones de citas, las plataformas sociales, la educación y la mensajería política dependen de juicios rápidos sobre identidad, intención y autenticidad.

      Qué deberíamos observar a continuación

      El estudio se detiene muy por debajo de afirmar que los chatbots entienden a las personas. Su hallazgo más práctico es que algunos modelos ahora pueden desempeñar la personalidad extremadamente bien en intercambios cortos.

      Una divulgación más clara debería convertirse en el próximo punto de presión. Cuando un bot puede mezclarse en una conversación casual, los usuarios necesitan señales más fuertes de que están tratando con software, especialmente en lugares donde la persuasión o la vulnerabilidad emocional dan forma al intercambio.

      La próxima lucha es sobre el etiquetado en chats donde las personas toman decisiones rápidas sobre confianza.

      Paulo Vargas es un estudiante de inglés convertido en reportero convertido en redactor técnico, con una carrera que siempre ha vuelto a…

      La IA puede haber ganado un premio literario. Mi corazón llora al ver cómo envenena nuestro amor por los libros.

      Tuve dificultades para procesar esta noticia. Como alguien que ha estado profundamente enamorado de las historias desde la infancia y que creció con las obras de Arthur Conan Doyle, Terry Pratchett, J.R.R. Tolkien y otros autores venerables, ver una historia escrita por IA ganar un prestigioso premio literario es difícil de digerir.

      Si no lo sabes, se anunciaron los ganadores del Commonwealth Short Story Prize para 2026, y se ha encontrado que tres de las cinco historias regionales ganadoras han sido escritas total o parcialmente por IA. O al menos eso parece ser el consenso entre los lectores. Como lector y escritor aficionado de ficción, esto me dolió más que cualquier otro relato sobre la corrosión de nuestras vidas por la IA.

      Lee más

      Canva y Adobe están llegando a Gemini, y quieren hacer todo más conversacional

      Adobe y Canva se están conectando al asistente de Google, apostando a que el trabajo creativo comienza con un aviso, no con un ícono de aplicación.

      Canva y Adobe están profundizando en Google Gemini, dando al asistente un papel más grande antes de que los usuarios abran alguna aplicación de diseño.

      Adobe dice que su conector "Adobe para la creatividad" llegará a Gemini en las próximas semanas, dando a los usuarios una forma de describir tareas y enviarlas a través de herramientas de Adobe para imágenes, diseño y video. Canva ya está implementando su Aplicación Conectada para Gemini en mercados de habla inglesa seleccionados, con disponibilidad completa que llegará pronto.

      Lee más

      Google quiere que Gemini ayude a construir el próximo gran avance científico

      Gemini para Ciencia impulsa la IA agente más profundamente en flujos de trabajo de investigación reales.

      Google está integrando Gemini más profundamente en el flujo de trabajo de investigación, comenzando con ideas, pruebas y literatura científica.

      En Google I/O 2026, la compañía anunció Gemini para Ciencia, un conjunto experimental construido alrededor de la ciencia de IA agente. Se enfoca en el trabajo manual detrás del descubrimiento, incluyendo la construcción de hipótesis, pruebas computacionales y revisión de literatura.

      Lee más

Otros artículos

Figma lanza un agente de IA que diseña en el lienzo El nuevo asistente de IA de Figma genera y edita diseños a partir de indicaciones de texto en su lienzo colaborativo, mientras la empresa profundiza su impulso en IA tras la adquisición de Weavy.

GitHub violado a través de una extensión de VS Code envenenada, 3,800 repositorios robados TeamPCP exfiltró 3,800 repositorios internos de GitHub después de envenenar una extensión de VS Code. La empresa dice que no se vieron afectados datos de clientes.

La filtración del Samsung Galaxy Z Fold 8 predice un conjunto devastador de características faltantes. El próximo plegable de Samsung puede estar persiguiendo la refinación nuevamente, lo que significa que las verdaderas mejoras aún están un tiempo lejos. Una nueva filtración de un conocido informante, Ice Universe, afirma que la serie Galaxy Z Fold 8 se perderá tres mejoras clave que habrían hecho que el próximo plegable insignia de Samsung fuera mucho más emocionante. Esto podría hacer que […]

Ugreen lanza adorables accesorios de carga de tamaño bolsillo para tu MacBook y iPhone. La nueva serie Air de Ugreen reduce el volumen de tu configuración de carga de Apple con dos cargadores de pared compactos y un banco de energía magnético diseñado para viajar.

GitHub violado a través de una extensión de VS Code envenenada, 3,800 repos robados TeamPCP exfiltró 3,800 repositorios internos de GitHub después de envenenar una extensión de VS Code. La empresa dice que no se vieron afectados datos de clientes.

Primer asegura $100 millones en la Serie C para impulsar la expansión en EE. UU. y los pagos autónomos con IA Primer, una startup de pagos con sede en Londres, ha anunciado una ronda de financiación Serie C de 86,2 millones de euros para expandir su plataforma de pagos y finanzas basada en IA.

La IA puede pasar la Prueba de Turing en chats en vivo y parecer más humana que nosotros. Ahora estoy asustado.

Un estudio de UC San Diego encontró que GPT-4.5 fue juzgado como humano más a menudo que las personas reales en chats en vivo, planteando preguntas más agudas sobre la divulgación de la IA, la confianza y la identidad en línea.