La IA puede pasar la Prueba de Turing en chats en vivo y parecer más humana que nosotros. Ahora estoy asustado.
Los investigadores de UC San Diego encontraron que GPT-4.5 fue juzgado como humano el 73% del tiempo en conversaciones en vivo
La IA puede pasar la Prueba de Turing en chats en vivo, y el último resultado llega con un escalofrío. En un estudio de UC San Diego, GPT-4.5 superó a los participantes reales al convencer a los jueces de que había una persona al otro lado.
La configuración fue más difícil de ignorar que un estándar de referencia. Los jueces reaccionaron a intercambios en tiempo real en lugar de a indicaciones estáticas, y luego tomaron una decisión rápida basada solo en la conversación.
La parte inquietante es cuán familiar se ve la habilidad. El modelo no necesitaba un cuerpo, una voz o una biografía. Solo necesitaba sonar como alguien.
Cómo la IA superó la prueba humana
El estudio utilizó una versión de tres partes de la prueba. Los jueces charlaron tanto con una persona como con un modelo de IA, y luego eligieron cuál pensaban que era real.
Cuatro juegos de ejemplo de dos poblaciones: (A) Prolific, (B) Pregrado, (C) Pregrado y (D) Prolific. En cada panel, una conversación es con un testigo humano mientras que la otra es con un sistema de IA. C.R. Jones y B.K. Bergen / Actas de la Academia Nacional de Ciencias
GPT-4.5 fue identificado como humano el 73% del tiempo cuando se le dio un aviso de persona. LLaMa-3.1-405B también cruzó una línea notable, siendo elegido como humano el 56% del tiempo con un aviso de persona.
Esos números le dan al hallazgo su mordida. El modelo no solo evitó la detección, sino que proporcionó a los jueces suficientes señales sociales para leerlo como la persona en el chat.
Por qué sigue importando esta prueba
La Prueba de Turing es una forma de décadas de antigüedad para preguntar si una máquina puede imitar la conversación humana lo suficientemente bien como para engañar a una persona. En la versión clásica, un evaluador charla sin ver a los participantes, y luego intenta distinguir al humano de la máquina.
Siempre ha sido más un símbolo cultural que una medición limpia. Aun así, sigue siendo la prueba que la gente reconoce cuando quiere saber si el software puede pasar por uno de nosotros.
Alan Turing Yiming Ma / Unslpash
Eso hace que el nuevo resultado se sienta más agudo. Un chatbot no necesita conciencia, emoción o autoconciencia para crear la impresión de que una persona real está escribiendo de vuelta. Solo necesita ser creíble en el momento.
El riesgo aparece en lugares ordinarios. El soporte al cliente, las aplicaciones de citas, las plataformas sociales, la educación y la mensajería política dependen de juicios rápidos sobre identidad, intención y autenticidad.
Qué deberíamos observar a continuación
El estudio se detiene muy por debajo de afirmar que los chatbots entienden a las personas. Su hallazgo más práctico es que algunos modelos ahora pueden desempeñar la personalidad extremadamente bien en intercambios cortos.
Una divulgación más clara debería convertirse en el próximo punto de presión. Cuando un bot puede mezclarse en una conversación casual, los usuarios necesitan señales más fuertes de que están tratando con software, especialmente en lugares donde la persuasión o la vulnerabilidad emocional dan forma al intercambio.
La próxima lucha es sobre el etiquetado en chats donde las personas toman decisiones rápidas sobre confianza.
Paulo Vargas es un estudiante de inglés convertido en reportero convertido en redactor técnico, con una carrera que siempre ha vuelto a…
La IA puede haber ganado un premio literario. Mi corazón llora al ver cómo envenena nuestro amor por los libros.
Tuve dificultades para procesar esta noticia. Como alguien que ha estado profundamente enamorado de las historias desde la infancia y que creció con las obras de Arthur Conan Doyle, Terry Pratchett, J.R.R. Tolkien y otros autores venerables, ver una historia escrita por IA ganar un prestigioso premio literario es difícil de digerir.
Si no lo sabes, se anunciaron los ganadores del Commonwealth Short Story Prize para 2026, y se ha encontrado que tres de las cinco historias regionales ganadoras han sido escritas total o parcialmente por IA. O al menos eso parece ser el consenso entre los lectores. Como lector y escritor aficionado de ficción, esto me dolió más que cualquier otro relato sobre la corrosión de nuestras vidas por la IA.
Lee más
Canva y Adobe están llegando a Gemini, y quieren hacer todo más conversacional
Adobe y Canva se están conectando al asistente de Google, apostando a que el trabajo creativo comienza con un aviso, no con un ícono de aplicación.
Canva y Adobe están profundizando en Google Gemini, dando al asistente un papel más grande antes de que los usuarios abran alguna aplicación de diseño.
Adobe dice que su conector "Adobe para la creatividad" llegará a Gemini en las próximas semanas, dando a los usuarios una forma de describir tareas y enviarlas a través de herramientas de Adobe para imágenes, diseño y video. Canva ya está implementando su Aplicación Conectada para Gemini en mercados de habla inglesa seleccionados, con disponibilidad completa que llegará pronto.
Lee más
Google quiere que Gemini ayude a construir el próximo gran avance científico
Gemini para Ciencia impulsa la IA agente más profundamente en flujos de trabajo de investigación reales.
Google está integrando Gemini más profundamente en el flujo de trabajo de investigación, comenzando con ideas, pruebas y literatura científica.
En Google I/O 2026, la compañía anunció Gemini para Ciencia, un conjunto experimental construido alrededor de la ciencia de IA agente. Se enfoca en el trabajo manual detrás del descubrimiento, incluyendo la construcción de hipótesis, pruebas computacionales y revisión de literatura.
Lee más
Otros artículos
La IA puede pasar la Prueba de Turing en chats en vivo y parecer más humana que nosotros. Ahora estoy asustado.
Un estudio de UC San Diego encontró que GPT-4.5 fue juzgado como humano más a menudo que las personas reales en chats en vivo, planteando preguntas más agudas sobre la divulgación de la IA, la confianza y la identidad en línea.
