Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

      Pedirle a la IA que finja ser un experto puede salir mal, pero los investigadores pueden haber encontrado una solución.

      Probablemente has visto el consejo circulando: dile a la IA que actúe como un experto en un campo, y obtendrás mejores respuestas. Es un consejo popular, y a veces funciona. Sin embargo, un nuevo estudio sugiere que usar personas de IA puede no ser tan efectivo como pensábamos.

      Investigadores de la Universidad de California probaron 12 personas diferentes en seis modelos de lenguaje. Las personas iban desde expertos en matemáticas y programación hasta escritores creativos y monitores de seguridad. El objetivo era averiguar qué tan bien se desempeña la IA cuando se le instruye para actuar como un experto.

      Los resultados fueron mixtos. Adoptar una persona hizo que la IA sonara más profesional y siguiera mejor las reglas. Pero también hizo que la IA fuera peor recordando hechos. Según el estudio, usar una persona de IA la cambia a un modo de seguimiento de instrucciones en lugar de un modo de recuperación de conocimiento, y ese intercambio te cuesta precisión.

      ¿Cuál es la solución?

      Para solucionar este problema, los investigadores desarrollaron PRISM, que significa Enrutamiento de Persona a través de Modelado Autónomo Basado en Intención. En lugar de usar siempre una persona o nunca usar una, PRISM enseña a la IA a decidir qué es lo mejor para sí misma.

      Cuando haces una pregunta, PRISM genera dos respuestas: una de su modo predeterminado y otra de su persona. Luego compara las dos y entrega la respuesta que mejor se desempeña para una consulta específica.

      La respuesta experta no se descarta incluso cuando la respuesta predeterminada gana. En cambio, el estilo de razonamiento se guarda en un componente ligero llamado adaptador LoRA, del cual la IA puede extraer más tarde cuando sea necesario. La solución suena simple, y aun así, es efectiva.

      ¿Cómo se desempeñó PRISM?

      PRISM aumentó la puntuación general de la IA en uno a dos puntos en el MT-Bench, una prueba que mide qué tan bien una IA sigue instrucciones y se mantiene útil. Para tareas de escritura y seguridad, las personas ayudaron. Para preguntas de conocimiento puro, omitir la persona demostró ser la mejor opción.

      Los investigadores planean probar PRISM con más personas y refinar su capacidad para proporcionar mejores respuestas. Es temprano, pero esto podría cambiar la forma en que le pedimos a la IA que actúe para bien.

      Rachit es un periodista tecnológico experimentado con más de siete años de experiencia cubriendo el panorama de la tecnología de consumo.

      El avance de la IA de próxima generación promete chatbots que pueden leer mejor el ambiente

      Los investigadores están enseñando a los chatbots de IA a leer entre líneas

      ¿Alguna vez le has preguntado algo a un chatbot y sentiste que no entendió tu punto? Dices algo con un poco de matiz, y la IA pierde por completo la sutileza. Ese es exactamente el problema que los investigadores están tratando de resolver. A pesar de que la conexión emocional con la IA puede sentirse más profunda que la conversación humana para muchos usuarios, la mayoría de los sistemas de IA hoy en día aún tratan una oración como un solo bloque de sentimiento. Si mezclas elogios y críticas, a menudo se pierde el matiz.

      Leer más

      ChatGPT no tendrá un modo erótico, después de todo

      OpenAI se retracta mientras el "modo adulto" enfrenta preocupaciones mayores

      Si esperabas que ChatGPT tuviera un "modo erótico", esa idea está oficialmente fuera de la mesa. Según Financial Times, el modo picante de OpenAI está en espera "indefinidamente". Dentro de la lucha de OpenAI por dar vida al modo adulto

      Leer más

      Samsung lleva su navegador a PC con muchos trucos interesantes

      Un navegador para gobernar tu teléfono, tu PC y el número infinito de pestañas que tienes abiertas ahora mismo.

      Samsung ha lanzado oficialmente Samsung Browser para Windows, y es más que solo una versión de escritorio del navegador de tu teléfono. Viene con continuidad entre dispositivos y un asistente de IA que parece genuinamente útil. Navegación continua para ayudar a mantener tus pestañas bajo control

      Leer más

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Otros artículos

Google expande Search Live globalmente con inteligencia artificial de voz y cámara Google expande Search Live globalmente con inteligencia artificial de voz y cámara Google ha expandido Search Live a nivel mundial, llevando la búsqueda por voz y cámara impulsada por IA a más de 200 países y múltiples idiomas. Botslab Smart Dashcams: Mejora tu seguridad vial esta primavera con más conciencia y menos conjeturas Botslab Smart Dashcams: Mejora tu seguridad vial esta primavera con más conciencia y menos conjeturas Con la creciente imprevisibilidad en la carretera, la conducción moderna exige una mayor conciencia por parte de los conductores. Durante las Ventas de Primavera de marzo, Botslab está haciendo que las cámaras de tablero manos libres impulsadas por IA sean más accesibles para los conductores que buscan actualizaciones de tecnología vehicular. Esto es para ayudar a proteger a los conductores y pasajeros con alertas inteligentes y evidencia para reducir disputas en la carretera. Por qué el plan de 5G de $25 de Metro by T-Mobile es difícil de pasar por alto Por qué el plan de 5G de $25 de Metro by T-Mobile es difícil de pasar por alto ¿Buscas reducir tu factura del teléfono? No digas más. El plan de línea única BYOD de $25 de Metro by T-Mobile no trae compromisos. Asegúrate el trato garantizado por 5 años mientras disfrutas de datos ilimitados a velocidad 5G sin estirar tu presupuesto mensual. WhatsApp finalmente permite a los usuarios de iPhone tener dos cuentas en el mismo dispositivo WhatsApp finalmente permite a los usuarios de iPhone tener dos cuentas en el mismo dispositivo Dos cuentas en un iPhone, controles de almacenamiento más inteligentes, transferencias de chat sin problemas entre plataformas y edición de fotos impulsada por IA: la actualización de WhatsApp de marzo de 2026 es la renovación práctica que los usuarios avanzados han estado esperando. Tu visor de realidad virtual pronto podrá permitirte oler el mundo virtual. Tu visor de realidad virtual pronto podrá permitirte oler el mundo virtual. Los investigadores han desarrollado un dispositivo portátil que mezcla hasta ocho aromas en tiempo real para coincidir con lo que ves en la realidad virtual, haciendo que los entornos virtuales se sientan más inmersivos que nunca. Xero y Anthropic se asocian para llevar las finanzas de las pequeñas empresas a Claude. Xero y Anthropic se asocian para llevar las finanzas de las pequeñas empresas a Claude. El acuerdo multianual de Xero con Anthropic integra a Claude en su plataforma contable y lleva datos financieros en vivo a Claude.ai para 4.6 millones de suscriptores.

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Decirle a una IA que "actúe como un experto" suena como una gran idea, pero un nuevo estudio sugiere que en realidad puede perjudicar su precisión.