Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

      Pedirle a la IA que finja ser un experto puede salir mal, pero los investigadores pueden haber encontrado una solución.

      Probablemente has visto el consejo circulando: dile a la IA que actúe como un experto en un campo, y obtendrás mejores respuestas. Es un consejo popular, y a veces funciona. Sin embargo, un nuevo estudio sugiere que usar personas de IA puede no ser tan efectivo como pensábamos.

      Investigadores de la Universidad de California probaron 12 personas diferentes en seis modelos de lenguaje. Las personas iban desde expertos en matemáticas y programación hasta escritores creativos y monitores de seguridad. El objetivo era averiguar qué tan bien se desempeña la IA cuando se le instruye para actuar como un experto.

      Los resultados fueron mixtos. Adoptar una persona hizo que la IA sonara más profesional y siguiera mejor las reglas. Pero también hizo que la IA fuera peor recordando hechos. Según el estudio, usar una persona de IA la cambia a un modo de seguimiento de instrucciones en lugar de un modo de recuperación de conocimiento, y ese intercambio te cuesta precisión.

      ¿Cuál es la solución?

      Para solucionar este problema, los investigadores desarrollaron PRISM, que significa Enrutamiento de Persona a través de Modelado Autónomo Basado en Intención. En lugar de usar siempre una persona o nunca usar una, PRISM enseña a la IA a decidir qué es lo mejor para sí misma.

      Cuando haces una pregunta, PRISM genera dos respuestas: una de su modo predeterminado y otra de su persona. Luego compara las dos y entrega la respuesta que mejor se desempeña para una consulta específica.

      La respuesta experta no se descarta incluso cuando la respuesta predeterminada gana. En cambio, el estilo de razonamiento se guarda en un componente ligero llamado adaptador LoRA, del cual la IA puede extraer más tarde cuando sea necesario. La solución suena simple, y aun así, es efectiva.

      ¿Cómo se desempeñó PRISM?

      PRISM aumentó la puntuación general de la IA en uno a dos puntos en el MT-Bench, una prueba que mide qué tan bien una IA sigue instrucciones y se mantiene útil. Para tareas de escritura y seguridad, las personas ayudaron. Para preguntas de conocimiento puro, omitir la persona demostró ser la mejor opción.

      Los investigadores planean probar PRISM con más personas y refinar su capacidad para proporcionar mejores respuestas. Es temprano, pero esto podría cambiar la forma en que le pedimos a la IA que actúe para bien.

      Rachit es un periodista tecnológico experimentado con más de siete años de experiencia cubriendo el panorama de la tecnología de consumo.

      El avance de la IA de próxima generación promete chatbots que pueden leer mejor el ambiente

      Los investigadores están enseñando a los chatbots de IA a leer entre líneas

      ¿Alguna vez le has preguntado algo a un chatbot y sentiste que no entendió tu punto? Dices algo con un poco de matiz, y la IA pierde por completo la sutileza. Ese es exactamente el problema que los investigadores están tratando de resolver. A pesar de que la conexión emocional con la IA puede sentirse más profunda que la conversación humana para muchos usuarios, la mayoría de los sistemas de IA hoy en día aún tratan una oración como un solo bloque de sentimiento. Si mezclas elogios y críticas, a menudo se pierde el matiz.

      Leer más

      ChatGPT no tendrá un modo erótico, después de todo

      OpenAI se retracta mientras el "modo adulto" enfrenta preocupaciones mayores

      Si esperabas que ChatGPT tuviera un "modo erótico", esa idea está oficialmente fuera de la mesa. Según Financial Times, el modo picante de OpenAI está en espera "indefinidamente". Dentro de la lucha de OpenAI por dar vida al modo adulto

      Leer más

      Samsung lleva su navegador a PC con muchos trucos interesantes

      Un navegador para gobernar tu teléfono, tu PC y el número infinito de pestañas que tienes abiertas ahora mismo.

      Samsung ha lanzado oficialmente Samsung Browser para Windows, y es más que solo una versión de escritorio del navegador de tu teléfono. Viene con continuidad entre dispositivos y un asistente de IA que parece genuinamente útil. Navegación continua para ayudar a mantener tus pestañas bajo control

      Leer más

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable. Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Otros artículos

Tu auricular de realidad virtual pronto te permitirá oler el mundo virtual. Tu auricular de realidad virtual pronto te permitirá oler el mundo virtual. Los investigadores han desarrollado un dispositivo portátil que mezcla hasta ocho aromas en tiempo real para coincidir con lo que ves en la realidad virtual, haciendo que los entornos virtuales se sientan más inmersivos que nunca. Botslab Smart Dashcams: Mejora tu seguridad vial esta primavera con más conciencia y menos conjeturas Botslab Smart Dashcams: Mejora tu seguridad vial esta primavera con más conciencia y menos conjeturas Con la creciente imprevisibilidad en la carretera, la conducción moderna exige una mayor conciencia por parte de los conductores. Durante las Ventas de Primavera de marzo, Botslab está haciendo que las cámaras de tablero manos libres impulsadas por IA sean más accesibles para los conductores que buscan actualizaciones de tecnología vehicular. Esto es para ayudar a proteger a los conductores y pasajeros con alertas inteligentes y evidencia para reducir disputas en la carretera. WYBOT S3: El primer limpiador de piscinas autovaciable del mundo transforma el cuidado de la piscina de estresante a lujoso WYBOT S3: El primer limpiador de piscinas autovaciable del mundo transforma el cuidado de la piscina de estresante a lujoso La limpieza de la piscina no tiene que ser una tarea estresante. Con el WYBOT S3, el primer limpiador de piscinas robótico autovaciable del mundo, obtienes un cuidado de piscina verdaderamente sin manos. Combinando la comodidad inalámbrica con una limpieza inteligente y guiada por IA, te permite disfrutar de tu espacio al aire libre sin levantar un dedo. La empresa «Ural» ha lanzado nuevos dispositivos principales «Storm». La empresa «Ural» ha lanzado nuevos dispositivos principales «Storm». El fabricante ruso de audioelectrónica "Ural" presentó dos nuevas versiones de las unidades principales de la línea "Storm". Blossom Health recauda 20 millones de dólares para poner copilotos de IA junto a psiquiatras Blossom Health recauda 20 millones de dólares para poner copilotos de IA junto a psiquiatras Blossom Health, una startup de telepsiquiatría con sede en Nueva York fundada en 2024, ha recaudado 20 millones de dólares en financiamiento combinado de semillas y Serie A para escalar una plataforma impulsada por IA que empareja psiquiatras con copilotos clínicos y administración automatizada. Tu Apple TV ahora puede recomendar programas y películas basados en tus hábitos de visualización. Tu Apple TV ahora puede recomendar programas y películas basados en tus hábitos de visualización. La tvOS 26.4 de Apple llega con cuatro cambios significativos en tu experiencia con Apple TV, incluyendo un navegador de contenido personalizado, una solución de audio Dolby que los audiófilos apreciarán y una despedida de iTunes.

Resulta que, si le pides a una IA que actúe como un experto, se vuelve menos confiable.

Decirle a una IA que "actúe como un experto" suena como una gran idea, pero un nuevo estudio sugiere que en realidad puede perjudicar su precisión.