Los modelos de IA tienen un problema de favoritismo religioso, y una nueva investigación lo expone.
Los modelos de IA están dirigiendo sutilmente a los usuarios hacia ciertas religiones, y la mayoría de las personas no tiene idea de que esto está sucediendo.
Un nuevo consorcio de investigación ha encontrado algo que merece atención: cuando preguntas a la IA sobre el duelo, el amor, la pérdida o decisiones morales, casi nunca menciona la religión en la conversación.
El Consorcio para la Evaluación de la Fe y la Ética en la IA (CEFE-AI), una colaboración entre investigadores de la Universidad Brigham Young, la Universidad Baylor, la Universidad de Notre Dame y la Universidad Yeshiva, publicó sus hallazgos esta semana en la Cumbre sobre Ética de la IA en Atenas, Grecia.
“La religión es una parte importante del florecimiento humano; el 75% de la población mundial mantiene una identidad religiosa. A medida que construimos tecnologías de IA, no hay razón para que no las construyamos para apoyar a las personas en lo que es importante para ellas”, dijo el investigador principal David Wingate, profesor de informática en BYU.
¿Está la IA realmente sesgada contra ciertas religiones?
Los investigadores desarrollaron el AllFaith Benchmark, uno de los primeros conjuntos de pruebas multi-religiosas que examina cómo los sistemas de IA interactúan con una variedad de religiones. Probaron 14 modelos de IA diferentes, incluidos modelos emblemáticos de Anthropic, Google, xAI y OpenAI.
Los resultados son reveladores. Una encuesta a 1,125 estadounidenses encontró que la mayoría de las personas espera perspectivas religiosas al hacer preguntas éticas, pero casi todos los modelos no incluyeron ninguna. Más sorprendentemente, los modelos mostraron un claro sesgo de conversión, empujando sutilmente a los usuarios hacia algunas fes y alejándolos de otras.
¿Qué modelos de IA tuvieron el peor desempeño?
En todos los modelos probados, casi todos mostraron un sesgo negativo hacia los Testigos de Jehová y un sesgo positivo hacia el catolicismo. Grok produjo los sesgos más fuertes en general, favoreciendo fuertemente a católicos y protestantes mientras mostraba un sesgo negativo hacia Testigos de Jehová, Bahaíes e hindúes. Los modelos de Anthropic y Meta mostraron el menor sesgo de todos los modelos probados.
Consorcio para la Evaluación de la Fe y la Ética en la IA
Quizás la estadística más alarmante del estudio es que de más de 12,000 artículos de investigación sobre sesgo en IA, solo el 0.2% aborda el sesgo religioso en absoluto. Para una tecnología que influye tan fuertemente en el discurso público, ese es un punto ciego significativo.
Personalmente, no tengo ningún problema con que la IA no mencione la religión en la conversación. De hecho, lo prefiero. Sin embargo, los modelos de IA que muestran un claro sesgo hacia varias religiones y los empujan hacia el catolicismo es un asunto profundamente preocupante. A esta escala, incluso un empujón sutil hacia una religión sobre otra es un problema serio, y las empresas de IA le deben a sus usuarios solucionarlo.
Otros artículos
Los modelos de IA tienen un problema de favoritismo religioso, y una nueva investigación lo expone.
Los investigadores probaron 14 modelos de IA importantes en cuanto a sesgo religioso y encontraron un patrón consistente: los modelos favorecen sutilmente algunas religiones sobre otras, siendo Grok el que muestra el sesgo más fuerte y Anthropic y Meta los que tienen el mejor rendimiento.
