ArXiv introduce una prohibición de un año para los investigadores que envían artículos con contenido generado por IA sin verificar.

ArXiv introduce una prohibición de un año para los investigadores que envían artículos con contenido generado por IA sin verificar.

      TL;DRArXiv prohibirá a los investigadores durante un año si presentan artículos con signos evidentes de generación de IA sin control, como referencias alucinadas o instrucciones de chatbot sobrantes. La política, anunciada por el presidente de la sección de informática, Thomas Dietterich, es la primera penalización formal de una importante plataforma de preprints por contenido generado por IA de mala calidad.

      ArXiv, el repositorio de acceso abierto que ha servido como el principal canal de distribución para la investigación en preprints en informática, matemáticas y física durante más de tres décadas, prohibirá a los autores durante un año si presentan artículos que contengan signos evidentes de generación de IA sin control. Thomas Dietterich, presidente de la sección de informática de arXiv, anunció la política el jueves, escribiendo que las presentaciones con "evidencia incontrovertible" de salida de modelos de lenguaje no revisados significan "no podemos confiar en nada en el artículo".

      La regla no es una prohibición general sobre el uso de herramientas de IA. Los investigadores aún pueden usar modelos de lenguaje para redactar, editar o analizar. Lo que desencadena la penalización es la evidencia de que un autor pegó la salida de un LLM en un artículo sin revisarlo, el tipo de negligencia que produce referencias alucinadas, instrucciones de marcador de posición del chatbot o tablas de datos fabricadas con notas que dicen "rellene con los números reales de sus experimentos". Si los moderadores encuentran tal evidencia y un presidente de sección la confirma, el autor enfrenta una prohibición de un año de arXiv, después de lo cual todas las presentaciones posteriores deben ser aceptadas primero por una revista revisada por pares antes de que puedan aparecer en la plataforma.

      Por qué es importante

      ArXiv no es una revista. No revisa los artículos. Pero se ha convertido en la forma de facto en que la investigación circula en varios de los campos de ciencia de más rápido movimiento, particularmente el aprendizaje automático y la inteligencia artificial. Los artículos publicados en arXiv son leídos, citados y sobre los que se construye mucho antes de que aparezcan en publicaciones formales, si es que alguna vez lo hacen. Eso hace que los estándares de calidad de la plataforma sean inusualmente significativos: una cita alucinada en arXiv puede propagarse a través de la literatura de investigación tan eficazmente como una en una revista revisada por pares, y a menudo más rápido.

      La magnitud del problema es significativa. Un estudio publicado en The Lancet en mayo de 2026 por investigadores de la Universidad de Columbia auditó 2.5 millones de artículos biomédicos y 126 millones de referencias indexadas en PubMed Central. Encontró que las citas fabricadas han aumentado doce veces desde 2023. En ese año, aproximadamente uno de cada 2,828 artículos contenía al menos una referencia falsa. Para 2025, la tasa había subido a uno de cada 458. En las primeras siete semanas de 2026, fue uno de cada 277. Los investigadores atribuyeron el aumento a la proliferación de herramientas de escritura de IA, señalando que estudios anteriores estiman que entre el 30 y el 69 por ciento de las referencias generadas por LLM en contextos biomédicos son fabricadas.

      ArXiv tiene razones para tomar la amenaza en serio. La plataforma recibe miles de presentaciones cada mes, y su sistema de moderación voluntaria no fue diseñado para filtrar contenido generado por máquinas a gran escala. El anuncio de Dietterich describió la nueva penalización como una regla de "un solo golpe", aunque las decisiones están sujetas a apelación y requieren la confirmación de un presidente de sección antes de ser impuestas.

      Qué cuenta como evidencia

      La política es deliberadamente estrecha en lo que apunta. Dietterich enumeró ejemplos específicos de "evidencia incontrovertible": referencias alucinadas que no corresponden a ninguna publicación real, comentarios meta del modelo de lenguaje dejados en el texto (como "aquí hay un resumen de 200 palabras; ¿te gustaría que hiciera algún cambio?"), y datos de marcador de posición con instrucciones al autor que nunca fueron eliminadas. Estas no son fallas de calidad sutiles. Son signos de que el autor no leyó el artículo antes de enviarlo.

      La distinción es importante porque evita la pregunta mucho más difícil de si se debería permitir la escritura asistida por IA en absoluto. La política existente de arXiv ya establece que los autores tienen "plena responsabilidad" por su contenido "independientemente de cómo se generen los contenidos". La nueva penalización refuerza ese principio al apuntar a las violaciones más flagrantes, casos en los que la falta de supervisión del autor es comprobable a partir del propio texto.

      Ese enfoque tiene ventajas prácticas. Detectar si un artículo bien editado fue redactado con la ayuda de un LLM es poco confiable con las herramientas de detección actuales, y tratar de hacer cumplir una prohibición más amplia sería tanto técnicamente difícil como potencialmente punitivo para los investigadores que utilizan herramientas de IA de manera responsable. Al centrarse en la mala calidad evidente, arXiv puede hacer cumplir la regla sin necesidad de construir o comprar un sistema de detección de IA, una tecnología que sigue siendo propensa a sus propios errores.

      Un problema más amplio

      ArXiv no es la única institución que lucha con el problema. Las conferencias académicas en informática, incluidas NeurIPS e ICML, han informado aumentos en las presentaciones que parecen ser generadas con una supervisión humana mínima. Nature publicó un artículo a finales de 2025 describiendo cómo la mala calidad de la IA está creando una crisis en la informática, donde el volumen de presentaciones de baja calidad está abrumando a los revisores y diluyendo la relación señal-ruido de la producción del campo.

      Las revistas revisadas por pares enfrentan el mismo problema. El estudio de The Lancet encontró que las citas fabricadas aparecieron en artículos que ya habían pasado la revisión por pares, lo que sugiere que los revisores o no están verificando las referencias o no pueden identificar las fabricaciones a la tasa a la que ahora están apareciendo. El autor principal, Maxim Topaz, de la Escuela de Enfermería de la Universidad de Columbia, advirtió que los clínicos y los desarrolladores de guías no tienen forma de saber cuándo la evidencia en la que confían no existe, una brecha que los esfuerzos para reducir las alucinaciones de IA en la investigación científica aún no han cerrado.

      ArXiv mismo está experimentando cambios estructurales que pueden ayudarlo a abordar el desafío. Después de más de 20 años como un proyecto alojado por la Universidad de Cornell, la plataforma se está convirtiendo en una organización sin fines de lucro independiente, un movimiento que debería darle mayor autonomía sobre sus políticas de moderación y la capacidad de recaudar fondos específicamente para combatir problemas de calidad. También ha introducido un requisito para que los presentadores por primera vez obtengan un respaldo de un autor establecido, una medida de control destinada a reducir el volumen de presentaciones de cuentas creadas únicamente para publicar material generado por IA.

      Los límites de la aplicación

      La nueva regla atrapará a los infractores más descuidados, investigadores que presentan artículos que no han leído. No atrapará a los investigadores que utilizan modelos de lenguaje para generar afirmaciones plausibles pero incorrectas, fabricar datos o producir artículos que son fluidos pero científicamente vacíos. Esos problemas requieren revisión por pares, supervisión institucional y una disposición dentro de la comunidad de investigación para tratar la mala conducta asistida por IA con la misma seriedad que las formas tradicionales de fabricación.

      Lo que establece la política de arXiv es un principio: si presentas un artículo, eres responsable de cada palabra en él. Eso siempre ha sido cierto en teoría. La diferencia ahora es que los modelos de lenguaje han hecho que sea trivialmente fácil producir texto que parece ciencia pero no contiene nada de sustancia. La prohibición de un año de arXiv es una penalización modesta por un delito grave, pero también es el primer reconocimiento formal por parte de una importante plataforma de investigación de que el problema ya no es uno de negligencia ocasional. Es estructural, está creciendo y requiere infraestructura dedicada para combatirlo.

Otros artículos

Asus metió una RTX 5080 en una caja de 3 litros. Cuesta $4,400 y la ganancia de rendimiento es del 2.3%. Asus metió una RTX 5080 en una caja de 3 litros. Cuesta $4,400 y la ganancia de rendimiento es del 2.3%. El ROG NUC 16 combina el Core Ultra 9 290HX de Intel con una GPU para portátiles RTX 5080 en un chasis más pequeño que un PS5. Se espera que el precio global esté cerca de $4,000. Por qué la infraestructura laboral es el motor silencioso del rendimiento empresarial Por qué la infraestructura laboral es el motor silencioso del rendimiento empresarial La infraestructura laboral, desde configuraciones de oficinas híbridas hasta herramientas de colaboración y bienestar de los empleados, determina silenciosamente si una empresa crece o se estanca. Aquí está en qué invertir. Trump sostiene un acuerdo de armas de $14 mil millones con Taiwán Trump sostiene un acuerdo de armas de $14 mil millones con Taiwán La visita estatal de tres días no produjo acuerdos vinculantes, pero cambió el tono sobre Taiwán. Trump describió las ventas de armas como una palanca, mientras que Xi advirtió que manejar mal el tema arriesga "enfrentamientos e incluso conflictos." Los vehículos eléctricos chinos están llegando a Canadá. Casi 400 concesionarios ya están compitiendo para venderlos. Los vehículos eléctricos chinos están llegando a Canadá. Casi 400 concesionarios ya están compitiendo para venderlos. Canadá redujo los aranceles sobre los vehículos eléctricos chinos al 6.1% con un límite de 49,000 unidades. Los concesionarios están haciendo fila, Trump lo llama un desastre, y los primeros autos han llegado. Cerebras acaba de tener la mayor IPO tecnológica en EE. UU. desde Snowflake. SpaceX, OpenAI y Anthropic son los siguientes. Cerebras acaba de tener la mayor IPO tecnológica en EE. UU. desde Snowflake. SpaceX, OpenAI y Anthropic son los siguientes. Cerebras recaudó $5.55 mil millones y cerró en $95 mil millones. Pero $3 billones en IPOs combinados de SpaceX, OpenAI y Anthropic hacen que todo lo demás parezca pequeño. Los vehículos eléctricos chinos están llegando a Canadá. Casi 400 concesionarios ya están compitiendo para venderlos. Los vehículos eléctricos chinos están llegando a Canadá. Casi 400 concesionarios ya están compitiendo para venderlos. Canadá redujo los aranceles sobre los vehículos eléctricos chinos al 6.1% con un límite de 49,000 unidades. Los concesionarios se están alineando, Trump lo llama un desastre, y los primeros coches han llegado.

ArXiv introduce una prohibición de un año para los investigadores que envían artículos con contenido generado por IA sin verificar.

La plataforma de preprints penalizará a los autores cuyos artículos contengan referencias alucinadas o instrucciones sobrantes de LLM. Un estudio de Lancet encontró que las citas fabricadas en artículos biomédicos aumentaron doce veces desde 2023.