Los desarrolladores ya no trabajarán sin IA. La investigación dice que podría estar empeorándolos.
TL;DRLos desarrolladores se niegan a programar sin IA, pero la investigación muestra que puede ralentizarlos. Amazon eliminó su tabla de clasificación de tokens. Uber agotó su presupuesto de IA en cuatro meses.
En febrero de 2026, el laboratorio de investigación de IA METR intentó repetir un estudio innovador que medía cuánto tiempo tardan los desarrolladores en completar tareas con y sin IA. No pudo. Los desarrolladores se negaron a participar porque no trabajarían sin IA, incluso para un número limitado de tareas en un entorno de investigación.
El estudio original de 2025 había producido un resultado sorprendente. Los desarrolladores informaron que la IA los hacía más productivos. Los datos mostraron lo contrario: la IA en realidad los ralentizaba porque pasaban tiempo extra encontrando y corrigiendo errores, dirigiendo la IA y esperando a que completara las tareas.
Incapaz de replicar el experimento, METR publicó una encuesta en mayo en su lugar. Los desarrolladores informaron que la IA los hacía el doble de valiosos para sus organizaciones. La evidencia reciente de múltiples fuentes sugiere que esa percepción es incorrecta.
Amazon cerró esta semana una tabla de clasificación interna de seguimiento de tokens llamada Kirorank, informó el Financial Times. Los empleados estaban manipulándola utilizando agentes de IA en exceso y acumulando costos. La tabla de clasificación demostró que el uso de IA no se traduce automáticamente en una mayor productividad.
Uber agotó todo su presupuesto de IA para 2026 en los primeros cuatro meses del año, informó The Information. El COO Andrew Macdonald dijo en un pódcast que el gasto no había llevado a un aumento medible en proyectos o productividad. Dos de las empresas más técnicamente sofisticadas del mundo gastaron mucho en herramientas de codificación de IA y no pudieron demostrar un retorno.
El término para este patrón es “tokenmaxxing”: usar el consumo de tokens como un proxy para la productividad. Ha sido la tendencia corporativa de 2026. Puede que ya haya terminado. Los ejemplos de Amazon y Uber muestran que medir la adopción de IA por volumen de uso, en lugar de la calidad de la producción, produce incentivos incorrectos.
Salesforce proyecta $300 millones en gastos de tokens de Anthropic este año. El CEO Marc Benioff pidió una “capa intermedia” que pudiera enrutar tokens de manera inteligente entre modelos de frontera y más baratos. La llamada a una capa de enrutamiento es una admisión implícita de que no todos los tokens producen valor, y que el gasto debe coincidir con la complejidad de la tarea.
El problema de la calidad del código es el tema más profundo. El programador y autor James Shore argumentó en una publicación de blog viral que la generación de código más rápida sin reducción de costos de mantenimiento es una trampa. “¿Escribes código el doble de rápido ahora? Mejor espera haber reducido a la mitad tus costos de mantenimiento”, escribió. “De lo contrario, estás en problemas. Estás intercambiando un aumento temporal de velocidad por una servidumbre permanente.”
Los datos respaldan la advertencia. Entelligence AI, una startup de ingeniería de confiabilidad, afirma que las empresas gastan el 44% de sus tokens en correcciones de errores que su IA generó. CodeRabbit, una herramienta de revisión de código, analizó solicitudes de extracción de código abierto y encontró que la IA producía 1.7 veces más problemas que el código humano. Ambas empresas venden herramientas de revisión de código de IA, lo que hace que las estadísticas sean interesadas pero no necesariamente incorrectas.
Investigadores independientes de la Universidad de Gestión de Singapur publicaron un informe en abril que llegó a la misma conclusión. “El código generado por IA puede introducir costos de mantenimiento a largo plazo en proyectos de software reales”, escribieron. El código se envía más rápido. Los errores llegan más tarde. La deuda de mantenimiento se acumula.
La pregunta que los líderes de ingeniería están evitando es si las ganancias de productividad de las herramientas de codificación de IA son reales o percibidas. Si los desarrolladores se niegan a trabajar sin IA pero la IA está generando más errores de los que previene, el efecto neto podría ser negativo. La dependencia ha superado la evidencia.
Scott Wu, fundador de Cognition y creador del agente de codificación de IA Devin, admite que el nivel de habilidad de la herramienta se sitúa entre un programador junior y uno de nivel medio, dependiendo de la tarea. No es una solución de "dejar y olvidar". Los investigadores de SMU recomiendan tratar la salida de IA de la manera en que tratarías el código de un desarrollador junior: revisar todo, mantener sistemas de control de calidad sólidos y mantener a los humanos responsables del diseño de arquitectura y seguridad.
El mercado laboral refleja la contradicción. Las empresas están contratando “codificadores de vibra” e ingenieros desplegados hacia adelante a tasas sin precedentes mientras descubren simultáneamente que las herramientas de las que dependen esos roles pueden no producir las ganancias de calidad que su contratación supone. El mercado de codificación de IA está creciendo más rápido que la evidencia de que funciona.
Los desarrolladores no volverán a programar sin IA. Ese barco ya zarpó. La pregunta es si la industria construirá la infraestructura de aseguramiento de calidad, las capas de enrutamiento y los procesos de revisión necesarios para garantizar que la producción de código más rápida no se convierta en una producción más rápida de deuda técnica. En este momento, la respuesta es no. A los desarrolladores les encantan las herramientas. Las herramientas pueden no amarlos de vuelta.
Otros artículos
Los desarrolladores ya no trabajarán sin IA. La investigación dice que podría estar empeorándolos.
METR no pudo repetir su estudio de codificación de IA porque los desarrolladores se negaron a trabajar sin IA. Amazon cerró su tabla de clasificación de tokens. Uber agotó su presupuesto de IA en cuatro meses.
