Los precios de los tokens de IA cayeron un 98%, pero las facturas empresariales se triplicaron.
TL;DRLas facturas de IA empresarial se están triplicando a pesar de una caída del 98% en los precios por token, ya que las herramientas agénticas impulsan el consumo 18.6 veces más por desarrollador. La Fundación Linux está lanzando la Fundación Tokenomics para llevar disciplina de costos al gasto en IA. Uber agotó todo su presupuesto de codificación de IA para 2026 en abril. Microsoft revocó las licencias de Claude Code de sus desarrolladores seis meses después de habilitarlas. Se informa que una empresa acumuló una factura de Claude de $500 millones en un solo mes después de olvidar establecer límites de uso. Un empleado de Priceline le dijo a TechCrunch que una renovación de contrato de Cursor rutinaria volvió cuatro a cinco veces más cara. El patrón es el mismo en todas partes. Los precios por token se han desplomado, pero el impulso por agentes de IA autónomos ha disparado el consumo. Las empresas que se atiborraron de suscripciones de todo lo que puedas comer a principios de 2025 ahora están luchando por entender a dónde se fue el dinero y si alguna parte de él produjo un retorno. El paradoja en números El rendimiento equivalente a GPT-4 ahora cuesta aproximadamente $0.40 por millón de tokens, bajando de $20 por millón a finales de 2022. Eso es una reducción del 98%. Sin embargo, las facturas de IA empresarial han aumentado en un 320% estimado, según múltiples análisis de la industria. El presupuesto promedio de IA empresarial ha crecido de $1.2 millones por año en 2024 a $7 millones en 2026. El culpable es el volumen. Las herramientas de IA agénticas lanzadas desde noviembre de 2025, incluyendo Claude Opus 4.5 de Anthropic, GPT-5.1 de OpenAI y Gemini 3 Pro de Google, han multiplicado el consumo de tokens por tarea. Un flujo de trabajo lineal simple en 2023 costaba alrededor de $0.04 por interacción. Un sistema agéntico orquestado en 2026 cuesta aproximadamente $1.20, unas 30 veces más. Se informa que ingenieros individuales en Microsoft estaban gastando entre $500 y $2,000 al mes en tokens antes de que se retiraran las licencias. Nicholas Arcolano, jefe de investigación en la plataforma de gestión de ingeniería Jellyfish, le dijo a TechCrunch que el consumo por desarrollador ha aumentado aproximadamente 18.6 veces en nueve meses. Los ingenieros que usaron más tokens fueron aproximadamente el doble de productivos que los usuarios más ligeros, pero gastaron 10 veces más tokens para llegar allí. “Si el gasto extremo vale la pena, depende del valor comercial final del código entregado, que la mayoría de las empresas aún no pueden medir”, dijo Arcolano. De tokenmaxxing a barandillas “Hace seis meses, tendría una conversación con un cliente y todo sería sobre ‘¿Qué puede hacer? ¿Es lo suficientemente bueno?’” Alexander Embiricos, jefe de empresa de OpenAI, le dijo a TechCrunch. “Ahora las conversaciones son sobre, ‘Estamos gastando tanto. ¿Qué visibilidad tienes? ¿Qué controles de tokens tienes?’” J.R. Storment, director ejecutivo de la Fundación FinOps, describió el cambio de manera contundente. “En abril y mayo, comencé a escuchar de las empresas: ‘Oh Dios mío, estamos 3x sobre nuestro presupuesto total de tokens para 2026 y solo es abril.’ Toda la conversación cambió de tokenmaxxing y ‘ir rápido’ a ‘necesitamos barandillas, ¿cómo controlamos esto?’” El director senior de finanzas de TI de Priceline, Chris Reed, hizo una comparación con la era de facturación de telecomunicaciones. “Es como la epidemia de crack-cocaína. Te dejan probarlo para engancharte, y ahora estás un poco atado a ello.” La empresa ha comenzado a establecer límites de tokens en ciertos grupos. Reed dijo que ya está viendo discrepancias entre el uso informado por los proveedores y los datos internos de Priceline. La Fundación Tokenomics En este contexto, la Fundación Linux presentó esta semana planes para la Fundación Tokenomics, un nuevo organismo de estándares que busca llevar la misma disciplina de costos a los tokens de IA que FinOps llevó al gasto en la nube. La Fundación planea construir una definición canónica de “tokenomics”, estándares abiertos para el uso y facturación de tokens de IA, y nuevas métricas que incluyan costo por inteligencia y tokens por vatio. Se planea un lanzamiento formal para julio. Nishant Gupta, director de disponibilidad en Salesforce, dijo en un comunicado que “la economía de tokens es fundamentalmente más abstracta y opaca que cualquier cosa que hayamos manejado a esta escala antes.” El desafío es enorme. “Rastrear los costos de la nube es un problema de datos de cientos de millones de filas al mes”, dijo Storment. “Rastrear los costos de tokens es un problema de datos de billones de filas al mes.” Un mercado se forma en torno al problema Las startups y los proveedores establecidos están compitiendo para llenar el vacío. Pay-i rastrea y optimiza el gasto en IA. Paid permite a los desarrolladores facturar en función del valor real en lugar de las tarifas de suscripción. Jellyfish, Waydev y Faros AI proporcionan monitoreo de agentes para demostrar el ROI de las herramientas para desarrolladores. Ramp ha entrado en la gestión del gasto en IA. Datadog y New Relic han añadido observabilidad a nivel de token. El enrutamiento de modelos está surgiendo como la principal palanca de costo. Factory, una startup de codificación de IA empresarial, lanzó esta semana un enrutador de modelos que elige automáticamente el modelo adecuado más barato para cada tarea. Vitaly Gordon, CEO de Faros AI, dijo que los laboratorios fronterizos ya están haciendo esto internamente. “El informe financiero sobre cuánto gastas en Anthropic, incluso si llamas al modelo Opus, parte del gasto será en Sonnet o Haiku, porque son lo suficientemente inteligentes para hacerlo”, dijo. Goldman Sachs proyecta que el uso global de tokens se multiplicará por 24 para 2030. Las empresas que ya están fuera de presupuesto necesitan soluciones ahora, y el primer entregable de la Fundación Tokenomics aún está a meses de distancia. Como dijo Gordon: “Tal vez creamos una máquina de vapor, pero aún no hemos descubierto la línea de ensamblaje.”
Otros artículos
Los precios de los tokens de IA cayeron un 98%, pero las facturas empresariales se triplicaron.
Uber, Microsoft y Priceline están luchando después de que las facturas de tokens de IA se dispararan. La Fundación Linux está lanzando una Fundación de Tokenomics para aportar disciplina de costos al gasto en IA.
