Minimización de tokens: las empresas limitan el uso de IA por parte del personal a medida que las facturas aumentan.
Hace un año, la jugada inteligente dentro de una gran empresa era utilizar tanto IA como fuera humanamente posible. Algunas empresas incluso clasificaban a los empleados en tablas de clasificación según cuántos tokens quemaban, un juego de estatus que ganó su propio nombre: tokenmaxxing.
Esa era está llegando a su fin. Las mismas empresas ahora están limitando el uso de IA, y la nueva palabra de moda es su imagen reflejada: tokenminimizing.
Lo último es AT&T, que ha comenzado a limitar el acceso de algunos empleados a GitHub Copilot, según The Information. Se informa que Meta está restringiendo el gasto del personal en Anthropic y otras herramientas de IA, un giro drástico respecto a los meses en que los trabajadores competían entre sí para consumir más.
La factura llegó
El desencadenante es simple: el gasto se volvió aterrador. Las empresas más obsesionadas con la IA ahora gastan $7,500 por empleado al mes, y las herramientas agentivas que llaman a un modelo una y otra vez han triplicado las facturas de IA empresarial incluso cuando los precios por token colapsaron.
Uber agotó todo su presupuesto de codificación de IA para 2026 en abril y ahora limita a los empleados a $1,500 al mes por herramienta. Walmart ha limitado el uso de su agente de IA interno. Amazon eliminó la tabla de clasificación interna que clasificaba al personal según el uso de IA después de que las personas la manipularan, aumentando los costos de computación.
Incluso los ingenieros individuales eran un problema: Microsoft encontró a algunos gastando entre $500 y $2,000 al mes solo en tokens de Claude Code.
Llega el ‘te lo dije’
Algunas empresas están disfrutando del momento. “Nunca celebramos el tokenmaxxing”, dijo el director ejecutivo de Box, Aaron Levie. “Nunca tuvimos tablas de clasificación, así que no nos adelantamos a nuestros esquís en… incentivar lo incorrecto.”
No todos están retrocediendo. En Databricks, un líder de ingeniería dijo que el presupuesto de IA para ingenieros sigue siendo ilimitado, “así que el tokenmaxxing aún existe”, una señal de que las empresas que confían en que su personal utiliza la IA de manera eficiente ven menos razón para racionarla.
Esa es la tensión bajo la tendencia. Los límites controlan los costos, pero también pueden frenar las ganancias de productividad que justificaron el gasto en primer lugar.
Los verdaderos ganadores son las herramientas de recorte de costos
El cambio más duradero es hacia lo que el tokenminimizing empuja a las empresas. Para reducir las facturas sin reducir el uso, las empresas están intercambiando modelos de frontera costosos por otros más baratos o de código abierto en tareas más simples.
Eso abre una oportunidad para la infraestructura. Microsoft y Databricks han lanzado herramientas de ‘puerta de enlace’ para monitorear y limitar el gasto de IA del personal, y Factory, respaldada por Nvidia y valorada en $1.5 mil millones, acaba de lanzar un enrutador de modelos que redirige tareas más baratas a modelos más económicos.
Satya Nadella capturó el estado de ánimo en un ensayo de fin de semana, argumentando que los modelos de IA deberían ser intercambiables en lugar de dominantes. “Lo último que cualquiera de nosotros quiere es un mundo donde cada empresa en cada sector ceda valor a unos pocos modelos que se comen todo lo que ven”, escribió. Proveniente del jefe de una empresa cuyo software está bajo presión de los mismos laboratorios de los que depende, también es un indicio de hacia dónde se dirige esto.
Otros artículos
Minimización de tokens: las empresas limitan el uso de IA por parte del personal a medida que las facturas aumentan.
Después de un año de 'tokenmaxxing', Meta, Uber y AT&T están limitando el uso de IA por parte de los empleados y Amazon eliminó su tabla de clasificación de uso. Bienvenido a la minimización de tokens.
