I prezzi dei token AI sono scesi del 98%, ma le fatture aziendali sono triplicate.

I prezzi dei token AI sono scesi del 98%, ma le fatture aziendali sono triplicate.

      TL;DREnterprise AI le fatture stanno triplicando nonostante un calo del 98% dei prezzi per token, poiché gli strumenti agentici guidano un consumo 18,6 volte superiore per sviluppatore. La Linux Foundation sta lanciando la Tokenomics Foundation per portare disciplina nei costi della spesa per l'AI.

      Uber ha esaurito l'intero budget di coding AI per il 2026 entro aprile. Microsoft ha revocato le licenze Claude Code dei suoi sviluppatori sei mesi dopo averle abilitate. Una società ha accumulato un conto di 500 milioni di dollari per Claude in un solo mese dopo aver dimenticato di impostare limiti di utilizzo. Un dipendente di Priceline ha detto a TechCrunch che un rinnovo di contratto di routine per Cursor è tornato quattro o cinque volte più costoso.

      Il modello è lo stesso ovunque. I prezzi per token sono crollati, ma la spinta per agenti AI autonomi ha fatto schizzare il consumo alle stelle. Le aziende che si sono abbuffate di abbonamenti illimitati all'inizio del 2025 ora si affannano a capire dove sia finito il denaro e se una parte di esso abbia prodotto un ritorno.

      Il paradosso nei numeri

      Le prestazioni equivalenti a GPT-4 ora costano circa 0,40 dollari per milione di token, rispetto ai 20 dollari per milione alla fine del 2022. Si tratta di una riduzione del 98%. Eppure, le fatture per l'AI aziendale sono aumentate di un stimato 320%, secondo molteplici analisi di settore. Il budget medio per l'AI aziendale è cresciuto da 1,2 milioni di dollari all'anno nel 2024 a 7 milioni nel 2026.

      Il colpevole è il volume. Gli strumenti AI agentici rilasciati da novembre 2025, tra cui Claude Opus 4.5 di Anthropic, GPT-5.1 di OpenAI e Gemini 3 Pro di Google, hanno moltiplicato il consumo di token per compito. Un semplice flusso di lavoro lineare nel 2023 costava circa 0,04 dollari per interazione. Un sistema agentico orchestrato nel 2026 costa circa 1,20 dollari, circa 30 volte di più. Gli ingegneri individuali di Microsoft spendevano tra 500 e 2.000 dollari al mese in token prima che le licenze venissero revocate.

      Nicholas Arcolano, responsabile della ricerca presso la piattaforma di gestione ingegneristica Jellyfish, ha detto a TechCrunch che il consumo per sviluppatore è aumentato di circa 18,6 volte in nove mesi. Gli ingegneri che utilizzavano il maggior numero di token erano circa due volte più produttivi degli utenti più leggeri, ma spendevano 10 volte i token per arrivarci. “Se la spesa estrema ripaga dipende dal valore commerciale finale del codice consegnato, che la maggior parte delle aziende non riesce ancora a misurare,” ha detto Arcolano.

      Da tokenmaxxing a guardrail

      “Sei mesi fa, avrei avuto una conversazione con un cliente e sarebbe stata tutta incentrata su ‘Cosa può fare? È abbastanza buono?’” ha detto Alexander Embiricos, responsabile dell'enterprise di OpenAI, a TechCrunch. “Ora le conversazioni riguardano, ‘Stiamo spendendo così tanto. Quale visibilità hai? Quali controlli sui token hai?’”

      J.R. Storment, direttore esecutivo della FinOps Foundation, ha descritto il cambiamento in modo diretto. “Ad aprile e maggio, ho iniziato a sentire da parte delle aziende: ‘Oh mio dio, siamo 3 volte oltre il nostro intero budget di token per il 2026 e siamo solo ad aprile.’ L'intera conversazione è passata da tokenmaxxing e ‘andare veloci’ a ‘abbiamo bisogno di guardrail, come controlliamo questo?’”

      Il direttore senior della finanza IT di Priceline, Chris Reed, ha fatto un confronto con l'era della fatturazione delle telecomunicazioni. “È come l'epidemia di crack-cocaina. Ti lasciano provare per farti affezionare, e ora sei in qualche modo schiavo di questo.” L'azienda ha iniziato a porre limiti sui token per alcuni gruppi. Reed ha detto di vedere già discrepanze tra l'uso riportato dai fornitori e i dati interni di Priceline.

      La Tokenomics Foundation

      È in questo contesto che la Linux Foundation ha svelato questa settimana i piani per la Tokenomics Foundation, un nuovo ente di standardizzazione che mira a portare la stessa disciplina dei costi ai token AI che FinOps ha portato alla spesa per il cloud.

      La Fondazione prevede di costruire una definizione canonica di “tokenomics”, standard aperti per l'uso e la fatturazione dei token AI, e nuove metriche tra cui costo per intelligenza e token per watt. Un lancio formale è previsto per luglio. Nishant Gupta, chief availability officer di Salesforce, ha dichiarato in una nota che “l'economia dei token è fondamentalmente più astratta e opaca di qualsiasi cosa abbiamo gestito a questa scala prima.”

      La sfida è enorme. “Monitorare i costi del cloud è un problema di dati da centinaia di milioni di righe al mese,” ha detto Storment. “Monitorare i costi dei token è un problema di dati da trilioni di righe al mese.”

      Un mercato si forma attorno al problema

      Startup e fornitori affermati stanno correndo per colmare il divario. Pay-i monitora e ottimizza la spesa per l'AI. Paid consente agli sviluppatori di fatturare in base al valore reale piuttosto che alle tariffe di abbonamento. Jellyfish, Waydev e Faros AI forniscono monitoraggio degli agenti per dimostrare il ROI degli strumenti per sviluppatori. Ramp è entrata nella gestione della spesa per l'AI. Datadog e New Relic hanno aggiunto osservabilità a livello di token.

      Il routing dei modelli sta emergendo come il principale leva dei costi. Factory, una startup di coding AI aziendale, ha lanciato questa settimana un router di modelli che sceglie automaticamente il modello adeguato più economico per ogni compito. Vitaly Gordon, CEO di Faros AI, ha detto che i laboratori di frontiera lo stanno già facendo internamente. “Il rapporto finanziario su quanto spendi per Anthropic, anche se chiami il modello Opus, parte della spesa sarà per Sonnet o Haiku, perché sono abbastanza intelligenti da farlo,” ha detto.

      Goldman Sachs prevede che l'uso globale dei token moltiplicherà 24 volte entro il 2030. Le aziende già oltre budget hanno bisogno di soluzioni ora, e il primo risultato della Tokenomics Foundation è ancora a mesi di distanza. Come ha detto Gordon: “Forse abbiamo creato una macchina a vapore, ma non abbiamo ancora capito la catena di montaggio.”

Altri articoli

Spirit AI batte Nvidia nel benchmark di robotica RoboArena Spirit AI batte Nvidia nel benchmark di robotica RoboArena La startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia, mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico. Truffe della Coppa del Mondo FIFA 2026 sono attive: siti falsi e malware Truffe della Coppa del Mondo FIFA 2026 sono attive: siti falsi e malware Oltre 4.300 domini falsi FIFA, malware bancario in app di streaming e credenziali rubate stanno già prendendo di mira i fan della Coppa del Mondo 2026, con l'FBI e i ricercatori che avvertono di potenziali perdite per miliardi. Il Giappone rischia di diventare una 'colonia dell'IA', avverte il suo ministro digitale. Il Giappone rischia di diventare una 'colonia dell'IA', avverte il suo ministro digitale. Il ministro digitale Hisashi Matsumoto ha avvertito che il Giappone potrebbe diventare una 'colonia dell'IA' se rimarrà indietro, difendendo un disegno di legge per semplificare le regole sul consenso all'uso dei dati. Truffe della Coppa del Mondo FIFA 2026 sono attive: siti falsi e malware Truffe della Coppa del Mondo FIFA 2026 sono attive: siti falsi e malware Oltre 4.300 domini falsi FIFA, malware bancario in app di streaming e accessi rubati stanno già prendendo di mira i fan della Coppa del Mondo 2026, con l'FBI e i ricercatori che avvertono di miliardi in potenziali perdite. Spirit AI batte Nvidia nel benchmark di robotica RoboArena Spirit AI batte Nvidia nel benchmark di robotica RoboArena La startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia, mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico. Chesky pianifica un laboratorio di intelligenza artificiale, entrando in competizione con l'OpenAI di Altman. Chesky pianifica un laboratorio di intelligenza artificiale, entrando in competizione con l'OpenAI di Altman. Il CEO di Airbnb, Brian Chesky, sta sostenendo un nuovo laboratorio di intelligenza artificiale focalizzato sull'interazione e sul design degli utenti, segnando il fatto che i più grandi fondatori della Silicon Valley non si fidano più dei laboratori all'avanguardia per costruire ciò di cui hanno bisogno.

I prezzi dei token AI sono scesi del 98%, ma le fatture aziendali sono triplicate.

Uber, Microsoft e Priceline stanno cercando di adattarsi dopo che le fatture dei token AI sono aumentate. La Linux Foundation sta lanciando una Tokenomics Foundation per portare disciplina ai costi della spesa in AI.