
AI può fare un sacco di cose, ma non può fare giochi-o addirittura giocare ancora
Man mano che gli strumenti di intelligenza artificiale migliorano, continuiamo a essere incoraggiati a scaricare compiti sempre più complessi a loro. LLM può scrivere le nostre e-mail per noi, creare presentazioni, progettare applicazioni, generare video, cercare in Internet e riassumere i risultati, e molto altro ancora. Una cosa con cui stanno ancora lottando, tuttavia, sono i videogiochi.
Finora quest'anno, due dei più grandi nomi dell'IA (Microsoft e Anthropic) hanno cercato di ottenere i loro modelli per generare o giocare, e i risultati sono probabilmente molto più limitati di quanto molte persone si aspettino.
Questo li rende perfetti vetrine di dove l'IA generativa è davvero in questo momento-in breve: può fare molto di più di prima, ma non può fare tutto.
Microsoft genera Quake II
La generazione di videogiochi ha problemi simili alla generazione di video: il movimento è strano e morph-y, e l'IA inizia a perdere il contatto con la “realtà” dopo un determinato periodo di tempo. L'ultimo tentativo di Microsoft, che chiunque può provare, è una versione generata dall'IA di Quake II.
L'ho giocato un bel paio di volte ed è un'esperienza davvero trippy, con strani, nemici smudgy che appaiono dal nulla e l'ambiente che cambia intorno a te mentre ti muovi. Più volte quando entravo in una nuova stanza, l'ingresso non c'era più quando tornavo indietro per affrontarla — e quando guardavo di nuovo in avanti le pareti si sarebbero spostate.
Uno screenshot del vero Quake II dalla sua pagina Steam. Steam
Uno screenshot della versione generata da Copilot di Quake II. Microsoft
L'esperienza dura solo pochi minuti prima che si interrompa e ti chieda di iniziare un nuovo gioco, ma se sei sfortunato, può smettere di rispondere correttamente ai tuoi input anche prima.
È un grande esperimento, tuttavia, e penso che sarebbe utile per più persone da vedere. Ti consente di sperimentare di persona in cosa è brava la gen AI e quali sono i suoi attuali limiti. Per quanto impressionante sia il fatto che possiamo generare un'esperienza di videogiochi interattiva, è difficile immaginare che chiunque possa giocare a questa demo tecnologica e pensare che il prossimo Assassin's Creed sarà realizzato dall'IA.
Questi tipi di pensieri e ipotesi esistono, tuttavia, ed è in gran parte perché le persone non possono sfuggire a sentire parlare di AI in questo momento. Anche se non ti potrebbe interessare di meno l'intelligenza artificiale, ti verrà comunque spinta in faccia ovunque tu vada. Il problema è che le informazioni che la persona media ottiene sono quasi interamente costituite da commenti di big tech marketing e CEO che vengono raccolti da pubblicazioni di notizie.
Ciò significa che sentono affermazioni esagerate e contrastanti come queste:
Ha il potenziale per risolvere alcuni dei più grandi problemi del mondo, come il cambiamento climatico, la povertà e le malattie. (Bill Gates)
Probabilmente nel 2025, noi di Meta, così come le altre aziende che stanno fondamentalmente lavorando su questo, avremo un'IA che può effettivamente essere una sorta di ingegnere di medio livello che hai nella tua azienda in grado di scrivere codice. (Mark Zuckerberg)
L'utilizzo efficace dell'IA è ora un'aspettativa fondamentale di tutti in Shopify. È uno strumento di tutti i mestieri oggi e crescerà solo in importanza. Francamente, non penso che sia fattibile rinunciare all'apprendimento dell'abilità di applicare l'intelligenza artificiale nel tuo mestiere. (Tobi Lutke, CEO di Shopify)
Ora siamo fiduciosi di sapere come costruire AGI come lo abbiamo tradizionalmente inteso. Crediamo che, nel 2025, potremmo vedere i primi agenti AI “entrare nella forza lavoro” e cambiare materialmente l'output delle aziende. (Sam Altman, CEO di OpenAI)
L'intelligenza artificiale è più pericolosa, ad esempio, della progettazione di aeromobili mal gestiti o della manutenzione della produzione o della cattiva produzione di auto, nel senso che è, ha il potenziale — per quanto piccolo si possa considerare tale probabilità, ma non è banale-ha il potenziale di distruzione della civiltà. (Elon Musk)
Tutto questo è abbastanza estremo, giusto? Ci salverà e ci distruggerà, è sia uno strumento di tutti i mestieri per i professionisti che uno strumento che sostituirà i professionisti-e apparentemente, potremmo ottenere AGI di livello fantascientifico non appena quest'anno. Quando questo è tutto ciò che la gente sente, iniziano ad aspettarsi cose piuttosto sorprendenti da questi strumenti e credono che tutti gli impiegati trascorrano le loro giornate conversando con i loro computer come i personaggi di Star Trek.
Tuttavia, non è quello che sembra la realtà. La realtà sembra un trippy, smudgy Quake II con forme incomprensibili per i nemici. Gli LLM a livello di ChatGPT sono stati davvero un'entusiasmante svolta nel 2022 e un sacco di divertimento per tutti con cui giocare — ma per la maggior parte degli usi la grande tecnologia ci sta spingendo in questo momento, l'IA non è abbastanza capace. I livelli di precisione sono troppo bassi, le abilità di seguire le istruzioni sono troppo basse, le finestre di contesto sono troppo piccole e sono solo addestrate su Internet senza senso invece della conoscenza del mondo reale.
Ma generare un videogioco è un obiettivo piuttosto complesso-ci vogliono interi team di umani anni per fare queste cose, dopo tutto. Che ne dici di giocare ai videogiochi invece?
Claude "gioca" Pokémon Rosso
ClaudePlaysPokemon
Beh, si scopre che la gente sta sperimentando anche questo. Il nuovo modello di Anthropic, Claude 3.7 Sonnet, sta giocando a Pokémon Rosso su Twitch da circa due mesi e sta facendo il miglior lavoro che un LLM abbia mai fatto nel giocare a Pokémon. Un leggero avvertimento, tuttavia, è che è ancora miglia dietro l'umano medio di 10 anni.
Uno dei problemi è la velocità — ci vogliono migliaia di azioni che coprono più giorni per fare cose come farlo attraverso la foresta viridiana.
Antropico
Perché ci vuole così tanto? Non è perché non riesce a capire come vincere strategicamente le battaglie Pokémon-questa è in realtà la parte in cui è più bravo. Navigare attraverso l'ambiente ed evitare alberi ed edifici, d'altra parte, non è così buono. Claude non è mai stato addestrato a giocare a Pokémon, e non è facile per lui capire la pixel art e cosa rappresenta.
Facendolo attraverso aree di tipo labirinto come Mt. Moon è particolarmente difficile per lui, poiché lotta per formare una mappa della zona ed evitare di ripercorrere i suoi passi. Una volta, si è bloccato così in un angolo che ha concluso che il gioco era rotto e ha generato una richiesta formale di reimpostare il gioco.
Anche questi primi tentativi non furono privi di momenti di leggerezza.In un'occasione, Claude è rimasto bloccato in un angolo e—convinto che qualcosa dovesse essere rotto—ha digitato una richiesta formale per resettare il gioco. pic.twitter.com/5RIiCJdxCM-Anthropic (@AnthropicAI) 25 Febbraio 2025
Inoltre non è bravo a ricordare quali sono i suoi obiettivi, quali cose ha già provato o quali luoghi è già stato.
C'è una ragione piuttosto semplice per questo — LLM ha una “finestra di contesto” finita che funge da memoria. Può contenere solo così tante informazioni, e una volta che Claude raggiunge il limite, condensa ciò che ha per fare spazio a più. Quindi un pezzo di informazioni come " Visitato Viridian City, entrato in ogni edificio e parlato con ogni NPC” potrebbe essere condensato in “Visited Viridian City” — spingendo Claude a tornare indietro e controllare se c'era altro da fare in città.
Per riassumere: Claude non riesce a capire dove sta andando, entra nei muri, scambia oggetti casuali per NPC, dimentica dove è stato e cosa sta cercando di fare, e ogni decisione che prende richiede paragrafi e paragrafi di ragionamento. Questa non è una critica-questi sono entrambi esperimenti emozionanti che stanno spingendo LLM per quanto possono andare.
Ma con tutto il clamore intorno AI, ci si sente importante per le persone a vedere demo come questi e fare le proprie menti su AI. Alcune figure stanno cercando di spingere la narrazione che stiamo per raggiungere il picco — che entro anni, l'IA sarà al di là anche degli umani più intelligenti — ma non penso che siano sinceri, sono solo venditori. Non siamo neanche lontanamente vicini al picco, tutto questo è solo all'inizio.




Altri articoli






AI può fare un sacco di cose, ma non può fare giochi-o addirittura giocare ancora
I modelli di intelligenza artificiale generativa hanno giocato con i videogiochi ultimamente, ed è una vetrina perfetta di quanto lontano sono arrivati and e quanto lontano devono ancora andare.