AI può fare un sacco di cose, ma non può fare giochi-o addirittura giocare ancora

      Man mano che gli strumenti di intelligenza artificiale migliorano, continuiamo a essere incoraggiati a scaricare compiti sempre più complessi a loro. LLM può scrivere le nostre e-mail per noi, creare presentazioni, progettare applicazioni, generare video, cercare in Internet e riassumere i risultati, e molto altro ancora. Una cosa con cui stanno ancora lottando, tuttavia, sono i videogiochi.

      Finora quest'anno, due dei più grandi nomi dell'IA (Microsoft e Anthropic) hanno cercato di ottenere i loro modelli per generare o giocare, e i risultati sono probabilmente molto più limitati di quanto molte persone si aspettino.

      Questo li rende perfetti vetrine di dove l'IA generativa è davvero in questo momento-in breve: può fare molto di più di prima, ma non può fare tutto.

      Microsoft genera Quake II

      La generazione di videogiochi ha problemi simili alla generazione di video: il movimento è strano e morph-y, e l'IA inizia a perdere il contatto con la “realtà” dopo un determinato periodo di tempo. L'ultimo tentativo di Microsoft, che chiunque può provare, è una versione generata dall'IA di Quake II.

      L'ho giocato un bel paio di volte ed è un'esperienza davvero trippy, con strani, nemici smudgy che appaiono dal nulla e l'ambiente che cambia intorno a te mentre ti muovi. Più volte quando entravo in una nuova stanza, l'ingresso non c'era più quando tornavo indietro per affrontarla — e quando guardavo di nuovo in avanti le pareti si sarebbero spostate.

      Uno screenshot del vero Quake II dalla sua pagina Steam. Steam

      Uno screenshot della versione generata da Copilot di Quake II. Microsoft

      L'esperienza dura solo pochi minuti prima che si interrompa e ti chieda di iniziare un nuovo gioco, ma se sei sfortunato, può smettere di rispondere correttamente ai tuoi input anche prima.

      È un grande esperimento, tuttavia, e penso che sarebbe utile per più persone da vedere. Ti consente di sperimentare di persona in cosa è brava la gen AI e quali sono i suoi attuali limiti. Per quanto impressionante sia il fatto che possiamo generare un'esperienza di videogiochi interattiva, è difficile immaginare che chiunque possa giocare a questa demo tecnologica e pensare che il prossimo Assassin's Creed sarà realizzato dall'IA.

      Questi tipi di pensieri e ipotesi esistono, tuttavia, ed è in gran parte perché le persone non possono sfuggire a sentire parlare di AI in questo momento. Anche se non ti potrebbe interessare di meno l'intelligenza artificiale, ti verrà comunque spinta in faccia ovunque tu vada. Il problema è che le informazioni che la persona media ottiene sono quasi interamente costituite da commenti di big tech marketing e CEO che vengono raccolti da pubblicazioni di notizie.

      Ciò significa che sentono affermazioni esagerate e contrastanti come queste:



      Ha il potenziale per risolvere alcuni dei più grandi problemi del mondo, come il cambiamento climatico, la povertà e le malattie. (Bill Gates)



      Probabilmente nel 2025, noi di Meta, così come le altre aziende che stanno fondamentalmente lavorando su questo, avremo un'IA che può effettivamente essere una sorta di ingegnere di medio livello che hai nella tua azienda in grado di scrivere codice. (Mark Zuckerberg)



      L'utilizzo efficace dell'IA è ora un'aspettativa fondamentale di tutti in Shopify. È uno strumento di tutti i mestieri oggi e crescerà solo in importanza. Francamente, non penso che sia fattibile rinunciare all'apprendimento dell'abilità di applicare l'intelligenza artificiale nel tuo mestiere. (Tobi Lutke, CEO di Shopify)



      Ora siamo fiduciosi di sapere come costruire AGI come lo abbiamo tradizionalmente inteso. Crediamo che, nel 2025, potremmo vedere i primi agenti AI “entrare nella forza lavoro” e cambiare materialmente l'output delle aziende. (Sam Altman, CEO di OpenAI)



      L'intelligenza artificiale è più pericolosa, ad esempio, della progettazione di aeromobili mal gestiti o della manutenzione della produzione o della cattiva produzione di auto, nel senso che è, ha il potenziale — per quanto piccolo si possa considerare tale probabilità, ma non è banale-ha il potenziale di distruzione della civiltà. (Elon Musk)



      Tutto questo è abbastanza estremo, giusto? Ci salverà e ci distruggerà, è sia uno strumento di tutti i mestieri per i professionisti che uno strumento che sostituirà i professionisti-e apparentemente, potremmo ottenere AGI di livello fantascientifico non appena quest'anno. Quando questo è tutto ciò che la gente sente, iniziano ad aspettarsi cose piuttosto sorprendenti da questi strumenti e credono che tutti gli impiegati trascorrano le loro giornate conversando con i loro computer come i personaggi di Star Trek.

      Tuttavia, non è quello che sembra la realtà. La realtà sembra un trippy, smudgy Quake II con forme incomprensibili per i nemici. Gli LLM a livello di ChatGPT sono stati davvero un'entusiasmante svolta nel 2022 e un sacco di divertimento per tutti con cui giocare — ma per la maggior parte degli usi la grande tecnologia ci sta spingendo in questo momento, l'IA non è abbastanza capace. I livelli di precisione sono troppo bassi, le abilità di seguire le istruzioni sono troppo basse, le finestre di contesto sono troppo piccole e sono solo addestrate su Internet senza senso invece della conoscenza del mondo reale.

      Ma generare un videogioco è un obiettivo piuttosto complesso-ci vogliono interi team di umani anni per fare queste cose, dopo tutto. Che ne dici di giocare ai videogiochi invece?

      Claude "gioca" Pokémon Rosso

      ClaudePlaysPokemon

      Beh, si scopre che la gente sta sperimentando anche questo. Il nuovo modello di Anthropic, Claude 3.7 Sonnet, sta giocando a Pokémon Rosso su Twitch da circa due mesi e sta facendo il miglior lavoro che un LLM abbia mai fatto nel giocare a Pokémon. Un leggero avvertimento, tuttavia, è che è ancora miglia dietro l'umano medio di 10 anni.

      Uno dei problemi è la velocità — ci vogliono migliaia di azioni che coprono più giorni per fare cose come farlo attraverso la foresta viridiana.

      Antropico

      Perché ci vuole così tanto? Non è perché non riesce a capire come vincere strategicamente le battaglie Pokémon-questa è in realtà la parte in cui è più bravo. Navigare attraverso l'ambiente ed evitare alberi ed edifici, d'altra parte, non è così buono. Claude non è mai stato addestrato a giocare a Pokémon, e non è facile per lui capire la pixel art e cosa rappresenta.

      Facendolo attraverso aree di tipo labirinto come Mt. Moon è particolarmente difficile per lui, poiché lotta per formare una mappa della zona ed evitare di ripercorrere i suoi passi. Una volta, si è bloccato così in un angolo che ha concluso che il gioco era rotto e ha generato una richiesta formale di reimpostare il gioco.



      Anche questi primi tentativi non furono privi di momenti di leggerezza.In un'occasione, Claude è rimasto bloccato in un angolo e—convinto che qualcosa dovesse essere rotto—ha digitato una richiesta formale per resettare il gioco. pic.twitter.com/5RIiCJdxCM-Anthropic (@AnthropicAI) 25 Febbraio 2025



      Inoltre non è bravo a ricordare quali sono i suoi obiettivi, quali cose ha già provato o quali luoghi è già stato.

      C'è una ragione piuttosto semplice per questo — LLM ha una “finestra di contesto” finita che funge da memoria. Può contenere solo così tante informazioni, e una volta che Claude raggiunge il limite, condensa ciò che ha per fare spazio a più. Quindi un pezzo di informazioni come " Visitato Viridian City, entrato in ogni edificio e parlato con ogni NPC” potrebbe essere condensato in “Visited Viridian City” — spingendo Claude a tornare indietro e controllare se c'era altro da fare in città.

      Per riassumere: Claude non riesce a capire dove sta andando, entra nei muri, scambia oggetti casuali per NPC, dimentica dove è stato e cosa sta cercando di fare, e ogni decisione che prende richiede paragrafi e paragrafi di ragionamento. Questa non è una critica-questi sono entrambi esperimenti emozionanti che stanno spingendo LLM per quanto possono andare.

      Ma con tutto il clamore intorno AI, ci si sente importante per le persone a vedere demo come questi e fare le proprie menti su AI. Alcune figure stanno cercando di spingere la narrazione che stiamo per raggiungere il picco — che entro anni, l'IA sarà al di là anche degli umani più intelligenti — ma non penso che siano sinceri, sono solo venditori. Non siamo neanche lontanamente vicini al picco, tutto questo è solo all'inizio.

Altri articoli

Il futuro della riabilitazione della mano e del polso è divertente giochi arcade Un team di ricercatori in Spagna sta utilizzando videogiochi sviluppati su una piattaforma gratuita e un controller specializzato per aiutare con la riabilitazione della mano e del polso.

” Uno dei migliori telefoni pieghevoli", il Razr Plus, ha appena ricevuto uno sconto di $200 Il Motorola Razr Plus 2024 è un divertente telefono pieghevole che i nostri recensori hanno apprezzato molto. Risparmia $200 su di esso quando lo compri oggi. Di solito è 1 1.000, ma puoi ottenerlo per $800 ora.

Netflix search potrebbe presto ottenere una spinta AI, e suona come una manna C'è uno scherzo in esecuzione nel mondo dello streaming. Nel momento in cui decidi cosa guardare, gli snack sono finiti o l'umore è sparito. Netflix ha anche lanciato uno strumento chiamato "Play Something" per terminare lo scorrimento del catalogo senza senso. Ma una parte intrinseca del problema è anche il cattivo sistema di ricerca della piattaforma. Per anni, [[]

The Pitt ha raggiunto una media di 10 milioni di spettatori nella sua prima stagione La serie emergency room è diventata un grande successo per Max, e ha appena concluso la sua prima stagione sulla piattaforma di streaming.

Telefoni e laptop non stanno diventando costosi, grazie allo sgravio tariffario Il governo degli Stati Uniti ha rivisto la politica tariffaria per i prodotti provenienti dalla Cina escludendo gli articoli elettronici come telefoni, laptop e processori.

Mythic Quest è stato cancellato su Apple TV+, ma i fan avranno un altro episodio La serie avrà la possibilità di offrire ai fan un finale aggiornato con una nuova versione del finale della quarta stagione che uscirà la prossima settimana.

AI può fare un sacco di cose, ma non può fare giochi-o addirittura giocare ancora

I modelli di intelligenza artificiale generativa hanno giocato con i videogiochi ultimamente, ed è una vetrina perfetta di quanto lontano sono arrivati and e quanto lontano devono ancora andare.