I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.

I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.

      La sfida di prevedere le scelte nel mondo reale

      Sensor Tower

      Una nuova ricerca suggerisce che il modo in cui l'intelligenza artificiale pensa a noi potrebbe essere un po' troppo ottimista. I ricercatori hanno scoperto che modelli di intelligenza artificiale popolari, come ChatGPT di OpenAI e Claude di Anthropic, tendono a presumere che le persone siano più razionali e logiche di quanto lo siano realmente, specialmente in situazioni di pensiero strategico.

      Questo divario tra come l'IA si aspetta che gli esseri umani si comportino e ciò che le persone fanno realmente potrebbe avere implicazioni su come questi sistemi prevedono le decisioni umane in economia e oltre.

      Testare l'IA rispetto al pensiero umano

      Unsplash

      I ricercatori hanno testato modelli di IA tra cui ChatGPT-4o e Claude-Sonnet-4 in un setup classico della teoria dei giochi chiamato concorso di bellezza keynesiano. Capire questo gioco aiuta a spiegare perché i risultati sono importanti (via TechXplore).

      Nel concorso di bellezza, i partecipanti devono prevedere ciò che gli altri sceglieranno per vincere, non semplicemente scegliere ciò che preferiscono personalmente. Il gioco razionale in teoria significa andare oltre le prime impressioni e ragionare effettivamente sul ragionamento degli altri, un profondo livello di pensiero strategico con cui gli esseri umani spesso hanno difficoltà nella pratica.

      Per vedere come si comportano i modelli di IA, i ricercatori hanno fatto giocare ai sistemi una versione di questo gioco chiamata “Indovina il numero”, dove ogni giocatore sceglie un numero tra zero e cento. Il vincitore è colui la cui scelta è più vicina alla metà della media delle scelte di tutti i giocatori.

      Tim Witzdam / Pexels

      Ai modelli di IA sono state fornite descrizioni dei loro avversari umani, che spaziavano da matricole universitarie a esperti teorici dei giochi, e gli è stato chiesto non solo di scegliere un numero ma anche di spiegare il loro ragionamento.

      I modelli hanno effettivamente aggiustato i loro numeri in base a chi pensavano di affrontare, il che dimostra un certo pensiero strategico. Tuttavia, hanno costantemente assunto un livello di ragionamento logico negli esseri umani che la maggior parte dei giocatori reali in realtà non manifesta, spesso “giocando troppo intelligenti” e mancando il bersaglio di conseguenza.

      U

      Sebbene lo studio abbia anche rilevato che questi sistemi possono adattare le scelte in base a caratteristiche come età o esperienza, essi hanno comunque faticato a identificare strategie dominanti che gli umani potrebbero utilizzare nei giochi a due giocatori. I ricercatori sostengono che ciò evidenzia la continua sfida di calibrare l'IA sul comportamento umano reale, in particolare per compiti che richiedono di anticipare le decisioni altrui.

      Questi risultati riecheggiano anche preoccupazioni più ampie riguardo agli attuali chatbot, comprese ricerche che mostrano che anche i migliori sistemi di IA sono solo circa il 69% precisi, e avvisi da parte di esperti che i modelli di IA possono imitare in modo convincente la personalità umana, sollevando timori di manipolazione. Poiché l'IA continua a essere utilizzata nella modellizzazione economica e in altri domini complessi, sarà essenziale comprendere dove le sue assunzioni divergono dalla realtà umana.

      A Manisha piace occuparsi di tecnologie che fanno parte della vita quotidiana, dagli smartphone e le app al gaming e allo streaming…

      Il primo monitor 6K al mondo con visione 3D senza occhiali è arrivato

      L'Odyssey 3D di Samsung abbina un pannello 6K ultra-definito alla tecnologia di tracciamento oculare per riportare in vita il 3D senza occhiali; ambizioso, sperimentale e sorprendentemente difficile da ignorare.

      In vista del CES 2026, il gigante tecnologico sudcoreano Samsung ha rilasciato ciò che definisce il "primo monitor 6K al mondo per il 3D senza occhiali". Il monitor da 32 pollici dispone di un pannello IPS, supporta un refresh rate massimo di 165Hz e ha porte HDMI 2.1 e DP 2.1, ma il suo principale punto forte è il rendering 3D senza occhiali. A differenza dei tradizionali display 3D che richiedono ingombranti occhiali (e un bel po' di pazienza), l'Odyssey 3D 6K (G9 G90XH) di Samsung utilizza un avanzato sistema di lenti lenticolari abbinato a telecamere di tracciamento oculare per determinare la direzione dello sguardo e regolare la prospettiva per ciascun occhio, creando l'illusione di profondità e ottenendo un aspetto 3D.

      Leggi di più

      Il nuovo Odyssey G6 da 1.040Hz di Samsung è la prova che i monitor da gioco non hanno finito di evolversi

      Con l'Odyssey G6, Samsung spinge i refresh rate nel territorio a quattro cifre, ridefinendo i limiti dei display per il gaming competitivo.

      Sulla strada per il CES 2026, Samsung ha svelato la sua ultima linea Odyssey di monitor da gioco. Mentre uno dei monitor offre visuali 3D senza occhiali, un altro è commercializzato come il primo monitor al mondo con un refresh rate di 1.040Hz. Battezzato Odyssey G6 (G60H), il monitor offre oltre quattro volte il refresh rate degli odierni pannelli da 240Hz a cui i giocatori di e-sport fanno affidamento.

      Di default, il pannello IPS QHD da 27 pollici offre un refresh rate di 600Hz, che è comunque notevole, ma in Dual Mode il monitor può arrivare fino a 1.040Hz (a risoluzione HD). Per chi non fosse al passo, la Dual Mode cambia il funzionamento del pannello, privilegiando il refresh rate sulla risoluzione.

      Leggi di più

      Risparmia 500$ su questo PC iBUYPOWER con RTX 5080 e dimentica il mal di testa del fai-da-te

      Risparmia 500$ su un PC da gioco totalmente equipaggiato con RTX 5080, 32GB di RAM e un SSD da 2TB.

      Se vuoi prestazioni da gaming di alto livello senza passare le notti a confrontare liste di componenti e a guardare guide di assemblaggio, questa offerta sull'iBUYPOWER Y40 Pro è molto difficile da ignorare. Al momento è sceso a 1.949,99$ (da un valore di confronto di 2.449,99$), il che significa che stai risparmiando 500$ su un desktop preassemblato pronto a dominare i giochi moderni subito.

      Con una RTX 5080, un Ryzen 9 7900X a 12 core, 32GB di RAM DDR5 e un capiente SSD NVMe da 2TB, questa configurazione rientra chiaramente nella categoria "high-end". Ottieni un tipo di hardware in grado di gestire gaming a 1440p e 4K, pesante multitasking e creazione di contenuti senza avere la sensazione di pagare un sovrapprezzo da early adopter su ogni componente.

      Leggi di più

I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani. I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.

Altri articoli

TCL collega l'implementazione dell'IA a miglioramenti dell'efficienza e a una produzione più sostenibile. TCL collega l'implementazione dell'IA a miglioramenti dell'efficienza e a una produzione più sostenibile. Questo mese TCL ha presentato le sue ultime applicazioni di intelligenza artificiale alla Conferenza globale sull'innovazione tecnologica TCL 2025, illustrando come il produttore cinese di elettronica Il prossimo laptop di Lenovo ti volterà le spalle, letteralmente. Il prossimo laptop di Lenovo ti volterà le spalle, letteralmente. L'aggiornamento 2026 di Lenovo introduce ThinkPad con processori Panther Lake e il portatile Auto Twist motorizzato, caratterizzati da rotazione guidata dall'IA e webcam ad alta risoluzione da 10 MP per ridefinire la produttività aziendale di fascia alta. Questo Lenovo Yoga Mini i trapelato potrebbe essere il tuo desktop Copilot+ più leggero. Questo Lenovo Yoga Mini i trapelato potrebbe essere il tuo desktop Copilot+ più leggero. Windows Latest afferma che Lenovo sta lavorando allo Yoga Mini i, un mini PC cilindrico da 600 g. La fuga di notizie sostiene che monterà un Intel Core Ultra X7 358H e supporterà fino a quattro display ad alta risoluzione. Google potrebbe finalmente permetterti di modificare il nome del tuo indirizzo Gmail. Google potrebbe finalmente permetterti di modificare il nome del tuo indirizzo Gmail. Google sta sperimentando una funzione molto attesa di Gmail che potrebbe finalmente permettere agli utenti di cambiare il nome del proprio indirizzo email, senza dover ricominciare da capo o perdere anni di dati. Guarda come il TriFold di Samsung si aggiudica un triste primato in questo test di resistenza Guarda come il TriFold di Samsung si aggiudica un triste primato in questo test di resistenza Il regalo di Natale di Zack Nelson per i suoi 9,7 milioni di iscritti su YouTube è stato un test di resistenza dello smartphone TriFold di Samsung. «Ogni tanto capita che sulla mia scrivania arrivi un pezzo di tecnologia che quasi mi fa sentire in colpa per quello che sta per succedere... quasi», dice l'uomo dietro JerryRigEverything all'inizio del test, [...] Samsung porta elementi visivi generati dall'IA nella semplice app Calendario Samsung porta elementi visivi generati dall'IA nella semplice app Calendario Samsung sta testando elementi visivi generati dall'IA per la sua app Calendario, iniziando con immagini che si adattano ai tuoi eventi. L'idea è rendere anche la programmazione di routine un po' più intelligente e visiva.

I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.

Un nuovo studio suggerisce che modelli di intelligenza artificiale come ChatGPT e Claude sovrastimano costantemente quanto gli esseri umani siano realmente razionali, inducendoli a valutare erroneamente il comportamento delle persone in situazioni strategiche.