I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.
La sfida di prevedere le scelte nel mondo reale
Sensor Tower
Una nuova ricerca suggerisce che il modo in cui l'intelligenza artificiale pensa a noi potrebbe essere un po' troppo ottimista. I ricercatori hanno scoperto che modelli di intelligenza artificiale popolari, come ChatGPT di OpenAI e Claude di Anthropic, tendono a presumere che le persone siano più razionali e logiche di quanto lo siano realmente, specialmente in situazioni di pensiero strategico.
Questo divario tra come l'IA si aspetta che gli esseri umani si comportino e ciò che le persone fanno realmente potrebbe avere implicazioni su come questi sistemi prevedono le decisioni umane in economia e oltre.
Testare l'IA rispetto al pensiero umano
Unsplash
I ricercatori hanno testato modelli di IA tra cui ChatGPT-4o e Claude-Sonnet-4 in un setup classico della teoria dei giochi chiamato concorso di bellezza keynesiano. Capire questo gioco aiuta a spiegare perché i risultati sono importanti (via TechXplore).
Nel concorso di bellezza, i partecipanti devono prevedere ciò che gli altri sceglieranno per vincere, non semplicemente scegliere ciò che preferiscono personalmente. Il gioco razionale in teoria significa andare oltre le prime impressioni e ragionare effettivamente sul ragionamento degli altri, un profondo livello di pensiero strategico con cui gli esseri umani spesso hanno difficoltà nella pratica.
Per vedere come si comportano i modelli di IA, i ricercatori hanno fatto giocare ai sistemi una versione di questo gioco chiamata “Indovina il numero”, dove ogni giocatore sceglie un numero tra zero e cento. Il vincitore è colui la cui scelta è più vicina alla metà della media delle scelte di tutti i giocatori.
Tim Witzdam / Pexels
Ai modelli di IA sono state fornite descrizioni dei loro avversari umani, che spaziavano da matricole universitarie a esperti teorici dei giochi, e gli è stato chiesto non solo di scegliere un numero ma anche di spiegare il loro ragionamento.
I modelli hanno effettivamente aggiustato i loro numeri in base a chi pensavano di affrontare, il che dimostra un certo pensiero strategico. Tuttavia, hanno costantemente assunto un livello di ragionamento logico negli esseri umani che la maggior parte dei giocatori reali in realtà non manifesta, spesso “giocando troppo intelligenti” e mancando il bersaglio di conseguenza.
U
Sebbene lo studio abbia anche rilevato che questi sistemi possono adattare le scelte in base a caratteristiche come età o esperienza, essi hanno comunque faticato a identificare strategie dominanti che gli umani potrebbero utilizzare nei giochi a due giocatori. I ricercatori sostengono che ciò evidenzia la continua sfida di calibrare l'IA sul comportamento umano reale, in particolare per compiti che richiedono di anticipare le decisioni altrui.
Questi risultati riecheggiano anche preoccupazioni più ampie riguardo agli attuali chatbot, comprese ricerche che mostrano che anche i migliori sistemi di IA sono solo circa il 69% precisi, e avvisi da parte di esperti che i modelli di IA possono imitare in modo convincente la personalità umana, sollevando timori di manipolazione. Poiché l'IA continua a essere utilizzata nella modellizzazione economica e in altri domini complessi, sarà essenziale comprendere dove le sue assunzioni divergono dalla realtà umana.
A Manisha piace occuparsi di tecnologie che fanno parte della vita quotidiana, dagli smartphone e le app al gaming e allo streaming…
Il primo monitor 6K al mondo con visione 3D senza occhiali è arrivato
L'Odyssey 3D di Samsung abbina un pannello 6K ultra-definito alla tecnologia di tracciamento oculare per riportare in vita il 3D senza occhiali; ambizioso, sperimentale e sorprendentemente difficile da ignorare.
In vista del CES 2026, il gigante tecnologico sudcoreano Samsung ha rilasciato ciò che definisce il "primo monitor 6K al mondo per il 3D senza occhiali". Il monitor da 32 pollici dispone di un pannello IPS, supporta un refresh rate massimo di 165Hz e ha porte HDMI 2.1 e DP 2.1, ma il suo principale punto forte è il rendering 3D senza occhiali. A differenza dei tradizionali display 3D che richiedono ingombranti occhiali (e un bel po' di pazienza), l'Odyssey 3D 6K (G9 G90XH) di Samsung utilizza un avanzato sistema di lenti lenticolari abbinato a telecamere di tracciamento oculare per determinare la direzione dello sguardo e regolare la prospettiva per ciascun occhio, creando l'illusione di profondità e ottenendo un aspetto 3D.
Leggi di più
Il nuovo Odyssey G6 da 1.040Hz di Samsung è la prova che i monitor da gioco non hanno finito di evolversi
Con l'Odyssey G6, Samsung spinge i refresh rate nel territorio a quattro cifre, ridefinendo i limiti dei display per il gaming competitivo.
Sulla strada per il CES 2026, Samsung ha svelato la sua ultima linea Odyssey di monitor da gioco. Mentre uno dei monitor offre visuali 3D senza occhiali, un altro è commercializzato come il primo monitor al mondo con un refresh rate di 1.040Hz. Battezzato Odyssey G6 (G60H), il monitor offre oltre quattro volte il refresh rate degli odierni pannelli da 240Hz a cui i giocatori di e-sport fanno affidamento.
Di default, il pannello IPS QHD da 27 pollici offre un refresh rate di 600Hz, che è comunque notevole, ma in Dual Mode il monitor può arrivare fino a 1.040Hz (a risoluzione HD). Per chi non fosse al passo, la Dual Mode cambia il funzionamento del pannello, privilegiando il refresh rate sulla risoluzione.
Leggi di più
Risparmia 500$ su questo PC iBUYPOWER con RTX 5080 e dimentica il mal di testa del fai-da-te
Risparmia 500$ su un PC da gioco totalmente equipaggiato con RTX 5080, 32GB di RAM e un SSD da 2TB.
Se vuoi prestazioni da gaming di alto livello senza passare le notti a confrontare liste di componenti e a guardare guide di assemblaggio, questa offerta sull'iBUYPOWER Y40 Pro è molto difficile da ignorare. Al momento è sceso a 1.949,99$ (da un valore di confronto di 2.449,99$), il che significa che stai risparmiando 500$ su un desktop preassemblato pronto a dominare i giochi moderni subito.
Con una RTX 5080, un Ryzen 9 7900X a 12 core, 32GB di RAM DDR5 e un capiente SSD NVMe da 2TB, questa configurazione rientra chiaramente nella categoria "high-end". Ottieni un tipo di hardware in grado di gestire gaming a 1440p e 4K, pesante multitasking e creazione di contenuti senza avere la sensazione di pagare un sovrapprezzo da early adopter su ogni componente.
Leggi di più
Altri articoli
I modelli di intelligenza artificiale come ChatGPT e Claude sopravvalutano quanto siano davvero intelligenti gli esseri umani.
Un nuovo studio suggerisce che modelli di intelligenza artificiale come ChatGPT e Claude sovrastimano costantemente quanto gli esseri umani siano realmente razionali, inducendoli a valutare erroneamente il comportamento delle persone in situazioni strategiche.
