Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

      Chiedere all'IA di fingere di essere un esperto può avere effetti contrari, ma i ricercatori potrebbero aver trovato una soluzione.

      Hai probabilmente visto il consiglio circolare: dì all'IA di comportarsi come un esperto in un campo, e otterrai risposte migliori. È un consiglio popolare, e funziona, a volte. Tuttavia, un nuovo studio suggerisce che utilizzare le persone dell'IA potrebbe non essere efficace come pensavamo.

      I ricercatori dell'Università della California hanno testato 12 diverse persone attraverso sei modelli linguistici. Le persone variavano da esperti di matematica e programmazione a scrittori creativi e monitor della sicurezza. L'obiettivo era scoprire quanto bene l'IA si comporta quando viene istruita a comportarsi come un esperto.

      I risultati sono stati misti. Adottare una persona ha reso l'IA più professionale e ha fatto seguire meglio le regole. Ma ha anche reso l'IA peggiore nel richiamare fatti. Secondo lo studio, utilizzare una persona dell'IA la sposta in una modalità di seguire istruzioni piuttosto che in una modalità di recupero della conoscenza, e quel compromesso ti costa in accuratezza.

      Qual è la soluzione?

      Per risolvere questo problema, i ricercatori hanno sviluppato PRISM, che sta per Persona Routing via Intent-based Self-Modeling. Invece di utilizzare sempre una persona o mai usarne una, PRISM insegna all'IA a decidere cosa è meglio per sé stessa.

      Quando fai una domanda, PRISM genera due risposte: una dalla sua modalità predefinita e una dalla sua persona. Confronta quindi le due e fornisce la risposta che funziona meglio per una query specifica.

      La risposta esperta non viene scartata anche quando la risposta predefinita vince. Invece, lo stile di ragionamento viene salvato in un componente leggero chiamato adattatore LoRA, dal quale l'IA può attingere in seguito quando necessario. La soluzione sembra semplice, eppure è efficace.

      Come ha performato PRISM?

      PRISM ha aumentato il punteggio complessivo dell'IA di uno o due punti sul MT-Bench, un test che misura quanto bene un'IA segue le istruzioni e rimane utile. Per compiti di scrittura e sicurezza, le persone hanno aiutato. Per domande di conoscenza pura, saltare la persona si è rivelato essere l'opzione migliore.

      I ricercatori pianificano di testare PRISM con più persone e affinare la sua capacità di fornire risposte migliori. Sono ancora i primi passi, ma questo potrebbe cambiare il modo in cui chiediamo all'IA di fare bene.

      Rachit è un giornalista tecnologico esperto con oltre sette anni di esperienza nella copertura del panorama della tecnologia di consumo.

      La prossima generazione di IA promette chatbot che possono leggere meglio l'ambiente

      Hai mai chiesto qualcosa a un chatbot e hai avuto la sensazione che avesse completamente perso il tuo punto? Dici qualcosa con un po' di sfumatura, e l'IA perde completamente la sottigliezza. Questo è esattamente il problema che i ricercatori stanno cercando di risolvere. Anche se la connessione emotiva con l'IA può sembrare più profonda della conversazione umana per molti utenti, la maggior parte dei sistemi di IA oggi tratta ancora una frase come un singolo blocco di sentimento. Se mescoli lodi e critiche, la sfumatura spesso si perde.

      Leggi di più

      ChatGPT non avrà una modalità erotica, dopo tutto

      Se ti aspettavi che ChatGPT avesse una "modalità erotica", quell'idea è ufficialmente fuori discussione. Secondo il Financial Times, la modalità piccante di OpenAI è in attesa "indefinitamente". All'interno della lotta di OpenAI per dare vita alla modalità per adulti

      Leggi di più

      Samsung porta il suo browser su PC con molte funzionalità interessanti

      Un browser per governare il tuo telefono, il tuo PC e l'infinito numero di schede che hai aperte in questo momento. Samsung ha ufficialmente lanciato Samsung Browser per Windows, ed è più di una semplice versione desktop del browser del tuo telefono. Viene fornito con continuità tra dispositivi e un assistente IA che sembra genuinamente utile. Navigazione continua per aiutare a tenere sotto controllo le tue schede

      Leggi di più

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Altri articoli

Blossom Health raccoglie 20 milioni di dollari per affiancare i copiloti AI agli psichiatri Blossom Health raccoglie 20 milioni di dollari per affiancare i copiloti AI agli psichiatri Blossom Health, una startup di telepsichiatria con sede a New York fondata nel 2024, ha raccolto 20 milioni di dollari in finanziamenti combinati seed e Serie A per scalare una piattaforma alimentata da intelligenza artificiale che abbina psichiatri con copiloti clinici e amministrazione automatizzata. Botslab Smart Dashcams: Aggiorna la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Botslab Smart Dashcams: Aggiorna la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Con la crescente imprevedibilità sulla strada, la guida moderna richiede una maggiore consapevolezza da parte degli automobilisti. Durante le Vendite di Primavera di marzo, Botslab sta rendendo le dashcam senza mani alimentate da intelligenza artificiale più accessibili per gli automobilisti che cercano aggiornamenti tecnologici per i veicoli. Questo serve a proteggere conducenti e passeggeri con avvisi intelligenti e prove per ridurre le controversie stradali. Herbalife acquisisce Bioniq in un affare del valore di fino a 150 milioni di dollari Herbalife acquisisce Bioniq in un affare del valore di fino a 150 milioni di dollari Herbalife sta acquisendo Bioniq, la startup di integratori di biomarcatori nel sangue sostenuta da Cristiano Ronaldo, in un affare del valore di fino a 150 milioni di dollari. Google espande Search Live a livello globale con AI vocale e della fotocamera Google espande Search Live a livello globale con AI vocale e della fotocamera Google ha espanso Search Live a livello globale, portando la ricerca vocale e tramite fotocamera alimentata dall'IA in oltre 200 paesi e in più lingue. Botslab Smart Dashcams: Migliora la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Botslab Smart Dashcams: Migliora la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Con la crescente imprevedibilità sulla strada, la guida moderna richiede una maggiore consapevolezza da parte degli automobilisti. Durante le Vendite di Primavera di marzo, Botslab sta rendendo le dashcam senza mani alimentate da intelligenza artificiale più accessibili per i conducenti che cercano aggiornamenti tecnologici per i veicoli. Questo serve a proteggere conducenti e passeggeri con avvisi intelligenti e prove per ridurre le controversie sulla strada. La tua Apple TV può ora consigliare programmi e film in base alle tue abitudini di visione. La tua Apple TV può ora consigliare programmi e film in base alle tue abitudini di visione. La tvOS 26.4 di Apple arriva con quattro cambiamenti significativi per la tua esperienza con Apple TV, tra cui un browser di contenuti personalizzato, una correzione audio Dolby che gli audiofili apprezzeranno e un addio a iTunes.

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Dire a un'IA di "comportarsi come un esperto" sembra un'ottima idea, ma un nuovo studio suggerisce che potrebbe effettivamente danneggiare la sua accuratezza.