Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.
Chiedere all'IA di fingere di essere un esperto può avere effetti contrari, ma i ricercatori potrebbero aver trovato una soluzione.
Hai probabilmente visto il consiglio circolare: dì all'IA di comportarsi come un esperto in un campo, e otterrai risposte migliori. È un consiglio popolare, e funziona, a volte. Tuttavia, un nuovo studio suggerisce che utilizzare le persone dell'IA potrebbe non essere efficace come pensavamo.
I ricercatori dell'Università della California hanno testato 12 diverse persone attraverso sei modelli linguistici. Le persone variavano da esperti di matematica e programmazione a scrittori creativi e monitor della sicurezza. L'obiettivo era scoprire quanto bene l'IA si comporta quando viene istruita a comportarsi come un esperto.
I risultati sono stati misti. Adottare una persona ha reso l'IA più professionale e ha fatto seguire meglio le regole. Ma ha anche reso l'IA peggiore nel richiamare fatti. Secondo lo studio, utilizzare una persona dell'IA la sposta in una modalità di seguire istruzioni piuttosto che in una modalità di recupero della conoscenza, e quel compromesso ti costa in accuratezza.
Qual è la soluzione?
Per risolvere questo problema, i ricercatori hanno sviluppato PRISM, che sta per Persona Routing via Intent-based Self-Modeling. Invece di utilizzare sempre una persona o mai usarne una, PRISM insegna all'IA a decidere cosa è meglio per sé stessa.
Quando fai una domanda, PRISM genera due risposte: una dalla sua modalità predefinita e una dalla sua persona. Confronta quindi le due e fornisce la risposta che funziona meglio per una query specifica.
La risposta esperta non viene scartata anche quando la risposta predefinita vince. Invece, lo stile di ragionamento viene salvato in un componente leggero chiamato adattatore LoRA, dal quale l'IA può attingere in seguito quando necessario. La soluzione sembra semplice, eppure è efficace.
Come ha performato PRISM?
PRISM ha aumentato il punteggio complessivo dell'IA di uno o due punti sul MT-Bench, un test che misura quanto bene un'IA segue le istruzioni e rimane utile. Per compiti di scrittura e sicurezza, le persone hanno aiutato. Per domande di conoscenza pura, saltare la persona si è rivelato essere l'opzione migliore.
I ricercatori pianificano di testare PRISM con più persone e affinare la sua capacità di fornire risposte migliori. Sono ancora i primi passi, ma questo potrebbe cambiare il modo in cui chiediamo all'IA di fare bene.
Rachit è un giornalista tecnologico esperto con oltre sette anni di esperienza nella copertura del panorama della tecnologia di consumo.
La prossima generazione di IA promette chatbot che possono leggere meglio l'ambiente
Hai mai chiesto qualcosa a un chatbot e hai avuto la sensazione che avesse completamente perso il tuo punto? Dici qualcosa con un po' di sfumatura, e l'IA perde completamente la sottigliezza. Questo è esattamente il problema che i ricercatori stanno cercando di risolvere. Anche se la connessione emotiva con l'IA può sembrare più profonda della conversazione umana per molti utenti, la maggior parte dei sistemi di IA oggi tratta ancora una frase come un singolo blocco di sentimento. Se mescoli lodi e critiche, la sfumatura spesso si perde.
Leggi di più
ChatGPT non avrà una modalità erotica, dopo tutto
Se ti aspettavi che ChatGPT avesse una "modalità erotica", quell'idea è ufficialmente fuori discussione. Secondo il Financial Times, la modalità piccante di OpenAI è in attesa "indefinitamente". All'interno della lotta di OpenAI per dare vita alla modalità per adulti
Leggi di più
Samsung porta il suo browser su PC con molte funzionalità interessanti
Un browser per governare il tuo telefono, il tuo PC e l'infinito numero di schede che hai aperte in questo momento. Samsung ha ufficialmente lanciato Samsung Browser per Windows, ed è più di una semplice versione desktop del browser del tuo telefono. Viene fornito con continuità tra dispositivi e un assistente IA che sembra genuinamente utile. Navigazione continua per aiutare a tenere sotto controllo le tue schede
Leggi di più
Altri articoli
Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.
Dire a un'IA di "comportarsi come un esperto" sembra un'ottima idea, ma un nuovo studio suggerisce che potrebbe effettivamente danneggiare la sua accuratezza.
