Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

      Chiedere all'IA di fingere di essere un esperto può avere effetti contrari, ma i ricercatori potrebbero aver trovato una soluzione.

      Hai probabilmente visto il consiglio circolare: dì all'IA di comportarsi come un esperto in un campo, e otterrai risposte migliori. È un consiglio popolare, e funziona, a volte. Tuttavia, un nuovo studio suggerisce che utilizzare le persone dell'IA potrebbe non essere efficace come pensavamo.

      I ricercatori dell'Università della California hanno testato 12 diverse persone attraverso sei modelli linguistici. Le persone variavano da esperti di matematica e programmazione a scrittori creativi e monitor della sicurezza. L'obiettivo era scoprire quanto bene l'IA si comporta quando viene istruita a comportarsi come un esperto.

      I risultati sono stati misti. Adottare una persona ha reso l'IA più professionale e ha fatto seguire meglio le regole. Ma ha anche reso l'IA peggiore nel richiamare fatti. Secondo lo studio, utilizzare una persona dell'IA la sposta in una modalità di seguire istruzioni piuttosto che in una modalità di recupero della conoscenza, e quel compromesso ti costa in accuratezza.

      Qual è la soluzione?

      Per risolvere questo problema, i ricercatori hanno sviluppato PRISM, che sta per Persona Routing via Intent-based Self-Modeling. Invece di utilizzare sempre una persona o mai usarne una, PRISM insegna all'IA a decidere cosa è meglio per sé stessa.

      Quando fai una domanda, PRISM genera due risposte: una dalla sua modalità predefinita e una dalla sua persona. Confronta quindi le due e fornisce la risposta che funziona meglio per una query specifica.

      La risposta esperta non viene scartata anche quando la risposta predefinita vince. Invece, lo stile di ragionamento viene salvato in un componente leggero chiamato adattatore LoRA, dal quale l'IA può attingere in seguito quando necessario. La soluzione sembra semplice, eppure è efficace.

      Come ha performato PRISM?

      PRISM ha aumentato il punteggio complessivo dell'IA di uno o due punti sul MT-Bench, un test che misura quanto bene un'IA segue le istruzioni e rimane utile. Per compiti di scrittura e sicurezza, le persone hanno aiutato. Per domande di conoscenza pura, saltare la persona si è rivelato essere l'opzione migliore.

      I ricercatori pianificano di testare PRISM con più persone e affinare la sua capacità di fornire risposte migliori. Sono ancora i primi passi, ma questo potrebbe cambiare il modo in cui chiediamo all'IA di fare bene.

      Rachit è un giornalista tecnologico esperto con oltre sette anni di esperienza nella copertura del panorama della tecnologia di consumo.

      La prossima generazione di IA promette chatbot che possono leggere meglio l'ambiente

      Hai mai chiesto qualcosa a un chatbot e hai avuto la sensazione che avesse completamente perso il tuo punto? Dici qualcosa con un po' di sfumatura, e l'IA perde completamente la sottigliezza. Questo è esattamente il problema che i ricercatori stanno cercando di risolvere. Anche se la connessione emotiva con l'IA può sembrare più profonda della conversazione umana per molti utenti, la maggior parte dei sistemi di IA oggi tratta ancora una frase come un singolo blocco di sentimento. Se mescoli lodi e critiche, la sfumatura spesso si perde.

      Leggi di più

      ChatGPT non avrà una modalità erotica, dopo tutto

      Se ti aspettavi che ChatGPT avesse una "modalità erotica", quell'idea è ufficialmente fuori discussione. Secondo il Financial Times, la modalità piccante di OpenAI è in attesa "indefinitamente". All'interno della lotta di OpenAI per dare vita alla modalità per adulti

      Leggi di più

      Samsung porta il suo browser su PC con molte funzionalità interessanti

      Un browser per governare il tuo telefono, il tuo PC e l'infinito numero di schede che hai aperte in questo momento. Samsung ha ufficialmente lanciato Samsung Browser per Windows, ed è più di una semplice versione desktop del browser del tuo telefono. Viene fornito con continuità tra dispositivi e un assistente IA che sembra genuinamente utile. Navigazione continua per aiutare a tenere sotto controllo le tue schede

      Leggi di più

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile. Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Altri articoli

La tua Apple TV può ora raccomandare programmi e film in base alle tue abitudini di visione. La tua Apple TV può ora raccomandare programmi e film in base alle tue abitudini di visione. La tvOS 26.4 di Apple arriva con quattro cambiamenti significativi per la tua esperienza con Apple TV, tra cui un browser di contenuti personalizzato, una correzione audio Dolby che gli audiofili apprezzeranno e un addio a iTunes. Botslab Smart Dashcams: Migliora la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Botslab Smart Dashcams: Migliora la tua sicurezza stradale questa primavera con maggiore consapevolezza e meno congetture Con la crescente imprevedibilità sulla strada, la guida moderna richiede una maggiore consapevolezza da parte degli automobilisti. Durante le Vendite di Primavera di marzo, Botslab sta rendendo le dashcam senza mani alimentate da intelligenza artificiale più accessibili per gli automobilisti che cercano aggiornamenti tecnologici per i veicoli. Questo serve a proteggere conducenti e passeggeri con avvisi intelligenti e prove per ridurre le controversie sulla strada. L'iPad più economico di Apple potrebbe finalmente raggiungere prestazioni migliori. L'iPad più economico di Apple potrebbe finalmente raggiungere prestazioni migliori. Il prossimo iPad economico di Apple di nuova generazione potrebbe ricevere un importante aggiornamento delle prestazioni con il chip A18, portando velocità più elevate e funzionalità di intelligenza artificiale. L'IA amplifica tutto ciò che le fornisci, compresa la confusione. L'IA amplifica tutto ciò che le fornisci, compresa la confusione. L'IA sta fallendo non a causa della tecnologia, ma perché le organizzazioni non riescono a separare il segnale dal rumore, lasciando i dati poco chiari, le decisioni deboli e il ROI sfuggente. L'IA amplifica tutto ciò che le fornisci, compresa la confusione. L'IA amplifica tutto ciò che le fornisci, compresa la confusione. L'IA sta fallendo non a causa della tecnologia, ma perché le organizzazioni non riescono a separare il segnale dal rumore, lasciando i dati poco chiari, le decisioni deboli e il ROI sfuggente. La tua Apple TV può ora raccomandare programmi e film in base alle tue abitudini di visione. La tua Apple TV può ora raccomandare programmi e film in base alle tue abitudini di visione. La tvOS 26.4 di Apple arriva con quattro cambiamenti significativi per la tua esperienza con Apple TV, inclusi un browser di contenuti personalizzato, una correzione audio Dolby che gli audiofili apprezzeranno e un addio a iTunes.

Risulta che, se chiedi a un'IA di comportarsi da esperto, diventa meno affidabile.

Dire a un'IA di "comportarsi come un esperto" sembra un'ottima idea, ma un nuovo studio suggerisce che potrebbe effettivamente danneggiare la sua accuratezza.