Il tuo chatbot preferito potrebbe non dire la verità

Il tuo chatbot preferito potrebbe non dire la verità

      Gli strumenti di ricerca AI stanno diventando sempre più popolari, con un americano su quattro che riferisce di utilizzare l'intelligenza artificiale invece dei tradizionali motori di ricerca. Tuttavia, ecco una nota importante: questi chatbot AI non sempre forniscono informazioni accurate.

      Un recente studio del Tow Center for Digital Journalism, riportato dalla Columbia Journalism Review, indica che i chatbot faticano a recuperare e citare accuratamente i contenuti delle notizie. Ancora più preoccupante è la loro tendenza a inventare informazioni quando non hanno la risposta corretta.

      I chatbot AI testati per il sondaggio includevano molti dei "migliori", tra cui ChatGPT, Perplessità, Perplessità Pro, DeepSeek, Copilot di Microsoft, Grok-2, Grok-3 e Google Gemini.

      Nei test, AI chatbot sono stati dati estratti diretti da 10 articoli online pubblicati da vari punti vendita. Ogni chatbot ha ricevuto 200 query, che rappresentano 10 articoli di 20 diversi editori, per 1.600 query. Ai chatbot è stato chiesto di identificare il titolo di ogni articolo, il suo editore originale, la data di pubblicazione e l'URL.

      Test simili condotti con i motori di ricerca tradizionali hanno fornito con successo le informazioni corrette. Tuttavia, i chatbot AI non hanno funzionato altrettanto bene.

      I risultati hanno indicato che i chatbot spesso lottano per rifiutare le domande a cui non possono rispondere con precisione, fornendo spesso risposte errate o speculative. I chatbot premium tendono a fornire risposte errate con sicurezza più spesso delle loro controparti gratuite. Inoltre, molti chatbot sembrano ignorare le preferenze del Robot Exclusion Protocol (REP), che i siti Web utilizzano per comunicare con i robot Web come i crawler dei motori di ricerca.

      L'indagine ha anche rilevato che gli strumenti di ricerca generativa erano inclini a fabbricare collegamenti e citare versioni di articoli sindacati o copiati. Inoltre, gli accordi di licenza dei contenuti con le fonti di notizie non garantivano citazioni accurate nelle risposte dei chatbot.

      Cosa puoi fare?

      Ciò che spicca di più sui risultati di questo sondaggio non è solo il fatto che i chatbot AI spesso forniscono informazioni errate, ma che lo fanno con sicurezza allarmante. Invece di ammettere di non conoscere la risposta, tendono a rispondere con frasi come “sembra”, “è possibile” o “potrebbe.”

      Ad esempio, ChatGPT ha identificato erroneamente 134 articoli, ma ha segnalato incertezza solo 15 volte su 200 risposte e non si è mai astenuto dal fornire una risposta.

      Sulla base dei risultati del sondaggio, è probabilmente saggio non fare affidamento esclusivamente sui chatbot AI per le risposte. Invece, si consiglia una combinazione di metodi di ricerca tradizionali e strumenti AI. Per lo meno, l'utilizzo di più chatbot AI per trovare una risposta può essere utile. Altrimenti, rischi di ottenere informazioni errate.

      Guardando al futuro, non sarei sorpreso di vedere un consolidamento dei chatbot AI in quanto quelli migliori si distinguono da quelli di scarsa qualità. Alla fine, i loro risultati saranno accurati come quelli dei motori di ricerca tradizionali. Quando questo accadrà è l'ipotesi di chiunque.

Altri articoli

DJI implementa la politica obbligatoria 9 pm fuori servizio per affrontare la cultura eccessiva degli straordinari DJI implementa la politica obbligatoria 9 pm fuori servizio per affrontare la cultura eccessiva degli straordinari Introdotto il Feb.27, il produttore di droni richiede ai dipendenti di lasciare entro le 9 di sera, con le luci dell'ufficio forzatamente spente a Shanghai. In precedenza, DJI ha affrontato critiche per gli straordinari eccessivi, poiché i team di ricerca e sviluppo di base lavoravano spesso oltre le 11 di sera o al mattino presto. Il prossimo aggiornamento di iOS potrebbe costringerti ad aggiornare Apple Home Il prossimo aggiornamento di iOS potrebbe costringerti ad aggiornare Apple Home Il prossimo aggiornamento di iOS potrebbe costringere gli utenti di HomeKit ad aggiornare l'ultima architettura dell'app domestica o perdere il supporto, secondo il codice scoperto nella beta di iOS 18.4. Il GAC cinese venderà veicoli a guida autonoma di livello 3 con Huawei Il GAC cinese venderà veicoli a guida autonoma di livello 3 con Huawei Il lancio della linea Xiangwang è l'ultimo passo di GAC, partner cinese di lunga data di Toyota e Honda, nella navigazione in un panorama competitivo. Il tuo Galaxy Z Fold 6 sta raccogliendo le principali funzionalità di Google Pixel Il tuo Galaxy Z Fold 6 sta raccogliendo le principali funzionalità di Google Pixel Due nuove funzionalità sono in arrivo sul Galaxy Z Fold 6 con l'imminente aggiornamento Samsung One UI 7. Invece di Disco Elysium 2, ZA / UM sta facendo un nuovo gioco di spionaggio Invece di Disco Elysium 2, ZA / UM sta facendo un nuovo gioco di spionaggio Il prossimo gioco di ZA/UM non è Disco Elysium 2; è un nuovo gioco di spionaggio chiamato C4. NYT Mini Cruciverba oggi: risposte puzzle per martedì 11 marzo NYT Mini Cruciverba oggi: risposte puzzle per martedì 11 marzo Il NYT Mini cruciverba potrebbe essere molto più piccolo di un normale cruciverba, ma non è facile. Se sei bloccato con il cruciverba di oggi, abbiamo le risposte per te.

Il tuo chatbot preferito potrebbe non dire la verità

I chatbot AI non sono così intelligenti come ci si potrebbe aspettare. In effetti, a volte non sanno nulla e forniscono risposte errate.