Il tuo chatbot preferito potrebbe non dire la verità

Il tuo chatbot preferito potrebbe non dire la verità

      Gli strumenti di ricerca AI stanno diventando sempre più popolari, con un americano su quattro che riferisce di utilizzare l'intelligenza artificiale invece dei tradizionali motori di ricerca. Tuttavia, ecco una nota importante: questi chatbot AI non sempre forniscono informazioni accurate.

      Un recente studio del Tow Center for Digital Journalism, riportato dalla Columbia Journalism Review, indica che i chatbot faticano a recuperare e citare accuratamente i contenuti delle notizie. Ancora più preoccupante è la loro tendenza a inventare informazioni quando non hanno la risposta corretta.

      I chatbot AI testati per il sondaggio includevano molti dei "migliori", tra cui ChatGPT, Perplessità, Perplessità Pro, DeepSeek, Copilot di Microsoft, Grok-2, Grok-3 e Google Gemini.

      Nei test, AI chatbot sono stati dati estratti diretti da 10 articoli online pubblicati da vari punti vendita. Ogni chatbot ha ricevuto 200 query, che rappresentano 10 articoli di 20 diversi editori, per 1.600 query. Ai chatbot è stato chiesto di identificare il titolo di ogni articolo, il suo editore originale, la data di pubblicazione e l'URL.

      Test simili condotti con i motori di ricerca tradizionali hanno fornito con successo le informazioni corrette. Tuttavia, i chatbot AI non hanno funzionato altrettanto bene.

      I risultati hanno indicato che i chatbot spesso lottano per rifiutare le domande a cui non possono rispondere con precisione, fornendo spesso risposte errate o speculative. I chatbot premium tendono a fornire risposte errate con sicurezza più spesso delle loro controparti gratuite. Inoltre, molti chatbot sembrano ignorare le preferenze del Robot Exclusion Protocol (REP), che i siti Web utilizzano per comunicare con i robot Web come i crawler dei motori di ricerca.

      L'indagine ha anche rilevato che gli strumenti di ricerca generativa erano inclini a fabbricare collegamenti e citare versioni di articoli sindacati o copiati. Inoltre, gli accordi di licenza dei contenuti con le fonti di notizie non garantivano citazioni accurate nelle risposte dei chatbot.

      Cosa puoi fare?

      Ciò che spicca di più sui risultati di questo sondaggio non è solo il fatto che i chatbot AI spesso forniscono informazioni errate, ma che lo fanno con sicurezza allarmante. Invece di ammettere di non conoscere la risposta, tendono a rispondere con frasi come “sembra”, “è possibile” o “potrebbe.”

      Ad esempio, ChatGPT ha identificato erroneamente 134 articoli, ma ha segnalato incertezza solo 15 volte su 200 risposte e non si è mai astenuto dal fornire una risposta.

      Sulla base dei risultati del sondaggio, è probabilmente saggio non fare affidamento esclusivamente sui chatbot AI per le risposte. Invece, si consiglia una combinazione di metodi di ricerca tradizionali e strumenti AI. Per lo meno, l'utilizzo di più chatbot AI per trovare una risposta può essere utile. Altrimenti, rischi di ottenere informazioni errate.

      Guardando al futuro, non sarei sorpreso di vedere un consolidamento dei chatbot AI in quanto quelli migliori si distinguono da quelli di scarsa qualità. Alla fine, i loro risultati saranno accurati come quelli dei motori di ricerca tradizionali. Quando questo accadrà è l'ipotesi di chiunque.

Otros artículos

Con el chipset Apple M4, la MacBook Air 13 es ahora la mejor computadora portátil pequeña de la historia Con el chipset Apple M4, la MacBook Air 13 es ahora la mejor computadora portátil pequeña de la historia El modelo Apple MacBook Air 13 M4 ahora obtiene una puntuación perfecta, como la mejor computadora portátil de 13 pulgadas (o 14 pulgadas) que puede comprar hoy. Y su modelo base es mejor que nunca. DJI implementa una política obligatoria fuera de servicio a las 9 p. m. para abordar la cultura excesiva de horas extras DJI implementa una política obligatoria fuera de servicio a las 9 p. m. para abordar la cultura excesiva de horas extras Presentado el Feb.el 27 de septiembre, el fabricante de drones requiere que los empleados se vayan antes de las 9 p. m., con las luces de la oficina apagadas a la fuerza en Shanghai. Anteriormente, DJI enfrentaba críticas por horas extras excesivas, ya que los equipos centrales de I + D a menudo trabajaban más allá de las 11 p. m.o hasta temprano en la mañana. ¿Qué causó la interrupción X de la que Musk culpa a Ucrania? ¿Qué causó la interrupción X de la que Musk culpa a Ucrania? Elon Musk dijo que las interrupciones en X fueron causadas por un ciberataque en Ucrania. Los expertos culparon a las botnets, pero será difícil encontrar a los culpables. Fluance apunta a los audiófilos conscientes de los costos con dos nuevos altavoces de la serie Reference Fluance apunta a los audiófilos conscientes de los costos con dos nuevos altavoces de la serie Reference Los fabricantes canadienses de equipos de audio Fluance han anunciado sus altavoces de estantería Ri71 y de torre Ri91, ambos altavoces de referencia de alta fidelidad a buen precio pensando en los audiófilos en ciernes. Hilos del NYT de hoy: consejos, espangramas y respuestas para el martes 11 de marzo Hilos del NYT de hoy: consejos, espangramas y respuestas para el martes 11 de marzo Strands es una versión complicada de la clásica búsqueda de palabras de NYT Games. Si estás atascado y no puedes resolver el rompecabezas de hoy, tenemos ayuda y sugerencias para ti aquí. La próxima actualización de iOS podría obligarte a actualizar Apple Home La próxima actualización de iOS podría obligarte a actualizar Apple Home La próxima actualización de iOS podría obligar a los usuarios de HomeKit a actualizar a la última arquitectura de la aplicación Home o perder soporte, según el código descubierto en la versión beta de iOS 18.4.

Il tuo chatbot preferito potrebbe non dire la verità

I chatbot AI non sono così intelligenti come ci si potrebbe aspettare. In effetti, a volte non sanno nulla e forniscono risposte errate.