Ho confrontato la generazione di immagini di ChatGPT con quella di Nano Banana e solo una delle due ha prodotto foto di stock utili.
Un mio hobby personale è porre la stessa domanda a due chatbot differenti e vedere quale dei due fornisce la risposta migliore. Come un professore che interroga gli studenti (cosa che a volte faccio nella vita reale come volontario), valuto se il bot sta allucinando e inventando fatti o se fornisce una risposta intelligente e coerente che sia davvero utile.
“Intelligenza” e “coerenza” non sono le parole che userei per descrivere ciò che i chatbot hanno solitamente generato quando si tratta di immagini. Conosciuti come i pasticci dell’IA, questi strani congegni — spesso con uno sfondo sfocato, un essere umano perfetto con capelli impeccabilmente acconciati e magari qualche pollice in più — sono ovunque sui social media e appaiono persino come immagine principale in articoli come questo.
Le immagini stock hanno già una cattiva reputazione. Questo video con Emilia Clarke è ancora una delle mie parodie di foto di repertorio preferite di sempre e mi fa ridere anche se è uscito molto prima dei pasticci dell’IA:
I tempi sono cambiati. OpenAI ha recentemente aggiornato il modello di generazione di immagini di ChatGPT per competere con Google Gemini e Nano Banana Pro.
Sorprendentemente, le immagini non usano più quella sfocatura distintiva e, nei miei test, spesso appaiono molto più realistiche di prima.
Ho deciso di usare esattamente gli stessi prompt con entrambi i chatbot per vedere quale producesse i risultati più utili. Parlo di: un’immagine che potresti usare in una campagna pubblicitaria o con un articolo, qualcosa che posteresti sui social media per accompagnare una didascalia spiritosa.
ChatGPT mi ha impressionato per la velocità — nessuna delle immagini stock sembrava spazzatura generata dal computer. Tuttavia, Nano Banana Pro ha il sopravvento perché nei miei test ha costantemente generato immagini più realistiche. Ecco i prompt che ho usato e le immagini che entrambi i bot hanno generato così puoi giudicare tu stesso. (Le immagini di Nano Banana sono a sinistra.)
1. Persona che ascolta un podcast
Immagine di podcast generata dall'IA. Gemini / Nano Banana è a sinistra John Brandon / Digital Trends
Prompt usato: Crea un'immagine stock di qualcuno che ascolta un podcast in un ufficio alla moda
Ho chiesto a entrambi i bot di creare un’immagine di qualcuno che ascolta un podcast in un ufficio. Nano Banana è stato il chiaro vincitore qui, anche se l’immagine di Nano Banana ha una leggera sfocatura nello sfondo che potrebbe tradirla. Eppure, l’IA sta imparando a evitare la perfezione assoluta. Onestamente, avrei difficoltà a capire che la donna in un ambiente d’ufficio nella foto di Nano Banana non fosse reale. I suoi capelli sono leggermente disordinati (come quelli di una persona reale). Nello scatto di ChatGPT, l’ascoltatrice del podcast non sembra del tutto a posto — la foto è un po’ troppo perfetta.
2. Crea un’immagine promozionale per il mio libro
Immagine generata dall'IA di qualcuno che legge un libro. Gemini / Nano Banana è a sinistra John Brandon / Digital Trends
Prompt usato: Metti questa copertina nelle mani di qualcuno che è davvero interessato a leggerla
Per questo test ho caricato la copertina del mio libro e ho chiesto ai bot di creare un’immagine di qualcuno che lo stesse leggendo. Nano Banana è andato un po’ oltre il necessario, perché l’immagine mostra qualcuno con un entusiasmo eccessivo. Tuttavia, l’immagine di ChatGPT mantiene ancora una qualità ultraterrena (e lo dico in senso negativo) che non sembra reale. Tutto dell’immagine di ChatGPT è troppo perfetto — l’illuminazione, la posa, ecc. — e grida ancora CGI.
3. Crea un’immagine stock da usare con un articolo
Immagine generata dall'IA che illustra la generazione di immagini da parte dell'IA. Gemini / Nano Banana è a sinistra John Brandon / Digital Trends
Prompt usato: Crea un’immagine stock da accompagnare un articolo sulla generazione di immagini da parte dell'IA
Nano Banana non ha vinto tutte le battaglie questa volta. Ho chiesto a entrambi i bot di creare un’immagine da affiancare a questo articolo. ChatGPT ha prodotto un’immagine abbastanza utile che però è ancora un po’ troppo finta, mentre Nano Banana Pro ha infranto la quarta parete con un’immagine generata al computer che sovrappone un cervello e un pennello su un iPad Apple. In altre parole — non è affatto utile.
4. Difficoltà di leadership
Difficoltà di leadership. Gemini / Nano Banana è a sinistra John Brandon / Digital Trends
Prompt usato: Mostra qualcuno che lotta per raggiungere un obiettivo di leadership, ma falla sembrare davvero realistica
Una delle foto stock più comuni mostra qualcuno che lotta per raggiungere un obiettivo — per esempio, scalare una montagna, alzare le braccia verso il cielo o saltare un crepaccio. Il motivo per cui questa immagine stock è così popolare è perché le foto sono riconoscibili — tutti noi lottiamo per avere successo. Direi che sia Nano Banana Pro sia ChatGPT hanno prodotto risultati sotto la media. Le immagini stock che hanno creato mostrano qualcuno frustrato in un ufficio con fogli accartocciati. Tuttavia, Nano Banana ha un aspetto leggermente più realistico.
5. Emilia Clarke che sorride alla fotocamera
Immagine stock generata dall'IA di Emilia Clarke. Gemini / Nano Banana è a sinistra John Brandon / Digital Trends
Prompt usato: Crea una nuova immagine stock che mostri Emilia Clarke mentre sorride alla fotocamera in un ufficio
Per un ultimo test ho chiesto a entrambi i bot di creare una nuova immagine di Emilia Clarke che sorride alla fotocamera in un ufficio. Sono rimasto sorpreso che ChatGPT si sia rifiutato di creare l’immagine, dicendo che Clarke è una “persona reale, identificabile”, mentre Nano Banana è stato felice di accontentarmi. Con qualche spinta, ho chiesto a ChatGPT di generare qualcuno che assomigliasse a Clarke. L’immagine di Nano Banana non è poi così male — non sembra completamente finta.
Considerazioni finali
La generazione di immagini da parte dell’IA ha fatto molta strada. Nessuna delle foto prodotte da Nano Banana Pro o ChatGPT mostrava qualcuno con sei dita o tre braccia. Sembravano tutte semi-realistiche. Alcune delle immagini di Nano Banana erano abbastanza realistiche da poterle vedere usate sui social media o per altri scopi, e ChatGPT sta decisamente migliorando. La mia previsione? Entro questa data il prossimo anno, non saremo più in grado di distinguere tra una foto reale e una falsa.
Altri articoli
Ho confrontato la generazione di immagini di ChatGPT con quella di Nano Banana e solo una delle due ha prodotto foto di stock utili.
Le immagini stock sembrano già finte. Ma Nano Banana Pro e ChatGPT possono creare immagini più realistiche e utili?
