Comparé la generación de imágenes de ChatGPT con Nano Banana y solo uno de los dos produjo fotos de archivo útiles.
Un pasatiempo personal mío es hacerle la misma pregunta a dos chatbots diferentes y ver cuál da la mejor respuesta. Como un profesor interrogando a sus estudiantes (algo que a veces hago en la vida real como voluntario), evalúo si el bot está alucinando e inventando hechos o si ofrece una respuesta inteligente y coherente que sea realmente útil.
“Inteligencia” y “coherencia” no son las palabras que usaría para describir lo que los chatbots suelen generar cuando se trata de imágenes. Conocidas como "AI slop", estas extrañas mezclas —a menudo con un fondo desenfocado, un humano perfecto con el pelo arreglado y quizá unos cuantos pulgares de más— están por todas partes en las redes sociales e incluso aparecen como imagen principal en artículos como este.
Las imágenes de stock ya tienen mala reputación. Este vídeo con Emilia Clarke sigue siendo una de mis parodias de fotos de stock favoritas de todos los tiempos y me hace reír aunque salió mucho antes del AI slop:
Los tiempos han cambiado. OpenAI actualizó recientemente el modelo de generación de imágenes de ChatGPT para competir con Google Gemini y Nano Banana Pro.
Sorprendentemente, las imágenes ya no usan ese desenfoque distintivo y, en mis pruebas, a menudo parecen mucho más realistas que antes.
Decidí usar exactamente las mismas indicaciones con ambos chatbots y ver cuál producía los resultados más útiles. Me refiero a: una imagen que podrías usar en una campaña publicitaria o junto a un artículo, algo que publicarías en redes sociales para acompañar un texto ingenioso.
ChatGPT me impresionó por su rapidez: ninguna de las imágenes de stock parecía basura generada por ordenador. Sin embargo, Nano Banana Pro tiene la ventaja porque sistemáticamente generó imágenes más realistas en mis pruebas. Aquí tienes las indicaciones que usé y las imágenes que generaron ambos bots para que juzgues por ti mismo. (Las imágenes de Nano Banana están a la izquierda.)
1. Persona escuchando un podcast
Imagen de podcast generada por IA. Gemini / Nano Banana está a la izquierda John Brandon / Digital Trends
Prompt usado: Haz una imagen de stock de alguien escuchando un podcast en una oficina moderna
Le pedí a ambos bots que hicieran una imagen de alguien escuchando un podcast en una oficina. Nano Banana fue el claro ganador aquí, aunque la imagen de Nano Banana tiene un ligero desenfoque en el fondo que podría ser una señal evidente. Aun así, la IA está aprendiendo a evitar la perfección absoluta. Honestamente, me costaría trabajo saber que la mujer en el entorno de oficina en la foto de Nano Banana no es real. Su pelo está un poco despeinado (como el de alguien en la vida real). En la foto de ChatGPT, la persona que escucha el podcast no parece del todo correcta: la foto es un poco demasiado perfecta.
2. Crear una imagen promocional para mi libro
Imagen generada por IA de alguien leyendo un libro. Gemini / Nano Banana está a la izquierda John Brandon / Digital Trends
Prompt usado: Pon la portada de este libro en manos de alguien que esté realmente interesado en leerlo
Para esta prueba, subí la portada de mi propio libro y pedí a los bots que hicieran una imagen de alguien leyéndolo. Nano Banana se pasó un poco, ya que la imagen muestra a alguien con demasiado entusiasmo. Aun así, la imagen de ChatGPT todavía tiene una cualidad de otro mundo (y lo digo en mal sentido) que no parece real. Todo en la imagen de ChatGPT es demasiado perfecto: la iluminación, la pose, etc., y aún grita “generada por ordenador”.
3. Crear una imagen de stock para usar con un artículo
Imagen generada por IA ilustrando la generación de imágenes por IA. Gemini / Nano Banana está a la izquierda John Brandon / Digital Trends
Prompt usado: Crea una imagen de stock para acompañar un artículo sobre la generación de imágenes por IA
Nano Banana no ganó todas las batallas esta vez. Le pedí a ambos bots que crearan una imagen para acompañar este artículo. ChatGPT produjo una imagen algo útil que aún parece un poco falsa, pero Nano Banana Pro rompió la cuarta pared con una imagen generada por ordenador que superpone un cerebro y un pincel sobre un iPad de Apple. En otras palabras: no es nada útil.
4. Luchas de liderazgo
Luchas de liderazgo. Gemini / Nano Banana está a la izquierda John Brandon / Digital Trends
Prompt usado: Muestra a alguien luchando por alcanzar una meta de liderazgo, pero haz que parezca realmente realista
Una de las fotos de stock más comunes muestra a alguien luchando por alcanzar una meta —por ejemplo, escalando una montaña, levantando los brazos hacia el cielo o saltando un abismo. La razón por la que esta imagen de stock es tan popular es porque las fotos son identificables: todos luchamos por tener éxito. Diría que tanto Nano Banana Pro como ChatGPT produjeron resultados mediocres. Las imágenes de stock que hicieron muestran a alguien frustrado en una oficina con papeles arrugados. Aun así, Nano Banana tiene un aspecto algo más realista.
5. Emilia Clarke sonriendo a la cámara
Imagen de stock de Emilia Clarke generada por IA. Gemini / Nano Banana está a la izquierda John Brandon / Digital Trends
Prompt usado: Crea una nueva imagen de stock que muestre a Emilia Clarke sonriendo a la cámara en una oficina
Para una prueba final, pedí a ambos bots que crearan una nueva imagen de Emilia Clarke sonriendo a la cámara en una oficina. Me sorprendió que ChatGPT se negara a hacer la imagen, diciendo que Clarke es una “persona real identificable”, mientras que Nano Banana estuvo encantado de complacer. Con un poco de insistencia, pedí a ChatGPT que generara a alguien que se pareciera a Clarke. La imagen de Nano Banana en realidad no está tan mal: no parece completamente falsa.
Reflexiones finales
La generación de imágenes por IA ha avanzado mucho. Ninguna de las fotos producidas por Nano Banana Pro o ChatGPT mostró a alguien con seis dedos o tres brazos. Todas parecían semi-realistas. Algunas de las imágenes de Nano Banana eran lo suficientemente realistas como para que pudiera ver usándolas en redes sociales u otros fines, y ChatGPT definitivamente está mejorando. ¿Mi predicción? Para dentro de un año, no podremos distinguir entre una foto real y una falsa.
Otros artículos
Comparé la generación de imágenes de ChatGPT con Nano Banana y solo uno de los dos produjo fotos de archivo útiles.
Las imágenes de stock ya parecen falsas. ¿Pero pueden Nano Banana Pro y ChatGPT crear imágenes más realistas y útiles?
