Я сравнил генерацию изображений ChatGPT с Nano Banana, и только один из них создал полезные стоковые фотографии.
Моё личное хобби — задавать один и тот же вопрос двум разным чат-ботам и смотреть, кто даст лучший ответ. Как профессор, допрашивающий студентов (что я иногда делаю в реальной жизни добровольно), я оцениваю, сочиняет ли бот выдумки и факты или даёт умный и последовательный ответ, который действительно полезен.
«Интеллект» и «последовательность» — не те слова, которые я бы использовал, описывая то, что обычно генерировали чат-боты, когда речь шла об изображениях. Известные как AI slop, эти странные выдумки — часто с размытым фоном, идеальным человеком с уложенными волосами и, возможно, парой лишних больших пальцев — повсюду в социальных сетях и даже появляются в качестве иллюстративного изображения в таких статьях, как эта.
У стоковых фотографий уже плохая репутация. Это видео с Эмилией Кларк до сих пор одна из моих любимых пародий на стоковые фото и заставляет меня смеяться, даже несмотря на то, что оно появилось задолго до AI slop.
Времена изменились. OpenAI недавно обновила модель генерации изображений ChatGPT, чтобы конкурировать с Google Gemini и Nano Banana Pro.
Удивительно, но изображения больше не используют ту характерную размытость и, по моим тестам, часто выглядят гораздо реалистичнее, чем раньше.
Я решил использовать точно такие же подсказки в обоих чат-ботах и посмотреть, кто даст более полезные результаты. Я имею в виду: изображение, которое можно было бы использовать в рекламной кампании или для статьи, то, что можно было бы разместить в соцсетях в сопровождении остроумной подписи.
ChatGPT впечатлил меня своей скоростью — ни одно из стоковых изображений не выглядело как компьютерный мусор. Однако у Nano Banana Pro есть преимущество, потому что в моих тестах он последовательно генерировал более реалистичные изображения. Вот подсказки, которые я использовал, и изображения, которые сгенерировали оба бота, чтобы вы могли судить сами. (Изображения Nano Banana слева.)
1. Человек, слушающий подкаст
AI-сгенерированное изображение подкаста. Gemini / Nano Banana слева John Brandon / Digital Trends
Используемый запрос: Сделать стоковое изображение человека, слушающего подкаст в модном офисе
Я попросил оба бота сделать изображение человека, слушающего подкаст в офисе. Nano Banana здесь явно победил, хотя на изображении Nano Banana фон слегка размытый, что может выдать его. Тем не менее ИИ учится избегать абсолютного совершенства. Честно говоря, мне было бы трудно понять, что женщина на снимке Nano Banana в офисной обстановке не настоящая. Её волосы слегка растрёпаны (как у реального человека). На снимке ChatGPT слушатель подкаста выглядит не совсем правильно — фото слишком идеальное.
2. Создать промо-изображение для моей книги
AI-сгенерированное изображение человека, читающего книгу. Gemini / Nano Banana слева John Brandon / Digital Trends
Используемый запрос: Поместите эту обложку книги в руки человека, который действительно заинтересован её читать
Для этого теста я загрузил обложку собственной книги и попросил ботов сделать изображение человека, читающего её. Nano Banana немного перестарался, потому что на изображении человек выглядит слишком воодушевлённо. Тем не менее изображение ChatGPT по-прежнему имеет некую инопланетную (и в плохом смысле) качественность, которая не кажется реальной. Всё в изображении ChatGPT слишком идеально — освещение, поза и т. д. — и по-прежнему кричит CGI.
3. Создать стоковое изображение для статьи
AI-сгенерированное изображение, иллюстрирующее генерацию изображений ИИ. Gemini / Nano Banana слева John Brandon / Digital Trends
Используемый запрос: Создать стоковое изображение для статьи о генерации изображений ИИ
На этот раз Nano Banana не выиграл в каждой битве. Я попросил оба бота создать изображение для этой статьи. ChatGPT сделал отчасти полезное изображение, которое всё ещё немного фальшивит, но Nano Banana Pro вышел за рамки, создав компьютером-генерированное изображение, на которое наложены мозг и кисть поверх Apple iPad. Иными словами — это вовсе не полезно.
4. Трудности лидерства
Трудности лидерства. Gemini / Nano Banana слева John Brandon / Digital Trends
Используемый запрос: Показать человека, которому трудно достигнуть лидерской цели, но сделать это выглядящим очень реалистично
Одна из самых распространённых стоковых фотографий показывает человека, который борется за достижение цели — например, поднимается на гору, поднимает руки к небу или прыгает через ущелье. Причина популярности таких снимков в том, что они вызывают отклик — мы все боремся, чтобы преуспеть. Я бы сказал, что и Nano Banana Pro, и ChatGPT дали посредственные результаты. Стоковые снимки, которые они сделали, показывают человека, разочарованного в офисе со смятыми листами бумаги. Всё же у Nano Banana вид немного более реалистичный.
5. Эмилия Кларк, улыбающаяся в камеру
AI-сгенерированное стоковое изображение Эмилии Кларк. Gemini / Nano Banana слева John Brandon / Digital Trends
Используемый запрос: Создать новое стоковое изображение Эмилии Кларк, улыбающейся в камеру в офисе
В последнем тесте я попросил оба бота создать новое изображение Эмилии Кларк, улыбающейся в камеру в офисе. Я был удивлён, что ChatGPT отказался создавать изображение, сказав, что Кларк — «реальный, идентифицируемый человек», тогда как Nano Banana с радостью выполнил просьбу. После некоторых уговоров я попросил ChatGPT сгенерировать кого-то, кто похож на Кларк. Изображение Nano Banana на самом деле неплохое — оно не выглядит полностью фальшивым.
Итог
Генерация изображений ИИ прошла долгий путь. Ни одно из фото, созданных Nano Banana Pro или ChatGPT, не показало человека с шестью пальцами или тремя руками. Все они выглядели полуреалистично. Некоторые изображения Nano Banana были достаточно реалистичны, чтобы я мог представить их использование в соцсетях или для других целей, и ChatGPT определённо улучшается. Мой прогноз? К этому времени в следующем году мы не сможем отличить настоящую фотографию от фальшивой.
Другие статьи
Я сравнил генерацию изображений ChatGPT с Nano Banana, и только один из них создал полезные стоковые фотографии.
Стоковые изображения уже выглядят фальшивыми. Но могут ли Nano Banana Pro и ChatGPT создавать более реалистичные и полезные изображения?
