ChatGPT Immagini 2.0 è qui, ed è molto più di un aggiornamento
Testo migliore, ragionamento e risultati nel mondo reale.
OpenAI è tornata con un altro aggiornamento delle capacità visive di ChatGPT, e questo sembra meno un trucco e più un passo serio verso la creazione di immagini AI realmente utili. OpenAI ha ufficialmente introdotto ChatGPT Images 2.0, un nuovo sistema di generazione di immagini che si basa fortemente sul ragionamento e sull'accuratezza.
ChatGPT Images 2.0 si concentra sulla comprensione, non solo sulla generazione
Invece di trasformare ciecamente i prompt in immagini, il modello ora adotta un approccio più deliberato, essenzialmente "pensando" a ciò che stai chiedendo prima di generare l'immagine.
Questo cambiamento si manifesta in alcuni modi chiave. Il modello è molto migliore nella gestione di prompt complessi, può mantenere coerenza tra più output ed è notevolmente più affidabile quando si tratta di posizionare il testo all'interno delle immagini, un aspetto con cui i precedenti strumenti AI hanno lottato.
Inoltre, può anche generare più variazioni da un singolo prompt mantenendo intatta l'idea centrale, il che lo rende molto più utile per il lavoro iterativo. Il risultato è un sistema che sembra meno un generatore d'arte AI e più uno strumento che comprende realmente ciò che stai cercando di creare.
È qui che le immagini AI iniziano a diventare pratiche
Ciò che rende interessante questo aggiornamento è la direzione che sta prendendo OpenAI. Non si tratta più di inseguire l'arte AI virale, ma anche di rendere la generazione di immagini utilizzabile in scenari del mondo reale. Con un rendering del testo migliorato, una struttura migliore e output più prevedibili, ChatGPT Images 2.0 inizia a avere senso per cose come presentazioni, creativi sui social media o mockup di design rapidi. Non è ancora un sostituto completo degli strumenti professionali, ma si sta avvicinando abbastanza da gestire una sorprendente quantità di lavoro creativo quotidiano.
Detto ciò, non è perfetto. Ci sono ancora occasionali incoerenze, specialmente con layout più complessi o testo non in inglese. Ma rispetto a dove eravamo anche solo un anno fa, i progressi sono difficili da ignorare. E se questa tendenza continua, la linea tra "visivi generati da AI" e "visivi realmente utilizzabili" diventerà molto sottile molto rapidamente. ChatGPT Images 2.0 è disponibile da oggi per tutti gli utenti di ChatGPT e Codex, con output avanzati utilizzando il Pensiero disponibili per gli utenti Plus, Pro, Business ed Enterprise. Il modello sottostante, gpt-image-2, è anche disponibile nell'API.
Varun è un giornalista e redattore tecnologico esperto con oltre otto anni nel media tecnologico per i consumatori. Il suo lavoro spazia...
I robot hanno appena corso la mezza maratona di Pechino più velocemente del detentore del record mondiale
Un robot umanoide ha appena corso una mezza maratona più velocemente del detentore del record mondiale. Potrebbe non sembrare impressionante a prima vista, ma considerando che l'anno scorso, il robot più veloce alla mezza maratona di robot umanoidi di Pechino ha terminato in due ore e 40 minuti, questo è un grande traguardo. Come riportato dall'Associated Press, il robot vincitore della mezza maratona di Pechino di quest'anno ha attraversato il traguardo in 50 minuti e 26 secondi, battendo comodamente il record mondiale umano di 57 minuti recentemente stabilito da Jacob Kiplimo.
Leggi di più
Come se il piatto non fosse già pieno, l'AI sta per peggiorare la crisi globale dei rifiuti elettronici
Un nuovo rapporto evidenzia una crescente preoccupazione ambientale
L'AI sta già cambiando il modo in cui funziona il mondo, ma sta anche silenziosamente aggravando uno dei nostri più grandi problemi ambientali. E no, questa volta non si tratta di consumo energetico. Si tratta dell'hardware. Perché ogni modello AI più intelligente comporta un costo fisico. L'AI sta per supercaricare il problema dei rifiuti elettronici
Leggi di più
Gli occhiali intelligenti stanno trovando una nicchia sorprendente — drama coreano e spettacoli teatrali
Ogni anno, milioni di persone seguono contenuti coreani senza parlare una parola della lingua. Guardano spettacoli con sottotitoli, leggono testi tradotti e trovano soluzioni alternative. Ma il teatro dal vivo è sempre stato un problema diverso: non puoi mettere in pausa o riavvolgere. Questo è il problema: una startup coreana pensa di averlo risolto, e Yuroy Wang è stato uno dei primi a provarlo. Il ventiduenne lavoratore al dettaglio di Taipei è un fan del K-pop che ama la cultura coreana ma non parla la lingua. Quando è andato a vedere "Il negozio di convenienza della seconda possibilità", un'opera in tournée basata su un romanzo coreano che è stato un bestseller a Taiwan, si aspettava sottotitoli. Ciò che ha ottenuto invece è stato un paio di occhiali neri spessi alimentati da AI seduti sul suo naso, traducendo il dialogo in tempo reale direttamente sulle lenti. "Non appena ho scoperto che erano disponibili, non vedevo l'ora di provarli," ha detto. Wang fa parte di un pubblico in crescita che scopre che gli occhiali intelligenti, una categoria di tecnologia che ha faticato a trovare uno scopo mainstream per anni, potrebbero aver appena trovato la loro vocazione nei luoghi più inaspettati: il teatro coreano dal vivo. Come funzionano gli occhiali?
Leggi di più
Altri articoli
ChatGPT Immagini 2.0 è qui, ed è molto più di un aggiornamento
ChatGPT Immagini 2.0 offre una generazione di immagini più intelligente e precisa, con una migliore gestione del testo e coerenza, avvicinando i visual AI a una fruibilità nel mondo reale.
