ChatGPT Imágenes 2.0 ya está aquí, y es mucho más que una actualización.
Mejor texto, razonamiento y resultados del mundo real.
OpenAI
OpenAI regresa con otra actualización a las capacidades de imagen de ChatGPT, y esta se siente menos como un truco y más como un paso serio hacia hacer que los visuales de IA sean realmente útiles. OpenAI ha presentado oficialmente ChatGPT Images 2.0, un nuevo sistema de generación de imágenes que se enfoca en el razonamiento y la precisión.
ChatGPT Images 2.0 se centra en entender, no solo en generar
En lugar de convertir ciegamente los mensajes en visuales, el modelo ahora adopta un enfoque más deliberado, esencialmente "pensando" en lo que estás pidiendo antes de generar la imagen.
OpenAI
Ese cambio se refleja en algunas formas clave. El modelo es mucho mejor para manejar mensajes complejos, puede mantener la consistencia en múltiples resultados y es notablemente más confiable cuando se trata de colocar texto dentro de las imágenes, algo con lo que las herramientas de IA anteriores lucharon notoriamente.
OpenAI
Además, también puede generar múltiples variaciones a partir de un solo mensaje mientras mantiene la idea central intacta, lo que lo hace mucho más útil para el trabajo iterativo. El resultado es un sistema que se siente menos como un generador de arte de IA y más como una herramienta que realmente entiende lo que estás tratando de crear.
Aquí es donde las imágenes de IA comienzan a volverse prácticas
Lo que hace interesante esta actualización es la dirección que está tomando OpenAI. Esto ya no se trata de perseguir arte viral de IA, sino también de hacer que la generación de imágenes sea utilizable en escenarios del mundo real. Con una mejor representación del texto, mejor estructura y resultados más predecibles, ChatGPT Images 2.0 comienza a tener sentido para cosas como presentaciones, creativos en redes sociales o maquetas de diseño rápidas. Aún no es un reemplazo completo para herramientas profesionales, pero se está acercando lo suficiente como para manejar una sorprendente cantidad de trabajo creativo cotidiano.
Dicho esto, no es perfecto. Aún hay inconsistencias ocasionales, especialmente con diseños más complejos o texto en idiomas que no son inglés. Pero comparado con dónde estaban las cosas hace incluso un año, el progreso es difícil de ignorar. Y si esta tendencia continúa, la línea entre "visual generado por IA" y "visual realmente utilizable" se volverá muy delgada muy rápidamente. ChatGPT Images 2.0 está disponible a partir de hoy para todos los usuarios de ChatGPT y Codex, con resultados avanzados utilizando Thinking disponibles para usuarios Plus, Pro, Business y Enterprise. El modelo subyacente, gpt-image-2, también está disponible en la API.
Varun es un periodista y editor de tecnología experimentado con más de ocho años en medios de tecnología de consumo. Su trabajo abarca…
Los robots acaban de correr la media maratón de Pekín más rápido que el poseedor del récord mundial
Un robot humanoide acaba de correr una media maratón más rápido que el poseedor del récord mundial. Puede que no parezca impresionante al principio, pero considerando que el año pasado, el robot más rápido en la media maratón de humanoides de Pekín terminó en dos horas y 40 minutos, este es un gran logro. Según informó la Associated Press, el robot ganador de la media maratón de Pekín de este año cruzó la línea de meta en 50 minutos y 26 segundos, superando cómodamente el récord mundial humano de 57 minutos establecido recientemente por Jacob Kiplimo.
Leer más
Como si el plato no estuviera ya lleno, la IA está a punto de empeorar la crisis global de residuos electrónicos
Un nuevo informe destaca una creciente preocupación ambiental
La IA ya está cambiando cómo funciona el mundo, pero también está empeorando silenciosamente uno de nuestros mayores problemas ambientales. Y no, esta vez no se trata del consumo de energía. Se trata del hardware. Porque cada modelo de IA más inteligente viene con un costo físico. La IA está a punto de potenciar el problema de los residuos electrónicos.
Leer más
Las gafas inteligentes están encontrando un nicho sorpresa: dramas y espectáculos de teatro coreanos
Cada año, millones de personas siguen contenido coreano sin hablar una palabra del idioma. Transmiten programas con subtítulos, leen letras traducidas y encuentran soluciones alternativas. Pero el teatro en vivo siempre ha sido un problema diferente: no puedes pausar o rebobinar. Ese es el problema: una startup coreana cree que lo ha resuelto, y Yuroy Wang fue uno de los primeros en probarlo. El trabajador minorista de 22 años de Taipei es un fanático del K-pop que ama la cultura coreana pero no habla el idioma. Cuando fue a ver "La tienda de conveniencia de segunda oportunidad", una obra de teatro itinerante basada en una novela coreana que fue un bestseller en Taiwán, esperaba supertítulos. Lo que recibió en su lugar fue un par de gafas de marco negro y grueso impulsadas por IA sentadas en su nariz, traduciendo el diálogo en tiempo real directamente en las lentes. "Tan pronto como supe que estaban disponibles, no podía esperar para probarlas", dijo. Wang es parte de una audiencia creciente que descubre que las gafas inteligentes, una categoría de tecnología que ha luchado por encontrar un propósito en el mercado durante años, podrían haber encontrado su vocación en el lugar más inesperado: el teatro coreano en vivo.
¿Cómo funcionan las gafas?
Leer más
Otros artículos
ChatGPT Imágenes 2.0 ya está aquí, y es mucho más que una actualización.
ChatGPT Imágenes 2.0 ofrece una generación de imágenes más inteligente y precisa, con un mejor manejo del texto y consistencia, acercando los visuales de IA a la usabilidad en el mundo real.
