El generador de imágenes JanusPro7B funciona mejor que OpenAI y Stability AI

El generador de imágenes JanusPro7B funciona mejor que OpenAI y Stability AI

      DeepSeek, una empresa de inteligencia artificial, ha publicado un nuevo conjunto de modelos de inteligencia artificial multimodal que, según los comentarios de los usuarios, superan al DALLE 3 de OpenAI. Los modelos, disponibles para su descarga en la plataforma Hugging Face, pertenecen a una nueva familia denominada JanusPro. JanusPro se distribuye bajo licencia MIT, lo que permite su uso comercial sin restricciones. La empresa describe JanusPro como un "novedoso marco autorregresivo" capaz tanto de analizar como de crear nuevas imágenes. El modelo más grande de la familia, el JanusPro7B, supera a DALLE 3, así como a soluciones como PixArtalpha, Emu3Gen y Stable Diffusion XL de Stability AI, en dos pruebas de evaluación: GenEval y DPGBench. Aunque la mayoría de los modelos JanusPro sólo pueden analizar imágenes de hasta 384 x 384 de resolución, su rendimiento es impresionante dado su tamaño compacto. Esto convierte a JanusPro en un firme candidato a ser uno de los modelos multimodales más versátiles. DeepSeek destaca que la sencillez, alta flexibilidad y eficacia del nuevo modelo igualan o superan el rendimiento de los modelos dedicados. JanusPro7B es una versión mejorada del modelo Janus anterior. Las mejoras incluyen: Procesos de entrenamiento actualizados: el modelo se entrena con 72 millones de imágenes sintéticas de alta calidad equilibradas con datos reales. Mejora de la calidad de los datos: los nuevos enfoques de procesamiento y el mayor volumen de datos contribuyen a obtener resultados más detallados. Aumento del tamaño del modelo: esto garantiza la estabilidad y un alto nivel de generación de imágenes. La nueva generación de modelos DeepSeek puede utilizarse en diseño, publicidad, medios de comunicación y entretenimiento, y la capacidad de generar imágenes de alta calidad es una característica clave del nuevo modelo. Para confirmar esta postura bastaba con mirar las imágenes de los senadores estadounidenses de antepenúltimo siglo. Lea también El mercado ruso de TI en 2024: resultados y perspectivas. IT-World Analytics Una época de retos y oportunidades: así evaluaron los expertos del mercado de TI el pasado año 2024. ¿Qué fue lo más importante del año pasado y qué debe esperar el mercado ruso de TI para el año que viene? IT-World analizó los acontecimientos clave y las tendencias más probables en el mercado nacional de TI.

El generador de imágenes JanusPro7B funciona mejor que OpenAI y Stability AI

Otros artículos

El generador de imágenes JanusPro7B funciona mejor que OpenAI y Stability AI

DeepSeek, una empresa de inteligencia artificial, ha lanzado un nuevo conjunto de modelos de inteligencia artificial multimodal que, según los comentarios de los usuarios, supera a DALLE 3 de OpenAI.