
Lo que sorprende al mercado nuevo chino DeepSeek R2
La Startup China DeepSeek se está preparando una vez más para sorprender al mercado de la inteligencia artificial. Esta vez estamos hablando del modelo R2, cuya información ya ha provocado una ola de discusiones debido a los impresionantes avances tecnológicos en tres direcciones a la vez.
En la red
se filtraron las características del nuevo modelo deepseek R2, capaz, según estimaciones preliminares, de eludir a los líderes de la industria. DeepSeek es una Startup China líder en IA. La compañía fue creada en 2023 con el objetivo de "explorar la esencia de la inteligencia artificial general". IT-World ha estudiado lo que se espera "bajo el capó" del nuevo lanzamiento.
La primera y quizás la principal ventaja del nuevo desarrollo es su revolucionaria arquitectura Hybrid MoE 3.0. DeepSeek puede administrar 1,2 billones de parámetros con una carga real de solo 78 mil millones. Gracias a esta optimización, el costo de procesamiento de datos (tokens) se ha reducido en un impresionante 97,3% en comparación con el GPT-4 Turbo de OpenAI. En el contexto de tales cifras, incluso los líderes del mercado comienzan a parecer un poco anticuados.
La segunda dirección clave fue lograr una alta eficiencia informática en equipos domésticos. Deepseek R2 mostró el 82% de la utilización de la capacidad del grupo de chips Huawei Ascend 910b, produciendo 512 PetaFLOPS de rendimiento. Esto es equivalente al 91% de la potencia de los famosos chips NVIDIA A100, pero ya en tecnología China. Suena intrigante y un poco desafiante: ¿pueden los líderes occidentales quedarse pronto en el banquillo?
El tercer avance es en tareas multimodales. Aquí, R2 nuevamente sorprende: la precisión de segmentación de objetos en el conocido DataSet COCO alcanzó el 92,4%, que es casi 12 puntos mejor que el popular modelo CLIP. En el control de producción, la tasa de falsos positivos se redujo a un increíble 7.2 E-6. Y en el diagnóstico médico mediante radiografías de tórax, el nuevo modelo superó a los radiólogos profesionales con una precisión del 98,1%, superando su promedio (96,3%).
Bajo el capó, DeepSeek R2 es una enorme cantidad de datos de 5.2 petabytes que cubre finanzas, derecho y patentes. En las pruebas C-Eval 2.0, el modelo muestra una precisión de 89.7% en la ejecución de instrucciones. Otra ventaja es la tecnología de cuantización, que reduce el Tamaño del modelo en un 83%, con poca o ninguna pérdida de precisión al pasar a la precisión de 8 bits. Esto hace que R2 sea accesible incluso para dispositivos con capacidades informáticas limitadas, ampliando su aplicación en la industria, la atención médica y el gobierno urbano.
El proyecto a gran escala, por supuesto, cuenta con el apoyo de grandes socios tecnológicos: Tuowei Information proporciona más de la mitad de la infraestructura de Huawei Ascend, Zhongke Shuguang suministra servidores refrigerados por líquido, Inspur Information es responsable de más de 5, 000 servidores con chips híbridos NVIDIA y Huawei, y Xinyisheng ha desarrollado soluciones de ahorro de energía basadas en Fotónica de silicio.
Si se confirman los datos oficiales, DeepSeek R2 tiene todas las posibilidades de cambiar el equilibrio de poder en el mercado de la inteligencia artificial, y de manera muy rápida e inesperada para los competidores occidentales. Parece que la carrera de IA acaba de comenzar a entrar en su fase más interesante.

Otros artículos






Lo que sorprende al mercado nuevo chino DeepSeek R2
La Startup China DeepSeek se está preparando una vez más para sorprender al mercado de la inteligencia artificial. Esta vez estamos hablando del modelo R2, cuya información ya ha provocado una ola de discusiones debido a los impresionantes avances tecnológicos en tres direcciones a la vez.