Lo que sorprende al mercado nuevo chino DeepSeek R2

      La Startup China DeepSeek se está preparando una vez más para sorprender al mercado de la inteligencia artificial. Esta vez estamos hablando del modelo R2, cuya información ya ha provocado una ola de discusiones debido a los impresionantes avances tecnológicos en tres direcciones a la vez.

       En la red

       se filtraron las características del nuevo modelo deepseek R2, capaz, según estimaciones preliminares, de eludir a los líderes de la industria. DeepSeek es una Startup China líder en IA. La compañía fue creada en 2023 con el objetivo de "explorar la esencia de la inteligencia artificial general". IT-World ha estudiado lo que se espera "bajo el capó" del nuevo lanzamiento.



       La primera y quizás la principal ventaja del nuevo desarrollo es su revolucionaria arquitectura Hybrid MoE 3.0. DeepSeek puede administrar 1,2 billones de parámetros con una carga real de solo 78 mil millones. Gracias a esta optimización, el costo de procesamiento de datos (tokens) se ha reducido en un impresionante 97,3% en comparación con el GPT-4 Turbo de OpenAI. En el contexto de tales cifras, incluso los líderes del mercado comienzan a parecer un poco anticuados.

       La segunda dirección clave fue lograr una alta eficiencia informática en equipos domésticos. Deepseek R2 mostró el 82% de la utilización de la capacidad del grupo de chips Huawei Ascend 910b, produciendo 512 PetaFLOPS de rendimiento. Esto es equivalente al 91% de la potencia de los famosos chips NVIDIA A100, pero ya en tecnología China. Suena intrigante y un poco desafiante: ¿pueden los líderes occidentales quedarse pronto en el banquillo?

       El tercer avance es en tareas multimodales. Aquí, R2 nuevamente sorprende: la precisión de segmentación de objetos en el conocido DataSet COCO alcanzó el 92,4%, que es casi 12 puntos mejor que el popular modelo CLIP. En el control de producción, la tasa de falsos positivos se redujo a un increíble 7.2 E-6. Y en el diagnóstico médico mediante radiografías de tórax, el nuevo modelo superó a los radiólogos profesionales con una precisión del 98,1%, superando su promedio (96,3%).

       Bajo el capó, DeepSeek R2 es una enorme cantidad de datos de 5.2 petabytes que cubre finanzas, derecho y patentes. En las pruebas C-Eval 2.0, el modelo muestra una precisión de 89.7% en la ejecución de instrucciones. Otra ventaja es la tecnología de cuantización, que reduce el Tamaño del modelo en un 83%, con poca o ninguna pérdida de precisión al pasar a la precisión de 8 bits. Esto hace que R2 sea accesible incluso para dispositivos con capacidades informáticas limitadas, ampliando su aplicación en la industria, la atención médica y el gobierno urbano.

       El proyecto a gran escala, por supuesto, cuenta con el apoyo de grandes socios tecnológicos: Tuowei Information proporciona más de la mitad de la infraestructura de Huawei Ascend, Zhongke Shuguang suministra servidores refrigerados por líquido, Inspur Information es responsable de más de 5, 000 servidores con chips híbridos NVIDIA y Huawei, y Xinyisheng ha desarrollado soluciones de ahorro de energía basadas en Fotónica de silicio.

       Si se confirman los datos oficiales, DeepSeek R2 tiene todas las posibilidades de cambiar el equilibrio de poder en el mercado de la inteligencia artificial, y de manera muy rápida e inesperada para los competidores occidentales. Parece que la carrera de IA acaba de comenzar a entrar en su fase más interesante.

Otros artículos

El audaz salto de Bulgaria: de centro de subcontratación a contendiente emergente de tecnología profunda Una vez vista simplemente como un puesto de subcontratación, Bulgaria se está posicionando para convertirse en una potencia de tecnología profunda en Europa. He aquí cómo.

La tableta asequible para tomar notas móviles de Lenovo acaba de caer por debajo de los $200 La Lenovo Tab K11 LTE está a la venta hoy, por debajo de los $200. Si necesitas conectividad en más lugares, esta es tu tablet. Puede conectarse a su computadora portátil Lenovo y crear archivos PDF a partir de fotografías.

ARX Robotics monta la ola de tecnología de defensa con €31 MILLONES para robots de campo de batalla La startup alemana de tecnología de defensa ARX Robotics ha asegurado €31 millones para aumentar la producción de sus robots autónomos de campo de batalla.

The Last of Us: Bella Ramsey revela la escena más dura de filmar El episodio de anoche de The Last of Us presentó la "escena más difícil de filmar de Bella Ramsey."Averigua qué escena le dio más problemas a Ramsey.

Ya está a la venta la última edición del TELEVISOR Samsung Frame de 75 pulgadas El Samsung Frame 4K QLED de 75 pulgadas está a la venta por $3,200 hoy. Compre en Amazon, B & H Photo-Video y Samsung para aprovechar esta oferta.

Este enorme TELEVISOR Samsung de 98 pulgadas tiene más del 50% de descuento hoy El Samsung DU9000 4K LED de 98 pulgadas está rebajado a Woo 1,850 en Woot hoy, cuando su precio minorista total suele ser de 4 4,000.