Meituan de China dice que su nuevo modelo de IA fue entrenado en chips nacionales.
LongCat-2.0, un modelo de 1.6 billones de parámetros, es el primero de su tamaño en ser entrenado de extremo a extremo en silicio de producción nacional, dice la compañía, en una respuesta directa a los controles de exportación de EE. UU. La afirmación más sorprendente sobre el nuevo modelo de inteligencia artificial de Meituan no es cuán grande es, aunque lo es, sino en qué se ejecutó. El gigante chino de entrega y servicios lanzó LongCat-2.0 el martes y dijo que era el primer modelo de su escala que se entrenó completamente en chips desarrollados en el país, un hito dirigido directamente a los controles de exportación que Washington ha utilizado para mantener su mejor silicio fuera de manos chinas. Las especificaciones son serias. LongCat-2.0 tiene 1.6 billones de parámetros y una ventana de contexto de un millón de tokens, y Meituan dice que su rendimiento es comparable al Gemini 3.1 Pro de Google, lanzado en febrero. La compañía lo describe como "el primer modelo de un billón de parámetros de la industria en completar el entrenamiento y la inferencia de extremo a extremo en un clúster de computación doméstico de 50,000 chips." El modelo ha sido de código abierto, poniendo los pesos en manos de cualquiera que quiera ejecutarlos o examinarlos. El detalle crucial es la frase "de extremo a extremo". Muchos modelos chinos realizan inferencias en hardware nacional, la tarea relativamente ligera de responder a una consulta una vez que un modelo está entrenado. El preentrenamiento es la parte pesada, el proceso computacionalmente brutal en el que un modelo digiere vastos conjuntos de datos para aprender sus patrones básicos, y es donde los chips más avanzados han sido más importantes. La afirmación de Meituan de que LongCat-2.0 fue tanto preentrenado como servido en silicio nacional es lo que hace que el anuncio sea más que una línea de marketing. Si la afirmación se sostiene, habla directamente a la cuestión estratégica que pesa sobre el sector de IA de China: si puede construir modelos de escala fronteriza sin Nvidia. Washington restringe las exportaciones de los chips más avanzados por razones de seguridad nacional, y Beijing ha respondido invirtiendo recursos en una alternativa nacional, acelerando los esfuerzos para diseñar y fabricar silicio que pueda soportar la carga que el hardware estadounidense estaba llevando. Ese esfuerzo ha producido una serie constante de hitos. China afirmó recientemente la corona de supercomputación sin chips estadounidenses, y un grupo de retadores nacionales ha surgido para disputar el dominio de Nvidia, con la unidad T-Head de Alibaba promoviendo su GPU Zhenwu M890 como un acelerador de producción nacional. LongCat-2.0 es el contraparte de software de ese impulso de hardware, un modelo grande diseñado para demostrar que la pila nacional funciona a gran escala. Meituan es un portador de bandera poco probable para la causa, que es en sí misma parte de la historia. Mejor conocido por la entrega de alimentos que por la IA de frontera, la compañía es uno de varios gigantes de internet chinos que han avanzado agresivamente en el desarrollo de modelos, tratándolo como infraestructura central en lugar de un proyecto secundario. Hacer de código abierto un modelo de 1.6 billones de parámetros también es un movimiento competitivo, sembrando la adopción entre los desarrolladores y señalando confianza en que los chips subyacentes pueden mantenerse al día. Para una compañía que opera una de las mayores operaciones logísticas bajo demanda del mundo, el atractivo de una IA más barata y asegurada a nivel nacional es concreto en lugar de abstracto: la ruta, la previsión de demanda y el servicio al cliente se ejecutan en computación, y un modelo entrenado en silicio de producción nacional aísla esa computación del próximo giro del tornillo de control de exportación. La verificación independiente vendrá de la comunidad de código abierto, que ahora puede ejecutar LongCat-2.0 contra los puntos de referencia que cita Meituan y probar si realmente coincide con un modelo como Gemini 3.1 Pro. La afirmación sobre el hardware de entrenamiento es más difícil de confirmar directamente para los externos, ya que se basa en el relato de Meituan sobre su propia infraestructura, y esa salvedad vale la pena tenerla en mente junto con la confianza de la compañía. Lo que no está en duda es la dirección del viaje. La carrera por la dominación de la IA entre China y los Estados Unidos se ha convertido, en su base, en una carrera por los chips, y cada modelo entrenado sin hardware estadounidense reduce la brecha que los controles de exportación estaban destinados a ampliar. El anuncio de Meituan es un punto de datos más en un concurso que Washington diseñó sus restricciones para ganar, y que Beijing está decidida a demostrar que puede operar en sus propios términos.
Otros artículos
Meituan de China dice que su nuevo modelo de IA fue entrenado en chips nacionales.
El LongCat-2.0 de Meituan, un modelo de 1.6 billones de parámetros, es el primero de su tamaño entrenado de extremo a extremo en un clúster nacional de 50,000 chips, dice China, en medio de las restricciones a las exportaciones de EE. UU.
