Apple detalla los modelos de IA detrás del nuevo Siri
El titular de la conferencia de desarrolladores de Apple fue un Siri renacido. La historia más interesante se encuentra debajo: los modelos de IA que Apple construyó para hacer funcionar la cosa, uno de los cuales es demasiado grande para caber en la memoria de un iPhone, pero que aún así funciona en el dispositivo.
En una publicación técnica publicada junto con WWDC, Apple detalló la tercera generación de sus Modelos de Fundación de Apple, una familia de cinco modelos que describe como “construidos a medida en colaboración con Google”.
Dos funcionan en el dispositivo: AFM 3 Core, un modelo de 3 mil millones de parámetros para tareas cotidianas, y AFM 3 Core Advanced, su modelo más potente en el dispositivo. Tres más funcionan en la nube: AFM 3 Cloud, un caballo de batalla en servidor; ADM 3 Cloud, un modelo de imagen detrás de Image Playground y Genmoji; y AFM 3 Cloud Pro, el pesado construido para el uso de herramientas agentivas y razonamiento complejo.
La ingeniería inteligente está en Core Advanced.
El 💜 de la tecnología de la UE Las últimas novedades de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y algo de arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Inscríbete ahora! Es un modelo de 20 mil millones de parámetros, nativamente multimodal, del tipo de tamaño que normalmente vive en un centro de datos, no en un teléfono. El truco de Apple es mantener todo el modelo en almacenamiento flash en lugar de en el mucho más pequeño conjunto de memoria de trabajo. Usando una técnica que sus investigadores llaman Poda de Seguimiento de Instrucciones, el modelo toma decisiones de enrutamiento una vez por aviso, cargando solo un pequeño conjunto de parámetros “expertos” en la memoria, entre 1 y 4 mil millones a la vez, mientras mantiene un núcleo de expertos compartidos siempre activo.
Eso permite a Apple escalar el modelo “muy más allá de los límites tradicionales de DRAM”, dice, y potencia las voces más expresivas y la dictación más nítida en el software de este año.
Los modelos en la nube se apoyan en la Computación en Nube Privada de Apple, que la compañía dice que evita que los datos de los usuarios sean almacenados o compartidos con nadie, incluyendo a Apple. Para el modelo Cloud Pro de gama alta, Apple trabajó con Google y Nvidia para extender esa arquitectura de privacidad a las GPU de Nvidia en Google Cloud.
Esa asociación con Google es el detalle que vale la pena desentrañar. La cobertura de la conferencia sugirió de diversas maneras que los modelos de Apple fueron “destilados de Gemini” o que no contenían tecnología de Google en absoluto.
La publicación técnica se sitúa entre ambos: la familia AFM es propia de Apple, “construida a medida en colaboración con Google”, y entrenada en las TPU de Google en la nube, mientras que el razonamiento más pesado detrás del nuevo Siri supuestamente se basa en un gran modelo personalizado de Google. En resumen, los modelos son de Apple, el músculo y gran parte de la infraestructura son de Google.
Para los desarrolladores, el cambio más significativo es el marco de Modelos de Fundación.
Las aplicaciones pueden acceder directamente al modelo en el dispositivo, y este año Apple agregó una capa de abstracción de modelo que permite a los desarrolladores intercambiar modelos de terceros como Claude de Anthropic o Gemini de Google sin reescribir su código, mientras que iOS 27 permitirá a los usuarios establecer un asistente rival como su predeterminado. Es una postura inusualmente abierta para Apple, incluso si la Inteligencia de Apple en sí misma aún no llegará a la UE en la misma línea de tiempo.
El habitual caveat se aplica a los números. La publicación de Apple está salpicada de comparaciones halagadoras, AFM 3 Cloud preferido sobre el modelo del año pasado en el 64.7 por ciento de los avisos, voces expresivas puntuando 4.15 en una escala de opinión de 5 puntos frente a 3.87 para el antiguo sistema, pero estas son evaluaciones humanas propias de Apple, no puntos de referencia independientes, y los modelos aún están en beta.
Se promete un informe técnico más completo más adelante este verano.
Aún así, después de dos años de ser objeto de burlas por un asistente que no funcionaba, este es el argumento más claro de Apple de que la plomería finalmente es real: un pequeño modelo privado para lo cotidiano, modelos más grandes encerrados dentro de su propia nube para las cosas difíciles, y el músculo de frontera de Google donde Apple aún no puede competir solo.
Si se mantiene fuera de las propias gráficas de Apple es la prueba que viene a continuación.
Otros artículos
Apple detalla los modelos de IA detrás del nuevo Siri
Los modelos de tercera generación de Foundation de Apple, construidos con Google, incluyen un modelo en el dispositivo de 20 mil millones de parámetros que se ejecuta desde el almacenamiento flash, además de tres modelos en la nube.
