Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real.

Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real.

      Crédito: BEYOND EXPO

      En la fase actual donde la competencia en modelos grandes está cambiando de la escala de parámetros a la capacidad de implementación en el mundo real, un grupo de empresas chinas enfocadas en IA en el borde está ganando atención, y Om AI Technology es una de ellas. Fundada en 2021, la empresa ha optado por no perseguir modelos extremadamente grandes basados en la nube, sino que se centra en modelos de visión multimodal de propósito general en el lado del borde, con el objetivo de llevar la IA a dispositivos reales como PCs, cámaras y robots. En el día de medios de la Expo BEYOND 2026, Om AI Technology presentó su producto de creación de contenido nativo de IA, OttoBox AI Studio. Diseñado para profesionales de los medios y creadores de contenido, aprovecha el poder de computación de IA local para proporcionar capacidades como análisis de video, coincidencia de activos, generación de guiones y producción rápida de video. La empresa lo posiciona como un compañero de creación de contenido para la era nativa de IA, con el objetivo de mejorar la eficiencia creativa.

      Comparado con muchas empresas de IA que pasan de modelos de propósito general a capas de aplicación, Om AI comienza desde una base más impulsada por la industria. El equipo ha estado profundamente involucrado en la industria de medios y audiovisual durante mucho tiempo, y por lo tanto enfatiza la construcción de modelos basados en problemas del mundo real en lugar de buscar clavos con un martillo. El Dr. Zhao Tiancheng, CEO de Om AI, señaló que la experiencia industrial a largo plazo no solo ayuda al equipo a implementar modelos más rápido, sino que también proporciona acceso a grandes cantidades de datos del mundo real de alta calidad. En su opinión, la verdadera capacidad multimodal no se trata solo de reconocer imágenes y texto, sino de entender video, audio y texto simultáneamente. Uno de los enfoques técnicos clave de la empresa es la comprensión de video bajo modelos de bajo parámetro. Comparado con enfoques tradicionales que dependen de conteos de parámetros extremadamente grandes y recursos de GPU basados en la nube, Om AI enfatiza un enfoque de modelo en el borde pequeño, preciso y rápido. Al reducir el tamaño del modelo, la IA puede ejecutarse directamente en dispositivos locales, reduciendo los costos de inferencia y disminuyendo los requisitos de carga de datos, al mismo tiempo que aborda las preocupaciones empresariales sobre la seguridad y privacidad de los datos.

      Esta ventaja de implementación en el borde es particularmente significativa en escenarios de análisis de video a gran escala. La empresa afirma que sus modelos pueden lograr velocidades de inferencia a nivel de milisegundos, lo que los hace adecuados para aplicaciones en tiempo real como seguridad, inspección industrial y análisis de AIoT. Actualmente, el negocio de IA de Om AI abarca tres áreas principales: PCs de IA, AIoT e inteligencia incorporada. Además de colaboraciones con Apple, Lenovo y HP, sus modelos también se aplican a robots, perros robóticos y drones, permitiendo que estos dispositivos adquieran capacidades de toma de decisiones y acción autónomas. Om AI también está explorando aplicaciones de IA inclusiva. Por ejemplo, su aplicación Homer, diseñada para usuarios con discapacidad visual, permite la búsqueda de objetos y la navegación asistida a través de teléfonos inteligentes o gafas de IA.

      La versión insignia de OttoBox AI Studio ya ha establecido asociaciones profundas con fabricantes de PC líderes como Apple, Lenovo y HP, completando su implementación en el espacio de PC de IA y proporcionando a los usuarios profesionales una experiencia lista para usar. Este año, la prioridad estratégica clave de la empresa es el lanzamiento de su modelo multimodal de borde de próxima generación VLX, que tiene como objetivo mejorar aún más la comprensión de video y la toma de decisiones mientras reduce continuamente los costos operativos. A medida que la industria de IA cambia de la competencia basada en la nube hacia la implementación en dispositivos, empresas como Om AI se están convirtiendo en motores clave de la adopción de IA multimodal en el mundo real.

      Jessie Wu es una reportera de tecnología con sede en Shanghái. Cubre electrónica de consumo, semiconductores y la industria de los videojuegos para TechNode. Conéctate con ella por correo electrónico: jessie.wu@technode.com. Más de Jessie Wu

Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real. Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real. Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real. Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real.

Otros artículos

Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real.

En la fase actual donde la competencia en modelos grandes está cambiando de la escala de parámetros a la capacidad de implementación en el mundo real, un grupo de empresas chinas