De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real.

De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real.

      Crédito: BEYOND EXPO

      En la fase actual donde la competencia en modelos grandes está cambiando de la escala de parámetros a la capacidad de implementación en el mundo real, un grupo de empresas chinas enfocadas en la IA en el borde está ganando atención, y Om AI Technology es una de ellas. Fundada en 2021, la empresa ha optado por no perseguir modelos extremadamente grandes basados en la nube, sino que se centra en modelos de visión multimodal de propósito general en el lado del borde, con el objetivo de llevar la IA a dispositivos reales como PCs, cámaras y robots. En el día de medios de la BEYOND Expo 2026, Om AI Technology presentó su producto de creación de contenido nativo de IA, OttoBox AI Studio. Diseñado para profesionales de los medios y creadores de contenido, aprovecha la potencia de computación de IA local para proporcionar capacidades como análisis de video, coincidencia de activos, generación de guiones y producción rápida de video. La empresa lo posiciona como un compañero de creación de contenido para la era nativa de IA, con el objetivo de mejorar la eficiencia creativa.

      En comparación con muchas empresas de IA que pasan de modelos de propósito general a capas de aplicación, Om AI comienza desde una base más impulsada por la industria. El equipo ha estado profundamente involucrado en la industria de medios y audiovisual durante mucho tiempo, y por lo tanto enfatiza la construcción de modelos basados en problemas del mundo real en lugar de buscar clavos con un martillo. El Dr. Zhao Tiancheng, CEO de Om AI, señaló que la experiencia industrial a largo plazo no solo ayuda al equipo a implementar modelos más rápido, sino que también proporciona acceso a grandes cantidades de datos del mundo real de alta calidad. En su opinión, la verdadera capacidad multimodal no se trata solo de reconocer imágenes y texto, sino de entender video, audio y texto simultáneamente. Uno de los enfoques técnicos clave de la empresa es la comprensión de video bajo modelos de bajo parámetro. En comparación con enfoques tradicionales que dependen de recuentos de parámetros extremadamente grandes y recursos de GPU basados en la nube, Om AI enfatiza un enfoque de modelo en el borde pequeño, preciso y rápido. Al reducir el tamaño del modelo, la IA puede ejecutarse directamente en dispositivos locales, reduciendo los costos de inferencia y disminuyendo los requisitos de carga de datos, al mismo tiempo que aborda las preocupaciones empresariales en torno a la seguridad y privacidad de los datos.

      Esta ventaja de implementación en el borde es particularmente significativa en escenarios de análisis de video a gran escala. La empresa afirma que sus modelos pueden lograr velocidades de inferencia a nivel de milisegundos, lo que los hace adecuados para aplicaciones en tiempo real como seguridad, inspección industrial y análisis de AIoT. Actualmente, el negocio de IA de Om AI abarca tres áreas principales: PCs de IA, AIoT e inteligencia incorporada. Además de colaboraciones con Apple, Lenovo y HP, sus modelos también se aplican a robots, perros robóticos y drones, permitiendo que estos dispositivos adquieran capacidades de toma de decisiones y acción autónomas. Om AI también está explorando aplicaciones de IA inclusivas. Por ejemplo, su aplicación Homer, diseñada para usuarios con discapacidad visual, permite la búsqueda de objetos y navegación asistida a través de teléfonos inteligentes o gafas de IA.

      La versión insignia de OttoBox AI Studio ya ha establecido asociaciones profundas con fabricantes de PC líderes como Apple, Lenovo y HP, completando su implementación en el espacio de PC de IA y proporcionando a los usuarios profesionales una experiencia lista para usar. Este año, la prioridad estratégica clave de la empresa es el lanzamiento de su modelo multimodal de borde de próxima generación VLX, que tiene como objetivo mejorar aún más la comprensión de video y la toma de decisiones mientras reduce continuamente los costos operativos. A medida que la industria de IA cambia de la competencia basada en la nube hacia la implementación en dispositivos, empresas como Om AI se están convirtiendo en motores clave de la adopción de IA multimodal en el mundo real.

      Jessie Wu es una reportera de tecnología con sede en Shanghái. Cubre electrónica de consumo, semiconductores y la industria de los videojuegos para TechNode. Conéctate con ella por correo electrónico: jessie.wu@technode.com. Más de Jessie Wu

De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real. De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real. De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real. De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real.

Otros artículos

Xiaomi podría estar tras el truco anti-espionaje de Samsung, sin la costosa tecnología de pantalla. Xiaomi podría estar tras el truco anti-espionaje de Samsung, sin la costosa tecnología de pantalla. Se informa que Xiaomi está desarrollando una función estilo Privacy Display para HyperOS 4 que dará a los usuarios una forma de bloquear a los mirones de pantalla sin necesidad del nuevo hardware de Samsung. Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real. Desde la comprensión del video hasta el despliegue en el borde, Om AI se enfoca en la IA del mundo real. En la fase actual donde la competencia en modelos grandes está cambiando de la escala de parámetros a la capacidad de implementación en el mundo real, un grupo de empresas chinas Xiaomi podría estar detrás del truco anti-espionaje de Samsung, sin la costosa tecnología de pantalla. Xiaomi podría estar detrás del truco anti-espionaje de Samsung, sin la costosa tecnología de pantalla. Se informa que Xiaomi está desarrollando una función estilo Privacy Display para HyperOS 4 que dará a los usuarios una forma de bloquear a los mirones de la pantalla sin necesidad del nuevo hardware de Samsung. En BEYOND Expo 2026, el CEO de XREAL predice un momento iPhone para las gafas de IA. En BEYOND Expo 2026, el CEO de XREAL predice un momento iPhone para las gafas de IA. A medida que los grandes modelos de IA se fusionan rápidamente con dispositivos portátiles, las gafas inteligentes están volviendo a convertirse en un punto focal para la industria tecnológica. Desde las gafas de IA de Meta En BEYOND Expo 2026, el CEO de XREAL predice un momento iPhone para las gafas de IA. En BEYOND Expo 2026, el CEO de XREAL predice un momento iPhone para las gafas de IA. A medida que los grandes modelos de IA se fusionan rápidamente con dispositivos portátiles, las gafas inteligentes están volviendo a convertirse en un punto focal para la industria tecnológica. Desde las gafas de IA de Meta

De la comprensión del video al despliegue en el borde, Om AI se enfoca en la IA del mundo real.

En la fase actual donde la competencia en grandes modelos está cambiando de la escala de parámetros a la capacidad de implementación en el mundo real, un grupo de empresas chinas