Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale

Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale

      Credito: BEYOND EXPO

      Nella fase attuale in cui la competizione nei grandi modelli si sta spostando dalla scala dei parametri alla capacità di distribuzione nel mondo reale, un gruppo di aziende cinesi focalizzate sull'AI edge sta guadagnando attenzione, e Om AI Technology è una di esse. Fondata nel 2021, l'azienda ha scelto di non perseguire modelli estremamente grandi basati su cloud, ma si concentra invece su modelli di visione multimodale generali a livello edge, con l'obiettivo di portare l'AI in dispositivi reali come PC, telecamere e robot. Durante il giorno dei media dell'Expo BEYOND 2026, Om AI Technology ha presentato il suo prodotto di creazione di contenuti nativo per l'AI, OttoBox AI Studio. Progettato per professionisti dei media e creatori di contenuti, sfrutta la potenza di calcolo AI locale per fornire capacità come analisi video, abbinamento di risorse, generazione di script e produzione video rapida. L'azienda lo posiziona come un compagno per la creazione di contenuti per l'era nativa dell'AI, con l'obiettivo di migliorare l'efficienza creativa.

      Rispetto a molte aziende di AI che si spostano da modelli generali a strati applicativi, Om AI parte da una base più orientata all'industria. Il team è stato a lungo profondamente coinvolto nell'industria dei media e audiovisiva e quindi enfatizza la costruzione di modelli basati su problemi del mondo reale piuttosto che cercare chiodi con un martello. Il Dr. Zhao Tiancheng, CEO di Om AI, ha osservato che l'esperienza a lungo termine nel settore non solo aiuta il team a distribuire modelli più rapidamente, ma fornisce anche accesso a grandi quantità di dati reali di alta qualità. Secondo loro, la vera capacità multimodale non riguarda solo il riconoscimento di immagini e testo, ma la comprensione simultanea di video, audio e testo. Uno dei principali focus tecnici dell'azienda è la comprensione video sotto modelli a basso numero di parametri. Rispetto agli approcci tradizionali che si basano su conteggi di parametri estremamente grandi e risorse GPU basate su cloud, Om AI enfatizza un approccio a modelli edge piccoli, precisi e veloci. Riducendo le dimensioni del modello, l'AI può funzionare direttamente su dispositivi locali, abbassando i costi di inferenza e riducendo i requisiti di caricamento dei dati, affrontando anche le preoccupazioni delle aziende riguardo alla sicurezza e alla privacy dei dati.

      Questo vantaggio nella distribuzione edge è particolarmente significativo in scenari di analisi video su larga scala. L'azienda afferma che i suoi modelli possono raggiungere velocità di inferenza a livello di millisecondo, rendendoli adatti per applicazioni in tempo reale come sicurezza, ispezione industriale e analisi AIoT. Attualmente, il business AI di Om AI si estende su tre aree principali: PC AI, AIoT e intelligenza incarnata. Oltre alle collaborazioni con Apple, Lenovo e HP, i suoi modelli sono applicati anche a robot, cani robotici e droni, consentendo a questi dispositivi di acquisire capacità autonome di decisione e azione. Om AI sta anche esplorando applicazioni di AI inclusive. Ad esempio, la sua Homer App, progettata per utenti non vedenti, consente la ricerca di oggetti e la navigazione assistita tramite smartphone o occhiali AI.

      La versione flagship di OttoBox AI Studio ha già stabilito profonde partnership con i principali produttori di PC come Apple, Lenovo e HP, completando la sua distribuzione nello spazio dei PC AI e fornendo agli utenti professionali un'esperienza pronta all'uso. Quest'anno, la priorità strategica chiave dell'azienda è il lancio del suo modello multimodale edge di nuova generazione VLX, che mira a migliorare ulteriormente la comprensione video e il processo decisionale riducendo continuamente i costi operativi. Con il passaggio dell'industria AI dalla competizione basata su cloud verso la distribuzione su dispositivo, aziende come Om AI stanno diventando motori chiave per l'adozione dell'AI multimodale nel mondo reale.

      Jessie Wu è una reporter tecnologica con sede a Shanghai. Copre elettronica di consumo, semiconduttori e l'industria dei giochi per TechNode. Connettiti con lei via e-mail: jessie.wu@technode.com. Altri articoli di Jessie Wu

Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale

Altri articoli

Dalla comprensione video al deployment edge Om AI mira all'AI nel mondo reale

Nella fase attuale in cui la competizione nei grandi modelli sta passando dalla scala dei parametri alla capacità di implementazione nel mondo reale, un gruppo di aziende cinesi