I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.
I ricercatori dell'Università di Washington hanno sviluppato un nuovo sistema prototipo che potrebbe cambiare il modo in cui le persone interagiscono con l'intelligenza artificiale nella vita quotidiana. Chiamato VueBuds, il sistema integra piccole telecamere in cuffie wireless standard, consentendo agli utenti di porre domande a un modello di intelligenza artificiale sul mondo che li circonda in tempo quasi reale.
Il concetto è semplice ma potente. Un utente può guardare un oggetto, come un pacchetto di cibo in una lingua straniera, e chiedere all'IA di tradurlo. In circa un secondo, il sistema risponde con una risposta attraverso le cuffie, creando un'interazione fluida e senza mani.
Un Approccio Diverso Ai Wearable AI
A differenza degli occhiali smart, che hanno avuto difficoltà con l'adozione a causa di preoccupazioni sulla privacy e limitazioni di design, VueBuds adotta un approccio più sottile. Il sistema utilizza telecamere in bianco e nero a bassa risoluzione integrate nelle cuffie per catturare immagini fisse piuttosto che video continui.
Università di Washington
Queste immagini vengono trasmesse tramite Bluetooth a un dispositivo connesso, dove un piccolo modello di intelligenza artificiale le elabora localmente. Questo elaborazione sul dispositivo assicura che i dati non debbano essere inviati al cloud, affrontando una delle maggiori preoccupazioni riguardo alle telecamere indossabili.
Per migliorare ulteriormente la privacy, le cuffie includono una luce indicatrice visibile quando registrano e consentono agli utenti di eliminare immediatamente le immagini catturate.
Ingegneria Intorno ai Limiti di Potenza e Prestazioni
Una delle maggiori sfide affrontate dal team di ricerca è stata il consumo energetico. Le telecamere richiedono significativamente più energia dei microfoni, rendendo impraticabile l'uso di sensori ad alta risoluzione come quelli trovati negli occhiali smart.
Per risolvere questo problema, il team ha utilizzato una telecamera di dimensioni simili a un chicco di riso, catturando immagini in scala di grigi a bassa risoluzione. Questo approccio riduce l'uso della batteria e consente una trasmissione Bluetooth efficiente senza compromettere la reattività.
Il posizionamento è stato un'altra considerazione chiave. Angolando leggermente le telecamere verso l'esterno, il sistema raggiunge un campo visivo tra 98 e 108 gradi. Anche se c'è un piccolo punto cieco per gli oggetti tenuti estremamente vicini, i ricercatori hanno scoperto che questo non influisce sull'uso tipico.
Il sistema combina anche le immagini di entrambe le cuffie in un'unica cornice, migliorando la velocità di elaborazione. Questo consente a VueBuds di rispondere in circa un secondo, rispetto ai due secondi quando gestisce le immagini separatamente.
Prestazioni Rispetto Agli Occhiali Smart
Nei test, 74 partecipanti hanno confrontato VueBuds con occhiali smart come i modelli Ray-Ban di Meta. Nonostante l'uso di immagini a bassa risoluzione e l'elaborazione locale, VueBuds ha mostrato prestazioni simili nel complesso.
Unsplash
Il rapporto ha mostrato che i partecipanti preferivano VueBuds per i compiti di traduzione, mentre gli occhiali smart si sono comportati meglio nel conteggio degli oggetti. In prove separate, VueBuds ha raggiunto tassi di precisione di circa l'83-84% per la traduzione e l'identificazione degli oggetti, e fino al 93% per l'identificazione dei titoli dei libri e degli autori.
Perché Questo È Importante E Cosa Viene Dopo
La ricerca evidenzia un potenziale cambiamento nel modo in cui vengono progettati i wearable alimentati da IA. Integrando l'intelligenza visiva in un dispositivo che le persone usano già, il sistema evita molte delle barriere affrontate dagli occhiali smart.
Tuttavia, rimangono delle limitazioni. L'attuale sistema non può interpretare i colori e le sue capacità sono ancora nelle fasi iniziali. Il team prevede di esplorare l'aggiunta di sensori di colore e lo sviluppo di modelli di IA specializzati per compiti come la traduzione e il supporto all'accessibilità.
I ricercatori presenteranno i loro risultati alla Conferenza dell'Associazione per la Macchina di Calcolo sui Fattori Umani nei Sistemi di Calcolo a Barcellona, offrendo uno sguardo su un futuro in cui i dispositivi quotidiani diventano silenziosamente assistenti intelligenti.
Altri articoli
I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.
I ricercatori dell'Università di Washington hanno creato auricolari AI con telecamere che interpretano l'ambiente circostante, dando priorità alla privacy e all'elaborazione sul dispositivo.
