I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.

I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.

      I ricercatori dell'Università di Washington hanno sviluppato un nuovo sistema prototipo che potrebbe cambiare il modo in cui le persone interagiscono con l'intelligenza artificiale nella vita quotidiana. Chiamato VueBuds, il sistema integra piccole telecamere in cuffie wireless standard, consentendo agli utenti di porre domande a un modello di intelligenza artificiale sul mondo che li circonda in tempo quasi reale.

      Il concetto è semplice ma potente. Un utente può guardare un oggetto, come un pacchetto di cibo in una lingua straniera, e chiedere all'IA di tradurlo. In circa un secondo, il sistema risponde con una risposta attraverso le cuffie, creando un'interazione fluida e senza mani.

      Un Approccio Diverso Ai Wearable AI

      A differenza degli occhiali smart, che hanno avuto difficoltà con l'adozione a causa di preoccupazioni sulla privacy e limitazioni di design, VueBuds adotta un approccio più sottile. Il sistema utilizza telecamere in bianco e nero a bassa risoluzione integrate nelle cuffie per catturare immagini fisse piuttosto che video continui.

      Università di Washington

      Queste immagini vengono trasmesse tramite Bluetooth a un dispositivo connesso, dove un piccolo modello di intelligenza artificiale le elabora localmente. Questo elaborazione sul dispositivo assicura che i dati non debbano essere inviati al cloud, affrontando una delle maggiori preoccupazioni riguardo alle telecamere indossabili.

      Per migliorare ulteriormente la privacy, le cuffie includono una luce indicatrice visibile quando registrano e consentono agli utenti di eliminare immediatamente le immagini catturate.

      Ingegneria Intorno ai Limiti di Potenza e Prestazioni

      Una delle maggiori sfide affrontate dal team di ricerca è stata il consumo energetico. Le telecamere richiedono significativamente più energia dei microfoni, rendendo impraticabile l'uso di sensori ad alta risoluzione come quelli trovati negli occhiali smart.

      Per risolvere questo problema, il team ha utilizzato una telecamera di dimensioni simili a un chicco di riso, catturando immagini in scala di grigi a bassa risoluzione. Questo approccio riduce l'uso della batteria e consente una trasmissione Bluetooth efficiente senza compromettere la reattività.

      Il posizionamento è stato un'altra considerazione chiave. Angolando leggermente le telecamere verso l'esterno, il sistema raggiunge un campo visivo tra 98 e 108 gradi. Anche se c'è un piccolo punto cieco per gli oggetti tenuti estremamente vicini, i ricercatori hanno scoperto che questo non influisce sull'uso tipico.

      Il sistema combina anche le immagini di entrambe le cuffie in un'unica cornice, migliorando la velocità di elaborazione. Questo consente a VueBuds di rispondere in circa un secondo, rispetto ai due secondi quando gestisce le immagini separatamente.

      Prestazioni Rispetto Agli Occhiali Smart

      Nei test, 74 partecipanti hanno confrontato VueBuds con occhiali smart come i modelli Ray-Ban di Meta. Nonostante l'uso di immagini a bassa risoluzione e l'elaborazione locale, VueBuds ha mostrato prestazioni simili nel complesso.

      Unsplash

      Il rapporto ha mostrato che i partecipanti preferivano VueBuds per i compiti di traduzione, mentre gli occhiali smart si sono comportati meglio nel conteggio degli oggetti. In prove separate, VueBuds ha raggiunto tassi di precisione di circa l'83-84% per la traduzione e l'identificazione degli oggetti, e fino al 93% per l'identificazione dei titoli dei libri e degli autori.

      Perché Questo È Importante E Cosa Viene Dopo

      La ricerca evidenzia un potenziale cambiamento nel modo in cui vengono progettati i wearable alimentati da IA. Integrando l'intelligenza visiva in un dispositivo che le persone usano già, il sistema evita molte delle barriere affrontate dagli occhiali smart.

      Tuttavia, rimangono delle limitazioni. L'attuale sistema non può interpretare i colori e le sue capacità sono ancora nelle fasi iniziali. Il team prevede di esplorare l'aggiunta di sensori di colore e lo sviluppo di modelli di IA specializzati per compiti come la traduzione e il supporto all'accessibilità.

      I ricercatori presenteranno i loro risultati alla Conferenza dell'Associazione per la Macchina di Calcolo sui Fattori Umani nei Sistemi di Calcolo a Barcellona, offrendo uno sguardo su un futuro in cui i dispositivi quotidiani diventano silenziosamente assistenti intelligenti.

I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te. I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.

Altri articoli

Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Il mercato degli asset digitali è cresciuto rapidamente negli ultimi anni. Milioni di persone partecipano ora al trading quotidiano, e l'attività può aumentare rapidamente in pochi minuti quando i mercati si muovono. Questa crescita ha spinto ogni exchange di criptovalute a ripensare a come sono costruiti i propri sistemi. L'infrastruttura non è più qualcosa a cui gli utenti pensano solo quando si rompe. […] Sony svela le cuffie da gioco open-back INZONE H6 Air e gli auricolari viola Sony svela le cuffie da gioco open-back INZONE H6 Air e gli auricolari viola Sony ha ampliato la sua gamma INZONE con le cuffie H6 Air a padiglione aperto, progettate per un'esperienza di gioco immersiva — non per gli esports competitivi, insieme a auricolari viola traslucidi. Ora puoi salvare e riutilizzare i prompt di Gemini in Chrome con la nuova funzione Skills. Ora puoi salvare e riutilizzare i prompt di Gemini in Chrome con la nuova funzione Skills. Google ha lanciato Skills in Chrome, una nuova funzionalità che ti consente di salvare i prompt di Gemini come strumenti riutilizzabili con un clic e di eseguirli su più schede senza dover riscrivere nulla. I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te. I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te. I ricercatori dell'Università di Washington hanno creato auricolari AI con telecamere che interpretano l'ambiente circostante, dando priorità alla privacy e all'elaborazione sul dispositivo. Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Il mercato degli asset digitali è cresciuto rapidamente negli ultimi anni. Milioni di persone partecipano ora al trading quotidiano, e l'attività può aumentare in pochi minuti quando i mercati si muovono. Questa crescita ha spinto ogni exchange di criptovalute a ripensare a come sono costruiti i propri sistemi. L'infrastruttura non è più qualcosa a cui gli utenti pensano solo quando si rompe. [...] Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Come gli scambi di criptovalute guidano la strada con un'architettura di sistema scalabile e resiliente Il mercato degli asset digitali è cresciuto rapidamente negli ultimi anni. Milioni di persone partecipano ora al trading quotidiano, e l'attività può aumentare in pochi minuti quando i mercati si muovono. Questa crescita ha spinto ogni exchange di criptovalute a ripensare a come sono costruiti i propri sistemi. L'infrastruttura non è più qualcosa a cui gli utenti pensano solo quando si rompe. […]

I tuoi prossimi auricolari potrebbero tradurre testi e identificare oggetti per te.

I ricercatori dell'Università di Washington hanno creato auricolari AI con telecamere che interpretano l'ambiente circostante, dando priorità alla privacy e all'elaborazione sul dispositivo.