Tus próximos auriculares podrían traducir texto e identificar objetos por ti.

Tus próximos auriculares podrían traducir texto e identificar objetos por ti.

      Los investigadores de la Universidad de Washington han desarrollado un nuevo sistema prototipo que podría cambiar la forma en que las personas interactúan con la inteligencia artificial en la vida diaria. Llamado VueBuds, el sistema integra pequeñas cámaras en auriculares inalámbricos estándar, permitiendo a los usuarios hacer preguntas a un modelo de IA sobre el mundo que les rodea en casi tiempo real.

      El concepto es simple pero poderoso. Un usuario puede mirar un objeto, como un paquete de comida en un idioma extranjero, y pedirle a la IA que lo traduzca. En aproximadamente un segundo, el sistema responde con una respuesta a través de los auriculares, creando una interacción fluida y manos libres.

      Un Enfoque Diferente Para Dispositivos Portátiles de IA

      A diferencia de las gafas inteligentes, que han tenido dificultades para ser adoptadas debido a preocupaciones de privacidad y limitaciones de diseño, VueBuds adopta un enfoque más sutil. El sistema utiliza cámaras de baja resolución en blanco y negro integradas en los auriculares para capturar imágenes fijas en lugar de video continuo.

      Universidad de Washington

      Estas imágenes se transmiten a través de Bluetooth a un dispositivo conectado, donde un pequeño modelo de IA las procesa localmente. Este procesamiento en el dispositivo asegura que los datos no necesiten ser enviados a la nube, abordando una de las mayores preocupaciones en torno a las cámaras portátiles.

      Para mejorar aún más la privacidad, los auriculares incluyen una luz indicadora visible cuando están grabando y permiten a los usuarios eliminar imágenes capturadas al instante.

      Ingeniería en torno a los Límites de Potencia y Rendimiento

      Uno de los mayores desafíos que enfrentó el equipo de investigación fue el consumo de energía. Las cámaras requieren significativamente más energía que los micrófonos, lo que hace impráctico utilizar sensores de alta resolución como los que se encuentran en las gafas inteligentes.

      Para resolver esto, el equipo utilizó una cámara aproximadamente del tamaño de un grano de arroz, capturando imágenes en escala de grises de baja resolución. Este enfoque reduce el uso de batería y permite una transmisión Bluetooth eficiente sin comprometer la capacidad de respuesta.

      La colocación fue otra consideración clave. Al inclinar las cámaras ligeramente hacia afuera, el sistema logra un campo de visión entre 98 y 108 grados. Si bien hay un pequeño punto ciego para objetos sostenidos extremadamente cerca, los investigadores encontraron que esto no afecta el uso típico.

      El sistema también combina imágenes de ambos auriculares en un solo marco, mejorando la velocidad de procesamiento. Esto permite que VueBuds responda en aproximadamente un segundo, en comparación con dos segundos al manejar imágenes por separado.

      Rendimiento Comparado Con Gafas Inteligentes

      En las pruebas, 74 participantes compararon VueBuds con gafas inteligentes como los modelos Ray-Ban de Meta. A pesar de utilizar imágenes de menor resolución y procesamiento local, VueBuds tuvo un rendimiento similar en general.

      Unsplash

      El informe mostró que los participantes prefirieron VueBuds para tareas de traducción, mientras que las gafas inteligentes tuvieron un mejor desempeño en el conteo de objetos. En pruebas separadas, VueBuds logró tasas de precisión de alrededor del 83-84% para traducción e identificación de objetos, y hasta el 93% para identificar títulos de libros y autores.

      Por Qué Esto Es Importante Y Qué Viene Después

      La investigación destaca un posible cambio en cómo se diseñan los dispositivos portátiles impulsados por IA. Al incorporar inteligencia visual en un dispositivo que las personas ya utilizan, el sistema evita muchas de las barreras que enfrentan las gafas inteligentes.

      Sin embargo, permanecen limitaciones. El sistema actual no puede interpretar el color, y sus capacidades aún están en etapas tempranas. El equipo planea explorar la adición de sensores de color y desarrollar modelos de IA especializados para tareas como traducción y soporte de accesibilidad.

      Los investigadores presentarán sus hallazgos en la Conferencia de la Asociación de Maquinaria de Computación sobre Factores Humanos en Sistemas de Computación en Barcelona, ofreciendo un vistazo a un futuro donde los dispositivos cotidianos se convierten silenciosamente en asistentes inteligentes.

Tus próximos auriculares podrían traducir texto e identificar objetos por ti. Tus próximos auriculares podrían traducir texto e identificar objetos por ti.

Otros artículos

Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony ha ampliado su línea INZONE con los auriculares H6 Air de diseño abierto, diseñados para una experiencia de juego inmersiva — no para esports competitivos, junto con auriculares púrpuras translúcidos. Cómo los intercambios de criptomonedas marcan el camino con una arquitectura de sistema escalable y resiliente Cómo los intercambios de criptomonedas marcan el camino con una arquitectura de sistema escalable y resiliente El mercado de activos digitales ha crecido rápidamente en los últimos años. Millones de personas ahora participan en el comercio diario, y la actividad puede aumentar en minutos cuando los mercados se mueven. Ese crecimiento ha llevado a cada intercambio de criptomonedas a replantearse cómo están construidos sus sistemas. La infraestructura ya no es algo en lo que los usuarios piensan solo cuando se rompe. […] Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony ha ampliado su línea INZONE con los auriculares H6 Air de diseño abierto, creados para una experiencia de juego inmersiva — no para esports competitivos, junto con auriculares púrpuras translúcidos. Ahora puedes guardar y reutilizar los mensajes de Gemini en Chrome con la nueva función de Habilidades. Ahora puedes guardar y reutilizar los mensajes de Gemini en Chrome con la nueva función de Habilidades. Google ha lanzado Skills en Chrome, una nueva función que te permite guardar los comandos de Gemini como herramientas reutilizables de un solo clic y ejecutarlos en múltiples pestañas sin tener que volver a escribir nada. Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony revela los auriculares de juego INZONE H6 Air de tipo abierto y los auriculares morados. Sony ha ampliado su línea INZONE con los auriculares H6 Air de diseño abierto, diseñados para una experiencia de juego inmersiva — no para esports competitivos, junto con auriculares púrpuras translúcidos. Tus próximos auriculares podrían traducir texto e identificar objetos por ti. Tus próximos auriculares podrían traducir texto e identificar objetos por ti. Investigadores de la Universidad de Washington crearon auriculares de IA con cámaras que interpretan el entorno mientras priorizan la privacidad y el procesamiento en el dispositivo.

Tus próximos auriculares podrían traducir texto e identificar objetos por ti.

Investigadores de la Universidad de Washington crearon auriculares con IA y cámaras que interpretan el entorno mientras priorizan la privacidad y el procesamiento en el dispositivo.