La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta.

La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta.

      Los investigadores de KAIST dicen que Upsample Anything agudiza los datos visuales comprimidos mientras reduce las demandas de memoria de GPU hasta en 16 veces.

      Los investigadores de KAIST han desarrollado un método de visión AI diseñado para un problema que los fabricantes de teléfonos no pueden ignorar para siempre. Upsample Anything reconstruye características visuales de alta resolución a partir de datos de imagen comprimidos, con el objetivo de hacer que la IA en el dispositivo sea más nítida sin exigir un presupuesto de memoria mucho mayor.

      Los teléfonos ya dependen de la compresión para mantener la inteligencia basada en cámaras funcionando rápidamente. La compensación es que los objetos pequeños, los bordes delgados y los defectos sutiles pueden eliminarse antes de que un sistema de visión tenga suficiente detalle con el que trabajar.

      El número destacado del equipo liderado por KAIST es difícil de pasar por alto. Dice que Upsample Anything puede restaurar información visual cercana a la imagen original mientras mejora la eficiencia de la memoria de GPU hasta en 16 veces.

      KAIST

      ¿Cómo ve más con menos?

      Upsample Anything no obliga a que todo el pipeline de visión funcione a alta resolución desde el principio. Trabaja con mapas de características de menor resolución, luego utiliza los bordes y la estructura de la imagen de entrada para reconstruir características de mayor resolución.

      El diagrama de flujo en la página 4 muestra el camino del método. Una imagen de alta resolución se reduce, se reconstruye a través de la optimización en el tiempo de prueba y se utiliza para aprender núcleos de restauración que pueden elevar mapas de características de menor resolución hacia un detalle más fino.

      También es libre de entrenamiento, por lo que no necesita una nueva ronda de entrenamiento del modelo antes de aplicarse a nuevos datos. Eso le da una ruta más limpia en entornos variados que los enfoques que dependen de reentrenamiento u optimización más pesada.

      ¿Por qué son los teléfonos el punto de presión?

      Los teléfonos inteligentes no tienen el margen térmico o de memoria del hardware de IA más grande, pero la IA visual se está acercando más al dispositivo. Las características de la cámara, las herramientas de reconocimiento y las tareas de percepción local ejercen presión sobre los chips que no pueden simplemente consumir más memoria de GPU cada vez que el detalle se vuelve escaso.

      KAIST probó el método utilizando una imagen de 224 x 224, un tamaño común en la investigación de IA, y reportó un tiempo de cálculo de aproximadamente 0.4 segundos. Eso no prueba un rendimiento listo para teléfonos, pero le da a la investigación un marcador de eficiencia concreto en lugar de una promesa vaga.

      Aerps / Unsplash

      Lo que aún tiene que funcionar

      Upsample Anything sigue siendo investigación, no una función lista para ser enviada dentro de una aplicación de cámara de teléfono. El trabajo ha sido publicado en arXiv y aceptado en CVPR 2026, donde recibió reconocimiento por su eficiencia computacional y transparencia en la investigación.

      La próxima prueba es el despliegue práctico. Los fabricantes de teléfonos y los desarrolladores de aplicaciones deberán demostrar que una visión local más nítida no crea nuevos problemas de batería, calor o latencia en hardware móvil real.

      Paulo Vargas es un estudiante de inglés convertido en reportero convertido en escritor técnico, con una carrera que siempre ha vuelto a…

      La extraña patente de Samsung muestra un teléfono plegable que se pliega a sí mismo en una caja

      La patente de pantalla más inusual de Samsung hasta ahora protege la apariencia de un dispositivo que se enrolla en un ladrillo rectangular.

      Samsung ha recibido una patente de diseño en EE. UU. por lo que podría ser su concepto de pantalla más inusual hasta ahora. La patente es para un dispositivo que, cuando está plegado, se asemeja a un ladrillo rectangular largo y puede desplegarse para formar una pantalla mucho más grande. Se presentó en enero de 2023 y se otorgó este mes.

      Leer más

      Pixi quiere reemplazar tus aburridos mensajes de texto con personajes de AR que reaccionan a ti

      Los usuarios de iMessage ahora pueden enviar divertidos personajes de IA como un gato o un robot a sus amigos.

      Olvida los stickers y GIFs, una nueva aplicación llamada Pixi Garden quiere que envíes personajes interactivos de realidad aumentada a través de iMessage en su lugar. Pixi Platforms lanzó hoy la aplicación nativa de mensajería, permitiéndote crear y enviar un "pixi", un personaje inteligente de AR que cobra vida a través de la cámara del teléfono de tu amigo y reacciona a lo que realmente está sucediendo a su alrededor.

      Leer más

      El editor de imágenes AI de Google Photos se expande a más regiones, pero solo para usuarios de Android

      Edita con Ask Photos, que te permite hacer ediciones describiendo lo que deseas, ahora está disponible para usuarios de Android en Alemania, el Reino Unido, Francia, España e Italia.

      Google introdujo una función de edición impulsada por IA en Google Photos llamada "Edit with Ask Photos" el año pasado, permitiendo a los usuarios hacer ajustes fotográficos utilizando comandos en lenguaje natural. Inicialmente debutó en un puñado de países, pero Google ahora está expandiendo el soporte a cinco nuevos mercados. De cuatro países a nueve.

      Leer más

La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta. La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta.

Otros artículos

General Intuition recauda $300 millones para IA entrenada con datos de juegos General Intuition recauda $300 millones para IA entrenada con datos de juegos La startup rechazó la oferta de $500 millones de OpenAI por sus datos de video de juegos. Ahora está recaudando $300 millones a una valoración de $2 mil millones para entrenar agentes de IA en 2 mil millones de clips de videojuegos por año. UPS está construyendo un gemelo digital en tiempo real de toda su red logística, actualizado cada 10 minutos. UPS está construyendo un gemelo digital en tiempo real de toda su red logística, actualizado cada 10 minutos. UPS detalló iniciativas de IA que incluyen un gemelo digital de su red global, torres de control agenciales para clientes y seguimiento impulsado por RFID en todos los vehículos de EE. UU. Spotify lanza la venta de entradas reservadas para superfans Spotify lanza la venta de entradas reservadas para superfans La función Reservada de Spotify retiene entradas para conciertos para suscriptores Premium basándose en datos de escucha, lanzándose en EE. UU. a través de un acuerdo exclusivo de varios años con Live Nation. UPS está construyendo un gemelo digital en tiempo real de toda su red logística, actualizado cada 10 minutos. UPS está construyendo un gemelo digital en tiempo real de toda su red logística, actualizado cada 10 minutos. UPS detalló iniciativas de IA que incluyen un gemelo digital de su red global, torres de control agénticas para clientes y seguimiento impulsado por RFID en todos los vehículos de EE. UU. BMW recorta su previsión de beneficios mientras China presiona a Europa BMW recorta su previsión de beneficios mientras China presiona a Europa BMW redujo su pronóstico de margen para la división de automóviles a tan solo el 1%. Las marcas chinas ahora tienen casi el 10% del mercado automotriz europeo mientras aplastan las ganancias europeas en China. Verse respaldado por Nvidia recauda $54 millones para el poder de centros de datos de IA Verse respaldado por Nvidia recauda $54 millones para el poder de centros de datos de IA Verse recaudó $54 millones en una Serie B liderada por Bessemer, con Nvidia entre los patrocinadores, para ayudar a los centros de datos de IA a evitar la cola de la red utilizando baterías en el sitio.

La visión de la IA se está volviendo demasiado hambrienta, y este método la pone a dieta.

El Upsample Anything de KAIST aborda el problema de memoria detrás de una visión de IA en el dispositivo más nítida, restaurando características visuales de alta resolución a partir de datos de imagen comprimidos sin obligar a los teléfonos inteligentes a procesar todo a plena resolución primero.