Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету.

Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету.

      Исследователи KAIST утверждают, что Upsample Anything улучшает сжатые визуальные данные, одновременно снижая требования к памяти GPU до 16 раз.

      Исследователи KAIST разработали метод ИИ-визуализации, созданный для проблемы, которую производители телефонов не могут игнорировать вечно. Upsample Anything восстанавливает высокоразрешающие визуальные характеристики из сжатых данных изображений, стремясь сделать ИИ на устройстве более четким, не требуя значительно большего объема памяти.

      Телефоны уже полагаются на сжатие, чтобы быстро обрабатывать интеллектуальные функции на основе камеры. Компромисс заключается в том, что мелкие объекты, тонкие края и тонкие дефекты могут быть удалены до того, как система визуализации получит достаточно деталей для работы.

      Главное число команды KAIST трудно не заметить. Оно говорит, что Upsample Anything может восстановить визуальную информацию, близкую к оригинальному изображению, одновременно улучшая эффективность памяти GPU до 16 раз.

      KAIST

      Как он видит больше с меньшими затратами

      Upsample Anything не заставляет весь визуальный поток работать на высоком разрешении с самого начала. Он работает с картами признаков низкого разрешения, а затем использует края и структуру входного изображения для восстановления признаков более высокого разрешения.

      Диаграмма рабочего процесса на странице 4 показывает путь метода. Высокое разрешение изображения уменьшается, восстанавливается через оптимизацию во время тестирования и используется для обучения ядер восстановления, которые могут поднять карты признаков низкого разрешения к более тонким деталям.

      Он также не требует обучения, поэтому ему не нужно новое обучение модели перед применением к новым данным. Это дает ему более чистый путь в разнообразные среды, чем подходы, которые полагаются на повторное обучение или более тяжелую оптимизацию.

      Почему телефоны являются точкой давления

      Смартфоны не имеют теплового или памятьного запаса более крупного аппаратного обеспечения ИИ, но визуальный ИИ приближается к устройству. Функции камеры, инструменты распознавания и задачи локального восприятия создают давление на чипы, которые не могут просто использовать больше памяти GPU, когда детали становятся тонкими.

      KAIST протестировал метод, используя изображение размером 224 x 224, что является распространенным размером в исследованиях ИИ, и сообщил о времени вычислений около 0,4 секунды. Это не доказывает готовность к производительности на телефонах, но дает исследованию конкретный маркер эффективности вместо расплывчатого обещания.

      Aerps / Unsplash

      Что еще должно сработать

      Upsample Anything все еще является исследованием, а не функцией, готовой к отправке в приложение камеры телефона. Работа была опубликована на arXiv и принята на CVPR 2026, где она получила признание за вычислительную эффективность и прозрачность исследований.

      Следующий тест — практическое развертывание. Производители телефонов и разработчики приложений должны будут показать, что более четкое локальное зрение не создает новых проблем с батареей, теплом или задержкой на реальном мобильном оборудовании.

      Пауло Варгас — специалист по английскому языку, ставший репортером, а затем техническим писателем, с карьерой, которая всегда возвращалась к…

      Дикий патент Samsung показывает складной телефон, который складывается в коробку

      Самый необычный патент на дисплей Samsung защищает внешний вид устройства, которое сворачивается в прямоугольный кирпич.

      Samsung получил патент на дизайн в США на то, что может быть его самым необычным концептом дисплея на сегодняшний день. Патент касается устройства, которое, когда сложено, напоминает длинный прямоугольный кирпич и может развернуться, чтобы образовать гораздо больший экран. Он был подан в январе 2023 года и был выдан только в этом месяце.

      Читать далее

      Pixi хочет заменить ваши скучные текстовые сообщения на AR-персонажей, которые реагируют на вас

      Пользователи iMessage теперь могут отправлять забавные AI-персонажи, такие как кот или робот, своим друзьям.

      Забудьте о стикерах и GIF-файлах, новое приложение под названием Pixi Garden хочет, чтобы вы отправляли интерактивных персонажей дополненной реальности через iMessage вместо этого. Pixi Platforms запустила нативное приложение для обмена сообщениями сегодня, позволяя вам создавать и отправлять "pixi" — интеллектуального AR-персонажа, который оживает через камеру телефона вашего друга и реагирует на то, что на самом деле происходит вокруг них.

      Читать далее

      AI-редактор изображений Google Photos расширяется на новые регионы, но только для пользователей Android

      Редактируйте с помощью Ask Photos, который позволяет вам вносить изменения, описывая, что вы хотите, теперь доступен для пользователей Android в Германии, Великобритании, Франции, Испании и Италии.

      Google представил функцию редактирования на основе ИИ в Google Photos под названием "Редактировать с помощью Ask Photos" в прошлом году, позволяя пользователям вносить изменения в фотографии с помощью подсказок на естественном языке. Изначально она дебютировала в нескольких странах, но теперь Google расширяет поддержку на пять новых рынков. С четырех стран до девяти

      Читать далее

Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету. Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету.

Другие статьи

Эксперты MIT только что создали специальную память. Когда люди забывают, роботы просто найдут потерянный предмет. Эксперты MIT только что создали специальную память. Когда люди забывают, роботы просто найдут потерянный предмет. Исследователи MIT разработали систему памяти на основе ИИ, которая позволяет роботам запоминать объекты, местоположения и детали из реальных окружающих сред на протяжении времени. Ford запускает подразделение по хранению батарей стоимостью 2 миллиарда долларов для центров обработки данных ИИ Ford запускает подразделение по хранению батарей стоимостью 2 миллиарда долларов для центров обработки данных ИИ Ford Energy будет производить батарейные системы LFP для сетевого масштаба на переоборудованном заводе в Кентукки, с первыми поставками в конце 2027 года. EDF подписала пятилетний контракт на поставку до 20 ГВтч. Rivian подала в суд за ложные обещания автономного вождения для Gen 1 R1 Rivian подала в суд за ложные обещания автономного вождения для Gen 1 R1 Коллективный иск утверждает, что Rivian потратила пять лет, обещая беспилотное вождение для своих R1T и R1S, зная, что оборудование первого поколения никогда не сможет это поддерживать. General Intuition собирает $300 млн для ИИ, обученного на игровых данных General Intuition собирает $300 млн для ИИ, обученного на игровых данных Стартап отклонил предложение OpenAI в 500 миллионов долларов за свои данные о видеоиграх. Теперь он собирает 300 миллионов долларов при оценке в 2 миллиарда долларов, чтобы обучать ИИ-агентов на 2 миллиардах видеоклипов игр в год. Spotify запускает резервирование билетов для суперфанов Spotify запускает резервирование билетов для суперфанов Функция Reserved от Spotify удерживает билеты на концерты для подписчиков Premium на основе данных о прослушивании, запускаясь в США через многолетнюю эксклюзивную сделку с Live Nation. Внутри SURBL, черного списка электронной почты, который проверяет ваши ссылки, а не ваш IP Внутри SURBL, черного списка электронной почты, который проверяет ваши ссылки, а не ваш IP SURBL помечает URL-адреса внутри ваших электронных писем, а не IP-адрес отправителя. Один единственный ссылочный адрес на помеченный домен может незаметно отключить каждую ссылку в доставленном сообщении, и большинство отправителей никогда не осознают, что это произошло.

Искусственный интеллект становится слишком жадным, и этот метод ставит его на диету.

Upsample Anything от KAIST решает проблему памяти, связанную с более четким зрением ИИ на устройствах, восстанавливая высококачественные визуальные характеристики из сжатых данных изображений, не заставляя смартфоны сначала обрабатывать все в полном разрешении.