GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

      Модель способна обрабатывать аудио, видео, текст, изображения и проводить анализ данных в режиме реального времени с помощью интернета.

      Сбер представил обновлённый вариант своей нейросетевой платформы — GigaChat 2.0. Это уже не просто чат-бот, а полноценный мультимодальный помощник, который способен понимать речь, изображения, видео и обрабатывать большие объемы текста, предоставляя актуальную и проверенную информацию с указанием источников. Новый GigaChat 2.0 также интегрирован в голосовые помощники умных колонок Сбер, а одной из первых цифровых платформ, включивших его, стала МАХ от VK.

      Что нового в GigaChat 2.0

      Основное обновление — поддержка мультимодальности. Искусственный интеллект теперь распознаёт голосовые записи, интерпретирует изображения, взаимодействует с видео по ссылкам (включая YouTube) и анализирует документы объёмом до 200 страниц. Например, пользователь может загрузить договор аренды и получить его анализ с учётом современных российских законов, расшифровать запись врачебных рекомендаций или понять содержание видеоурока.

      Значительно улучшились возможности обработки аудио. Модель воспринимает звуковые данные в оригинальном формате, без преобразования в текст. Она умеет выделять ключевые моменты, отвечать на вопросы по содержанию, распознавать устную речь, акценты, музыку и посторонние звуки. Ограничения связаны с размерами файлов: до 60 минут или 30 мегабайт. Однако на практике пока существуют ограничения по форматам и объёмам при работе с аудиофайлами.

      Работа с актуальными данными в реальном времени стала ещё одной важной функцией. Теперь GigaChat 2.0 может искать информацию в интернете, отфильтровывать её, выделять главное и предоставлять ссылки на проверенные источники. Это помогает избежать устаревших данных, на которых была обучена модель, и снижает риск так называемых «галлюцинаций» — ошибок в выдаче.

      Две версии — для разных нужд

      В линейке доступны две версии: GigaChat 2 Pro — для повседневных задач, таких как написание текстов или поиск справочной информации, и GigaChat 2 Max — для более сложных профессиональных запросов. Max-модель уже заняла первое место среди AI-моделей в бенчмарке MERA для русского языка и уверенно конкурирует с зарубежными аналогами, такими как GPT-4 и LLaMA 70B.

      Музыка, изображения и видео

      GigaChat 2.0 научился генерировать музыку и песни по текстовому запросу — теперь максимальная длина трека достигает трёх минут, а создать его можно за одну. Модель поддерживает создание композиций даже на иностранных языках, таких как китайский.

      Работа с изображениями также вышла на новый уровень. Искусственный интеллект способен анализировать содержание фотографии, расшифровывать текст, предлагать стили одежды, решать задачи и объяснять смысл квитанций.

      Что касается видео, GigaChat 2.0 может обрабатывать ссылки: модель анализирует аудиодорожку, рассказывает основную суть, отвечает на вопросы или выделяет ключевые моменты, включая записи на английском или других языках.

      Умные колонки и интерактивный диалог

      Впервые в России все умные колонки Сбера работают на мощной языковой модели. Это позволяет вести живое взаимодействие с пользователем на понятном языке или исполнять заданные роли. Теперь колонка поддерживает нить разговора в 10 раз дольше, чем раньше, объясняет сложные понятия простым языком или отвечает от имени, например, кинозвезды.

      Модель предлагает 18 вариантов для настройки общения: выбор голоса, формата обращения (на «ты» или «вы»), стиля общения. В одном обращении можно задать несколько команд, и колонка сама поймёт, когда нужно установить будильник, включить музыку или найти информацию.

      GigaChat 2.0 на платформе МАХ от VK

      Одним из первых новых партнёров стала платформа МАХ от VK — отечественный аналог WeChat с мессенджером, мини-приложениями, чат-ботами и платежными сервисами. Пользователи могут с помощью GigaChat 2.0 создавать тексты, расшифровывать аудио, кратко пересказывать видео и статьи, получать помощь по профессиональным и повседневным вопросам.

      GigaChat 2

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

Другие статьи

Нью-Йоркский мини-кроссворд сегодня: ответы на головоломки в понедельник, 14 апреля Нью-Йоркский мини-кроссворд сегодня: ответы на головоломки в понедельник, 14 апреля Мини-кроссворд NYT может быть намного меньше обычного кроссворда, но это непросто. Если вы застряли с сегодняшним кроссвордом, у нас есть ответы для вас. Красочный поп-трекер Chipolo превосходит AirTag только благодаря этой функции Красочный поп-трекер Chipolo превосходит AirTag только благодаря этой функции Красочный трекер Chipolo Pop item не нуждается в специальном чехле, поэтому его можно прикрепить к вашему брелоку. Вот как выглядит новый трекер в использовании. Утечка информации предполагает, что iPhone Fold может быть больше похож на складной iPad mini Утечка информации предполагает, что iPhone Fold может быть больше похож на складной iPad mini Долгое время ходили слухи, что Apple в скором времени займется производством складных устройств. Ранее мы сообщали, что iPhone может быть представлен в 2026 году, но пока об этом устройстве известно очень мало. Однако некоторые детали, возможно, стали немного яснее. Надежный источник утечки информации предоставил нам [...] Как получить скины Сабрины Карпентер в Fortnite Как получить скины Сабрины Карпентер в Fortnite Сабрина Карпентер привносит в Fortnite свой шарм с помощью потрясающих косметических средств и некоторых своих популярных песен. Вот как приобрести оба ее наряда в Fortnite. Lunar Remastered Collection - это мой новый любимый пакет для ретро-RPG Lunar Remastered Collection - это мой новый любимый пакет для ретро-RPG В Lunar Remastered Collection представлены качественные обновления, которые приближают игры к современным стандартам, поэтому к двум классическим RPG стоит вернуться. Является ли Марафон кроссплатформенным? Является ли Марафон кроссплатформенным? Marathon - это еще одна игра от Bungie в жанре live service, но на этот раз в жанре extraction shooter, а не в жанре looter shooter. Теперь, когда команда принадлежит PlayStation, будет ли она по-прежнему кроссплатформенной?

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

Модель способна обрабатывать аудио, видео, тексты и изображения, а также в режиме реального времени анализировать информацию из интернета.