GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

      Модель способна обрабатывать аудио, видео, текст, изображения и проводить анализ данных в режиме реального времени с помощью интернета.

      Сбер представил обновлённый вариант своей нейросетевой платформы — GigaChat 2.0. Это уже не просто чат-бот, а полноценный мультимодальный помощник, который способен понимать речь, изображения, видео и обрабатывать большие объемы текста, предоставляя актуальную и проверенную информацию с указанием источников. Новый GigaChat 2.0 также интегрирован в голосовые помощники умных колонок Сбер, а одной из первых цифровых платформ, включивших его, стала МАХ от VK.

      Что нового в GigaChat 2.0

      Основное обновление — поддержка мультимодальности. Искусственный интеллект теперь распознаёт голосовые записи, интерпретирует изображения, взаимодействует с видео по ссылкам (включая YouTube) и анализирует документы объёмом до 200 страниц. Например, пользователь может загрузить договор аренды и получить его анализ с учётом современных российских законов, расшифровать запись врачебных рекомендаций или понять содержание видеоурока.

      Значительно улучшились возможности обработки аудио. Модель воспринимает звуковые данные в оригинальном формате, без преобразования в текст. Она умеет выделять ключевые моменты, отвечать на вопросы по содержанию, распознавать устную речь, акценты, музыку и посторонние звуки. Ограничения связаны с размерами файлов: до 60 минут или 30 мегабайт. Однако на практике пока существуют ограничения по форматам и объёмам при работе с аудиофайлами.

      Работа с актуальными данными в реальном времени стала ещё одной важной функцией. Теперь GigaChat 2.0 может искать информацию в интернете, отфильтровывать её, выделять главное и предоставлять ссылки на проверенные источники. Это помогает избежать устаревших данных, на которых была обучена модель, и снижает риск так называемых «галлюцинаций» — ошибок в выдаче.

      Две версии — для разных нужд

      В линейке доступны две версии: GigaChat 2 Pro — для повседневных задач, таких как написание текстов или поиск справочной информации, и GigaChat 2 Max — для более сложных профессиональных запросов. Max-модель уже заняла первое место среди AI-моделей в бенчмарке MERA для русского языка и уверенно конкурирует с зарубежными аналогами, такими как GPT-4 и LLaMA 70B.

      Музыка, изображения и видео

      GigaChat 2.0 научился генерировать музыку и песни по текстовому запросу — теперь максимальная длина трека достигает трёх минут, а создать его можно за одну. Модель поддерживает создание композиций даже на иностранных языках, таких как китайский.

      Работа с изображениями также вышла на новый уровень. Искусственный интеллект способен анализировать содержание фотографии, расшифровывать текст, предлагать стили одежды, решать задачи и объяснять смысл квитанций.

      Что касается видео, GigaChat 2.0 может обрабатывать ссылки: модель анализирует аудиодорожку, рассказывает основную суть, отвечает на вопросы или выделяет ключевые моменты, включая записи на английском или других языках.

      Умные колонки и интерактивный диалог

      Впервые в России все умные колонки Сбера работают на мощной языковой модели. Это позволяет вести живое взаимодействие с пользователем на понятном языке или исполнять заданные роли. Теперь колонка поддерживает нить разговора в 10 раз дольше, чем раньше, объясняет сложные понятия простым языком или отвечает от имени, например, кинозвезды.

      Модель предлагает 18 вариантов для настройки общения: выбор голоса, формата обращения (на «ты» или «вы»), стиля общения. В одном обращении можно задать несколько команд, и колонка сама поймёт, когда нужно установить будильник, включить музыку или найти информацию.

      GigaChat 2.0 на платформе МАХ от VK

      Одним из первых новых партнёров стала платформа МАХ от VK — отечественный аналог WeChat с мессенджером, мини-приложениями, чат-ботами и платежными сервисами. Пользователи могут с помощью GigaChat 2.0 создавать тексты, расшифровывать аудио, кратко пересказывать видео и статьи, получать помощь по профессиональным и повседневным вопросам.

      GigaChat 2

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

Другие статьи

Кроссворд NYT: ответы на понедельник, 14 апреля Кроссворд NYT: ответы на понедельник, 14 апреля Разгадать кроссворд в New York Times может быть непросто, даже если это не воскресный выпуск! Если вы застряли, мы готовы помочь вам с сегодняшними подсказками и ответами. Является ли Марафон кроссплатформенным? Является ли Марафон кроссплатформенным? Marathon - это еще одна игра от Bungie в жанре live service, но на этот раз в жанре extraction shooter, а не в жанре looter shooter. Теперь, когда команда принадлежит PlayStation, будет ли она по-прежнему кроссплатформенной? Не упустите из виду эти 3 скрытых потоковых телешоу за апрель 2025 года Не упустите из виду эти 3 скрытых потоковых телешоу за апрель 2025 года Если вы ищете интересное шоу, о котором, возможно, еще не слышали, ознакомьтесь с этими тремя скрытыми потоковыми телешоу, которые выйдут в эфир в апреле 2025 года. Внедрение One UI 7 от Samsung приостановлено. Вот что это значит для вас Внедрение One UI 7 от Samsung приостановлено. Вот что это значит для вас Samsung решила приостановить внедрение One UI 7 из-за проблем с обновлением. Apple права, делая iPadOS более похожим на Mac, но я никогда не куплю iPad под управлением macOS Apple права, делая iPadOS более похожим на Mac, но я никогда не куплю iPad под управлением macOS В новом отчете утверждается, что iPadOS 19 получит множество функций, аналогичных Mac. Но Apple поступила бы неправильно, объединив две системы - на самом деле, это была бы ужасная идея. Как получить скины Сабрины Карпентер в Fortnite Как получить скины Сабрины Карпентер в Fortnite Сабрина Карпентер привносит в Fortnite свой шарм с помощью потрясающих косметических средств и некоторых своих популярных песен. Вот как приобрести оба ее наряда в Fortnite.

GigaChat 2.0 поднял российский искусственный интеллект на новый уровень.

Модель способна обрабатывать аудио, видео, тексты и изображения, а также в режиме реального времени анализировать информацию из интернета.