Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

      Новый бенчмарк Google FACTS показывает, что лучшие современные чат-боты на базе ИИ достигают лишь примерно 69% точности. Даже такие топ-модели, как Gemini 3 Pro, по-прежнему ошибаются в фактах в одной трети случаев, что вызывает новые опасения у компаний, ставящих на надёжность ИИ.

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Другие статьи

Эта колонка Sony Ult Tower 9 для вечеринок стоит 699 долларов и создана, чтобы раскачать комнату. Эта колонка Sony Ult Tower 9 для вечеринок стоит 699 долларов и создана, чтобы раскачать комнату. Если ваш нынешний Bluetooth-динамик перестаёт слышно, как только люди начинают разговаривать, это тот апгрейд, который полностью меняет атмосферу. Sony ULT Tower 9 (SRSULT900) — полноразмерная беспроводная колонка для вечеринок, созданная для мощного, наполняющего комнату звука, глубокого баса и всего того света и эффектов, которых вы ожидаете за такую цену. При текущем предложении […] Этот крошечный дрон отслеживает, снимает и следует за вами, и у него наконец-то разумная цена. Этот крошечный дрон отслеживает, снимает и следует за вами, и у него наконец-то разумная цена. Если вы когда‑либо хотели получить те плавные слежащие кадры и ракурсы сверху, которые видите в влогах о путешествиях и в TikTok, но не хотите возиться с полноразмерным дроном, этому предложению стоит присмотреться. HOVERAir X1 PROMAX — компактный автономно летающий дрон с камерой, созданный, чтобы жить в вашей сумке и снимать за вас. […] Вскоре вы сможете получать уведомления с iPhone на смарт‑часах Galaxy. Вскоре вы сможете получать уведомления с iPhone на смарт‑часах Galaxy. Apple только что выпустила первую бета‑сборку iOS 26.3, представляющую несколько новых функций, которые появятся на совместимых iPhone. Обновление добавляет новый инструмент переноса, предназначенный для более бесшовного перехода на устройство Android, раздел обоев «Погода» для настройки экрана блокировки и, что наиболее заметно, поддержку просмотра уведомлений iPhone на […] «Moonbound» от НАСА раздувает ажиотаж вокруг эпической миссии «Артемида II». «Moonbound» от НАСА раздувает ажиотаж вокруг эпической миссии «Артемида II». С учётом того, что первый за пять десятилетий запуск НАСА к Луне может состояться уже через несколько месяцев, космическое агентство только что выпустило первый эпизод нового шоу, посвящённого широко ожидаемой миссии. «Moonbound — Прокладывая курс» длится 22 минуты и предлагает глубокое погружение в подготовку, которая ведётся […] Asus теперь предлагает Nvidia GeForce RTX 5060 в двух новых вариантах. Asus теперь предлагает Nvidia GeForce RTX 5060 в двух новых вариантах. Asus предлагает два новых варианта RTX 5060 с переосмысленным физическим дизайном, при этом характеристики в основном остались неизменными. Благодаря более тонкому профилю и обновлённым разъёмам варианты EVO ориентированы на сборщиков компактных ПК. Threads от Meta усиливает акцент на Сообществах, а также вводит значок «Чемпион» и метки профиля Threads от Meta усиливает акцент на Сообществах, а также вводит значок «Чемпион» и метки профиля Threads от Meta активно выходит в тематические пространства с расширенным развёртыванием функции «Сообщества» и экспериментальными значками для выдающихся участников.

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Новый бенчмарк Google FACTS показывает, что лучшие современные чат-боты на базе ИИ достигают лишь примерно 69% точности. Даже такие топ-модели, как Gemini 3 Pro, по-прежнему ошибаются в фактах в одной трети случаев, что вызывает новые опасения у компаний, ставящих на надёжность ИИ.