Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

      Новый бенчмарк Google FACTS показывает, что лучшие современные чат-боты на базе ИИ достигают лишь примерно 69% точности. Даже такие топ-модели, как Gemini 3 Pro, по-прежнему ошибаются в фактах в одной трети случаев, что вызывает новые опасения у компаний, ставящих на надёжность ИИ.

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Другие статьи

Threads от Meta усиливает акцент на Сообществах, а также вводит значок «Чемпион» и метки профиля Threads от Meta усиливает акцент на Сообществах, а также вводит значок «Чемпион» и метки профиля Threads от Meta активно выходит в тематические пространства с расширенным развёртыванием функции «Сообщества» и экспериментальными значками для выдающихся участников. Эта колонка Sony Ult Tower 9 для вечеринок стоит 699 долларов и создана, чтобы раскачать комнату. Эта колонка Sony Ult Tower 9 для вечеринок стоит 699 долларов и создана, чтобы раскачать комнату. Если ваш нынешний Bluetooth-динамик перестаёт слышно, как только люди начинают разговаривать, это тот апгрейд, который полностью меняет атмосферу. Sony ULT Tower 9 (SRSULT900) — полноразмерная беспроводная колонка для вечеринок, созданная для мощного, наполняющего комнату звука, глубокого баса и всего того света и эффектов, которых вы ожидаете за такую цену. При текущем предложении […] Microsoft Copilot незаметно появляется на телевизорах LG, и его нельзя удалить Microsoft Copilot незаметно появляется на телевизорах LG, и его нельзя удалить Владельцы телевизоров LG обнаруживают Microsoft Copilot на своих домашних экранах после обновления программного обеспечения. Помощник ИИ устанавливается автоматически и не может быть удалён, что подчёркивает, как функции ИИ всё чаще становятся постоянной частью платформ умных телевизоров. Серия OnePlus Turbo выходит, чтобы решить ваши проблемы с батареей и играми. Серия OnePlus Turbo выходит, чтобы решить ваши проблемы с батареей и играми. OnePlus подтвердила серию OnePlus Turbo, обещая производительность уровня флагманов, выдающуюся автономность и ориентацию на игры при более низкой цене. Технические характеристики, цены и дата запуска пока неизвестны. Вскоре вы сможете получать уведомления с iPhone на смарт‑часах Galaxy. Вскоре вы сможете получать уведомления с iPhone на смарт‑часах Galaxy. Apple только что выпустила первую бета‑сборку iOS 26.3, представляющую несколько новых функций, которые появятся на совместимых iPhone. Обновление добавляет новый инструмент переноса, предназначенный для более бесшовного перехода на устройство Android, раздел обоев «Погода» для настройки экрана блокировки и, что наиболее заметно, поддержку просмотра уведомлений iPhone на […] «Moonbound» от НАСА раздувает ажиотаж вокруг эпической миссии «Артемида II». «Moonbound» от НАСА раздувает ажиотаж вокруг эпической миссии «Артемида II». С учётом того, что первый за пять десятилетий запуск НАСА к Луне может состояться уже через несколько месяцев, космическое агентство только что выпустило первый эпизод нового шоу, посвящённого широко ожидаемой миссии. «Moonbound — Прокладывая курс» длится 22 минуты и предлагает глубокое погружение в подготовку, которая ведётся […]

Google выяснил, что ИИ-чатботы точны лишь на 69%… в лучшем случае

Новый бенчмарк Google FACTS показывает, что лучшие современные чат-боты на базе ИИ достигают лишь примерно 69% точности. Даже такие топ-модели, как Gemini 3 Pro, по-прежнему ошибаются в фактах в одной трети случаев, что вызывает новые опасения у компаний, ставящих на надёжность ИИ.