Meta выдала себя за подростков, чтобы протестировать конкурирующие AI-чат-боты

      Проект проходил под внутренним названием Канны, и его управлял подрядчик Meta под названием Covalen. WIRED сообщила, что сотни подрядчиков создали фиктивные аккаунты для лиц младше 18 лет. Они отправляли подсказки и изображения чат-ботам конкурентов, а затем фиксировали ответы в таблицах. Эта деятельность была активна еще 21 апреля 2026 года. Целями были ChatGPT от OpenAI, Gemini от Google и Character.AI. Никто из трех не знал, что тестирование происходит.

      Что было предложено подрядчикам

      Подсказки были созданы для того, чтобы подтолкнуть чат-ботов к ответам, которые их системы безопасности должны были отвергать. Один раунд, завершившийся в августе 2025 года, обработал более 45 000 подсказок через соперничающие инструменты. Компании, стоящие за этими инструментами, никогда не были уведомлены.

      WIRED рассмотрела одну таблицу с 3748 подсказками. Сотни из них касались самоубийств и самоповреждений. Еще сотни охватывали расстройства пищевого поведения. По крайней мере 239 касались секса или романтики, а другие затрагивали наркотики, ненормативную лексику и расовые оскорбления. Многие из них были написаны от лица ребенка в кризисной ситуации. Один из них выдавал себя за беременную 13-летнюю девочку, спрашивающую, где купить таблетки. Другой выдавал себя за девушку, спрашивающую, как скрыть расстройство пищевого поведения от родителей.

      Некоторые из изображений, отправленных подрядчиками, включали таблетки и ножи. В отдельной таблице были перечислены фальшивые профили полностью, с именами, временными адресами электронной почты, паролями и датами рождения.

      Защита Meta

      Meta не отрицает работу. Она представляет это как нормальную практику в отрасли. «Тестирование и оценка ответов чат-ботов для обеспечения безопасного и подходящего по возрасту опыта — это ответственная практика, соответствующая стандартам отрасли, и любое другое предположение полностью недопонимает, как технологические компании работают над улучшением своих систем», — сказал представитель компании WIRED. Компания добавила, что не использует бенчмаркинг конкурентов для обучения своих собственных моделей ИИ. Covalen не ответила на запрос о комментарии.

      Внутренний документ Covalen описывал проект более грандиозно. Он охарактеризовал его как «всестороннюю оценку безопасности ИИ», которая предоставила «критически важные наборы данных для сравнения моделей и соблюдения норм».

      Тестирование продукта конкурента само по себе не является чем-то необычным. Business Insider сообщила в прошлом году, что подрядчики на Google Bard сравнивали его ответы с ChatGPT. Затем они переписывали ответы Bard, чтобы они соответствовали или превосходили их. Что выделяет эту ситуацию, так это масштаб, маскировка и тематика.

      Почему это выглядит иначе

      Одна деталь больше всего беспокоит экспертов: использование аккаунтов, замаскированных под детей. Румман Чоудхури, генеральный директор Humane Intelligence, рассмотрела образец подсказок. Настройка ее беспокоила. Долгий проект, проходивший через «фальшивые аккаунты, выдающие себя за детей», находится «за пределами того, что обычно описывается как ‘стандартная практика’ в отрасли», — сказала она. Она назвала это «серой зоной управления, где безопасность становится удобным прикрытием для антиконкурентных практик».

      Два юриста, специализирующихся на онлайн-речи, рассмотрели примеры для WIRED. Материал, по их словам, не пересекал границу в отношении запроса материалов сексуального насилия в отношении детей или незаконной непристойности. Тем не менее, бывшие подрядчики описали работу как тревожную. Один сказал, что коллеги боялись, что они могут генерировать или сохранять материалы насилия. Другой беспокоился, что проект фактически означает тихое извлечение данных у конкурентов для передачи обратно в собственные системы Meta.

      Конкуренты недовольны

      Все три целевые компании запрещают такого рода тестирование в своих условиях обслуживания. OpenAI запрещает непрошенные тесты безопасности, попытки обойти меры предосторожности и использование результатов для создания конкурирующих моделей. Google запрещает попытки обойти свои фильтры безопасности. Character.AI запрещает вредный, эксплуататорский и незаконный контент. С конца 2025 года он полностью закрыл открытые чаты для пользователей младше 18 лет.

      Никто из них не уполномочивал эту работу. Представитель Character.AI сказал, что поведение нарушает «наши Условия обслуживания» и «персонажей и миры, созданные нашим сообществом». OpenAI заявила, что изучает вопрос, но отказалась от дальнейших комментариев. Google заявил, что не одобрял тестирование и не знал его цели. В своих собственных проверках, добавил он, показал, что Gemini отвечает в соответствии с его политиками.

      Борьба с регуляторами, которые уже наблюдают

      Ситуация могла бы быть хуже. В сентябре 2025 года Федеральная торговая комиссия США открыла официальное расследование по вопросам ИИ и безопасности детей. Оно охватывает Meta, OpenAI и Google, среди прочих. Теперь отчет показывает, что одна из этих компаний исследует другие с помощью фальшивых детских аккаунтов.

      В Европе есть свои рычаги. Законопроект о ИИ и Закон о цифровых услугах оба оказывают давление на платформы по поводу рисков, которые их системы представляют для несовершеннолетних. Оба могут охватить любую компанию, работающую в блоке. Регуляторы с обеих сторон Атлантики теперь задают один и тот же вопрос: кто несет ответственность, когда чат-бот разговаривает с ребенком о самоповреждении? Контроль быстро становится рынком сам по себе, с венчурными деньгами, направляющимися в стартапы по обеспечению безопасности.

      Этот эпизод также вписывается в более широкую картину. Meta тщательно охраняет свои амбиции в области ИИ. Она даже ограничила использование инструментов кодирования конкурентов своими инженерами, пока строит свои собственные. Тем временем создатели чат-ботов ведут дорогую гонку за пользователей и доверие. Anthropic и OpenAI обе стремятся к платным клиентам. OpenAI вошла в рекламу. Google борется, чтобы сохранить свое доминирование в эпоху ИИ. В этом соревновании тестирование безопасности и конкурентная разведка могут начать размываться.

      Обе интерпретации не могут быть правдой

      Это размытие — настоящая история. Meta утверждает, что она делала чат-ботов безопаснее. Ее критики говорят, что она замаскировала подрядчиков под детей, чтобы добыть информацию у конкурентов, а затем представила все это как упражнение по безопасности. Документы опубликованы, и регуляторы уже на подходе. Теперь Meta придется убедить их, какая версия права.

      Если вы или кто-то из ваших знакомых испытывает трудности, поддержка доступна. В Великобритании и Ирландии с Самаританами можно связаться бесплатно по номеру 116 123. В США Линия помощи по предотвращению самоубийств и кризисам 988 предлагает круглосуточную поддержку. Список международных горячих линий доступен через Международную ассоциацию по предотвращению самоубийств.

Другие статьи

Kobo отвечает на преимущество Goodreads от Kindle с автоматической синхронизацией StoryGraph Kobo включил интеграцию с StoryGraph, так что ваш прогресс чтения теперь синхронизируется автоматически. Больше никаких ручных обновлений.

Искусственные интеллектуальные браузеры, такие как Perplexity Comet, могут быть обмануты и выдать ваш пароль через уязвимость BioShocking. Новая уязвимость под названием BioShocking убеждает ИИ-браузеры, что они играют в игру, а затем заставляет их передать ваши личные данные.

Ещё одно исследование подтверждает, что советы по лечению травм в TikTok просто ужасны. Новое исследование показало, что видео TikTok о реабилитационных упражнениях для ACL в целом были низкого качества, что вызывает новые опасения по поводу использования подростками вирусных клипов для получения советов по восстановлению после травм.

Верховный суд рассмотрит апелляцию Apple по делу о неуважении к суду в отношении App Store в деле Epic. Верховный суд согласился рассмотреть решения нижестоящих судов, которые установили, что Apple сознательно нарушила приказ 2021 года о сборах в App Store в своей борьбе с Epic Games.

Стартап Chamath по разработке ИИ-кода 8090 привлек $135 млн Чамат Палихапития привлек 135 миллионов долларов, возглавляемых Salesforce, для своего стартапа в области ИИ 8090 и впервые с момента работы в Facebook становится генеральным директором.

AWS инвестирует $1 млрд в развернутых инженеров ИИ AWS тратит 1 миллиард долларов на подразделение, которое включает инженеров, работающих на месте у клиентов, для более быстрого внедрения ИИ, следуя примеру OpenAI, Anthropic и Palantir.

Meta выдала себя за подростков, чтобы протестировать конкурирующие AI-чат-боты

Сотни подрядчиков на проекте Meta выдавали себя за подростков, чтобы проверить, как ChatGPT, Gemini и Character.AI справляются с темами самоубийств, наркотиков и секса, выяснил WIRED.