Перестаньте общаться с ИИ, пусть они общаются друг с другом: Протокол A2A
Вы когда-нибудь просили Алексу напомнить вам отправить сообщение в WhatsApp в определенный час? А потом просто задаетесь вопросом: «Почему Алекса не может отправить сообщение сама?» Или невероятное разочарование, когда вы используете приложение для планирования поездки, только чтобы переключиться на свой календарь/сайт бронирования/тур/банковский счет вместо того, чтобы ваш ИИ-ассистент сделал это все? Что ж, именно этот разрыв между автоматизацией ИИ и человеческими действиями и призван устранить протокол агент-агент (A2A).
С появлением ИИ-агентов следующим шагом эволюции, казалось, должна была стать коммуникация. Но когда коммуникация между машинами и людьми уже налажена, что остается? Что ж, думая о создании многопользовательской экосистемы для разрушения барьеров между системами данных и приложениями, Google объявил о протоколе A2A в прошлом году в сотрудничестве с более чем 50 технологическими партнерами — открытом стандартном протоколе, который позволяет ИИ-агентам общаться, безопасно обмениваться информацией, сотрудничать и работать между агентными приложениями и сложными корпоративными рабочими процессами, независимо от их базовой технологии.
От запроса до оркестрации: как на самом деле работает A2A. 💜 Технологии ЕС. Последние новости из технологической сцены ЕС, история от нашего мудрого основателя Бориса и немного сомнительного ИИ-искусства. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас! A2A разработан на основе пяти принципов, которые являются естественными возможностями. Он позволяет агентам сотрудничать в своей естественной модальности без промежуточного инструмента, позволяя агентам сохранять свои индивидуальные возможности и независимость.
Он построен на существующих стандартах, что упрощает интеграцию с существующими ИТ-стеками, и в паре с схемами аутентификации OpenAPI (интерфейсы прикладного программирования) для гарантии безопасного сотрудничества. Он предоставляет обратную связь в реальном времени, а также асинхронные уведомления для долгосрочных операций (LRO). Наконец, он был разработан для поддержки различных модальностей, включая текст, аудио и видеопоток.
Объявление о протоколе Agent2Agent (A2A). Изображение: Google. A2A работает как посредник между «клиентом»-агентом и «удаленным» агентом. Клиентский агент запрашивает и передает задачи, в то время как удаленный агент отвечает за выполнение этих задач, ищет лучшее решение или ввод. Этот процесс включает несколько этапов и ключевых компонентов:
После получения запроса на задачу, сделанного человеком или другим ИИ-агентом, клиентский агент оценивает удаленных агентов с помощью их карточек агентов, которые представляют собой структурированные профили, описывающие личность, возможности, конечные точки обслуживания и требования к аутентификации. Затем клиентский агент выбирает наиболее подходящего агента и проходит аутентификацию в соответствии с схемой безопасности, указанной в карточке агента.
После этого устанавливается связь для завершения задачи. Задача определяется протоколом и имеет жизненный цикл, и она требует немедленного действия, или для LRO агенты общаются, чтобы оставаться синхронизированными друг с другом до завершения задачи. Результатом задачи является артефакт.
Агенты общаются друг с другом, обмениваясь контекстом, ответами, артефактами или инструкциями пользователей. Каждое сообщение включает части, которые имеют определенное содержание, например, сгенерированное изображение, позволяя агентам согласовывать правильный формат в соответствии с возможностями пользовательского интерфейса. А также другие спецификации и ошибки, которые можно найти здесь, для тех отважных душ с жаждой знаний.
Этот протокол дополняет Протокол контекста модели Anthropic (MCP) для создания надежных агентных приложений, поскольку MCP обеспечивает коммуникацию агент-инструмент, позволяя лучше понимать и обрабатывать абстрактные API, используемые в качестве инструментов, в то время как протокол A2A позволяет агентам открывать возможности друг друга, поддерживая рост агентных систем.
Почему A2A — это прорыв? Протокол A2A был создан для решения проблемы совместимости между специализированными ИИ-агентами, с учетом масштабного внедрения в корпоративном секторе. Вместо того чтобы рассматривать агентов как изолированные инструменты, как это делает MCP, A2A позволяет создать общую экосистему, где агенты могут взаимодействовать как агенты, сохраняя свои уникальные возможности и более качественные результаты.
Он также переосмысляет выполнение, позволяя настраиваемое, безопасное сотрудничество между непрозрачными агентами, сохраняя конфиденциальность данных и интеллектуальную собственность по умолчанию. По мере роста числа агентов и взаимодействий A2A решает проблему масштабируемости напрямую, позволяя бесшовную интеграцию и появление сложных ИИ-экосистем в рамках корпоративных систем, полагаясь на установленные стандарты, такие как HTTPS, и JSON-RPC, чтобы избежать изобретения основных технологий и существующих веб-стандартов для аутентификации, авторизации, безопасности, конфиденциальности, отслеживания и мониторинга.
A2A имеет приложения в самых разных отраслях, включая обслуживание клиентов, цепочку поставок, управление человеческими ресурсами, здравоохранение, исследования, образование, креативные индустрии, государственные услуги, финансовые услуги, ИТ-операции и консалтинг.
Обеспечивая сотрудничество агентов через приложения и организации, он поддерживает продвинутый анализ данных и автоматизацию задач, от проверки фона и логистики запасов до улучшенного обнаружения мошенничества и высоко персонализированных клиентских решений.
Те трения, которые мы не можем игнорировать. Несмотря на свои обещания, A2A не лишен проблем. Как и большинство распределенных систем, одной из основных проблем является безопасность. Непрерывная двусторонняя связь между агентами увеличивает угрозу безопасности на нескольких уровнях, от идентичности и сообщения до распространения контекста и управления системой.
Эта проблема подчеркивает необходимость наличия внутренней идентичности, целостности и гарантий последовательности для A2A, наряду с задачей включения этого без ущерба для его легковесного дизайна и совместимости.
Вторая ограниченность возникает на архитектурном уровне, особенно в коммуникации ИИ на корпоративном уровне. A2A в основном полагается на HTTPS и высокопроизводительные удаленные вызовы процедур (RPC) в прямой точка-точка связи.
Хотя это работает в малом масштабе, это может стать сложным и несостоятельным риском для крупных корпоративных сред. Одиночные изменения, перекрытия, сбои или неправильно направленные сообщения могут вызвать каскадные эффекты, создавая потенциальный операционный риск, если не дополнить это дополнительными механизмами оркестрации и управления.
Является ли A2A будущим ИИ? Невероятно быстрое внедрение и принятие ИИ-агентов, от ИИ-агентов до агентного ИИ, сделало необходимым возможность развиваться вместе с технологией. A2A обозначает четкий сдвиг в том, как ИИ-системы рассматриваются и проектируются, создавая экосистему для разрушения барьеров и позволяя кросс-сотрудничество между агентами.
Это, безусловно, необходимо для современности, и хотя это представляет собой вызовы и ограничения, стоит помнить, что это все еще на ранних стадиях, и улучшения придут по мере того, как протокол созревает.
Вместе с MCP и LLM A2A позволяет создать более широкий стек агентов, который предлагает возникающий шаблон для агентного ИИ: где коммуникация, выполнение и управление управляются на различных уровнях, позволяя агентам действовать в реальных системах.
Истинное значение A2A заключается в том, что оно сигнализирует о том, куда движется ИИ. Следующее поколение ИИ не будет определяться одной универсальной моделью, а взаимосвязанными экосистемами агентов, созданными для совместной работы по умолчанию.
Другие статьи
Перестаньте общаться с ИИ, пусть они общаются друг с другом: Протокол A2A
Как протокол A2A позволяет ИИ-агентам общаться друг с другом, сотрудничать и действовать автономно в различных приложениях и системах? Статья для любителей ИИ.
