Отсутствие фундамента в корпоративном ИИ: почему управление контентом может иметь большее значение, чем следующий прорыв в ИИ

TL;DR Роб Ханна из Precision Content утверждает, что корпоративный ИИ работает неэффективно, потому что организации рассматривают язык как структурированные данные. Реальной проблемой является неуправляемая документация, и команды технических публикаций уже обладают навыками, необходимыми для ее исправления. Роб Ханна отмечает, что многие инициативы корпоративного ИИ могут терять динамику, поскольку организации продолжают рассматривать язык как структурированные данные, игнорируя системы, которые делают знания надежными. Соучредитель и генеральный директор Precision Content, консалтинговой компании в области технических коммуникаций, говорит: «Долговременные команды технических публикаций уже обладают многими возможностями, необходимыми для создания масштабируемой цепочки поставок контента, поддерживающей ИИ, хотя эти команды не всегда включаются в стратегические обсуждения ИИ». Разговоры о корпоративном ИИ часто сосредоточены на все более сложных моделях, расширяющейся инфраструктуре и новых возможностях платформ. Ханна наблюдает другой паттерн, возникающий внутри организаций. «Я видел, как ИИ-ко-пилоты дают непоследовательные ответы, программы корпоративного поиска испытывают трудности с выполнением ожиданий, а помощники службы поддержки клиентов предоставляют опыт, который оставляет пользователей с желанием большей уверенности в получаемой информации», - делится он. С его точки зрения, эти результаты приглашают к более широкому обсуждению качества знаний, поддерживающих ИИ, вместо того чтобы сосредотачиваться исключительно на самой технологии. Эта точка зрения может быть рассмотрена в контексте предыдущего технологического цикла. Во время всплеска чат-ботов, который Ханна наблюдал с 2016 по 2018 год, ожидания быстро росли. В 2018 году прогнозировалось, что 25% операций службы поддержки клиентов интегрируют виртуальных помощников к 2020 году, что отражает широкую уверенность в разговорных технологиях. «Сама технология показала значительный потенциал, но многие организации обнаружили, что существующая документация не могла последовательно поддерживать значимые взаимодействия с клиентами», - утверждает Ханна. Он считает, что современный ландшафт корпоративного ИИ отражает многие из тех ранних уроков, потому что основная среда знаний часто менялась гораздо медленнее, чем технологии, предназначенные для ее использования. Несколько исследований подтверждают эту более широкую тенденцию. В статье 2019 года отмечалось, что, хотя были разработаны сотни тысяч чат-ботов, успешные развертывания за пределами относительно простых сценариев оказались значительно более сложными, чем многие ожидали. Исследование 2021 года, рассматривающее 103 реальных чат-бота, также выявило устаревшие, неполные и плохо поддерживаемые знания как повторяющиеся факторы, способствующие трудностям в реализации. По словам Ханны, эти выводы предполагают, что разговорные технологии часто зависят не меньше от надежных исходных материалов, чем от достижений в программном обеспечении. Он считает, что эта история также подчеркивает важное различие между простым обладанием документацией и обладанием пригодными знаниями. Ханна отмечает, что многие организации поддерживают обширные коллекции руководств, политик, баз знаний, учебных материалов и ресурсов поддержки. Тем не менее, эти активы могут существовать в разрозненных системах, следовать непоследовательным стандартам или содержать перекрывающиеся версии одной и той же информации. Таким образом, ИИ-системы, использующие эти среды, могут унаследовать неопределенность, которая уже существовала в экосистеме контента организации. «Галлюцинации редко начинаются внутри модели», - объясняет Ханна. «Они часто начинаются гораздо раньше, когда никто не установил, какая информация представляет собой надежный источник правды». Пример из ранней эпохи чат-ботов иллюстрирует этот принцип. Ханна указывает на бренд продуктов питания, чей сезонный виртуальный помощник добился успеха, сосредоточившись на узко определенной теме, поддерживаемой десятилетиями тщательно поддерживаемого опыта. Вместо того чтобы пытаться ответить на каждый возможный вопрос, опыт сосредоточился на авторитетных рекомендациях для конкретной потребности клиента. Ханна размышляет: «Это примечательно иронично, что чат-бот Butterball все еще считается золотым стандартом успешного разговорного ИИ, когда так много крупных организаций инвестировали и потерпели неудачу. Это демонстрирует, как успех начинается с тщательно управляемых знаний, которые отражают подлинный опыт в четко определенной области». Это приводит Ханну к другой проблеме, которую он считает заслуживающей большего внимания со стороны руководства. Инициативы ИИ часто возникают в IT-организациях или командах по анализу данных, чья экспертиза акцентирует внимание на структурированных наборах данных, аналитике и вычислительных моделях. Хотя эти возможности остаются важными, он предполагает, что они иногда побуждают организации рассматривать письменные знания как еще одно упражнение по управлению данными. Ханна проводит различие между двумя. «Данные обычно организованы в структурированные поля для вычислений, в то время как контент состоит из языка, документации, процедур, политик и инструкций, предназначенных для передачи смысла», - объясняет он. Поскольку большие языковые модели учат паттернам из письменного языка, он подчеркивает, что они эффективно работают, когда организации подготавливают контент таким образом, который отражает, как язык создается, управляется и поддерживается. Precision Content построила свою работу вокруг этой философии, помогая организациям превращать фрагментированную документацию в структурированный, многоразовый контент, который служит как людям, так и системам ИИ. С помощью структурированного авторинга, метаданных, многоразовых компонентов контента, рамок управления и стратегий управления компонентами контента компания стремится помочь предприятиям создать надежную цепочку поставок контента, способную поддерживать развивающиеся инициативы ИИ. Ханна рассматривает это как возможность поднять операции с контентом с функции публикации до важного элемента инфраструктуры корпоративных знаний. «Контент заслуживает той же дисциплины, которую организации уже применяют к разработке программного обеспечения и управлению данными», - говорит он. «Знания должны поддерживаться как инфраструктура, чтобы ИИ мог получить гораздо более прочную основу». Для Ханны этот разговор также указывает на ресурс, которым уже располагают многие организации. Команды технических публикаций регулярно управляют контролем версий, структурированным авторингом, таксономией, метаданными, многоразовыми компонентами, рабочими процессами рецензирования и управлением жизненным циклом контента. Эти возможности, отмечает он, соответствуют тому, что корпоративный ИИ все больше требует для извлечения надежной информации в масштабе. Вместо того чтобы искать исключительно дополнительные технологии, Ханна подчеркивает, что организации могут начать с признания экспертизы, уже доступной в их собственных командах документации. В конечном итоге Ханна призывает руководящие команды расширить вопросы, определяющие их стратегии, поскольку корпоративный ИИ продолжает развиваться. Он говорит: «Мы должны спросить: Какой контент является авторитетным? Кто владеет корпоративными знаниями? Где находится организационная правда? Может ли документация интерпретироваться последовательно как людьми, так и ИИ? И участвуют ли технические публикации в обсуждениях о стратегии ИИ с самого начала?» С точки зрения Ханны, вдумчивые ответы на эти вопросы могут внести такой же вклад в долгосрочный успех ИИ, как и дальнейшие достижения в самих моделях.

Другие статьи

Anthropic запускает Claude Sonnet 5, более дешевую модель агента Клод Сонет 5 предлагает производительность, близкую к Opus 4.8, по средней цене от $2/$10 за миллион токенов до 31 августа. Вот что нового.

Верховный суд рассмотрит апелляцию Apple по делу о неуважении к суду в отношении App Store в деле Epic. Верховный суд согласился рассмотреть решения нижестоящих судов, которые установили, что Apple умышленно нарушила приказ 2021 года о сборах в App Store в своей борьбе с Epic Games.

Экономика захваченного портала: как страницы входа в Wi-Fi отелей стали как вектором безопасности, так и скрытым рекламным каналом Генеральный директор KeepSolid Василий Иванов объясняет, как захваченные порталы WiFi в отелях превратились как в уязвимость безопасности, так и в программный рекламный канал, и что клиенты VPN должны с этим делать.

Clicks демонстрирует свой телефон Communicator, вдохновленный BlackBerry, в новом видео с практическим обзором. Коммуникатор Clicks за $499 имеет физическую клавиатуру, световой индикатор для фильтрованных уведомлений и будет выпущен в четвертом квартале. Новое видео показывает аппаратное обеспечение вблизи.

Стартап Chamath по разработке ИИ-кода 8090 привлек $135 миллионов Чамат Палихапития привлек 135 миллионов долларов, возглавляемых Salesforce, для своего стартапа в области ИИ 8090 и впервые с момента работы в Facebook занимает должность CEO.

BMW представляет обновленный X5 с бензиновыми, гибридными, электрическими и водородными вариантами BMW представила совершенно новый X5 с бензиновыми, дизельными, подключаемыми гибридными, электрическими и будущими водородными силовыми установками, что стало крупнейшим обновлением в истории этого внедорожника.

Отсутствие фундамента в корпоративном ИИ: почему управление контентом может иметь большее значение, чем следующий прорыв в ИИ

Генеральный директор Precision Content Роб Ханна утверждает, что неудачи корпоративного ИИ связаны с неуправляемой документацией, а не с слабыми моделями, и что команды технических публикаций обладают недостающим элементом.