Новый этап развития искусственного интеллекта, известный как Agentic AI, обещает кардинально изменить различные отрасли. Эти системы способны не только воспринимать окружающую среду, планировать действия и адаптироваться, но и обучаться, выходя за рамки традиционных, основанных на правилах, алгоритмов. В отличие от статичных систем, Agentic AI использует генеративный ИИ для более глубокого анализа и автономного принятия решений.
Однако возникает закономерный вопрос: кто будет контролировать этих автономных агентов во время их работы? Кто будет отслеживать, куда они направляются и какие данные используют для выполнения задач? Оказывается, решение этой ультрасовременной проблемы может лежать в технологии, существующей уже несколько десятилетий, — платформах наблюдаемости (observability platforms).
Платформа наблюдаемости представляет собой комплексный набор инструментов, разработанный для обеспечения глубокой видимости производительности, состояния и поведения сложных систем и приложений. Она позволяет ИТ-специалистам собирать, хранить, анализировать и визуализировать данные из различных источников, включая метрики, логи и трассировки (известные под акронимом MELT). Этот централизованный подход дает командам возможность получать информацию о поведении системы в реальном времени, диагностировать проблемы и принимать обоснованные решения для повышения производительности и надежности. Ключевые функции таких платформ включают управление логами для выявления закономерностей и аномалий, мониторинг критических системных показателей, таких как использование ЦП и памяти, распределенную трассировку для выявления узких мест в запросах пользователей, а также информационные панели и визуализации для быстрой оценки данных. Кроме того, используются алгоритмы ИИ и машинного обучения для обнаружения аномалий в реальном времени. По сути, платформы наблюдаемости обеспечивают проактивный мониторинг и устранение неполадок в сложных ИТ-средах.
Синергия между Agentic AI и наблюдаемостью имеет решающее значение для обеспечения ответственного внедрения ИИ. Наблюдаемость дает представление о том, что происходит, в то время как AIOps (Искусственный интеллект для ИТ-операций), использующий агентные возможности, объясняет, почему это происходит, и предпринимает действия для исправления ситуации. Эта комбинация преобразует необработанные сигналы в полезные выводы и автоматизированные реакции, что снижает сложность и ускоряет решение проблем.
AIOps использует ИИ, включая машинное обучение и аналитику, для автоматизации, оптимизации и упорядочивания ИТ-операций. Это помогает ИТ-командам быстро выявлять и устранять замедления и сбои, часто проактивно, обеспечивая сквозную видимость и контекст в различных ИТ-средах. Благодаря генеративному ИИ, AIOps также внедряет возможности автономного принятия решений, позволяя системам обнаруживать, диагностировать и устранять проблемы без вмешательства человека. Платформы наблюдаемости собирают всесторонние данные о состоянии системы, а AIOps анализирует эти данные, предоставляя действенные идеи и автоматизируя ответные меры. Вместе они улучшают управление инцидентами, сокращая время обнаружения и решения, обеспечивая проактивное решение проблем с помощью прогнозной аналитики и поддерживая мониторинг в реальном времени и автономные операции.
Однако внедрение наблюдаемости для Agentic AI сопряжено с трудностями. Билл Хайнлайн, технический директор Chronosphere, сообщает Reworked, что одной из самых больших проблем является изменчивость данных наблюдения. Он предлагает компаниям, выбирающим модели ИИ для задач наблюдаемости, рассмотреть стандартные модели данных, такие как OTEL, чтобы сделать телеметрию менее вариативной. Инструменты, использующие Agentic AI, потребуют большей прозрачности в своих ответах, чтобы укрепить доверие и позволить уточнять их логику. Хайнлайн утверждает, что подходы по типу «черного ящика», скрывающие, как технология приходит к ответу, приведут к потере доверия. Инструменты должны «показывать свою работу», чтобы быть надежными. Он добавляет, что сфера наблюдаемости продолжает стремительно расти, и размер сред означает, что объемы данных и накладные расходы на анализ также будут расти. Без решений на базе ИИ можно достичь точки, когда быстрая интерпретация станет невозможной, что может стать фактором конкурентного различия. Тем не менее, Хайнлайн считает, что существует множество вариантов использования ИИ для улучшения наблюдаемости уже сегодня, многие из которых полагаются на существующие возможности ИИ, такие как сопоставление с образцом и обнаружение аномалий, если компании приняли стандартную телеметрию вроде OTEL.
Существуют и проблемы, связанные с самими платформами. Лиран Хасон, вице-президент по ИИ в Coralogix, рассказал Reworked, что традиционные платформы могут быть медленными, дорогими и неэффективными для получения информации в реальном времени, что становится серьезной проблемой при работе с автоматизацией на основе ИИ, где скорость и точность критически важны. Хасон указывает на ключевые проблемы, с которыми сталкивается бизнес: проблемы масштабируемости (сможет ли система наблюдаемости справиться с ростом возможностей ИИ), сложности интеграции (многие платформы плохо интегрируются с существующими инструментами ИИ) и риск привязки к поставщику (закрытые платформы ограничивают гибкость). Также важен баланс между стоимостью, хранением данных и получаемыми знаниями. Хасон заключает, что компаниям необходимо тщательно оценивать свои платформы наблюдаемости, чтобы убедиться в их экономической эффективности, масштабируемости и гибкости для поддержки автоматизации на основе ИИ.
Роджерс Джеффри Лео Джон, соучредитель и технический директор DataChat, отмечает, что наблюдаемость должна развиваться параллельно с моделями ИИ. В отличие от статичных моделей, автономные системы требуют отслеживания не только показателей производительности, но и изменений целей, обоснований решений и возникающего поведения для гарантии безопасности и надежности. Серьезной проблемой является неожиданное поведение и циклы обратной связи, вызывающие накапливающиеся ошибки. Эффективный мониторинг должен сосредоточиться на непрерывном анализе поведения, обнаружении аномалий и прогнозировании траекторий. Джон подчеркивает, что для получения значимых выводов необходимо смотреть глубже базовых метрик, чтобы понять, как меняются модели, как принимаются решения ИИ и соответствует ли система целям бизнеса. Особое внимание он уделяет необходимости прозрачности, прослеживаемости и этического соответствия, особенно в ситуациях с высокими ставками. Системы наблюдаемости должны обеспечивать проверку соответствия ценностям, мониторинг намерений и объяснимые журналы решений для повышения ответственности и доверия. По мере развития платформ наблюдаемости ИИ, Джон ожидает появления общепринятых стандартов сбора телеметрических данных, которые упростят интеграцию. Сами инструменты наблюдаемости будут активно использовать ИИ и машинное обучение, со временем улучшаясь и обучаясь на прошлых инцидентах.
Фитц Ноулан, вице-президент по ИИ и архитектуре в SmartBear, сообщил Reworked, что Agentic AI обладает большим потенциалом, но и несет более высокие риски, чем традиционные большие языковые модели (LLM). Хотя наблюдаемость может помочь, она сама по себе не лишена рисков. Ноулан говорит, что системе наблюдаемости может быть трудно определить, правильно ли работает ИИ, и следует ли подавать сигнал тревоги. Еще одна проблема — выбор правильного уровня абстракции для наблюдения и отслеживания, так как объем данных может быть слишком велик для мониторинга каждого взаимодействия ИИ. Тем не менее, Ноулан видит пользу наблюдаемости в объяснении вопросов, связанных со смещением ответа ИИ, задержкой и распределением входных данных.
Ариджит Сенгупта, основатель и генеральный директор Aible, также видит пользу в наблюдаемости. Он утверждает, что без надлежащего контроля ИИ-агенты могут быстро сойти с правильного пути и растратить ресурсы или, что еще хуже, предпринять непреднамеренные и потенциально вредные действия. Бизнесу следует избегать ловушки восприятия этих агентов как непогрешимых; они являются мощными инструментами, но требуют тщательного мониторинга и специализации. Сенгупта предлагает платформам наблюдаемости включать модели обоснования, требующие от агентов заранее формулировать свои планы, позволяя пользователям просматривать и утверждать их перед выполнением для большей прозрачности и контроля. Заглядывая в будущее, Сенгупта говорит, что организации отдают приоритет тонко настроенным, специализированным моделям для агентов, чтобы повысить надежность задач, одновременно ища фреймворки для обоснования, улучшающие интерпретируемость ИИ. Растущей проблемой он называет отсутствие опций тонкой настройки для ведущих проприетарных моделей, что может стимулировать переход к открытым альтернативам, таким как проект s1 от Stanford.