Компания OpenAI упрощает разработку ИИ-агентов

Компания OpenAI представила новые инструменты для разработчиков, призванные упростить создание ИИ-агентов, способных автономно выполнять сложные задачи. Обновление включает в себя Responses API, SDK с открытым исходным кодом Agents и встроенные инструменты для поиска в Интернете, поиска файлов и управления компьютером. Все это предназначено для оптимизации взаимодействия ИИ-систем с реальной информацией и приложениями.

ИИ-агенты определяются как системы, которые самостоятельно выполняют задачи от имени пользователей. Они могут осуществлять многоэтапные процессы, такие как исследование темы или обновление базы данных, с минимальным вмешательством человека. Цель компании — снизить барьер для разработчиков и предприятий при развертывании мощных ИИ-помощников, тем самым расширяя доступность передовых возможностей ИИ.

Новый Responses API служит единым интерфейсом для создания ИИ-агентов. Этот API объединяет в себе возможности диалога Chat Completions API от OpenAI с функциональностью использования инструментов предыдущего Assistants API. Теперь один вызов API может обрабатывать сложные многоэтапные задачи, которые могут включать вызов различных инструментов или источников знаний.

Responses API создан для упрощения разработки агентов за счет уменьшения необходимости в пользовательском коде и настройке подсказок. API предназначен для разработчиков, которые хотят легко комбинировать модели OpenAI и встроенные инструменты в своих приложениях без сложностей интеграции нескольких API или внешних поставщиков. Ранее разработчикам часто приходилось организовывать несколько вызовов API и создавать сложные подсказки, чтобы заставить ИИ-агента сделать что-то полезное, что было сложно и отнимало много времени. С новым API агент может, например, вести диалог с пользователем, искать информацию через веб-поиск, а затем писать резюме — и все это в рамках одного рабочего процесса.

Responses API доступен всем разработчикам без дополнительной платы, кроме стандартных сборов за использование. Он также обратно совместим: OpenAI продолжит поддержку Chat Completions API для простых случаев использования, в то время как более старый Assistants API будет постепенно выведен из эксплуатации к середине 2026 года, поскольку его функции будут включены в Responses API.

Запуск также включает Agents SDK, набор инструментов для управления рабочими процессами одного или даже нескольких взаимодействующих ИИ-агентов. OpenAI сделала этот SDK с открытым исходным кодом, что позволяет разработчикам и предприятиям проверять код и даже интегрировать модели, не относящиеся к OpenAI, в свои агентские системы. Компания может координировать работу агента, который использует GPT-4 от OpenAI, вместе с другим агентом, работающим на другой модели ИИ, в рамках одной и той же системы.

Agents SDK ориентирован на оркестровку рабочих процессов – отслеживание того, что делает агент и как он передает задачи. Он предоставляет встроенные механизмы для: настройки ИИ-агентов с предопределенными ролями или инструкциями для конкретных задач, передачи задач между несколькими агентами или процессами на основе контекста (например, один агент собирает данные, а другой анализирует их), обеспечения безопасности агента в определенных пределах с помощью инструментов проверки ввода и модерации контента для предотвращения нежелательных результатов, пошагового мониторинга и отладки действий агента, что помогает разработчикам понимать решения и повышать производительность.

Этот инструментарий может упростить сложные сценарии использования, такие как боты поддержки клиентов, многоэтапные помощники по исследованиям, рабочие процессы создания контента, агенты проверки кода или автоматизация поиска потенциальных клиентов. Открывая исходный код SDK, OpenAI поощряет вклад сообщества и внедрение в корпоративных средах, где важны прозрачность и возможность самостоятельного размещения компонентов. Такие компании, как Coinbase и Box, уже экспериментируют с Agents SDK для создания инструментов исследования и извлечения данных на базе ИИ.

Responses API поставляется с тремя встроенными инструментами, которые подключают ИИ к внешним данным и действиям: веб-поиск (позволяет ИИ-агенту выполнять поиск в Интернете в режиме реального времени и получать актуальную информацию с указанием источников), поиск файлов (позволяет агенту быстро просматривать большие коллекции документов или данных, предоставленных разработчиком, чтобы найти релевантную информацию) и использование компьютера (новая возможность (в настоящее время находится в стадии предварительного просмотра), которая позволяет ИИ-агенту выполнять действия на компьютере, как если бы это был пользователь, работающий с машиной).

Интегрируя эти инструменты, ИИ-агенты могут не только обдумывать проблему, но и действовать – будь то поиск информации, извлечение конкретных данных или манипулирование цифровой средой. Все это можно организовать через Responses API унифицированным образом, вместо того, чтобы требовать отдельных сервисов или ручной интеграции.

Аналитики говорят, что этот запуск может ускорить внедрение ИИ-агентов в различных отраслях за счет снижения технических барьеров. Для бизнеса привлекательность этих новых инструментов заключается в возможности автоматизировать и масштабировать процессы без обширной разработки на заказ. Повседневные задачи, такие как извлечение информации, обработка форм или ввод данных между приложениями, которые могли потребовать значительного кодирования или нескольких программных систем, теперь потенциально могут обрабатываться ИИ-агентами, использующими строительные блоки OpenAI.

Шаг OpenAI является частью более широкой гонки за предоставление разработчикам возможностей создания агентов. Конкурирующие технологические фирмы и стартапы выпускают свои собственные платформы ИИ-агентов, и комплексный инструментарий OpenAI может помочь ей выделиться. Интерес к автономным ИИ-агентам растет во всем мире – например, китайский стартап Monica недавно привлек внимание своим агентом Manus, утверждая, что он может превзойти собственный прототип агента OpenAI в определенных задачах. Открывая исходный код ключевых частей своей платформы и предлагая встроенные инструменты, OpenAI реагирует на конкурентное давление, одновременно способствуя более широкому внедрению ИИ.

С точки зрения доступности, эти инструменты могут демократизировать создание передовых ИИ-систем. Небольшие компании и даже отдельные разработчики теперь могут создавать ИИ-помощников или рабочие процессы, не нуждаясь в большой исследовательской группе. Интегрированный подход и наличие примеров в документации OpenAI снижают входной барьер для новичков. OpenAI предоставляет интерфейс наблюдаемости, чтобы разработчики могли отслеживать и проверять, что делает агент, что имеет решающее значение для отладки и укрепления доверия к результатам ИИ. Ожидается, что этот акцент на удобство использования и безопасность побудит больше предприятий экспериментировать с ИИ-агентами.

ИИ-агенты могут стать такими же распространенными и необходимыми, как и присутствие в Интернете. Новые инструменты OpenAI, делая разработку агентов более доступной, могут помочь воплотить это видение в реальность, позволив гораздо более широкому сообществу разработчиков и организаций создавать своих собственных агентов.