Компания IBM представила новое поколение мейнфреймов IBM z17, оснащенное процессором IBM Telum II, который позиционируется как «ускоритель искусственного интеллекта». Новая система способна обрабатывать свыше 450 миллиардов ИИ-операций в день, что на 50% превосходит возможности предшественника z16, при времени отклика в одну миллисекунду. Мейнфрейм поддерживает более 250 сценариев использования ИИ, включая оценку рисков, анализ медицинских изображений, управление чат-ботами и обнаружение мошенничества.
IBM занимается производством мейнфреймов с 1952 года. Хотя само понятие «мейнфрейм» может ассоциироваться с ушедшей эпохой, современные системы этого класса оснащаются процессорами и аппаратными ускорителями, оптимизированными для задач искусственного интеллекта. Это делает их подходящей платформой для запуска генеративных ИИ-моделей непосредственно на мощностях предприятия (on-premises). Кроме того, если мейнфреймы 1950-х годов требовали площади от 2000 до 10 000 квадратных футов, то z17 занимает место не больше, чем большой холодильник.
Модель z17 обеспечивает производительность, масштабируемость и надежность, необходимые для безопасной обработки больших наборов данных в реальном времени. Это делает ее идеальным решением для предприятий со строгими требованиями к управлению данными и времени безотказной работы, особенно для использования ИИ-агентов.
Возможности и безопасность IBM z17 будут расширены за счет ряда дополнительных продуктов. Карта расширения PCIe под названием IBM Spyre Accelerator, ожидаемая в конце 2025 года, обеспечит безопасную обработку данных, позволяя ИИ-приложениям работать без необходимости передачи конфиденциальной информации за пределы платформы. Инструменты управления системой watsonx Code Assistant for Z и watsonx Assistant for Z предложат подсказки по коду в реальном времени и помогут в разрешении инцидентов, интегрируясь с IBM Z Operations Unite для быстрого обнаружения и устранения проблем с использованием оперативных системных данных. Операционная система z/OS 3.2, запланированная к выпуску в третьем квартале 2025 года, привнесет аппаратно-ускоренный ИИ, поддержку гибридных облачных сред данных и совместимость с современными методами доступа к данным. Решение для безопасности IBM Vault, основанное на технологиях приобретенной компании HashiCorp, предназначено для управления конфиденциальными данными компании во всех ее ИТ-активах. Система хранения данных IBM Storage DS8000, оптимизированная для критически важных рабочих нагрузок, дополняет z17, обеспечивая стабильную производительность, модульную архитектуру и надежную защиту данных.
Особое внимание уделяется квантово-устойчивой криптографии мейнфрейма, что отражает растущую озабоченность в области кибербезопасности. Выпуск IBM z17 на рынок запланирован на 18 июня.
Роб Лубек, директор по доходам консалтинговой компании по корпоративному ИИ RTS Labs, считает переход IBM к развертыванию генеративного ИИ на мощностях заказчика отражением растущей тенденции. По его словам, это имеет большой смысл, поскольку компании все больше фокусируются на контроле над данными и производительности в реальном времени, стремясь использовать возможности ИИ без компрометации конфиденциальной информации. Компании хотят получить мощь ИИ, но не желают, чтобы их данные покидали пределы их инфраструктуры.
Лубек отметил, что этот сдвиг особенно заметен в организациях, которым необходимо сбалансировать скорость и безопасность. Системы on-premises позволяют получать ответы в реальном времени, не отправляя данные вовне и не ожидая их возвращения. Преимущества очевидны: больше контроля, локальное хранение данных для обеспечения конфиденциальности и соответствия нормативным требованиям, а также возможность более тонкой настройки систем по сравнению с управляемыми облачными средами. Лубек подчеркнул, что это дает «просто больше гибкости». Локальный ИИ легко вписывается в гибридные облачные стратегии, где начальная разработка и масштабирование ИИ происходят в облаке, а чувствительные рабочие нагрузки, требующие большего контроля, переносятся на локальные мощности.
Лубек добавил, что недавнее представление IBM ускорителя Spyre Accelerator и процессора Telum II указывает на четкое направление – более глубокие инвестиции в специализированное оборудование для ИИ. Это является сильным индикатором того, что корпоративный ИИ – это не только инновации, но и создание правильной основы для реального масштабного развертывания.
Кевин Сюрейс, генеральный директор Appvance, сообщил, что по мере того, как организации осознают потенциальные выгоды от интеграции моделей GenAI в собственную инфраструктуру, переход к локальным решениям набирает обороты. При локальном хостинге ИИ-моделей предприятие берет на себя полную ответственность за их эксплуатацию, обновление и обслуживание. Это обеспечивает значительный уровень контроля, особенно в таких отраслях, как здравоохранение и банковское дело, где конфиденциальность и безопасность данных имеют первостепенное значение.
Сюрейс добавил, что ИИ-агенты находятся в центре этой трансформации. Хотя их потенциал очевиден, опасения препятствуют широкому внедрению. Он пояснил, что ИИ-агенты могут выполнять задачи от имени своего «владельца», от отслеживания критических точек до взаимодействия с бэк-офисными системами, что похоже на наличие еще одного сотрудника. Однако до сих пор возможности и доверие являются серьезными препятствиями, и локальное развертывание поможет снять большую часть этих опасений. Для регулируемых отраслей развертывание в локальной среде или частном облаке – это не просто предпочтение, а необходимость. Хотя в будущем эти предприятия могут перейти к гибридным или полностью облачным решениям, на данный момент существует потребность в локальных моделях.
Обширный опыт IBM в области мейнфреймов дает компании преимущество для доминирования в сфере корпоративного ИИ. Сюрейс отметил, что IBM присутствует во всех крупных предприятиях с мейнфреймами для унаследованных приложений, и у многих предприятий таких систем тысячи. Поэтому не стоит списывать IBM со счетов как крупную силу в корпоративном сегменте. Предложение аппаратных опций с ускорением ИИ ставит их в лидирующую позицию в большинстве предприятий, где доверие, локальное и гибридное облако имеют решающее значение, и где IBM уже имеет значительное присутствие.
Майн Байрак Озмен, сооснователь и директор по маркетингу Rierino, указала, что локальное развертывание GenAI обеспечивает повышенный контроль и управление, близость к данным, сверхнизкую задержку и возможность применения пользовательских политик безопасности. Все это критически важно для таких процессов с высокими ставками, как обнаружение мошенничества, проверка контрактов или оптимизация запасов в реальном времени, где имеют значение даже миллисекунды. Задержка – это не просто проблема производительности, это функциональное ограничение, мешающее ИИ-агентам работать корректно или с максимальной эффективностью. Даже небольшие задержки могут нарушить цикл обратной связи контекстно-зависимого ИИ, что существенно сказывается на итоговых бизнес-показателях. Например, в электронной коммерции покупатели ожидают мгновенных результатов при поиске или получении рекомендаций с помощью ИИ.
Озмен пояснила, что задержка в несколько сотен миллисекунд может ухудшить пользовательский опыт или напрямую повлиять на конверсию. В таких случаях внедрение ИИ становится затруднительным не потому, что моделям не хватает интеллекта, а потому, что они не могут реагировать достаточно быстро, чтобы быть полезными. IBM z17 решает эту проблему, приближая выполнение ИИ-операций (inference) к уровню данных с помощью процессора Telum II и ускорителя Spyre Accelerator. Эта тесная интеграция сокращает перемещение данных и позволяет ИИ-агентам взаимодействовать с основными системами в реальном времени, не покидая безопасную среду мейнфрейма.
Озмен считает фокус на поддержке агентного ИИ разумным шагом, так как это соответствует более широкой тенденции перехода ИИ от пассивного выполнения команд к автономным действиям в рамках корпоративных рабочих процессов.
Однако у локального хостинга GenAI есть и компромиссы, включая стоимость, сложность и гибкость моделей. Озмен отметила, что запуск генеративного ИИ локально означает инвестиции в специализированное оборудование, электропитание и охлаждение, а также требует определенного уровня операционной экспертизы для оптимального управления этими ресурсами. Она также указала на сложности с поддержанием моделей в актуальном состоянии и обеспечением их корректной работы, если они не интегрированы в более широкий цикл обновлений. Еще одним соображением является темп инноваций в области больших языковых моделей (LLM). Локальные модели могут отставать от новейших возможностей, доступных в облаке, например, в части производительности логических выводов или настройки инструкций, если не прилагать специальных усилий для постоянного улучшения и оценки.
Лубек также признал, что локальное развертывание подходит не всем. Первоначальные инвестиции, необходимость в квалифицированном персонале и долгосрочная стратегия могут сделать его менее привлекательным для некоторых. По его мнению, небольшим компаниям или командам, которые просто хотят тестировать и экспериментировать, облако может показаться лучшей отправной точкой. Но для тех, кто создает системы промышленного уровня и нуждается в строгом контроле данных, это разумный выбор.
Байрак Озмен видит будущее безопасного ИИ распределенным, где определенные рабочие нагрузки, особенно связанные с конфиденциальными данными, выполняются локально. Она также ожидает сдвига в сторону выполнения ИИ-операций по месту нахождения данных. По ее заключению, по мере того как агентный ИИ будет все глубже встраиваться в бизнес-логику, локальное развертывание станет критически важным для такого рода безопасной и контекстно-зависимой автоматизации.