Инвестиции в ИИ: окупаемость и скрытые риски

2024 год станет особенным для искусственного интеллекта, поскольку корпорации начнут реализовывать свои планы по расходам на ИИ. По оценкам PwC, к 2030 году ИИ добавит 15,7 триллиона долларов к мировой экономике и увеличит ВВП Северной Америки почти на 15%, и эти инвестиции начнут осуществляться в течение следующего года.

Поскольку предприятия, советы директоров и инвесторы все чаще стремятся к окупаемости инвестиций в ИИ, сейчас как никогда важно понимать результаты и затраты, связанные с искусственным интеллектом.

От интеграции до масштабирования, интенсивного сбора данных, разработки, обучения и многого другого – каковы очевидные и менее понятные затраты, к которым компании должны быть готовы на следующем этапе массового внедрения ИИ?

Один из вариантов – развертывание ИИ на собственных серверах компании (on-premise) или использование его как услуги (as-a-service). Многие до сих пор не понимают структуру затрат на ИИ, потому что он часто используется по модели «как услуга». Подобно облачным вычислениям, это позволяет предприятиям удобно увеличивать и уменьшать использование ИИ по мере необходимости. Они могут сосредоточиться на своей основной миссии и передать капитальные затраты, техническое обслуживание и другие расходы поставщикам услуг, которые получают выгоду от эффекта масштаба.

Сегодня компании, использующие ИИ таким образом, обычно платят согласованную цену за токен. Например, стоимость ряда новых моделей IBM Granite 3.0 составляет двадцать центов за миллион токенов. Такая цена во многом определяется размером модели (т.е. количеством ее параметров) и объемом вычислений, необходимых для получения результата. Однако отсутствие более глубокого понимания того, что определяет затраты на ИИ, может привести к тому, что предприятия будут принимать неоптимальные решения в отношении моделей и платформ.

Например, компания может развернуть ИИ «локально», используя собственные GPU-серверы, чтобы потенциально снизить общие затраты на вычисления по мере масштабирования, но первоначальные затраты на приобретение и управление вычислительными ресурсами будут невозвратными. Несколько графических процессоров для логического вывода могут стоить 150 000 долларов США; оплата труда специалистов по созданию и обслуживанию таких кластеров GPU может добавить еще 500 000 долларов США, и это будет лишь небольшой первоначальный взнос на текущее обучение, энергию, эксплуатационные расходы и расходы на техническое обслуживание.

Этот пример объясняет, почему большинство предприятий пропускают этап первоначальных затрат и выбирают ИИ как услугу. Он также проясняет некоторые аспекты, которые могут сделать ИИ более или менее дорогим.

Существуют три очевидных прямых затрат при использовании ИИ.

  1. Стоимость «вывода» или активного использования модели. При использовании ИИ как услуги прейскурантные цены обычно меняются в зависимости от размера модели. То же самое верно, если вы используете собственную модель, коммерческую модель или модель с открытым исходным кодом. Затраты на вывод будут варьироваться в зависимости от эффективности оборудования, но как для коммерческих, так и для моделей с открытым исходным кодом большие модели, как правило, приводят к более высоким текущим расходам. Выбор модели, размер которой соответствует вашим потребностям, является ключом к минимизации затрат.
  2. Настройка модели – или адаптация «готовой» модели к конкретным данным и потребностям вашей компании. Методы настройки модели, такие как разработка промптов, RAG, полная тонкая настройка или эффективная настройка параметров (PEFT), имеют разные затраты, преимущества и сроки. Как и настройка гитары, это регулярная практика, которая гарантирует, что ваш ИИ учитывает самые лучшие и актуальные данные. Стоимость настройки зависит от того, сколько вычислений требуется для выполнения операции, обычно плата взимается за час вычислений, а почасовая ставка зависит от типа используемого графического процессора. Следовательно, чем больше модель, тем выше стоимость настройки. Чтобы найти наиболее экономичный метод настройки, руководителям следует рассмотреть возможность настройки небольших, доверенных моделей с использованием собственных корпоративных данных для конкретных областей — в идеале найти «золотую середину» наименьшей возможной модели. Например, модель 3B, адаптированная для конкретной корпоративной задачи, может стоить в 100 раз дешевле, чем модель в 100 раз больше, и при этом достигать или превосходить производительность.
  3. Третья очевидная стоимость связана с разработкой приложений и интеграцией этих моделей в ваш стек, что влечет за собой еще один уровень затрат на разработку и развертывание.

Эти прямые затраты являются важными факторами, но они не являются исчерпывающими. Следует также учитывать ряд других «скрытых» затрат и выгод, связанных с внедрением ИИ. Одним из примеров является стоимость неспособности обеспечить ответственное внедрение ИИ, особенно в строго регулируемых средах.

В 2023 году в США действовало 25 федеральных правил в отношении ИИ — по сравнению с одним лишь 5 лет назад — и было предложено 181 законопроект, связанный с ИИ. Во всем мире упоминания ИИ в законодательных процессах в 2023 году почти удвоились и достигли почти 2200. По мере роста популярности ИИ растут юридические, нормативные и этические проблемы.

Несоблюдение нормативных требований может привести к значительным расходам для предприятий. Многие модели связаны со сложными пользовательскими лицензиями, которые требуют тщательного анализа юридической командой. Среди моделей ИИ с открытым исходным кодом некоторые используют хорошо известную лицензию Apache 2.0. Другие модели используют совершенно новые, собственные лицензии, анализ которых юридическими отделами, как минимум, требует много времени, что потенциально может привести к дополнительным расходам.

Отсутствие прозрачности в отношении данных и процесса обучения модели также может привести к скрытым затратам, потенциально приводя к нарушению прав интеллектуальной собственности и, в свою очередь, подвергая предприятия дорогостоящим судебным разбирательствам. Прозрачность данных также жизненно важна для отслеживания и управления результатами и поведением модели. Для предприятий важно понимать, почему получается тот или иной результат ИИ, и, что наиболее важно, давать им возможность исправить или улучшить его.

Прозрачный, объяснимый ИИ также помогает гарантировать, что данные не содержат ошибок, предвзятости, а также оскорбительного контента.

Проблемы с данными – это лишь одна из многих проблем, которые, если ими не управлять должным образом, могут потенциально повысить репутационные риски. Уже были скандалы с ИИ, приведшие к миллионным убыткам, изменению общественного мнения и снижению доверия инвесторов. ИИ может и должен использоваться для повышения ценности бизнеса, но без увеличения риска ненужных затрат в других областях. Некоторые модели ИИ защищают пользователей от рисков, связанных с данными, а другие – нет.

Мы все еще находимся на начальном этапе развития искусственного интеллекта. Венчурные компании и новаторы в области ИИ придерживаются политики невмешательства в отношении монетизации, и инвестиции продолжают поступать. Но для бизнеса сейчас самое время понять общие затраты – как прямые, так и косвенные – на искусственный интеллект.

Как и сама технология, модели ценообразования и продуктовый ландшафт меняются ежедневно. Но, имея представление о структуре затрат, бизнес-лидеры могут лучше понять компромиссы. Они могут лучше понять преимущества, потенциальную окупаемость и то, какие переменные можно изменить. Самое главное, они могут знать, какие вопросы задавать, и делать выбор, который приведет к явной ценности и окупаемости инвестиций в течение следующего года и в последующий период.

 

Google AI Co-Scientist: партнер для ученых будущего

Искусственный интеллект оптимизирует зарядку электромобилей

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *