Llama 4: открытые ИИ-модели Meta догоняют лидеров рынка

В последние несколько лет мир искусственного интеллекта сместился от культуры открытого сотрудничества к доминированию тщательно охраняемых проприетарных систем. Компания OpenAI, в названии которой буквально заложено слово «открытый», после 2019 года перешла к сохранению своих самых мощных моделей в секрете. Конкуренты, такие как Anthropic и Google, аналогичным образом создавали передовые ИИ за стенами API, доступные только на их условиях. Этот закрытый подход частично оправдывался соображениями безопасности и коммерческими интересами, но он заставил многих в сообществе сожалеть об утрате раннего духа открытого исходного кода.

Теперь этот дух возвращается. Недавно выпущенные Meta модели Llama 4 сигнализируют о смелой попытке возродить ИИ с открытым исходным кодом на самом высоком уровне, и даже традиционно закрытые игроки принимают это к сведению. Генеральный директор OpenAI Сэм Альтман недавно признает, что компания оказалась «не на той стороне истории» в отношении открытых моделей, и объявляет о планах по созданию «мощного нового варианта GPT-4 с открытыми весами». Иначе говоря, ИИ с открытым исходным кодом наносит ответный удар, а значение и ценность понятия «открытый» эволюционируют.

Meta представила Llama 4 как еще один прямой вызов новым моделям от тяжеловесов ИИ, позиционируя его как альтернативу с открытыми весами. Llama 4 выходит сегодня в двух вариантах – Llama 4 Scout и Llama 4 Maverick – с впечатляющими техническими характеристиками. Обе являются моделями типа «смесь экспертов» (MoE), которые активируют только часть своих параметров для каждого запроса, что позволяет достичь огромного общего размера без непомерных затрат на вычисления во время работы. Scout и Maverick используют по 17 миллиардов «активных» параметров (та часть, которая работает над конкретным вводом), но благодаря MoE, Scout распределяет их между 16 экспертами (всего 109 миллиардов параметров), а Maverick – между 128 экспертами (всего 400 миллиардов параметров). В результате модели Llama 4 демонстрируют внушительную производительность и обладают уникальными преимуществами, которых нет даже у некоторых закрытых моделей.

Например, Llama 4 Scout может похвастаться лучшим в отрасли контекстным окном в 10 миллионов токенов, что на порядки превосходит большинство конкурентов. Это означает, что модель может обрабатывать и анализировать действительно огромные документы или базы кода за один раз. Несмотря на свой масштаб, Scout достаточно эффективен, чтобы работать на одном графическом процессоре H100 при сильном квантовании, намекая на то, что разработчикам не понадобится суперкомпьютер для экспериментов с ним. Тем временем Llama 4 Maverick настроен на максимальную производительность. Ранние тесты показывают, что Maverick не уступает или превосходит лучшие закрытые модели в задачах рассуждения, кодирования и компьютерного зрения. Фактически, Meta уже намекает на еще более крупную модель, Llama 4 Behemoth, находящуюся в разработке, которая, по внутренним данным, «превосходит GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro по нескольким тестам STEM». Посыл ясен: открытые модели больше не являются второсортными; Llama 4 нацелен на статус самой современной технологии.

Не менее важно и то, что Meta сделала Llama 4 немедленно доступным для скачивания и использования. Разработчики могут получить Scout и Maverick с официального сайта или Hugging Face по лицензии Llama 4 Community License. Это означает, что любой – от хакера-одиночки до компании из списка Fortune 500 – может изучить модель изнутри, доработать ее под свои нужды и развернуть на собственном оборудовании или в облаке. Это резкий контраст с проприетарными предложениями, такими как GPT-4o от OpenAI или Claude 3.7 от Anthropic, которые предоставляются через платные API без доступа к базовым весам модели. Meta подчеркивает, что открытость Llama 4 направлена на расширение возможностей пользователей, заявляя, что компания делится первыми моделями семейства Llama 4, которые позволят людям создавать более персонализированные мультимодальные приложения. Другими словами, Llama 4 – это набор инструментов, предназначенный для разработчиков и исследователей по всему миру. Выпуская модели, способные конкурировать по возможностям с такими, как GPT-4 и Claude, Meta возрождает идею о том, что первоклассный ИИ не обязательно должен скрываться за платным доступом.

Meta представляет Llama 4 в возвышенных, почти альтруистических тонах. Генеральный директор Марк Цукерберг недавно объявляет, что их модель искусственного интеллекта с открытым исходным кодом Llama была загружена более миллиарда раз, добавляя, что «открытие исходного кода моделей ИИ необходимо для обеспечения доступа людей во всем мире к преимуществам ИИ». Такая подача рисует Meta как знаменосца демократизации ИИ – компанию, готовую поделиться своими лучшими моделями ради общего блага. И действительно, популярность семейства Llama подтверждает это: модели были загружены в поразительных масштабах (число загрузок выросло с 650 миллионов до 1 миллиарда всего за несколько месяцев), и они уже используются в производственных процессах такими компаниями, как Spotify, AT&T и DoorDash.

Meta с гордостью отмечает, что разработчики ценят «прозрачность, настраиваемость и безопасность» открытых моделей, которые они могут запускать самостоятельно, что «помогает достичь новых уровней креативности и инноваций» по сравнению с API-интерфейсами типа «черный ящик». В принципе, это звучит как применение старой этики программного обеспечения с открытым исходным кодом (вспомним Linux или Apache) к ИИ – однозначная победа для сообщества. Однако нельзя игнорировать стратегический расчет, стоящий за этой открытостью. Meta – не благотворительная организация, и «открытый исходный код» в этом контексте имеет оговорки. Примечательно, что Llama 4 выпускается по специальной лицензии сообщества Llama 4 Community License, а не по стандартной разрешительной лицензии, поэтому, хотя веса модели можно использовать бесплатно, существуют ограничения (например, для некоторых ресурсоемких сценариев использования может потребоваться разрешение, а сама лицензия является «проприетарной» в том смысле, что она разработана Meta). Это не соответствует определению открытого исходного кода, одобренному Open Source Initiative (OSI), что побудило некоторых критиков утверждать, что компании злоупотребляют этим термином.

На практике подход Meta часто описывается как «ИИ с открытыми весами» или «source-available»: код и веса находятся в открытом доступе, но Meta все еще сохраняет некоторый контроль и не раскрывает все (например, данные для обучения). Это не умаляет полезности для пользователей, но показывает, что Meta открыта стратегически – сохраняя ровно столько контроля, чтобы защитить себя (и, возможно, свое конкурентное преимущество). Многие фирмы навешивают ярлык «открытый исходный код» на модели ИИ, умалчивая о ключевых деталях, что подрывает истинный дух открытости. Зачем Meta вообще понадобилась открытость? Конкурентная среда дает подсказки. Выпуск мощных моделей бесплатно может быстро создать широкую базу пользователей среди разработчиков и предприятий – французский стартап Mistral AI сделал именно это со своими ранними открытыми моделями, чтобы завоевать авторитет как лаборатория высшего уровня.

Насыщая рынок Llama, Meta обеспечивает своей технологии статус фундаментальной в экосистеме ИИ, что может принести дивиденды в долгосрочной перспективе. Это классическая стратегия «принять и расширить»: если все используют вашу «открытую» модель, вы косвенно устанавливаете стандарты и, возможно, даже направляете людей к вашим платформам (например, продукты-помощники Meta AI используют Llama). Существует также элемент PR и позиционирования. Meta получает возможность играть роль благосклонного новатора, особенно в контрасте с OpenAI, которая столкнулась с критикой за свой закрытый подход. Фактически, изменение позиции OpenAI в отношении открытых моделей частично подчеркивает, насколько эффективным был шаг Meta. После того как в январе появилась прорывная китайская открытая модель DeepSeek-R1 и обогнала предыдущие модели, Альтман указал, что OpenAI не хочет оставаться «не на той стороне истории». Теперь OpenAI обещает в будущем открытую модель с сильными возможностями рассуждения, что знаменует смену отношения. Трудно не заметить влияние Meta в этом сдвиге. Позиция Meta в отношении открытого исходного кода является одновременно искренней и стратегической: она действительно расширяет доступ к ИИ, но это также умный ход, чтобы обойти конкурентов и сформировать будущее рынка на условиях Meta.

Для разработчиков возрождение открытых моделей, таких как Llama 4, – это глоток свежего воздуха. Вместо того чтобы быть привязанными к экосистеме и тарифам одного поставщика, у них теперь есть возможность запускать мощный ИИ на собственной инфраструктуре или свободно настраивать его. Это огромное благо для предприятий в чувствительных отраслях – таких как финансы, здравоохранение или государственное управление, – которые опасаются передавать конфиденциальные данные в чужой «черный ящик». С Llama 4 банк или больница могут развернуть современную языковую модель за собственным брандмауэром, дообучая ее на частных данных, не передавая ни одного токена внешнему субъекту. Существует также преимущество в стоимости. В то время как плата за использование API для топовых моделей может стремительно расти, открытая модель не имеет платы за использование – вы платите только за вычислительные мощности для ее запуска. Компании, которые наращивают интенсивные рабочие нагрузки ИИ, могут значительно сэкономить, выбрав открытое решение, которое они могут масштабировать внутри компании.

Неудивительно, что мы наблюдаем растущий интерес к открытым моделям со стороны предприятий; многие начали понимать, что контроль и безопасность ИИ с открытым исходным кодом лучше соответствуют их потребностям, чем универсальные закрытые сервисы. Разработчики также выигрывают в плане инноваций. Имея доступ к внутренностям модели, они могут дорабатывать и улучшать ИИ для нишевых областей (юриспруденция, биотехнологии, региональные языки – что угодно) способами, которые закрытый API никогда не сможет обеспечить. Взрывной рост проектов, созданных сообществом вокруг более ранних моделей Llama – от чат-ботов, дообученных на медицинских знаниях, до любительских мобильных приложений, работающих с миниатюрными версиями – доказал, как открытые модели могут демократизировать эксперименты.

Однако ренессанс открытых моделей также поднимает сложные вопросы. Действительно ли происходит «демократизация», если только те, кто обладает значительными вычислительными ресурсами, могут запустить модель с 400 миллиардами параметров? Хотя Llama 4 Scout и Maverick снижают планку требований к оборудованию по сравнению с монолитными моделями, они все еще тяжеловесны – на это обращают внимание некоторые разработчики, чьи ПК не могут справиться с ними без помощи облака. Надежда заключается в том, что такие методы, как сжатие моделей, дистилляция или меньшие варианты экспертов, позволят сделать мощь Llama 4 доступной в более компактных размерах. Еще одна проблема – злоупотребление. OpenAI и другие долгое время утверждали, что открытый выпуск мощных моделей может дать инструменты злоумышленникам (для генерации дезинформации, вредоносного кода и т.д.).

Эти опасения сохраняются: Claude или GPT с открытым исходным кодом могут быть использованы не по назначению без фильтров безопасности, которые компании применяют в своих API. С другой стороны, сторонники утверждают, что открытость также позволяет сообществу выявлять и устранять проблемы, делая модели со временем более надежными и прозрачными, чем любая секретная система. Есть свидетельства того, что сообщества открытых моделей серьезно относятся к безопасности, разрабатывая собственные защитные механизмы и обмениваясь передовым опытом, но это постоянное противоречие. Становится все более очевидным, что мы движемся к гибридному ландшафту ИИ, где открытые и закрытые модели сосуществуют, влияя друг на друга. Закрытые провайдеры, такие как OpenAI, Anthropic и Google, пока сохраняют преимущество в абсолютной производительности – на данный момент. Действительно, по состоянию на конец 2024 года исследования показывают, что открытые модели отстают примерно на год от самых лучших закрытых моделей по возможностям. Но этот разрыв быстро сокращается.

На сегодняшнем рынке «ИИ с открытым исходным кодом» больше не означает просто любительские проекты или старые модели – теперь это основа стратегии ИИ для технологических гигантов и стартапов. Запуск Llama 4 от Meta является мощным напоминанием об эволюционирующей ценности открытости. Это одновременно философская позиция в защиту демократизации технологий и тактический ход в битве с высокими ставками в отрасли. Для разработчиков и предприятий это открывает новые двери для инноваций и автономии, хотя и усложняет принятие решений новыми компромиссами. А для всей экосистемы это вселяет надежду, что блага ИИ не будут сосредоточены в руках нескольких корпораций – если этика открытого исходного кода сможет удержать свои позиции.

 

Малые ИИ-модели бросают вызов гигантам: эра эффективного разума

Фотонные чипы: революция в ИИ-вычислениях с помощью света

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *