ИИ-модель ESM3 создаёт новые формы жизни

В течение миллиардов лет эволюция совершенствовала жизнь на молекулярном уровне. Белки, основные строительные блоки жизни, эволюционировали, чтобы выполнять различные биологические функции, от борьбы с инфекциями до переваривания пищи. Эти сложные молекулы состоят из длинных цепочек аминокислот, расположенных в точных последовательностях, которые определяют их структуру и функции. Хотя природа создала необычайное разнообразие белков, понимание их структуры и разработка совершенно новых белков долгое время были сложной задачей для ученых.

Последние достижения в области искусственного интеллекта (ИИ) меняют наши возможности в решении некоторых из наиболее важных проблем биологии. Ранее ИИ использовался для прогнозирования того, как данная последовательность белка будет сворачиваться и вести себя – сложная задача из-за огромного количества возможных конфигураций. В последнее время ИИ продвинулся до того, что может генерировать совершенно новые белки в беспрецедентных масштабах. Этот рубеж был достигнут с помощью ESM3, мультимодальной генеративной языковой модели, разработанной компанией EvolutionaryScale. В отличие от обычных систем ИИ, предназначенных для обработки текста, ESM3 был обучен понимать последовательности, структуры и функции белков. Что делает его поистине замечательным, так это его способность имитировать 500 миллионов лет эволюции – подвиг, который привел к созданию совершенно нового флуоресцентного белка, чего никогда раньше не наблюдалось в природе.

Этот прорыв является значительным шагом на пути к тому, чтобы сделать биологию более программируемой, открывая новые возможности для разработки специализированных белков с применением в медицине, материаловедении и других областях. В сообщении, опубликованным EvolutionaryScale, рассказывается о том, как работает ESM3, чего он достиг, и почему этот прогресс меняет наше понимание биологии и эволюции.

ESM3 – это мультимодальная языковая модель, обученная понимать и генерировать белки, анализируя их последовательности, структуры и функции. В отличие от AlphaFold, которая может предсказывать структуру существующих белков, ESM3, по сути, является моделью белковой инженерии, позволяющей исследователям определять функциональные и структурные требования для разработки совершенно новых белков.

Модель обладает глубокими знаниями о последовательностях, структурах и функциях белков, а также способностью генерировать белки посредством взаимодействия с пользователями. Эта возможность позволяет модели генерировать белки, которые могут не существовать в природе, но при этом остаются биологически жизнеспособными. Создание нового зеленого флуоресцентного белка (esmGFP) является яркой демонстрацией этой возможности. Флуоресцентные белки, первоначально обнаруженные у медуз и кораллов, широко используются в медицинских исследованиях и биотехнологии. Чтобы разработать esmGFP, исследователи предоставили ESM3 ключевые структурные и функциональные характеристики известных флуоресцентных белков. Затем модель итеративно усовершенствовала дизайн, применяя подход, основанный на последовательности рассуждений, для оптимизации последовательности. В то время как естественной эволюции могут потребоваться миллионы лет, чтобы произвести подобный белок, ESM3 ускоряет этот процесс, достигая результата за дни или недели.

Процесс проектирования белков с помощью ИИ выглядит следующим образом:

Сначала исследователи вводят последовательности и структурные подсказки, чтобы направить ESM3 к особенностям, связанным с флуоресценцией.

Далее ESM3 исследует огромное пространство потенциальных последовательностей, чтобы произвести тысячи белков-кандидатов.

Затем наиболее перспективные образцы фильтруются и синтезируются для лабораторных испытаний.

После этого отобранные белки, разработанные ИИ, экспрессируются в бактериях для подтверждения их флуоресценции и функциональности.

Этот процесс привел к созданию флуоресцентного белка (esmGFP), не похожего ни на что в природе.

Что делает esmGFP необычным, так это то, насколько он далек от известных флуоресцентных белков. В то время как большинство вновь открытых GFP имеют незначительные отличия от существующих, esmGFP имеет идентичность последовательности только 58% со своим ближайшим естественным родственником. С эволюционной точки зрения такое различие соответствует времени расхождения более 500 миллионов лет.

Для сравнения, последний раз белки с подобными эволюционными расстояниями появлялись, когда динозавры еще не появились, а многоклеточная жизнь была еще на ранних стадиях развития. Это означает, что ИИ не просто ускорил эволюцию – он смоделировал совершенно новый эволюционный путь, создав белки, которые природа, возможно, никогда бы не создала.

Это открытие является значительным шагом вперед в белковой инженерии и углубляет наше понимание эволюции. Имитируя миллионы лет эволюции всего за несколько дней, ИИ открывает двери к захватывающим новым возможностям.

Использование белков, созданных ИИ, может значительно ускорить процесс открытия новых лекарств. Многие лекарства действуют, нацеливаясь на определенные белки, но поиск нужных – медленный и дорогой процесс.

Белки используются во всем: от разложения пластиковых отходов до выявления заболеваний. С помощью проектирования, управляемого ИИ, ученые могут создавать специализированные белки для здравоохранения, защиты окружающей среды и даже новых материалов.

Одним из самых интригующих аспектов этого исследования является то, что оно позиционирует ИИ как симулятор эволюции, а не просто инструмент для анализа. Традиционные эволюционные симуляции включают итерацию генетических мутаций, что часто занимает месяцы или годы для получения жизнеспособных кандидатов. ESM3, однако, обходит эти медленные ограничения, напрямую предсказывая функциональные белки. Этот сдвиг в подходе означает, что ИИ может не просто имитировать эволюцию, но и активно исследовать эволюционные возможности за пределами природы. При наличии достаточной вычислительной мощности эволюция, управляемая ИИ, может раскрыть новые биохимические свойства, которые никогда не существовали в естественном мире.

Хотя потенциальные преимущества белковой инженерии, управляемой ИИ, огромны, эта технология также поднимает этические вопросы и вопросы безопасности. Что произойдет, когда ИИ начнет проектировать белки за пределами человеческого понимания? Как обеспечить безопасность этих белков для медицинского или экологического использования?

Чтобы решить эти проблемы, необходимо сосредоточиться на ответственной разработке ИИ и тщательном тестировании. Белки, сгенерированные ИИ, такие как esmGFP, должны проходить обширные лабораторные испытания, прежде чем рассматриваться для реальных применений. Кроме того, разрабатываются этические рамки для биологии, управляемой ИИ, чтобы обеспечить прозрачность, безопасность и доверие общественности.

Запуск ESM3 – важное событие в области биотехнологии. ESM3 демонстрирует, что эволюция не должна быть медленным процессом проб и ошибок. Сжатие 500 миллионов лет эволюции белков всего до нескольких дней открывает будущее, в котором ученые смогут разрабатывать совершенно новые белки с невероятной скоростью и точностью. Разработка ESM3 означает, что мы можем использовать ИИ не только для понимания биологии, но и для ее изменения. Этот прорыв помогает нам усовершенствовать нашу способность программировать биологию так же, как мы программируем программное обеспечение, открывая возможности, которые мы только начинаем представлять.

 

ИИ ускорит диагностику рака в Британии

ИИ помогает врачам диагностировать врождённые пороки сердца

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *