Белки — одно из самых невероятных и универсальных изобретений природы. Эти важнейшие строительные блоки жизни катализируют практически все химические реакции в организме, регулируют экспрессию генов и иммунную систему, входят в состав основных структурных элементов всех клеток и формируют основные компоненты мышц.
Но почему этот искусственный интеллект называется «альфа-фолд»? Белки — это цепочки аминокислот, которые самопроизвольно сворачиваются, образуя трехмерную структуру, необходимую для биологической функции белка. Вы можете посмотреть на их компоненты и последовательности на бумаге, но если вы не знаете, в какую трехмерную форму они складываются, вы не сможете предсказать, что они будут делать или как они будут взаимодействовать с другими молекулами.
Для определения белковых структур использовались различные экспериментальные методы, управляемые человеком, но они отнимают много времени и дороги. Учитывая, что известно более 200 миллионов белков во всех формах жизни, а на данный момент идентифицировано только 170 000 белковых структур, имело смысл использовать искусственный интеллект для ускорения процесса. Но до появления AlphaFold программы не могли предсказывать структуру белка с такой же точностью, как экспериментальные методы, основанные на людях.
AlphaFold 2, выпущенный в 2021 году, стал настоящим прорывом, позволившим предсказать трехмерные структуры практически для каждого белка в организме человека и задействовать все виды передовых научных разработок. Менее чем за три года он был использован исследователями по всему миру для ускорения открытий в области лечения рака, создания вакцин от малярии, создания ферментов, расщепляющих пластик, и многих других — на данный момент в статье Alphafold 2 приведено более 14 000 цитат.
Итак, в чем же заключается улучшение AlphaFold 3? Что ж, новейшая версия выходит за рамки простого предсказания структуры и взаимодействий белков и включает в себя все, от множества белков до ДНК, РНК и низкомолекулярных лигандов. (Большинство лекарств представляют собой лиганды, которые связываются с белками, изменяя их взаимодействие с точки зрения здоровья и болезней человека.)
Это делает его абсолютно беспрецедентным ресурсом для моделирования того, как определенные белки в организме будут взаимодействовать с определенными молекулами лекарств.
Трехмерная структура белка-спайка вируса простуды, созданного AlphaFold 3 в Google DeepMind/Isomorphic Labs
Приведенный выше гиф-файл дает представление о структуре, которую генерирует AlphaFold 3. На рисунке показан структурный прогноз для белка-спайка (синий) вируса простуды, который взаимодействует с антителами (бирюзовый) и простыми сахарами (желтый). Вы можете видеть, насколько точно модель AlphaFold 3 соответствует истинной структуре белка, которая обозначена серым цветом.
Чтобы реализовать эти расширенные возможности, AlphaFold 3 был обучен работе с глобальными данными о молекулярной структуре, хранящимися в Банке данных о белках. Deepmind утверждает, что он может обрабатывать более 99% всех известных биомолекулярных комплексов в этой базе данных. Кроме того, был усовершенствован модуль Evoformer, архитектура которого позволила AlphaFold 2 работать в прежнем режиме.
Вот как работает система AlphaFold в самых общих чертах. (Спасибо группе белковой информатики Оксфордского университета за более простое для понимания объяснение.) Он берет введенную аминокислотную последовательность, ищет в базах данных похожие последовательности, уже идентифицированные в других живых организмах, извлекает всю необходимую информацию с помощью преобразователя (это Evoformer) и передает эту информацию в нейронную сеть, которая создает трехмерную структуру – длинный список координат, представляющих исходный код. положение каждого атома белка, включая боковые цепи.
Предсказание AlphaFold 3 для молекулярного комплекса, содержащего белок (синий), связанный с двойной спиралью ДНК (розовый), почти идеально соответствует истинной молекулярной структуре (серый)Google DeepMind/Isomorphic Labs.
Что делает новый и усовершенствованный Evoformer, так это собирает свои структурные прогнозы с помощью диффузионной сети, подобной тем, что используются в генераторах изображений с искусственным интеллектом. Как поясняется в совместном блоге DeepMind и Isomorphic Labs, анонсирующем AlphaFold 3, он “начинается с облака атомов и на протяжении многих этапов приближается к своей окончательной, наиболее точной молекулярной структуре”.
В недавнем интервью корреспонденту Bloomberg Тому Маккензи, генеральный директор и соучредитель Google DeepMind (а также генеральный директор и основатель Isomorphic Labs) Демис Хассабис рассказал о последствиях использования AlphaFold 3 для разработки лекарств.
“Святой грааль открытия лекарств — это не просто знание структуры белка, как это сделал AlphaFold 2, но и разработка лекарственных соединений, называемых лигандами, которые связываются с поверхностью белка”, — сказал Хассабис. “И вы хотите знать, где он связывается и насколько прочно, чтобы разработать правильный тип лекарственного соединения. Итак, AlphaFold 3 — это большой шаг в направлении прогнозирования связывания белка с лигандом и того, как это взаимодействие будет работать”.
В январе этого года Isomorphic Labs объявила о стратегическом партнерстве с фармацевтическими гигантами Eli Lilly и Novartis, общая стоимость которого составляет около 3 миллиардов долларов США. Но что удивительно, так это сроки производства лекарств, которые, как ожидается, будут достигнуты в результате этих партнерских отношений.
“Итак, мы уже работаем над реальными программами по лекарственным препаратам”, — сказал Хассабис. “И я ожидаю, что, возможно, в ближайшие пару лет в клинике появятся первые лекарства, разработанные с помощью искусственного интеллекта”.
«Если вы спросите меня, что самое главное, что ИИ мог бы сделать для человечества, — продолжил он, — это решить проблему сотен ужасных заболеваний. Я не могу представить лучшего варианта использования ИИ. Отчасти это является мотивацией, лежащей в основе Isomorphic и AlphaFold, и всей работы, которую мы делаем в области науки, — способствовать развитию общества во всех этих областях».
Полное интервью Хассабиса и Маккензи можно посмотреть в видео ниже.
Генеральный директор Google DeepMind по разработке лекарств, Hype, Isomorphic
Во время тестирования AlphaFold 3 продемонстрировал высочайшую точность в прогнозировании лекарственных взаимодействий, включая взаимодействие белков с лигандами и антител с белками-мишенями.
Используя тест PoseBusters, было обнаружено, что он на 50% точнее, чем лучшие существующие методы, без необходимости ввода какой–либо структурной информации. PoseBusters проверяет химическую и физическую достоверность молекулярных и белково-лигандных «позиций», генерируемых с помощью модели глубокого обучения.
И вы можете играть с ним самостоятельно. AlphaFold 3 доступен через сервер AlphaFold, который содержит базу данных из 200 миллионов белковых структур. Этот феноменальный ресурс является бесплатным для ученых, проводящих некоммерческие исследования, или просто любопытных пользователей Интернета по всему миру.
Демонстрация сервера AlphaFold — Google DeepMind
Прогнозирование структуры белка без такого инструмента может занять много времени… Примерно столько же времени требуется для получения докторской степени и может стоить сотни тысяч долларов. Подобно тому, как инструмент GNoME от DeepMind перенес открытие материалов и кристаллов на сотни лет в будущее, AlphaFold 3 обещает радикально ускорить развитие обширных областей биологической науки и фармацевтики.
“Это новое представление о молекулах жизни раскрывает, как все они связаны, и помогает понять, как эти связи влияют на биологические функции, такие как действие лекарств, выработка гормонов и сохраняющий здоровье процесс восстановления ДНК”, – заявили в Google DeepMind и Isomorphic Labs. “Этот прорыв может привести к новым научным достижениям — от разработки биовозобновляемых материалов и более устойчивых сельскохозяйственных культур до ускорения разработки лекарств и исследований в области геномики”.
Нам не терпится увидеть, к чему приведет нас эта технология.
Исследование прогностических возможностей AlphaFold 3 было опубликовано в журнале Nature.
Источники: Google DeepMind, Isomorphic Labs
© «ПостИИ» (postii.ru), перевод на русский язык
+ There are no comments
Add yours