ИИ против болезней: новый инструмент объясняет тайну токсичных белков



Новый инструмент на базе искусственного интеллекта, получивший название CANYA, может кардинально изменить подходы ученых к пониманию и лечению более 50 заболеваний, связанных со слипанием белков, включая болезнь Альцгеймера. Эта модель, созданная исследователями из Центра геномной регуляции и Института биоинженерии Каталонии, помогает расшифровать химический язык, который запускает вредоносную агрегацию белков. Впервые ученые могут не только предсказать, когда белки образуют опасные сгустки, но и объяснить, почему это происходит.

Иногда белки в организме начинают слипаться, формируя клейкие структуры, известные как амилоидные фибриллы. Эти скопления нарушают нормальную работу клеток и лежат в основе множества заболеваний, в том числе самых распространенных форм деменции, от которых страдают более полумиллиарда человек по всему миру. Амилоиды встречаются не только у людей, но и во всех формах жизни, и хотя иногда они выполняют полезные функции, чаще всего их появление сулит серьезные проблемы.

CANYA представляет собой значительный шаг вперед по сравнению с типичными моделями ИИ, используемыми в биологии. Большинство таких инструментов работают по принципу «черного ящика», выдавая результат без объяснения логики своих выводов. CANYA же была разработана так, чтобы разъяснять свои решения, проливая свет на правила, которым следуют белки при агрегации. При этом новый ИИ демонстрирует точность примерно на 15% выше, чем у существующих аналогов.

Мощь инструмента заключается в самом большом на сегодняшний день наборе данных для изучения агрегации белков. Ученые синтезировали более 100 000 фрагментов белков, каждый длиной в 20 аминокислот, и протестировали их в дрожжевых клетках. Когда тот или иной фрагмент вызывал слипание, это влияло на рост дрожжей, что давало исследователям простой способ определить проблемные последовательности. Из 100 000 образцов около 22 000 вызвали агрегацию — это в тысячи раз больше, чем удавалось изучить в предыдущих исследованиях. «Мы создали по-настоящему случайные фрагменты белков, многие из которых даже не существуют в природе, — говорит доктор Майк Томпсон, ведущий автор исследования. — Эволюция исследует лишь крошечную часть возможного. Мы же изучили гораздо более широкое пространство, что помогло нам выявить общие закономерности».

На основе этого колоссального набора данных команда обучила CANYA распознавать закономерности. Модель сочетает в себе два типа ИИ: сверточный слой сканирует белок подобно тому, как программа распознавания лиц ищет черты на изображении, выявляя короткие аминокислотные «мотивы», связанные со слипанием. Затем слой внимания помогает ИИ определить, какие из этих мотивов действительно важны в контексте всего белка. Такая гибридная архитектура позволяет не только предсказывать агрегацию, но и понимать, почему одни участки белка играют более важную роль, чем другие. Например, ИИ обнаружил, что водоотталкивающие аминокислоты чаще всего запускают процесс слипания, особенно если они расположены в начале белковой цепи.

Хотя результаты исследования могут помочь в изучении таких заболеваний, как болезнь Альцгеймера, их наибольшее влияние уже сейчас может проявиться в биотехнологиях. Многие современные лекарства создаются на основе белков, и если эти белки слипаются, целые партии препаратов становятся непригодными, что приводит к значительным финансовым и временным потерям. «Агрегация белков — это серьезная головная боль для фармацевтических компаний, — отмечает доктор Бенедетта Болоньези, руководившая работой в Институте биоинженерии Каталонии. — Если белок слипается, весь производственный процесс может быть сорван. CANYA поможет нам разрабатывать препараты, которые не будут склеиваться, экономя время и деньги».

На этом исследователи не останавливаются. В планах — усовершенствовать модель, чтобы она могла предсказывать не только сам факт агрегации, но и ее скорость. Этот параметр имеет решающее значение для заболеваний, при которых раннее образование сгустков ведет к более быстрому ухудшению состояния. «Существует 10 в 24 степени различных способов построить последовательность из 20 аминокислот, — объясняет Болоньези. — Мы изучили всего 100 000. Но наша работа показывает, что мы можем начать разбираться в этом огромном пространстве». Подход исследователей также оказался экономически эффективным, позволяя тестировать тысячи белковых последовательностей в одной пробирке.

CANYA выделяется не только своей производительностью, но и способностью к самообъяснению. Это делает ее бесценным инструментом для ученых, стремящихся изменять белки или понимать механизмы болезней. ИИ выступает в роли переводчика, превращая сложный язык белков во что-то, что человек может прочитать и использовать. Этот проект демонстрирует, каких высот можно достичь, объединив масштабные эксперименты с интеллектуальным машинным обучением. Вместо того чтобы гадать, как ведут себя белки, мы начинаем это знать, открывая путь к более эффективным методам лечения, безопасным лекарствам и более глубокому пониманию самой жизни.

ИИ выносит приговор сайтам по поиску работы: что ждет рынок труда

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *