Секвенирование генов отдельных клеток коренным образом изменило подходы ученых к изучению жизни на микроуровне. Этот метод позволяет исследователям анализировать поведение каждой клетки, особенно в условиях стресса, такого как болезнь или воздействие лекарственных препаратов. Однако, предоставляя беспрецедентную детализацию, технология порождает огромное количество «шума» в данных. Этот шум часто маскирует важные биологические сигналы, затрудняя получение точных выводов.
Одним из наиболее перспективных решений этой проблемы, опубликованным в научном журнале Nature Methods, стал новый метод под названием scNET. Разработанная исследователями из университета в Израиле, эта система объединяет два мощных инструмента: секвенирование РНК одиночных клеток и сети белок-белковых взаимодействий. Комбинируя их, scNET позволяет получить значительно более четкую картину взаимодействия генов и клеток в различных условиях.
Секвенирование РНК одиночных клеток, или scRNA-seq, дает возможность изучать активность генов внутри отдельных клеток. В отличие от старых методов, которые усредняли активность генов по миллионам клеток, этот новый подход позволяет ученым выявлять уникальное поведение различных клеток, даже если они принадлежат к одной ткани или органу.
Однако существует серьезная проблема. Большое количество зарегистрированных показаний активности генов являются нулевыми. Иногда это действительно означает, что ген неактивен в клетке. Но часто это лишь техническая погрешность: ген был активен, но метод секвенирования его не обнаружил. Эта проблема, известная как «выпадение» (dropout), создает множество ложных нулевых значений в данных.</
Когда так много данных об активности генов теряется или не регистрируется, становится сложно изучать совместную работу генов или активацию сигнальных путей в ответ на изменения. Исследователи пытались исправить это с помощью различных статистических и вычислительных методов.
Некоторые используют сложные модели для оценки пропущенных значений, другие пытаются группировать похожие клетки и предполагать, какие гены они должны экспрессировать. Эти подходы помогли, но обычно они фокусируются либо на исправлении числовых данных, либо на группировке клеток, но не на том и другом одновременно.
Чтобы выйти за рамки простой корректировки данных, ученые начали использовать сети белок-белковых взаимодействий (PPI). Эти карты показывают, как белки — продукты генов — взаимодействуют внутри клетки. Сети PPI содержат больше, чем просто количественные данные; они предоставляют контекст: как гены могут функционировать вместе в рамках более крупных процессов, таких как деление клеток или иммунные реакции.
Но сети PPI имеют свои ограничения. Большинство из них построены на основе больших наборов данных, объединяющих информацию из множества различных тканей и условий. Поэтому, хотя они и полезны, они не отражают специфику конкретного образца, например, опухоли или группы иммунных клеток у больного пациента.
Именно здесь на помощь приходит объединение сетей PPI с данными scRNA-seq. Внедрение динамических данных об активности генов из отдельных клеток в эти статические карты PPI позволяет получить гораздо более ценную информацию: увидеть, как взаимосвязи генов меняются в реальном времени в различных биологических состояниях.
Предыдущие исследования уже показали, что объединение этих двух источников информации может улучшить такие задачи, как поиск ключевых генов, прогнозирование выживаемости и улучшение кластеризации клеток. Но до недавнего времени не существовало метода, который мог бы объединить всю эту мощь в одном инструменте, особенно для небольших наборов данных, где типы клеток могут быть даже неизвестны.
Метод scNET меняет правила игры, делая нечто простое, но мощное. Он анализирует не только гены, но и клетки. Этот двойной подход позволяет ему одновременно изучать сходство между клетками и совместную работу генов.
В основе scNET лежит графовая нейронная сеть, или GNN. Этот тип модели искусственного интеллекта отлично справляется с работой с сетями: подобно тому, как социальная сеть показывает связи между людьми, GNN могут выявлять связи между генами и клетками. В этой модели один граф представляет взаимодействия генов (на основе PPI), а другой — сходства между клетками (на основе схожести профилей их генной активности).
Вместо того чтобы фиксировать количество «соседей» для каждой клетки, что делают большинство моделей, scNET использует гибкий механизм внимания к ребрам графа. Это позволяет модели определять, какие клетки действительно связаны, а не принудительно связывать каждую клетку с заданным числом других. Такой подход лучше отражает реальную биологию, где некоторые клетки могут быть тесно связаны, а другие — обособлены.
Обучаясь одновременно на сетях генов и клеток, scNET сглаживает шум и формирует точные «вложения» генов и клеток — компактные представления, содержащие ключевую информацию. Эти вложения затем можно использовать для улучшения последующих аналитических задач, таких как кластеризация клеток, выявление генных взаимосвязей и идентификация важных биологических путей.
Для проверки возможностей scNET исследовательская группа сосредоточилась на иммунных клетках, называемых Т-клетками. Эти клетки играют ключевую роль в борьбе с опухолями. Однако понять, как они меняются в ответ на лечение, сложно, особенно при наличии «шумных» данных.
Используя scNET, исследователи смогли наконец увидеть, какие Т-клетки стали более активными после лечения. Они заметили усиление цитотоксического поведения — когда Т-клетки атакуют и уничтожают опухолевые клетки. Эта информация была скрыта в исходных зашумленных данных, но стала очевидной благодаря улучшенному анализу scNET.
Рон Шейнин, ведущий аспирант проекта в Тель-Авивском университете, объясняет, что scNET интегрирует данные секвенирования одиночных клеток с сетями, описывающими возможные взаимодействия генов, подобно социальной сети, предоставляя карту того, как разные гены могут влиять друг на друга и взаимодействовать.
Благодаря этому улучшенному обзору стало возможным определить, как различные методы лечения влияют не только на опухоль, но и на окружающие ее иммунные клетки, что является ключом к совершенствованию методов лечения рака.
Профессор Асаф Мади, один из научных руководителей проекта, добавляет, что они сосредоточились на популяции Т-клеток, иммунных клеток, известных своей способностью бороться с раковыми опухолями. Он сообщает, что scNET выявил влияние лечения на эти Т-клетки и показал, как они стали более активными в своей цитотоксической деятельности против опухоли — то, что раньше было невозможно обнаружить из-за высокого уровня шума в исходных данных.
Потенциал scNET выходит далеко за рамки онкологии. Упрощая понимание поведения генов в различных условиях, он может помочь в изучении широкого спектра заболеваний — от аутоиммунных до неврологических расстройств. Это также открывает двери для более целенаправленной разработки лекарств.
Профессор Родед Шаран, соруководитель исследования, подчеркивает общую картину. Он отмечает, что это прекрасный пример того, как инструменты искусственного интеллекта могут помочь в расшифровке биологических и медицинских данных, позволяя получать новые и важные знания. Идея заключается в том, чтобы предоставить биомедицинским исследователям вычислительные инструменты, которые помогут понять, как функционируют клетки организма, и тем самым найти новые способы улучшения нашего здоровья.
В ходе тестов scNET превзошел старые методы в идентификации ген-генных взаимодействий и кластеризации схожих клеток. Он также выявил более биологически значимые пути и позволил лучше понять, как различные методы лечения влияют на поведение клеток.
Отличительной чертой scNET является его способность работать без необходимости в маркированных данных, что является большим преимуществом для новых экспериментов, где исследователи еще не знают, какие типы клеток присутствуют. Именно эта гибкость делает scNET мощным инструментом для ученых, изучающих сложные биологические системы.
По мере того как исследователи продолжают расширять использование ИИ в биологии, такие инструменты, как scNET, становятся центральными для осмысления потока новых данных. Они предлагают способ пробиться сквозь шум, четче видеть закономерности и приближают нас к более эффективной и персонализированной медицине.