Исследования редких заболеваний часто заходят в тупик из-за фундаментального парадокса: для поиска новых методов лечения нужны большие объемы данных, но сами болезни настолько редки, что собрать их практически невозможно. Ситуацию усугубляют строгие законы о конфиденциальности, такие как GDPR, которые защищают пациентов, но затрудняют международный обмен информацией. Европейский проект SYNTHEMA предлагает революционное решение этой проблемы с помощью искусственного интеллекта, открывая новую эру в изучении редких заболеваний крови.
Гематологические заболевания — это обширная группа из более чем 450 патологий крови, лимфатической системы и свертываемости, которые представляют серьезную угрозу для систем здравоохранения. Только в Европе финансовое бремя от этих болезней оценивается в 22,5 миллиарда евро ежегодно. Однако нехватка структурированных и доступных данных тормозит научный прогресс, мешая разработке передовых методов диагностики и терапии. Именно для преодоления этих барьеров и был запущен проект SYNTHEMA с финансированием в 7 миллионов евро от программы Horizon Europe.
В основе проекта лежит технология генерации синтетических данных. Искусственный интеллект анализирует реальные, но анонимные клинические записи, изучает их статистические закономерности и создает на их основе совершенно новые, «искусственные» наборы данных. Эти синтетические данные точно отражают характеристики настоящих пациентов, но не содержат никакой личной информации, что позволяет исследователям свободно работать с ними, не нарушая конфиденциальность. Таким образом, решается проблема нехватки материала для анализа и обучения ИИ-моделей.
Чтобы обеспечить максимальную безопасность, SYNTHEMA использует федеративное обучение — передовой подход, при котором алгоритмы ИИ «путешествуют» к данным, хранящимся в больницах, а не наоборот. Модели обучаются локально в нескольких медицинских учреждениях по всей Европе, обмениваясь только обезличенными результатами обучения, в то время как исходные данные пациентов никогда не покидают стен клиники. Эту децентрализованную систему, объединившую 16 партнеров из десяти стран, дополняют передовые методы шифрования, гарантирующие беспрецедентный уровень защиты.
Ключевым принципом проекта является «этика по умолчанию». Разработчики с самого начала заложили в архитектуру платформы строгие правовые и этические рамки. Все процессы соответствуют принципам FAIR, делая данные находимыми, доступными, совместимыми и пригодными для повторного использования. Такой подход не просто решает техническую задачу, но и формирует доверие к использованию ИИ в медицине, что особенно важно для уязвимых групп пациентов с редкими заболеваниями.
Для проверки эффективности платформы были выбраны два показательных случая: серповидноклеточная анемия (SCD) и острый миелоидный лейкоз (AML). Эти заболевания представляют разные вызовы: первое — хроническое и генетическое, второе — агрессивный и гетерогенный рак. Успешная генерация синтетических данных для таких разных патологий докажет универсальность и масштабируемость подхода SYNTHEMA, который в будущем можно будет применить и к другим редким болезням.
Проект SYNTHEMA — это не просто очередная технологическая инновация. Это создание фундамента для будущего, в котором безопасные синтетические данные станут драйвером медицинских открытий. Создавая инструменты для надежного и этичного сотрудничества, проект формирует новую модель для исследований в Европе, где искусственный интеллект сможет полностью раскрыть свой потенциал для спасения жизней, надежно защищая при этом права каждого пациента.