Американские ученые из Калифорнийского университета в Дейвисе разработали революционную технологию, которая позволяет парализованному человеку говорить практически в реальном времени, используя силу мысли и искусственный интеллект. Новаторский мозговой имплант преобразует нейронную активность напрямую в членораздельную и выразительную речь. Результаты этого исследования, открывающего новую эру в нейропротезировании, опубликованы в престижном научном журнале Nature.
В основе системы лежит нейрокомпьютерный интерфейс (BCI), принцип работы которого схож с технологиями голосовых помощников, таких как Alexa или Siri. В ходе эксперимента нейрохирурги имплантировали на поверхность мозга пациента, страдающего тяжелой дизартрией вследствие бокового амиотрофического склероза (БАС), массив из 256 микроэлектродов. Электроды были размещены в области, отвечающей за контроль мимических мышц, которые задействуются при разговоре.
Специально обученная модель искусственного интеллекта в режиме реального времени анализирует уникальные паттерны мозговой активности и сопоставляет их с предполагаемыми звуками, которые пациент пытается произнести. Система оказалась настолько точной, что синтезируемый голос был понятен для слушателей, которые с высокой точностью распознавали произносимые слова. Это позволило участнику эксперимента не просто общаться, но и придавать своей речи эмоциональную окраску.
Одной из главных проблем при создании подобных систем было точное определение момента, когда человек пытается что-то сказать. Разработанные алгоритмы успешно решили эту задачу, сопоставляя нейронную активность с намерениями в каждый момент времени. Это дало пациенту контроль над каденцией и нюансами синтезированного голоса, делая общение более естественным и живым.
Скорость преобразования нейронных сигналов в звук, воспроизводимый через динамик, поражает: задержка составляет всего одну сороковую долю секунды. Это сопоставимо с естественной задержкой, с которой человек слышит собственный голос во время разговора. Технология также позволила участнику произносить новые слова, которых не было в первоначальной базе данных системы, и делать междометия. Он смог модулировать интонацию, чтобы задать вопрос или сделать акцент на определенном слове в предложении.
Более того, участник эксперимента смог сделать первые шаги к воспроизведению мелодий, продемонстрировав способность системы к передаче высоты тона путем напевания простых коротких мотивов. По словам разработчиков, голос является неотъемлемой частью личности, и его потеря становится разрушительной для людей с неврологическими заболеваниями. Эта технология дает надежду тем, кто хочет, но не может говорить, и в будущем может кардинально изменить жизнь людей, живущих с параличом.