Дельфины давно привлекают внимание исследователей и любителей природы своей разумностью, сложной социальной организацией и запутанными системами общения. Вопрос о том, обладают ли дельфины языком, подобным человеческому, волнует умы ученых многие годы. Искусственный интеллект открыл новые перспективы для изучения этой загадки. Важным шагом стало сотрудничество компании Google и организации Wild Dolphin Project (WDP), результатом которого явилась разработка DolphinGemma — модели ИИ, предназначенной для анализа звуков, издаваемых дельфинами. Это новшество может не только помочь расшифровать общение дельфинов, но и потенциально проложить путь к двустороннему взаимодействию с этими удивительными морскими млекопитающими.
Дельфины общаются с помощью комбинации щелчков, свистов и движений тела. Эти звуки различаются по частоте и интенсивности, передавая разные сообщения в зависимости от контекста, будь то поиск пищи, спаривание или социальное взаимодействие. Несмотря на десятилетия исследований, полное понимание всего спектра этих сигналов оставалось сложной задачей. Традиционные методы наблюдения и анализа с трудом справлялись с огромными объемами данных, генерируемых дельфинами, что затрудняло выявление закономерностей.
Искусственный интеллект помогает преодолеть эти трудности, используя машинное обучение и алгоритмы обработки естественного языка для анализа больших массивов звуковых данных дельфинов. Такие модели способны выявлять паттерны и связи в вокализациях, которые недоступны человеческому слуху. ИИ может различать разные типы звуков дельфинов, классифицировать их по характеристикам и связывать определенные звуки с конкретным поведением или эмоциональным состоянием. Например, исследователи отмечают, что определенные свисты, по-видимому, связаны с социальными взаимодействиями, тогда как щелчки обычно используются для навигации или эхолокации.
Хотя ИИ обладает большим потенциалом в расшифровке звуков дельфинов, сбор и обработка огромных объемов данных от стай дельфинов, а также обучение моделей ИИ на таких масштабных наборах данных, остаются серьезными вызовами. Для решения этих проблем Google и WDP разработали DolphinGemma — модель ИИ, специально созданную для анализа коммуникации дельфинов. Модель обучается на обширных наборах данных и способна обнаруживать сложные закономерности в вокализациях.
В основе DolphinGemma лежит Gemma, семейство генеративных моделей ИИ с открытым исходным кодом от Google, насчитывающее около 400 миллионов параметров. DolphinGemma разработана для изучения структуры вокализаций дельфинов и генерации новых, дельфиноподобных звуковых последовательностей. Модель, созданная в сотрудничестве с WDP и Технологическим институтом Джорджии, использует набор данных вокализаций атлантических пятнистых дельфинов, собиравшийся с 1985 года. Технология Google SoundStream применяется для токенизации этих звуков, позволяя модели предсказывать следующий звук в последовательности. Подобно тому, как языковые модели генерируют текст, DolphinGemma предсказывает звуки, которые могли бы издать дельфины, что помогает выявить паттерны, потенциально представляющие грамматику или синтаксис в их общении.
Эта модель способна даже генерировать новые, похожие на дельфиньи, звуки, аналогично тому, как предиктивный ввод текста предлагает следующее слово в предложении. Эта способность может помочь определить правила, управляющие коммуникацией дельфинов, и дать ключ к пониманию того, образуют ли их вокализации структурированный язык.
Особую эффективность DolphinGemma придает ее способность работать в режиме реального времени на устройствах вроде смартфонов Google Pixel. Благодаря своей легковесной архитектуре модель может функционировать без дорогостоящего специализированного оборудования. Исследователи могут записывать звуки дельфинов прямо на свои телефоны и немедленно анализировать их с помощью DolphinGemma. Это делает технологию более доступной и помогает снизить затраты на исследования.
Кроме того, DolphinGemma интегрирована в систему CHAT (Cetacean Hearing Augmentation Telemetry), которая позволяет исследователям воспроизводить синтетические звуки, похожие на дельфиньи, и наблюдать за реакцией животных. Это может привести к созданию общего словаря, открывая возможность двустороннего общения между дельфинами и людьми.
Разработка DolphinGemma имеет большое значение не только для понимания общения дельфинов, но и для продвижения исследований в области когнитивных способностей и коммуникации животных в целом. Расшифровка вокализаций дельфинов может дать более глубокое представление об их социальных структурах, приоритетах и мыслительных процессах. Это способно не только улучшить усилия по сохранению видов через понимание их потребностей, но и расширить наши знания об интеллекте и сознании животных.
DolphinGemma является частью более широкого движения по использованию ИИ для изучения коммуникации животных; аналогичные проекты ведутся для таких видов, как вороны, киты и сурикаты. Google планирует выпустить DolphinGemma как открытую модель для исследовательского сообщества летом 2025 года с целью расширения ее применения на другие виды китообразных, например, афалин или длиннорылых продельфинов, путем дальнейшей доработки. Такой подход с открытым исходным кодом будет способствовать глобальному сотрудничеству в исследованиях коммуникации животных. Google также планирует протестировать модель в полевых условиях в предстоящем сезоне, что может еще больше расширить наше понимание атлантических пятнистых дельфинов.
Несмотря на свой потенциал, проект DolphinGemma сталкивается с рядом трудностей. Записи в океане часто искажаются фоновым шумом, что усложняет анализ звука. Тэд Старнер из Технологического института Джорджии, участвующий в проекте, указал на проблему большого количества окружающих океанских шумов в данных, что требует применения продвинутых методов фильтрации. Некоторые исследователи также ставят под сомнение, можно ли действительно считать общение дельфинов языком. Например, зоолог Арик Кершенбаум высказал мнение, что вокализации дельфинов могут представлять собой более простую систему сигналов, в отличие от сложной природы человеческого языка. Теа Тейлор, директор Sussex Dolphin Project, выразила обеспокоенность риском непреднамеренного обучения дельфинов имитации звуков. Эти точки зрения подчеркивают необходимость тщательной проверки и осторожной интерпретации результатов, полученных с помощью ИИ.
Исследование Google в области коммуникации дельфинов с использованием ИИ представляет собой новаторскую работу, приближающую нас к пониманию сложных способов взаимодействия дельфинов друг с другом и с окружающей средой. С помощью искусственного интеллекта исследователи обнаруживают скрытые закономерности в звуках дельфинов, предлагая новые взгляды на их системы общения. Хотя проблемы остаются, достигнутый прогресс подчеркивает потенциал ИИ в изучении поведения животных. По мере развития этих исследований могут открыться новые возможности в области сохранения видов, изучения когнитивных способностей животных и взаимодействия человека и животных.