ИИ научился видеть как человек: прорыв в распознавании изображений



Современные машины далеко продвинулись в способности видеть и понимать изображения, но до человеческого зрения им все еще далеко. Однако недавняя разработка в области искусственного интеллекта (ИИ) может кардинально изменить ситуацию. Исследователи создали метод под названием Lp-Convolution, который позволяет машинам фокусироваться на важных частях изображения, подобно тому как это делает человеческий мозг. Эта технология обещает сделать ИИ умнее, быстрее и эффективнее для решения реальных задач в таких сферах, как беспилотное вождение, медицина и робототехника.

Международная команда ученых, включая специалистов из Института фундаментальных наук, поставила перед собой цель решить одну из ключевых проблем ИИ: как обрабатывать сложные изображения с высокой скоростью и точностью, но с меньшими вычислительными затратами. Вдохновившись принципами работы человеческого мозга, они разработали новый подход, который наделяет искусственный интеллект способностью динамически настраивать свое «внимание».

Чтобы понять суть инновации, стоит взглянуть на традиционные системы. Большинство из них, известные как сверточные нейронные сети (CNN), сканируют картинки с помощью небольших фильтров фиксированной квадратной формы. Этот метод неплохо работает, но часто упускает общую картину или детали нестандартной формы. Другой подход, вижн-трансформеры (ViT), анализирует изображение целиком и показывает лучшие результаты, но требует колоссальных вычислительных мощностей, что делает его неприменимым для повседневных устройств, таких как смартфоны или камеры наблюдения.

Человеческий мозг, в свою очередь, работает иначе. Он не сканирует каждый пиксель и не нуждается в суперкомпьютере. Вместо этого он мгновенно выделяет главное в любой сцене — будь то лицо знакомого в толпе или летящий в вашу сторону мяч. Исследователи задались вопросом: можно ли научить этому машину?

Ответом стала технология Lp-Convolution. Она меняет сам принцип работы фильтров в нейросетях. Вместо жестких «квадратов» используются гибкие фильтры, способные растягиваться по горизонтали, вертикали или принимать любую другую форму. Их поведение меняется в зависимости от задачи, имитируя адаптивность человеческого зрения. Например, при чтении мы фокусируемся на строках текста, а во время спортивной игры — на траектории движения. Такой подход позволяет повысить точность анализа, не увеличивая нагрузку на систему.

Для проверки эффективности Lp-Convolution команда провела испытания на стандартных наборах изображений, где технология превзошла не только классические модели, но и некоторые передовые системы. Особенно важно, что она показала высокую производительность при работе с размытыми, зашумленными или поврежденными изображениями — условиями, максимально приближенными к реальному миру. Ученые также обнаружили удивительное сходство: паттерны активности нового ИИ оказались похожи на нейронную активность в мозге животных. «Мы, люди, быстро определяем важное в переполненной сцене, — говорит один из руководителей исследования, доктор К. Джастин Ли. — Наша Lp-Convolution имитирует эту способность, позволяя ИИ гибко фокусироваться на самых релевантных частях изображения — точно так же, как это делает мозг».

Потенциал новой технологии огромен. Поскольку она работает быстрее и требует меньше ресурсов, ее можно интегрировать в повседневные устройства. Беспилотные автомобили смогут точнее и быстрее распознавать препятствия, что критически важно для безопасности. В медицине ИИ поможет врачам анализировать рентгеновские снимки и другие сканы, выявляя едва заметные признаки заболеваний на ранних стадиях. Роботы, оснащенные таким «зрением», станут эффективнее в динамичной среде — от сортировки посылок на складе до помощи в зонах бедствий. Эта работа не только открывает новые возможности для ИИ, но и приближает его к биологической реальности, делая умные системы более адаптивными и эффективными.

ИИ нового поколения: главные риски и как бизнесу взять их под контроль

ИИ против БАС: гонка со временем за лекарством от неизлечимой болезни

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *