Исследователи из Школы инженерии и прикладных наук Университета Вирджинии разработали интеллектуальный видеоанализатор на базе искусственного интеллекта, способный распознавать действия человека.
Система обнаружения действий, получившая название Semantic and Motion-Aware Spatiotemporal Transformer Network (SMAST), обещает широкий спектр социальных преимуществ.
К ним относятся усовершенствованные системы видеонаблюдения и повышение общественной безопасности, усовершенствованное отслеживание движения в здравоохранении и усовершенствование навигации автономных транспортных средств в сложных условиях.
“Эта технология искусственного интеллекта открывает возможности для обнаружения действий в реальном времени в самых сложных условиях”, — сказал профессор и заведующий кафедрой электротехники и вычислительной техники Скотт Т. Эктон, который руководил проектом.
Технология искусственного интеллекта для комплексного анализа видео
Система использует два ключевых компонента для обнаружения и понимания сложного поведения человека.
Первый — это многофункциональная модель обнаружения действий, которая помогает ИИ сосредоточиться на наиболее важных частях сцены, таких как человек или объект, игнорируя при этом ненужные детали. Это позволяет системе более точно определять происходящее, например, распознавать, когда кто-то бросает мяч, а не просто двигает рукой.
Вторая ключевая особенность — это 2D-алгоритм позиционного кодирования с учетом движения, который помогает ИИ отслеживать, как все движется с течением времени.
Благодаря интеграции этих функций SMAST может точно распознавать сложные действия в режиме реального времени, что делает его более эффективным в таких важных ситуациях, как наблюдение, диагностика состояния здоровья или автономное вождение.
SMAST переосмысливает то, как машины обнаруживают и интерпретируют действия человека. Современные системы работают с хаотичными, неотредактированными, непрерывными видеоматериалами, в которых часто отсутствует контекст событий.
Инновационный дизайн SMAST позволяет с поразительной точностью фиксировать динамические отношения между людьми и объектами благодаря компонентам искусственного интеллекта, которые позволяют ему учиться и адаптироваться на основе данных.
Новые стандарты в технологии распознавания действий
Этот огромный скачок в технологии распознавания действий означает, что система искусственного интеллекта может идентифицировать такие действия, как бегун, переходящий улицу, врач, выполняющий точную процедуру, или даже угрозу безопасности в людном месте.
Компания SMAST уже превзошла решения высшего уровня по ключевым академическим показателям, включая AVA, UCF101-24 и EPIC-Kitchens, установив новые стандарты точности и эффективности.
“Влияние на общество может быть огромным”, — сказал Мэтью Корбан, научный сотрудник лаборатории Эктона, работающий над проектом.
“Мы рады видеть, как эта технология искусственного интеллекта может трансформировать отрасли, делая системы на основе видео более интеллектуальными и способными к пониманию в режиме реального времени”.
+ There are no comments
Add yours