Краткая история видеоанализа от компании Network Optix

Наши друзья из компании Network Optix – разработчика и производителя открытой платформы для управления IP-видеонаблюдением Nx – заглянули в историю развития видеоанализа, чтобы обратить внимание специалистов на значимые аспекты создания систем видеонаблюдения на базе искусственного интеллекта

С 1930-х годов до наших дней

1880 год: Томас Эдисон и Уильям Диксон разрабатывают первые кинокамеры. В 1883 году они предпринимают первые шаги по показу движущихся изображений.

1939 год: появляются миниатюризованные портативные камеры, которые начинают применяться фронтовыми кинооператорами Второй мировой войны.

1942 год: немецкая компания Siemens создает первую в мире систему видеонаблюдения за испытаниями ракет "Фау-2" на полигоне Пенемюнде. Похожим образом компания Илона Маска SpaceX снимает испытания своих ракет.

1951 год: выпускается первый коммерческий катушечный видеомагнитофон. В 1956 году американская компания Ampex Corporation представляет свой знаменитый видеомагнитофон модели VRX-1000, который стоит 50 тыс долларов (с учетом инфляции это 480 849 долларов в 2021 году).

1960-е годы: полиция начинает использовать CCTV для охраны высокопоставленных лиц и расследования правонарушений в общественных местах.

1970-е годы: широкое распространение получают кассетные магнитофоны (VCR), и сфера применения CCTV выходит за рамки задач государственного сектора. Первыми коммерческими потребителями систем видеонаблюдения становятся банки и крупные торговые сети.

1980-е годы: видеонаблюдение применяется уже во всех сегментах рынка, в том числе секторе частного жилья, благодаря появлению доступных по цене видеокамер и более функциональных магнитофонов.

1990-е годы: на смену аналоговым магнитофонам приходят цифровые видеорегистраторы (DVR), которые содержат в своем составе процессор и плату видеозахвата для записи, хранения и воспроизведения видеоизображения локальными и удаленными операторами. В 1996 году компания Axis Communications выпускает первую в мире сетевую видеокамеру.

2000-е годы: системы видеонаблюдения получают еще большее распространение благодаря возможности интеграции с системами контроля доступа и охранной сигнализации через SDK и появлению профессионального программного обеспечения (VMS) для управления IP-камерами и масштабирования систем до десятков тысяч каналов. Сетевые системы видеонаблюдения разворачиваются на базе сетевых видеорегистраторов (NVR), которые производятся на основе типовых серверных компонентов Dell, Supermicro, HP и других производителей. Это позволяет системным интеграторам создавать решения видеонаблюдения с учетом требований и специфики клиентов. В 2000-е годы компания ObjectVideo разрабатывает программные средства видеоаналитики для коммерческого использования, которые на тот момент отличались недостаточной эффективностью.

2010-е годы: IP-камеры доминирует на рынке, организации разворачивают конвергентные, полностью цифровые системы видеонаблюдения за считанные дни. Нейросети и технологии глубинного обучения выводят системы видеоанализа на качественно новый уровень. В августе 2010 года в Калифорнии (США) основывается компания Network Optix, миссия которой создавать самые быстрые и самые простые в использовании кроссплатформенные системы управления IP-видеонаблюдением.

Новое тысячелетие и массовый видеоанализ

С середины и до конца 2000-х годов такие компании, как ObjectVideo, начали предлагать на рынке программные средства видеоанализа, которые использовали вычислительные алгоритмы для анализа видеозаписей в режиме реального времени и оповещали операторов системы видеонаблюдения при выявлении тревожных ситуаций. По замыслу разработчиков, интеллектуальные компьютерные технологии должны были снизить затраты и сократить ошибки, которые вызывает человеческий фактор. Если раньше отслеживанием потенциальных нарушителей занимались охранники, глядя в мониторы в режиме 24/7/365, то теперь появилась возможность автоматизированно идентифицировать, отслеживать и оповещать службы о тревожных событиях.

Среди первых детекторов – отслеживание попыток вывести из строя видеокамеру, изменить или блокировать ее обзор (тамперинг); анализ направления движения и простейшее распознавание объектов (детекция лиц или людей). Эти алгоритмы прекрасно работали в контролируемых условиях и некорректно проявляли себя в реальной среде по нескольким причинам.

Во-первых, обнаружение кого-то или чего-то на изображении предполагало проанализировать множество переменных, включая попиксельные изменения текущего кадра в сравнении с предыдущими (для детекции движения), направление движения, размер объекта и др. Традиционные методы видеоанализа требовали значительных вычислительных ресурсов и работали нормально лишь в жестко контролируемых условиях освещения. Это было дорого (закупать и обслуживать).

В результате (и это во-вторых), некоторые компании пытались сочетать традиционные детекторы ПО и датчики с камерами через порты ввода/вывода (I/O), но их точность, как правило, была низкой, поскольку они обнаруживали все движения, независимо от типа. В результате, первая волна распространения видеоанализа вызвала большое разочарование рынка, поскольку ожидания от использования аналитики существенно превышали ее возможности.

В-третьих, по мере улучшения аппаратного и программного обеспечения системы видеоанализа продолжали использовать все те же базовые принципы для определения поведения – они анализировали изменения пикселей, и обнаружение (и уж тем более распознавание) объектов в кадре было неточным.

Оставалось одно – "научить" компьютер распознавать объекты на видео.

Получить консультацию по задачам видеоанализа ➞

Глубокое обучение

Технологии глубокого обучения проникли в жизнь почти каждого человека. Фотографии и видео, которые вы снимаете на смартфон, анализируются и применяются для обучения нейронных сетей. Таким образом нейросети все лучше распознают людей и объекты.

Наилучшим способом обучения нейронных сетей оказалось использовать реальные примеры из жизни и соответствующие структурированные метаданные, а не алгоритмы, созданные человеком, или мощные вычислительные ресурсы. Оперируя большим объемом тегированных датасетов, можно "обучать" нейросети распознавать объекты и их поведение, причем (и это самое главное) делать это с высоким уровнем точности.

Постоянно обучая глубокую нейросеть новыми данными и давая ей возможность обучать себя, удалось наконец-то начать решать задачи видеоанализа более надежным образом. Речь идет о применении структурированных датасетов, собранных в самых разных средах, и разнообразных типов изображений с камер, что позволило преодолевать проблемы обнаружения и распознавания, связанные в том числе с погодными и природными условиями.

Глубокое обучение оказалось настолько эффективным, что за последние 10 лет стало востребованным почти во всех типах применений (например, машинный перевод текста, беспилотные автомобили, видеоанализ). Мощности, которые сегодня доступны для обучения нейросетей, гигантские, и результаты улучшаются с каждым днем. Конкретно в области видеонаблюдения появились более совершенные инструменты обнаружения и распознавания людей, объектов, движения и поведения.

Мировые ИТ-гиганты предлагают облачные аналитические сервисы (например, Google Cloud Vision, Microsoft Computer Vision API и Amazon Rekognition), которые могут использовать любые разработчики при создании собственных систем видеоанализа. Существуют также облачные решения видеоанализа на базе искусственного интеллекта, специализированные под узкие задачи, например распознавание лиц или обнаружение людей.

Производители "железа" для систем безопасности переключаются на производство IP-видеокамер со встроенным искусственным интеллектом, чтобы получить продвинутый уровень видеоанализа. А производители микросхем участвуют в гонке за поставку систем на кристалле (SoC) производителям вычислительных устройств. Компания NVIDIA – один из главных разработчиков, продвигающих специальные графические процессоры для тренировки нейронных сетей и подобных вычислений в любительских и профессиональных приложениях. Все больше компаний заходит на поляну NVIDIA, атмосфера здесь никогда ранее не была столь конкурентной, как сейчас. То, что раньше считалось крайне специализированными инструментами для высокопроизводительных вычислений, легло в основу создания современного оборудования, инфраструктуры серверов, программного обеспечения и сетей. По мере увеличения востребованности прикладных систем искусственного интеллекта, расширяется спектр доступных встраиваемых вычислительных модулей наподобие Jetson, которые "запитывают" интеллектом множество разнообразных оконечных устройств.

Производитель программного обеспечения для управления IP-видеонаблюдением Network Optix непрерывно вносит новшества в свою открытую платформу Nx Meta VMP, чтобы облегчить поставщикам создание систем видеонаблюдения с искусственным интеллектом.

Видеонаблюдение с искусственным интеллектом и приватность

Демократизация IP-видеонаблюдения, повсеместное распространение IP-видеокамер и наступление эры искусственного интеллекта сулят огромный потенциал, включая сбор большего количества реальных данных и создание условия для работы приложений Google, что позволит повысить ситуационную осведомленность и безопасность человечества.

Однако эти прогрессивные тенденции могут привести и к злоупотреблениям. Любому владельцу бизнеса или частной собственности становится намного проще контролировать, например, свой магазин, или приглядывать, скажем, за квартирой. Но технические решения, использующие искусственный интеллект, настораживают людей, заботящихся о конфиденциальности.

Огромное количество установленных (и устанавливаемых) IP-видеокамер позволяет при желании отследить действия любого человека в течение дня, что фактически кладет конец конфиденциальности, которую люди знали на протяжении тысячелетий.

Конечно, нельзя полностью возлагать за это ответственность на видеокамеры.

Объем метаданных, собираемых смартфонами, приложениями и сервисами о действиях лишь одного человека в в течение дня, ошеломляет. При должной подготовке к этим данным может получить доступ любой злоумышленник, следить за людьми и влиять на них с помощью целевого контента.

Очевидно, правительства стран должны задумываться о том, чтобы законодательно уравновешивать преимущества передовых технологий и потребности общества в приватности. Такие законы, как General Data Protection Regulation (GDPR, Общий регламент по защите данных) в Евросоюзе и California Consumer Privacy Act (CCPA, Закон штата Калифорния о защите прав потребителей) четко устанавливают, какие персональные данные можно собирать, хранить и использовать, а какие нельзя. По мере развития технологий законодательство должно уточняться.

Технически справиться с проблемой приватности в системах безопасности позволяют решения, которые на уровне видеокамеры или управляющего ПО (VMS) скрывают лица людей, обеспечивая доступ к этим данным лишь уполномоченным пользователям или руководителям.

Каждое новое технологическое достижение влечет за собой проблемы как технического, так и социального характера. Поэтому один из приоритетов компании Network Optix – развивать платформу для управления IP-видеонаблюдением, соблюдая разумный баланс между ценностью искусственного интеллекта и конфиденциальностью персональных данных.

Получить консультацию по задачам видеоанализа ➞

Если вам необходима консультация или проработка технического решения по развертыванию системы интеллектуального видеонаблюдения, обращайтесь к Ольге Федосеевой по email