© Е.В. Зайцева. Д.Л. Степанова, 2013
УДК 004.93'12
Е.В. Зайцева. А.Л. Степанова
КЛАССИФИКАЦИЯ СОВРЕМЕННЫХ МЕТОДОВ ТРЕКИНГА ОБЪЕКТОВ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ ВИДЕОНАБЛЮДЕНИЯ
Рассмотрены современные методы отслеживания объектов в системах видеонаблюдения, представлены способы описания объектов и выбор признаков в зависимости от наблюдаемого объекта. Предлагается классификация этих методов на основе подхода к выделению формы. Ключевые слова: слежение, видеонаблюдение, классификация, видеоаналитика.
Видеонаблюдение используется в современном мире практически во всех сферах деятельности: в различных охранных системах, для борьбы с терроризмом, в работающих в режиме реального времени АСУ ТП, для мониторинга дорожного движения, для изучения поведения лабораторных животных. В настоящее время всё более широкое распространение приобретают интеллектуальные системы видеонаблюдения, в состав которых входит программный модуль отслеживания движущихся объектов [1, 2]. Его задача состоит в анализе потока видеоданных, поступающего с цифровой камеры, и автоматическом трекинге передвигающегося в поле зрения камеры субъекта.
Цель трекинга объектов - это создание траектории объекта во времени путем локализации его позиции в каждом кадре видео. Применение видеоаналитических систем дает возможность снизить участие в процессе наблюдения оператора, что в свою очередь уменьшает влияние человеческого фактора, сокращает время реакции на нештатные ситуации и позволяет своевременно распознавать угрозы. Кроме того, такая система успевает анализировать большее количество поступающих данных в режиме реального времени, а не обрабатывает их уже после события.
Задача видеослежения заключается в определении положения объекта на плане наблюдаемой территории по видеоданным, полученным от одной или нескольких камер. Сущест-
вует три ключевых шага в анализе видео в реальном времени: обнаружение движущегося объекта, трекинг этого объекта от кадра к кадру, анализ трека этого объекта для распознавания его поведения. Задача детектирования и установления соответствия между объектами в разных кадрах может быть выполнена совместно или по отдельности, что также зависит от представления объекта.
Достаточно просто отследить траекторию объекта в лабораторных условиях, но трекинг может быть весьма осложнен влиянием условий наблюдений: шумом в изображениях, переменами освещенности сцены, частичными и полными окклю-зиями, изменчивым фоном и при движении объекта сложной формы. В системах видеонаблюдения имеются различные методы и алгоритмы для отслеживания траектории объекта. Классифицировать их можно по разным признакам: по представлению объекта для трекинга, по используемым особенностям изображения, по способу моделирования движения, по внешнему виду и форме объекта.
Выбор метода зависит прежде всего от того, в какой среде осуществляется отслеживание. Большую роль в трекинге играет выбор особенностей объекта, которыми могут быть: цвет, форма края, оптический поток, текстура. Форма представления выбирается в зависимости от его внешнего вида. Обычно используются:
• Точки.
Объект представляет собой точку или набор точек. Этот метод подходит для отслеживания малых объектов, занимающих небольшую часть изображения
• Примитивные геометрические формы.
Форма объекта представляется как эллипс или прямоугольник [3]. Они подходят для представления простых жестких объектов, хотя также применяются и для отслеживания нежестких.
• Силуэт объекта и контур.
Представление в виде контура определяет границы объекта. Область внутри контура называется силуэт. Силуэт и контур подходят для трекинга сложных гибких объектов [4].
Для трекинга людей применяют сложные формы модели, когда объекты наблюдения состоят из частей тела, а отношения между частями тела регулируются моделями кинематики дви-
жения, а также используется модель скелета, который может быть получен из силуэта объекта.
Между видом представления объектов и методами отслеживания существует тесная взаимосвязь, соответствующая классификация представлена на рис. 1 [5].
Рис. 1. Классификация методов тренинга объектов
Отслеживание точек
Отслеживание точек может быть сформулировано как зависимость обнаруженных объектов представленная точками во всех кадрах. Соответствие объектов в методах отслеживания точек обычно определяется с помощью комбинации ограничений:
• Близость местоположения объекта от одного кадра к другому;
• Максимальная скорость, ограничивающая окрестность вокруг объекта;
• Плавность движения, значащая что направление и скорость объекта не меняются кардинально;
• Общее движение, предполагающее что скорость объектов в малой окрестности должна быть одинаковой;
• Жесткость, обозначающая что расстояние между любыми двумя точками на объекте останутся без изменений.
Качественное сопоставление объектов трекинга может приниматься на основе их способности записи новых появившихся объектов и исчезновения существующих, обработки окк-люзий, обеспечения оптимального решения функции миними-
зации стоимости для установления соответствий [6]. В целом эти методы можно разделить на две широкие категории, а именно детерминированные и статистические методы. Для определения соответствия точек детерминированные методы используют стоимость привлечения каждого объекта в предыдущем кадре к объекту в текущем кадре. Минимизация этой стоимости формулируется как проблема комбинаторной оптимизации. Решение, состоящее из найденных соотношений один к одному среди всех возможных ассоциаций, может быть получено, например, методом жадного поиска. Для решения проблемы обработки пропавших или шумных наблюдений при детерминированном отслеживании точек часто используют сочетание движение на основе ограничений. Методы статистического отслеживания с учетом неопределенности в модели явно обрабатывают шум, который обычно предполагается как нормально распределенный, но прогнозируемая позиция объекта не всегда выполняется. В случае с действительным предположением на распределение и шум фильтр Калмана и МНТ показывают лучший результат [5]. Другой подход к обработке шума и окклюзий предполагает соблюдение ограничений, которые определяют структуру 3Э объекта [7], вычисленная форма затем служит ограничением на оставшиеся точки траектории.
Методы отслеживания точек подходят для отслеживания очень маленьких объектов, которые можно представить одной точкой на кадре, так и для больших, для описания которых необходимо множество точек. В контексте отслеживания объектов с использованием нескольких точек важной проблемой является кластеризация точек, необходимая для отличия между несколькими объектами и между объектами и фоном. Для упрощения проблемы сегментации обычно предполагается, что отслеживание происходит на неподвижном фоне.
Отслеживание простых геометрических форм
С представлением объектов на основе простых геометрических форм вычисляемое движение неявно определяет область объекта, его ориентацию в следующем кадре, расположение объекта определяется с помощью оценочной модели движения. Качественное сравнение методов этой
категории может быть получено на основе критериев количества отслеживаемых объектов, способность обрабатывать окклюзии, требование тренировки, тип модели движения, требование о ручной инициализации. На основе представления внешнего вида объекта эти методы можно разделить на две подкатегории, а именно, использующие шаблон вида объекта и использующие несколько видов объекта. Методы на основе шаблонов широко используются из-за их относительной простоты и низкой вычислительной сложности. Их суть заключается в определении области интереса и взятии ее за шаблон, затем для шаблона из предыдущего кадра вычисляется степень сходства с кандидатом в текущем. Мерой сходства может быть прямое сравнение шаблона или статистические показатели двух плотностей вероятности. Таким образом, методы, основанные на шаблонах, собирают информацию об объекте из самых последних наблюдений, но с различных точек наблюдения форма может различаться и, если представление объекта резко изменится во время слежения, его след может быть потерян. Для решения этой проблемы могут быть использованы модели разных видов объекта, которыми программа будет обучена в автономном режиме. Движение объекта можно оценить путем нахождения максимального сходства между предыдущим и текущим кадром. Для предсказания местоположения объекта в следующем кадре используются фильтр Калмана или фильтр частиц.
Примитивные геометрические формы для представления объекта используются очень часто, поскольку они подходят для применения в реальном времени. Одним из недостатков использования трекинга примитивных геометрических форм является то, что части объектов могут быть оставлены за пределами определенной формы, в то время как часть фона может находиться внутри него. В таких случаях движение объекта, полученное путем оценки максимального сходства, может быть некорректно, поэтому применение моделирования объекта по плотности вероятности функции цвета/текстуры и назначение веса пикселям, находящимся внутри примитивной формы, может быть более эффективно.
Отслеживание силуэта
Отслеживание силуэта используется, когда требуется тре-кинг объектов сложной формы. Факторами для выделения различий методов являются используемые особенности объекта, обработка окклюзий, необходимость тренировки на примерах. Самое главное преимущество этих методов - это гибкость при работе с большим разнообразием форм объектов. Наиболее распространенным представлением силуэта является функция двоичного индикатора, которая обозначает области объекта единицами, а остальные - нулями. Появление объекта, как правило, моделируется параметрической или непараметрической функциями плотности, такими как смесь Гаусса или гистограммы. Методы отслеживания контура можно разделить на две категории, а именно соответствие формы и эволюция контура. Методы соответствия формы похожи на методы шаблона вида объекта. Поиск выполняется путем вычисления схожести объекта с генерированной моделью из предполагаемых силуэтов, основанных на предыдущем кадре. Такой подход предполагает перевод модели только из текущего кадра к следующему, поэтому движение нежестких объектов не является явно решенным без дополнительных усовершенствований. Другой подход заключается в расчете потока вектора для каждого пикселя внутри таким образом, чтобы доминирующий поток использовался для создания траектории объекта. Методы эволюции контура последовательно развивают начальный контур в новую позицию в текущем кадре с помощью моделей пространства состояний или прямой минимизации функции энергии [4,8]. Состояние объекта определяется с точки зрения формы и параметров движения контура, оно обновляется каждый раз, когда априорная вероятность, зависящая от приоритетного состояния и расстояния от наблюдаемой границы объекта, максимальна. Методы соответствия формы не позволяют отслеживать изменения топологии, а именно раскол региона или слияния [9]. В методах прямой минимизации энергии нужно после построения контура сформулировать его энергию и на следующем кадре найти контур, на котором достигается минимум энергии. Энергетическая формулировка позволяет учитывать разные факторы совместно, что повышает качество отслеживания.
Анализ методов отслеживания объектов показал, что в настоящее время остро стоит проблема обеспечения непрерывного трекинга. Важным фактором, влияющим на эффективность применения метода, является выбранный способ описания формы объекта. Рассмотренные методы реализованы алгоритмически и используются в зависимости от условий наблюдения.
- СПИСОК ЛИТЕРАТУРЫ
1. Степанян И.В. Нейрокомпьютерное моделирование зрительного анализатора для обеспечения безопасности человека, ГИАБ. - М.: МГГУ -2010, № 3. - с. 323-329.
2. Петровичев Е.И. Нейросетевая технология в системах искусственного интеллекта, ГИАБ. - М.: МГГУ, отдельный выпуск 11, 2009, с. 135-146
3. Comaniciu D., Ramesh V., MEER, P. 2003. Kernel-based object tracking. IEEETrans.Patt. Analy. Mach. Intell. 25, 564-575.
4. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. М.: Вильямс, 2004. - 928 с.
5. Yilmaz A., Javed O., and Shah, M. 2006. Object tracking: A survey. ACM Comput. Surv. 38, 4, Article 13, 45 pages.
6. КИМ Д.П. Методы поиска и преследования подвижных объектов. М.: Наука, 1989. - 336 с.
7. Torresani L., Bregler C. 2002. Space-time tracking. In European Conference on Computer Vision (ECCV). 801-812.
8. Maccormick J., Blake A. 2000. Probabilistic exclusion and partitioned sampling for multiple object tracking. Int. J. Comput. Vision 39, 1, 57-71.
9. Sethian J. 1999. Level Set Methods: Evolving Interfaces in Geometry, Fluid Mechanics Computer Vision and Material Sciences. Cambridge University Press fTT^I
КОРОТКО ОБ АВТОРАХ -
Зайцева Елена Вячеславовна - кандидат технических наук, доцент кафедры АСУ, [email protected]
Степанова Анастасия Леонидовна - магистр, [email protected] Московский государственный горный университет
А