Научная статья на тему 'Видеокомпьютерные системы для наблюдения за движущимися объектами'

Видеокомпьютерные системы для наблюдения за движущимися объектами Текст научной статьи по специальности «Математика»

CC BY
105
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБНАРУЖЕНИЕ / DETECTION / СОПРОВОЖДЕНИЕ / ДВИЖУЩИЕСЯ ОБЪЕКТЫ / MOVING OBJECTS / ВИДЕОНАБЛЮДЕНИЕ / ДИНАМИЧЕСКИЙ ДИАПАЗОН / VOLUME RANGE / МОРФОЛОГИЧЕСКИЙ ГРАДИЕНТ / МОРФОЛОГИЧЕСКАЯ ФИЛЬТРАЦИЯ / MORPHOLOGICAL FILTRATION / СЕГМЕНТАЦИЯ / SEGMENTATION / MORPHOLOGICAL GRADIENT / ОПТИЧЕСКИЙ ПОТОК / OPTICAL FLOW / ЭНЕРГИЯ ДВИЖЕНИЯ / СЛОИ ДВИЖЕНИЯ / MOTION LAYERS / MOTION ENERGY / ПОРОГ ОБНАРУЖЕНИЯ / DETECTION THRESHOLD / TRACKING / VIDEOSUPERVISION

Аннотация научной статьи по математике, автор научной работы — Тимофеев Б. С.

Рассмотрены проблемы обнаружения и сопровождения движущихся объектов на сложном фоне. Обсуждены алгоритмы предварительной обработки изображений. Дан обзор методов слежения за объектами, основанных на модели, движении и представлении слоев движения. Показано, что методы слежения, основанные на представлении слоев движения, способны обрабатывать задачи, возникающие при перекрытии, остановке или при временном исчезновении объектов. Даны методики расчета векторов оптического потока на основе дифференциального анализа и сопоставления блоков. Предложен алгоритм автоматического определения порога для обнаружения энергии движения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Тимофеев Б. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Video and Computer Systems for the Moving Objects Tracking

The problems of moving objects detection and tracking on a complex background are considered. The algorithms of the images preprocessing are argued. The review of tracking objects methods based on model, motion and performance with motion layers is given. It is shown, that the tracking methods based on performance of motion layers are capable to handle the tasks arising at overlap, stoping or temporary disappearance of objects. The techniques of an optical flow vectors calculation based on the differential analysis and units comparison are given. The algorithm of a threshold autodetection for detection of a motion energy is offered.

Текст научной работы на тему «Видеокомпьютерные системы для наблюдения за движущимися объектами»

Известия вузов России. Радиоэлектроника. 2003. Вып. 4==================================

Телевидение и обработка изображений

УДК 621.397.13

Б. С. Тимофеев

Санкт-Петербургский государственный университет

аэрокосмического приборостроения

Видеокомпьютерные системы

для наблюдения за движущимися объектами

Рассмотрены проблемы обнаружения и сопровождения движущихся объектов на сложном фоне. Обсуждены алгоритмы предварительной обработки изображений. Дан обзор методов слежения за объектами, основанных на модели, движении и представлении слоев движения. Показано, что методы слежения, основанные на представлении слоев движения, способны обрабатывать задачи, возникающие при перекрытии, остановке или при временном исчезновении объектов. Даны методики расчета векторов оптического потока на основе дифференциального анализа и сопоставления блоков. Предложен алгоритм автоматического определения порога для обнаружения энергии движения.

Обнаружение, сопровождение, движущиеся объекты, видеонаблюдение, динамический диапазон, морфологическая фильтрация, сегментация, морфологический градиент, оптический поток, энергия движения, порог обнаружения, слои движения

Исследованию движения, зафиксированного с помощью телевизионных систем, посвящены многочисленные публикации. В 70-80 гг. XX века сегментацию и сопровождение движущихся объектов осуществляли в большинстве случаев в системах самонаведения на цель. Над разработчиками подобных систем довлели ограничения физической реализуемости алгоритмов в реальном времени, возникавшие из-за несовершенства элементной базы. Этот факт заставлял ограничиваться относительно простыми алгоритмами в ущерб их точности и надежности.

В последние годы интерес к проблемам движения многократно возрос. Прежде всего, это связано с необходимостью компенсации движения в системах сжатия цифровых телевизионных сообщений по стандарту MPEG. Известно [1], что до 63% вычислительных затрат в системе сжатия MPEG-2 приходится на компенсацию движения. В системе MPEG-4 коэффициент сжатия удалось существенно повысить без заметных артефактов в значительной мере за счет более эффективного алгоритма компенсации движения. Области применения систем выделения и сопровождения движущихся объектов существенно расшири-

32 © Б. С. Тимофеев, 2003

======================================Известия вузов России. Радиоэлектроника. 2003. Вып. 4

лись за счет их использования в охранных видеосистемах и в системах контроля дорожного движения и управления им. Стремительный прогресс вычислительных устройств снимает ограничения на сложность алгоритмов. В течение нескольких последних лет (значительный рост числа публикаций наблюдается с 1998 г.) предложены новые представляющие интерес алгоритмы выделения и сопровождения движущихся объектов на неподвижном (статическая камера) и движущемся (камера сопровождает объект) фонах.

Предварительная обработка изображения. Получение качественных исходных изображений объектов является основой для их дальнейшей обработки и для решения оперативных задач.

Важным резервом улучшения качества исходных изображений является расширение допустимого динамического диапазона освещенностей сцены, что позволит "не терять объекты" в условиях резко контрастного освещения. Примерами могут служить следующие условия видеосъемки:

• объекты на темном фоне воды и ярком фоне неба, разделенные линией горизонта;

• попадание в кадр солнца, ярких бликов, прожекторов;

• съемка против рассеянного солнечного света (в контражуре) и пр.

Для прикладных целей критерием оценки качества синтезированного изображения

M N

можно принять детальность D = ^^ CP (Xj, y), где M - число строк; N - число

i=1 j=1

столбцов в битовой матрице; CP (Xj, y¿) - контурный препарат. При синтезе изображения

применяют весовое суммирование видеокадров, снятых с различной экспозицией, причем весовые коэффициенты wi и w? устанавливают пропорциональными локальной детальности на площади кадра.

Видеоизображения окружающего пространства, полученные в сложных условиях видеонаблюдения, подвергают предварительной цифровой обработке с целью повысить вероятность правильного обнаружения объектов и снизить вероятность срыва сопровождения. Исходные изображения во многих случаях имеют недостаточный контраст, содержат фоновые составляющие и структурные помехи, а также поражены шумами (рис. 1). Первой операцией по обработке изображения является повышение контраста для эффективного использования выделенного динамического диапазона.

В ходе предварительной обработки изображений увеличивают соотношение сигнал/шум за счет пространственной и временной фильтраций; улучшают наблюдаемость предполагаемых объектов за счет геометрических и яркостных преобразований; устраняют статический или динамический фон. При обработке изображений, полученных в инфракрасной области спектра, априорно известно, что подлежащие обнаружению цели обычно светлее фона, так как они теплее окружающей среды. Нелинейная обработка с коэффициентом у > 1 позволяет существенно улучшить качество исходного изображения. Для случая инверсного изображения следует применить обработку с обратным коэффициентом уд = 1/у . Так, в результате нелинейной поэлементной обработки рис. 1, а с коэффи-

Известия вузов России. Радиоэлектроника. 2003. Вып. 4

V , -.'.. \ "V . _ "i : ■ : ■. : ^-¿Jí; ; - - i/

"■.«■Г Т .- - - Г I .' >, -Г . Г ■ г " ' -1 - _

а

!

б

циентом у = 3 заметно повысилось соотношение сигнал/шум и снизилась заметность структурной помехи (рис. 1, б).

Для дальнейшего сглаживания шумов выбирают методы фильтрации, не нарушающие фронтов изображения. Этим полезным свойством обладает морфологическая фильтрация, основанная на логических операциях [2]. В последнее время математическую морфологию применяют во многих областях обработки/анализа цифровых изображений, таких как нелинейная фильтрация, выделение контуров, подавление шумов, отображение форм, сглаживание и распознавание, ске-летирование. С целью улучшения соотношения сигнал/шум в изображении (рис. 1, б) применяют комбинацию операций открытия (opening) и закрытия (closing) со структурным элементом S с размером 3 х 3 элемента. Результаты морфологической обработки показаны на рис. 1, в.

Гистограммы распределения уровней яркости в изображениях (рис. 2) позволяют оценить полученный выигрыш в соотношении сигнал/ шум: среднеквадратическое отклонение значений яркости в окне фона из 10 201 элементов снизилось с 23.58 (рис. 2, а) до 4.75 уровней (рис. 2, б), т. е. в 5 раз (-14 дБ) .

Сегментация объектов по совокупности признаков. Обнаружение предполагаемых объектов на сложном фоне, пораженном шумами, производят на основании совокупности присущих им признаков (яркостных, гистограммных, текстурных, внешнего вида, размеров, формы, а также движения). Обычно в кадре присутствуют объекты как темнее, так и светлее фона. В этом случае для препарирования изображения используют градиентный метод. Напомним, что вектор-градиент составляется из первых частных производных матрицы яркостей элементов L в заданной точке изображения: gradL(x,y) = [(dL/dx),(dL/dy)]т ( т - символ транспонирования).

Рельеф изображения выявляется с использованием нормы вектора-градиента ||grad L ( x, y )||. В точках локальных минимумов и максимумов рельефа вектор-градиент равен нулю, следовательно, объекты, как темнее, так и светлее фона, приводятся к одному

в

Рис. 1

======================================Известия вузов России. Радиоэлектроника. 2003. Вып. 4

и тому же нулевому уровню. Вычисления вектора-градиента для каждой точки кадра представляют достаточно трудоемкую задачу, поэтому используют приближение к норме - так называемый многомасштабный морфологический градиент [3]:

MG (L) = 3 £ {К L ф Si) - (L 0 S')] 9 S' -1}

(1)

i=1

где 8г - группа структурных квадратных элементов размером (2/ +1) х (2/ +1) пикселей,

1 < / < 3; ф и © - операции наращивания и эрозии соответственно.

В соответствии с выражением (1) значения градиентов рассчитывают трижды с использованием структурных элементов различной размерности, а затем результаты складывают.

В видеокадре идущего на посадку самолета (рис. 3, а) корпус темнее фона, а включенные фары -светлее. В карте морфологического градиента (рис. 3, б) все эти детали отображены в виде темных участков, так как градиент в точках экстремумов сигналов минимален. Для выделения контрастирующих с фоном объектов применяется операция "залив-

Конал | Яркость

т

а

,^рец 204.64 Ср и i kji. £3,56 Мециан: 200 пиксел: 1 0201

К&л&я. | Яркость

Урсв Сче i Проиентнай. КэшуроЕья 1 1

а

б

Dpen. Ср откл: А.75 Мсций! i: 2-13 пиксел:10201

Урсв Счет ■ npOUCI ITI 1ЫЙ'

КэшypoBi-ri ■ 1

б

Рис. 2

в

Рис. 3

Известия вузов России. Радиоэлектроника. 2003. Вып. 4======================================

ки": участки изображения со значениями морфоградиента ниже некоторого порога заполняются черным, а выше его - белым цветом (рис. 3, в). При использовании операции морфологического открытия* из изображения (рис. 4, а) устраняются все области, размеры которых меньше, чем структурный элемент S, т. е. ликвидируется излишняя сегментация (рис. 4, б). Другое предложение заключается в изготовлении контурного препарата, так как считается, что основная информация содержится в его контурах. Для нахождения контуров используют фильтры Собела, которые дают пространственно ориентированные контуры, но наилучшим методом, на взгляд автора данной статьи, является все же применение морфологической обработки.

а б

Рис. 4

Использование признака движения для сегментации объектов. При обработке видеопоследовательности к перечисленным ранее признакам добавляют движение. Если камера расположена на подвижной платформе, то сначала производят компенсацию глобального движения фона, после чего обнаруживают локальные движения объектов. Прежде всего, следует определить само понятие движения применительно к условиям видеонаблюдения. Объект движется в трехмерном пространстве (3Б-движение). С помощью видеокамеры можно оценить лишь его проекцию на плоскость изображения, которую называют 2Б-движением. Видимое движение порождено изменениями яркости пикселей 1Х у (t) с координатами х и у в кадре с номером t. Видимое движение не эквивалентно 2Б-

движению, так как имеет место даже в статической сцене с изменяющейся освещенностью, где движение отсутствует. Для оценивания 3Б-движения доступно только видимое движение, что затрудняет решение задачи сегментации движущихся объектов.

Движение характеризуют полем оптического потока, а также энергией движения.

Оптический поток определяют через скорости V = (ух, Уу) . Поле векторов смещения -

* Базовыми операциями морфологической обработки являются "эрозия" (erosion - ©) и "наращивание" (duration - 0). Операция эрозии устраняет все детали, меньшие по размерам структурного элемента S. Операция наращивания увеличивает детали на величину S. Комбинация операций эрозии и наращивания, выполненных последовательно, называется "открытием" (opening). Сначала эрозией устраняют все детали, меньшие S, а затем наращиванием восстанавливают размеры всех оставшихся элементов до их прежних значений. 36

======================================Известия вузов России. Радиоэлектроника. 2003. Вып. 4

это проекция на плоскость изображения векторов, которые отображают смещения объектов в трехмерной сцене за фиксированный промежуток времени (обычно, это телевизионный кадр). Поскольку временной промежуток между соседними кадрами фиксирован, между векторами смещения и оптическим потоком существует непосредственная связь [4]. Чтобы определить оптический поток, применят методы дифференциального анализа, позволяющие связывать временные и пространственные рассогласования либо методы поиска наилучшего согласования блоков, относящихся к различным кадрам.

В методе дифференциального анализа предполагают, что вдоль траектории движения объекта его яркость L остается постоянной:

d w ч dL dx dL dy dL dL „

— L (x, y, t) ---+--- + — = VL v + — = 0,

dt 7 dx dt dy dt dt dt

где VL = [( dL/dx), (dL/dy )] - вектор-градиент.

Эта задача не доопределена: имеется лишь одно уравнение с двумя неизвестными vx и Vy. Чтобы найти решение, вводят ограничение гладкости: считают, что векторы скорости неизменны в пределах малого окна (например, 5 х 5 пикселей). Кроме того, используют весовую функцию W *, чтобы отдать предпочтение пикселю, находящемуся в центре окна. Тогда можно записать переопределенную систему из 25 уравнений, которую решают методом наименьших квадратов:

v =

-|Т

A т WWA

ATWWb

где V - вектор скорости; А - матрица частных производных ёЬ/ёх и ёЬ/ёу с размером 25 х 2 ; Ь - вектор производных по времени дЬ/dt с размером 25 х 1.

Метод согласования блоков, благодаря своей относительной простоте, является одним из самых популярных. Текущий кадр разбивают на блоки одинакового размера, и для каждого блока вычисляют наилучшее соответствие в следующем кадре. В качестве меры соответствия используют значение взаимно корреляционной функции или суммы модулей разности яркостей пикселей в пределах блока

т п

МЛО = XX 1х} , у. ^ ) - 1Х} , у. -1) , .=1 ]=1

где т, п - число пикселей в блоке по координатам х и у соответственно.

Минимум целевой функции ищут перемещением блока, выделенного в кадре с номером

(V -1) с координатами ( х1 -1, у{-1 )т, в пределах зоны поиска на последующем кадре с номером V. В результате поиска находят новое положение блока ( х1 , у1 )т и вычисляют вектор смещения

^ДХ ^ ( Х{ ^ ( XV _1

) \ yt) \ yt-1

* Весовая функция W - диагональная матрица весов пикселей.

Известия вузов России. Радиоэлектроника. 2003. Вып. 4======================================

Считают, что все пиксели блока претерпевают одинаковое перемещение, и им приписывают один и тот же вектор смещения [1].

Для эффективной реализации метода оптического потока нужно преодолеть две существенные трудности: громадный объем вычислений, если искать эти векторы для всех пикселей (или блоков) кадра, и большое количество аномальных векторов, соответствующих областям кадра без текстуры ("плоский блок") или изображениям края ("краевой блок"). Аномальные векторы не столь опасны при реализации алгоритмов сжатия, но могут привести к срывам слежения в прикладных видеосистемах. Влияние аномальных векторов снижают за счет медианной фильтрации или проверки на согласованность.

Разработано большое количество быстрых алгоритмов согласования блоков. Большинство из них уменьшает объем вычислений, ограничивая число контрольных точек внутри окна поиска (например, алгоритм трехшагового поиска 3SS) за счет предположения, что рельеф целевой функции гладкий. В реальных сюжетах это предположение выполняется далеко не всегда: целевая функция может иметь локальные минимумы, что приводит к плохой точности сопоставления блоков и, как следствие, к появлению аномальных векторов. В связи с этим обстоятельством был развит второй подход, рекомендующий уменьшить число пикселей, используемых при каждом измерении целевой функции (алгоритм остановки на половине пути).

Рационально искать векторы оптического потока в тех областях кадра, где обнаружена энергия движения, которую определяют через межкадровую разность или производную сигнала изображения по времени в последовательности кадров:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

y (t) ю X, у(t)- X, у(t -1)

dt At '

Абсолютная величина этой аппроксимации сравнивается с порогом соответствующего уровня, в результате чего происходит сегментация изображения кадра на подвижные (капли Blob) и неподвижные области. В системах с камерой, расположенной на подвижной платформе, предварительно должна быть проведена компенсация глобального движения. Для этого ищут точку с максимальным значением взаимной корреляции между двумя последовательными изображениями lx y (t) и Lx y (t -1) в моменты времени t и t -1:

M N

(rm, cm ) = argmin X X |lx+c,y+r (t) - lx,y (t -1)|,

( r ,c) y=0 x =0

где r, c - сдвиги между анализируемыми блоками в моменты времени t и (t -1) по вертикали и горизонтали соответственно; rm, cm - эти же сдвиги, доставляющие минимум целевой функции, т. е. максимальную корреляцию между блоками в указанные моменты времени; N и M - число столбцов и строк изображения соответственно.

Для уменьшения вычислительной нагрузки используют спиральное сканирование равноудаленных точек. Когда сдвиг между двумя кадрами найден, предыдущий кадр геометрически смещается в это положение и вычитается из текущего кадра:

Im ( X y ) =

lX,y (t) lX+Cm ,y+Гт

>0;

yV) lx+cm, y+rm 0 в противном случае.

где Im (x, y) - двузначная функция, принимающая значения 1 на областях движения и 0 в

остальной части кадра, рассчитанная в момент времени t для взаимного смещения кадров, доставляющего максимум их взаимной корреляции; 0 - величина порога [5].

Такое изображение, однако, содержит множество нежелательных шумов, вызванных помехами, а движение на заднем плане не может быть полностью исключено, так как параметры движения камеры не рассматриваются. Эти ошибки могут быть эффективно устранены без воздействия на интересующую область посредством морфологической открывающей операции над исходной матрицей пикселей L и структурным элементом S L^ = (LgS S , формирующей двузначную матрицу L^, элементы которой определяются аналогично Im (x, y). Для повышения робастности алгоритма предлагается проводить

обнаружение движения по блокам.

В литературных источниках можно найти рекомендации об установлении порога

0 = 5___10% . Однако если в процессе обнаружения и сопровождения объектов принимает

участие оператор, который указывает с помощью строба интересующий его объект (рис. 5, а), то можно предложить алгоритм автоматической установки порога, максимизирующий отношение вероятностей обнаружения истинного р и ложного движения Рл

(рис. 5, б): arg max [Ро/(Рл + s)], где малая величина г добавлена, чтобы избежать ситуации деления на нуль. При реализации алгоритма считают, что движение, обнаруженное внутри строба истинно, а в локальной области, окружающей строб, - ложно).

Если освещенность сцены резко меняется в интервале между сравниваемыми кадрами, возможен ложный результат обнаружения движения. Исправить положение можно за счет сравнения и выравнивания средней яркости изображений в соседних кадрах.

Строб Локальная область

а

Q

0.75 0.50 0.25

0

Р 0.75 0.50 0.25

0

Рис. 5

Q _ V (рл )

Q~ [ V(Рл - )]

max

0, %

0, %

б

Известия вузов России. Радиоэлектроника. 2003. Вып. 4======================================

При быстром движении объекта области движения будут обнаружены дважды: в моменты времени (t -1) и t. Это значит, что центр обнаруженной движущейся области смещен относительно истинного положения объекта в текущий момент времени t. Для компенсации полученной ошибки предлагается выполнять логическую операцию И между найденной областью движения и контурным препаратом, полученным из текущего кадра t .

Сопровождение объектов. Надежное слежение за объектами - более сложная задача, чем просто обнаружение движения. Известны многочисленные программы исследований, имеющие дело с задачей слежения, и существующие направления могут быть представлены тремя подходами:

• Основанные на движении, реализующие робастные методы для группировки территориально близких областей или блоков с согласованным движением;

• Основанные на модели, предполагающие, что форма и внешний вид объектов априорно известны, и поэтому более надежные по сравнению с методами, оценивающими только движение. Пространство модели может быть или реальным ЭБ-миром, или 2Б-про-странством проекции на плоскость кадра;

• Основанные на представлении слоев движения, реализующие идею разложения последовательности видеокадров на двухмерные слои когерентного движения, что позволяет ввести в действие мощные инструментальные средства анализа движения.

Во всех подходах слежение выполняют с учетом геометрических свойств прослеживаемого объекта; при этом полагаются на информацию, обеспеченную либо границами (контурами) объекта, либо всей областью, т. е. яркостью, текстурой и движением (на основе разметки блоков).

Алгоритмы слежения, основанные на границах, используют активные контурные модели, такие как "змеи", "активные геодезические контуры" [6] и "статистический морфологический остов" (statistical morphological skeleton - SMS), который является оператором описания формы. Эти модели основаны на энергетическом или геометрическом подходах минимизации, которые видоизменяют начальную кривую под влиянием внешних воздействий, тогда как внутренние силы этому противодействуют.

Методы слежения, основанные на модели, различают по способу формирования и модификации априорно известных моделей. Если алфавит объектов, которые подлежат сопровождению, заранее известен, то в предельном случае реализуют трехмерные математические модели объектов, которые могут перемещаться в трехмерном пространстве. Новые положения модели рассчитывают с помощи матриц аффинных преобразований. Затем рассчитывают проекцию модели на экранную плоскость (маску), которую далее совмещают с реальным изображением (рис. 6). Такая сложная модель позволяет оценить трехмерное движение, но пересчеты модели сопряжены с существенными вычислительными затратами [7], [8].

Более простая модель образована из линий и плоских граней (рис. 7). Эту модель совмещают с контурным препаратом, изготовленным из исходного изображения. Мерой близости выбирают расстояние Хаусдорфа (рис. 8):

H (O, I) = max {h(O, I), h(I, O)},

Рис. 6

Рис. 7

где h (O, I) = max min J|o - i||; h (I, O) = max min ||o - i||; O, I - матрицы координат элемен-oeO iel iel oeO

тов модели и изображения соответственно; o, i - векторы координат элементов модели и изображения соответственно.

• Точка модели о Точка объекта

О

о

о

о

о,

о,

о

h (O, I)

о

h (I, O)

a

б

Рис. 8

Сначала вычисляют для каждой точки модели о расстояние до ближайшей точки изображения I, а затем значение максимального из этих расстояний присваивают величине h (О, I) (рис. 8, а). Затем, наоборот, вычисляют для каждой точки изображения I расстояния до ближайшей точки модели о и величине h (I, О) присваивают значение максимального из этих расстояний (рис. 8, б). Расстояние Хаусдорфа равно большему из этих максимумов: на рис. 8 h(I,О) больше, чем h(О,I), поэтому расстояние Хаусдорфа

H (I, О ) равно h (I, О ) [9].

Устройства слежения, основанные на корреляции и на энергии движения, неспособны обработать трудные задачи: перекрытие, остановку или временное исчезновение объекта. Корреляционные устройства слежения определяют движение выделенного объекта с помощью вычисления функции взаимной корреляции шаблона внешнего вида с изображением. Шаблон - прямоугольное окно, выделенное вручную в первом кадре. Затем шаблон модифицируется линейной интерполяцией предыдущей модификации и его новой оценки. При вычислениях на стадиях корреляции и модификации шаблона не принимается во внимание принадлежность пикселей изображения. Каждый пиксель в окне шаблона, принадлежит ли он к фону или к объекту, рассматривается в равных условиях. Следовательно, его легко перепутать с фоновой помехой или близлежащими объектами.

Известия вузов России. Радиоэлектроника. 2003. Вып. 4======================================

Устройства слежения, основанные на энергии движения, используют информацию, содержащуюся в областях значимой межкадровой разности. Объект инициализируется, когда обнаруживается такая новая область. Для сглаживания траектории перемещения объекта используется фильтр Калмана. Очевидная проблема с подобным типом устройств слежения заключается в том, что сопровождение прекращается, когда объект останавливается. Когда область движения пропадает, устройство слежения не может определить, остановился объект или исчез. Другая проблема состоит в том, что, когда объекты приближаются друг к другу, их области движения объединяются. Единственным признаком, позволяющим позднее разбить их на отдельные области, является движение. Такой подход может оказаться ненадежным, если объединение продолжается продолжительный период времени.

Ключевая идея анализа движения объектов, основанного на слоях, заключается в том, чтобы в момент времени t сегментировать объекты на отдельные слои Aj (нумеруемые переменной j) по признакам формы Фt j, движения Mt j и внешнего вида At j :

Aj = j, Mt j, At j}, которые затем обрабатывать раздельно [10]. Каждый слой содер-

A^2,t,j Arot,j

, где Дц - век-

жит объекты с когерентным движением j = г j

тор смещения центра тяжести изображения объекта; Дю - приращение угла поворота (рис. 9, а). Для снижения объема вычислений вводится гауссовская аппроксимация модели формы объекта (рис. 9, б).

yt-1, j

A' -h t,J i / 1

/

A

t-1, j

mi,t, j

-M?

At, j , J * 0

x,

t-1,j

j = 0, фон

б

Рис. 9

Предположим, что имеются g слоев движения, причем слой 0 - фоновый. Тогда модель объекта, принадлежащего к слою у.

Lt, J (xi) =

в, J = 0;

f( xi

Y + ех^ - (xi - ^t, j ) Кt )

(xi - Kt,j)/2] , J = 1, ..., g-1

где у - малая по величине положительная константа, представляющая неопределенность формы.

Матрица ковариаций определена как

, j = R1!-©t, j )diag

,2 ,2

lt, j' j

Я (j ),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Я (-щ j) - матрица поворота на угол ю; lt j и st j - длины малой и большой полуосей эллипсов гауссовской аппроксимации формы объектов.

Тогда форма объекта, принадлежащего к слою j, может быть компактно описана

длинами полуосей эллипса Фt j =

Нормированная модель объекта

lt, j, st, j ] •

St, ] (х) = Ц, ] (х)/ Е lt, ] (х).

/ ]=0

Каждому пикселю изображения ставят в соответствие параметр принадлежности к

слою

h =P

ni,j г

h (X)

4, j И

*t, j (X Vz •

В этой формуле первый сомножитель - вероятность, показывающая насколько хорошо изображение (хг-) соответствует шаблону внешнего вида А' j - шаблону At-1 j, для

которого выполнено согласование положения с новой позицией объекта. Второй сомножитель описывает априорную вероятность принадлежности пикселя к слою / Коэффициент 2

ё-1

нормализует И j так, чтобы ^ И^ j = 1. Параметр принадлежности к слою И■ j - апостери-

]=0

орная вероятность принадлежности пикселя с номером I к слою ] . Это уравнение иллюстрирует тот факт, что на сегментацию И j влияют как априорная функция формы, так и мера соответствия изображения шаблону. Системы слежения, основанные на слоях движения, успешно преодолевают указанные выше трудности, поскольку разнесенные по слоям объекты обрабатывают с учетом параметра принадлежности к слою.

Библиографический список

1. Cheung Ch.-K., Po L.-M. Normalized partial distortion search algorithm for block motion estimation // IEEE transactions on circuits and systems for video technology. 2000. Vol. CSVT-10, № 1. P. 417-422.

2. Maragos S. Tutorial on advances in morphological image processing and analysis // Optical Engineering. 1987. Vol. 26, № 7. P. 623-632.

3. Wang D. Unsupervised video segmentation based on watersheds and temporal tracking // IEEE Transactions on circuits and system for video technology. 1998. Vol. CSVT-8, № 5. P. 539-552.

4. Giusto D. D., Vernazza G. Optical flow calculation from feature space analysis through an automatic segmentation process // Signal Processing. 1989. Vol. 16. P. 41-51.

5. Murray D., Basu A. Motion tracking with an active camera // IEEE transactions on pattern analysis and machine intelligence. 1994. Vol. PAMI-16, № 5. P. 231-239.

6. Paragios N., Deriche R. Geodesic active contours and level sets for the detection and tracking of moving objects // IEEE transactions on pattern analysis and machine intelligence. 2000. Vol. PAMI-22, № 3. P. 266-279.

7. Рапаков Г. Г., Тимофеев Б. С. Компьютерное моделирование летательных аппаратов в задаче траек-торных измерений / Санкт-Петербург. акад. аэрокосм. приборостроения. СПб., 1998. 9 с. Деп. в ВИНИТИ 10.02.98, № 370-В98.

1

Известия вузов России. Радиоэлектроника. 2003. Вып. 4======================================

8. Рапаков Г. Г., Тимофеев Б. С. Машинный синтез трехмерной модели летательных аппаратов: Сб. науч. тр.: В 2 т. Т. 1 / Вологод. политехн. ин-т. Вологда, 1998. С. 72-75.

9. Meier Th., Ngan K. N. Automatic segmentation of moving objects for video object plane generation // IEEE Transactions on circuits and system for video technology. 1998. Vol. CSVT-8, № 5. P. 525-537.

10. Tao H., Sawhney H. S., Kumar R. Object tracking with Bayesian estimation of dynamic layer representations // IEEE transactions on pattern analysis and machine intelligence. 2002. Vol. PAMI-24, № 1. P. 75-88.

B. S. Timofeev

Saint-Petersburg state university for aerospace instrumentation Video and Computer Systems for the Moving Objects Tracking

The problems of moving objects detection and tracking on a complex background are considered. The algorithms of the images preprocessing are argued. The review of tracking objects methods based on model, motion and performance with motion layers is given. It is shown, that the tracking methods based on performance of motion layers are capable to handle the tasks arising at overlap, stoping or temporary disappearance of objects. The techniques of an optical flow vectors calculation based on the differential analysis and units comparison are given. The algorithm of a threshold autodetection for detection of a motion energy is offered.

Detection, tracking, moving objects, videosupervision, volume range, morphological filtration, segmentation, morphological gradient, optical flow, motion energy, detection threshold, motion layers

Статья поступила в редакцию 26 июня 2003 г.

УДК 621.397

Н. А. Обухова

Санкт-Петербургский государственный университет

аэрокосмического приборостроения

Метод видеонаблюдения за медленно движущимися малоразмерными объектами

Описывается группа алгоритмов, решающих задачу обнаружения, сегментации и сопровождения медленно движущихся малоразмерных объектов на основе метода сопоставления блоков, применяемого стандартах видеокодирования МРЕО-1, -2. Предложен способ нахождения векторов движения при смещении объекта менее одного пикселя - непрерывная оценка вектора движения, получаемая квадратичной интерполяцией. Приведены алгоритмы сегментации объектов по признакам пространственной и временной корреляций и их 44 © Н. А. Обухова, 2003

i Надоели баннеры? Вы всегда можете отключить рекламу.