Научная статья на тему 'Новый метод подавления эффекта дрожания кадра в видео'

Новый метод подавления эффекта дрожания кадра в видео Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
141
23
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — К. Н. Стрельников, Д. С. Ватолин, С. А. Солдатов

В данной статье авторами рассмотрены наиболее известные алгоритмы подавления дрожания в видео и проанализированы их достоинства и недостатки. Также предложены новые алгоритмы подавления дрожания в видео с заполнением неизвестных области после сдвига кадра и определения наличия дрожания в видео

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Новый метод подавления эффекта дрожания кадра в видео»

Секция «Компьютерная графика»

Новый метод подавления эффекта дрожания кадра в видео

К.Н. Стрельников, Д.С. Ватолин, С.А. Солдатов МГУ им. Ломоносова, факультет Вычислительной Математики и Кибернетики,

Лаборатория Компьютерной Графики {strelnikov_kn, dmitriy, stass}@graphics.cs.msu.ru

Аннотация

В данной статье авторами рассмотрены наиболее известные алгоритмы подавления дрожания в видео и проанализированы их достоинства и недостатки. Также предложены новые алгоритмы подавления дрожания в видео с заполнением неизвестных области после сдвига кадра и определения наличия дрожания в видео. Введение

Человеческий глаз очень чувствителен к дрожанию кадра в видео, поскольку реагирует на движение, а хаотичное движение является сильным раздражителем для глаза. Поэтому просмотр фильмов с дрожанием кадра вызывает дискомфорт восприятия. Дрожание кадра обычно появляется при съемках без использования штатива или специальных платформ, которые применяются при киносъемках. Это, как правило, архивное видео, материал журналистов или домашнее видео.

Целью алгоритмов подавления эффекта дрожания является удаление нежелательного дрожания при сохранении равномерного движения камеры.

1. Обзор существующих алгоритмов

Можно выделить четыре разных подхода к подавлению дрожания кадра:

1) на основе алгоритма определения движения (Motion Estimation);

2) на основе аппарата особых точек (Feature Points);

3) на основе визуализации по изображениям (Image-Based Rendering);

4) на основе анализа кадра целиком.

Далее будут рассмотрены несколько алгоритмов, использующих эти подходы.

1.1. Подавление дрожания в видео с использованием Motion Estimation

Аппарат Motion Estimation используется практически во всех областях обработки

видео. Задача - определить направление и скорость движения небольших частей кадра. Для этого кадр разбивается прямоугольной сеткой на блоки заданного размера, и для каждого блока минимизируется функция (1).

3

error = У (( (x, y) - IT (x + Ax, y + Äy) )2

(Äx, Äy )eS

(1)

Таким образом, каждому блоку ставится в соответствие вектор движения

(Ах, Ду) из некоторой области поиска £. А для пары кадров определяется векторное

поле, характеризующее смещение объектов сцены за время Т - Т'.

1.1.1. Простейший подход

Простейший подход [1] заключается в определении смещения кадра, как

медианного вектора из найденного поля векторов. Таким образом, для

последовательности кадров получаем набор смещений вдоль осей координат

{(ДХг, ДУ1): : е [2, N ]}. Сдвиги после удаления дрожания {(Д~г, ДУ1): : е[2, N ]}

получаем, применяя к набору {(ДXi, ДУ1): I е [2, N]} фильтр усреднения.

h[n] =

VL , n = 0, L -1 0

(2)

Подавление дрожания осуществляется смещением каждого кадра на вектор

(ÄX,, AY,).

(ax,, äY) = (ÄXi - ÄXt, Ä~ - ÄY;). (3)

Алгоритм работает очень быстро, но позволяет получить приемлемый результат

на узком классе видеопоследовательностей, так как не оценивает поворот и

увеличение.

1.1.2. Восстановление движения камеры

В данном алгоритме [2] производится определение параметров движения камеры

в пространстве по известным векторам движения. Каждой точке Р = (x, y) на кадре

соответствует определенная точка сцены P =(X , z), и они связаны соотношением

(4).

(x, y )=(X/Zfe, Y/Zf. ) (4)

fc - фокусное расстояние камеры. Движение камеры определяется сдвигами (Tx ,Ty T)

вдоль соответствующих

координатных осей и поворотами (Q x, Q y, Q z) вокруг соответствующих координатных осей. А связь между движением кадра и движением камеры задает равенство (5).

T T Q Q

- fc (Z +Qy ) + x~Z + yQz - x 2-fL + xy-f-

Z Z JcJc

+ y

2 Q X

T T Q

- fc (Z + QX) + yZ - xQz - xyf „

Z Z JcJc

(и, V) и (х, У) - координаты точки в текущем и предыдущем кадре; Ъ - удаленность точки, представленной в предыдущем кадре координатами

(х, У).

Исходя из предположения, что на любом изображении есть область, которой в сцене соответствует плоскость, получаем (6). По утверждению авторов, качественно оценить все параметры нельзя, поэтому определяются только сдвиги вдоль осей (Тх ,Ту ,Тг) и поворот вокруг оси Ъ (О г). Полученная траектория камеры сглаживается, и производится сдвиг кадров соответственно новой траектории камеры.

a = - fcaTX - fc QY 1 = aTZ - fcPTX

C = QZ - fc7TX d = -fcaTY + fn X (6)

e = -П z - fcPTY f = aTZ - fcYTY

g = -n zfc -1 +PTZ h = Q Xfc + YTZ

Основной недостаток алгоритма в том, что точность определения параметров движения не высока. Хотя, значительно выше чем у алгоритма изложенного в предыдущем пункте (0)

1.2. Подавление дрожания в видео с использованием Feature Tracking

Работу алгоритмов Feature Tracking [3] можно разделить на два этапа:

1) Выбор особых точек (Selection).

На этом этапе производится отбор точек, обладающих набором определенных свойств. Вообще говоря, разные методы (например, KLT и IPAN) дают различные наборы особых точек. Но их задача в том, чтобы выбрать точки, окрестность которых значительно отличается от окрестностей близлежащих точек.

2) Определение смещения особой точки между соседними кадрами (Tracking).

Этот этап выполняется аналогично алгоритму Motion Estimation из пункта 0.

1.2.1. 2D Ridge Motion

В алгоритме [1] используется небольшое число особых точек. Проведя

сопровождение особых точек, получаем для каждой из них траекторию движения -

x(t) и y(t). Движение камеры считается линейным, поэтому траектории

приближаются наиболее близкой прямой:

N

m11 Z((t) - a •t - 1) (7)

a ,b

P=1

p(t) - точки траектории x(t) или y(t).

Вектор сдвига находится как медиана от векторов сдвига для особых точек. Далее алгоритм работает аналогично подходу, описанному в пункте 0. И обладает теми же недостатками.

1.3. Подавление дрожания в видео с использованием Image-Based Rendering

На первом этапе [4] определяются и сглаживаются траектории движения

отобранных особых точек аналогично алгоритму, описанному в пункте 0.

Далее для каждой точки, координаты которой получены сглаживанием, определяется значение яркости. Для определения нового значения яркости выбирается несколько кадров, в которых положение рассматриваемой особой точки близко к полученному сглаживанием (Рис. 1). Яркость в точке вычисляется по формуле (8).

Е (1- ^) • с,,

dmax = max(d, )

(8)

- расстояние между точками p и Р,; с, с, - цвет точек p и pi соответственно.

По найденным точкам строится треугольная сетка, и производится визуализация (rendering). Пример построения сетки приведен на рисунке (Рис. 2).

Рис. 1 Определение яркости в точке

Рис. 2 Пример построения сетки

с

1.4. Подавление дрожания в видео с анализом кадра целиком

1.4.1. Алгоритм подавления дрожания кадра, строящий аффинную модель движения [5]

Изменение положения кадра оценивается с помощью аффинной модели.

V4

y

п

ах а2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J

V a3 a4 У

y

.n—1

i и \

+

bi

J

V b2 У

A ■

y

.n—1

+ bn (9)

V-' J

x ,y - координаты точки в n-ом кадре. Таким образом, производится оценка поворота, увеличения и сдвига. Параметры An и

bn определяются при помощи алгоритма градиентного спуска с функцией цены (10).

I ((In (x) — In—1 (An ■ x + bn )2 + в))2 в > 0 (10)

x

После определения матриц A и векторов b для всех кадров проводиться их покомпонентное сглаживание (например, с помощью фильтра Кальмана). В

результате, каждому An и bn ставятся в соответствие An и bn, которые отражают

истинное движение кадра (без дрожания). С использованием An и bn строится

стабилизированное видео, в котором отсутствует дрожание кадра.

Данный алгоритм позволяет получить наилучший результат в сравнении с остальными рассмотренными в обзоре алгоритмами, но требует значительных вычислительных затрат.

2. Предлагаемый алгоритм

Предлагаемый алгоритм подавления эффекта дрожания состоит из трех шагов:

1) определение смещения между соседними кадрам;

2) удаление дрожания;

3) заполнение неизвестных областей на краях кадра.

2.1. Определение смещения между соседними кадрами

Определение глобального смещения между соседними кадрами выполняется на

основе информации о локальном движении при помощи алгоритма, описанного авторами в статье [6]. Особенность подхода заключается в том, что алгоритм не ориентирован на какой-либо определенный алгоритм определения локального движения (Motion Estimation, Feature Tracking, Optical Flow), а может работать с результатом любого из них.

В результате этого шага для каждого кадра In определяются параметры

смещения: xn, yn - сдвиги вдоль осей, (рп - угол поворота, zn - увеличение. Иными

словами, оценивается траектория движения камеры (используется прощенная модель движения).

2.2. Удаление дрожания

Найденные траектории движения сглаживается покомпонентно с помощью

низкочастотной фильтрации. После чего кадры сдвигаются согласно разнице между исходной и сглаженной траекториями. Сдвиг вычисляется по формуле (11).

/V ~

Т = Т- • Т (11)

Т - смещение кадра в исходной видеопоследовательности; Т - смещение кадра после сглаживания;

/V

Т - сдвиг, компенсирующий дрожание.

2.3. Заполнение неизвестных областей на краях кадра

Поскольку кадры сдвигаются относительно исходного положения, на их краях

появляются неизвестные области. Самый простой способ решения этой проблемы заключается в обрезании краев кадра. Но такой подход не очень хорош, так как в результате теряется часть информации.

Для заполнения неизвестных областей авторы предлагают использовать панорамное изображение, реконструируемое в процессе работы алгоритма по известным параметрам глобального смещения между соседними кадрами (Рис. 3, Рис. 4). Такой подход не требует сложных дополнительных вычислений и обеспечивает приемлемое визуальное качество.

Рис. 3 Результат без заполнения краев Рис. 4 Результат с заполнением краев

Результат работы предложенного алгоритма представлен на рисунке (Рис. 6).

Рис. 5 Последовательность соседних кадров из видео с дрожанием

3. Определение наличия дрожания

Для определения наличия дрожания на некотором фрагменте видеопоследовательности анализируется соответствующий участок траектории движения независимо по каждой компоненте. Для каждой компоненты траектории анализируется ее спектр.

Как показали исследования, амплитуды спектра можно разделить на три класса: «форма», «дрожание» и «шум» (Рис. 7).

Для определения наличия дрожания анализируется амплитуды из класса «дрожание». На видеопоследовательностях без дрожания все амплитуды из этого класса лежат ниже некоторого порога (Рис. 8). Таким образом, если на некотором фрагменте траектории хотя бы одна амплитуда из класса «дрожание» превышает установленный порог, то считается, что на соответствующем фрагменте видео присутствует дрожание.

Рис. 8 Пример определения наличия дрожания

Предложенный алгоритм дает возможность не выполнять подавление дрожания на участках видео с плавным движением, что позволяет повысить скорость обработки видеопоследовательностей и снизить количество артефактов, вносимых алгоритмом подавления эффекта дрожания.

4. Заключение

В статье проанализированы наиболее известные алгоритмы подавления дрожания в видео и предложен собственный алгоритм, учитывающий их достоинства и недостатки. Предлагаемый алгоритм применим для обработки любых видеопоследовательностей, так как он анализирует видео на предмет наличия дрожания и обрабатывает только видео в которых эффект дрожания присутствует. Алгоритм определяет сдвиг, поворот и увеличение с высокой степенью точности и обрабатывает 30 кадров размером 352х288 пикселей в секунду на Pentium-4 2.8 ГГц за счет использования алгоритма быстрого и надежного определение глобального движения в видеопоследовательностях [6]. Особо стоит отметить, что предложенный алгоритм позволяет заполнять неизвестные области появляющиеся на краях кадров в результате компенсации дрожания.

Список литературы

[1] Kwong Kin, Wah Eric, «Video Stabilization Algorithms», ELEC 533 Project Report, 2003

[2] Irani M., Rousso B., Peleg S., «Recovery of Ego-Motion Using Image Stabilization», CVPR '94, pp. 454-460, 1994

[3] Tomasi C., Kanade T., «Detection and Tracking of Point Features», Carnegie Mellon University Technical Report CMU-CS-91-132, April 1991

[4] Buehler C., Bosse M., McMillan L., «Non-Metric Image-Based Rendering for Video Stabilization», Proceedings of CVPR, 2001

[5] Litvin A., Konrad J., Karl W.C., «Probabilistic video stabilization using Kalman filtering and mosaicking», Symposium on Electronic Imaging, Image and Video Communications, 2003

[6] Солдатов С.А., Стрельников К.Н., Ватолин Д.С., «Быстрое и надежное определение глобального движения в видеопоследовательностях», Труды конференции Graphicon-2006, стр. 430-437, Новосибирск, Академгородок, Россия, Июль 2006

i Надоели баннеры? Вы всегда можете отключить рекламу.