Научная статья на тему 'Двухпроходный режим компрессии видеоданных'

Двухпроходный режим компрессии видеоданных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
133
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМЫ СЖАТИЯ / АЛГОРИТМЫ УПРАВЛЕНИЯ СКОРОСТЬЮ ВИДЕОПОТОКА RATE CONTROL (RC) / КОМПРЕССИЯ ВИДЕОДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Потапов Павел Вячеславович

В статье предлагается двухпроходный алгоритм распределения ресурсов при компрессии видеоданных. Проводится анализ преимуществ и недостатков использования двухпроходных алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

2-pass video encoding mode

This paper propose 2-pass rate control algorithm. Proposed second order rate-distortion model. Discussed advantages and disadvantages of using 2-pass algorithms.

Текст научной работы на тему «Двухпроходный режим компрессии видеоданных»

P(x1; x2, x3, x4 | одно лицо в F)

и

Р(отклики порожденные шумом)Р(нет лица)

-коэффициент допустимой погрешности.

Р(одно лицо в F)

Когда группа признаков удовлетворяет критерию классификации — апостериорная вероятность присутствия лица превышает апостериорную вероятность отсутствия лица, поиск можно прекратить. Вероятно, проверять все возможные признаки для определения наличия лица будет не нужно. Если конфигурация явно указывает на наличие лица, а не на последствия шума, то можно утверждать, что лицо присутствует, и прекращать поиск.

В заключение нужно отметить, что задачи распознавания образов не имеют точного аналитического решения в связи с тем, что не существует формализованного описания изображения (Старавойтов В. В., Брилюк Д. В. Нейросетевые методы распознавания изображений. http://rusnauka.narod.rU/lib/author/briluk_d_b/1/index.html). Поэтому наиболее эффективных результатов работы приведенных детекторов лиц следует ожидать при их совместном использовании с неформализованными методами, например многослойными нейронными сетями.

Литература

1. Сойфер В.А., Храмов А.Г. и др. Методы компьютерной обработки изображений. - М.: Физматлит, 2003. - 780 с.

2. Грузман И.С., Киричук В.С. и др. Цифровая обработка изображений в информационных системах. - Новосибирск: Изд-во НГТУ, 2000. - 168 с.

3. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. - М.: Издательский дом «Вильямс», 2004. - 928 с.

Петрашко Андрей Анатольевич

Программист Института дополнительного образования Томского политехнического университета

Телефон: (3822) 49 22 42

Эл. почта: andrey@ido.tpu.edu.ru

Калайда Владимир Тимофеевич

Канд. техн. наук, ст. науч. сотр. кафедры автоматизированных систем управления ТУСУРа Телефон: (3822) 49 22 42 Эл. почта: kvt@iao.ru

A.A. Petrashko, V.T. Kalaida

Image of a face extraction method| in systems of figures recognition

The image of a human face extraction method were described. Conclusion of expediency of using described methods in common with neuronetworking technologies was made.

УДК 681.3.067 П.В. Потапов

Двухпроходный режим компрессии видеоданных

В статье предлагается двухпроходный алгоритм распределения ресурсов при компрессии видеоданных. Проводится анализ преимуществ и недостатков использования двухпроходных алгоритмов.

Представление видеоизображений в цифровой форме дает много преимуществ при съемке, обработке и воспроизведении. Однако объем данных, описывающих видеоматериал, может достигать гигантских размеров. Для компактного хранения видеоданных и передачи их по каналам связи с ограниченной пропускной способностью применяются специальные алгоритмы сжатия. Для обеспечения совместимости аппаратуры и программных систем были

разработаны стандарты, в которых формально закреплены используемые для сжатия алгоритмы и форматы.

В настоящее время широкое распространение получили стандарты MPEG-2, MPEG-4, AVC (H.264). В них используются алгоритмы сжатия с потерями, и поэтому увеличение степени сжатия влечёт за собой ухудшение качества. Как правило, цель компрессии заключается в получении видеопотока с заданной скоростью передачи данных. Обычно кадры видеопотока имеют разную сложность кодирования и, как следствие, требуют разное количество битов для достижения одинакового качества. Опыты показывают, что человеческий глаз лучше воспринимает видео с постоянным качеством. В результате возникает задача оптимального распределения ресурсов между кадрами пропорционально сложности их кодирования. Таким образом, возникает еще одна проблема — закодировать кадр так, чтобы его размер R соответствовал выделенному ресурсу битов. Размер закодированного видео управляется при помощи параметра квантизации Q — степени загрубления кадра. Чем больше параметр квантизации (квантайзер), тем большие искажения вносятся в кадр и тем меньший размер он будет иметь после сжатия. Зависимость размера кадра от параметра квантизации имеет существенно нелинейный характер.

Перечисленные задачи решаются алгоритмами управления скоростью видеопотока Rate Control (RC). Алгоритмы RC делятся на два типа.

• Однопроходные алгоритмы — в процессе кодирования исходные данные анализируются по мере поступления и сразу выполняется сжатие, формируется выходной поток. Алгоритмы этого типа могут применяться для кодирования видеоданных в реальном времени.

• Многопроходные алгоритмы — в процессе кодирования производится несколько проходов по исходной видеопоследовательности, собирается информация о сложности кадров, которая затем используется при распределении ресурсов.

Предлагаемый алгоритм относится ко второму классу. Двухпроходные алгоритмы имеют ограничение — они не могут использоваться при кодировании в реальном времени. Они применяются для подготовки видео к хранению и записи на такие носители, как DVD, VideoCD и т. д. Обычно в этих приложениях мы сразу имеем всю кодируемую видеопоследовательность и можем позволить себе пройти по последовательности более одного раза. За счёт дополнительных проходов можно эффективнее распределить ресурсы битов среди кадров последовательности, вследствие чего выровнять качество закодированного видео, а также обеспечить точное совпадение результирующего размера сжатого видео с требуемым.

Для описания зависимости R(Q) на практике часто используют модели первого и второго порядка [1]:

где a и Ь — коэффициенты зависимости. Очевидно, a и Ь будут различны для разных кадров. В выражении для модели (1) используется только один коэффициент, благодаря этому данная модель очень легка в использовании, однако её точность оставляет желать лучшего. Модель (2) обладает более высокой точностью, к тому же при Ъ = 0 мы получаем выражение (1), поэтому в дальнейшем рассматриваться будет только модель вида (2). Данная модель достаточно точно описывает вид кривой Я(ф), однако для разных кадров коэффициенты модели будут сильно различаться, поэтому требуется построить такую модель, коэффициенты которой не зависели бы от сложности кадра. В качестве меры сложности примем величину V:

где ЫтЪ — количество макроблоков (макроблок — часть кадра, как правило, размером 16x16 пикселов) в кадре; А — количество пикселей в макроблоке; I. . — значение яркости в у-м пикселе г-го макроблока; — среднее значение яркости в г-м макроблоке.

Экспериментально доказано [2], что при кодировании с постоянным квантайзером зависимость размера закодированного кадра от величины V близка к линейной. Причём угол наклона кривой зависит от значения параметра квантизации. Учитывая это, можно предположить, что графики зависимостей Я(ф) / V для разных кадров будут более схожи.

В модель (2) внесём изменения вида

R (Q) = aQ 1, R(Q) = aQ1 + bQ 2 ,

(1) (2)

Nmb f 1 A

Л

R(Q) = (aQ"1 + bQ 2)V .

(3)

Эксперименты показали, что для существенно различных кадров коэффициенты модели (3) всё равно будут различны, однако для большинства кадров коэффициенты будут близки по значению. Благодаря этому, мы сможем предсказывать поведение кривой Я(Я) для ещё не закодированных кадров.

Коэффициенты можено найти при помощи метода наименьших квадратов. Предположим, мы закодировали N кадров с квантайзерами Яь и получили кадры размерами Яь. Пусть эти кадры имеют схожие характеристики, тогда будем минимизировать квадрат ошибки. Обозначим Уь = Яь/Уь и из (3) получим выражение вида

N Г п2

Е(а,Ь) = Х[аЯ-1 + ЬЯ-2 -У1 ] ^ шт .

ь=1

(4)

Теперь для нахождения минимума функции из выражения (3) найдём частные производные по параметрам модели:

N г , п N

дЕ да

2Х [(а©-1 + ЬЯ-2 - У )Я-1 ] = 2Х [аЯ-2 + ЬЯ-3 - У^1 ]; ь=1 ь=1

дЕ = 2£ [(аЯь-1 + ЬЯ-2 - Уь Я ] = 2£ [аЯь-3 + ЬЯ-4 - У.Я-2 ].

дЬ ь=1 ь=1

Приравняв значения частных производных нулю, получим систему из двух уравнений с двумя неизвестными:

N N N

Х Я-2 + ЬХ Я-3 -Е УьЯь-1 = 0;

ь=1

N

ь=1

N

ь=1

N

(5)

а£ Яь-3 + Ь£Я-4 -ЕУьЯь-2 = 0. ь =1 ь =1 ь =1

Решив систему (5), получим выражения для коэффициентов а и Ь, минимизирующие квадрат ошибки:

N NN N

ЕЕ УьЯь-1 ХЯь-3 -ХУьЯь-2 ХЯь-2

Ь =

ь=1

ь=1

ь=1

ь=1

N N

,-4 ^ гл-2

( N \

Х Яь-3 -Х Яь-4 Х Я-

V ь=1 у ь=1 ь=1

(6)

N N

ЬХ Яь-3 - Уь Х Яь-1

а = ---. (7)

1ЯГ2

ь=1

Таким образом, по формулам (6) и (7) на первом проходе мы можем найти коэффициенты модели для каждого кадра и использовать их на втором проходе.

На втором проходе для последовательности из N кадров известны коэффициенты и значение сложности кадров, а также требуемый ресурс битов на всю видеопоследовательность Т. Просуммировав размеры каждого кадра, получим выражение

N N

Т = Я-1 Х(аь^ь)+ Я-2 Х(Ьь^ь). (8)

ь=1 ь=1

N N

Обозначим х1 = -Х (аьУь), х2 = ~Х (рУь), получаем квадратное уравнение

ь=1 ь=1

ТЯ2 + Ях1 + х2 = 0.

Решив это уравнение, мы найдём коэффициент квантования, кодируя с которым всю последовательность, получим требуемый размер. Решение уравнения (8) имеет вид

2 = х, 4Тх^ . (9)

I,2 2Т

Одно из решений отбрасывается, исходя из условия, что коэффициент квантования не может быть меньше нуля. Однако, закодировав всю последовательность с указанным кван-тайзером, мы не получим требуемого размера. Это происходит из-за того, что квантайзер — целое число, а в результате решения уравнения (8) мы получаем дробное число и вынуждены округлять его. Кроме того, используемое соотношение (3) — всего лишь модель, и, как любая модель, она имеет определённую точность. Поэтому необходимо корректировать параметр квантования по мере кодирования потока.

Опишем алгоритм оптимального распределения ресурсов.

На первом проходе кодируем видеопоследовательность, специальным образом устанавливая параметры квантования: выбираем границы изменения квантайзера и от кадра к кадру меняем квантайзер в этих границах с определённым шагом. Это позволяет получить значения точек в разных местах кривой R(Q), что существенно увеличивает точность аппроксимации.

Для каждого кадра при помощи выражений (6) и (7) находим коэффициенты a и b. Для этого берём характеристики n предыдущих и n последующих кадров. По 2n + I точкам находим коэффициенты модели R(Q). Найденные коэффициенты, а также сложность кадра запоминаются и используются во время второго прохода кодирования.

Подсчитываем общее количество кадров и среднее число кадров в секунду, а также суммы х, и х2. Все эти показатели также запоминаются.

В начале второго прохода на основе данных, собранных на первом проходе, по формуле (8) находим средний коэффициент квантования для всей последовательности и начинаем кодировать видео с этим коэффициентом квантования. По завершении кодирования каждого кадра выполняем следующую операцию: вычитаем из требуемого размера последовательности получившийся размер кадра, а из суммарных параметров х, и х2 вычитаем соответственно alVl и blVl. И снова производим вычисление оптимального параметра квантования по формуле (8). Таким образом мы производим перерасчёт коэффициента квантования для оставшейся видеопоследовательности. Это позволяет компенсировать ошибку округления параметра квантования, а также погрешность модели. В результате параметр квантования может незначительно изменяться во время кодирования видеопоследовательности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Разработанный алгоритм был реализован для системы кодирования видеоданных Moonlight H.264 Video Encoder. Система протестирована на различных видеопоследовательностях. Оценка эффективности двухпроходного алгоритма производилась относительно результатов, полученных с однопроходного алгоритма RC. В качестве меры оценки качества закодированного видео использовалась мера PSNR (Peak Signal to Noise Ratio — пиковое отношение сигнала к ошибке). PSNR для n-го кадра высчитывается по формуле

PSNRn = 10log

(2552^

10

D,

n

Dn =1Y \in - ii ' n Af~1 \ i i

. тп Л п

где А — количество пикселей в кадре; и I г — значения яркости пикселей в восстановленном и оригинальном кадрах с номером п.

Результаты тестирования приведены в таблице, где РБМЯ1 и девиация РБМЯ1 — характеристики потока, сжатого с использованием однопроходного алгоритма, а РБМЯ2 и девиация РБМЯ2 — характеристики потока, сжатого с использованием двухпроходного алгоритма распределения ресурсов.

Результаты тестирования

Название ролика PSNR1, дБ PSNR2, дБ Девиация PSNR1, дБ Девиация PSNR2, дБ

Woman_walk 30,89500 31,34732 5,725939 2,625609

SceneChange 33,06238 33,23276 3,517659 1,705684

Ski 33,01318 33,44675 3,552816 2,103852

Baseball 38,25746 38,68767 4,062914 1,737190

Д.В. Севостьянов, ВЛ. Сергеев. Идентификация и прогноз продуктивности нефтяных скважин... 81

Девиация PSNR для видео, закодированного с использованием двухпроходного алгоритма, оказалась в два раза меньше, чем для видео, кодируемого с использованием однопроходного алгоритма. Для видео, закодированного с использованием двухпроходного алгоритма, PSNR возросло на 0,2-0,5 дБ.

Тестирование показало, что применение описанного алгоритма позволяет значительно уменьшить девиацию PSNR за счёт распределения ресурса битов между кадрами пропорционально их сложности. Таким образом, обеспечивается практически постоянное качество закодированного видео на протяжении всей последовательности. Особенно эффективно применение описанного алгоритма для продолжительных видеопоследовательностей с переменной сложностью кодирования. Также преимуществом данного алгоритма является то, что он позволяет обеспечить высокую точность совпадения требуемого и получившегося размеров видео.

Литература

1. N. Mohsenian, R. Rajagopalan, C.A. Gonzales, Single-pass constant and variable bitrate MPEG2 video compression, IBM J. RES. DEVELOP. VOL. 43 NO. 4 JULY 1999.

2. Po-Yuen Cheng, Jin Li, and C.-C. Jay Kuo, Rate Control for an Embedded Wavelet Video Coder, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 7, NO. 4, AUGUST 1997.

Потапов Павел Вячеславович

Студент пятого курса кафедры автоматизированных систем управления ТУСУРа Эл. почта: PotapovPavel@yandex.ru

P.V. Potapov

2-pass video encoding mode

This paper propose 2-pass rate control algorithm. Proposed second order rate-distortion model. Discussed advantages and disadvantages of using 2-pass algorithms.

УДК 519.71: 681.3

Д.В. Севостьянов, В.Л. Сергеев

Идентификация и прогноз продуктивности нефтяных скважин в процессе их эксплуатации на основе метода интегрированных моделей

Предлагается и исследуется метод решения задачи идентификации пластового давления и продуктивности скважин в условиях их нормальной эксплуатации. Метод основан на современных принципах системного анализа, физически содержательных математических моделях процессов нефтегазодобычи и данных комплексных исследований скважин.

Актуальной задачей, обусловленной сложностью получения информации о продуктивности скважин в процессе их нормальной эксплуатации (без длительной остановки), является создание новых информационных технологий построения математических моделей процессов нефтегазодобычи, основанных на современных принципах системного анализа и теории систем [1-4 ].

Для ее решения в работе предлагается использовать технологию интегрированных моделей (ТИМ) [5-6], в основе которой использованы следующие принципы:

1) основой ТИМ являются физически содержательные математические модели процессов нефтегазодобычи и данные комплексных исследований скважин и пластов;

2) все «жесткие» ограничения отсутствуют;

i Надоели баннеры? Вы всегда можете отключить рекламу.