Научная статья на тему 'Методы оптимизации определения направления предсказания intra модели кодирования'

Методы оптимизации определения направления предсказания intra модели кодирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
418
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
INTRA МОДЕЛЬ ПРЕДСКАЗАНИЯ / КОДЕР H.264/AVC INTRA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бушин Д. С., Игнатов Ф. М.

В статье описан алгоритм сокращения битрейта для intra модели предсказания. Для уменьшения пространственной избыточности в intra модели кодирующего устройства H.264/AVC используется девять способов предсказаний для блоков размером 4x4 пикселя. Такое количество способов усложняет работу кодирующего устройства за счет увеличения количества битов оповещения. В предложенном методе, способы предсказания для каждого блока подбирались адаптивно. Каждый блок, предназначенный для предсказания, классифицируется под одну из трех категорий, в зависимости от общности опорных пикселей. В этой статье также оценивается самый вероятный способ (MPM) исходя из направления предсказания соседних блоков, с различными весами соответствующими их положению. Результаты эксперимента подтверждают, что предложенный метод сокращает битрейт на 12.4%, улучшает качество видео в среднем на 0.37 дБ, и требует на 37% меньшего количества вычислений, чем H.264/AVC intra кодер. Предложенный метод не только улучшает работу RD, но также и уменьшается вычислительная сложность кодера H.264/AVC intra.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бушин Д. С., Игнатов Ф. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы оптимизации определения направления предсказания intra модели кодирования»

Методы оптимизации определения направления предсказания infra модели кодирования

Описан алгоритм сокращения битрейта для infra модели предсказания. Для уменьшения пространственной избыточности в infra модели кодирующего устройства H.264/AVC используется девять способов предсказаний для блоков размером 4x4 пикселя. Такое количество способов усложняет работу кодирующего устройства за счет увеличения количества битов оповещения. В предложенном методе, способы предсказания для каждого блока подбирались адаптивно. Каждый блок, предназначенный для предсказания, классифицируется под одну из трех категорий, в зависимости от общности опорных пикселей. Оценивается самый вероятный способ (MPM) исходя из направления предсказания соседних блоков, с различными весами соответствующими их положению. Результаты эксперимента подтверждают, что предложенный метод сокращает битрейт на 12.4%, улучшает качество видео в среднем на 0,37 дБ, и требует на 37% меньшего количества вычислений, чем H.264/AVC infra кодер. Предложенный метод не только

к---- слова. intra модель улучшает работу RD, но также и уменьшается вычислительная сложность кодера

предсказания, кодер H.264/AVC intra. H.264/AVC infIO.

Бушин Д.С.,

аспирант кафедры ТиЗВ, МТУСИ, [email protected] Игнатов Ф.М.,

профессор кафедры ТиЗВ, МТУСИ, [email protected]

H.264/AVC - самый свежий на текущий момент международный стандарт видео кодирования, разработанный ITU-T Coding Expert Group и ISO/IEC Moving Picture Expert Group. Данная технология обеспечивает прирост эффективности сжатия приблизительно на 40% по сравнению с предыдущими стандартами (ISO/IEC 1449610,2004, Weigand и др., 2003). В стандарте представлены новые и передовые методы, такие как intra предсказание для кодирования 1-кадров, мультикадровое inter прогнозирование, контекстно адаптивное бинарное арифметическое кодирование (САВАС), деблокинговые фильтры, и т.д. Эти методы обеспечивают приблизительно 40%-ое снижение затрат по битрейту в сравнении с сопоставимыми по качеству видеопоследовательностями, кодированных кодеками, основанными на предшествующих стандартах (Weigandct al. 2003).

Н.264 intra включает девять способов предсказания для блоков цветности размером в 4x4 пиксел, девять способов предсказания для блоков цветности 8x8 и четыре способа предсказания для блоков цветности 16x16.

Однако, степень искажения (RD) кадров в модели intra еще ниже, чем это реализовано в модели inter. Следовательно, для кодирования методом intra, обычно выделяется намного больше бит, чем при кодировании способом inter, что приводит к трудностям контроля буфера и/или потере нескольких кадров, в процессе кодирования видеопоследовательности intra моделью в режиме реального времени. Таким образом, развитие эффективной техники intra кодирования является важной задачей для сокращения битрейта для дальнейшей эффективной трансляции.

Для выбора наиболее оптимальной с точки зрения максимализации качества и уменьшения битрейта модели кодирования среди девяти доступных способов предсказания, H.264/AVC использует технику оптимизации оценки искажения (RDO). Это означает, что кодирующее

устройство должно закодировать видео, последовательно пробуя все девять комбинаций. Лучшим способом признается тот, который имеет минимальную степень искажения. Чтобы вычислить степень искажений для каждого способа, повторно выполняются те же самые операции: прямое и обратное преобразования/квантование, энтропийное кодирование. Каждому из этих методов присуща высокая сложность вычислений и степень искажения. Что в свою очередь приведет к необходимости увеличивать вычислительную мощность кодирующего устройства. То есть, используя девять способов т1га предсказания для блоков размера 4x4 и 8x8 и для макроблока размером 16x16 (МВ).

Можно уменьшить пространственную избыточность, но потребуется множество добавочных бит, для предсказания каждого 4x4 и 8x8 блока. Быстрые алгоритмы решения Ыга модели вводились, чтобы сократить число способов, нуждавшихся в вычислениях согласно некоторым критериям [3]. Метод (ШБ), сократит не только избыточные биты, но также и вычислительные затраты кодирующего устройства (Ким и др., 2010).

В основе метода лежит предположение, что если соседние пиксели верхних и левых блоков подобны, то используется только ОС предсказание, для которого не требуется предсказание по битам, другими словами не нужно использовать все девять способов предсказания. Но метод 1В8 страдает рядом недостатков:

a) опорные пиксели в правом верхнем блоке не рассматриваются на предмет подобия. Если различие опорных пикселей верхних и левых блоков очень низкое, предсказание для диагональных (по нижнему левому блоку) и вертикальному левому не равноценны другим способам.

С точки зрения теории 1В8 все модели производят схожие значения. В этом случае, для поддержания приемлемого РВИЯ и степени сжатия, не достаточно воспользоваться только ОС моделью предсказания ОС.

b) В 1В8, каждый блок разделен на две категории в зависимости от применяемых методов кодирования: или ОС модель или все 9 способов. Именно поэтому, улуч-

шение для сложных последовательностей, таких как Штефан (Stefan), окажется не существенным, из-за только небольшого количества блоков предсказанных посредством DC модели.

с) Для определения порога чувствительности, как на стороне кодера, так и на стороне декодера используется множество вычислительно сложных операций. Чтобы уменьшить избыточность при внутрикадровом кодировании, разработана методика самого вероятного способа (МРМ- MOST PROBABLE METHOD) [2]. Улучшения, привнесенные этим методом можно расценивать как существенные, но и они в полной мере не избавляют от пространственной избыточности.

г8

-►У

р„ Р< Р,. Р7 Ps Р* 1 P.. 1 Рн 1 Pi: 1

р. а b с d 3

р. е / h

1’: i J к 1

Р. т п о Р

JRn = SSD + Я- R

(1)

где 880 - квадрат суммы различия между исходными блоками 8 и восстановленными блоками С, и это выражено

ЖьУУК-С)2 (2)

ни

где £ и С. (я, ^ элементы текущего исходного блока 8

и восстановленного блока С.

В уравнении (1), К - биты, которыми кодируется блок, и X экспоненциальная функция параметра квантования (ОР). Сильная связь между множителем Лагранжа и ОР определяются экспериментально [ 1 ]

Я = 0,85 х 2

(£>/>-12 )/3

(3)

Вычислительный процесс RD 4x4 тй'а модели приведён на рис. 2. Чтобы вычислить значение RD, для каждого способа, те же операции: прямое и обратное преобразование/квантование и кодирование переменной длины выполняются повторно. Все перечисленные процессы говорят о высокой сложности RD вычисления.

Остаточные

Рис. 1. Направление intra предсказания

Внутри кадровое прогнозирование H.264/AVC

В отличие от некоторых предыдущих стандартов (а именно, Н.263 + и MPEG-4 Visual), где intra предсказание проводилось в области преобразования, intra предсказание в H.264/AVC всегда проводится в пространственной области, опираясь на соседние сэмплы из ранее закодированных блоков, которые находятся слева и/или выше предсказываемого блока. Intra предсказание яркостных элементов можно сформировать для каждого блока размером 4x4 и 8x8 или для макроблока 16x16. В общей сложности существует 9 дополнительных способов предсказания для каждого блока яркости размером 4x4 и 8x8 и 4 дополнительных способа для блоков цветности размером 16x16 пикселей. Так же для блоков цветности размером 8x8 пикселей, применяется еще 4 способа предсказания. Опираясь на соседние пиксели из восстановленных блоков, определяется прогнозируемый блок. Предсказания блоков 4x4, основанных на восстановленных сэмплах, маркируются как Р0-Р12, что продемонстрировано на рис. 1(a). Восстановленные ранее серые пиксели (Р0-Р12), рассматриваются как опорные пиксели текущего блока. В целях систематизации, 13 справочных пикселей блока 4x4 обозначены последовательно от РО до Р12, а предсказываемые пиксели обозначены от А до Р.

Метод 2 называют предсказанием DC, в котором все пиксели маркированные от А до Р предсказаны на основании среднего арифметического суммы (Р1+Р2+РЗ+Р4+ Р5+Р6+Р7+Р8)/8. Оставшиеся способы определяются согласно различным указаниям (рис. lb). Чтобы в полной мере воспользоваться преимуществами всех моделей, кодирующее устройство H.264/AVC, используя схему решения способа оптимизации RD, может определить способ, который имеет наилучшие характеристики RD. Лучший способ должен иметь минимальную степень искажений, он выражен как

данные

■ I

Н DCT/Q

1DCT/1Q

VLC

Скорость

Искажение

Вычисление RD

Рис. 2. Вычисление 1Ш функции

После того, как лучший способ выбран, он будет закодирован в сжатый битовый поток 1шга модели соседних блоков, чрезвычайно коррелированных между собой и, например, если ранее закодированный блок был предсказан, используя метод 2, вероятно этот же способ станет предпочтительным для текущего блока. Чтобы использовать достоинства этой корреляции, прогнозирующее кодирование применяется к сигналу 4x4 Ыга моделей. Для текущих блоков размера 4x4, способ предсказания, основанный на методе определения верхних и левых блоков, оказался самым оптимальным.

В стандарте Н.264/АУС МРМ выведен, согласно следующим правилам; если левый или верхний соседний блок недоступен, МРМ будет модель 2 (ОС), иначе МРМ станет минимальная модель прогнозирования левого и верхнего соседних блоков. Для шйа предсказания согласно каждой модели прогнозирования кодирующее устройство использует условие МРМ с флагом, для сообщения способа прогнозирования. Если МРМ совпадает со способом предсказания, флаг установлен в “1”, тогда только один бит необходим для передачи декодеру способа предсказания. Когда МРМ и способ предсказания отличаются, флаг установлен в “0”, и требуются 3 дополнительных бита, для сообщения т1га модели предсказания. Кодер затрачивает 1 или 4 бита на представление кодирующей ш№а модели.

N N N N N N N N N

N а Ь с D

N е f i Н

N i j к L

N т п 0 Р

Рис. 3. Случай 1: Все опорные пиксели имеют одинаковые значения

Улучшенный метод предсказания Intra модели 4x4

3.1 Адаптивное число способов

Хотя, вследствие использования девяти способов предсказания блоков яркости размера 4x4, метод intra кодирования стандарта H.264/AVC обеспечивает высокую степень сжатия, вследствие этого вычислительная сложность возрастает. Использование девяти способов предсказания intra 4x4 для макроблока 16x16 МБ может уменьшить пространственную избыточность, но потребуется большое количество избыточных бит, для осуществления предсказания каждого блока размером 4x4. Основанный на вариативности соседних пикселей, предложенный метод классифицирует блок для каждого из трех различных случаев.

a) Случай 1

Как показано в рис. 3, если все опорные пиксели однородны, то и результаты прогнозирования по девяти направлениям тоже будут одинаковы. В этом случае не нужно применять все способы предсказания. Оптимальным можно считать использование DC модели, а способ прогнозирования по битам (prediction mode bit), можно пропустить. Если различие <г всех соседних пикселей меньше, порога чувствительности 7], также следует использовать модель прогнозирования DC. Переменная величина <х и значение /j. установлены как:

II*.-/*,!■ Я »[<1*?>/12] (4)

(=1 /=1

где Р опорный пиксель сг, рис. 1(a) и , является значением граничных пикселей блока.

Чтобы установить порог чувствительности 7j, мы

провели несколько экспериментов для четырех различных типов видео последовательностей (Mother & Daughter, Foreman, Bus and Stefan) в формате CIF для различных значений QP. Mother & Daughter представляет собой простую видео последовательность с низким битрейтом. Видеопоследовательности "Foreman" и "Bus" обладают умеренный битрейтом, так- как содержат множество среднеразмерных деталей. Высокий битрейт видеопоследовательности "Stefan" объясняется наличием большого количества мелких деталей. Изменяя порог чувствительности, наблюдая за искажением сигнала, можно сделать вывод, что порог Т не зависит от типа видео последовательности, но зависит от значения QP. Рисунок 4 отображает зависимость порога чувствительности 7] от значения QP. Исходная пороговая кривая

выведена аппроксимацией пороговых значений всех четырех последовательностей для каждого QP.

Воспользовавшись методом подбора многочлена, аппроксимируем обобщенное пороговое значение Tt. г _ (QP + 12

1 \ 150Я-9О Р)

b) Случай 2

Если все опорные пиксели содержащиеся в верхних и правых верхних блоках одинаковы, то способы предсказания по остальным направлениям обеспечат такие же результаты предсказания, что наглядно продемонстрировано на рис. 5. Поэтому из всех возможных методов мы выбрали только вертикальный способ предсказания. Если различие сг, соседних пикселей - верхнего и правого

верхнего блоков меньше, порога чувствительности Г,,

следует использовать четыре способа предсказания:

вертикальный, горизонтальный, диагональный (нижний правый угол, и горизонтальный).

Рис. 4. Изменение порога чувствительности 7] с QP

Вместо того, чтобы использовать 3 бита кодирующего устройства, каждый из четырех способов предсказания обходится 2-мя битами, что представлено в табл. 1. Порог Т2 определяется тем же способом что и Т{. Тг также зависит от ОР, и лучшие результаты получаются, если Т2 = [27] / 3] Переменная а-, и значение ц: установлены как:

сг2 =£||.и//,=[(£^)/81 (6)

/=5 /=5

где //-, - принимает значение пикселей граничных с правым - верхним и верхним блоками. На рисунке 6 представлена Блок-схема предложенного метода. Различие сг,

и пороговые 7] вычислены на начальном этапе процесса принятия решений способа и если переменная меньше порога (ст] < 7] ) то следует использовать модель

прогнозирования ОС. В этом случае можно сократить вычислительную нагрузку, пропустив затратный 1ШО процесс.

Таблица 1

Бинарное представление модели для второго случая

Направление модели предсказания Двоичное представление

Вертикальное 00

Горизонтальное 01

Диагональное по направлению влево вниз 10

Влево вверх по горизонтальной оси 11

Ро N N N N N N N N

Р* а Ь с А

Рз с f X и

Р; t ) к 1

Pi m п о Р

Рис 5. Случай 2. Опорные пиксели верхнего и правого верхнего блока имеют одинаковые значения

Только метод предсказания ОС

Используется 4 модели

предсказания В процессе ИЮ выбирается пучш<;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Используется 9

моделей

предсказания В

процессе

выбирается

лучшая

Остаточный

модепь '4

предсказан

модепь

предсказания

... ,, ОСТ и Квантование Энтропийное

кодирование

Конец бпока 4x4

Рис. 6. Блок диаграмма предложенного метода

Кроме того, нет необходимости в использовании битовых флагов, для представления ни га способа предсказания, потому, что используется только один способ. Если на стороне декодера выполняется неравенство сг, < 7], декодер понимает, что способ предсказания ОС является лучшим способом предсказания. С другой стороны, если а < Т., что не удовлетворяет условиям, кодирующее устройство вычисляет переменную <Т2 и порог Г,. Если о\ < Г,, вертикальный, горизонтальный,

правый нижний и верхний способы используются в качестве способов - кандидатов для ИЕЮ процесса.

Существенная экономия в вычислениях, достигнутая использованием 4-ех способов предсказания вместо 9, изначального процесса Я ПО. Лучшая модель - модель, обладающая наименьшей степенью искажений. В процессе выбора лучшего способа кодирования 2 бита отсылаются в декодер, в табл. 1 продемонстрированы четыре способа предсказания с соответствующими двоичными представлениями. Если способ предсказания по "правому нижнему" блоку избран наилучшим, кодирующее устройство посылает двоичное “10” в декодер.

Таблица 2

Соответствие модели предсказания предложенному способу

Направление модели предсказания Номер для стандарта Н264/ЛУС Номера для предложенной модели

По диагонали влево вниз 3 0

По вертикальной оси вправо 5 1

По горизонтальной оси вниз 6 2

По вертикальной оси влево 7 3

По вертикали 0 4

По горизонтали 1 5

ЭС 2 6

По диагонали вправо вниз 4 7

По горизонтальной оси вверх 8 8

Если условие <т, < Г,, не удовлетворяется, девять

способов предсказания используются в качестве возможных кандидатов, и один из них отбирается посредством процесса 1ШО, аналогично Н.264/АУС. В этом случае, основанный на МРМ, любые 1 или 4 бита используются, для описания метода предсказания. Обозначения новых методов предсказания регистрируются и сравниваются со способами, реализованными в Н.264/АУС. Примеры обозначений можно найти в табл. 2.

Если левый - нижний левый, правый верхний, левый нижний и левый верхний варианты предсказаний не использовались в предыдущих случаях, вероятность применения этих способов в дальнейшем весьма высока, в этом случае они обозначаются небольшими числами. Моделируя работу декодера видеопоследовательностей, приходим к выводу, что значительное количество блоков все еще вычисляется перебором 9-ти способов предсказания. Если МРМ -определяется как лучший способ, то для описания способа предсказания используется только один бит вместо четырех. Поэтому, если мы можем выработать более точно метод оценки МРМ, то для определения метода кодирования существенного процента блоков можно будет использовать только 1 бит.

Выбор наиболее подходящего способа (МРМ)

Естественные видео последовательности содержат множество угловых элементов, таких как углы и края, эти элементы обычно непрерывны, таким образом, указание направления предсказания соседних блоков и текущих блоков, также не должно прерываться. На рис. 7 представлен текущий блок X и четыре соседних блока обозначены как А, В, С и О. Таким образом, если верхний блок (В) будет закодирован вертикальным способом, то и модель кодирования текущего блока, вероятнее всего, будет вертикальной. Точно также выбираются лучшие варианты направления кодирования и для остальных блоков. Если направление от соседнего блока к текущему идентично направлению способа предсказания соседнего блока, есть высокая вероятность, что лучший способ предсказания текущего блока также идентичен направлению способа предсказания.

Основанный на этой идее, предложенный метод МРМ соразмерен абсолютной разности между направлением движения блока и направлением модели кодирования.

Вычисление направления кодирования (Эт) определяется на основании направлений отмеченных на рис. 1 (Ъ) и сведено в табл. 3.

Таблица 3 Направления моделей кодирования

Направление модели Угол поворота

Вертикальное л72

Горизонтальное 0

По диагонали влево вниз Эя/4

По диагонали вправо вниз л74

По вертикальной оси вправо Зя78

По горизонтальной оси вниз л7 8

По вертикальной оси влево 5я78

По горизонтальной оси вверх -/г/8

С В о

А X

Рис. 7. Текущие и соседние блоки

Направление движения блоков вв и дистанция между блоками DB рассчитывается с помощью следующих выражений.

0В = tan"1 Уг - Уя (7)

°в=\Ус-Уп\ + \хс-хп\

ЩМя) = тт[0,-?--/1\вв-ет\) (9)

ив

где а и р пропорциональные константы, a min(P,Q) минимальное значение между Р и Q. В процессе модели-

8

рования, a w р отобраны как —. Вместо того, чтобы

л

использовать два соседних блока А и В, как это происходит в H.264/AVC кодере, предложенный метод использует способ предсказания для четырех соседних блоков (А, В, С и D). Вес модели предсказания каждого соседнего блока вычисляется и обновляется, добавлением веса такой же модели. Так как у моделей DC нет совместного направления, если соседним способом кодирования окажется DC, то вес, соответствующий этому блоку будет приравнен нулю.

Вес каждой модели предсказания подсчитывается, и выбирается способ с самой большой весовой составляющей W . Если максимальный вес W оказывается

max шах

ниже минимального уровня, значит, достигнут край блока. В данном случае лучшим методом предсказания будет модель DC. Если максимальный вес ^ - меньше,

порога МРМ, тогда МРМ - способом будет DC; в ином случае способ с максимальным весом W представляется наилучшим. Пошаговый алгоритм предложенного метода выглядит следующим образом:

Шаг 1: вес (W) каждого способа приравнивается нулю.

Шаг 2: Для каждого из четырех соседних блоков (А, В, С и D), справедливо выражение.

Если способ кодирования смежных блоков Mn = DC, W (Mn) + = 0.

Иначе:

a. Вычисляем направление движения блоков, 6В и DB.

b. В таблице 3 находим направление движения закодированных соседних блоков.

c. Вычисляется вес соседних моделей:

^(MJ+ = min[0,-^— Р\ев-9Я\] в

Конец блока:

Шаг 3: Найти модель с максимальным весом W .

max

Шаг 4: Если максимальный вес, W - меньше, чем Тиги, то самым вероятным способ, является DC; иначе лучшей моделью будет МРМ с максимальным весом Wmax ■

Чтобы найти порог Тмш, необходимо провести несколько процедур кодирования.

Четыре различных типа видео последовательностей (Mather & Daughter, Foreman, Bus и Stefan) были закодированы, с изменением значений Тмрм от 1 до 10 и для

изучения изменений RD. Лучшие результаты были достигнуты в ТМРМ = 5. Чтобы уменьшить вычисление (9),

а / DB и вв соседних блоков А, В, С и D были предварительно вычислены и сохранены в таблице. Например, ОС / DB равно 6 для блоков А и В, и 3 для блоков С и D.

6И равны 0, л/2, л/4, и - л/4 для блоков А, В, С и D, соответственно.

Результаты моделирования

Оценить предложенный метод, можно воспользовавшись моделированием работы кодера. В ходе исследований использовались различные видео последовательности, разрешения и тестовые материалы. Было выполнено несколько экспериментов на испытательных последовательностях с различными парамеграми квангизации (QPs). Моделирование производилось на операционной системе Windows Vista, Pentium i5 2400 4G RAM. Условия моделирования (a) QPs, 28, 36, 40, 44 (b) энтропийное кодирование: CABAC (с) RDO (d) частота кадров: 30 кадров в секунду, (е) модель 4x4 (0 число кадров: 100.

Результаты сравниваются и сводятся в таблицу основанную на различии моделей кодирования (ДТ1%), среднее отклонение PSNR (APSNR), и среднее отклонение скорости передачи данных (AR %). PSNR и различия в битрейте вычислены согласно среднеарифметической разности между кривыми RD, приращенными от исходного и предложенного алгоритмов соответственно. Детальная процедура различия можно найти в (Bjontegaard, 2001). Вычислительная сложность (АТ %) измеряется следующим образом:

Т -Т

АТ%= original----pmpmJ xlOO (Ю)

Г

original

где, Toriginal обозначает полное время кодирования JM,

12.4 кодирующего устройства и Т ^ - полное время

кодирования последовательности устройством, предложенным методом.

Таблица 4

Сравнение метрик PSNR и битовой скорости

Последовательность IBS Предложенный метод

APSNR ARatc% APSNR ДRat<?/o

Grand Mother (QCIF) 0,37 -15.4 0.42 -17,0

Salesman (QCIF) 0,32 -12,9 0,40 -14,6

Stefan (QCIF) 0,10 -2,7 0,20 -6,0

Conteiner (QCIF) 0.09 -3,1 0,18 -6,7

Car phone (QCIF) 0,66 -18,4 0,83 -23,8

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Silent (CIF) 0,35 -15,4 0,42 -18,0

Bus (CIF) 0,11 -3,8 0,15 -4,1

Hall (CIF) 0,32 -8,6 0,42 -11,3

Mobile Calendar (HD) 0,19 -6,8 0,27 -9,8

Итог 0,28 -9,7 0,37 -12,4

Сравнение производительности RD моделей представлено на габл. 4. В случае метода 1В8, среднее улучшение PSNR составляет приблизительно 0,28 дБ, и сокращение средней скорости передачи данных составляет приблизительно 9,7%. Принимая во внимание, что в нашем предложенном методе, среднее улучшение PSNR составляет приблизительно 0.37 дБ и сокращение средней скорости передачи данных составляет приблизительно 12,4%.

Таблица 5

Полное сравнение предложенного метода

Последовательность IBS AT% Предложенный метод Д7"%

APSNR APSNR

Grand Mother (QCIF) 39,7 49,1

Salesman (QCIF) 31,2 35,7

Stefan (QCIF) 17,9 22,6

Conteiner(QCIF) 31,3 37,9

Car phone (QCIF) 33,8 42,0

Silent (CIF) 35,8 43,0

Bus (CIF) 16,4 28,8

Hall (CIF) 38,8 45,0

Mobile Calendar (HD) 27,6 33,0

Итог 30,3 37,5

Из всех видеопоследовательностей, перечисленных в табл. 4, лучшего результата достигла видеопоследовательность "Car Phone", сокращение битрейта приблизительно 23,8%, и улучшение PSNR составляет 0,83 дБ.

Это объясняется тем, что большинство блоков этой последовательности классифицируется или как случай 1 или как случай 2.Улучшение PSNR и снижение битрейта для худшего случая "Bus" составляет 0,15 дБ и 4,14%, соответственно.

О 200 400 600 S00 1000

Rale (kbps)

Рис. 8 (а). Кривая RD исходного и предложенного метода для видеопоследовательности (Salesman QCIF)

Rate fkbPS)

Рис. 8 (b). Кривая RD исходного и предложенного метода для видеопоследовательности (Stefan QCIF)

Rate (kbps)

Рис. 8 (с). Кривая RD исходного и предложенного метода для видеопоследовательности (Car phone QCIF)

О 200 400 600 800 1000

RatefkbPS*

Рис. 8 (d). Кривая RD исходного и предложенного метода для видеопоследовательности (Container QCIF)

О 1000 2000 3000 4000 5000

Rate(kbps)

Рис. 8 (е). Кривая RD исходного и предложенного метода для видеопоследовательности (Bus QCIF)

200 700 1200 1700 2200

Rate < kbps I

Рис. 8 (f). Кривая RD исходного и предложенного метода для видеопоследовательности (Hall CIF)

34

m

х>

с^О

I

26

22

/

/ —Original H 2B4/AVC + Proposed i

40000

О 10000 20000 30000

Raf*» (khpc)

Рис. 8 (g) Кривая RD исходного и предложенного метода для видеопоследовательности (Mobile Calendar HD)

3S

34

сс

z

w

So

26

/

—Oflginal H.26WVC * Proposed

600

1200 1800 Rate (kbps)

2400 3000

Рис. 8 (h). Кривая RD исходного и предложенного метода для видеопоследовательности (Silent C1F)

Уменьшение вычислительной нагрузки, полученное с помощью предложенного алгоритма, занесено в табл. 5. Хотя для выбора МРМ, предложенный метод вводит некоторые дополнительные вычисления, тотальные сокращения вычислений гораздо более существенные и приблизительно на 7% быстрее, чем в методе [6]. Предложенный метод уменьшает вычислительную сложность приблизительно на 37,5%, по сравнению с оригинальной моделью Н.264/АУС Ыга кодера. На рис. 8 представлены кривые уровней искажений (ЯП) шести различных типов видео последовательностей. Показано, что кривая ЯО, предложенного метода, всегда превосходит кривую оригинального кодирующего устройства Н.264/АУС.

Выводы

В статье описан алгоритм сокращения битрейта для Ыга модели предсказания. Для уменьшения пространственной избыточности в ййга модели кодирующего устройства Н.264/АУС используется девять способов предсказаний для блоков размером 4x4 пикселя. Такое количество способов усложняет работу кодирующего устройство за счет увеличения количества битов оповещения. В предложенном методе, способы предсказания для каждого блока подбирались адаптивно. Каждый блок, предназначенный для предсказания, классифицируется под одну из трех категорий, в зависимости от общности опорных пикселей. Оценивается самый вероятный способ (МРМ) исходя из направления предсказания соседних блоков, с различными весами соответствующими их положению. Результаты эксперимента подтверждают, что предложенный метод сокращает битрейт на 12,4%, улучшает качество видео в среднем на 0,37 дБ, и требует на 37% меньшего количества вычислений, чем Н.264/АУС шИга кодер. Предложенный метод не только улучшает работу ЯО, но также и уменьшается вычислительная сложность кодера Н.264/А УС т1га.

38

34

т

К

2

o')

CL

30

26

/

/

—o— Original H 264/AVC —ы— Proposed

200

600

800

400 Rate (kbps)

Рис 8 (i). Кривая RD исходного и предложенного метода для видеопоследовательности (Grand Mother QCIF)

Литература

1. 1SO/IEC 14496-10 (2004), Information Technology-Coding of audio-visual objects-Part: 10: Advanced Video Coding. ISO/lEC JTC1/SC29/WGI1.

2. Kim B.G. (2008) Fast selective intra mode search algorithm based on adaptive thresholding scheme for H.264/AVC encoding. IEEE Transaction on Circuits and Systems for Video Technology, vol. 18, no. 1, pp. 127-133, ISSN: 1051-8215.

3. Kim D.Y.. Han K.H. , and Lee Y L. (2010), Adaptive singlemultiple prediction of H.264/AVC intra coding. , IEEE Transaction on Circuits and Systems for Video Technology, vol. 20, no. 4, pp. 610-615, ISSN: 1051-8215.

4. Wiegand Т., Schwarz H. , Joch A.. Kossent ini F.. and Sullivan G J. (2003) Rate-constrained coder control and comparison of video coding standards. IEEE Transaction on Circuits and Systems for Video Technology . vol 13, no. 7, pp.688-703, ISSN: 10518215.

Methods of improving intra coding.

Bushin D.S., Ignatov F.M.

Abstract

The paper describes an algorithm to reduce the bitrate for intra model predictions. To reduce spatial redundancy in intra model H.264/AVC encoder used nine ways to predictions of blocks of 4x4 pixels. Such a number of ways complicates the work of the coding device by increasing the number of bits notice. In the proposed method, the methods of prediction for each block were selected adaptively. Every unit for predictions are classified into one of three categories, depending on the generality, reference pixels. This article also assessed the most likely way (MPM) from the direction of neighboring prediction blocks with different weights corresponding to their position. Results of experiments that show that the proposed method reduces the bit rate by 12,4% and improves video quality by an average of 0,37 dB, and requires 37% less computation than H.264/AVC untra encoder. The proposed method not only improves the RD, but also reduce the computational complexity of the encoder H.264/AVC intra.

i Надоели баннеры? Вы всегда можете отключить рекламу.