Научная статья на тему 'Влияние размера пакета передачи видеоинформации на качество восстановленных видеопоследовательностей в беспроводных сетях'

Влияние размера пакета передачи видеоинформации на качество восстановленных видеопоследовательностей в беспроводных сетях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
955
121
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ / БЕСПРОВОДНЫЕ СЕТИ / МОБИЛЬНЫЕ УСТРОЙСТВА / МОДЕЛЬ ГИЛЬБЕРТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чуйков А. В.

Рассмотрена передача RTP пакетов компрессированного видео по стандарту H.264 AVC. Рассмотрены различные типы ошибок в каналах связи и способов борьбы с ними. В качестве модели канала выбрана модель Гильберта. Показано как размер RTP пакета (по отношению к NALU) влияет на качество восстанавливаемого видео. Показано как влияет размер пакета на размер битового потока. Намечены направления дальнейших исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Влияние размера пакета передачи видеоинформации на качество восстановленных видеопоследовательностей в беспроводных сетях»

4 декабря 2011 г. 1:01

ТЕХНОЛОГИИ

Влияние размера пакета передачи видеоинформации на качество восстановленных видеопоследовательностей в беспроводных сетях

Ключтл

Видеопоследовательности, беспроводные сети, мобильные устройство, модель Гильберта

Рассмотрена передача ЙТР-пакетов компрессированного видео по стандарту Н.264 АУС Рассмотрены различные типы ошибок в канапах связи и способов борьбы с ними. Б качестве модели канапа выбрана моаепь Гильберта. Показано как размер 1?ТР-пакета (по отношению к МАШ) влияет на качество восстанавливаемого видео. Показано как влияет размер пакета на размер битового потока. Намечены направления дальнейших исследований.

Чуйков А в.,

аспирант кафедоы информационных систем (№51) Санкт-Петербургского государственного университета аэрокосмического приборостроения

(СПб ГУАП)

За последнее время рынок мобильных устройств значительно вЬ{ХХ, появились новые устройства, которые включают в себя большой набор разнообразных функций — мобильная связь, мобильный интернет, фото- и видеокамеры, спутниковая навигация и тд. Программное обеспечение и сервисы, предоставляемые абонентам, активно развиваются, предлагая новые услуги связи, как конференцсвязь и видео-звонок. Дополнительно стоит отметить, что мобильные устройства могут использовать различные типы подключения для передачи информации (например, 2С, ЗС, 4С и 802.11). Разные типы соединения предлагают различное качество услуг. С точки зрения передачи видеоинформаций, качество определяется исходя из следующих параметров:

— кадоовая скорость и отсутствие задержек;

— потеря (эам^хзние) блоков видео кадра;

— объективное и субъективное (визуальное) качество видео.

Основная задача передачи видео по сетям, выбрать оптимальное отношение между скоростью передачи и критериями качества описанными выше. Уменьшение длины посылок приводит к уменьшению вероятности ее потери, но с другой стороны увеличивает нагрузку на канал.

Для передачи по мобильным сетям предлагается использовать стандарт

H.264/MPEG-4 AVC (Advanced Video Coding, улучшенное кодирование видео, [ 1 ]) или его расширение SVC (Scalable Video Coding, масштабированное кодирование видео). Основными характеристиками данного кодера можно счггать:

— широкий выбор профилей для кодирования видео различных скоростей, частоты кадров и разрешений;

— поддержку слайсов, кодирование макроблоками различных типов: I, Р, В (двухстороннее предсказание), SI, SP;

— четвертъ-ликсельную компенсацию д вижения для блоков размерами от 16x16 до 4x4 с использованием нескольких ссылочных кадров;

— целочисленные преобразования над блоками;

— адаптивный нелинейный deblocking фильтр для удаления границ блоков и/или макроблоков;

— энтропийное кодирование;

— иерархическое построение битового потока.

Современные мобильные устройства обладают достаточной производительностью и объемами память, что бы использовать Н.264 для кодирования и декод^ювания видеоинформации Для передачи потокового видео в IP-сетях используется протокол RTR его произ водоые или коммерческие реализации, основанные на этом стандарте. Для передачи донных Н.264 используется инкапсуля^я донных в RTP пакет по правилам описанных в |2).

Геометрическое разрешение передаваемой информации сложно отнести к качественным характеристикам. Для мобильных устройств, оно чаше всего фиксировано и определяется настройками для конкретного приложения или используемого видеокодека.

Передача видеоинформации по беспро-водеым сетям подвергается различным типам помех (интерференции, замирания), которые невозможно заранее предусмотреть. Очевидно, что передача видеоинформации по беспроводным сетям требует специализированных средств для защиты от ошибок |3|.

Для дальнейших рассуждений разделим систему кодирования, декодирования, приема и передачи видеоинформации на три уровня:

— физический уровень соответствует физическому уровню модели 051;

— уровень MAC соответствует канальному (MAC подуровень) и сетевому уровням модели OSI;

— уровень приложения соответствует всем выше лежащим уровням, в первую очередь уровню приложения;

Рассмотрим различные основные типы помех, которые могут появиться при передаче видеоинформации по беспроводным каналам связи:

— на физическом уровне, это затухание сигнала и шум;

— на МАС-уровне это потери пакетов, вызванные коллизиями;

Рассмотрим способы борьбы с помехами на различных уровнях.

— на физическом уровне это использование неравномерного FEC (Forward Error Correction) для пакетов, описанный в (4];

— на МАС-уровне можно выбрать оптимальный размер пакета;

— на уровне приложения поддерживаются различные типы защиты от помех. Например, разделение донных (data partitioning) и использование слайсов (slicing);

Совместное использование всех уровней позволяет достичь максимальных результа-

32

T-Comm #3-2010

ТЕХНОЛОГИИ

тов. Под совместной работой подразумевается наличие связей между уровнями для настройки параметров уровня. В первую очередь это касоется МАС-уровня и уровня приложения.

Как было сказано ранее, Н.264 разбивает изображение на слайсы с помощью использования гибкого порядка макроблоков (Flexible МасгоЫоск Ordering, FMO, |5]). В качестве примера можно привести два тривиальных случая. Первь** случай, когда все изображение представляется одним слайсом. Второй — когда выделяется регион интереса (Re^pon Of Interest, ROI), который образует слайс #0 (передоий план), а все остальные макроблоки попадают в слайс # 1 (фон). Таким образом, слайс — это группа макроблоков во времени и пространстве, которая кодируется независимо от другого слайса. Так же возможна кодорование и передача слайсов с дополнительной информации для улучшения качества восстанавливаемого видео. Передаваться слайсы можно в любом порядке. В данной статье будет использоваться один слайс описывающий весь кадр.

Закодированный слайс состоит из зако-дерованных макроблоков. Такая группа закодированных макроблоков состоит из нескольких единиц NAL (Network Abstraction Layer Uni, NAIU) и включает необходимые заголовки, параметры и сжатую текстуру. Единица NAL несет заголовок, описываюццй ее тип, длину и полезные данные.

Для передачи NAIU по сетям с использованием RTP можно опираться на следующее:

— один NALU = один RTP-пакет, если размер NALU не превышает максимально допустимый размер RTP, устанавливаемого системой передачи видеоинформацж;

— несколько NALU = один RTP-пакет, если суммарный размер NAIU не превьиюет максимально допустимый размер RTP, устанавливаемого системой передачи видеоинформации;

— Один NAIU = несколько RTP-пакетов, если размер NALU превышает допустимый размер RTP, устанавливаемого системой передачи видеоинформации. При этом нельзя объединять фрагменты различных NAIU в один пакет.

Потеря NALU может привести к невозможности (частжной или полной) восстановления слайса. Это приводит к невозможности (части 1*40Й или полной) восстановления той группы макроблоков, которую он описывает. Очевидно, что уменьшение размера пакета

позволяет уменьшить влияние потери, но увеличивает нагрузку на канал.

Идея разделения данных состоит в том, что все кодируемые NALU группируются по зна1*1мости

— наиболее значимая информация — тип мокроблока, параметры квантователя, вектора компенсации, тип А;

— Inlra макроблоки, тип В;

— Inter макроблоки, тип С.

Данньм подход позволяет оптимизировать защиту на более низких слоях (оптимизировать выбор неравномерного кода для

FEC).

Выбор оптимального размера пакета должен производиться с учетом характеристик MAC и физического уровня.

Рассмотрим два случая Если небольшой размер пакета позволяет уменьшить влияние потерь и порчи пакетов. С другой стороны, уменьшение размера пакета приводит увеличению накладных расходов — заголовки пакетов и повышение нагрузки на передающие и принимающие устройства (в первую оче-реде энергопотребления). Большой размер пакета может включать несколько NALU, что сокращает нагрузку на канал и устройства приемника и передатчика. С другой стороны потеря NALU пакета может оказаться существенной с точен зрения качества воспроизводимого видео.

При передаче пакетов по беспроводной сети необходимо учитывать два параметра — вероятность ошибок в пакете (Packet Error Rate, PER) и вероятность потери пакета (Pocket Loss Rate. PLR).

Посмотрим зависимость качества видео от PER/PLR. Смоделируем передачу видеоинформации по сети, с учетом пакетной передачи. Для этого введем величину размера RTP пакета (MTU). При моделирована передачи будут учитываться требования указанные выше (объединение или дробление RTP пакета). Зафиксируем несколько скоростей передачи видеоинформации (6]:

— 192 К Бит д ля разрешения 176х 144 @ 30 fps;

— 768 К Бит для разрешения 352x288 @ 30 fps,

— > I Мбита для разрешения 352x288 @ 30 fps.

Выберем размер пакета RTP равной 600, 1000, 1400 и 2000 байтов. Размер 1400 соответствуют приблизительному максимальному размеру пакета для IEEE 802.3 сетей Размер 2000 байтов для сетей 802.11 соот-

Рис. 1, Маркова*ся цепь издвух состояний

ветстеенно. Для моделирования канала выберем модель Гильберта [6]. Данная модель описывается простой Марковская цепью из двух состояний ("хорошее/Good" и "плохое/Bad", см. рис I) с матрицей переходов (1).

Р =

Роо А>1 Pio Рп

(1)

Донная модель часто используется для описания беспроводных каналов и хорошо изучена. Матрицу переходных вероятностей можно описать через среднюю вероятность ошибки в канале и среднюю длину пакета ошибок.

Зададим разл^ные опюшения вероятности ошибки в канале, зафиксируем длины пакетов ошибок в 50 бит, зафиксируем длины сообщений и вычислим PLR для различных длин:

Средняя вероятность ошибки в канале Длина сообщения. байт Средняя вероятность потери пакета (PLR)

10» 600 0.0010

1000 0.0016

1400 0.0022

2000 0.0032

11Н 600 0.0097

1000 0.0160

1400 0.0222

2000 0.0316

1<н 600 0.0925

1000 0.1488

1400 0.2016

2000 0.2748

1<Н 600 0.6234

1000 0.8033

1400 0.8970

2000 0.9609

Используя моде г*, и вероятности, полученные выше, построим график среднего относительного числа восстановленных кадров (см. рис. 2). При моделировании проводилось максимально возможная упаковка данных без перестановок ЫАШ. Каждый РТР пакет вмещал в себя как можно больше МАШ, либо содержал фрагменты ЫАШ. Например, МАШ единицы имеют размер 100, 100, 100, 800 и 100 байт. Для РТР-лакета с максимальной

T-Comm #3-2010

зз

i Надоели баннеры? Вы всегда можете отключить рекламу.