4 декабря 2011 г. 1:01
ТЕХНОЛОГИИ
Влияние размера пакета передачи видеоинформации на качество восстановленных видеопоследовательностей в беспроводных сетях
Ключтл
Видеопоследовательности, беспроводные сети, мобильные устройство, модель Гильберта
Рассмотрена передача ЙТР-пакетов компрессированного видео по стандарту Н.264 АУС Рассмотрены различные типы ошибок в канапах связи и способов борьбы с ними. Б качестве модели канапа выбрана моаепь Гильберта. Показано как размер 1?ТР-пакета (по отношению к МАШ) влияет на качество восстанавливаемого видео. Показано как влияет размер пакета на размер битового потока. Намечены направления дальнейших исследований.
Чуйков А в.,
аспирант кафедоы информационных систем (№51) Санкт-Петербургского государственного университета аэрокосмического приборостроения
(СПб ГУАП)
За последнее время рынок мобильных устройств значительно вЬ{ХХ, появились новые устройства, которые включают в себя большой набор разнообразных функций — мобильная связь, мобильный интернет, фото- и видеокамеры, спутниковая навигация и тд. Программное обеспечение и сервисы, предоставляемые абонентам, активно развиваются, предлагая новые услуги связи, как конференцсвязь и видео-звонок. Дополнительно стоит отметить, что мобильные устройства могут использовать различные типы подключения для передачи информации (например, 2С, ЗС, 4С и 802.11). Разные типы соединения предлагают различное качество услуг. С точки зрения передачи видеоинформаций, качество определяется исходя из следующих параметров:
— кадоовая скорость и отсутствие задержек;
— потеря (эам^хзние) блоков видео кадра;
— объективное и субъективное (визуальное) качество видео.
Основная задача передачи видео по сетям, выбрать оптимальное отношение между скоростью передачи и критериями качества описанными выше. Уменьшение длины посылок приводит к уменьшению вероятности ее потери, но с другой стороны увеличивает нагрузку на канал.
Для передачи по мобильным сетям предлагается использовать стандарт
H.264/MPEG-4 AVC (Advanced Video Coding, улучшенное кодирование видео, [ 1 ]) или его расширение SVC (Scalable Video Coding, масштабированное кодирование видео). Основными характеристиками данного кодера можно счггать:
— широкий выбор профилей для кодирования видео различных скоростей, частоты кадров и разрешений;
— поддержку слайсов, кодирование макроблоками различных типов: I, Р, В (двухстороннее предсказание), SI, SP;
— четвертъ-ликсельную компенсацию д вижения для блоков размерами от 16x16 до 4x4 с использованием нескольких ссылочных кадров;
— целочисленные преобразования над блоками;
— адаптивный нелинейный deblocking фильтр для удаления границ блоков и/или макроблоков;
— энтропийное кодирование;
— иерархическое построение битового потока.
Современные мобильные устройства обладают достаточной производительностью и объемами память, что бы использовать Н.264 для кодирования и декод^ювания видеоинформации Для передачи потокового видео в IP-сетях используется протокол RTR его произ водоые или коммерческие реализации, основанные на этом стандарте. Для передачи донных Н.264 используется инкапсуля^я донных в RTP пакет по правилам описанных в |2).
Геометрическое разрешение передаваемой информации сложно отнести к качественным характеристикам. Для мобильных устройств, оно чаше всего фиксировано и определяется настройками для конкретного приложения или используемого видеокодека.
Передача видеоинформации по беспро-водеым сетям подвергается различным типам помех (интерференции, замирания), которые невозможно заранее предусмотреть. Очевидно, что передача видеоинформации по беспроводным сетям требует специализированных средств для защиты от ошибок |3|.
Для дальнейших рассуждений разделим систему кодирования, декодирования, приема и передачи видеоинформации на три уровня:
— физический уровень соответствует физическому уровню модели 051;
— уровень MAC соответствует канальному (MAC подуровень) и сетевому уровням модели OSI;
— уровень приложения соответствует всем выше лежащим уровням, в первую очередь уровню приложения;
Рассмотрим различные основные типы помех, которые могут появиться при передаче видеоинформации по беспроводным каналам связи:
— на физическом уровне, это затухание сигнала и шум;
— на МАС-уровне это потери пакетов, вызванные коллизиями;
Рассмотрим способы борьбы с помехами на различных уровнях.
— на физическом уровне это использование неравномерного FEC (Forward Error Correction) для пакетов, описанный в (4];
— на МАС-уровне можно выбрать оптимальный размер пакета;
— на уровне приложения поддерживаются различные типы защиты от помех. Например, разделение донных (data partitioning) и использование слайсов (slicing);
Совместное использование всех уровней позволяет достичь максимальных результа-
32
T-Comm #3-2010
ТЕХНОЛОГИИ
тов. Под совместной работой подразумевается наличие связей между уровнями для настройки параметров уровня. В первую очередь это касоется МАС-уровня и уровня приложения.
Как было сказано ранее, Н.264 разбивает изображение на слайсы с помощью использования гибкого порядка макроблоков (Flexible МасгоЫоск Ordering, FMO, |5]). В качестве примера можно привести два тривиальных случая. Первь** случай, когда все изображение представляется одним слайсом. Второй — когда выделяется регион интереса (Re^pon Of Interest, ROI), который образует слайс #0 (передоий план), а все остальные макроблоки попадают в слайс # 1 (фон). Таким образом, слайс — это группа макроблоков во времени и пространстве, которая кодируется независимо от другого слайса. Так же возможна кодорование и передача слайсов с дополнительной информации для улучшения качества восстанавливаемого видео. Передаваться слайсы можно в любом порядке. В данной статье будет использоваться один слайс описывающий весь кадр.
Закодированный слайс состоит из зако-дерованных макроблоков. Такая группа закодированных макроблоков состоит из нескольких единиц NAL (Network Abstraction Layer Uni, NAIU) и включает необходимые заголовки, параметры и сжатую текстуру. Единица NAL несет заголовок, описываюццй ее тип, длину и полезные данные.
Для передачи NAIU по сетям с использованием RTP можно опираться на следующее:
— один NALU = один RTP-пакет, если размер NALU не превышает максимально допустимый размер RTP, устанавливаемого системой передачи видеоинформацж;
— несколько NALU = один RTP-пакет, если суммарный размер NAIU не превьиюет максимально допустимый размер RTP, устанавливаемого системой передачи видеоинформации;
— Один NAIU = несколько RTP-пакетов, если размер NALU превышает допустимый размер RTP, устанавливаемого системой передачи видеоинформации. При этом нельзя объединять фрагменты различных NAIU в один пакет.
Потеря NALU может привести к невозможности (частжной или полной) восстановления слайса. Это приводит к невозможности (части 1*40Й или полной) восстановления той группы макроблоков, которую он описывает. Очевидно, что уменьшение размера пакета
позволяет уменьшить влияние потери, но увеличивает нагрузку на канал.
Идея разделения данных состоит в том, что все кодируемые NALU группируются по зна1*1мости
— наиболее значимая информация — тип мокроблока, параметры квантователя, вектора компенсации, тип А;
— Inlra макроблоки, тип В;
— Inter макроблоки, тип С.
Данньм подход позволяет оптимизировать защиту на более низких слоях (оптимизировать выбор неравномерного кода для
FEC).
Выбор оптимального размера пакета должен производиться с учетом характеристик MAC и физического уровня.
Рассмотрим два случая Если небольшой размер пакета позволяет уменьшить влияние потерь и порчи пакетов. С другой стороны, уменьшение размера пакета приводит увеличению накладных расходов — заголовки пакетов и повышение нагрузки на передающие и принимающие устройства (в первую оче-реде энергопотребления). Большой размер пакета может включать несколько NALU, что сокращает нагрузку на канал и устройства приемника и передатчика. С другой стороны потеря NALU пакета может оказаться существенной с точен зрения качества воспроизводимого видео.
При передаче пакетов по беспроводной сети необходимо учитывать два параметра — вероятность ошибок в пакете (Packet Error Rate, PER) и вероятность потери пакета (Pocket Loss Rate. PLR).
Посмотрим зависимость качества видео от PER/PLR. Смоделируем передачу видеоинформации по сети, с учетом пакетной передачи. Для этого введем величину размера RTP пакета (MTU). При моделирована передачи будут учитываться требования указанные выше (объединение или дробление RTP пакета). Зафиксируем несколько скоростей передачи видеоинформации (6]:
— 192 К Бит д ля разрешения 176х 144 @ 30 fps;
— 768 К Бит для разрешения 352x288 @ 30 fps,
— > I Мбита для разрешения 352x288 @ 30 fps.
Выберем размер пакета RTP равной 600, 1000, 1400 и 2000 байтов. Размер 1400 соответствуют приблизительному максимальному размеру пакета для IEEE 802.3 сетей Размер 2000 байтов для сетей 802.11 соот-
Рис. 1, Маркова*ся цепь издвух состояний
ветстеенно. Для моделирования канала выберем модель Гильберта [6]. Данная модель описывается простой Марковская цепью из двух состояний ("хорошее/Good" и "плохое/Bad", см. рис I) с матрицей переходов (1).
Р =
Роо А>1 Pio Рп
(1)
Донная модель часто используется для описания беспроводных каналов и хорошо изучена. Матрицу переходных вероятностей можно описать через среднюю вероятность ошибки в канале и среднюю длину пакета ошибок.
Зададим разл^ные опюшения вероятности ошибки в канале, зафиксируем длины пакетов ошибок в 50 бит, зафиксируем длины сообщений и вычислим PLR для различных длин:
Средняя вероятность ошибки в канале Длина сообщения. байт Средняя вероятность потери пакета (PLR)
10» 600 0.0010
1000 0.0016
1400 0.0022
2000 0.0032
11Н 600 0.0097
1000 0.0160
1400 0.0222
2000 0.0316
1<н 600 0.0925
1000 0.1488
1400 0.2016
2000 0.2748
1<Н 600 0.6234
1000 0.8033
1400 0.8970
2000 0.9609
Используя моде г*, и вероятности, полученные выше, построим график среднего относительного числа восстановленных кадров (см. рис. 2). При моделировании проводилось максимально возможная упаковка данных без перестановок ЫАШ. Каждый РТР пакет вмещал в себя как можно больше МАШ, либо содержал фрагменты ЫАШ. Например, МАШ единицы имеют размер 100, 100, 100, 800 и 100 байт. Для РТР-лакета с максимальной
T-Comm #3-2010
зз