Научная статья на тему 'Энтропийное кодированиe сигналов изображений в системах телевизионного контроля объектов'

Энтропийное кодированиe сигналов изображений в системах телевизионного контроля объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
130
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Энтропийное кодированиe сигналов изображений в системах телевизионного контроля объектов»

Энтропийное кодирование сигналов изображений в системах телевизионного контроля объектов

Власюк И.В., Комаров П.Ю., Свешников Н.Б., МТУСИ

Процесс сжатия спектра телевизионного изображения основан на селекции изменений параметров видеоинформационного сигнала по любому из указанных направлений видеоинформационного пространства и кодировании выявленных изменений для передачи с минимизацией объёма передаваемой информации до уровня, обеспечивающего на приёмной стороне необходимое качество реставрации сигнала.

Информативными параметрами отдельного элемента полного алфавита структуры изображения является положение данного элемента, например, во внутрикадровом пространстве, уровень соответствующего сигнала. Экономично должны кодироваться также совокупности (участки) смежных элементов, сохраняющих, например, в пределах заданного диапазона отклонений, один и тот же уровень. Тогда при кодировании сообщений кодом переменной длительности (длин серий) кодовое слово может быть составным: первая часть отражает уровень, а вторая часть-протяжённость последующего участка с таким фиксированным уровнем. Частным случаем данного варианта является случай, когда относительно протяжённые участки (последовательности) между элементами с изменениями уровня являются фиксированными по значению, например, равным нулю. Тогда в одной из частей кодового слова следует кодировать число элементов (длина серии) фиксированного уровня, отделяющих один от другого элементы, уровни которых отличаются от фиксированного.

Проблема при сжатии, собственно, и состоит в том, чтобы получить сигнал, имеющий достаточно большое количество нулевых значений. В системах вещательного телевидения данная задача решается за счёт перехода в спектральную область (ДКП) при передаче видеоинформации блоками. При этом имеет место распределение дискретных компонент пространственного спектра в пределах соответствующей матрицы значений пространственных частот. Составляющая наиболее низкой частоты позиционируется в левом верхнем углу матрицы. Число компонент спектра равно числу пикселов блока. Значения уровней компонент и их число в спектре конкретного блока пикселов обычно снижается с увеличением частоты. Минимальный уровень чаще всего имеет компонента в правом нижнем углу матрицы. Последнее определяет целесообразность диагонального сканирования двумерной матрицы распределения коэффициентов спектра в каждом из независимых блоков с весовым преобразованием и сопутствующим снижением точности квантования уровня коэффициентов спектра высокочастотных составляющих. В результате имеет место появление значительного числа нулевых значений в высокочастотной части матрицы спектра блока и возможность кодирования полученной одномерной последовательности методом "длин серий". Далее полученная последовательность ко-

дируется кодом Хаффмана

Энтропия ограниченного, из полного алфавита, числа ( от нуля до k-1) элементов определяется суммой

K -1 ,

П=Ъ -Ptlog2pi,

0 i 2 1

где P — вероятности каждого из элементов.

Энтропия определяет наименьшее, в среднем, число бит, необходимое для описания алфавита данных элементов. При отличающихся вероятностях элементов существенно падает энтропия. В случаях, когда последовательно передаются символь алфавита, использование архивирования символов на приёмной стороне позволяет оценивать и уточнять вероятность их последующего поступления. Текущее увеличение протяжённости архивированной информации позволяет выявлять специфику изменения вероятностного распределение отдельных сообщений в зависимости от протяжённости процесса передачи.

С другой стороны известное вероятностное распределение отдельных сообщений позволяет сразу же вычислять средний объём информации на сообщение для данного их алфавита. В случаях, когда протяжённость реализации значительно (многократно) превышает число возможных сообщений алфавита и содержит не менее, например, шестнадцати повторений каждого из отдельных сообщений, относительная частота фактически совпадает с вероятностью появления сообщений. Соответственно понятие среднего объёма реализации трансформируется в понятие энтропия. Чем больше не-определённости в сообщении, тем больше оно содержит информации. При числе возможных сообщений n энтропия выражается следующим образом:

П H =—^ Р■ log т Р ■ бит/сообщение i-1 ■ 2 1

Здесь P. — вероятность i-го из возможного конечного числа n сообщений и H =£ p. = 1.

i-1 1

Разность между энтропией источника равновероятных сообщений H0 и энтропией H данного, например, реального источника сообщений при фиксированном их числе часто определяется как избыточность R источника:

R = H0- H.

Относительную избыточность находят делением избыточности на энтропию источника равновероятных сообщений Ho:

Ro = 1 -

н

но

Сравнительно высокую степень приближения к энтропии обеспечивает кодирование алфавита сообщений с использованием кодовых слов, изменение числа бит в которых согласовано с вероятностью появления в источнике соответствующего сообщения. Чем большая вероятность появления данного сообщения, тем более коротким должно быть кодовое слово, отражающее его появление в данной реализации.

Кодирование Хаффмана.

Процедура включает следующие операции:

1. Распределения (упорядочивания) сообщений в порядке убывания их вероятностей.

2. Определенная последовательность этапов объединения сообщений с минимальными для каждого этапа значениями вероятностей ( с получением соответствующих узлов на дереве кодирования) до полного её завершения (с получением последнего узла).

3. Кодирование, которое реализуют с узла последнего этапа, завершающего объединение. При этом верхней (по величине вероятности) упорядоченной компоненте последнего этапа объединения может быть присвоена двоичная цифра "1" , а нижней "0". Аналогичным образом присвоения могут осуществляться в узлах, полученных на предшествующих этапах. С учетом префиксного типа кода соответственно процесс кодирования сообщений реализуют в обратном (по отношению к этапам создания узлов объединений) порядке.

В случаях когда возникает вариант с более, чем двумя узлами, имеющими одинаковую вероятность, целесообразно объединять ветви тех из них, которые до этого имели меньшее число объединений. При этом выравниваются длины используемых кодовых слов.

В случаях же когда при объединениях возникает вариант с более чем двумя узлами, имеющими наименьшую вероятность, целесообразно иногда также осуществить объединение и ветвь дерева кодирования, имеющую наименьшей вероятность с ветвью, имеющую наибольшую вероятность. Может быть построено несколько вариантов кодирования для данного алфавита. Однако наиболее лучшим вариантом будет код с наименьшей дисперсией. Дисперсию кодирования d оценивают по отношению к среднему числу бит на один символ-п5.

7

^ = Х Р> (П - П )2'

1 = 1

Если относительные частоты сообщений неизвестны, то на передающей и приёмной сторонах они могут параллельно определяться и уточняться путём, например, установленной процедуры контроля текущих изменений характеристик передаваемых сообщений и адаптивной перестройки структуры дерева кодирования. При этом процедура упорядочивания сообщений в порядке убывания их вероятностей и соответствующая перестройка структуры дерева реализуется соответственно в текущем режиме, по ходу уточнения относительных частот алфавита сообщений. Структура дерева изменяется слева направо и при необходимости и по уровням, т.е. снизу вверх. Изменения параллельно реализуют и на приёмной и на передающей стороне.

Недостатком кодирования Хаффмана считается избыточность кодирования, которая обусловлена использованием целого числа бит в каждом из выбранных для сообщений слов кода. Однако возможность использования целого числа бит на символ при кодировании по Хаффману не даёт избыточности только в случае, когда вероятности сообщений отражаются числами Ро“ = (0,5)а, где а > 1 и является целым числом. В противном случае степень сжатия существенно падает из-за неэффективного кодирования символами, вероятность появления сообщений, соответствующих которым р: > 0,5.

В идеале на данное сообщение следует выделить кодовое слово протяжённостью /1 = - 1од2 р, < 1 бит. Однако, согласно алгоритму кодирования Хаффмана, приходится выделять >1 бита.

Арифметическое кодирование

Особенностью арифметического кодирования при сжатии является относительно жёсткое сопряжение процедуры кодирования с вероятностями появления сообщений конкретного алфавита и присвоение кода не отдельным символам, отражающим появление сообщений в источнике, а их, ансамблю (файлу), имеющему определённое, например, число (объём) сообщений.

Арифметическое кодирование может выполняться в два этапа. На первом этапе (проходе файла) оценивают относительные частоты сообщений в передаваемом файле, а на втором осуществляют собственно кодирование. Если же относительные частоты для данного файла известны, то арифметическое кодирование осуществляют с их использованием. При кодировании поступающие символы многократно отражаются, согласно всей совокупности относительных частот данного алфавита сообщений, в виде модифицируемого (приходом каждого символа, которому соответствует определённая относительная частота) числа в интервалы позиционировании, идентифицирующие порядок их появления.

Исходный интервал позиционирования всей совокупности относительных частот данного алфавита сообщений [1] на первом этапе делится на интервалы, отражающие "вес" относительной частоты каждого из сообщений алфавита. Имеется упорядоченная таблица, отражающая число, частоты и относительные частоты (вероятности) символов сообщений алфавита.

Основным недостатком арифметического кодирования является значительный объем вычислений, обусловленный необходимостью использования при кодировании и декодировании операций умножения (деления). С другой стороны в данном случае обычно имеет место более эффективное, по отношению к варианту кодирования по Хаффману, кодирование сообщений, вероятность появления которых р. > 0,5 .

При выполнении адаптивного арифметического кодирования реализуют, с учётом изменений показаний счётчиков, осуществляющих текущую оценку относительных частот каждого из сообщений, параллельную (жестко согласованную) коррекцию на приёмной и передающей сторонах интервалов локализации сообщений в соответствующих массивах данных. С поступлением и накоплением сообщений могут, например, иметь место такие изменения относительных частот сообщений, представленных в массиве, которые нарушают его упорядоченность. Соответственно на последующих этапах кодирования целесообразно (согласованно при кодировании и декодировании) переходить к другому варианту интервалов локализации относительных частот сообщений в массиве. Процедура коррекции массива данных существенно упрощается при использовании специальной структуры в виде двоичного дерева кодирования, в узлах которого приведены, в том числе, и данные показаний счётчиков сообщений.

Во внутрикадровом пространстве исходного ТВ сигнала изображений должна обеспечиваться передача изменений фиксированной во времени видеоинформации по строке (горизонтальное по растру направление) или от строки к строке (вертикальное по растру направление) через пространственный интервал, равный протяжённости элемента Передача внутрикадровой видеоинформации (её каждого элементарного отсчёта) реализуется по временному направлению с частотой кадров. Передача внутрикадровой видеоинформации (ее каждого элементарного отсчёта отсчета) по цветовому направлению выполняется параллельно во времени в виде ярко-

стной и цветоразностных составляющих, первая из которых обычно передаётся с относительно более высокой пространственной разрешающей способностью.

При сжатии в первую очередь в системах телевизионного контроля объектов следует выделить участки с изменениями структуры изображения, трансформации которых во времени и передают на приемную сторону, что в конечном итоге позволяет представить на приёмной стороне степень и характер изменений сцены. Селекцию таких областей реализуют за счет сравнения текущей и размещенной в архиве видеоинформации с учётом параметров определяющих в текущее время адрес архивирования и соответствующие изменения архивированной видеоинформации в зависимости от штатных вариаций таблицы параметров с течением времени. Объём во внутрикадровом пространстве изменяющихся во времени участков видеоинформации по отношению к общему объему, т.е. с учетом тех, которые остаются стабильными, и определяет, в конечном итоге, степень сжатия.

С учетом того, что на приемную сторону необходимо передавать координатную информацию, определяющую траекторию движения объекта реализующего нарушение в пределах контролируемого пространства, то некоторым преимуществом обладают методы сжатия с дискретным разделением контролируемого пространст-

ва на независимые участки, являющихся опорными для пространственной локализации в пределах кадра несанкционированных изменений видеоинформации во времени. При этом сжатие пространственного спектра указанных участков изображения может осуществляться раздельно с последовательной передачей на приёмную сторону отсчётов реальной видеоинформации или её спектра.

Соответственно относительные изменения, которые определяются при сравнении штатной и текущей ситуаций, выявляются как нарушения в зоне телевизионного контроля объектов. Именно эти изменения штатной ситуации являются информативными. Соответствующий сигнал изображения должен последовательно во времени фиксироваться, спектр его должен подвергаться сжатию и в сжатом виде передаваться на приёмную сторону канала связи с диспетчерским пунктом централизованного контроля ситуации в области локализации объектов.

Литература

1. Вернер М. Основы кодирования. — М.: Техносфера, 2006. — 288 с.

2. Сэломон Д Сжатие данных, изображений и звука. — М.: Техносфера, 2006. — 368 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.