УДК 621.327:681.5
МОДЕЛЬ ОЦЕНКИ ИНФОРМАТИВНОСТИ НИЗКОЧАСТОТНОЙ СОСТАВЛЯЮЩЕЙ СПЕКТРАЛЬНОГО ПРЕДСТАВЛЕНИЯ СЕГМЕНТА ИЗОБРАЖЕНИЯ
ТУРЕНКО С. В.______________________________
Выявляются недостатки и показывается необходимость совершенствования технологии кодирования низкочастотных составляющих спектрального представления для формата JPEG. Строится математическая модель для оценки информативности структурного описания низкочастотных компонент, базирующаяся на том, что апертура равномерной длины, построенная для нормированных низкочастотных компонент, является комбинаторным объектом в условиях нормирования по первой низкочастотной компоненте и выявления скорректированных локальных приращений между смежными элементами апертуры.
1. Введение
Актуальность развития теоретических основ и технологий сжатия видеоданных обусловлена наличием тенденции значительно более высоких темпов роста видеоприложений по сравнению с внедрением высокоскоростных беспроводных технологий [1 - 3]. Одним из широко используемых стандартов является JPEG [2; 3]. Поэтому предлагается направление дальнейшего развития такой технологии. В аспекте одной из важных составляющих является разработка кодирования низкочастотных составляющих спектрального представления.
Стратегия кодирования квантизированной трансформанты для компонентного описания строится с учетом таких свойств [2; 3]:
1) концентрация основной энергии исходного сигнала в ограниченном количестве низкочастотных компонент трансформанты;
2) выделение области высокочастотных компонент, несущих информацию о мелких деталях изображений и потому оказывающих менее значимое влияние на визуальное восприятие изображений, чем низкочастотные компоненты;
3) появление компонент трансформанты с нулевыми значениями, особая концентрация которых велика для зигзагообразного обхода в диагональном направлении в области высокочастотных компонент.
Такие свойства надолго предопределили развитие базовых стратегий кодирования компонентного представления трансформанты, а именно раздельную обработку низкочастотной DC-компоненты и остальных AC компонент трансформант.
Компоненты DC могут кодироваться с использованием следующих способов:
1) назначение поэлементных кодов с применением кодовых таблиц в зависимости от диапазона DC-компоненты;
2) проведение предварительного дифференциального представления между DC-компонентами соседних трансформант с последующим кодированием по технологии LZW;
3) равномерное кодирование DC-компоненты с предварительной ее квантизацией.
Данные способы имеют следующие недостатки:
- если значение DC-компоненты велико, то таблица кодов по диапазону будет увеличивать длину выходного кода. Как показывают эмпирические исследования, затраты количества бит на DC-компоненту при таком способе кодирования будут не ниже 10 - 12 бит;
- снижение значения DC-компоненты возможно за счет ее квантизации, но такой подход неминуемо приведет к потере значительной информации;
- использование LZW технологии позволит в лучшем случае уменьшить количество бит на представление DC-компоненты не более, чем на 5 - 7%.
Таким образом, необходимо создать такую технологию кодирования низкочастотных компонент трансформант, для которой будет обеспечено снижение битовой скорости сжатого потока видеоданных в условиях отсутствия искажений и проведения обработки в реальном времени независимо от степени насыщенности изображений. В связи с этим, для обоснования направления по обработке низкочастотных компонент требуется разработать соответствующую модель оценки информативности, что и составляет цель исследований.
2. Основная часть
По условию формирования вектора двухкомпонентных кортежей низкочастотная компонента DC не участвует в такой обработке. Значение DC компоненты несет ключевую информацию об исходном сегменте и имеет относительно значительный динамический диапазон. Такие свойства накладывают определенные требования относительно выявления закономерностей и технологий кодирования низкочастотных компонент, а именно необходимо:
1) учитывать относительно незначительные изменения между DC-компонентами соседних линеаризированных трансформант в случае обработки слабонасыщенных сегментов изображений;
2) обеспечивать компенсацию при наличии резких перепадов между DC-компонентами, что характерно для ЛТ, соответствующих сегментам насыщенных изображений;
3) исключать искажения в процессе обработки DC-компонент.
РИ, 2013, № 2
53
Поэтому предлагается выявлять закономерности для последовательности DC-компонент на базе смежных ЛТ, учитывая их структурные и статистические зависимости.
Рассмотрим последовательность G низкочастотных DC-компонент, соответствующих соседним ЛТ.
Для учета статистической зависимости между DC компонентами смежных трансформант предлагается в первую очередь осуществлять их представление в дифференциальном пространстве за счет нормирования по первой DC-компоненте в векторе G. Это задается следующим выражением:
с1 ,r = с1,г - с1,1, (1)
странстве, которое можно составить при наличии ограничений на динамические диапазоны элементов, заданных выражениями (2) и (3), будет равно
W(G') = Мс'ц) • (Мс|,г))К-1 = (DC'max - DC'min))R-1 .
Соответственно количество V(G') информации в векторе G', составленное из низкочастотных компонент линеаризированных трансформант в нормированном по начальному элементу пространстве, оценивается по формуле V(G') = (R-1) 1og2(DC'max - DC'min)) .
Здесь по условию формирования апертуры выполняется условие
DC' - DC' < DC' < DC
^wmax ^^mm ^ ■Lyv^max ^ ■Lyv^max ?
(4)
где с1,г - значение г -й низкочастотной компонентні в нормированном пространстве.
В результате нормировки (1) формируется вектор G', у которого первая компонента имеет значение, равное нулю, сц = 0, т.е.
G' = {0, ■■■ , с1,г -с1,Ь ■■■, с1Д -с1,1} .
Такое представление позволит сократить динамический диапазон низкочастотных компонент, используя зависимость между соседними DC-компонентами Для того чтобы выявить закономерности во всей последовательности DC-компонент, предлагается формировать для вектора G' апертурные закономерности
Характеристиками апертуры являются:
1) длина R апертуры, вычисляемая как количество DC-компонент, для которых выполняется условие c1,r є [DCmin ; DCmax] , Г=1, R ;
2) начальный элемент c1,1 апертуры;
3) высота d апертуры, определяемая как разница между верхним DC'max и нижним DC'min значениями
динамического диапазона для вектора G' и задающая допуск на диапазон отклонения значений элементов апертуры, элементов предсказанных кадров ■
Основным структурным свойством апертуры является то, что ее элементы принадлежат ограниченному
динамическому диапазону, те^ DCmin - с1,г - DCmax ■
Это позволяет рассматривать апертуру как перестановку с повторениями по R элементов, на динамические диапазоны Х(сц) и Х(с1,г) которых наложены следующие ограничения:
c1,1 -^(с1,1) -1 = 1; (2)
c1,r - ^(с1,г) -1 = DCmax - DCmin , Г = 27"R ■ (3)
Тогда количество W(G') различных апертур длиной R в нормированном по координате апертуры про-
где DCmax - максимальное значение низкочастотной компоненты в векторе G до нормирования^
В то же время в процессе выявления закономерностей для последов ательности низкочастотных компонент и их кодирования необходимо учитывать особенности формирования апертур, а именно: если апертура строится в режиме заранее заданной высоты, то переменной будет ее длина^ Тогда, с одной стороны, это приведет к потере адаптивности относительно реального динамического диапазона DC компонент Отсюда возможны такие последствия, когда динамический диапазон: будет значительно меньшим, чем выбранное заранее значение высоты апертуры, что приведет к появлению избыточного количества разрядов при формировании объема DC-компонент; будет иметь нестационарные значения, что в случае фиксированной высоты апертуры приведет к образованию большого количества апертур^ С другой стороны, длина апертуры будет зависеть от степени когерентности сегментов и приводить к: снижению помехоустойчивости кодовых конструкций; уменьшению степени сжатия для сегментов насыщенных высокочастотными составляющими; увеличению количества операций на обработку как результат роста количества отдельных апертур ■
Для устранения таких недостатков предлагается осуществлять дополнительное выявление закономерностей, основанных на учете локально-пространственных свойств апертуры для последовательности низкочастотных компонент смежных ЛТ [4; 5] Выявление локально-пространственных свойств для последовательности низкочастотных компонент предлагается осуществлять на основе учета ограниченного приращения hj. между соседними низкочастотными компонентами Наличие таких свойств объясняется, во-первых, когерентностью смежных сегментов изображения, а во-вторых - представлением последовательности низкочастотных компонент в нормированном пространстве^
Такой вид ограничений задается следующей системой соотношений:
54
РИ, 2013, № 2
Kr-і-hr < cu;
{с1,г-і + hr ^ c1,r - (5)
Для сокращения служебных данных предлагается на основе вектора H приращений формировать одно значение, вычисляемое как максимальное приращение hmax [4; 5]: hmax = max (hr), где hmax - мак-
1 < r < R
симальное приращение среди компонент вектора H -
Величина hmax вычисляется для последовательности нормированных низкочастотных компонент и определяет динамический диапазон приращений между каждой парой ее элементов. Следовательно, величина hmax характеризует локальные пространственно-временные свойства апертуры. Для элементов последовательности G' выполняется ограничение
c1,r-1 — hmax < c1,r < c1,r-1 + hmax , r=1, R - (6)
Однако выражение (6) не учитывает ограничения, накладываемые на элементы апертуры относительно их допустимого отклонения в пределах высоты апертуры. Тогда возможен вариант, когда величина приращения может быть больше, чем половина высоты апертуры, т. е.
hmax > d/2 = (DC max -DC min)/2 .
В этом случае нормированные низкочастотные компоненты будут изменяться в пределах
с1,г-1Є [- hmax ; hmax] , причем
DC'
1 > c1,r-1 hn
<C1 r < C1 r-1 + hmax >DCm
-Lr-1
,r=1, R. (7)
В то же время по определению апертуры принадлежащие ей элементы не должны выходить за ее нижний и
верхний пределы, т.е. DCmin < с1,r < DCmax .
Следовательно, для выполнения требований относительно формирования апертуры необходимо вводить корректирующее условие, которое позволит избежать случаев, описываемых соотношением (7). Для этого предлагается вычислять локальное приращение как минимальное значение между высотой d апертуры и максимальным приращением hmax [5]:
h'max = min( max (hr}; d). Данное выражение задает
1 < r < R
локальное приращение h'max между нормированными низкочастотными компонентами с корректировкой.
Значит, для нормированных низкочастотных компонент, рассматриваемых как элементы апертуры с локальным приращением h'max , будет соответствовать динамический диапазон, задаваемый следующими соотношениями:
c1,1 < ^(с1д) -1 = 1; (8)
РИ, 2013, № 2
c1 r < min( max {hr}; d), r = 2, R . (9)
’ 1 < r < R
Отсюда можно сформулировать следующее определение.
Определение. Апертура равномерной длины, построенная для нормированных низкочастотных компонент, является комбинаторным объектом, а именно перестановкой с повторениями по R элементов, динамические диапазоны Х(с1д) и Х(с1,г) которых определяются в соответствии с выражениями (8) и (9).
Количество таких апертур W(G') определяется как количество перестановок по R элементов с двумя спецификациями Х(с1д) и Х(с1,г) и задается формулой
W(G') = (min(2 max (hr}; d))R-1 (ю)
1 < r < R •
Соотношение (10) для оценки количества нормированных апертур с учетом скорректированного ограничения на локальное приращение обеспечивает исключение тех апертур, элементы которых выходят за ее границы.
На основе выражение (10) максимальное количество двоичных разрядов V(G'), затрачиваемое на представление равномерной нормированной последовательности G'' низкочастотных компонент с учетом выявления скорректированных ограничений на локальное приращение, находится по следующему выражению:
V(G') =[(R-1) 1og2 (min(2 max (hr}; d))] + 1. (11)
1 < r < R
Минимальное количество избыточности S(G')min относительно исходной последовательности низкочастотных компонент, которое сокращается в результате нормирования по первой компоненте, выявления скорректированных ограничений на локальное приращение и рассмотрения апертуры как перестановки с повторениями с двумя спецификациями, оценивается по формуле
S(G')min
V(G) - V(G")min V(G)
x 100 %
Здесь V(G) - максимальное количество двоичных разрядов на представление последовательности низкочастотных компонент без нормировки и до выявления локальных приращений, равное
V(G) = [Rl0g2DCmax] + 1,
где DCmax - максимальное значение низкочастотной компоненты в векторе G до нормирования.
Тогда с учетом выражения (11) получим следующее соотношение для оценки минимального количества избыточности S(G')min относительно исходной последовательности низкочастотных компонент, которое сокращается в результате нормирования по первой
55
компоненте, выявления скорректированных ограничений на локальное приращение и рассмотрения апертуры как перестановки с повторениями с двумя спецификациями, а именно:
S(G')mn=(1
[(R -1) 1og2(min(2 max {hr}; d))]+1
1 < r < R
[R1og2DCmax] + 1
) 100%.
Здесь R - длина последовательности низкочастотных компонент.
Поскольку выполняется неравенство
DCmax < d < min(2 max {hr}; d))
1 < r < R
то минимальное устраняемое количество избыточности будет всегда больше нулевого уровня, т.е. S(G')mm >>> 0.
Количество устраняемой избыточности объясняется: выявлением статистических закономерностей, обусловленных когерентностью соседних сегментов изображений; выявлением структурных ограничений на локальное приращение; коррекцией локального приращения относительно высоты апертуры.
3. Выводы
1. Обоснована эффективность нормированной последовательности низкочастотных компонент в виде апертуры с выявленными скорректированными локальными приращениями между элементами. Здесь обеспечивается устранения избыточности без потери информации с учетом: относительно незначительных изменений между DC-компонентами соседних линеаризированных трансформант в случае обработки слабонасыщенных сегментов изображений; наличия компенсации при резких перепадах между DC-компонентами, что характерно для ЛТ, соответствующих сегментам насыщенных изображений.
2. Разработана математическая модель для оценки информативности структурного описания трансформанты, базирующаяся на том, что апертура равномерной длины, построенная для нормированных низкоча-
стотных компонент, является комбинаторным объектом, а именно перестановкой с повторениями по R элементов, динамические диапазоны которых определяются в соответствии с условиями нормирования по первой низкочастотной компоненте и выявления скорректированных локальных приращений между смежными элементами апертуры.
Научная новизна. Впервые разработана математическая модель для оценки информативности линеаризированной трансформанты. Отличительные характеристики модели состоят в том, что последовательность низкочастотных компонент представляется комбинаторным объектом, а именно перестановкой с повторениями, динамические диапазоны которых определяются в соответствии с условиями нормирования по первой низкочастотной компоненте и выявления скорректированных локальных приращений между смежными элементами апертуры. Это позволяет оценить нижнюю границу эффективности компрессии сегментов изображений.
Литература: 1. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов / В.Г. Олифер, Н.А. Олифер. СПб.: Питер, 2006. 958 с. 2. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. М.: Техносфера, 2005. 1072 с. 3. Баранник В.В. Кодирование трансформированных изображений в инфоком-муникационных системах / В.В. Баранник, В.П. Поляков. Х.: ХУПС, 2010. 212 с. 4. Баранник В.В. Информативная модель двухадического представления апертурных видеоданных с адаптивным приращением / В.В. Баранник, Д.С. Кальченко // Сучасна спеціальна техніка. 2011. №4(27). С. 23-29. 5. Баранник В.В. Модель оценки информативности двухосновного позиционного представления с фиксированным приращением / В. В. Баранник, Д. С. Каль-ченко // Збірник наукових праць Харківського університету Повітряних Сил. Х.: ХУПС. 2011. Вип. 3 (29). С. 81 - 89.
Поступила в редколлегию 05.01.2013
Рецензент: д-р техн.наук, профессор Баранник В.В.
Туренко Сергей Викторович, аспирант ХНУРЭ. Научные интересы: обработка и передача информации. Адрес: Украина, 61023, Харьков, ул. Ленина, 14.
56
РИ, 2013, № 2