УДК 621.327:681.5
В.В.БАРАННИК, А.А.КРАСНОРУЦКИЙ
ТЕХНОЛОГИЯ КОДИРОВАНИЯ ТРАНСФОРМАНТ ДЛЯ ДОСТАВКИ ВИДЕОПОТОКА В ИНФОКОММУНИКАЦИЯХ
Обосновывается направления совершенствования технологии сжатия бинарного описания трансформант в рамках позиционного структурно-весового кодирования последовательностей одномерных длин серий двоичных областей. Излагается формирование условий эффективного совершенствования позиционного структурно-весового кодирования для обработки массивов длин серий двоичных элементов бинарного описания трансформант. Рассматриваются особенности реализации технологии позиционного структурновесового кодирования бинаризированной трансформанты. Ключевые слова: позиционное структурно-весовое кодирование, трансформанта.
Введение
Телекоммуникационные системы в сфере предоставления информационных услуг характеризуются необходимостью обеспечивать обмен видеотрафика на значительные расстояния. При этом характеристики сети являются неоднородными и динамично изменяющимися. Это обуславливает актуальность тематики исследований, связанной с контролем битовой скорости видеоинформационного потока [1 - 3]. В этой связи ключевым механизмом является технология снижения интенсивности битового потока в условиях сохранения заданного уровня информационного содержания [4]. В работе [5] описывается направление, основанное на компактном представлении трансформант, представленных в бинарном виде. Для сокращения избыточности в таких трансформантах предлагается использовать позиционное структурно-весовое кодирование. В этом случае требуется обеспечить следующие условия: исключить неконтролируемые потери информации о двоичных объектах бинарного описания трансформант; сократить количество служебной информации, необходимой для устранения неконтролируемых потерь информации; снизить количество операций для реализации технологии кодирования бинаризированой обработки трансформант. Поэтому цель исследований - создать методологию совершенствования структурновесового кодирования бинаризированных трансформант.
1. Анализ методов совершенствования эффективности использования систем
компрессии на базе позиционного структурно-весового кодирования
Для повышения эффективности использования систем компрессии относительно качества предоставления видеоинформационных услуг необходимо совершенствовать технологию кодирования бинарного описания трансформанты. Такое совершенствование заключаются в том, чтобы:
1) снизить битовую скорость компрессионного потока для заданных: уровня качества визуального восприятия рассжатых изображений; длины кодового слова (локально-равномерный принцип); количества служебных данных, определяемого минимально необходимым количеством для проведения кодирования;
2) уменьшить время задержки на кодирование битового представления трансформант путем сокращения количества операций на обработку трансформант за счет выявления закономерностей в смежных процедурах кодирования.
2. Особенности реализации технологии позиционного структурно-весового
кодирования бинаризированной трансформанты
Первая особенность. Позиционные структурно-весовые (ПСВ) числа A(p) строятся на основе отдельных столбцов массива Ak,u длин бинарных серий, т. е. Aku ^ {A(1),... ,A(p),... ,A(P)}. Здесь ПСВ число A(p)
определяется в зависимости от
индекса столбца p следующим образом:
92
A(p) =
,1 s,p,--->1 S,p}’ ^ p - P -1;
,1 s,p,...,1 s',p}, ^ p = P.
Величина s' в данной формуле является количеством элементов в последнем столбце массива Aku . Тогда в соответствии с формулой для кодового отображения полиадического числа строятся р позиционных структурно-весовых кодов {Ci,....,Cp,...,Cp}:
Сі = Z1 s,1 П g Y ;
s=1 Y=s+1
Сp = Z1 s,p IT g
s=1 Y=s+1
Y
СР = Z1 s,P П g
s=1 Y=s+1
Y
Вторая особенность. Схема кодирования ПСВ чисел реализуется по принципу формирования весовых коэффициентов старших элементов. Кодирование проводится для старшего элемента относительно необработанных элементов ПСВ числа. Отсюда для исключения случаев неконтролируемой потери информации организуются следующие принципы обработки:
1) длина S ПСВ числа выбирается из расчета непереполнения кодового слова максимально допустимой длины Vmax. Величина S определяется по формуле
S = Vmax / ([1og2nm]+1) . Здесь n Xm - линейные размеры бинарных плоскостей трансформанты, n - количество столбцов, а m - количество строк. Это позволяет сформировать столбцы массива длин бинарных серий так, что количество V(Cp)c разрядов не
превысит максимально допустимую длину кода V(Cp)c - S([1og2m n]+1) - Vmax;
2) кодовое слово формируется по локально-равномерному (сегментно-неравномерному) принципу на основе информации о векторе G оснований ПСВ числа. Тогда максимальное количество бит, необходимое на представление кода ПСВ чисел, элементы которых соответствуют системе оснований G, gs = max {1 }+1, будет равно
1<p<p' ,p S
v(max)c = [1og2 (Пgs -1)] +1.
s=1
Отсюда длина Vc кодового слова для одного кода ПСВ числа по локально-равномерному принципу вычисляется по формуле Vc = [1og2 (g1 W1 -1)]+1. С одной стороны, данные подходы позволяют компактно представить последовательности длин бинарных серий и исключить неконтролируемые потери информации из-за переполнения кодового слова максимально допустимой длины. Однако с другой стороны, существующие принципы реализации ПСВ кодирования имеют недостатки, влияющие на избыточность, что приводит к повышению битовой скорости сжатого представления трансформанты.
3. Формирование методологической базы реализации структурно-весового кодирования
Первый недостаток. В случае ограниченного значения максимально допустимой длины Vmax кодового слова длина S столбца массива длин бинарных серий будет сокращаться. Отсюда образуется большое количество равномерных кодов для ПСВ чисел равномерной и ограниченной длины, т.е. S = ranst ^ min , а P ^ max .
Рассмотрим, как такое условие повлияет на величину битовой скорости. Допустим, что
на обработку поступают два ПСВ числа A(1) = {1 1} и A(2) ={1 s,2} , длиной S элементов и
системой оснований G={g1,...,gs,...,gS} . Формируются два ПСВ кода, а именно
С1 = Z1 s,1 П gy и С2 = Z1 s,2 П gy .
s=1 Y=s+1 s=1 Y=s+1
93
В условиях существующего принципа кодообразования суммарная длина V1;2 кодовых слов (битовая скорость) будет равна V12 = V(C1)c + V(C2)c = 2Vc (бит). Допустим теперь, что на основе двух ПСВ чисел образуется одно число, длиной S'=Si + S2 и системой
оснований G'={gi,...,gs,...,gs,gi,...,gs,...,gs}.
Другими словами, формируется ПСВ число Аі,2 с расширенной системой оснований G'. Согласно соотношению для определения кодового отображение С p полиадического числа значение его кода С1,2 будет равно:
С1,2 = ( 21 s,1 П gу)Пgу + 21 s,2 П gy = С1 g1W1 + C2 .
s=1 y=s+1 Y=1 s=1 y=s+1
S
Здесь giWi = П g Y .
Y=1
Количество Vi,2 двоичных разрядов на представление кода Сі,2 в расширенной системе оснований G' будет равно Vi,2 = [-^2(С^^1 + С2)]+1.
Без потери общности можно допустить, что Сі Ф 0. Тогда с учетом соотношения Сp < (Пgs) - 1 будет выполняться неравенство С2 < g1W1, величина V1/,2 оцениваться как V^1- [^(С^^)]+1 = [log2Сі + 1og2giWi)]+1.
Поскольку Vc = [1og2(g1W1 -1)] +1, то V1,2 ~ [1^2С1] + 1 + Vc = ^С0 + Vc (бит).
В то же время по существующему условию кодообразования выполняется неравенство
[log 2 Сі] + 1 < Vc, следовательно, V(,2 < 2Vc = V12 . Значит, в результате формирования расширенного ПСВ числа достигается снижение битовой скорости.
Вид такой структурной избыточности обусловлен неравномерностью размеров структурных составляющих бинарного представления трансформанты. А вот в результате существующего принципа формирования ПСВ чисел и выбора длины кодового слова такой
вид избыточности сокращается не полностью. Количество Rv избыточности равно Rv = V(v)'. -v Vc, где V(v)'. - длина кодового слова расширенного ПСВ числа, включающего v -е количество исходных ПСВ чисел; v Vc - суммарный объем v кодовых слов, сформированных для исходных ПСВ чисел по отдельности.
На рисунке показана оценка битовой скорости vc сжатого описания сегмента с учетом дополнительных затрат на представление максимальной длины бинарной серии и наличия неустраненной структурной избыточности.
300
250
200
150
100
50
0
v
c
0,4<r<0,7
0,8<r<0,9 r>0,95
■ 30дБ__________■ 50 дБ
r
Зависимость величины Vc от уровня искажений
94
Расширение длины ПСВ чисел проводилось из условия заданной длины кодового слова, равного 64 бит. Анализ результатов исследований, приведенных в виде диаграмм на рисунке, позволяет заключить, что использование кодообразования для расширенного ПСВ числа обеспечит сокращение битовой скорости компактно представленного сегмента изображения в среднем на 20 - 50% в зависимости от степени насыщенности и уровня внесенных искажений.
Значит, формирование единого кода для расширенного ПСВ числа имеет потенциал для дополнительного снижения битовой скорости сжатого представления. Для повышения количества устраняемой структурной избыточности необходимо разработать механизм расширения длины ПСВ числа, для которого будет формироваться единый код.
Второй недостаток. Как показывает анализ выражения для вычисления среднего количества v(max)b бит на один элемент, ДСТ зависит от длины выявляемой бинарной серии.
С ростом длины 1s,p бинарной серии снижается среднее количество v(max)b бит сжатого представления, приходящегося на один элемент двоичного формата трансформанты, т.е.
повышается степень сжатия
v(max)b ~
1
1
s,p
Для увеличения длины бинарной серии необходимо учитывать наличие структур нулевых элементов, включающих несколько битовых плоскостей ДСТ. Например, такая ситуация проявляется для старших битовых плоскостей, соответствующих высокочастотным компонентам. В то же время для существующего принципа образования длины кодового слова необходимо накладывать ограничения на размеры областей, в которых допускается выявление бинарной серии. Выявление бинарной серии ограничено пределами отдельных
битовых плоскостей ДСТ, т.е. 1 s,p < nXm . Соответственно это приводит к наличию структурной избыточности, обусловленной дроблением серий нулевых элементов ДСТ. В свою очередь, это приводит к снижению степени сжатия.
Если снять ограничения на области выявления серий, то их длина 1 может превышать размеры двоичных плоскостей и принимать значения в диапазоне 1 < 1 < d n m, где d -количество битовых плоскостей для ДСТ. В этом случае для определения длины S столбца массива ДБС в условиях, когда длина кодового слова выбирается по принципу непревышения максимально допустимой длины Vmax , используется выражение
S = Vmax/([1og21 max]+1). Здесь 1 max - максимальная длина бинарной серии, выявленная для ДСТ. Отсюда следует, что:
- для правильного определения длины кодового слова на приемной стороне необходимо дополнительно передавать информацию о величине 1 max, что приводит к увеличению объема сжатого представления трансформанты;
- если 1 max > nm, то длина ПСВ числа будет сокращаться, а количество р соответственно будет увеличиваться, т.е. S < Vmax / ([1og2nm]+1). Это повлечет за собой увеличение количества ПСВ кодов и, как следствие, рост избыточности Rv, обусловленной ограниченным учетом структурной неравномерности ДСТ.
Для устранения таких недостатков в условиях формирования кодовых слов равномерной длины необходимо отказаться от принципа построения ПСВ чисел равномерной длины. Это позволит формировать кодовые слова для ПСВ чисел, содержащих от одного до
S(P -1)+s/ элементов массива бинарных серий. Длина D ПСВ числа будет неравномерной и изменяться в пределах 1 < D < S(P — 1)+s/, где S(P — 1) - количество элементов в
полных столбцах массива длин бинарных серий; s' - количество элементов в последнем столбце.
95
Принцип выбора неравномерной длины ПСВ числа позволит создать потенциал для одновременного снятия ограничений на области выявления бинарных серий и на линейный размер массива ДБС.
Третий недостаток. Существующий принцип кодообразования заключается в формировании кодового слова, длина которого не должна превышать максимально допустимую
длину Vmax . Однако часто для прикладных областей существует необходимость формировать кодовое слово с заранее заданной длиной Vic. Такая ситуация возможна, когда:
1) требуется заполнить информационную часть заданной длины пакета;
2) жестко прописывается длина кода, исходя из: особенностей вычислительного процесса; особенностей обеспечения заданной битовой скорости; обеспечения равномерной длины кода для всех сегментов изображения.
В условиях существующего принципа кодообразования для реализации такого требования необходимо выбирать длину V* кодового слова, равную Vmax, где Vmax = Vic. Только в этом случае можно обеспечить выполнение выдвинутого требования. Следовательно, выполняется условие: V" = Vmax = Vic. Но, с другой стороны, будет выполняться неравенство V" > S([1og2m n]+1). Отсюда формируется количество кодовой избыточности Rс, обусловленное несовместимостью (несоответствием) существующего принципа кодообразования для ПСВ чисел и требованием формирования заранее выбранной длины кодового слова. Это проявляется на этапах:
1) выбора равномерной длины ПСВ числа на базе столбца массива бинарных серий, что приводит к наличию кодовой разницы V" > S([1og2m n]+1);
2) выбора длины кодового слова для отдельных столбцов массива длин бинарных серий, что приводит к наличию кодовой разницы S ([1og2m n]+1) > Vc.
В результате появляется количество кодовой избыточности, вычисляемое как разность между длиной V" кодового слова в соответствии с требованием заранее выбранной длины и длиной Vc кодового слова, определяемой на базе существующего принципа кодообразования Rс = V" - Vc . (бит).
Обеспечить механизм заполнения кодового слова заданной длины означает сократить количество незначимых (нулевых) старших разрядов кодового слова. Такой принцип называется принципом кодообразования по максимальному заполнению кодового слова.
Четвертый недостаток. Существующий принцип кодообразования позволяет формировать кодовые слова равномерной длины только в пределах отдельных сегментов изображений. Между сегментами длины кодовых слов могут быть неравномерными. Длина Vc кодовых слов и их количество P определяется с помощью вектора оснований элементов ПСВ чисел и является заранее не известной на приемной стороне. Для каждой трансформанты, представленной в двоичном формате, строится свой вектор оснований G . Поэтому количество и длина кодовых слов для разных сегментов будут разными. Это приводит к
тому, что длина v(t)c кодовой конструкции т -го сегмента, формируемая на основе кодовых слов ПСВ чисел, будет неравномерной и заранее не известной, т.е. v(t)c = PT Vc T и v(t)c = var, где v(t)c - длина кодовой конструкции сжатого представления т -го сегмента; Рт - количество ПСВ чисел для т -го сегмента; Vc T - длина кодового слова ПСВ числа т -го сегмента.
Начальная позиция ф(т + 1; т)0 кодовой конструкции очередного (т +1) -го сегмента относительно начала кодовой конструкции текущего т -го сегмента определяется как Ф(т +1; т)о = vCOc +1.
Отсюда можно заключить, что правильное (безошибочное) определение границ кодовых конструкций сжатого представления сегментов зависит от безошибочности выявления
96
размеров и начальных позиций кодовых конструкций всех предшествующих сегментов. Начальная позиция ф(т)0 кодовой конструкции сжатого представления для т -го сегмента относительно начала сжатого представления всего изображения определяется по следующей формуле:
т-1
Ф(т)<> =1 + Z v©c
k=1
т-1
где Z v(^) - суммарный объем кодовых конструкций сжатого представления всех
%=1
сегментов, предшествующих т -му сегменту.
Таким образом, что ошибка в определении границ (размеров) кодовой конструкции хотя бы одного сегмента приводит к появлению искажений для определения границ кодовых конструкций сжатого представления всех последующих сегментов.
Вывод
1. Обоснована концептуальная основа метода сжатия трансформанты в двоичном представлении, базирующаяся на кодировании битового представления трансформанты с учетом выявленных закономерностей двоичных структур на основе позиционного структурновесового кодирования. В этом случае реализуется интегрированное представление взвешенных структурных составляющих двоичного формата трансформанты. При этом весовые характеристики структурных составляющих зависят от их позиционирования в ДСТ. Это позволяет учитывать неравномерность динамических диапазонов длин бинарных серий, расположенных в пределах как одной двоичной плоскости, так и в различных плоскостях ДСТ.
2. Построена технология ПСВ кодирования, которая обладает двумя механизмами компенсации влияния структурных особенностей двоичного формата трансформанты на количество бит сжатого представления, а именно: формирование длин для бинарных серий; построение системы оснований ПСВ числа для каждого массива длин бинарных серий. Это приводит к снижению битовой скорости сжатого представления ДСТ для различного структурного содержания двоичного формата трансформанты.
3. Сжатие изображений в результате позиционного структурно-весового кодирования достигается за счет сокращения следующих видов избыточности: структурной, обусловленной наличием бинарных серий в двоичном формате трансформанты; комбинаторной, вызванной наличием неравномерности в длинах бинарных серий, как для двоичных плоскостей, так и между ними.
Список литературы: 1. Аудиовизуальные системы связи и вещания: новые технологии третьего тысячелетия, задачи и проблемы внедрения в Украине / [О.В. Гофайзен, А.И. Ляхов, Н.К. Михалов и др.] // Праці УНДІРТ. 2000. № 3. С. 3-40. 2. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов. / В.Г. Олифер, Н.А. Олифер. СПб.: Питер, 2006. 958 с. 3. GonzalesR.C. Digital image processing / R.C. Gonzales, R.E. Woods. Prentice Inc. Upper Saddle River, New Jersey 2002. 779 p.
4. Баранник В. В. Кодирование трансформированных изображений в инфокоммуникационных системах / В.В. Баранник, В.П. Поляков. Х.: ХУПС, 2010. 212 с. 5. КрасноруцкийА.А. Обоснование проблемных сторон видеоинформационного обеспечения в системе поддержки и принятия решений / А.А. Красноруцкий, И.Е. Рогоза // Сучасна спеціальна техніка. 2012. №2. С. 22 - 30.
Поступила в редколлегию 23.11.2013
Баранник Владимир Викторович, д-р техн. наук, проф., начальник кафедры Харьковского университета Воздушных Сил им. Ивана Кожедуба. Научные интересы: технологии кодирования и обеспечения безопасности информации. Адрес: Украина, 61000, Харьков, Сумская, 77/79. [email protected].
Красноруцкий Андрей Александрович, инженер Харьковского университета Воздушных Сил им. Ивана Кожедуба. Научные интересы: технологии кодирования информации. Адрес: Украина, 61000, Харьков, Сумская, 77/79.
97