DQ1
ройств промышленной автоматики/ Грейнер Г.Р., Ильяшенко В.П., Май В.П., Первушин Н.Н., Токмакова Л.И. М.: Энергия, 1977. 384 С.
Поступила в редколлегию 12.11.2004
Рецензент: д-р техн. наук, проф. Краснодубец Л.А.
Орловский Игорь Анатольевич, канд. техн. наук, доцент кафедры электропривода и автоматизации про-
мышленных установок Запорожского национального технического университета. Научные интересы: интеллектуальные системы управления. Увлечения: туризм. Адрес: Украина, 69063, Запорожье, ул. Казачья, 49, кв. 25, тел.: 63-30-19, 69-83-85.
Стекленёв Сергей Владимирович, студент 5-го курса Запорожского национального технического университета. Адрес: Украина, 69069, Запорожье, ул. Жуковского, к.731.
УДК 621.391
ДВОИЧНОЕ ПОЛИАДИЧЕСКОЕ КОДИРОВАНИЕ ПО КОЛИЧЕСТВУ СЕРИЙ ЕДИНИЦ
БАРАННИК В.В., ЮДИНА.К_____________
Излагается двумерное однопризнаковое структурное кодирование двоичных данных по количеству серий единиц в полиадическом пространстве. Обосновывается, что дополнительный учет ограничений на количество серий единичных элементов в двоичных полиадических числах обеспечивает увеличение степени сжатия сообщений произвольного источника информации. Проводится оценка степени сжатия двоичных данных на основе разработанного кодирования.
Введение
Одно из направлений дальнейшего совершенствования телекоммуникационных систем связано с выполнением следующих требований [1, 2]:
— снижение времени обработки и передачи по каналам связи данных, полученных от различных источников информации с произвольной мощностью алфавита (изображения компьютерных и телевизионных цветовых моделей, различных графических форматов, изображения в спектральном виде, аудиосигналы, речь, текстовая информация);
— повышение степени достоверности данных, получаемых для последующего их анализа и принятия решения;
56
РИ, 2005, № 2
— сокращение финансовых затрат на закупку и модернизацию информационно-вычислительных систем.
Обеспечение выполнения указанных требований только на основе совершенствования технических средств невозможно. С одной стороны, это объясняется резким ростом объемов данных до порядка 105 бит, обрабатываемых в реальном времени. С другой — существующие возможности информационных систем характеризуются относительно ограниченными возможностями по быстродействию обработки и по пропускным способностям каналов связи [1, 2]. Поэтому актуальным является использование в телекоммуникационных системах подсистем сжатия, позволяющих сократить цифровые объемы данных без внесения погрешности.
1. Анализ известных методов сжатия без внесения погрешности
В настоящее время существует множество специальных и универсальных методов обработки. Специальные методы разработаны для сжатия сообщений от одного вида источника информации. Например, для сжатия видеоданных используются форматы JPEG 2000 и фрактальные методы, для сжатия аудиоданных - вокодеры с учетом предсказания и ортогональной обработки, для текстовой информации -LZW и его модификации. Основными недостатками таких методов являются: адаптация работы с конкретным источником информации; учет психовизуальных или психозвуковых свойств получателя; наибольшие степени сжатия (до 100 раз) достигаются за счет внесения погрешностей, что может привести к безвозвратной потере важной информации [1, 2]. Универсальные методы характеризуются возможностью сжатия данных без внесения погрешности. В связи с этим они используются для кодирования различных источников информации. В то же время основные недостатки универсальных методов состоят в: низких степенях сжатия ( в среднем в 1,7 раза); слабой помехоустойчивости сжатых данных к ошибкам в каналах связи (значение отношения сигнал/шум при вероятности ошибки 10-4 не превышает 5 дБ) [1 — 3]. Кроме того, одним из существенных недостатков известных методов является снижение степени сжатия при обработке двоичных данных (в среднем степень сжатия равна 1,5 раза). Это вызвано тем, что [1 — 3]:
—двоичные данные имеют меньшую статистическую избыточность по сравнению с данными с большей мощностью алфавита. В то же время существующие методы устраняют в основном статистическую избыточность (арифметическое кодирование, кодирование Хаффмана — Галлагера). При этом сами методы статистического кодирования имеют такие недостатки как неравномерность кодовых комбинаций, использование в некоторых случаях разделителей, возможность переполнения машинного слова;
— двоичные данные, полученные от различных источников информации, характеризуются ограниченными длинами серий нулей и единиц (в среднем длина серии равна 2 — 4 элементам). По этой причине неэффективными оказываются методы, использующие выявление длин серий (они могут привести к увеличению исходного объема данных в среднем на 20%). Значит, для повышения эффективности функционирования телекоммуникационных систем необходимо разрабатывать новые методы сжатия двоичных данных без внесения погрешности на основе устранения не только статистической, но и структурной избыточности.
2. Выбор направления разработки новых методов сжатия двоичных данных
Структурная избыточность исключается в результате выявления структурных закономерностей в двоичных последовательностях (одномерная последовательность, двумерный массив или трехмерная структура) по некоторому признаку. Суть такого кодирования заключается в формировании кода-номера всей двоичной последовательности с заданным значением структурного признака. Наиболее информативными структурными признаками являются вектор S запретов появления на определенной позиции единичного элемента (S={s; }, i=1,m; s; — признак запрета появления на i -й позиции единичного элемента; если Si = 0 , то на i -й позиции запрещено появление единицы, и наоборот) и количество серий единиц 9 в двоичной последовательности [4, 5]. Примеры двоичных последовательностей для разных значений 9 и для вектора S={1; 1; 1; 0; 1 } приведены в табл. 1.
Таблица 1
Структурные признаки
S
Индекс разряда 1 2 1 3 1
1 0 0 0 1 1 1
2 1 1 1 0 0 1
3 0 0 1 1 0 1
4 0 0 0 0 0 0
5 0 1 0 1 0 1
N (m, Л) 4 5 6 11 8
N(m, -Э) 6 1 7 0 10
Кодирование с учетом запретов на позиции единиц соответствует полиадическому представлению двоичных данных. В этом случае двоичное число рассматривается как полиадическое число, элементы которого принимают значения {0; 1} . Тогда основания двоичного полиадического числа находятся по формуле Xi = Si +1, где i=1,m . В этом случае позиции i, для которой запрещено появление 1, соответствует Xj =1 и S; = 0 . Пример кодов-номеров N(m, Л) для двоичных полиадических
РИ, 2005, № 2
57
чисел приведен в табл. 1. Достоинствами методов кодирования с учетом вектора ограничений S являются: относительно небольшое количество операций на обработку; возможность распараллеливания обработки; повышение степени сжатия k сж с ростом количества позиций с запретом появления единичных элементов. Основным недостатком такого кодирования является резкое снижение степени сжатия при уменьшении количества запретов на появление единичных элементов и при увеличении длины двоичной последовательности. Степень сжатия в зависимости от степени насыщенности единичными элементами изменяется от 1,2 до 2,5 раза.
Достоинствами кодирования данных с учетом ограниченного количества серий единиц 9 являются: уменьшение зависимости степени сжатия от закона распределения и от длины серии одинаковых двоичных элементов; возможность повышения степени сжатия с увеличением единичных элементов и с ростом длины двоичной последовательности; относительно небольшое количество операций на нахождение количества серий единиц. В то же время основными недостатками являются: отсутствие параллельной схемы кодирования; возможность уменьшения степени сжатия даже при уменьшении единичных элементов. Степень сжатия в зависимости от количества серий единиц изменяется от 1,3 до 3 раз. Пример кодов-номеров N(m, О) для двоичных последовательностей с различным количеством серий единиц Q показан в табл. 1.
Из анализа табл. 1 вытекает, что существуют двоичные последовательности, для которых выполняется неравенство N (m, Л) < N (m, О), и наоборот N(m, Л) > N(m, О) . Отсюда следует, что для повышения степени сжатия двоичных данных без внесения погрешности и снижения времени обработки требуется сформировать двоичные массивы и разработать кодирование, учитывающее одновременно закономерности в направлении столбцов по количеству серий единиц, а в направлении строк —
а б в
Рис. 1. Пример запрещенных комбинаций для m = 5 , S4 = 0 : а — общая схема выделения двух рабочих зон, состоящих соответственно из трех и одного двоичного элемента m^ = 3 и m2 =1; б — примеры запрещенных двоичных последовательностей с количеством серий, равным 9 = 1; в — примеры запрещенных двоичных последовательностей с количеством серий, равным 9 = 2
на позиции с возможным появлением единичного элемента:
0 < a;j < Si; Si = max{aij} ; aij; si є {0;1} ; (1) 1< j< n
v (aij)i=im =Sj, (2)
где aij — ij -й элемент двоичного массива; max {aij}
1< j< n
— оператор вычисления ограничения на позиции с возможным появлением единиц; О j — количество серий единиц для j -го столбца; v (a^_j~m — оператор вычисления количества серий единиц для столбцов двоичного массива.
Оператор вычисления количества серий единиц для j -го столбца двоичного массива задается следующей системой:
— на нулевом шаге a0,j = 0 ; 00j = 0;
— на i -м шаге значение числа серий увеличивается на 1, &ij =&i_1,j +1, если ai_1,j < aij;
— в противном случае Oij + 0 , если
ai-1,j - aij;
—для конечного шага при i=m получаем искомое значение количества серий единиц Оj =&ij для j -го столбца.
Таким образом, цель исследования заключается в разработке кодирования двоичных данных, на которые одновременно наложены ограничения на количество единичных серий и на позиции с запретом появления элементов, равных 1.
3. Обоснование возможности дополнительного сокращения структурной избыточности
Для обоснования того, что за счет выявления закономерностей по количеству серий единиц в полиадическом пространстве осуществляется дополнительное сокращение избыточности, необходимо доказать неравенства:
V(m, Л, 0) < V(m, Л); (3)
V(m, Л, 0) < V(m, 0), (4)
где V(m, Л), V(m, О), V(m, Л, О) — множества двоичных последовательностей, удовлетворяющих со -ответственно ограничениям на позиции единиц, на количество серий единиц и на количество серий единиц в полиадическом пространстве.
Для доказательства неравенства (3) необходимо показать, что выполняется соотношение
Т(m,Л,Оk) П *(m,Л,Эи) = 0 , (5)
где k, и = 0, 0max; k ф и , т.е. обосновать взаимонезависимость множеств двоичных последовательностей в полиадическом пространстве, полученных
для разных значений признаков % и 0и (где % , О и — количество серий единиц соответственно для
РИ, 2005, № 2
yz =1 Ш1 = 3
__Запретная
зона
- = 2 ш 2 =1
0 0 0
0 0 0
0 0 1
1 1 1
0 1 0
0 1 1
1 0 0
0 0 0
1 1 1
1 0 1
58
k -й и u -й двоичных последовательностей, Smax — максимальное количество серий единиц, которое может содержаться в двоичной последовательности
длиной m элементов, &max = [—— ]).
Действительно, соотношение (5) выполняется, поскольку выполняется условие взаимонезависимости для различных однопризнаковых множеств без ограничений на возможные позиции единиц [4, 5]:
¥(m,%) П ^(m,К) = 0 , (6)
где k,u = max ; k * u •
Поскольку условие (6) выполняется для произвольных ограничений на позиции единиц, то оно также будет выполняться в условиях наложения конкретных ограничений (соотношение (5)).
Из взаимонезависимости множеств Т (m, Л, %) следует, что они являются слагаемыми множества полиадических чисел Y (m, Л), причем знак равенства в выражении (3) будет стоять тогда, когда наложены запреты на появление единиц для всех позиций. Неравенство (3) доказано.
Рассмотрим доказательство неравенства (4). Двоичная последовательность будет принадлежать множеству Т (m, Л, &) тогда, когда через заданную позицию с X; =1 (s; = 0) не будет проходить серия единиц, т.е. полиадические ограничения трактуются как запрет появления единиц на определенной позиции. Значит, на расположение серий единичных элементов накладываются дополнительные запреты, задаваемые полиадическими ограничениями 0 < а; <Х; -1. Отсюда следует выполнение неравенства (4). Знак равенства в соотношении (4) будет тогда, когда для всех позиций разрешено появление единичных элементов. Примеры запрещенных двоичных последовательностей показаны на рис. 1.
4. Разработка кодирования двоичных полиадических чисел по ограниченному количеству серий единиц
Перед разработкой процесса кодирования дадим определение однопризнаковому двоичному полиадическому числу.
Определение 1. Множеством однопризнаковых двоичных последовательностей в полиадическом пространстве называется множество полиадических чисел с двоичным алфавитом, для которых значение структурного признака принимает заданное значение.
Определение 2. Однопризнаковым структурным кодированием двоичных данных в полиадическом пространстве называется система выражений, обеспечивающая формирование кода-номера двоичному полиадическому числу, элементы которого удовлетворяют заданному структурному признаку. (Система выражений, определяющая номер заданной
двоичной последовательности в множестве однопризнаковых полиадических чисел).
В нашем случае структурным признаком является количество серий единиц. Поэтому сформулируем следующие определения.
Определение 3. Множеством двоичных последовательностей в полиадическом пространстве по количеству серий единиц V(m, Л, S) называется пронумерованное множество двоичных последовательностей, содержащих заданное количество серий единиц, не проходящих через позиции с запретом единиц.
Для определения объема множества V(m, Л, S) докажем следующую теорему.
Теорема об объеме множества двоичных полиадических чисел по количеству серий единиц. Количество двоичных последовательностей, удовлетворяющих ограничениям (1) и (2), равно
K K Z
V(m,Л,S) = £ V(©(k)) = £ПV(4k), ©(k)) • (7)
k=1 k=1z=1 ’
V(4k), ©(k))
' mz +1 N
2&Zk)
z у
_________(mz +1)!__________
(2dZk))! (mz +1- 2^zk)), (8)
где 4k) — значение числа серий для z -й допустимой зоны двоичной последовательности A ( см. рис. 1, а); ©(k) — вектор, элементами которого является k-я комбинация количеств серий единиц ^zk) в допустимых зонах
©(k) ={Q(k),..., szk),_, , k = рк ; Z - количе-
ство допустимых зон в двоичной последовательности длиной m элементов; к — количество векторов ©(k) (количество комбинаций длиной Z, составленных из элементов &zk)); mz — количество двоичных элементов в z -й допустимой зоне; V (S zk), ©(k)) — количество допустимых двоичных последовательностей, полученных для z -й допустимой зоны по количеству серий единиц, равному ^zk) для вектора ©(k); V (©(k)) — количество допустимых двоичных последовательностей, полученное с учетом обработки всех Z допустимых зон
для k-го вектора значений величин ^k) .
Доказательство. Система полиадических ограничений делит исходную двоичную последовательность на допустимые и запрещенные зоны (см. рис. 1,а). Запрещенные зоны состоят из элементов, на позициях которых запрещено появление единицы,
т.е. X; =1. Допустимые зоны располагаются между запрещенными зонами и на их позициях допустимо появление единиц. Обозначим число допустимых
зон через Z, 0 < Z < [—2~], причем Z=0 , когда все элементы двоичной последовательности равны 0.
РИ, 2005, № 2
59
Пример множества V(m, Л, О) двоичных полиадических чисел по количеству серий единиц для m = 5, Л={2;2;2;1;2} и 0 = 1 приведен в табл. 2. Для данного примера количество допустимый зон равно
Таблица 2
а1 0 0 0 0 1 1 1
а2 0 0 1 1 0 1 1
а3 0 1 0 1 0 0 1
а4 0 0 0 0 0 0 0
а5 1 0 0 0 0 0 0
N(m, Л, 0) 0 1 2 3 4 5 6
Z=2, а запрещенная зона состоит из одного элемента а4 = 0.
Из комбинаторного анализа известно, что последовательности, удовлетворяющие условиям (9) и (10), являются Т -сочетаниями с повторениями из z элементов, с ограничениями на спецификации (10). Поскольку различные сочетания с повторениями отличаются хотя бы одним элементом, то множества щ (©(k)) являются взаимонезависимыми:
¥(©(k)) П ^(©(u)) = 0 , где k,u =1к , k ф u . (11)
Тогда согласно комбинаторной теореме сложения суммарное количество допустимых двоичных последовательностей V (m, Л, О) будет равно сумме объемов множеств щ (©(k)) по всем к :
V (m, Л, О) =Х V (©(k)), (12)
k=1
где V (©(k)) = ¥ (©(k))
Пример выполнения соотношений (11) и (12) иллюстрируется в табл. 2. Действительно,
В результате деструктуризации исходной последовательности на запрещенные и допустимые зоны исходное количество серий Т будет равняться сумме количеств серий единиц QZk) каждой допустимой зоны z :
3=E^k). (9)
z=1
Исходя из выражения (9) и особенностей формирования серий единиц значение величины &Zk) будет изменяться в интервале, задаваемом в виде неравенства
о <$Zk) ^ min{$;[—2^]}. (10)
Поскольку в общем случае количество серий единиц больше 0, то возможны несколько комбинаций ©(k), состоящих из величин &Zk), удовлетворяющих условиям (9) и (10). При этом комбинации ©(k) могут как содержать, так и не содержать допустимые последовательности. Для примера, рассмотренного в табл. 2, могут быть две комбинации векторов ©(k), k=2 : ©(1) ={й|1) = 0,^ =1} и ©(2) ={й(2) =1,8(22) = 0} . Для первой комбинации величин &Zk) соответствует одна допустимая последовательность (с номером 0 в табл. 2), а для второй комбинации — шесть последовательностей (с номерами от 1 до 6 в табл. 2). Обозначим множество допустимых двоичных последовательностей, соответствующих k -й комбинации величин &Zk) для отдельной z -й зоны, через щ (©(k), &Zk)). Тогда множество двоичных последовательностей для k -
й комбинации по всем зонам, z = 1, Z обозначим как Щ (©(k)).
¥(©(1)) П ^(©(2)) = 0 ,
V(5,Л, 1) = V (©(1)) + V (©(2)) = 1 + 6 = 7 .
Доказана левая часть соотношения (7). Для доказательства его правой части рассмотрим событие, состоящее в появлении двоичной последовательности длиной mZ элементов с количеством серий единиц, равным 4k). Тогда в соответствии со свойством деструктуризации исходной последовательности, заключающимся в рассмотрении каждой допустимой зоны в отдельности, следует, что для заданной комбинации ©(k) появление события, состоящего в том, что в допустимой зоне будет V(&Zk), ®(k)) двоичных последовательностей, не зависит от других допустимых зон. Поэтому в силу комбинаторной теоремы умножения количество допустимых последовательностей V(©(k)) по всем зонам k-й комбинации ©(k) ={o(k),...,&Zk),_,^Z^} равно
Z
V( ©(k)) = П V(^Zk), ©(k)). (13)
Z=1
Подставив выражение (13) в правую часть формулы (12), получим соотношение (7).
Поскольку ограничений на появление серий единиц в каждой допустимой зоне нет, то количество допустимых двоичных последовательностей в каждой зоне находится по формуле (8). Теорема доказана.
Доказанная теорема позволяет определить для заданных параметров m, Л и 9 объем V(m, Л, О) множества двоичных полиадических чисел по количеству серий единиц. Для формирования кода-номера конкретной двоичной последовательности необходимо разработать соответствующий процесс
60
РИ, 2005, № 2
кодирования двоичных полиадических чисел по количеству серий единиц.
Определение 4. Кодированием двоичных полиадических чисел по количеству серий единиц называется система выражений, позволяющих определить номер обрабатываемой последовательности в множестве двоичных полиадических чисел, содержащих заданное количество серий единиц.
Для разработки такого кодирования сформулируем и докажем теорему об однопризнаковой нумерации двоичных полиадических чисел по ограниченному количеству серий единиц..
Теорема о нумерации двоичных полиадических чисел по количеству серий единиц. Для двоичной
последовательности Aj ={а^ }i=j“m с выявленными
ограничениями на позиции единиц Л= { X; и на количество серий единиц 9 можно сформировать код-номер N (ш, Л, О), вычисляемый по формулам:
k—1
N(ш,Л,-Э) = ^ V (©й)) + N (©(k)) =
4=1
k—1 Z
= 2 v (© ®) + п N($Zk), ©(k));
§=1 z=1
mz
N(4k), ©(k)) = z aij (ri-1 - ri);
z=1
(14)
(15)
(Іц +1)
rj_1—-----—, если ai_1,j = aij;
ri-1
(І04+1)' (I24 +1) (I0§ +»
ес
ли ai_1,j Ф aij;
(16)
I00 - (mz +1) ; I10 - (mz +1 _ 2 &zkb ; I20 - 2 &zk) ;
r0 =
I00 !
I10 ! I20 !
ri =
I0i = (mz - і+i); I1i = (mz - і+i-Pij); I2i = Pij,
где pi = (ri_1 - ri) — весовой коэффициент ij -го элемента обрабатываемой последовательности, зависящий от значений mz и ^k); Pij — рекуррентный параметр, зависящий от числа серий нулей и единиц, а также от модуля разности значений двух соседних разрядов величины aij:
Pij = Pi-1,j _| ai—1,j _aij I ;
P0j — начальное значение параметра Pij, равно P0j = 2 4k); N(^zk), ©(k)) — код-номер двоичной последовательности, полученный для z -й допустимой зоны по количеству серий единиц, равных 9 zk) для вектора®(k); N( ©(k)) — значение кода-номера двоичной последовательности в множестве щ (©(k)), полученное с учетом обработки всех Z допустимых зон для k-го вектора значений величин ^k).
РИ, 2005, № 2
Замечание. Если N(&zk), ©(k)) = 0 , то эта величина вступает в формулу (14) не как сомножитель, а как слагаемое.
Доказательство. Поскольку множество V(m, Л, О) допустимых двоичных чисел состоит из подмножеств, образуемых для каждой комбинации @(k), то при нумерации конкретной последовательности необходимо установить порядок старшинства комбинаций величин ^k). Это объясняется зависимостью значения номера обрабатываемых данных от их принадлежности к множеству
щ (©(k)) и от количества предшествующих множеств. В качестве принципа старшинства предлагается использовать следующее лексикографическое
правило: из двух комбинаций @(k) и @(u) старшей является та, у которой старший элемент больше, т.е.
Nk > Nu, если для &(k) = -Э©), z =1,1
»£>, ><!• (17>
где Nk , Nu — номера комбинаций @(k) и @(u).
Без потери общности допустим, что обрабатываемая последовательность принадлежит k -й комбинации величин ^zk). Тогда для установленного принципа нумерации и в соответствии с соотношениями (11) и (17) значение кода-номера N (ш, Л, О) будет равняться
k—1
N(m,Л,-Э) =2 V (©®) + N (©(k)) (18)
4=1 ■ \ )
Например, рассмотрим двоичную последовательность A = (0;1;1;0;0) под номером 3 из табл. 2 для 0=1. Поскольку X 4 =1, то образуются две допустимые зоны. Значит, возможны две комбинации векторов ©(1) ={й(1) = 0,0 21) =1} и
©(2) ={й(2) =1, й22) = 0} . Данная двоичная последовательность принадлежит второй комбинации и
занимает в множестве Щ (©(2)) позицию под номером 2. Отсюда согласно выражению (18) ее код-номер равен N(m, Л, О) = 1 + 2=3 . Данное значение совпадает с номером в табл. 2.
Рассмотрим формирование кода-номера N( ©(k)) в пределах множества щ (©(k)). Поскольку формирование кода N( ©(k)) проводится по каждой z -й зоне независимо друг от друга, то в соответствии с выражением (13) выполняется равенство
Z
N(©(k)) =ПN(4k), ©(k)). (19)
z=1
Формула (19) указывает на то, что код-номер N( ©(k)) формируется на основе произведения кодов-номеров N(0®, ©(k)), полученных незави-
61
симо для каждой зоны. Значение кода-номера N(&Zk), ©(k)) вычисляется для случая кодирования по числу серий без ограничений на возможные позиции единиц на основе рекуррентной схемы, заданной выражениями (15) и (16). Физический смысл замечания трактуется как то, что если N(4k), ©(k)) = 0 , то количество допустимых комбинаций для z -й зоны отсутствует. И в этом случае значение N(&Zk), ©(k)) не влияет на величину N(©(k)). Теорема доказана.
Например, для последовательности A = (0; 1; 1; 0; 0) получаем две последовательности (0;1;1) и (0;). Значения кодов номеров этих последовательностей соответственно равны N(S(2), ©(2)) = 2 и N(&22), ©(2)) = 0 . Следовательно, в силу замечания 1 N(©(k)) = 2+0 = 2 .
Следствие. Из сравнительного анализа выражений (12) и (18) следует, что значение кода-номера N(m, Л, й) будет ограничено сверху величиной у(ш, Л, й):
— если i < ш, то переход на шаг 1;
—если i = ш+1, то процесс нахождения параметров кодирования считается завершенным и Z=Zi.
Этап 2. Вычисление количества серий единиц &Zk) для z -й зоны на основе значения mz :
— на нулевом шаге a0,j = 0 ; &0,j = 0;
— на i -м шаге значения числа серий увеличивается
на 1, =&i-1,j +1, если ai_1,j < aij;
— в противном случае &ij =^i-1,j + 0 , если ai-1,j - aij;
— для конечного шага при i = ш получаем искомое значение количества серий единиц &Zk) =^ij для j -го столбца.
Таким образом, система выражений (14) — (16) и двухэтапная схема вычисления параметров кодирования позволяют сформировать код-номер для двоичного полиадического числа по количеству серий единиц.
N(m, Л, й) < V(m, Л, Э). (20)
Вычисление параметров кодирования z , mz и &Zk) предлагается осуществлять на основе вектора
Л= {X; }i=1”m. Для этого необходимо выполнить
5. Экспериментальная оценка минимального коэффициента сжатия
В соответствии с соотношением (20) минимальное значение коэффициента сжатия kmin находится по формуле
два основных этапа. На первом этапе определить количество зон z и их размеров mz (количество двоичных элементов в каждой зоне). На втором этапе для известных значений mz найти величины
ozk).
Этап 1. Определение параметров кодирования Z и mz . Для этого выполняются следующие шаги:
Шаг 0. Определение начальных значений искомых параметров кодирования: X 0 = 0; Z = 0; z = 0 ; mz = 0 , i = 1.
Шаг 1. Вычисление значений параметров Zi и mz на i -м шаге обработки:
m
^og2 V(m, Л, й)*
(21)
где V(m, Л, й)* — среднее значение объема множества двоичных полиадических чисел по количеству серий единиц, получаемого в результате экспериментальной обработки реалистических изображений; ^og2V(m, Л, й)* — максимальное количество
разрядов, затрачиваемое на представление кода-номера для двоичного полиадического числа по количеству серий единиц.
Результаты обработки приведены на рис. 2. Здесь также приведены значения средней степени сжатия на основе энтропийного кодирования по алгоритму Хаффмана-Галлагера.
- если X<Хi , то
z = z +1; mz = mz +1;
Zi - Zi-1 +1 ;
— если X j_j =Xi, то Z; = Zi_i + 0 ; z = z + 0, а mz = mz +1 для ^ = 2 и mz = mz + 0 для X i =1;
k
— если X i_! >Xi , то Zi = Zi_1 + 0 ; z = z + 0, mz = mz + 0 , mz+1 = 0 .
Шаг 2. Переход на обработку очередного элемента i=i+ 1:
□ ХГ иш = 8 nm = 12 nm = 16
Рис. 2. Значение kmin , обеспечиваемое алгоритмом Хаффмана-
Галлагера и разработанным кодированием для m=8; 12; 16 и для изображений с разной степенью насыщенности
62
РИ, 2005, № 2
Анализ данных на рис. 2 показывает, что степень сжатия для разработанного кодирования превышает степень сжатия для алгоритма Хаффмана-Галла-гера в среднем в 1,6 раза.
Заключение
Из рассмотренного материала можно сделать следующие выводы:
1. Разработано кодирование двоичных полиадических чисел по количеству серий единиц без внесения погрешностей. В этом случае дополнительная степень сжатия достигается за счет учета запретов на позиции с возможным появлением единиц. При этом комбинации, у которых серии единиц проходят через такие позиции, являются запрещенными.
2. Минимальная степень сжатия по информационным кодовым комбинациям в зависимости от класса изображения и от длины последовательности принимает значения от 1,7 до 2,7 раза. Величина выигрыша по степени сжатия для разработанного кодирования относительно кодирования Хаффма-на-Галлагера в среднем равна 1,6 раза.
Литература: 1. Ватолин В.И., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ — МИФИ, 2002. 384 с. 2. Зубарев Ю.В., Дворкович В.П. Цифровая обработка телевизионных и компьютерных изображений. М.: Международный центр научной и технической информации, 1997. 212с. 3. Галлагер Р.Г. Адаптивный код Хаффмана // ТИИЭР. 1978. №6. С. 668-674. 4. Королев А.В. Верификационная избыточность изображений // ИУСЖТ. 2002. № 2. С. 26-30. 5. Королев А.В., Баранник В.В. Оценка количества информации изображения по числу серий одинаковых элементов // Системи обробки інформації. Харків: НАНУ, ПАНМ, ХВУ. 2002. Вип. 2 (18). С. 43-46.
Поступила в редколлегию 23.02.2005
Рецензент: д-р техн. наук, проф. Поляков П.Ф.
Баранник Владимир Викторович, канд. техн. наук, старший научный сотрудник научно-исследовательского отдела Харьковского университета Воздушных Сил. Научные интересы: обработка и передача информации. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79, тел. 704-96-71.
Юдин Александр Константинович, канд. техн. наук, доцент, заместитель директора института права и безопасности предприятия Европейского Университета, заведующий кафедрой комплексных систем защиты информации. Научные интересы: обработка и передача информации. Адрес: Украина, 03058, Киев, пр. Косм. Комарова, 1, тел. 8-044-276-58-01.
РИ, 2005, № 2
63