Научная статья на тему 'Показатели степени сжатия графической информации методом дифференциального цепного кодирования на основе оценки плотности структурных элементов изображений'

Показатели степени сжатия графической информации методом дифференциального цепного кодирования на основе оценки плотности структурных элементов изображений Текст научной статьи по специальности «Прочие технологии»

CC BY
320
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим технологиям , автор научной работы — Уфимкин А. Я.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Показатели степени сжатия графической информации методом дифференциального цепного кодирования на основе оценки плотности структурных элементов изображений»

Уфимкин А.Я.

ПОКАЗАТЕЛИ СТЕПЕНИ СЖАТИЯ ГРАФИЧЕСКОМ ИНФОРМАЦИИ МЕТОДОМ ДИФФЕРЕНЦИАЛЬНОГО ЦЕПНОГО КОДИРОВАНИЯ НА ОСНОВЕ ОЦЕНКИ ПЛОТНОСТИ СТРУКТУРНЫХ ЭЛЕМЕНТОВ ИЗОБРАЖЕНИЙ

В статье описаны результаты исследования возможностей сжатия графической информации методом дифференциального цепного кодирования на основе оценки плотности структурных элементов изображений. Учет особенностей графических изображений позволяет ввести меру сложности их пространственной структуры - плотность структурных элементов, которая непосредственно связана с характеристиками дифференциального цепного кода. Установлено, что эффективность кодирования и сжатия графических изображений определяется зависимостью, близкой к линейной, от плотности структурных элементов, а также найдены предельные значения показателей степени сжатия графической информации.

Передача графической информации по каналам связи телекоммуникационных систем характеризуется определенным противоречием между ограниченной пропускной способностью каналов связи и потенциально неограниченной информационной емкостью передаваемых данных, что не всегда позволяет обеспечить реальный масштаб времени их передачи. Поэтому задача разработки эффективных методов сжатия графической информации продолжает сохранять свою актуальность. Необходима разработка таких методов сжатия графической информации, которые учитывали бы специфику графических изображений (ГИ), проявляющуюся в таких их характерных особенностях, как способ их формирования, априорно определенные их характеристики и графические формы, используемые при их построении.

Наиболее важной особенностью ГИ является то, что они строятся в соответствии с вполне определенным планом их построения (ПП). Этот план пространственного характера может существовать в виде зрительного образа в сознании человека, создающего изображение, или в структурах данных программ машинной графики, синтезирующих это изображение, т.е. ГИ характеризуются наличием априорно заданной структурной организации в изображениях.

Другой особенностью ГИ является целенаправленность их создания как средства передачи графической информации. Воспроизводится только необходимая для передачи информация в графических формах, обеспечивающих простоту процесса визуального восприятия полученной информации и не допускающих неоднозначности ее интерпретации. Изображения объектов обобщаются и подвергаются стилизации. При этом системы условных обозначений изображаемых объектов, обеспечивают их воспроизведение в наглядно воспринимаемой образно-знаковой форме. Для наилучшего восприятия ГИ используется небольшое количество хорошо различаемых цветов или тонов. Таким образом, ГИ характеризуются жесткой регламентацией графических характеристик воспроизведения изображений.

Решение задачи эффективного сжатия ГИ может быть основано на использовании цепных кодов [3]. Для этого необходимо преобразовать ГИ в растровый рисунок, составленный из линий, представляющих собой линейные структурные элементы изображения и границы между его планарными структурными элементами, т.е., по существу, восстановить ПП ГИ. Точечные структурные элементы также присутствуют в изображении, но их доля в структуре изображения несоизмеримо меньше доли линейных элементов и границ и, соответственно, объем памяти, необходимый для их кодирования также несоизмеримо меньше объема памяти, необходимого для кодирования линейных элементов и границ.

Восстановить ПП ГИ можно за счет использования адаптивного цветотонового преобразования (АЦТП) [1] и последующего центроидного преобразования [2] изображений.

АЦТП обеспечивает возможность обработки цветных ГИ и достижение необходимых показателей качества последующей обработки полутоновых изображений и заключается в выделении на изображении связных цветовых областей и определении характерных цветов этих областей с последующим созданием пакета бинарных изображений, стратифицированного по выделенным характерным цветам изображения.

Установлено, что АЦТП в высокой степени подавляет шумы и обеспечивает при восстановлении цветного (полутонового) изображения более высокое качество воспроизведения ГИ по сравнению с исходным изображением за счет выравнивания цветовых (тоновых) контрастов [1].

Дальнейшая обработка центроидным фильтром заключается в центроидном преобразовании каждого полученного бинарного изображения и вычислении вектора центроида для каждого пиксела по результатам анализа его окрестности, а также вычислении производных величин, определяющих коды видов элементов по их графическим формам [2]. Установлено, что максимальные точность обнаружения и вероятность распознавания структурных элементов при использовании центроидной фильтрации достигаются на двухградационных черно-белых изображениях [2]. Установлено также, что центроидное преобразование обладает четко выраженными селективными свойствами по отношению к структурным элементам изображения и позволяет обнаруживать линейные структурные элементы и границы между планарными структурными элементами изображения [2]. В результате формируется рисунок на растре, составленный из линий однопиксельной толщины, соответствующий линейным структурным элементам и границам между планарными структурными элементами, сопровождаемый указанием кодов видов объектов, т.е. ПП ГИ.

Этот рисунок может быть подвергнут сегментированию - разделению на отдельные линейные сегменты, представляющие собой связные цепочки пикселов (толщиной в один пиксел), начинающиеся и заканчивающие в узлах и не содержащие в себе других узлов, т.е. «от узла до узла». Для кодирования таких линейных сегментов удобно использовать цепные коды [3].

Простейший 8-связный цепной код ЦК-8 образуется путем кодирования переходов из текущего пиксела цепочки в один из смежных пикселов. Посколь ку количество смежных пикселов всегда равно восьми, то каждый переход можно закодировать тремя битами. Однако более эффективным является 8-связный 3-позиционный дифференциальный цепной код ДЦК-8/3 (см. рис. 1).

1(01) 0(00)

ж

2(10)

1(01)

0(00)

2(10)

Рис. 1. 8-связный 3-позиционный дифференциальный цепной код (ДЦК-8/3)

Код ДЦК-8/3 предусматривает кодирование перехода с текущего пиксела сегмента на последующий его пиксел в следующем виде:

- код 0 0 - в том случае, если направление перехода совпадает с направлением предыдущего перехода (движение вперед);

- код 01 - в том случае, если направление перехода отличается от направления предыдущего перехода на величину +90 градусов (полуповорот налево);

- код 10 - в том случае, если направление перехода отличается от направления предыдущего перехода на величину -90 градусов (полуповорот направо);

- код 11 - признак окончания кодовой последовательности (при достижении конечного пиксела сегмента на предыдущем переходе).

Таким образом, каждый переход с текущего пиксела сегмента на последующий его пиксел в коде ДЦК-8/3 кодируется двумя битами; поэтому такая схема кодирования называется двухбитной - ДЦК-8/3(2). Следует заметить, что при использовании кода ДЦК-8/3 точки излома, в которых совершается переход по направлению, отличающемуся от направления предыдущего перехода по абсолютной величине на величину, большую 90 градусов, являются узлами. Этим обеспечивается разделение линейных структурных элементов и границ между планарными структурными элементами на гладкие сегменты.

Кодовая последовательность ДЦК-8/3(2) для каждого сегмента, состоящего из l пикселов, имеет следующий вид:

- код вида объекта - 8 бит (1 байт);

- координаты начального пиксела сегмента - 32 бита (2+2=4 байта);

- переход с начального пиксела сегмента на последующий его пиксел, представленный в коде ЦК-8, -3 бита;

- собственная последовательность переходов с текущего пиксела сегмента на последующий его

пиксел, представленных в коде ДЦК-8/3(2), - 2 (l — 2) бита;

- код 11 - признак окончания кодовой последовательности - 2 бита.

Таким образом, длина кодовой последовательности для сегмента, состоящего из l пикселов, составляет:

к2 = 2(/ - 2) + 45 бит. (1)

Эффективность кода ДЦК-8/3 может быть повышена за счет перехода к полуторабитной схеме - ДЦК-8/3(1.5). Код ДЦК-8/3(1.5) предусматривает кодирование перехода с текущего пиксела сегмента на последующий его пиксел в следующем виде:

- код 0 - в том случае, если направление перехода совпадает с направлением предыдущего перехода (движение вперед);

- код 1 - в том случае, если направление перехода отличается от направления предыдущего перехода на величину 90 градусов (полуповорот налево или полуповорот направо); при этом следующий элемент кодовой последовательности принимает значение:

- код 0 - в том случае, если направление перехода отличается от направления предыдущего перехода на величину +90 градусов (полуповорот направо);

- код 1 - в том случае, если направление перехода отличается от направления предыдущего перехода на величину -90 градусов (полуповорот налево);

Таким образом, каждый переход с текущего пиксела сегмента на последующий его пиксел в коде ДЦК-8/3 кодируется в среднем двумя битами.

В этом случае кодовая последовательность ДЦК-8/3(1.5) для каждого сегмента, состоящего из l пикселов, имеет следующий вид:

- код вида объекта - 8 бит (1 байт);

- координаты начального пиксела сегмента - 32 бита (2+2=4 байта);

- переход с начального пиксела сегмента на последующий его пиксел, представленный в коде ЦК-8, -3 бита;

- количество последующих переходов с текущего пиксела сегмента на последующий его пиксел - (l — 2)

- 16 бит (2 байта);

- собственная последовательность переходов с текущего пиксела сегмента на последующий его пиксел, представленных в коде ДЦК-8/3(1.5), - 1. 5(l—2) бита .

Таким образом, длина кодовой последовательности для сегмента, состоящего из l пикселов, составляет:

= 1.5 (/ — 2) + 56 бит. (2)

Для дальнейшего анализа необходимо рассмотреть характеристики изображения на материальном носителе (бумаге). Если размеры изображения M (ширина изображения; мм) и N (высота изображения; мм), то естественными представляются следующие нормативы:

- минимальная ширина линейных условных знаков, графически воспроизводящих линейные СЭ, -

Ятп = О.1 мм;

- максимальная ширина линейных условных знаков, графически воспроизводящих линейные СЭ, -Hmax = 10 мм;

- средняя ширина линейных условных знаков, графически воспроизводящих линейные СЭ, -

н_

2

- минимальная длина линейных условных знаков средней ширины и границ между планарными условными знаками, графически воспроизводящими планарные СЭ;

¿min = 5Ho = 2.75 мм. (3)

При этом площадь изображения составляет M х N мм2.

Кроме того, для четкого различения линейных условных знаков и границ между планарными условными знаками необходимо установить некоторое минимальное расстояние между ними. Для этого определяется сегрегат (односторонняя зона отчуждения) линейного условного знака или границы между планарными условными знаками. Эта зона ограничивается траекторией расположения линейного условного знака или границы между планарными условными знаками и эквидистантой на некотором расстоянии от них. Таким образом, каждый линейный условный знак и каждая граница между планарными условными знаками окаймлены двумя сегрегатами. При этом сегрегаты двух условных знаков, двух границ или условного знака и границы не пересекаются. Естественным представляется значение ширины сегрегата, составляющее 3 средних ширины линейных условных знаков, т.е. S = 3Н0 = 1.65 мм.

Для получения цифрового растрового изображения (формат - *.bmp Truecolor, 256 градаций уровней

яркости в каждом из 3-х цветовых каналов RGB, по 3 байта на пиксел) необходимо задать разрешение,

Ho = mn _ max = 0.55

обеспечивающее достаточное качество воспроизведения ГИ. Для нормального воспроизведения минимальной ширины линейных условных знаков необходимо 3 пиксела (750 dpi, 30 мм-1,); соответственно, размер пиксела составляет - 0.33 мм. Более высокое разрешение является избыточным и приводит к увеличению размеров растра и, соответственно, к увеличению объема памяти, необходимого для представления цифрового изображения. В этом случае целесообразно уменьшить размер растра, соответствующим образом масштабируя изображение.

М

Отсюда размеры изображения в пикселах - т (ширина) и т (высота), где т = ^ = 3М ,

N 2

п = ^ =3N. При этом площадь изображения в пикселах составит величину тх п = 3 .М^ = 9MN .

Объем памяти, необходимый для представления цифрового изображения составит V = 3х 9MN = 27MN байт или V = 8х 27М¥ = 216М¥ бит.

Указанные выше нормативы для растрового изображения примут следующие значения:

- 0.55

- средняя ширина линейного условного знака пикселах - ^ ^ = 1./ ;

- длина линейного условного знака средней ширины и границы между планарными условными знаками в пикселах для сегмента длины 0 на изображении, ориентированного преимущественно в горизонтальном или

вертикальном направлении - I- =----------= 3Ь ;

0.33

- длина линейного условного знака средней ширины и границы между планарными условными знаками в пикселах для сегмента длины Ь на изображении, ориентированного преимущественно в диагональном

/ ^^/2

направлении - 1тс,^ =------= 4.20 ;

тах 0.33

- средняя длина линейного условного знака средней ширины и границы между планарными условными знаками в пикселах для сегмента длины Ь :

(3 + 4.2) Ь

к =±-------!— = 3.60 ; (4)

0 2

- минимальная длина линейного условного знака средней ширины и границы между планарными условными знаками в пикселах:

2.75

/0тт = 033 = 8.25; (5)

- ширина сегрегата в пикселах - ---------= 4.95 ;

0.33

- средняя площадь на изображении, занимаемая линейным условным знаком средней ширины или границей между планарными условными знаками вместе с сегрегатами, в пикселах - р0 =(1.7 + 2х4.95)х 10 = 21.20,;

- средняя площадь на изображении, занимаемая линейным условным знаком средней ширины и минимальной длины или границей минимальной длины между планарными условными знаками вместе с сегрегатами, в

пикселах - Р0т„ = 21.2Ьтт = 58.3 .

Отсюда можно определить величину плотности структурных элементов изображения как отношение суммарной площади на изображении, занимаемой линейными условными знаками средней ширины и границами между планарными условными знаками вместе с сегрегатами, в пикселах к общей площади изображения в пикселах:

£ 21.20, 2.36£Ь,

П = —------ =-----—---- . (6)

9MN Ш

Очевидно, что величина плотности структурных элементов изображения изменяется в пределах от 0 до

1.

Можно также определить максимальное количество линейных условных знаков средней ширины и минимальной длины или границ минимальной длины как отношение общей площади изображения в пикселах к площади на изображении, занимаемой линейным условным знаком средней ширины и минимальной длины или границей минимальной длины между планарными условными знаками вместе с сегрегатами, в пикселах (при величине плотности структурных элементов изображения р = 1 ):

9MN 9MN Л1СЯЛГ

Ктах =-----= -7^7 = °.1М . (7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р0тт 58.3

После подстановки (4) в выражения (1) и (2) можно получить выражения для длин кодовых последовательностей каждого /-го сегмента в двухбитной и полуторабитной схемах кодирования ДЦК-8/3:

к2, = 2(3.60 -2) + 45 = 7.2Ь,. + 41 бит, (8)

к.5,. = 1.5(3.60 - 2) + 56 = 5.40 + 53 бит. (9)

Общая длина кодовой последовательности составит, соответственно:

к2 = 41К + 7.2£0 , (10)

/=1

К

к.5 = 53К + 5.4£0 . (11)

/=1

Для минимальной длина линейного условного знака средней ширины и границы между планарными условными знаками (4) - к2,тп = 57.5 и к^тп = 65.4 , а при Ктах = 0.15MN (7) - к2 = 8.6М¥ и к^ = 9.6MN .

Таким образом, при максимальной плотности структурных элементов изображения р = 1 коэффициенты сжатия информации составляют:

216MN

ст, =-------= 25 , (12)

2 8.6MN

216MN „„ г

о-|5 =------= 22.5 . (13)

1 9.6MN

При этом, следует заметить, что при максимальной плотности структурных элементов изображения Р =1 структура изображения может иметь вид либо плотной регулярной решетки, либо плотной текстуры при стохастическом характере размещения структурных элементов в поле изображения.

В экспериментальных исследованиях установлено, что обычные значения плотности структурных элементов изображения составляют 0.1-0.5. При этом коэффициенты сжатия информации изменяются от двух до четырех порядков, что свидетельствует о высокой эффективности использования схем дифференциального цепного кодирования.

ЛИТЕРАТУРА

1. Галичанин А.А., Мурынов А.И., Лялин В.Е., Левицкая Л.Н., Телегина М.В. Адаптивное цветотоновое

преобразование изображений // Математическое моделирование и интеллектуальные системы: Тем. сб.

науч. тр. IV Междунар. науч.-техн. конф. «Информационные технологии в инновационных проектах» -Ижевск: Изд-во ИжГТУ, 2003 - С. 25-38.

2. Мурынов А.И., Вдовин А.М., Лялин В.Е. Оценка геометрико-топологических параметров деталей

изображений на основе метода центроидной фильтрации // Химическая физика и мезоскопия. - Т.4. -

2002. - №2. - С. 161-177.

3. Павлидис Т. Алгоритмы машинной графики и обработки изображений. - М.: Радио и связь, 1986. -

400 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.