Уфимкин А.Я., Петров А.В., Левицкая Л.Н. ИСПОЛЬЗОВАНИЕ ЦЕНТРОИДНОГО ПРЕОБРАЗОВАНИЯ И ЦЕПНЫХ КОДОВ ДЛЯ КОДИРОВАНИЯ ГРАФИЧЕСКИХ ИЗОБРАЖЕНИЙ
В статье рассматриваются возможности эффективного представления и кодирования графических изображений на основе совместного использования их центроидного преобразования и последующего цепного кодирования. Установлено, что эффективность кодирования может быть существенно повышена за счет устранения избыточности графических изображений, обусловленной упорядоченностью и организованностью их структуры.
Существующие методы кодирования и сжатия изображений ориентированы на использование универсальных схем обработки информации, не учитывающих особенности различных типов изображений [1, 2] . В то же
время учет характерных свойств изображений, таких как характеристики упорядоченности и организованности их пространственной структуры, может быть использован для построения специализированных, но более эффективных схем их эффективного представления и кодирования за счет устранения обусловленной этими характеристиками избыточности изображений.
В частности, особенности графических изображений (ГИ), таких как карты, схемы, планы, чертежи и т.д., для которых характерно априорное их структурирование, могут быть использованы для построения эффективных схем их кодирования при использовании центроидного преобразования [3, 5, 8] и последую-
щего цепного кодирования [5-8] полученного в результате преобразования препарата изображения.
Представление изображений тесно связано со способом их формирования. Графический способ, реализуемый посредством последовательного нанесения на плоскость изображения его структурных элементов, предполагает в своей основе структурное представление, т.к. эти элементы размещаются в соответствии с некоторым априорно определенным планом построения изображения. Этот план имеет пространственный характер и может существовать в виде зрительного образа в сознании человека, создающего изображение, или в структурах данных программ машинной графики, синтезирующих изображение. Результатом являются искусственно созданные графические изображения объектов, воспроизводящие их пространственную структуру.
При определении ГИ важно учесть, что их структура является результатом воспроизведения какого-либо априорно определенного пространственного плана построения изображения, который обычно подчиняется требованиям определенных достаточно жестких регламентов или стандартов. Таким образом, ГИ характеризуются наличием априорно заданной структурной организации в воспроизводимых изображениях, т.е. отличительным признаком ГИ является их пространственная определенность, которая означает, что каждая точка изображения принадлежит единственному и вполне определенному элементу изображения, который может являться объектом, либо быть частью одного или нескольких объектов в соответствующей предметной области. Тем самым реализуется структурная обусловленность изображений пространственным планом их построения, определяющим местоположение, смысловые характеристики и взаимосвязи его элементов .
Все элементы, составляющие ГИ, можно подразделить на три типа - планарные, линейные и точечные. Планарные элементы выражаются в масштабе изображения и их местоположение определяется областью (размерность 2) их размещения на изображении. Поперечный размер линейных элементов не выражается в масштабе изображения и их местоположение определяется трассой (размерность 1) их размещения на изображении. Точечные элементы не выражаются в масштабе изображения и их местоположение определяется точкой (размерность 0) их позиционирования на изображении.
В результате размещения на плоскости в поле изображения совокупности планарных, линейных и точечных элементов различного вида воспроизводится пространственная структура ГИ. Виды этих элементов визуально различаются по их графическим формам.
Метод центроидного преобразования изображений [3, 5, 8] используют настраиваемые окна с заданными
размерами и формой. Для пиксела с координатами О',}) окно образуется совокупностью п пикселов в его окрестности ^(/,])— |(' + *£,] + ) | к = 1,п| , где , I - величины смещений пикселов окна относительно
положения центрального пиксела (',]) .
Центроидное преобразование изображения 1(',}) в общем случае заключается в вычислении вектора центроида (сх (', ] ),Су (', ])) для каждого пиксела:
I ('-■)■('■;')
(' ■/^(и)
сх ('> -I )=■
I (/->) ■(■'■/)
с.м=("и:) .. , , (1) /.? 1(' ^ )
( I ■ 1 1
после чего формируется производное центроидное изображение С (',у). Для этого создается «пустое» изображение Ъ(',]) = 0 , которое затем модифицируется:
Со (',]) = Z(i,I) +1 , если ' = Сх(0,0) , I = с. (0,0) ,
Ст+1 (',|) = Ст (',|)+ 1 , если ' = ' + Сх (Л/) , ] = / + С. (Л/) , (2)
где индекс т = ' + ММ нумерует пикселы изображения размера МхN , соответственно, ' * =т—М
т
М
С[а] - целая часть числа а ).
т
М _
В частном случае окно ^(/, ]) может иметь вид строчного или столбцового интервала.
Центроидное преобразование обладает отчетливо выраженными селективными свойствами по отношению к структурным элементам изображения и проявляет при этом субпиксельные эффекты.
Дальнейшая обработка центроидным фильтром заключается в пороговом выделении на центроидном изображении пикселов с высокой яркостью и вычислении для них величин диссипации Н и экстента к (при
этом возможна смена размеров и формы окна):
I ('-—о’■ ('■ ./■)
н,М-(1 ... ...—с;М, 13)
I 1 (г , I )
(',/)е»(и)
кх(',I) = 412НХ(',I) . (4)
По величине экстента оцениваются местоположение границ планарных элементов и местоположение и
размеры поперечного сечения линейных элементов (или их участков), либо соответствующие области изображения маркируются как неопределенные. В последнем случае перенастраиваются размеры и форма окна
w (',}), которое затем используется для обработки областей неопределенности. Таким образом, реализу-
ется адаптивная обработка изображения центроидным фильтром.
Результаты восстановления распознанного в результате центроидной фильтрации изображения показаны на рис. 1 (N - количество пикселов строчного и столбцового интервала окна), из которого можно сде-
лать вывод о достаточно высоком качестве анализа структуры изображения.
а) исходное изображение
в) результат центроидной фильтрации - N = 13
б) результат центроидной фильтрации - N = 9
Рис. 1. Центроидная фильтрация изображения
Исследования центроидной фильтрации показали, что максимальные точность обнаружения и вероятность распознавания элементов достигаются на двухградационных черно-белых изображениях.
Для достижения необходимых показателей качества обработки полутоновых изображений, а также для обеспечения возможности обработки цветных ГИ, может быть использован метод адаптивного цветотонового преобразования [4, 5], который позволяет преобразовать исходное изображение в пакет бинарных двухградационных изображений, разделяемых по характерным для них тонам или цветам.
После определения местоположения границ планарных и линейных элементов образуется препарат изображения, в котором эти элементы представляются цепочками пикселов, причем в формируемых на растре совокупностях пикселов воспроизводятся такие топологические характеристики элементов как их размерность (цепочки однопиксельной толщины) и связность (для линий - непрерывность), а также отношение их смежности.
Эти характеристики, свойства и отношения связаны с понятием связности на растре. Связность на растре определяется отношением смежности (соседства) пикселов; при этом по кратности связности следует различают 8-связность и 4-связность (см. рис. 2) [6, 7].
3(011) 2(010) 1(001)
4(100)
5(101)
6(110)
0(000) 2(10)
7(111)
1(01)
0(00)
3(11)
а) 8-связность и 8- позиционный код (ЦК-8)
б) 4-связность и 4-позиционный код (ЦК-4)
Рис. 2. Связность и цепные коды на растре
Если полагать, что каждой точке плоскости соответствует определенный пиксел на растре, то связность многообразия будет означать связность соответствующей совокупности пикселов, а смежность двух многообразий - наличие смежности хотя бы одной пары пикселов, принадлежащих этим двум совокупностям пикселов. Размерность 1 для растрового воспроизведения линий означает их минимальную толщину - 1 пиксел.
На основе 8-связности и 4-связности можно построить эффективные представления линий на растре в виде простого цепного кода (ЦК - кода Фримена [6, 7]; см. рис. 2), описывающего переходы по смежным
пикселам линии как приращения пиксельных координат, и дифференциального цепного кода (ДЦК [6] ; см. рис. 3), описывающего изменения в этих переходах как приращения изменений текущего направления перехода.
1(01) 0(00) 2(10)
Г
3(011) 1(001) 0(000)
2(010) 4(100)
.X
1(01)
£
0(00)
4(100)
2(10)
3-позиционный
б) 8-связный 5-позиционный (ДЦК-8/5)
в) 4-связный 3-
позиционный (ДЦК-4/3)
а) 8-связный (ДЦК-8/3)
Рис. 3. Дифференциальные цепные коды
Характер представления об эффективности использования цепных кодов показан на рис. 4, где для линии, содержащей 3 точки излома, представлены коды ЦК-8, ДЦК-8/3 и ДЦК-8/5. Как видно из рисунка
наибольшая эффективность кодирования обеспечивается использованием ДЦК-8/3 (2 бита на элемент), не-
смотря на особое кодирование трех узлов (изломов).
Вся линейная структура препарата ГИ, полученная после обработки центроидным фильтром должна быть подвергнута сегментации на участки линейных элементов, ограниченные узлами, которые затем преобразуются в цепной код ДЦК-8/3.
ЦК-8 (132 Ь)
00022212211110007775550000010011222212211100
ДЦК-8/3 (95 Ь)
(0)003(2)0021020002002003(5)003(0)000012010100021020020
ДЦК-8/5 (135 Ь)
(0)0030021020002002004005(0)000012010100021020020
Рис. 4. Представление и кодирование линии на растре
Результаты экспериментов по сжатию графической информации показаны на рис. 5. Как видно из рисунка, при дифференциальном кодировании сжатие обеспечивается естественным образом, поскольку незначащая часть растрового изображения устраняется из кода.
а) Линейчатое черно-белое изображение
б) Фрагмент цветного изображения
Рис. 5. Образцы обрабатываемых изображений
На рис. 5а исходное изображение - рисунок, составленный из 33 изолированных гладких линий, представ-
ляющий собой монохромное (полутоновое) линейчатое изображение в формате *.bmp Grayscale (256 градаций уровней серого), размером 1000x1000 пикселов, объемом 128 килобайт.
Изолированность линий позволила произвести однопроходную центроидную фильтрацию, которая дала отчетливый рисунок на растре, составленный из однопиксельных линий. По этой же причине узловая сегментация не потребовалась. Ввиду гладкости линий цепное кодирование также не потребовало сегментации и преобразование в
код ДЦК-8/3 дало те же 33 сегмента общим объемом 2.4 килобайт. Относительно невысокая степень сжатия информации (чуть более чем на один порядок; коэффициент сжатия информации составил 53) обусловлена тем, что рисунок составлен из гладких линий.
На рис. 5б в качестве исходного ГИ использовалось цветное изображение, исполненное в 6 цветах в формате *.bmp Truecolor (256 градаций уровней яркости в каждом из трех цветовых каналов RGB), размером 2000x2000 пикселов, объемом 12 мегабайт. В результате адаптивного цветотонового преобразования было получено 6 цветовых слоев. Сжатие этого пакета изображений дало общий объем 8 0 килобайт (коэффициент сжатия информации составил 150). Трехпроходная центроидная фильтрация дала отчетливый рисунок на растре, составленный из однопиксельных линий. После узловой сегментации сформировалось 386 линейных сегментов. Их преобразование в код ДЦК-8/3 дало 867 сегментов общим объемом 28 килобайт. Здесь достигнута средняя степень сжатия информации (чуть более чем на два порядка; коэффициент сжатия информации составил 150). Это обусловлено тем, что рисунок также содержит значительную долю гладких линий.
Экспериментально полученные общие наиболее характерные показатели сжатия графической информации составляют величины 3-6 порядков.
Таким образом, при центроидной фильтрация изображений достигаются возможности «очищения» поля изображения от незначащих (неинформативных) областей (внутренние области фона и структурных элементов изображения), а также оценки параметров граничных контрастов и параметров малоразмерных структурных элементов изображения. Этим обеспечивается возможность эффективного кодирования ГИ дифференциальным цепным кодом с показателями сжатия видеоинформации на 2-4 порядка выше относительно результатов сжатия
препаратов изображений, полученных при центроидной фильтрации.
ЛИТЕРАТУРА
1. Артюшенко В.М., Шелухин О.И., Афонин М.Ю. Цифровое сжатие видеоинформации и звука. - М.: Даш-
ков и К°, 2003. - 426 с.
2. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. - М.: ДИАЛОГ-МИФИ, 2003. - 384 с.
3. Галичанин А.А., Мурынов А.И. Левицкая Л.Н. Обнаружение и распознавание элементов структуры изображения методом центроидной фильтрации // Тр. IV Междунар. науч.-техн. конф. «Информационные технологии в инновационных проектах». - Ч. 4. - Ижевск, 2003. - С. 111-114.
4. Галичанин А.А., Мурынов А.И., Лялин В.Е., Левицкая Л.Н., Телегина М.В. Адаптивное цветотоновое
преобразование изображений // Математическое моделирование и интеллектуальные системы: Тем. сб.
науч. тр. IV Междунар. науч.-техн. конф. «Информационные технологии в инновационных проектах» -Ижевск: Изд-во ИжГТУ, 2003 - С. 25-38.
5. Лялин В.Е., Мурынов А.И., Лепихов Ю.Н., Шибаева И.В. Модели представления и кодирования пространственных объектов для передачи изображений по цифровым каналам связи // Материалы XXXI Междунар. конф. «Информационные технологии в науке, образовании, телекоммуникациях и бизнесе» // Успехи современного естествознания. - 2004. - №5. - Прилож. №1. - С. 123-125.
6. Павлидис Т. Алгоритмы машинной графики и обработки изображений. - М.: Радио и связь, 1986. -
400 с.
7. Прэтт У. Цифровая обработка изображений. - Кн. 1. - М.: Мир, 1982. - 312 с.; - Кн. 2. - М.:
Мир, 1982. - 480 с.
8. Murynov A.I., Levitskaya L.N., Shibaeva I.V. The Model Discretely-Planimetry Graphic Structures of the Image Graphic // Book of Abstracts of the 6th International Congress on Mathematical Modelling. - Nizhny Novgorod, 2004. - P. 258.