Уфимкин А.Я., Самохвалов А.В. АДАПТИВНОЕ ЦВЕТОТОНОВОЕ ПРЕОБРАЗОВАНИЕ ПРИ КОДИРОВАНИИ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ
В статье рассматриваются возможности сжатия видеоинформации на основе учета особенностей, присущих таким ее видам, как графические изображения. Установлено, что эффективность сжатия может быть существенно повышена за счет использования адаптивного цветотонового преобразования изображений, устраняющего их избыточность, обусловленную большим внутренним корреляциям, которые избирательно связаны с упорядоченностью и организованностью их пространственной структуры.
Проблема передачи больших объемов информации по каналам связи телекоммуникационных систем продолжает сохранять свою актуальность. Решение этой проблемы в значительной мере осложняется тем, что передаваемая информация имеет сложную структуру и разнообразные формы организации. Существующие в настоящее время хорошо развитые методы кодирования (сжатия, упаковки) информации [1, 2] могут быть
усовершенствованы за счет учета особенностей организации этой структуры.
Так графические изображения (ГИ; - карты, схемы, планы, чертежи и т.д.), для которых характерно априорное их структурирование, образуя обширный подкласс всего многообразия изображений, не слишком эффективно обрабатываются существующими методами кодирования изображений. Причина этого в том, что присущие им внутренние корреляции чрезвычайно сильно и избирательно связаны с упорядоченной и организованной их пространственной структурой. Поэтому отсутствие учета этой структуры приводит к существенному снижению показателей сжатия графической информации, а также к снижению производительности процедур кодирования и декодирования. В связи с этим актуальной становится задача разработки таких методов представления и кодирования графической информации, которые учитывали бы специфику ГИ.
Многообразие всевозможных разновидностей ГИ чрезвычайно велико: карты, планы, схемы, чертежи, рисунки и другие графические документы, различные графические знаки (в т.ч. алфавитно-цифровые символы и иероглифы), пиктографические указатели и т.д. Современный графический интерфейс программ также оформляется в виде ГИ на экране дисплея компьютера.
Выделение класса ГИ может быть произведено на основе сопоставления их с изображениями, полученными неграфическими способами. Так, в отличие от ГИ, фотографические изображения формируются при проецировании изображений внешних объектов на плоскость проекции. Поэтому они могут обладать гораздо большей детальностью и сложностью структуры по сравнению с ГИ.
Характерной особенностью ГИ является то, что изображения создаются целенаправленно как средство передачи информации в ее графической форме. Для этого в изображении воспроизводится только необходимая для передачи информация, представленная в таких графических формах, которые обеспечивают простоту процесса восприятия полученной информации и не допускают неоднозначности ее интерпретации. Для этого изображения объектов обобщаются (генерализуются) и, в той или иной мере, подвергаются стилизации. В зависимости от предметной области, в которой используются ГИ того или иного вида, разрабатываются легенды или системы стилизованных условных обозначений изображаемых объектов, что обеспечивает их воспроизведение в наглядной легко воспринимаемой образно-знаковой форме. Кроме того, для обеспечения наилучшего восприятия создаваемых ГИ обычно используется относительно небольшое количество хорошо различаемых цветов или тонов. В частности, большое количество типов графических документов создается в двухцветной шкале, содержащей только белый и черный цвета, что обусловлено, в первую очередь, ограничениями, присущими традиционному полиграфическому процессу. Таким образом, ГИ характеризуются достаточно жесткой регламентацией графических характеристик воспроизведения изображений.
Фотографические и полиграфические копии ГИ могут отличаться по своим характеристикам от исходного изображения, но при этом сохраняют его графический характер, поскольку в основе построения изображения по-прежнему остается изначальный план построения его пространственной структуры. Таким образом, ГИ характеризуются наличием априорно заданной структурной организации в воспроизводимых изображениях.
Поэтому характерным отличительным признаком ГИ является их графическая определенность, которая заключается в том, что для каждого структурного элемента изображения точно указана его графическая форма, определяемая видом изображаемого объекта и его смысловыми характеристикам. Изображение составляется из таких графических форм в соответствии с некоторой заранее заданной их номенклатурой или легендой, предусматривающей определенное графическое исполнение изображений объектов в форме условных знаков. Применение условных знаков обеспечивает передачу семантики изображения при визуальном восприятии путем ассоциирования знаков с образами объектов в соответствующей предметной области. Типичные примеры - системы условных знаков для топографических карт и планов, системы условных обозначений для радиоэлектронных схем и т.д. При этом в каждой точке изображения точно определен тон или цвет из заранее заданной дискретной шкалы хорошо различаемых тонов или цветов (цветотоновой шкалы), содержащей относительно небольшое их количество.
В то же время процесс реального воспроизведения изображения на материальном носителе или в цифровой форме всегда в той или иной мере сопровождается воздействием искажений, таких как нелинейные искажения тона и цвета, пространственно-частотные искажения, ограничивающие разрешающую способность изображений, нанесение на изображение шумов и помех. Эти искажения обусловлены физическими ограничениями используемых средств воспроизведения изображений (фотоаппарат, телекамера, полиграфический станок, сканер, принтер, дисплей компьютера, электронно-лучевая трубка и т.д.), определяющими характер и степень воздействия искажений на изображение.
Нелинейные искажения тона и цвета обусловлены тем, что при любом физическом процессе воспроизведения изображений кривые тоно- и цветопередачи нелинейны и обеспечивают передачу значений тонов и цветов в пределах ограниченного динамического диапазона. Вследствие этого наблюдается эффект тоно- и цветозамены, при котором значения воспроизводимого тона и цвета заменяются на другие их значения, определяемые этими кривыми.
Пространственно-частотные искажения обусловлены ограниченностью разрешающей способности любого физического процесса воспроизведения изображений. Так в линейных процессах воспроизводимое изображение представляет собой свертку исходного изображения с импульсным откликом процесса воспроизведения (воспроизводящей системы), который хотя и локализован в небольшой области, но не является точечным (т.е. не является дельта-функцией), т.к. указанная область всегда имеет некоторые конечные ненулевые размеры. Поэтому реакцией системы на каждую отдельную точку исходного изображения является пятно размытия, определяемое ее импульсным откликом. Поэтому на границах областей различного тона или цвета образуются полосы размытия с плавным переходом от одного тона к другому для монохромных изображений или с многоцветной каймой для цветных изображений. Кроме того, для малоразмерных деталей изображения, размеры которых соизмеримы с величиной разрешающей способности, наблюдается снижение их контраста для монохромных изображений или искажение их цвета для цветных изображений.
Шумы и помехи, возникающие на воспроизводимом изображении, обусловлены неоднородностями стохастического характера, которые всегда имеются на поверхности любого материального носителя воспроизводимого изображения и которые присущи также любому физическому процессу воспроизведения изображений. В зависимости от характера шумов и помех на воспроизводимом изображении может наблюдаться зернистость, пятнистость и другие виды неоднородностей.
Перечисленные факторы приводят к тому, что свойство графической определенности в той или иной мере нарушается, а характер корреляций отсчетов изображения усложняется, что в свою очередь снижает показатели сжатия графической информации. Эти показатели могут быть существенно улучшены с помощью использования метода адаптивного цветотонового преобразования изображений (АЦТП) [3, 4].
Метод АЦТП использует настраиваемые окна с заданными размерами и формой. Для пиксела с координатами (i,j) окно образуется совокупностью n пикселов в его окрестности w(i, j) = | (i + ifr, j + j ) | к = 1, nj ,
где ik , jk - величины смещений пикселов окна относительно положения центрального пиксела (i, j) . Последовательность обработки изображений имеет следующий вид.
Первоначально создается первичное «пустое» цветное изображение ZRGB (i,j) = 0, затем цветовые компоненты 1Д (i,j) IG (i, j) \B (i, j) изображения 1Д G _g(i,j) обрабатываются связно-кластерным фильтром:
lR(i, j) =1 Z Ir(i*. j*), IG)=1 Z Io(G,f),
n (i'*,/)e4‘"j) n (Л/^цу)
B,j)=1 Z B",;*). (1)
n (iV)ew(ij) B
Для каждого пиксела с координатами (i, j) производится сравнение с порогом p :
Ir (i*, j*) - IR (i, j))2 + ( Ig (i*, j*) - IG (i, j))2 +( Ib (i*, j*) - IB (i, j))2 ^ p . (2)
Если (2) при всех (i*, j*)e w(i, j) выполнено, то ZRGB (i,j) модифицируется:
ZR (i,j) = IR (i,j) , ZG (i,j) = IG (i,j) , ZB (i,j) = IB (i,j) . (3)
Дальнейший анализ состоит в выделении в изображении ZR,G,B 0> j) связных цветовых областей Gx , ..., Gg и определении характерных цветов:
R=-f Z zr (i, /), G=-f Z ZG (i, /),
Nq (i,j) eGq Nq (i,j) eGq
Bq = 7^ Z ZB (i, /) . (4)
Nq {i,j)eGq
где q = 1,Q , Q - количество областей, Nq - количество пикселов в области G .
Обработка завершается созданием пакета «пустых» бинарных изображений Zj (i, j) = 0 , ..., ZQ (i, j) = 0 и
их последующим заполнением:
Zq (i', j )= 1 , если ^, j )e Gq . (5)
Результатом АЦТП является стратифицированное по характерным цветам изображение Z q(', j) (фрагмент изображения показан на рис. 1).
Исследования АЦТП показали, что преобразование обладает высокой способностью шумоподавления, выравнивания цветовых и тоновых контрастов, компенсации пространственно-частотных искажений, цвето- и тонокоррекции, эквализации вторичных структур (например, полиграфических растров), колориметрического уравнивания цветовых балансов изображения а при восстановлении цветного (полутонового) изображения может быть достигнуто более высокое качество воспроизведения по сравнению с исходным изображением за счет выравнивания цветовых (тоновых) контрастов [3, 4].
Также при применении АЦТП возможности сжатия графической информации можно повысить за счет образования повторяющихся серий пикселов при выравнивании тонов и цветов (схема LRE [1, 2]).
В экспериментальных исследованиях было использовано около двухсот ГИ с различной сложностью структуры, с различным количеством значений цветотоновой шкалы (от 2 до 28) с различным характером нелинейных искажений цветотоновой шкалы и пространственно-частотных искажений, подверженных воздействию шумов различной интенсивности, и в целом - различного качества. При этом в экспериментах на нескольких десятках ГИ были определены оптимальные настройки процедур АЦТП.
Так для цветного 6-цветного ГИ, фрагмент которого показан на рис. 1, в формате *.bmp Truecolor (256 градаций уровней яркости в каждом из цветовых каналов RGB), размером 2000x2000 пикселов и объемом 12 мегабайт, в результате применения АЦТП было получено 6 цветовых слоев (бинарных изображений, что само по себе сокращает объем информации в 24/6=4 раза). Сжатие этого пакета изображений методом LRE дало общий объем 95 килобайт (коэффициент сжатия информации составил 126), в то время как сжатие с помощью преобразования в формат *.jpg с качеством 70% дало всего лишь 680 килобайт с коэффициентом сжатия информации 18. Использование более мощного архиватора WinRAR дало 80 килобайт (коэффициент
сжатия составил 150) . Еще больший эффект может быть достигнут если использовать схему архивации
WinRAR не в байтовом формате, а в поразрядном представлении цвета с количеством разрядов, равным
количеству выделенных характерных цветов. В данном случае 6 выделенных цветов против исходных 24
разрядов (3 байта) дает увеличение коэффициента сжатия в 24/6=4 раза, т.е. коэффициент сжатия составляет 600, а объем файла сокращается до 20 килобайт.
Рис. 1. Адаптивное цветотоновое преобразование изображения
Экспериментально полученные общие наиболее характерные показатели сжатия графической информации для всей выборки изображений характеризуются величинами Ых10 - Ых102 (Ы - кратность показателя, принимающая целочисленные значения от 1 до 9). Таким образом, достигается возможность сжатия графической информации на 1-2 порядка, т.е. сравнительно с показателями сжатия используемых графических растровых форматов изображений - как минимум на порядок выше.
При разработке технологии и программного обеспечения обработки изображений, основанных на использовании АЦТП, был проработан поиску новых алгоритмических решений, сокращающих используемые вычислительные ресурсы - объемы потребляемой памяти и время вычислений (время кодирования/декодирования). Эти решения основывались на использовании более эффективных форм представления данных и видоизменений вычислительных процессов с целью исключения повторных вычислений.
Так, для локальной обработки изображений, основанной на использовании настраиваемых окон, характерным является повторение значительного количества пикселов в окне при сдвиге его на величину одного пиксела в процессе сканирования изображения окном. Поэтому, в качестве одного из основных приемов видоизменения вычислительного процесса была использована коррекция вычисляемых значений функционала (3) в окне при перемещении окна на величину в один пиксел. При этом значение функционала корректировалось таким образом, чтобы учесть попадание в окно новых пикселов изображения, устранение из него части старых пикселов и перемещение сохранившихся в окне пикселов. Были выведены корректирующие выражения для связно-кластерной фильтрации. Выигрыш во времени вычислений составил 65%.
Таким образом, применение АЦТП позволяет достичь высокой степени сжатия графической информации, а также высокой производительности процедур ее обработки при кодировании и декодировании.
ЛИТЕРАТУРА
1. Артюшенко В.М., Шелухин О.И., Афонин М.Ю. Цифровое сжатие видеоинформации и звука. - М.: Дашков и К°, 2003. - 426 с.
2. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. - М.: ДИАЛОГ-МИФИ, 2003. - 384 с.
3. Галичанин А.А., Мурынов А.И., Лялин В.Е., Левицкая Л.Н., Телегина М.В. Адаптивное цветотоновое
преобразование изображений // Математическое моделирование и интеллектуальные системы: Тем. сб.
науч. тр. IV Междунар. науч.-техн. конф. «Информационные технологии в инновационных проектах» -Ижевск: Изд-во ИжГТУ, 2003 - С. 25-38.
4. Лялин В.Е., Мурынов А.И., Лепихов Ю.Н., Шибаева И.В. Модели представления и кодирования пространственных объектов для передачи изображений по цифровым каналам связи // Материалы XXXI Междунар. конф. «Информационные технологии в науке, образовании, телекоммуникациях и бизнесе» // Успехи современного естествознания. - 2004. - №5. - Прилож. №1. - С. 123-125.