Научная статья на тему 'Технология компрессии изображений больших размеров'

Технология компрессии изображений больших размеров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
137
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПРЕССИЯ ИЗОБРАЖЕНИЙ / КВАНТОВАНИЕ / ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / ЛИФТИНГ-СХЕМА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алтухов Александр Иванович, Дудин Евгений Александрович, Титков Бронеслав Владимирович

Представлена технология компрессии изображений больших размеров. Рассмотрены наиболее эффективные алгоритмы декоðрелирующего преобразования матрицы изображения и квантования вейвлет-коэффициентов.I

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n clause fair-sized images compression technology is produced. Most effective image matrix decorrelation and wavelet-coefficients quantization algorithms are considered.

Текст научной работы на тему «Технология компрессии изображений больших размеров»

и = Цх — х0У(у — г0)*Ф(л", у)(Ьс с1\\ (20)

т.

где х0=—— и >-0 =——--координаты центра

»»оо '"оо

тяжести РЛИ.

Используя известное соотношение

(а-ЬУ =£скп(-Ь)к(аГк, к = 0

можно получить связь между моментами (12) и (20)

я=0Л=0

т.

'01

(т]0)"(тт)к х——-^—щ

(/«00 )'

п+к р-п.ц-к •

(21)

Выражая все моменты в правой части (21) по формуле (17). получаем

М =РУ ,

пРЧ г РЧ

(22)

где

т

ха =-

т,

Ю . „0_»»(

— • Уо —

оо

т.

'оо

нормированные координаты центра тяжес-

ти.

= \1х — х0*У(у—уХФ(х, у)с1х йу — центральные моменты неискаженного изображения;

Формула (22) полностью идентична формуле (17). Отсюда следует, что отношение

Мпа

Мпп=-(23)

РЧ

Ю'

может использоваться в качестве признака классификации, инвариантного как к смещению объекта относительно центра РЛИ, так и к специфическим искажениям, вызванным вращением объекта.

В статье получены выражения векторов классификационных признаков, основанных на достаточных статистиках и моментах различных порядков; сравниваются несколько параметрических и непараметрических правил принятия решения.

Кроме того, получено выражение вектора признаков, инвариантных к специфическим искажениям изображений классифицируемых объектов, вызванных их смешениями и вращениями в процессе наблюдения.

СПИСОК ЛИТЕРАТУРЫ

1. Доросинский Л.Г. Синтез алгоритма распознавания пространственно-распределенных объектов по данным РЛС бокового обзора // Радиотехнические системы локации пространственно-распределенных объектов. Оптимизация и моделирование: Межвуз. сб. Вып. 4. Свердловск, 1981. С. 48-52.

2. Доросинский Л.Г., Шитова Т.М. Статистическое моделирование двумерного изображения

пространственно-раснределенного объекта // Проблемы повышения эффективности и качества радиотехнических систем: Межвуз. сб. Вып. 3. Свердловск. 1980. С. 99-101.

3. Ху М.К. Опознавание фигур при помощи инвариантных соотношений между моментами // ТИИЭР. 1961. №9.

А. И. Алтухов, Е. А. Дудин, Б. В. Титков Технология компрессии изображений больших размеров

Проблемы обработки изображений больших размеров существуют давно. Современные технологии получения и обработки видовой информации непрерывно совершенствуются, способствуя развитию способов оперативной

доставки изображений, их эффективной архивации, зашиты от несанкционированного доступа и прочего.

Все технические системы, реализующие современные технологии обработки изображений

больших размеров, непременно имеют в своем составе кодеки [1]. Их задача — исключение визуальной избыточности, без которой оператор в состоянии видеть в изображении то. что необходимо и достаточно для решения стоящей перед ним задачи. В го же время сокращение объема данных значительно облегчает задачи их транспортировки и хранения, обеспечивает потребителю существенный экономический эффект.

Существует ряд западных фирм, поставляющих на мировой рынок программную и аппаратную продукцию, позволяющую успешно обрабатывать аэро- и космические фотоснимки, в большинстве случаев представляющие собой массивы данных больших размеров. Наиболее эффективными считаются кодеки таких фирм, как LizardTech (кодек MrSID) и Leica (кодек JPEG-2000).

Анализ работы методов компрессии видовой информации в перечисленных кодеках дал следующие результаты. Кодек фирмы Leica показывает хорошую скорость кодирования, но качество восстановленных изображений быстро ухудшается при увеличении коэффици-

а) б) в)

ента сжатия. Об этом свидетельствуют значения PSNR (пиковое отношение сигнал/шум, англ. Peak Signal-to-Noise Ratio) и визуальное оценивание восстановленных изображений (рис. 1. а). Кодек фирмы MrSid затрачивает иногда в несколько раз больше времени на обработку изображений, чем кодек фирмы Leica, но также работает некачественно при высоких значениях коэффициента сжатия (рис. 1. б).

В России коллективом специалистов был разработан метод сжатия изображений под названием Q VT. который по своим характеристикам превосходит зарубежные аналоги.

Анализ работы отечественного метода сжатия показал, что при кодировании изображений больших размеров с коэффициентами сжатия выше 20 происходит значительное увеличение времени обработки, а также потеря мелких деталей на изображении (рис. 1, в). Причина таких результатов в следующем.

На этапе вейвлет-преобразования изображения производится свертка отсчетов изображения с коэффициентами масштабирующего и вейвлет-фильтров [2]. Значения этих коэффициентов очень малы, поэтому для работы с ними

г)

Рис. I. Фрагмент исходного изображения (г) и результаты его комирессии кодеками ,1РЕС-2000

(«), МгёГО (о) и ОУТ(в)

PSNR = 18.4 PSNR = 20,6 PSNR =24,2

PSNR = 4.3

PSNR =6.4 PSNR =9.7

PSNR =0,4

PSNR = 1,3 PSNR = 6,1

применяется тип данных двойной точности с плавающей запятой. Это вызывает необходимость увеличения динамической памяти компьютера, что соответственно увеличивает время обработки изображения.

Причина потери качества восстановленного изображения заключается в том. что на этапе округления вейвлет-коэффициентов. полученных в результате вейвлет-преобразования. применяется алгоритм скалярного квантования с мертвой зоной [3]. При высоких коэффициентах сжатия данный алгоритм дает грубое округление вейвлет-коэффициентов. При степени сжатия выше 20 значительная часть полезной информации теряется, что ведет к ухудшению качества восстановленного изображения.

Таким образом, проведенный анализ позволяет сделать вывод о том. что в отечественных и зарубежных методах сжатия изображений противоречие между объемами производимой видеоинформации и характеристиками средств ее передачи и хранения по-прежнему существует. Это противоречие вызывает необходимость доработки метода компрессии QVT с целью обеспечить сжатие изображений больших форматов без существенных потерь.

Содержание изменений сводится к заменам вейвлет-преобразования на основе свертки на вейвлет-преобразование по лифтинг-схеме [4], а также скалярного квантователя с мертвой зоной на метод кодирования с использованием нуль-деревьев [5].

Вейвлет-преобразование на основе лифтинг-схемы

На рис. 2 показаны основные этапы деко-реллирующего преобразования: разбиение, предсказание и обновление. Рассмотрим выделенные этапы.

Этап разбиения. Задачей любого преобразования при сжатии изображений является де-корелляция. т. е. представление энергетически наиболее значимой составляющей изображения в компактной форме.

Нечетные отсчеты

Разбиение

Предсказание

Обновление

£

Четные отсчеты Рис. 2. Типовая ячейка лифтинг-схемы

В случае лифтинг-схемы входная последовательность Х01к, к е Z делится на четные и нечетные элементы; для уменьшения последовательности нечетные элементы удаляются.

Этап предсказания. На данном этапе в исходной последовательности четные элементы остаются без изменений, а нечетные заменяются разностью между истинными значениями нечетных элементов и их предсказанными значениями, т. е. вейвлет-коэф-фициентами у ,к. Предсказанные значения вычисляются в общем случае при помощи оператора предсказания Р(у ,), такого, что

у.Л

разность Х02А+1 - Р(у /к) минимальна. Для случая, когда изображение имеет большие размеры, в качестве функции предсказания используется полином третьей степени [6]. Коэффициенты полинома вычисляются эмпирическим путем.

Этап обновления. На предыдущем этапе были рассчитаны вейвлет-коэффициенты. Если оставлять четные значения без изменений, то в результате многоразвого применения преобразования к строке изображения мы получим два крайних элемента последовательности в исходном виде и все промежуточные значения в виде вейвлет-коэффициентов. Это вызовет значительный элайзинг, т. е. взаимовлияние полос высоких и низких частот. В результате уменьшенная копия не будет похожа на исходное изображение. Для устранения этого эффекта необходимо сохранять некоторую скалярную величину, например среднюю яркость. Для этого значения четных элементов обновляются на основе значений вейвлет-коэффициеитов по формуле

- ^ и +

У и-1 +У-и

(2)

В общем случае прямое преобразование в виде системы уравнений можно записать в следующем виде:

У У.* ~ )'

Ч* = кМ+и(- Ум>-

(3)

Для того чтобы получить обратное преобразование, достаточно поменять знаки "+" и местами. В результате будем иметь такую систему уравнений:

(4)

Таким образом. на выходе лифтинг-схемы формируются два множества коэффициентов вейвлет-разложения: низкочастотных у_.( и высокочастотных у

Если применить лифтинг-схему к низкочастотному и высокочастотному массивам, то будет реализован один шаг двумерного вейвлетного преобразования. Выходы второго уровня лифтинг-схем образуют четыре прямоугольных массива данных, из которых массив представляет собой масштаби-

рованную копию входного изображения, но в четыре раза меньшего размера. Он соответствует массиву низкочастотных коэффициентов первого шага вейвлет-преобразования. Двумерные массивы высокочастотных вей-влет-коэффициентов ¿#(1), НН{ 1) и НЦ 1) отвечают за горизонтальные, диагональные и вертикальные детали в исходном изображении соответственно.

В табл. 1 приведены сравнительные оценки количества операций, требуемых для выполнения вейвлет-разложения последовательностей различной длины с помощью алгоритма быстрого вейвлет-преобразования и лифтинг-схемы. Они свидетельствуют, что вейвлет-разло-жение с помощью лифтинг-схемы происходит примерно в 1,3 раза быстрее, чем разложение с помощью быстрого вейвлет-преобразования (ВВП).

Таблица 1

Количество операций, необходимых для выполнении вейвлет-разложения (при £ = 4)

Длина Быстрое вейвлет- Лифтинг-

сигнала преобразование схема

256 3556 2794

512 7140 5610

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1024 14308 11242

Округление вейвлет-коэффициентов с использованием алгоритма кодирования нуль-деревьев

В работе алгоритма применяется древовидная структура данных для описания вейвлет-коэффициентов. Такая структура получается в результате применения двухканального разделимого вейвлет-преобразования. Корневой узел дерева ("родитель'') представляет собой коэффициент масштабирующей функции в низкочастотной области и имеет три связанных с ним коэффициента высокочастотной области последнего уровня разложения (три "потомка"). Каждый из потомков корневого узла имеет четыре потомка, соответствующих вейвлет-коэффициентам следующего уровня и того же пространственного расположения. Низом дерева являются листьевые узлы, не имеющие потомков.

Для каждого из коэффициентов низкочастотной области существуют три таких дерева, соответствующих трем порядкам филы рации, как показано на рис. 3, а.

Квантование с использованием нуль-деревьев основано на наблюдении: если коэффи-

а)

1\ т

V

В"

ип

ни

нт

Пш

6)

"У о. * *

и

5 С" с

Рис. 3. Древовидная структура («) данных и способ сканирования (о) для описания вейвлет-коэффициентов

цнент мал. то его потомки на дереве зачастую тоже малы. Это объясняется тем, что значимые коэффициенты возникают вблизи контуров и текстур, которые локальны. Дерево или субдерево. которое содержит только незначимые коэффициенты, называется нуль-деревом.

Приведена следующая последовательность реализации метода квантования.

Вначале выполняется частичное упорядочивание коэффициентов по амплитуде. Оно реализуется путем сравнения величины каждого вейвлет-коэффициента (ВК) с некоторым порогом Т. Если значение ВК > Т. то выносится решение, что коэффициент— значимый, в противном случае— незначимый. Сканирование производится от низкочастотных полос к высокочастотным. Порядок сканирования элементов одного дерева при трехуровневом вейвлет-разложении показан на рис. 3. 6.

Для кодирования знака и позиции всех коэффициентов используется двухбитный символ. Этим символом могут быть: р — положительный значимый коэффициент; п — отрицательный значимый коэффициент; / — корень нуль-дерева, если все "потомки" меньше порога; г — изолированный ноль, если есть "потомки" больше порога.

После вычисления и передачи карты значений для значащих коэффициентов должны быть переданы биты, уточняющие их значение ("карта данных"). Далее карта данных и карта значений сжимаются арифметическим методом кодирования. В гом случае, если не исчерпан ресурс скорости передачи, порог Т делится пополам и процесс повторяется.

Верхние ряды бит содержат много нулей, так как многие коэффициенты имеют значение ниже порога. Роль нуль-дерева заключается в предотвращении передачи этих нулей. Символ нуль-дерева может снова и снова передаваться для данного коэффициента, пока он не станет больше текущего порога. После этого передается его квантованное значение.

Алгоритм квантования с использованием нуль-деревьев генерирует вложенный, иерархический код. Подобные алгоритмы позволяют осуществить прогрессивную передачу изображения с последовательным уточнением его на приеме. При этом изображение вначале аппроксимируется небольшим количеством бит. а потом эта аппроксимация уточняется. Такие коды имеют большой практический интерес по причине появления следующих воз-

можностей: точного регулирования скорости передачи: восстановления всего изображения при прекращении приема декодером бит в любой точке с максимальным качеством для принятого количества информации; быстрого просмотра уменьшенной копии изображения в удаленной базе данных.

Ввод изображения

ЦМ.Х]

I

Разбиение изображения на блоки Ь х Ь

Ь = 2'У.А' =8

Преобразование цветового пространства

" Y " 0.299 0.586 0.114 " 'R

= -0.169 -0.331 0.500 G

сг. 0.500 -0.419 -0.081 В

Пропорции между каналами Y. СЬ,С, - 90/5/5

Субвыборка в цветовых каналах

= 1:1: end Сг = 1:1 .end

Сдвиг уровня сигнала

1(т,п) = /(/и, п)-М(1(т,п))

Вейвлет-преобразование с использованием лифтинг-схемы

Нечетные отсчеты

-V. < 1 У i

Разбиение Предсказание Обновление

Четные отсчеты

Округление вейвлет-коэффициентое с использованием нуль-деревьев

г 1 5Т -Т ~>Т

1п 1,-40 4'у ¿¿о I-1-1---1

Н/\И II I II

Мультиплексирование потоков

1

Сохранение в файл

Рис. 4. Структура нового метода компрессии

Таким образом, метод кодирования с использованием нуль-деревьев — эффективный алгоритм округления коэффициентов вейвлет-преобразования. Он позволяет организовать

прогрессивную передачу сжатого изображения по каналу связи, т. е. передачу изображения с постепенным улучшением его качества по мере получения новых данных. Достоинством алгоритма также является помехоустойчивость, так как при прекращении приема битового потока мы можем получить изображение наилучшего (для принятого объема информации качества).

Оценивание производилось по значениям показателей времени кодирования и F>SNR. Размер тестового изображения — 10000 х 10000 элементов. Результаты оценивания работы кодера приведены в табл. 2. Из нее видно, что предлагаемая технология компрессии изображений дает лучшие результаты при высоких значениях коэффициента сжатия по сравнению с известными методами.

Представленная технология компрессии

Таблица 2

Сравнение разработанного кодера с известными но показателям времени сжатия tи PSNR

Степень сжатия MrSID JPEG-2000 QVT Разработан ны и метод

t , с СЖ PSNR t. с CA' PSNR 'сж. C PSNR te ж, с PSNR

10 84 20.6 16 18.4 12 24.2 8 26.1

30 78 6.4 12 4.3 10 9.7 6 12.4

50 72 1.3 8 0.4 9 6.1 4,5 6.8

Заменив методы, используемые в структуре алгоритма сжатия (~)УТ на этапах вейвлет-преобразования и округления вейвлет-коэф-фициентов, на лифтинг-схему и округление с использованием нуль-деревьев, получим новую структуру алгоритма сжатия (рис. 4)

На заключительном этапе было оценено качество работы нового метода сжатия изображений.

изображений больших размеров имеет важное практическое приложение — обеспечение работы космических аппаратов дистанционного зондирования Земли, так как позволяет увеличить объемы передаваемой информации по существующим каналам связи, а также при хранении полученных данных в наземных комплексах обработки изображений.

СПИСОК ЛИТЕРАТУРЫ

1. Ва I о. щи Д., Ра I ушняк А„ Смирнов М„ Юкин В.

Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ-МИФИ, 2003.

2. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования / ВУС. СПб., 1999.

3. Прэтг У. Цифровая обработка изображений: Т. 1.2. М.: Мир. 1982.

4. Sweldens W. The lifting scheme: A custom-design construction on biorthogonal wavelets // Applied Computer Harmonic Analysis. 1996. Vob. 3, № 2. P. 186-200.

5. Shapiro J. Embedded image coding using zerotrees of wavelet coefficients // Signal Processing. 1993. Vob. 41. P. 45-46.

i Надоели баннеры? Вы всегда можете отключить рекламу.