Исследование алгоритмов сжатия с потерями на основе пространственной декомпозиции сигнала

Лужков Юрий Валерьевич; Тропченко Александр Ювенальевич

2

ОПТОИНФОРМАТИКА

УДК 681.3

ИССЛЕДОВАНИЕ АЛГОРИТМОВ СЖАТИЯ С ПОТЕРЯМИ НА ОСНОВЕ ПРОСТРАНСТВЕННОЙ ДЕКОМПОЗИЦИИ

СИГНАЛА Ю.В. Лужков, А.Ю. Тропченко

В работе рассматриваются адаптивные иерархические преобразования сигнала, используемые или пригодные к использованию в алгоритмах сжатия изображений с потерями. Суть преобразований заключается в том, что исходное изображение разлагается на отдельные части и представляется в виде трехмерной структуры. Предложены новые схемы адаптивной компрессии. Ключевые слова: сжатие с потерями, адаптивная сегментация, октодеревья

В настоящее время основная доля внимания уделяется сжатию трехмерных графических структур, которые используются в компьютерных играх, обучающих программах, компьютерном дизайне. Чаще всего именно в этом контексте исследуется проблема эффективного хранения информации об объемных изображениях. Тем не менее, это не единственная прикладная область, где могут быть востребованы уже имеющиеся наработки. Некоторые из подходов с определенными оговорками могут быть применены и для сжатия двумерной растровой графики.

Алгоритмы сжатия двумерных растровых изображений часто оценивают по следующим основным критериям:

1. коэффициент сжатия, уровень искажений;

2. возможность иерархического сжатия;

3. вычислительная сложность.

В работе предложен подход, позволяющий достичь сравнительно высокой степени компрессии при низкой вычислительной сложности, допускающий реализацию постепенного восстановления сигнала.

Основная особенность рассматриваемого алгоритма - преобразование изображения в иерархическую пространственную структуру, имеющую сходные черты с окто-деревом. Сами октодеревья относятся к группе трехмерных древовидных структур и представляют собой развитие концепции квадродеревьев [1]. Отметим, что в литературе [2] производится обобщение таких структур для пространства любой размерности, однако в прикладной области востребованными остаются, в основном, только двух- и трехмерные деревья.

Будем называть единичный кубический элемент пространства термином воксель (voxel), по аналогии с пикселем (pixel) для дискретизированной плоской структуры.

Заранее отметим, что все рассуждения будут проводиться для черно-белых изображений с конечным числом градаций серого цвета. Обобщение на цветные изображения может быть легко выполнено, если рассматривать плоскость каждой цветовой компоненты независимо от других.

Введение

Декомпозиция и сжатие сигнала в пространстве

Пусть дан двумерный массив бражения размерности N х M .

Мы можем рассматривать двумерное изображение, обычно представляемое в плоском виде, как трехмерный объект, где третья координата - амплитуда пикселей а. Тогда мы имеем систему координат Отпа, см. рис. 1.

a

m

n —►

Рис. 1. Пример представления сигнала в трехмерном пространстве

Пусть для задания яркости одного пикселя выделяется А бит (для монохромного

изображения - 1 бит). Положим А = 2А . Тогда амплитудная компонента а принимает целые значения в пределах [0; А -1].

Элементы рассматриваемого пространства, воксели Vт,п а , могут принимать значения из множества {0;1}, причем

4°,

? и,

V,

V m,n,a > Am,n

V < A

y m,n,a — ^m,n

2.

3.

Рассмотрим отличия такой трехмерной структуры от классических трехмерных объектов.

1. Каждой паре значений (m, n) соответствует одно и только одно значение координаты a. Это означает, что такая структура может быть сведена к некоторой поверхности.

Если рассматривать объект как функцию a(m, n), то она всегда имеет областью своего определения прямоугольник размерами N х M .

Пусть Qi - произвольный битовый срез, т.е. плоскость размерами N х M, получающаяся при фиксированном a = i. Тогда Sqk > Sqi , если l > k , где SQi - площадь ненулевых пикселей среза (т.е. фактически их число).

Из 3-го пункта следует важный вывод: при наличии хотя бы одного ненулевого коэффициента (пикселя) на исходном изображении существует хотя бы одна прямоугольная окрестность1 S, такая, что найдется такое целое Athr е [l; A), при котором

v > Athr для всех v е S .

Конечно, реальные изображения редко представляют собой черный прямоугольник, следовательно, в целях компрессии мы можем усекать группы пикселей с сохранением величины среза для каждой группы. Кроме того, мы можем комбинировать усечение амплитуд снизу с последовательным разбиением области плоскостями, параллельными 0ma и 0na . Причем процесс может быть многоуровневым и затрагивать одну и ту же окрестность изображения многократно.

Итак, мы можем рекурсивно проделывать над изображением (или его локальной окрестностью) по выбору следующие три действия: 1. усечение амплитуд окрестности снизу;

В данном случае нас интересуют только прямоугольные окрестности, хотя можно сделать обобщение на случай произвольной четырех- или восьмисвязной области.

2. разбиение окрестности плоскостью, параллельной 0та ;

3. разбиение окрестности плоскостью, параллельной 0па .

Действия осуществляются в той последовательности, которая выгодна с точки зрения некоторого критерия. Отметим только, что нет необходимости осуществлять усечение амплитуд дважды для одной и той же окрестности. Результат разбиения представляет собой древовидную структуру.

Пример декомпозиции сигнала приведен на рис. 2.

Важными аспектами схемы с точки зрения ее практической реализации являются следующие:

1. стратегия декомпозиции (разбиения) исходных данных, т.е. критерии, в соответствии с которыми будет строиться дерево разбиения;

2. стратегия аппроксимации узлов дерева.

Последняя стратегия важна, в первую очередь, для сжатия с потерями. Поскольку стратегия декомпозиции в значительной степени определяется ошибкой, привносимой аппроксимацией, те или иные схемы разбиения так или иначе будут зависеть от характеристики искажения сигнала при заданном параметре качества сжатия (либо, наоборот, при заданной ошибке ищется способ наилучшего сжатия).

Так как наш алгоритм можно отнести к группе алгоритмов расщепления областей, для него применимы основные подходы декомпозиции этой группы:

1. поиск резких границ, перепадов (метод Хафа);

2. поиск однотонных областей в соответствии с критерием однородности;

3. прямая оценка эффективности - явная аппроксимация с последующим выбором лучшего результата.

Примерами стратегий аппроксимации могут служить:

1. приближение сигнала с использованием бимлет-, курвлет-, риджлет-базисов [3];

2. аппроксимация поверхностями (плоскости, билинейные плоскости, нелинейные поверхности) [4];

3. применение ортогональных преобразований.

Рис. 2. Пример декомпозиции сигнала

Эффективное применение декомпозиции в горизонтальном направлении

Уже предложенные схемы сжатия не используют трехмерную декомпозицию с последующей аппроксимацией узлов, ограничиваясь двумерным разбиением. Однако использование ЭБ-декомпозиции позволяет сократить объем данных, требуемых для представления значений аппроксимации. Так, одна операция горизонтального разбиения позволяет сократить число разрядов для представления значений аппроксимации сразу нескольких узлов.

Введем функцию, оценивающую в битах стоимость хранения ветки дерева относительно некоторого узла:

Ык Ыу Ыа

/см=1 ьк ъуъа

(1)

где Ъа - число бит, необходимое для сохранения значения аппроксимации /-го оконечного узла, аналогично Ък и Ъу - горизонтальной и вертикальной декомпозиции соответственно. Если горизонтальная декомпозиция не используется, то = 0 . Используя горизонтальную декомпозицию сигнала, можно уменьшить значения Ъа. Кроме того, значения

Ък для дочерних узлов также могут быть сокращены. Очевидно, для выигрыша в результате применения горизонтальной декомпозиции должно выполняться условие

/со$1 < /со$1, (2)

где /со^ - цена до внесения данного узла горизонтальной декомпозиции, а /С-

после. Таким образом, прирост цены за счет кодирования горизонтальной декомпозиции должен быть меньше выигрыша за счет уменьшения бит для кодирования значений аппроксимации и других горизонтальных декомпозиций (если таковые уже имеются).

Итак, после операции горизонтальной декомпозиции должно уменьшаться число бит, необходимых для кодирования последующих дочерних узлов. Это происходит тогда, когда диапазон кодируемых значений сокращается так, что его величина переходит через порог степени 2, см. рис. Э. Так как имеет смысл сокращать диапазон амплитуд пикселей не только снизу, но и сверху, предлагается сохранять отступ снизу Аа и число переходов через порог степени 2 при сокращении диапазона. Диапазон амплитуд в этом случае устанавливается кратным степени 2.

а ж а

255

127

0

255

127

0

128 Да

Рис. 3. Пример сокращения числа требуемых для кодирования бит при использовании

вертикальной декомпозиции сигнала

Пример практического использования метода

Руководствуясь неравенством (2), смоделируем одну из возможных схем сжатия, использующую пространственную декомпозицию. За основу рассматриваемого алгоритма возьмем схему, предложенную в [4].

Кратко суть базового метода2 заключается в том, что исходное изображение рекурсивно делится пополам, в результате чего получается иерархическая древовидная структура. Конечные регионы разбиения, соответствующие оконечным узлам дерева, аппроксимируются билинейными плоскостями. Последние строятся по четырем точкам, лежащим на угловых осях, перпендикулярных плоскости основания. Критерий разбиения - минимум суммарной ошибки аппроксимации двух получаемых в результате разбиения областей. Кодирование сигнала производится следующим образом: один бит - является ли узел конечным или составным. Если узел конечный, кодируются значения аппроксимации. Если узел составной, одним битом кодируется тип разбиения (вертикальное или горизонтальное), далее кодируется позиция разбиения, на что требуется )о§2 г! [ или )о§2 с ^ [ бит для вертикального и горизонтального разбиения соответственно. Причем г! и с ^ - число возможных линий деления по вертикали и горизонтали для данной области.

Модифицируем описанный базовый метод. Пусть дано дерево декомпозиции, построенное по базовому алгоритму. Добавим дополнительные узлы в это дерево, руководствуясь правилом (2). Начиная с оконечных узлов дерева, будем продвигаться по направлению к его корню и для каждого составного узла вычислять выигрыш от добавления узла горизонтальной декомпозиции. Если выигрыш в битах положителен, узел добавляется. В противном случае поднимаемся на уровень выше. Функция цены (1) в этом случае примет следующий вид: Ык ЫУ Нал

/см = Х +Хьу + 4ХК -1082 8.,

I I I

где 8 - параметр аппроксимации.

Рис. 4. Результаты эксперимента: сравнение модифицированной и базовой схемы компрессии (Kcomp - коэффициент сжатия, 1од2а-число разрядов отсчета амплитуды)

Результаты тестирования алгоритма для изображения «LENA» представлены на рис. 4. Результаты эксперимента свидетельствуют, что модифицированный алгоритм в среднем на 3-8 % превосходит базовый по степени сжатия.

2 Формат данной работы не позволяет подробно описывать базовую схему, поэтому предлагаем читателям обратиться к указанным источникам.

Заключение

В работе был описан подход к сжатию изображений на основе трехмерной декомпозиции сигнала. Было показано, как на его основе можно составить новые и модернизировать уже существующие схемы компрессии.

Так, в качестве базовой схемы компрессии был взят алгоритм кодирования на основе адаптивной сегментации с минимаксным контролем ошибки. Применяя разработанную нами технику, мы добились улучшения характеристик данной схемы. Отметим, что подобную модернизацию можно произвести со многими другими алгоритмами на основе адаптивной сегментации, описанными, например, в [5].

В качестве дальнейшей исследовательской деятельности нам представляется важным исследовать вопрос о более компактном кодировании дерева декомпозиции.

Литература

1. Samet H. Octree approximation and compression methods // 3DPVT02. - 2002. - P. 460-469.

2. Samet H. Applications of spatial data structures to computer graphics. - Addison-Wesley, 1990. - 512 p.

3. Donoho D.L., Huo X. Beamlets and Multiscale Image Analysis. Multiscale and Multiresolution Methods, Springer Lecture Notes in Computational Science and Engineering / Ed. T.J. Barth, T. Chan, and R. Haimes. - 2002. - V. 20. - P. 149-196.

4. Dalai M., Leonardi R. L-inf Norm Based Second Generation Image Coding // ICIP04. -2004. - P. 3193-3196.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Shukla R. Rate-distortion optimized geometrical image processing: Ph.D. dissertation, Swiss Federal Inst. Technol. - Lausanne, Switzerland, 2004.

Лужков Юрий Валерьевич

Тропченко Александр Ювенальевич

— Санкт-Петербургский государственный университет информационных технологий, механики и оптики, аспирант, [email protected]

— Санкт-Петербургский государственный университет информационных технологий, механики и оптики, доктор технических наук, профессор, [email protected]

УДК 536.48

ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ ГИНЗБУРГА-ЛАНДАУ

ДЛЯ СВЕРХПРОВОДЯЩИХ ПЛАСТИН С ИСПОЛЬЗОВАНИЕМ РАЗЛИЧНЫХ ГРАНИЧНЫХ УСЛОВИЙ

П.И. Безотосный, А.Н. Лыков, А.Ю. Цветков

Численными методами было изучено влияние граничных условий на решения уравнений Гинзбурга-

Ландау для тонких сверхпроводящих пластин в безвихревом пределе.

Ключевые слова: сверхпроводимость, уравнения Гинзбурга-Ландау, граничные условия

Введение

Уравнения Гинзбурга-Ландау имеют фундаментальный характер, и нахождение их точного решения полезно для многих задач сверхпроводимости, в частности, для проверки применимости самих уравнений для описания свойств высокотемпературных

Исследование алгоритмов сжатия с потерями на основе пространственной декомпозиции сигнала Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Лужков Юрий Валерьевич, Тропченко Александр Ювенальевич

Похожие темы научных работ по математике , автор научной работы — Лужков Юрий Валерьевич, Тропченко Александр Ювенальевич

ANALYSIS OF ALGORITHMS OF THE LOSSY COMPRESSION BASED ON THE SPACE SIGNAL DECOMPOSITION

Текст научной работы на тему «Исследование алгоритмов сжатия с потерями на основе пространственной декомпозиции сигнала»