УДК 004.627
СЖАТИЕ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА/СИНТЕЗА
Е. Г. ЖИЛЯКОВ Н. К. ВЕСЕЛЫХ
Белгородский
государственный
национальный
исследовательский
университет
e-mail:
Анализ распределений энергии изображений показывает, что подавляющая ее доля сосредоточена в небольшой части двумерной частотной области с границами в точках [-ив тг]. Следовательно, эту небольшую часть частотной области можно считать информационной. Поэтому, адекватным подходом к сжатию изображений может служить сохранение информации о компонентах изображения из этой частотной подобласти. Такой подход естественно называть субполосным анализом/синтезом изображения.
Исходя из этого, в работе используется метод субинтервального преобразования [1,2], основанный на выделении компонент изображения, характеризующихся проявлением повышенной концентрации спектральной энергии в отдельных частотных интервалах.
Ключевые слова: изображение, субполосный анализ, субполосный синтез, доли энергии, подобласти пространственных частот, информационный частотный интервал, свойства субполосных матриц
Введение
В настоящее время, многие отрасли техники, имеющие отношение к получению, обработке, хранению и передаче информации, в значительной степени ориентируются на развитие систем, в которых информация представлена в виде изображений, представляющих собой один из наиболее распространенных типов данных.
Изображения занимают больше места в памяти, чем текст. Например, иллюстрация размером 500x800 пикселей занимает порядка 1.2 Мб — столько же, сколько художественная книга из 400 страниц (60 знаков в строке, 42 строки на странице). Возникает проблема сокращения объемов битовых представлений графических файлов (сжатия данных).
Кодирование информации — процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для обработки, хранения или передачи этой информации [1]. При сжатии, битовому представлению исходного изображения ставится в соответствие другой объем данных, для кодирования которых требуется меньшее количество бит.
Вычисление точных значений энергии изображения в заданных частотных интервалах (субинтервалах)
Вычисление энергетического спектра изображения позволяет получить представление о распределении его энергии по так называемым частотным интервалам. Известно, что алгоритмы, использующие преобразование Фурье и БПФ, не позволяют вычислять точные значения энергетических характеристик в заданных частотных интервалах [2]. Умение точно определять долю энергии сигнала в отдельном частотном диапазоне обеспечивает возможность более качественного выбора параметров различных преобразований визуальной информации.
D3
-Pi -Pi
D4
ai __
а2' u
Do
SSI
D
Pi
Pi
Di
Рис. 1. Двумерная частотная область D (субинтервал)
v
Рассмотрим некоторую симметричную двумерную частотную область П, которую будем называть субинтервалом (рис. 1).
О :{О(и,у)\(и е[«,«2] V е[Д, Д2])и и (и е [ах,а2], V е [- Д2,-А]) и
и (и е[-«2,-«1 V е[-Д2,-Д]) и (1)
и (и е [-«2,-«11 V е [Д1,Д2Ь},
где 0 < «, а2, Д, Д2 < л Можно показать, используя равенство Парсеваля, что точное значение доли энергии двумерного сигнала /(х, у) в двумерной частотной области О (1) при известном Фурье-образе ^(и, V) определяется выражением:
Ро = ^2 Я (и ^|2 ^^.
(2)
(и ,v)еQ
Рассмотрим далее дискретный конечный двумерный сигнал (изображение) в виде матрицы Ф = I = 1,2,...,М,к= 1,2, ...,ЛГ, элементы которой представляют собой значения яркости в равноотстоящих точках пространственной области.
Выражение для определения доли энергии дискретного сигнала Ф = (/¿к) в частотной области П может быть преобразовано следующим образом [1,3]:
М N М N
РО = X X X X аЧЧ \кг ^кК (3)
Ц =1к[ =1^ =1к2 =1
где матрицы А = (а; и В = {Ьь ь), размерности МхМ и МхМ, вычисляются в соответствии с выражениями (4), (5):
^/п(«2(/1 -¿г))-Ят«^ -/2))
л(/1 - /2) '
СХ^ /1 = /2'
Л
Я/п(Д2(к\ - к2))- Б/п(Д1(к1 - к2))
л (к - Л)
Д2 -Д Л к1 = к2
1 Ф и
к1 Ф к2'
(4)
(5)
Сгруппируем слагаемые следующим образом:
/, =1
М N М V N
РО = X X X акЧ^кК X
Х\
к и к
....... ...... (6)
Vк1 =! V¿1 =!
Данное выражение позволяет записать формулу вычисления значения энергии Рп дискретного двумерного сигнала Ф в частотной двумерной области О, используя матричные обозначения, в следующем виде:
Рл = Ггес(АТ -Ф-Б) (7)
где Ф - исходное изображение, А и В - субполосные матрицы.
Соотношение (7) определяет метод субинтервальной обработки изображений на основе частотных представлений и позволяет для нахождения значения энергии двумерного сигнала в любой частотной двумерной области О построить вычислительную процедуру, не вычисляя при этом трансформанту Фурье [1,2,4].
Определение информационных частотных интервалов
Частотное пространство предлагается неравномерно разбить на субинтервалы в соответствии с выражениями (8), (9):
(:2Па + 1)15^ = тг (8)
(2ДЬ + 1)11^ = тг (9)
12
где йс и - количество частотных интервалов по оси абсцисс и ординат частотного пространства соответственно;
> _ нулевые частотные интервалы на оси абсцисс и ординат частотного пространства соответственно:
Тогда, на основании выражений (8)-(ю), получаем:
М = 2(2 Па + 1); (11)
N = 2(2ЯЬ + 1); (12)
Таким образом, для изображения размерностью (МхН) количество частотных интервалов йп и вдоль осей абсцисс и ординат частотного пространства соответственно, определяется следующими выражениями:
=
М- 2
ЛГ-2
(13)
Ширина остальных частотных интервалов, не считая нулевого, является вдвое большей и равна:
На рис. 2 показано неравномерное разбиение частотного пространства изображения на субинтервалы:
Рис. 2. Неравномерное разбиение области определения трансформанты Фурье на субинтервалы
При таком разбиении частотного пространства, элементы всех субполосных матриц можно вычислять из выражений (15), (16):
Атл = К;} = (2 ■ < ■ - *))}; (15)
= 1 = 1,2.....М- к = 1,2,...,^;
К = Ш = (2 ■ Ь?к ■ соз{о>т Ц - к))}; (16)
г2= 1.....1=1,2.....М; к= 1,2.....Я;
где А0 = {а^} и50= - нулевые матрицы, значения элементов которых можно вычислить из формул (4), (5).
Для того, чтобы определить, какие частотные интервалы, предположительно, являются информационными, необходимо ввести порог И, который представляет собой среднее значение энергии изображения на один частотный интервал:
= "Ъ" - ) (>: " >:) (17)
Частотный интервал, значение энергии которого превышает установленный порог, в рамках данного исследования считается информационным.
Выделение компонент изображений из информационных частотных интервалов
Для того, чтобы восстановить изображение по сумме компонент информационных частотных интервалов, используется метод оптимальной линейной фильтрации изображений, разработанный и теоретически обоснованный в работе [1]. Он является оптимальным в том смысле, что спектр получаемого в результате фильтрации изображения имеет наименьшее среднеквадратическое отклонение от спектра фильтруемого изображения в заданном двумерном частотном интервале, а вне этого интервала имеет наименьшее отклонение от нуля.
Метод оптимальной фильтрации изображений на основе частотных представлений позволяет для нахождения результатов фильтрации изображения = : = - - ■ -■.'=!- . Л", в частотной двумерной области П построить вычислительную процедуру, не вычисляя при этом трансформанту Фурье. Для фильтрации изображений предложено использовать следующий вариационный принцип: трансформанта Фурье Z(u,v) результата фильтрации является оптимальной в смысле евклидовой нормы ее отклонения в заданном частотном интервале П от трансформанты Фурье F(u,v) исходного изображения Ф и от нуля - вне данного интервала:
Jj|F(u,v)—Z{u,v)\ dudv + jj\Z{u,v)|2dudv => min ^g-j
Указанному вариационному принципу соответствует следующее изображение Уп, которое в матричной форме имеет вид:
Yn = А ■ Ф ■ В (19)
где А = (а; 1ЛЛ2 = и В = (¿>k ),klrk2 = 1,2- субполосные матри-
цы размерности MxM и NxN; Ф - исходное изображение.
Таким образом, для того, чтобы выделить набор компонент изображения
Frir2, которые относятся к некоторому частотному интервалу
ra' r\ — 1j2, г2 — 1,2,... ,Rb, необходимо вычислить:
Тогда, сумма компонент, принадлежащих информационным частотным интервалам, будет выглядеть, как:
II
F =
F Г1Г2
(21)
где Д ! и Д2 есть множества, определяющие информационные частотные интервалы.
На рис. 3-6 представлены: исходное изображение; диаграмма распределения значений его энергии; диаграмма с обозначенными информационными интервалами (выде-
лены черным цветом); результат выделения компонент, принадлежащих информационным частотным интервалам.
Рис. 5. Результат восстановления Рис. 6. Информационные частотные интервалы
(выделены черным цветом)
На рисунке 6:
- Рассчитанное количестве частотных интервалов Яа=32; Яь=32';
- Общее количество частотных интервалов - 1024;
- Количество информационных частотных интервалов - 51;
- В них сосредоточено 0.9446 энергии изображения
При этом, вызывает интерес выделение компонент изображений, принадлежащих частотным интервалам, не отнесенным к информационным. На рис. 7-8 представлены: исходное изображение; результат выделения компонент, принадлежащих частотным интервалам, не отнесенным к информационным (выделены белым цветом на рис. 6).
Рис. 7. Исходное изображение размерностью 130х130 пикселей
Рис. 8. Результат восстановления
Как видно из рисунка (контур объекта, контур его тени, мелкие детали, прожилки), совокупность отброшенных субинтервалов в наибольшей степени отвечает за резкость восстанавливаемого изображения.
Сжатие/восстановление изображений
Поскольку, матрицы ЛГ1 и ВРп являются симметрическими, то данные матрицы можно представить, используя их собственные числа и собственные векторы, в следующем виде:
= (-) VВ ЬВ^В '
где столбцы матриц 1 и С?/- составлены из значений собственных векторов матриц Аг и
соответственно:
(23)
матрицы Ьл и Ьз - квадратные матрицы, на главной диагонали которых расположены значения их собственных чисел
Будем в дальнейшем считать, что значения собственных чисел упорядочены по убыванию, т.е.:
> Щ >
- лм> .
(25)
Подставив полученные выражения (26) в выражение (24), получим следующее выражение для определения результата оптимальной фильтрации:
РГл Гг = Q2LrXQrfфQr¿Lт¿Qrf. (26)
Выражение
«V, (27)
естественно назвать субинтервальным преобразованием [1] изображения в некотором частотном интервале Л^ г3 • Именно субинтервальное преобразование является основой для построения алгоритма сжатия изображений.
Количество элементов в матрице субинтервального преобразования, определяемого выражением (31), совпадает с количеством элементов изображения. Ниже представлен подход для уменьшения количества элементов в матрице субинтервального преобразования.
Для восстановления результата субинтервального преобразования изображения, соответствующего выбранному частотному интервалу следует выполнить следую-
щую операцию:
Р = О -С
1 г. г„ VА ^
о -
Г, Г„ ЧГД
г,Г
(28)
Рассмотрим следующие величины Д. и , позволяющие выделить ненулевые собственные числа субполосных матриц:
Зл = 2
М 2Я
+ 2 и = 2
N
Ж
+ 2,
(29)
где операция [выражение] означает операцию взятия целой части «выражения».
Величины и определяют количество ненулевых собственных чисел матриц Аг и соответственно [1,4]- Таким образом, с достаточной степенью обоснованности, для матриц АГ1 и 5Р п можно использовать следующую аппроксимацию при условии разбиения (в данном случае неравномерного) области определения трансформанты Фурье на Яа и Яъ частотных интервалов вдоль координатных осей:
I (30)
(31)
А, ЫАЛ
* Б.
— пА
— г,В
и.
где
чц - ( =( Ч, = (
ч,=(
ЧЬ Чг, чЬч1
•Ч
*2 ,
(32)
(33)
(34)
(35)
Учитывая приближенное представление субполосных матриц, для нахождения
Аг ч, Л
1* 2'
.
Ан, Д-
матриц субинтервального преобразования изображения Ф в некотором частотном интервале^^, = 1,2, т2 = 1,2,.,., Ль, можно использовать следующее выражение:
- ТА
ф ^ (36)
Для восстановления результата субинтервального преобразования изображения, соответствующего выбранному частотному интервалу Я,.,,.,, следует выполнить следующую операцию:
Поскольку частотная область была разбита на ЯахЯь частотных интервалов, то приведенные выше операции следует выполнить для каждого интервала
Восстановление исходного изображения после субинтервальных преобразований осуществляется на основании значений субинтервальных матриц каждого частотного интервала, на которые была разбита частотная область, следующим образом:
Яъ
ЯЬ
Гц
(38)
= 1 Тг = 1
= 1 7>=1
Количество элементов каждой из матриц Сг субинтервального преобразо-
вания, определяемого выражением (40), равняется следующей величине:
= -и, = 1,2.....гг = 1,2.....пь (39)
Поскольку вся частотная область разбита на Ыкк частотных интервалов:
(40)
то количество элементов всех матриц (С^ }, определяется величиной :
то есть суммарное количество элементов на первом этапе субполосного преобразования изображения для всех частотных интервалов превышает количество элементов (точек) изображения.
Для уменьшения количества бит, необходимого для хранения множества (С,. }, предлагается для восстановления использовать только те субинтервальные преобразования, которые соответствуют информационным частотным интервалам. Таким образом, количество матриц [С^ ^} значительно уменьшится, что снизит затраты ресурсов на их хранение и передачу.
Следовательно, процесс восстановления исходного изображения описывается выражением:
А Т
■ С (42)
где Ra и Rb есть множества, определяющие информационные частотные интервалы.
Экспериментальные исследования были направлены на сравнение показателей качества восстановленных изображений, которые были получены с использованием метода субполосного анализа/синтеза, а также методов JPEG и JPEG2000. Это необходимо, прежде всего, для получения объективного представления о потенциальной перспективности исследуемого субполосного подхода к сжатию изображений и о его позициях среди конкурирующих решений.
Используемые показатели качества для восстановленного и исходного изображений:
1. Среднеквадратическое отклонение S с добавлением коэффициента а
(43)
где — исходное изображение размерностью (МхЫ); восстановленное изображение после сжатия; а - коэффициент, который вычисляется:
Рцс
а
^ilt
(44)
2. Показатель резкости:
11''2
= :'1;;=:Г.;=::':Л, - л - " (45)
3. Оценка контраста:
QI = ■
n n2 -1
Т т
fi,k fi,k+1 fi,k + fi,k+1
N1-1 N2
тт
i=1 j=1
fi,k fi+1,k fi,k + fi+1,k
N.(N2 -1)
N 2( N1 -1)
(46)
4. Пиковое отношение сигнала к шуму восстановленного изображения Ф относительно исходного изображения Ф определяются на основании выражения:
2552
РШЖфф) = 101og1 n. n2--f .
т т (ф -Ф J2 (47)
N1N2т ту j
На рис. 9-12 представлены исходное изображение и результаты его восстановления после сжатия алгоритмами JPEG, JPEG2000 в сравнении с результатом субполосного анализа/синтеза.
Рис. 9. Исходное изображение размерностью 25бх25б пикселей
Рис. 10. Результат восстановления после субполосного анализа/синтеза (КС=ю)
Рис. 11. Результат восстановления после сжатия Рис. 12. Результат восстановления после сжатия
1
1=1 k=1
2
У
алгоритмом JPEG (КС=10) алгоритмом JPEG2000 (КС=10)
Таблица 1
Уточняющие данные о результатах субполосного анализа/синтеза
Количество частотных интервалов 4096
Количество информационных частотных интервалов 183
Доля энергии, заключенная в информационных частотных интервалах 93,74%
Коэффициент сжатия 10
Таблица 2
Характеристики качества восстановленных изображений
---^^^^^^ Алгоритм Характеристика --^^^^ JPEG Субполосный анализ/синтез JPEG2000
Коэффициент сжатия 10
СКО 0.1343 0.0688 0.0691
Коэффициент резкости исходного изображения 22.4836
Коэффициент резкости восстановленного изображения 15.2950 19.3542 16.7896
112.7827 130.1432 129.8679
Контрастность 0,000154 0,000177 0,000155
Уровень адаптации зрительной системы 0.877 0.878 0.891
На рис. 13 показаны увеличенные фрагменты результатов, представленных на рис. 9-12.
Рис. 13. Фрагменты восстановленных изображений: а) исходное изображение; б) результат восстановления после субполосного анализа/синтеза; в) результат восстановления после сжатия алгоритмом JPEG; г) результат восстановления после сжатия алгоритмом JPEG2000
В случае использования алгоритма субполосного анализа/синтеза, искажения восстановленного изображения не являются регулярными (блочность в JPEG проявляется как горизонтальные/вертикальные границы через каждые 8 пикселов). В значительной степени, искажения зависят от структуры изображения, проявляясь, в основном, в сильно детализированных областях или вокруг резких границ. Это выгодно отличает субполосный подход от стандарта JPEG.
Стандарт JPEG2000 допускает появление эффекта сильного сглаживания деталей (размытия контуров) при той же степени сжатия, что и субполосный метод. Результаты субполосного анализа/синтеза при этом позволяют сохранить основные очертания наблюдаемых объектов, что проявляется в более высоких значениях показателей резкости и среднеквадратического отклонения.
Заключение
Таким образом, для уменьшения количества бит, необходимого для хранения множества субинтервальных преобразований {Сг р}, предлагается для восстановления использовать только те субинтервальные преобразования, которые соответствуют информационным частотным интервалам.
Так, на примере изображения 10, для достижения коэффициента сжатия КС=10, необходимо учитывать свойства 183 информационных частотных интервалов. При использовании собственных векторов, соответствующих 6 ненулевым собственным числам, для хранения субинтервальных преобразований требуется массив из 6588 элементов, тогда как исходное изображение хранится в массиве объемом 65536 элементов.
Для исследования характеристик эффективности предлагаемого подхода выполнены вычислительные эксперименты по моделированию процессов сжатия различных изображений. Для сравнения использовалось сжатие на основе широко применяемых алгоритмов JPEG и JPEG2000.
Список литературы
1. Жиляков, Е.Г. Вариационные алгоритмы анализа и обработки изображений на основе частотных представлений: моногр. / Е.Г. Жиляков, А.А. Черноморец. - Белгород: Изд-во ГиК, 2009. - 146 с.
2. Жиляков, Е.Г. Методы анализа и построения функций по эмпирическим данным на основе частотных представлений [Текст] / Е.Г. Жиляков. - Белгород, изд-во БелГУ, 2007. - 160 с.
3. Жиляков, Е.Г. Метод определения точных значений долей энергии изображений в заданных частотных интервалах [Текст] / Е.Г. Жиляков, А.А. Черноморец, И.В. Лысенко // Вопросы радиоэлектроники. Сер. РЛТ. — 2007. — Вып. 4. — С. 115-123.
4. Жиляков, Е.Г. Частотный анализ речевых сигналов / Е.Г. Жиляков, Е.И. Прохоренко // Научные ведомости Белгородского государственного университета. - Белгород, 2006. -№2 (3.118), выпуск 3. - С. 201-208. - (Серия: информатика и прикладная математика).
5. Черноморец, А.А. Оценка количества значимых долей энергии изображения, определяемых его проекциями на собственные векторы субполосных матриц [Текст] / Е.Г. Жиляков, А.А. Черноморец // Информационные системы и технологии. — № 3 (71). — 2012. — С. 51-58.
IMAGE COMPRESSION BASED ON SUBBAND ANALYSIS/SYNTHESIS
Energy distributions analysis of images shows that the majority of energy is concentrated in a small part of a two-dimensional frequency domain with a boundary at the point [-я; я]. This small part of the frequency domain can be considered as informational. Storing information about the components of the image of some informational frequency sub-areas is a way of image compression called subband analysis / synthesis image.
In the work using method of conversion, based on the allocation of image component, characterized by elevated concentrations of spectral energy in specific frequency ranges.
Е. G. ZHILYAKOV N. K. VESELYKH
Belgorod State National Research University
e-mail:
Keywords: image, subband analysis, subband synthesis, energy parts, spatial frequencies subareas, informational subarea.