Научная статья на тему 'Параметризация нелинейного предсказателя Грехэма при компрессии цифровых изображений'

Параметризация нелинейного предсказателя Грехэма при компрессии цифровых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
194
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компрессия цифровых изображений / предсказатель Грехэма / квантование / шкала Макса / ДИКМ / квадратичная погрешность / максимальная погрешность / digital image compression / Greham predictor / quantization / Max scale / DPCM / mean square error / maximum error

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гашников Михаил Валерьевич

Производится параметризация нелинейного предсказателя Грехэма для метода компрессии цифровых изображений на основе дифференциальной импульсно-кодовой модуляции. Предсказатель автоматически выбирает различные способы расчета для каждого пиксела изображения с учетом наличия и выраженности контура в этом пикселе. Перед собственно компрессией производится быстрая процедура обучения, оптимизирующая параметры предсказания. При оптимизации обеспечивается минимум суммы модулей погрешностей предсказания. Для этого используется рекуррентная процедура, вычислительная сложность которой не зависит от размера изображения. Приводится оценка вычислительной сложности предложенного предсказателя. Для исследования предсказателей проводятся вычислительные эксперименты на реальных изображениях. Показан выигрыш предложенного предсказателя у прототипов по квадратичной погрешности. Кроме того, показан выигрыш метода компрессии на основе дифференциальной импульсно-кодовой модуляции с предлагаемым предсказателем у метода компрессии JPEG по максимальной погрешности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гашников Михаил Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Parameterization of the nonlinear Greham predictor for digital image compression

Parameterization of the nonlinear Greham predictor is performed for a digital image compression method based on the differential pulse code modulation. The predictor automatically selects different methods for calculating each pixel in the image based on the availability and intensity of that pixel contour. A fast learning procedure that optimizes the prediction parameters is performed before the actual compression. In the course of optimization, the minimum sum of absolute values of prediction errors is provided. For this purpose, a recursive procedure is used, whose computational complexity is independent of the image size. The estimation of the computational complexity of the proposed predictor is conducted. To study the predictors computational experiments are carried out on real images. A gain the proposed predictor offers in terms of the root mean square error when compared with the prototypes is demonstrated. In addition, a gain that the compression method based on the differential pulse code modulation with the proposed predictor has over the JPEG compression method in terms of the maximum error is demonstrated.

Текст научной работы на тему «Параметризация нелинейного предсказателя Грехэма при компрессии цифровых изображений»

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

ПАРАМЕТРИЗАЦИЯ НЕЛИНЕЙНОГО ПРЕДСКАЗАТЕЛЯ ГРЕХЭМА ПРИ КОМПРЕССИИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ

М.В. Гашников 1

1 Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет) (СГАУ), Самара, Россия

Аннотация

Производится параметризация нелинейного предсказателя Грехэма для метода компрессии цифровых изображений на основе дифференциальной импульсно-кодовой модуляции. Предсказатель автоматически выбирает различные способы расчета для каждого пиксела изображения с учетом наличия и выраженности контура в этом пикселе. Перед собственно компрессией производится быстрая процедура обучения, оптимизирующая параметры предсказания. При оптимизации обеспечивается минимум суммы модулей погрешностей предсказания. Для этого используется рекуррентная процедура, вычислительная сложность которой не зависит от размера изображения. Приводится оценка вычислительной сложности предложенного предсказателя. Для исследования предсказателей проводятся вычислительные эксперименты на реальных изображениях. Показан выигрыш предложенного предсказателя у прототипов по квадратичной погрешности. Кроме того, показан выигрыш метода компрессии на основе дифференциальной импульсно-кодовой модуляции с предлагаемым предсказателем у метода компрессии JPEG по максимальной погрешности.

Ключевые слова: компрессия цифровых изображений, предсказатель Грехэма, квантование, шкала Макса, ДИКМ, квадратичная погрешность, максимальная погрешность.

Цитирование: Гашников, М.В. Параметризация нелинейного предсказателя Грехэма при компрессии цифровых изображений / М.В. Гашников // Компьютерная оптика. - 2016. - Т. 40, № 2. - С. 225-231. - DOI: 10.18287/2412-6179-2016-40-2- 225-231.

Введение

Все методы компрессии на основе дифференциальной импульсно-кодовой модуляции (ДИКМ) [1-5] так или иначе эксплуатируют идею кодирования разностного сигнала (изображения) вместо исходного. Разностный сигнал вычисляется вычитанием из каждого отсчета исходного сигнала некоторого предсказанного значения. Переход к разностному представлению декоррелирует сигнал, что приводит к повышению эффективности его компрессии.

Несмотря на простоту лежащей в основе идеи, ДИКМ обладает существенными преимуществами, наиболее важными среди которых является низкая вычислительная сложность и возможность обеспечения постоянной скорости формирования выходного потока сжатых данных. Благодаря этому ДИКМ по-прежнему перспективен при компрессии данных дистанционного зондирования Земли [6-9], в геоинформационных системах [10-12], а также включен в качестве одного из этапов в другие методы компрессии цифровых изображений, например JPEG [13].

Важным этапом ДИКМ является предсказатель, точность и скорость которого оказывают существенное влияние на эффективность метода в целом. При этом для предсказания в ДИКМ чаще всего используются тривиальные схемы, основанные на простом усреднении по ближайшим пикселам изображения. Причиной этого является желание сохранить на достаточно низком уровне вычислительную сложность компрессии. В этой ситуации актуальной является задача разработки предсказателей, позволяющих повысить эффективность компрессии при сохранении вычислительной сложности на приемлемом уровне.

В данной работе предлагается адаптивный предсказатель, который позволяет повысить эффективность метода ДИКМ за счет использования различных способов предсказания для каждого пиксела изображения в зависимости от направления контура в окрестности этого пиксела.

Работа построена следующим образом. В первом пункте приведено краткое описание общей схемы метода компрессии цифрового изображения на основе ДИКМ. Во втором пункте рассмотрено предсказание для ДИКМ и описано построение адаптивного параметризованного предсказателя. В третьем пункте описана процедура обучения адаптивного предсказателя. В четвёртом пункте кратко рассмотрены способы квантования в ДИКМ. В пятом пункте приведены результаты вычислительных экспериментов на реальных изображениях.

1. Дифференциальная импульсно-кодовая модуляция при компрессии изображений

Рассмотрим процедуру компрессии изображения на основе ДИКМ. Пусть x(m, n) - отсчеты исходного цифрового изображения (для простоты изложения целочисленные неотрицательные), которое подвергается компрессии, а x (m, n) - отсчеты декомпрессированного (восстановленного после компрессии) изображения. При компрессии изображение обрабатывается построчно. При этом для каждого отсчета на основе уже прошедших компрессию и восстановление отсчетов вычисляется предсказанное значение

X(m,n) = P{ x(i, j): i < m or i = m and j < n } , (1)

где Р - функция предсказания, которая работает на основе восстановленных отсчётов х (т, п) для обеспечения идентичности предсказания на этапах компрессии и декомпрессии. Затем предсказанное значение вычитается из исходного для получения разностного сигнала

/(т,п) = х(т,п)-X(т,п) , (2)

который подвергается квантованию

/ (т,п) = е (/ (т,п)) , (3)

где е - функция квантования, а / (т,п) - квантованный разностный сигнал, который упаковывается в канал связи либо архивный файл. Затем производится восстановление текущего отсчета

х(m,n) = f (m,n) + x (m,n) .

(4)

Восстановленный отсчет используется для предсказания (1) следующего отсчета.

Процедура декомпрессии на основе ДИКМ принимает на вход распакованный из канала связи или архивного файла квантованный разностный сигнал / (т,п) и состоит из шагов предсказания (1) и восстановления (4).

2. Предсказание при компрессии изображений на основе ДИКМ

В целях уменьшения вычислительной сложности в ДИКМ обычно используются очень простые предсказатели [14], использующие только ближайшие к предсказываемому отсчёты изображения. Рассмотрим примеры таких предсказателей и пронумеруем их:

Х(0) (т, п ) = х (т -1, п) , (5)

х(1) (m,n) = (x (m -1,n) + х (m,n - \f)j2,

x(2) (m,n) = x (m,n -1) .

(6)

(7)

Рассмотренные предсказатели линейны и поэтому обязательно будут ошибаться на контурах. Под контуром здесь понимается пространственно протяжённый перепад яркости, не обязательно замкнутый (граница между однородными фрагментами изображения). Для сокращения ошибки предсказания на контурах обычно используются нелинейные схемы, например предсказатель Грехэма [15]:

[х(0) (тп), И Хт (m,п) <ХЯ(тп); хх (т, п) = ^ (8)

I Х(2) (т,п), if 1т (т,п) >1п (т,п),

где

1m (m,n) = х (m,n -1)- x (m -1,n -1)

1n (m, n )= x (m -1, n)-x (m -1, n -1) .

(9)

(10)

Сравнение разностей (9) и (10), соответствующих жирным линиям на рис. 1, используется для опреде-

ления направления контура в окрестности текущего отсчета, а выражение (8) обеспечивает предсказание «вдоль» контура, т.е. вдоль той стрелки на рис. 1, которой соответствует меньшая из разностей (9-10).

Такой предсказатель, в отличие от усредняющей схемы (6), точнее работает на контурах, но менее точен на относительно ровных участках, где ему мешают шумы. Другими словами, погрешность предсказания (2) нелинейной схемы (8) на контурах меньше, чем погрешность усредняющей схемы (6) за счёт того, что нелинейная схема использует соседние точки контура с близкой яркостью, а не точки соседних однородных областей, яркость которых может заметно отличаться. С другой стороны, линейная схема (6) более точна на ровных участках, т. к. влияние шума при использовании этой схемы уменьшается за счёт усреднения по соседним отсчётам.

(т,п-1)

(т,п)

Рис. 1. Предсказатель Грехэма для ДИКМ В данной работе предлагается адаптивный предсказатель, совмещающий преимущества «усредняющего» предсказателя (6) и предсказателя Грехэма (8) за счет автоматического переключения между ними в каждой точке изображения. Идея предсказателя, который работает похожим образом, была предложена в [16] для другого метода сжатия, основанного на представлении изображения в виде квадродерева.

+

+

4

Я.Н A.W х

Рис. 2. Адаптивный предсказатель для ДИКМ

В данной работе произведена модификация этого предсказателя для его использования в методе ДИКМ, результатом которой является предлагаемый адаптивный предсказатель:

x(0) (m,n), if 1(m,n) <1(-);

x(1) (m,n), if 1(-) <1(m,n) £l(+); (11) x(2) (m, n), if <1(m, n), где «признак контура» 1(m, n) вычисляется следующим образом:

1(m,n) = 1m (m,n)-1n (m,n) , (12)

а 1(-), 1(+} - пороги переключения, удовлетворяющие условию:

x" (m, n) =

- x <1(-) < 0 <1(+) <.

(13)

где [0, Хшах ] - диапазон возможных значений яркости

изображения.

Нетрудно видеть, что предсказатель (11) также можно рассматривать как параметризацию предсказателя Грехэма (8). При этом знак «признака контура» 1(т, п) характеризует направление, а его модуль характеризует степень выраженности контура в точке (т, п). При этом 1(+), 1(-) задают пороги переключения между предсказателем Грехэма и усредняющим предсказателем (6). Если в текущей точке есть достаточно выраженный контур, то будет использовано предсказание «вдоль контура» (с учетом направления), если же сильно выраженного контура нет, то произойдет усреднение по двум ближайшим уже обработанным отсчетам. Пороги 1(+), 1(-) вычисляются автоматически процедурой обучения и перед собственно процедурой компрессии (один раз для изображения), что позволяет алгоритму адаптироваться к особенностям каждого конкретного изображения. Вычисленные при компрессии пороги 1(+), 1(-) упаковываются в архивный файл (или канал связи) и затем используются при декомпрессии.

3. Обучение адаптивного предсказателя при ДИКМ-компрессии изображений

Т.к. предсказатель должен работать как можно точнее, то подбор параметров предсказателя 1(+), 1(-) можно производить исходя из минимизации суммы модулей погрешности предсказания:

5(1(+), 1(-) )= х X (

(т,п)е>

т,п)-х(т,п)® шт , (14)

где ю - множество координат всех отсчётов изображения. Введём также в рассмотрение множества ю(+), ю(-), ю(0) координат отсчётов изображения, для которых значение признака контура (12) положительно, отрицательно и равно нулю соответственно. Тогда погрешность предсказания, вычисленная по отсчётам, для которых признак контура (12) положителен, можно записать следующим образом:

§(+) (1») = X |х(т,п)-х(т,п)|. (15)

(т,п)ею(+)

Нетрудно видеть, что эта погрешность зависит от положительного порога 1(+) и не зависит от отрицательного порога 1(-). Аналогичным образом можно записать погрешности предсказания 5(-)(1(-)), 5(0) по отсчетам с отрицательным и нулевым значением признака (12) соответственно, при этом 5(-)(1(-)) зависит от только отрицательного порога 1(-), а 5(0) вообще от порога не зависит. Во введенных обозначениях погрешность предсказания может быть представлена в виде:

5(1(+), 1(-)) = 5(-) (1() + 5(0) + 5(+) (1(+)). (16)

Такое представление позволяет факторизовать двумерную задачу оптимизации (14) на две одномерных задачи:

(17)

1(+) = а^шш 5(+) (1)

1(-) = а^шт 5(-) (1) .

(18)

Рассмотрим решение задачи (17). Для этого понадобится предварительный проход по изображению (обучение предсказателя), при котором заполняется матрица

Ла = X |Х 1 тп

(т,п)ею(1)

(т,п)- х^ (т,п)|

(19)

содержащая суммарные значения погрешности предсказания интерполятора номер I (5-7) для всех отсчётов, для которых значение признака (12) равно 1. Диапазоны изменения индексов матрицы:

0 < I < 2, - Хшах <1< Хшах . (20)

После заполнения этой матрицы одномерный массив значений погрешности (15) можно заполнить с помощью рекуррентной схемы

Хшах

§(+) (Хшах ) = X Л^, (21)

1=0

5м(1) = 5(+)(1 + 1) + Л2,1-Л1Д,0<1<Хшах , (22)

вычислительная сложность которой не зависит от размера изображения.

Этот массив имеет длину всего (Хшах+1), и оптимальное значение 1(+) может быть найдено в таком массиве простым перебором. На этом решение задачи (17) закончено. Задача (18) решается аналогично, с использованием того же самого предварительного прохода по изображению (второй предварительный проход не понадобится). В результате задача обучения адаптивного предсказателя будет решена, т.е. будут найдены пороги переключения 1(+), 1(-).

Таким образом, для каждого пиксела изображения вычисляются два из трех предсказанных значения (57) и признак (12), а также заполняются два элемента матрицы (19). Кроме того, после первого прохода по изображению дважды запускается рекуррентная схема (21-22). Вычислительная сложность такого расчёта для изображения размера составляет

и = 9 + (6Хшах/МЫ) (23)

аддитивных операций на отсчёт (в предположении, что деление на два и вычисление модуля не требует арифметических операций), причём вклад рекуррентной схемы, как правило, пренебрежимо мал. Так, для изображения размером 500*500 с диапазоном яркостей [0.255] вычислительная сложность составит 9,00612 операций на отсчёт, что приемлемо для большинства практических приложений.

4. Квантование при компрессии изображений на основе ДИКМ

Для квантования в ДИКМ обычно используется шкала Макса [1-3]. Использование этой шкалы обеспечивает минимум относительной квадратичной погрешности

1

е

О ММБ_

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X (х(т,п)-Х(т,п))

(24)

Х (т,п)ею

2

2

между исходным изображением х(т, п) и декомпрессированным изображением х (т,п) при фиксированном количестве уровней квантования (здесь Бх - оценка дисперсии исходного изображения).

Общая схема ДИКМ позволяет использовать также другие шкалы квантования, например равномерную шкалу, которая позволяет контролировать максимальную погрешность

= max x(m,n)-x(m,n)

(m,n)e

(25)

Этот показатель используется в областях, где необходим более строгий контроль погрешности [17] из-за повышенных требований к качеству данных или уникальности этих данных, например при работе с данными дистанционного зондирования Земли, в том числе при компрессии гиперспектральных изображений [18-23].

Предварительные эксперименты, проведенные на Ватерлоо-наборе [24] изображений (типичные результаты см. на рис. 3-4), показали, что выбор шкалы квантования имеет важное значение, т.к. использование рассмотренных шкал приводит к существенно различающимся результатам. г2Юх

0,15

0,10

0,05

-Равномерная шкала

— Шкала Макса

1,1 1,3 1,5 1,7 1,9 Ксж

Рис. 3. Зависимость относительной квадратичной погрешности от коэффициента сжатия для ДИКМ

Етах,,

100 80

— Равномерная шкала ---Шкала Макса

__/

60

1,1 1,3 1,5 1,7 1,9 Ксж

Рис. 4. Зависимость максимальной погрешности от коэффициента сжатия для ДИКМ

5. Экспериментальное исследование предсказателей при компрессии изображений на основе ДИКМ

Вычислительные эксперименты проводились на полутоновой версии Ватерлоо-набора [24] изображений, который часто используется при сравнении методов сжатия цифровых изображений.

Сравнение производилось в координатах «погрешность/коэффициент сжатия», при этом использовались показатели относительной квадратичной погрешности (24) и максимальной погрешности (25). Компрессия и декомпрессия производилась для всех

изображений Ватерлоо-набора, после чего полученные результаты усреднялись.

На рис. 5 показана зависимость относительной квадратичной погрешности от коэффициента сжатия для ДИКМ при использовании квантователя со шкалой Макса для предсказателей по двум отсчётам (6), предсказателя Грехэма (8) и адаптивного предсказателя (11). Как видно из графика, адаптивный предсказатель имеет выигрыш по погрешности до двух раз у обоих прототипов. в2Юх

0,008

0,006—

0,004

0,002

---Предсказатель

по двум отсчётам

........ Предсказатель

Грехэма

-Адаптивный

предсказатель

ti I:

1,8 1,9 2,0 2,1 2,2 2,3 2,4 Ксж

Рис. 5. Сравнение предсказателей для ДИКМ

Кроме того, в рамках данной работы ДИКМ с адаптивным предсказателем и равномерным квантователем сравнивался с методом компрессии JPEG. На рис. 6 показана зависимость максимальной погрешности от коэффициента сжатия для этого случая.

1,6 2,3 3,0 3,7 4,4 К^

Рис. 6. Сравнение ДИКМ (с адаптивным предсказателем) с методом компрессии JPEG

Из графика видно, что ДИКМ с адаптивным предсказателем имеет заметный выигрыш по погрешности (до 2,5 раз). Так как JPEG во многих областях используется в качестве «очевидного и стандартного» решения (некоторые варианты JPEG применяются даже при бортовой компрессии), то полученные результаты позволяют сделать вывод о перспективности использования метода ДИКМ с предложенным адаптивным предсказателем.

Выводы

В данной работе был предложен адаптивный параметризованный алгоритм предсказания для метода компрессии ДИКМ, основанный на использовании различноых способов предсказания в зависимости от локальных особенностей изображения. Параметры

e

предсказателя автоматически настраиваются на каждое изображение с помощью быстрой процедуры обучения. Проведённые исследования показали повышенную эффективность предложенного предсказателя по сравнению с прототипами.

В дальнейшем планируется исследование возможности отказа от предварительного прохода по изображению при обучении адаптивного предсказателя. При этом накопление статистики по погрешности различных вариантов предсказателя можно вести одновременно с собственно предсказанием, а модификацию порогов переключения можно производить исходя из статистики, накопленной к текущему моменту. Такая схема обработки сделает метод более удобным для систем реального времени.

Благодарности

Работа выполнена за счет гранта Российского научного фонда (проект №14-31-00014) «Создание лаборатории прорывных технологий дистанционного зондирования Земли».

Литература

1. Salomon, D. Data Compression. The Complete Reference / D. Salomon. - 4th ed. - Springer-Verlag, 2007. - 1118 p.

2. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. - М.: ДИАЛОГ-МИФИ, 2002. - 384 с.

3. Pratt, W. Digital image processing. / W. Pratt. - 4th ed. -Wiley, 2007. - 807 p.

4. Soifer, V. Computer Image Processing, Part II: Methods and algorithms / A.V. Chernov, V.M. Chernov, M.A. Chicheva, V.A. Fursov, M.V. Gashnikov, N.I. Glumov, N.Yu. Ilyasova, A.G. Khramov, A.O. Korepanov, A.V. Kupriyanov, E.V. My-asnikov, V.V. Myasnikov, S.B. Popov, V.V. Sergeyev, V.A. Soifer. - VDM Verlag, 2010. - 584 p.

5. Woods, E Digital Image Processing / E. Woods, R. Gonzalez. - 3th ed. - Prentice Hall, 2007. - 976 p.

6. Дистанционное зондирование. Модели и методы обработки изображений / Р. Шовенгердт. - М.: Техносфера, 2010. - 560 с.

7. Chang, C. Hyperspectral Data Processing: Algorithm Design and Analysis / C. Chang. - Wiley Press, 2013. - 1164 p.

8. Borengasser, M. Hyperspectral Remote Sensing - Principles and Applications / M. Borengasser, W. Hungate, R. Watkins. - CRC Press, 2004. - 128 p.

9. Chang, C. Hyperspectral data exploitation: theory and applications / C. Chang. - Wiley-Interscience, 2007. - 440 p.

10. Benz, U. Multi-resolution, object-oriented fuzzy analysis of remote sensing data for GIS-ready information / U. Benz, P. Hofmann, G. Willhauck, I. Lingenfelder, M. Heynen // ISPRS Journal of Photogrammetry and Remote Sensing. -2004. - Vol. 58(3). - P. 239-258.

11. Anderson, J. A land use and land cover classification system for use with remote sensor data / E. Hardy, J. Roach,

R. Witme, J. Anderson. - US Government Printing Office, 1976. - 964 p.

12. Gashnikov, M. Regional Geographic Information Systems for Gas Network Monitoring / M. Gashnikov, N. Glumov, V. Myasnikov, A. Chernov, E. Ivanova // Pattern Recognition and Image Analysis. - 2015. - Vol. 25(3). - P. 418-422. -DOI: 10.1134/S1054661815030062

13. Wallace, G. The JPEG Still Picture Compression Standard / G. Wallace // Communications of the ACM. - 1991. -Vol. 34(4). - P. 30-44.

14. Ефимов, В.М. Оценка эффективности иерархических и построчных алгоритмов сжатия полутоновых изображений без потерь / В.М. Ефимов, А.Н. Колесников // Тезисы докладов III конференции «Распознавание образов и анализ изображений: новые информационные технологии». -Нижний Новгород: 1997. - Часть I. - С. 157-161.

15. Нетравали, А. Кодирование изображений / А. Нетра-вали, Дж. Лимб // Обзор ТИИЭР. - 1980. - № 68(3). -С. 76-121.

16. Гашников, М.В. Адаптивный алгоритм интерполяции для иерархической компрессии изображений / М.В. Гашников, Н.И. Глумов, В.В. Сергеев // Компьютерная оптика. - 2002. - Вып. 23. - С. 89-93.

17. Lin, S. Error Control Coding: Fundamentals and Applications, second edition / S. Lin, D. Costello. - New Jersey: Prentice-Hall, Inc., Englewood Cliffs, 2004. - 1260 p.

18. Гашников, М.В. Иерархическая сеточная интерполяция при сжатии гиперспектральных изображений / М.В. Гашников, Н.И. Глумов // Компьютерная оптика. -2014. - Т. 38, № 1. - С. 87-93.

19. Gashnikov, M Hierarchical GRID Interpolation under Hy-perspectral Images Compression / M. Gashnikov, N. Glu-mov // Optical Memory and Neural Networks (Information Optics). - 2014. - Vol. 23(4). - P. 246-253.

20. Chang, C. Hyperspectral imaging: techniques for spectral detection and classification / C. Chang. - Springer, 2003. -372 p.

21. Chang, C. Anomaly detection and classification for hyper-spectral imagery / C. Chang, Sh. Chiang // IEEE Transactions on Geoscience and Remote Sensing. - 2002. -Vol. 40(6). - P. 1314-1325.

22. Gashnikov, M. Hyperspectral images repository using a hierarchical compression / M. Gashnikov, N. Glumov // Posters Proceedings of 23-rd International Conference on Computer Graphics, Visualization and Computer Vision (WSCG 2015). - Czech Republic, Plzen, June 8-12. - 2015. - P. 1-4. - ISBN 978-80-86943-67-1. - ISSN 2464-4617.

23. Гашников, М.В. Иерархическая компрессия в задаче хранения гиперспектральных изображений / М.В. Гашников, Н.И. Глумов // Компьютерная оптика. - 2014. -Т. 38, № 3. - С. 482-488.

24. Waterloo Grey Set [Электронный ресурс]. - University of Waterloo Fractal coding and analysis group: Mayer Gregory Image Repository, 2009. - URL: http://links. uwaterloo.ca/Repository.htm (Date Request 02.03.2015).

Сведения об авторе

Гашников Михаил Валерьевич, 1975 года рождения, в 1998 году окончил Самарский государственный аэрокосмический университет имени академика С.П. Королёва (СГАУ), кандидат наук, доцент, в настоящее время работает доцентом кафедры геоинформатики и информационной безопасности (СГАУ). Область научных интересов: сжатие изображений, обработка космических снимков, геоинформационные технологии. Имеет более 80 публикаций, в том числе более 30 статей и две монографии (в соавторстве). Б-шаП: [email protected] .

Поступила в редакцию 11 марта 2016 г. Окончательный вариант - 5 апреля 2016 г.

PARAMETERIZATION OF THE NONLINEAR GREHAM PREDICTOR FOR DIGITAL IMAGE COMPRESSION

M. V. Gashnikov 1 1 Samara State Aerospace University, Samara, Russia

Abstract

Parameterization of the nonlinear Greham predictor is performed for a digital image compression method based on the differential pulse code modulation. The predictor automatically selects different methods for calculating each pixel in the image based on the availability and intensity of that pixel contour. A fast learning procedure that optimizes the prediction parameters is performed before the actual compression. In the course of optimization, the minimum sum of absolute values of prediction errors is provided. For this purpose, a recursive procedure is used, whose computational complexity is independent of the image size. The estimation of the computational complexity of the proposed predictor is conducted. To study the predictors computational experiments are carried out on real images. A gain the proposed predictor offers in terms of the root mean square error when compared with the prototypes is demonstrated. In addition, a gain that the compression method based on the differential pulse code modulation with the proposed predictor has over the JPEG compression method in terms of the maximum error is demonstrated.

Keywords: digital image compression, Greham predictor, quantization, Max scale, DPCM, mean square error, maximum error.

Citation: Gashnikov MV. Parameterization of the nonlinear Greham predictor for digital image compression. Computer Optics 2016; 40(2): 225-31. DOI: 10.18287/2412-6179-2016-40-2-225-231.

Acknowledgements: The work was funded by the Russian Science Foundation, grant No. 14-31-00014.

References

[1] Salomon D. Data Compression. The Complete Reference. Springer-Verlag, 4ed; 2007.

[2] Vatolin D, Ratushnyak A, Smirnov M, Yukin V. Data compression methods. Archive program architecture, image and video compression [In Russian]. Moscow: DIALOG-MIFI; 2002.

[3] Pratt W. Digital image processing. 4ed. Wiley; 2007.

[4] Soifer VA, Chernov AV, Chernov VM, Chicheva MA, Fursov VA, Gashnikov MV, Glumov NI, Ilyasova NY, Khramov AG, Kore-panov AO, Kupriyanov AV, Myasnikov EV, Myasnikov VV, Popov SB, Sergeyev VV. Computer Image Processing, Part II: Methods and algorithms. Ed by Soifer VA. VDM Verlag; 2010.

[5] Woods E, Gonzalez R. Digital Image Processing. 3ed. Prentice Hall; 2007.

[6] Shovengerdt R. Remote sensing. Models and methods for image processing [In Russian]. Moscow: Tehnosfera; 2010.

[7] Chang C. Hyperspectral Data Processing: Algorithm Design and Analysis. Wiley Press; 2013.

[8] Borengasser M, Hungate W, Watkins R. Hyperspectral Remote Sensing - Principles and Applications. CRC Press; 2004.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[9] Chang C. Hyperspectral data exploitation: theory and applications. Wiley-Interscience; 2007.

[10] Benz U, Hofmann P, Willhauck G, Lingenfelder I, Heynen M. Multi-resolution, object-oriented fuzzy analysis of remote sensing data for GIS-ready information. ISPRS Journal of Photogrammetry and Remote Sensing 2004; 58(3): 239-258.

[11] Anderson J, Hardy E, Roach J, Witme R. A land use and land cover classification system for use with remote sensor data. US Government Printing Office; 1976.

[12] Gashnikov MV, Glumov NI, Myasnikov VV, Chernov AV, Ivanova EV. Regional Geographic Information Systems for Gas Network Monitoring. Pattern Recognition and Image Analysis 2015; 25(3): 418-422. DOI: 10.1134/S1054661815030062.

[13] Wallace G. The JPEG Still Picture Compression Standard. Communications of the ACM 1991; 34(4): 30-44.

[14] Efimov VM, Kolesnikov AN. Estimation of efficiency of hierarchical and sequential compression algorithms of grayscale images without losses. Pattern Recognition and Image Analysis: new information technologies processing 1997; 1: 157-161.

[15] Netravali N, Limb J. Picture coding: A review. IEEE proceeding 1980; 68(3): 366-406. DOI: 10.1109/PROC.1980.11647.

[16] Gashnikov MV, Glumov NI, Sergeyev VV. Adaptive interpolation algorithm for hierarchical image compression [In Russian]. Computer Optics 2002; 23: 89-93.

[17] Lin S, Costello D. Error Control Coding: Fundamentals and Applications, second edition. New Jersey: Prentice-Hall, inc. Englewood Cliffs; 2004.

[18] Gashnikov MV, Glumov NI. Hierarchical grid interpolation for hyperspectral image compression. Computer Optics 2014; 38(1): 87-93.

[19] Gashnikov MV, Glumov NI. Hierarchical GRID Interpolation under Hyperspectral Images Compression. Optical Memory and Neural Networks (Information Optics) 2014; 23(4): 246-253.

[20] Chang C. Hyperspectral imaging: techniques for spectral detection and classification. Springer; 2003.

[21] Chang C, Chiang S. Anomaly detection and classification for hyperspectral imagery. IEEE Transactions on Geoscience and Remote Sensing 2002; 40(6): 1314-1325.

[22] Gashnikov MV, Glumov NI. Hyperspectral images repository using a hierarchical compression. 23-rd International Conference on Computer Graphics, Visualization and Computer Vision proceeding 2015; 1-4. ISBN 978-80-86943-67-1. ISSN 2464-4617.

[23] Gashnikov MV, Glumov NI. Hierarchical compression for hyperspectral image storage. Computer Optics 2014; 38(3): 482-488.

[24] Waterloo Grey Set. University of Waterloo Fractal coding and analysis group: Mayer Gregory Image Repository; 2009. Source: (http://links.uwaterloo.ca/Repository.htm/)

Authors' information

Mikhael Valeryevich Gashnikov (b. 1975) graduated from S.P. Korolyov Samara State Aerospace University (SSAU), PhD and associate professor. He is the associate professor at the Geoinformatics and Information Security department at SSAU. He has 80 publications, including 30 scientific papers and 2 monograph (with coauthors). His research interests are currently focused on image compression, space images processing, geoinformation technologies. E-mail: [email protected] .

Received March 11, 2016. The final version - April 5, 2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.