СТАТИСТИЧЕСКОЕ КОДИРОВАНИЕ ПРИ КОМПРЕССИИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ИЕРАРХИЧЕСКОЙ СЕТОЧНОЙ ИНТЕРПОЛЯЦИИ
М.В. Гашников1
1 Самарский национальный исследовательский университет имени академика С.П. Королева, Самара, Россия
Аннотация
Исследуются алгоритмы статистического кодирования при компрессии изображений. Предлагается подход к повышению эффективности кодов переменной длины при компрессии изображений с потерями. Разрабатывается алгоритм статистического кодирования, предназначенный для использования в составе методов компрессии изображений, осуществляющих кодирование декоррелированного сигнала с неравномерным распределением вероятностей. Производится экспериментальное сравнение предложенного алгоритма с алгоритмами ZIP и ARJ при кодировании специфических данных иерархического метода компрессии. Кроме того, проводится экспериментальное сравнение иерархического метода компрессии изображений, включающего разработанный алгоритм кодирования, с методом JPEG и методом на основе вейвлет-преобразования.
Ключевые слова: компрессия изображений, статистическое кодирование, коды переменной длины, квантование, энтропия, объём сжатых данных.
Цитирование: Гашников, М.В. Статистическое кодирование при компрессии изображений на основе иерархической сеточной интерполяции / М.В. Гашников // Компьютерная оптика. - 2017. - Т. 41, №6. - С. 905-912. - DOI: 10.18287/2412-6179-2017-41-6-905-912.
Введение
В настоящее время объёмы информации, соответствующие изображениям, продолжают увеличиваться. Примером может являться продолжающийся рост объёмов данных при съёмке Земной поверхности летательными аппаратами [1-3]. Если раньше распространены были только снимки с самолётов и спутников, содержащие одну или несколько компонент, то в настоящее время приходится иметь дело с мультиспек-тральными и гиперспектральными данными, которые могут содержать сотни большеформатных каналов высокого разрешения. Массовое применение беспилотных летательных аппаратов и доступность результатов их работы ещё больше усугубляет проблему объёма данных, соответствующих изображениям.
Конечно, съёмка земной поверхности не является единственным примером. Увеличение разрешения и количества изображений имеет место в различных отраслях знаний, таких как геоинформатика, медицина, полиграфия, криминалистика и т.п. Использование компрессии изображений в такой ситуации не имеет альтернативы, а актуальность повышения эффективности методов компрессии не вызывает сомнений.
Многие методы компрессии изображений основаны на декорреляции [4] данных, которые затем квантуются [5] и кодируются [6 -7] (дожимаются). Например, в дифференциальных методах [8] компрессии изображений декорреляция производится посредством перехода к разностному сигналу (разности между исходными и предсказанными значениями пикселов). Разностный сигнал затем квантуется и кодируется.
В методах кодирования с преобразованием, основанных на дискретных косинусных преобразованиях [9] (JPEG [10]) или вейвлет-преобразованиях [11] (JPEG-2000 [12]), кодированию подвергается квантованное поле трансформант (результатов преобразования).
При компрессии на основе иерархической сеточной интерполяции (ИСИ) [13 -14] пиксели изображения ин-
терполируются на основе прореженных версий того же самого изображения, ошибки интерполяции (постинтерполяционные остатки) квантуются и кодируются.
Во всех рассмотренных случаях в конечном итоге кодированию подвергается некий квантованный сигнал. Естественно, этап декорреляции во всех методах компрессии строится так, чтобы квантованный сигнал был как можно удобнее для кодирования («дожа-тия»). Поэтому квантованный сигнал имеет, как правило, специфичную (существенно неравномерную) плотность распределения вероятностей. Чтобы наилучшим образом использовать эту неравномерность для повышения коэффициента компрессии, квантованный сигнал обычно подвергается статистическому (энтропийному) кодированию [6 -7], т.е. кодированию, использующему неравновероятность отсчётов сигнала для сокращения объёма данных.
Таким образом, возникает задача выбора (или построения) алгоритма статистического кодирования для метода компрессии изображений. Наиболее широкое распространение имеют алгоритмы Лемпеля-Зива [15], Хаффмена [16] и арифметического кодирования [17]. Большая часть остальных алгоритмов так или иначе использует идеи, заложенные в этих трех.
Вычислительная сложность арифметического кодера достаточно велика. Ещё более существенным недостатком является то, что арифметические кодеры достаточно «плотно» запатентованы. Алгоритм Лемпеля-Зива также имеет большую сложность и, кроме того, недостаточно эффективен без дополнительного «дожимающего» алгоритма, в качестве которого обычно используют алгоритм Хаффмена. Поэтому наиболее привлекательным представляется собственно алгоритм Хаффме-на, сложность которого меньше, а коэффициент является наилучшим среди всех кодов переменной длины.
Однако специфика распределения вероятностей кодируемого сигнала приводит к тому, что прямое применение алгоритма Хаффмена может повлечь за
собой существенную потерю эффективности кодирования. Кодируемый (квантованный) сигнал зачастую содержит некоторое значение (обычно нулевое), которое встречается гораздо чаще остальных. Собственно причина потери эффективности заключается в том, что алгоритм Хаффмена не может назначить никакому символу (даже очень часто встречающемуся) длину кода, меньшую одного бита. Коэффициент сжатия, таким образом, не может превысить разрядности кодируемого сигнала, а объём сжатых данных (в бит на отсчёт) может существенно превысить энтропию сжимаемого сигнала, что означает потерю эффективности кодирования (заметное отставание от теоретического предела).
В данной работе предлагается двухпотоковый статистический кодер, учитывающий специфику распределения вероятностей кодируемого сигнала при компрессии изображений. Построение предлагаемого кодера производится для иерархического метода компрессии, однако предложенная идея может быть использована для широкого класса методов компрессии, основанных на декорреляции и последующем квантовании сжимаемого сигнала.
Иерархическое представление изображения
Метод иерархической сеточной интерполяции (ИСИ) [18 -19] основан на иерархическом представлении компрессируемого изображения. Изображение представляется в виде набора из Ь масштабных уровней. Старший масштабный уровень, т.е. уровень номер (Ь - 1), представляет собой двумерный массив отсчетов исходного изображения, прореженного в 2Ь-1 раз по каждой координате. Следующий масштабный уровень, т.е. масштабный уровень номер (Ь - 2), представляет собой исходное изображение, прореженное с шагом 2Ь-2, из которого исключены отсчеты предыдущего масштабного уровня номер (Ь - 1), и так далее вплоть до уровня номер 0 (рис. 1).
Рис. 1. Иерархическое представление изображения в виде набора масштабных уровней
Такое представление похоже на квадродерево (пирамидальное представление изображения) [4 -5], но имеет преимущество перед ним, т.к. является безызбыточным. В формализованном виде иерархическое представление изображения X в виде набора масштабных уровней X/ может быть представлено следующим образом:
Ь-1
X = и X/, Хь-1 ={ Хь-1 (т, п)},
1=0 (1)
XI ={ Х1 (т п)} \ { Х1+1 (т п)} , 0 < 1 < Ь ,
где {х1(т,п)} - массив пикселов изображения, прореженный с шагом 21 по обеим координатам, Ь - количество масштабных уровней.
Описанное иерархическое представление дает возможность компрессировать масштабные уровни последовательно, начиная со старшего уровня Хь-1, причем пиксели более прореженных (менее детальных) масштабных уровней будут использоваться для интерполяции пикселов менее прореженных (менее детальных) масштабных уровней. Запишем процедуру компрессии формально.
Иерархическая компрессия изображения
При компрессии масштабные уровни изображения обрабатываются последовательно, от старшего к младшему, т.е. в порядке Хь-1, Хь-2, ... Х1, Хо. Вид процедуры компрессии старшего масштабного уровня Хь-1 неважен, так как его доля в общем объёме данных очень мала (меньше чем полпроцента для числа уровней больше четырёх). Поэтому запишем процедуру компрессии произвольного нестаршего масштабного уровня X/ (1 < Ь - 1), которая состоит из следующих этапов (см. также рис. 2).
1) Интерполяция
К моменту интерполяции масштабного уровня Х1 уже обработаны все более прореженные масштабные уровни (Хк, 1 < к< Ь-1). Их объединение составляет прореженное с шагом 21+1 изображение{хш(т,п)}, для всех пикселов которого уже вычислены восстановленные значения х,+1 (т, п) , совпадающие со значениями, которые будут получены при декомпрессии. Обозначим Хк множество восстановленных пикселов, соответствующих масштабному уровню Хк. Таким образом, интерполяция пикселов масштабного уровня Х1 производится на основе восстановленных пикселов, соответствующих уже обработанным более прореженным масштабным уровням:
х, (т, п) = Р | и Хк | = Р (х+1 (т, п)), (2)
V к=1+1 )
где Р - функция, задающая некоторый интерполятор.
2) Вычисление разностного сигнала
Вычисляется разностный сигнал, т.е. массив разностей истинных и предсказанных значений отсчетов (постинтерполяционные остатки):
(т, п) = х1 (т,п)- X, (т,п) . (3)
3) Квантование разностного сигнала
Выполняется квантование приведенного выше разностного сигнала ф(т, п). При этом каждое раз-
ностное значение f (т, п) заменяется на квантованное значение:
ql(т,п) = Qe (f (m,п)) , (4)
где Qe(...) - функция, задающая некоторый квантователь, а ql(m, п) - квантованный разностный сигнал (или просто «квантованный сигнал»).
4) Восстановление
На этом этапе по квантованным значениям ql(m,n) вычисляются восстановленные значения XI (т, п)
пикселов масштабного уровня. Для этого необходимо сначала вычислить восстановленные значения разностного сигнала:
/',(т п) = <2а (q,(т п)),
(5)
где Qd(..) - функция деквантования, формирущая приближенное значение отсчета разностного сигнала из его квантованного значения, а затем вычислить собственно восстановленные значения:
х, (т, п) = f¡ (т, п) + X, (т, п) .
(6)
Эти восстановленные значения пикселов идентичны тем, что будут получены при декомпрессии (процедура компрессии как бы включает в себя процедуру декомпрессии). Восстановленные значения нужны для интерполяции более прореженных иерархических уровней (Хк, 0 < к< I). Поэтому на этапе компрессии данная операция выполняется для всех масштабных уровней (кроме масштабного уровня Х0). Наличие описанной обратной связи (рис. 2), то есть использование для интерполяции восстановленных, а не исходных пискелов, позволяет гарантировать, что и при компрессии, и при декомпрессии интерполятор будет работать идентичным образом (вычислять одни и те же значения), что обеспечивает возможность контроля погрешности.
5) Статистическое кодирование
Выполняется статистическое кодирование квантованного сигнала ql(m, п). Т.к. распределение вероятностей этого сигнала является существенно неравномерным, при кодировании можно достигнуть значительного сокращения объема данных, которое собственно и является целью компрессии изображения.
На этом описание общей структуры алгоритма иерархической компрессии завершено. Для конкретизации метода компрессии необходимо указать алгоритмы интерполяции, квантования и статистического кодирования.
В контексте настоящего исследования, посвящён-ного статистическому кодированию, вид алгоритма интерполяции неважен. Для квантования в данной работе использовалась равномерная шкала [4 -5] ([..] обозначает выделение целой части числа):
ql (т, п) = sign ((т, п))
I(m, п)\ + £„ 2ешах +1
(7)
гарантирующая, что декомпрессированное изображение будет отличаться от исходного не более чем на величину заданной максимальной погрешности ешах:
к (m, п )| = Iх (m, п ) -х ( Ш, п )| < бшах .
(8)
Алгоритм статистического кодирования описан далее.
Рис. 2. Компрессия иерархического уровня X, (I < Ь-1)
Статистическое кодирование при компрессии изображений Статистическому кодированию [6 -7] при иерархической компрессии подвергается квантованный разностный сигнал ql(m, п). Распределение вероятностей этого сигнала очень похоже на распределение вероятностей «неквантованного» разностного сигнала Дт, п), то есть имеет максимум в нуле и быстро спадает по обе стороны от нуля симметричным образом [4 -5]. Отличие распределения вероятности квантованного сигнала заключается в том, что оно является более узким за счет объединения значений при квантовании.
Для кодирования сигналов такого вида, характеризующихся ярко выраженной неравномерностью распределения вероятностей, часто используются коды переменной длины [6] (часто встречающимся символам назначаются короткие коды, редко встречающимся - более длинные коды). Эффективность кодера в этом случае определяется средней длиной кодового слова [7], которая в данном случае совпадает с объёмом сжатых данных, который измеряется в битах на отчёт:
в=£ ръ
(9)
где N - количество возможных значений кодируемого сигнала, р, Ъг - вероятности и длины кодов кодируемых значений.
г=0
Именно среднюю длину кодового слова В и необходимо минимизировать при построении кодера. Однако согласно теореме Шеннона [6] у средней длины кодового слова есть теоретический предел: она не может быть меньше энтропии [7]:
Н =-Х Р< 10§2 Рг .
(10)
Из последних двух выражений нетрудно видеть, что средняя длина кодового слова достигает теоретического предела (т.е. энтропии), если при построении кода удаётся обеспечить следующие длины кодов: Ь1 =- 10М2 Р* ,0 < г < N . (11)
Однако при иерархической компрессии специфика распределения вероятностей кодируемого (квантованного) сигнала зачастую не позволяет это сделать, что приводит к потере эффективности кода переменной длины для этого сигнала. Этот эффект следует объяснить подробнее.
Чем точнее интерполятор и чем большее значение имеет заданная погрешность квантования бшах, тем больше нулевых значений в кодируемом сигнале. Вероятность нуля Р0 в этом случае может существенно превышать значение 0,5. Количество информации в нулевом символе равно (-^2(1 /Р0)) и может быть значительно меньше одного бита при р0 > 0,5, в то время как кодер переменной длины присваивает этому сообщению код длины один бит, за счет чего и происходит потеря эффективности кодирования, которая увеличивается с ростом погрешности, вносимой при компрессии. Чтобы избежать указанной потери эффективности, в данной работе предлагается двухпотоко-вый алгоритм статистического кодирования, учитывающий долю нулей в кодируемом сигнале (рис. 3).
Алгоритм работает следующим образом. Если вероятность нуля р0 < 0,5, то описанной потери эффективности нет, поэтому для кодирования используется наилучший из кодов переменной длины - кодер Хаффмена [16].
Если вероятность нуля р0 > 0,5, то кодируемый сигнал разбивается на два потока: в первый поток направляются значения всех ненулевых отсчетов, во второй поток направляется бинарная датирующая [8] последовательность: на место ненулевых отсчетов входного потока записываются единицы, а на место нулевых -нули. Далее потоки кодируются независимо.
В первом потоке наиболее вероятными символами являются 1 и (-1), причем из симметрии распределения следует, что вероятность любого из этих символов меньше 0,5, благодаря чему для кодирования первого потока может применяться стандартный алгоритм Хаффмена, который не теряет эффективности в данном случае.
Второй (бинарный) поток кодируется различными способами, в зависимости от доли нулевых значений. Если вероятность нуля не превышает некоторого порогового значения р0 < р^ЬЕ (т.е. вероятность нуля «велика, но не слишком»), то используется алгоритм, основанный на алгоритмах кодирования длин серий
(КДС) [7] и Хаффмена [16]. Сначала осуществляется переход от бинарной последовательности к последовательности, состоящей из укрупненных символов КДС вида 1, 01, 001, ... , 00..01, 00..00. Отличие от стандартного КДС заключается в том, что количество NRLE различных укрупненных символов может не являться степенью двойки.
Делитель на два {¡Ф0
Хаффмен
потока
Вт(д) [01001] Да
КДС-1
КДС-2 Хаффмен
Рис. 3. Структура предлагаемого двухпотокового кодера (в квадратных скобках - пример кодируемого сигнала)
Затем каждому объединенному символу ставится в соответствие не код фиксированной длины, как в «обычном» КДС, а код Хаффмена. Для того, чтобы при этом не происходило описанной выше потери эффективности, обусловленной слишком большой вероятностью одного из символов, параметр NшE выбирается из соотношения:
р^ЬЕ-1 < 0,5. (12)
Благодаря неравномерности распределения вероятностей объединенных символов, такое кодирование более эффективно, чем стандартный КДС, однако требует передачи кодовой книги.
Если вероятность нуля р0 > р^ЬЕ , то для бинарного потока используется стандартный КДС. От дополнительного кодирования по Хаффмену приходится отказываться из-за того, что объединенных символов становится слишком много, размер кодовой книги оказывается чрезмерно большим, что ухудшает коэффициент сжатия (адаптивное кодирование по Хаф-фмену также не используется, чтобы избежать чрезмерного усложнения алгоритма в целом).
Для завершения описания предложенного алгоритма статистического кодирования следует отметить, что он может использоваться не только при иерархической компрессии изображений, но и в со-
1=0
ставе других методов компрессии, порождающих де-коррелированный сигнал с существенно неравномерным распределением вероятностей.
Исследование эффективности алгоритма статистического кодирования
Для исследования эффективности разработанного двухпотокового кодера он сравнивался с алгоритмами кодирования ARJ и ZIP [6 -7] на специфических данных метода ИСИ, т.е. на квантованном разностном сигнале, полученном при сжатии реальных изображений. В качестве показателя эффективности в данном случае использовался объём сжатых данных B (в бит/отсчет).
Типичные результаты показаны на рис. 4 (для изображения «Портрет», представленного на рис. 5). Я +
Кодеры:
---ZIP, ARJ
- Двухпотоковый
О 5 10 15 20 25 Етш
Рис. 4. Зависимость объема сжатых данных B (в бит/отсчет) от максимальной погрешности Emax для различных кодеров на изображении «Портрет»
Из рисунка видно, что на специфических данных метода ИСИ двухпотоковый кодер имеет преимущество до 20 % перед алгоритмами ARJ и ZIP.
Рис. 5. Примеры тестовых изображений: «Портрет», «Пейзаж», «Картина», «ДДЗ»
Исследование эффективности иерархической компрессии, включающей двухпотоковый статистический кодер
Для исследования эффективности компрессии изображений при использовании разработанного двухпотокового статистического кодера были проведены вычислительные эксперименты на изображениях различных типов: портрет, пейзаж, картина, данные дистанционного зондирования (ДДЗ) и т.д. Примеры тестовых изображений показаны на рис. 5.
Для проведения вычислительных экспериментов предложенный двухпотоковый статистический кодер был встроен в метод компрессии на основе иерархической сеточной интерполяции (ИСИ). В рамках этого метода двухпотоковый кодер использовался для кодирования квантованного разностного сигнала. При этом в рамках двухпотокового кодера применялся «классический» (неадаптивный) вариант кодера Хаффмена, предполагающий предварительный проход по сжимаемом сигналу для оценки распределения вероятностей.
При проведении вычислительных экспериментов метод компрессии ИСИ, двухпотоковый кодер, сравнивался с методами компрессии Baseline JPEG [10] и LuraWave Wavelet [20, 21]. Для каждого из трёх указанных методов компрессии строилась зависимость объема сжатых данных B (в бит на отсчет) от максимальной погрешности emax, вносимой при компрессии. Типичные результаты показаны на рис. 6.
Нетрудно видеть, что метод компрессии ИСИ, использующий двухпотоковый кодер, имеет заметный выигрыш у JPEG и Wavelet по объёму сжатых данных при всех рассмотренных максимальных погрешностях, кроме нулевой.
Заключение
Рассмотрены вопросы снижения эффективности алгоритмов статистического кодирования при компрессии изображений с потерями. Предложен подход к повышению эффективности статистического кодера в указанной ситуации. На примере иерархического метода компрессии произведена разработка входящего в его состав двухпотокового алгоритма статистического кодирования.
Произведено экспериментальное сравнение разработанного двухпотокового кодера с алгоритмами ZIP и ARJ в составе иерархического метода компрессии изображений, и показан выигрыш предложенного кодера. Кроме того, на серии тестовых изображений показан выигрыш иерархического метода компрессии изображений, включающего предложенный кодер, у методов JPEG и Wavelet. Предложенный алгоритм статистического кодирования может использоваться в любых методах компрессии, в которых требуется кодировать декорелированный сигнал с неравномерным распределением вероятностей.
В дальнейшем планируется сравнение эффективности предложенного двухпотокового кодера с алгоритмом, основанным на объединении часто встречающихся символов в один, а также экспериментальное исследование скорости работы предложенного алгоритма.
Благодарности
Работа выполнена за счет гранта Российского научного фонда (проект №14-31-00014) «Создание лаборатории прорывных технологий дистанционного зондирования Земли».
Рис. 6. Зависимость объёма сжатых данных B (в бит на отсчёт) от максимальной погрешности Emax для изображений «Портрет», «Пейзаж», «Картина», «ДДЗ»
Литература
Schowengerdt, R.A. Remote sensing: models and methods for image processing / R. Schowengerdt. - 3th ed. - Burlington, San Diego: Academic Press, 2007. - 558 p. - ISBN 978-0-12-369407-2.
Chang, Ch.-I Hyperspectral data processing: Algorithm design and analysis / Ch.-I. Chang. - Hoboken, NJ: A John Wiley & Sons, Inc., 2013. - 1164 p. - ISBN: 978-0-47169056-6.
Borengasser, M. Hyperspectral remote sensing: Principles and applications / M. Borengasser, W.S. Hungate, R. Wat-kins. - Boca Raton, London, New York: CRC Press, 2007. - 128 p. - ISBN: 978-1-56670-654-4. Gonzalez, R.C. Digital image processing / R.C. Gonzalez, R.E. Woods. - 3th ed. - Upper Saddle River, NJ: Prentice Hall, 2007. - 976 p. - ISBN: 978-0-13-168728-8. Pratt, W.K Digital image processing / W.K. Pratt. - 4th ed. - Hoboken, NJ: John Wiley & Sons, Inc., 2007. - 806 p. -ISBN: 978-0-471-76777-0.
Sayood, K. Introduction to data compression / К. Sayood. -4th ed. - Waltham, MA: Morgan Kaufmann, 2012. -768 p. - ISBN: 978-0-12-415796-5.
Salomon, D. Data compression: The complete reference /
D. Salomon. - 4th ed. - London: Springer-Verlag, 2007. -1118 p. - ISBN: 978-1-84628-602-5.
Computer image processing. Part II: Methods and algorithms / A.V. Chernov, V.M. Chernov, M.A. Chicheva, V.A. Fursov, M.V. Gashnikov, N.I. Glumov, N.Yu. Ilyaso-va, A.G. Khramov, A.O. Korepanov, A.V. Kupriyanov,
E.V. Myasnikov, V.V. Myasnikov, S.B. Popov, V.V. Sergeyev, V.A. Soifer; ed. by V.A. Soifer. - VDM Verlag Dr. Müller. - 2010. - 584 p. - ISBN: 978-3-63917545-5.
Plonka, G. Fast and numerically stable algorithms for discrete cosine transforms / G. Plonka, M. Tasche // Linear Al-
gebra and its Applications. - 2005. - Vol. 394. - P. 309345. - DOI: 10.1016/j.laa.2004.07.015.
10. Wallace, G.K The JPEG still picture compression standard / G.K. Wallace // Communications of the ACM. - 1991. -Vol. 34, Issue 4. - P. 30-44. - DOI: 10.1145/103085.103089.
11. Gupta, V. Enhanced image compression using wavelets / V. Gupta, V. Sharma, A. Kumar // International Journal of Research in Engineering and Science (IJRES). - 2014. -Vol. 2(5). - P. 55-62.
12. Li, J. Image compression: The mathematics of JPEG-2000 / J. Li // Modern Signal Processing. - 2003. - Vol. 46. -P. 185-221.
13. Gashnikov, M. Compression method for real-time systems of remote sensing / M.V. Gashnikov, N.I. Glumov, V.V. Sergeyev // Proceedings of 15th International Conference on Pattern Recognition. - 2000. - Vol. 3. - P. 232-235. - DOI: 10.1109/ICPR.2000.903527.
14. Gashnikov, M. Development and Investigation of a hierarchical compression algorithm for storing hyperspectral images / M.V. Gashnikov, N.I. Glumov // Optical Memory and Neural Networks. - 2016. - Vol. 25, Issue 3. - P. 168179. - DOI: 10.3103/S1060992X16030024.
15. Ziv J. A universal algorithm for sequential compression / J. Ziv, A. Lempel // IEEE Transactions on Information Theory. - 1977. - Vol. 23, Issue 3. - P. 337-343. - DOI: 10.1109/TIT.1977.1055714.
16. Huffman, D. A method for the construction of minimum-redundancy codes / D. Huffman // Proceedings of the IRE. -1952. - Vol. 40, Issue 9. - P 1098-1101. - DOI: 10.1109/JRPROC.1952.273898.
17. Written, I.H. Arithmetic coding for data compression / I.H. Written, R.M. Neal, J.G. Cleary // Communication of the ACM. - 1987. - Vol. 30, Issue 6. - P. 520-540. - DOI: 10.1145/214762.214771.
18. Гашников, М.В. Бортовая обработка гиперспектральных данных в системах дистанционного зондирования Земли на основе иерархической компрессии / М.В. Гашников, Н.И. Глумов // Компьютерная оптика. -2016. - Т. 40, № 4. - С. 543-551. - DOI: 10.18287/24126179-2016-40-4-543-551.
19. Gashnikov, M.V. Hierarchical grid interpolation under hy-perspectral images compression / M.V. Gashnikov, N.I. Glu-mov // Optical Memory and Neural Networks. - 2014. -
Vol. 23, Issue 4. - P. 246-253. - DOI: 10.3103/S1060992X14040031.
20. LuraTech: A business of Foxit software. - URL: http://www.luratech.com (request date 20.07.2017).
21. Ватолин, Д. Сравнение кодеков изображений стандарта JPEG2000 [Электронный ресурс] / Д. Ватолин, А. Москвин, О. Петров, А. Титаренко. - URL: http://compression.ru/video/codec_comparison/pdf/jpeg2000 _codec_comparison_ru.pdf (создан 09.2005, дата обращения 20.07.2017).
Сведения об авторе
Гашников Михаил Валерьевич, 1975 года рождения, в 1998 году окончил Самарский государственный аэрокосмический университет имени академика С.П. Королёва (СГАУ), кандидат наук, доцент. В настоящее время работает доцентом кафедры геоинформатики и информационной безопасности Самарского национального исследовательского университета имени академика С.П. Королёва. Область научных интересов: сжатие изображений, обработка космических снимков, геоинформационные технологии. Имеет более 80 публикаций, в том числе более 30 статей и две монографии (в соавторстве). Е-шаП: [email protected] .
ГРНТИ: 28.17.19, 28.21.15, 28.23.15.
Поступила в редакцию 26 июля 2017 г. Окончательный вариант - 23 сентября 2017 г.
STATISTICAL ENCODING FOR IMAGE COMPRESSION BASED ON HIERARCHICAL GRID INTERPOLATION
M.V. Gashnikov1
1 Samara National Research University, Samara, Russia Abstract
Algorithms of statistical encoding for image compression are investigated. An approach is proposed to increase the efficiency of variable-length codes when compressing images with losses. An algorithm of statistical encoding is developed for use as part of image compression methods that encode a de-correlated signal with an uneven probability distribution. An experimental comparison of the proposed algorithm with the algorithms ZIP and ARJ is performed while encoding the specific data of the hierarchical compression method. In addition, an experimental comparison of the hierarchical method of image compression, including the developed coding algorithm, with the JPEG method and the method based on the wavelet transform is carried out.
Keywords: image compression, statistical encoding, variable length codes, quantization, entropy, compressed data size.
Citation: Gashnikov MV. Statistical encoding for image compression based on hierarchical grid interpolation. Computer Optics 2017; 41(6): 905-912. DOI: 10.18287/2412-6179-2017-41-6-905-912.
A cknowledgements: The work was funded by the Russian Science Foundation, grant No. 14-31-00014.
References
[1] Schowengerdt RA. Remote sensing: models and methods for image processing. 3th ed. Burlington, San Diego: Academic Press; 2007. ISBN 978-0-12-369407-2.
[2] Chang Ch-I. Hyperspectral data processing: Algorithm design and analysis. Hoboken, NJ: A John Wiley & Sons, Inc; 2013. ISBN: 978-0-471-69056-6.
[3] Borengasser M, Hungate WS, Watkins R. Hyperspectral remote sensing: Principles and applications. Boca Raton, London, New York: CRC Press; 2007. ISBN: 978-156670-654-4.
[4] Gonzalez RC, Woods RE. Digital image processing. 3th ed. Upper Saddle River, NJ: Prentice Hall; 2007. ISBN: 9780-13-168728-8.
[5] Pratt WK. Digital image processing. 4th ed. Hoboken, NJ: John Wiley & Sons, Inc; 2007. ISBN: 978-0-471-76777-0.
[6] Sayood K. Introduction to data compression. 4th ed. Wal-tham, MA: Morgan Kaufmann; 2012. ISBN: 978-0-12415796-5.
[7] Salomon D. Data compression: The complete reference. 4th ed. London: Springer-Verlag; 2007. ISBN: 978-1-84628-602-5.
[8] Soifer VA, ed. Computer image processing, Part II: Methods and algorithms. VDM Verlag Dr Müller; 2010. ISBN: 978-3-6391-7545-5.
[9] Plonka G, Tasche M. Fast and numerically stable algorithms for discrete cosine transforms. Linear Algebra and its Applications 2005; 394: 309-345. DOI: 10.1016/j.laa.2004.07.015.
[10] Wallace GK. The JPEG still picture compression standard. Communications of the ACM 1991; 34(4): 30-44. DOI: 10.1145/103085.103089.
[11] Gupta V, Sharma V, Kumar A. Enhanced image compression using wavelets. International Journal of Research in Engineering and Science (IJRES) 2014; 2(5): 55-62.
[12] Li J. Image compression: The mathematics of JPEG-2000. Modern Signal Processing 2003; 46: 185-221.
[13] Gashnikov MV, Glumov NI, Sergeyev VV. Compression method for real-time systems of remote sensing. ICPR 2000; 3: 232-235. DOI: 10.1109/ICPR.2000.903527.
[14] Gashnikov MV, Glumov NI. Development and investigation of a hierarchical compression algorithm for storing hyperspectral images. Opt Mem Neural Networks 2016; 25(3): 168-179. DOI: 10.3103/S1060992X16030024.
[15] Ziv J, Lempel A. A universal algorithm for sequential compression. IEEE Trans Inf Theory 1977; 23(3): 337343. DOI: 10.1109/TIT.1977.1055714.
[16] Huffman D. A method for the construction of minimum-redundancy codes. Proc IRE 1952; 40(9): 1098-1101. DOI: 10.1109/JRPROC.1952.273898.
[17] Written IH, Neal RM, Cleary JG. Arithmetic coding for data compression. Communication of the ACM 1987; 30(6): 520-540. DOI: 10.1145/214762.214771.
[18] Gashnikov MV, Glumov NI. Onboard processing of hyperspec-tral data in the remote sensing systems based on hierarchical compression [In Russian]. Computer Optics 2016; 40(4): 543551. DOI: 10.18287/2412-6179-2016-40-4-543-551.
[19] Gashnikov MV, Glumov NI. Hierarchical GRID Interpolation under Hyperspectral Images Compression. Opt Mem Neural Networks 2014; 23(4): 246-253. DOI: 10.3103/S1060992X14040031.
[20] LuraTech: A business of Foxit software. Source: (http://www.luratech.com).
[21] Vatolin D, Moskvin A, Petrov O, Titarenko A. MSU JPEG 2000 Image Codecs Comparison. Source: (http://compression.ru/video/codec_comparison/pdf/jpeg20 00_codec_comparison_en.pdf); 2005.
Author's information
Mikhael Valeryevich Gashnikov (b. 1975) graduated from S.P. Korolyov Samara State Aerospace University (SSAU), PhD and associate professor. He is the associate professor at the Geoinformatics and Information Security department at Samara National Research University. He has 80 publications, including 30 scientific papers and 2 monograph (with coauthors). His research interests are currently focused on image compression, space images processing, geoinformation technologies. E-mail: [email protected] .
Received July 26, 2017. The final version - September 23, 2017.