Научная статья на тему 'Переменное квантование с минимальными искажениями'

Переменное квантование с минимальными искажениями Текст научной статьи по специальности «Математика»

CC BY
362
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Переменное квантование с минимальными искажениями»

В.Б. Тхор

ПЕРЕМЕННОЕ КВАНТОВАНИЕ С МИНИМАЛЬНЫМИ

ИСКАЖЕНИЯМИ

ВВЕДЕНИЕ

При решении различных задач науки и техники человеку приходится передавать хранить или обрабатывать огромное количество визуальной информации, являющейся для него по-видимому психологически наиболее привычной. Действительно, человек стремится визуализировать даже сигналы в области невидимого спектра (радиолокация инфракрасное тепловидение, рентгенография, гидролокация, ультразвуковое зондирование, акустическая голография и т.д. ).

Как только объемы визуальной информации начинают превышать возможности технических систем передачи, хранения или обработки, возникает необходимость в ее экономном представлении т.е. в сжатии.

Основной операцией, отвечающей за качество декодированного изображения является квантование, разбивающее пространство сигналов на ячейки. Все сигналы, попавшие в одну и ту же ячейку считаются неотличимыми друг от друга. Зрительная система человека также разбивает пространство сигналов на ячейки сложной формы и не видит различий в сигналах из одной и той же ячейки. Это подтверждается огромным количеством психофизических опытов [7-10]. Каким должно быть квантование, чтобы при максимально возможном сжатии качество декодированного изображения оставалось неотличимым от оригинала для получателя в строго определенных условиях наблюдения? Формально эта задача рассматривается в теории е-энтропии однако, несмотря на обилие работ, здесь, к сожалению до сих пор не найдено конструктивное решение [1-6]. С точки зрения источника сигналов квантователь должен отслеживать изменения статистических свойств изображения, а с позиций получателя должен согласовывать форму своих ячеек с формой и размером ячеек зрительной системы.

На данный момент накоплено огромное количество знаний о методах квантования изображений, которые отражены в прекрасных обзорах и монографиях [11-15]. Анализируя многочисленную литературу по квантованию изображений, можно заметить, что еще в ранних работах стали использовать переменные квантователи [16 -20 ], несмотря на то, что теории для таких квантователей не было разработано. В этих работах было обнаружено, что при фиксированном квантованиии очень быстро достигается предел сжатия, за которым начинается ухудшение качества декодированного изображения. Можно несколько улучшить результат применяя методы статистического кодирования [4], однако другой путь - переход к переменному квантованию, оказался более эффективным. Действительно, с помощью простых измерений локальных свойств сигналов изображения можно убедиться в их существенной изменчивости в пределах изображения. Легко убедиться также и в локальной изменчивости зрительных порогов получателя - известное свойство маскирования - увеличение зрительных порогов вблизи перепадов яркости в пространстве и во времени [13].

В конце семидесятых годов одновременно в Японии [21], США [22] и СССР [23,24] были предложены варианты переменного блочного квантования изображений, которые затем в восьмидесятых были детально изучены в отечественных [24-35] и зарубежных работах [36,37]. В настоящее время можно сказать, что переменное квантование доминирует практически во всех алгоритмах сжатия изображений.

Несмотря на столь блистательную победу переменного квантования, потенциальные возможности многих подходов остались неизученными. Из-за отсутствия подходящих моделей переменного квантователя, построение "хорошего" квантователя до сих пор осуществляется эвристически на основе опыта и искусства разработчика. Теоретически неизвестны оптимальные процедуры изменения параметров квантователя, приводящие к максимальному сжатию при заданных требованиях к качеству декодированного изображения - задача оптимизации скорости, и минимальному искажению при фиксированной скорости - задача оптимизации искажений. В данной работе делается попытка решения второй задачи. Формализуется задача переменного

квантования изображений и известные алгоритмы оптимизации квантователей обощаются на случай переменного квантования на основе многослойной модели.

1. НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ

Пусть Бо - размеры поля зрения, на котором задано исходное изображение. В дискретном виде это изображение может быть представлено в виде некоторого массива чисел и = (и(У), 1 = 1,1; j = 1,1}, где I- число строк, а 1 - число столбцов. Массив и можно трактовать как последовательность скалярных величин и - элементов изображения, если ввести определенное правило их выборки из массива (развертку).

В одномерном случае квантование представляет собой отображение числовой оси на множество представительных уровней г = {ц, 1 = 1,Ь }, т.е. С>: => г и называется скалярным кватованием, а в многомерном случае векторным квантованием.

Квантование осуществляется в два этапа. На первом элементы числовой оси отображаются на множество индексов I = { 1,2,...,Ь }, т.е. С: => 1. На втором этапе множество индексов 1 отображается на множество представительных уровней г, т.е, Э; I => г.

При отображении С числовая ось разбивается на отрезки т = , 1 =1,Ь }, 9*1 и XI г» т^ = 0 для 1 * к и каждое число и из 91^, попавшее в отрезок т\ заменяется на соответствующий индекс 1 из множества I, причем границы отрезков т определяются набором пороговых уровней г = { ^ , 1 = 0,Ц.

Для осуществления отображения Б необходимо иметь множество представительных уровней г и последовательность индексов I из множества I. Каждому индексу 1 ставится в соответствие представительный уровень ц.

Таким образом, скалярный квантователь q полностью определяется множеством пороговых г и преставигельных уровней г, т.е. q = { г, г }, а операция квантования представляется в виде и е т] : О (и) = Г]. Если используется равномерный квантователь, то достаточно только трех чисел для его полного определения. Здесь возможны следующие варианты: {г^ , г^ X}, {2), Н, Ц, или {г^, .У, Ц, где г^ и Г]^ первый и последний представительный уровни, В = г^ - динамический диапазон, Н — (г] + г^)/2 или Я = го - средняя (опорная) точка и ^ = /)/(£-1) - шаг квантования, Ь - число уровней квантования. Для равномерного квантователя, таким образом, мы будем иметь q = {г^ц^Ь <3 = или я = {ДН), I = 1,1, ] = 1,1.

Введем теперь формальное определение переменного квантователя. Переменным квантователем будем называть квантователь, параметры которого зависят от координаты элемента изображения в поле зрения получателя Р0. Если задано правило выборки элементов из массива и, то можно записать для скалярного случая я(1) = (1(1), г(1)}, где 1 = 1,2,... - номера элементов изображения. Для двумерных координат в поле зрения будем иметь я(У) = { 1(У), г(У) }, где У е Р0- координаты элемента в поле зрения получателя.

Для того, чтобы определить параметры квантователя необходимо произвести некоторые операции с изображениями. Множество элементов или векторов, на основе которых определяются параметры квантователя, будем называть полем определения квантователя и обозначать через ^(У). Множество элементов или векторов, подвергающихся одинаковому квантованию будем называть полем зрения квантователя и обозначать через Ру(У). Очевидно, что Ру(к,1) ^ Ру(т,п) = 0, к * т или 1 * п. На практике эти параметры фиксируются т.е. Ру(У) = Ру и Ра(У) = Ра-

2.ПРОЦЕДУРЫ ИЗМЕНЕНИЯ ПАРАМЕТРОВ КВАНТОВАТЕЛЯ.

Как было отмечено выше, для успешного декодирования (операция О) на приемную сторону необходимо передать представительные уровни г и последовательность индексов 1. При фиксированном квантовании (Ру = ОО ) представительные уровни квантователя передаются один раз в начале связи, а затем достаточно передавать только индексы.

Для случая переменного квантования при каждом изменении квантователя приходится об этом информировать приемник. Здесь становится актуальной проблема выбора процедуры изменения параметров квантователя. Формально параметры

квантователя могут переопределяться в каждой точке изображения (Ру = 1), однако очевидно, тогда система сжатия будет неэффективной, поскольку придется передавать большой объем дополнительной информации. Существует два классических приема, позволяющих уменьшить объем дополнительной информации. Первый - предсказание [35],' при котором значения параметров квантователя в текущей точке пытаются угадать по уже переданным на приемную сторону параметрам квантователей из некоторой окрестности квантуемой точки

Я(0 = Р(яО- т),я(1- т- 1),...,я0-1)), (1)

где ш - определяет размер окрестности, а Р - оператор предсказания.

Второй - интерполяция, при которой в редких точках происходит переопределение параметров квантователя на основе пикселей из его поля определения, а в остальных их детерминированное изменение, с помощью интерполяционных функций [30,41].

= j = i-m+l,...,i+пl-l, (2)

где А - оператор интерполяции.

И в том и в другом случае делаются предположения о медленном изменении параметров квантователя от точки к точке. В ряде случаев, например, если среднее сигнала практически не меняется, можно зафиксировать какую-нибудь опорную точку квантователя и относительно нее изменять другие параметры. В другом случае можно перестраивать только опорную точку, а остальные параметры зафиксировать и тл. В общем случае, например для равномерною квантователя можно варьировать такими параметрами, как О диапазоном, Б- шагом квантования, Н-опорной точкой, Ь- числом уровней квантования и шагом интерполяции Ъ. Поскольку параметры О и 8 зависимы, реально используется один из этих двух параметров, например шаг Б. Если изменяются все параметры, мы имеем один 4 - параметрический переменный квантователь возможны также 4 трехпараметрических я(8,Н,Ь), я(8,2,Ь),

Я^Н,^, 6 двухпараметрических а(8,Н), q(S,L), q(S,Z)> я(Н,Ь), q(L,Z) и 4

однопараметрических я(8), ч(Н), и <№) квантоватлей. Мы будем рассматривать

только 2-х параметрические переменные интерполяционные квантователи типа ч(8,Н) с фиксированными параметрами (Ь,2).

З.МНОГОСЛОЙНАЯ МОДЕЛЬ ПЕРЕМЕННОГО КВАНТОВАТЕЛЯ.

Реальные изображения имеют ярко выраженную структуру. Как правило это композиция участков с приблизительно одинаковыми свойствами, причем переход от одного участка к другому может быть как резким, так и плавным. Если предположить, что нарушение гладкости в изображении редко вызваны разрывами физической поверхности изображаемого объекта, а скорее взаимным затенением и заслонением объектов, то разумно принять многослойную модель, которая трактует разрывы в функции как переключение между двумя гладкими функциями. Эти гладкие функции - слои описывают поведение представительных и пороговых уровней переменного квантования. Таким образом, основная идея здесь заключается в аппроксимации сложной функции набором гладких, переключаемых с помощью некоторой Ь - значной функции, где Ь - число слоев в модели или число уровней в квантователе.

Если принять вероятностную трактовку, то многослойная модель совпадает с иерархической вероятностной моделью ансамбля изображений [38-40], при которой предполагается, что источник изображений 8 является сложным и состоящим из множества подисточников 8 = ф, 1 = 1,Ь }, где Ь - число подисточников. Согласно [40] сначала выбирается реализация случайного Ь - значного поля индексов Ь = {Ь (и): (У) е Р0Ь После формирования символьного поля Ь сложное изображение и разобьется на Участки и],1 = т.е. и = и Ц]. Сложное изображение формируется согласно правилу и(у) = ц^у), если ЦУ) = 1, гце - элемент реализации 1 - го подисточника ^ Таким образом сложное изображение полностью описывается набором {Ь^,...^}. Эти

параметры, как правило, заранее неизвестны. Для их определения часто используют итеративную процедуру, а в качестве критерия оптимизации - максимум апостериорной вероятности (MAB оценивание), предварительно выбрав значение L и свойства поисточников Sj. Например, в [40] (предлагается использовать частные случаи источника с Гиббсовским распределением. Для индексов - полуторомарковское символьнозначное случайное поле, а в качестве Sj -гауссмарковские поля.

На первом этапе предполагают равную вероятность пикселей символьного поля. Затем от итерации к итерации вероятности переоцениваются и приближение сложного изображения простыми случайными полями становится все лучше. Если итеративный процесс сойдется, то мы получим оптимальную MAB оценку символьного поля L для выбранного значения L и заданного набора подисточников S. Значение L должно быть достаточным, для того, чтобы охватить все возможное разнообразие однородных участков изображения. Очевидно, что увеличивая число подисточников L и усложняя их свойства, мы будем приближать свойства сложных реализаций U к свойствам реальных изображений.

Рассмотрим детерминированную трактовку и пусть сложные изображения являются кусочно-непрерывными функциями и имеется L гладких функций R — { Rj ,1 = 1,L }. Предположим что, мы определили симольнозначное поле L, тогда сложное изображение U будет композицией кусков функций Rj, т.е. U = u Rj , причем Rj о R^ =

0, 1 * к , а его элементы будут определяться согласно правилу u(ij) = Rj (ij), если L(iJ) =

1. При выбранном значении L и функциях Rj задача оптимизации здесь заключается в поиске наилучшего поля индексов L, при котором достигается минимум выбранного критерия ошибок аппроксимации. По аналогии с вероятностным подходом для этого можно воспользоваться алгоритмом, при котором итеративно происходит переопределение поля индексов.

3.1 Выбор функций для многослойной модели

Как выбирать гладкие функции Rj? Если при вероятностной трактовке гладкость определялась структурой используемого потенциала в Гиббсовском распределении, то здесь можно воспользоваться другой классификацией функций, например, по количеству непрерывных производных, как это принято в теории аппроксимации [41]. Не теряя общности для простоты рассмотрим одномерный случай. Обычно пространство функций, заданных на конечном отрезке числовой оси [а,Ь] и имеющих п непрерывных производных обозначается через Сп[а,Ь]. Внутри каждого класса функции, имеющие п производных различаются по модулю непрерывности п - той производной. Модуль непрерывности некоторой функции R при определенном значении g обозначается через w(R;g) и определяется выражением

w(R;g) = max{]R(x)-R(y)|: х,у е[а,Ъ], |x-y|<g, (3)

Для непрерывных функций w(R, g) может меняться в широких пределах. Классическим средством аппроксимации являются многочлены. Пусть R есть функция, которую необходимо приблизить многочленом А, принадлежащим к классу многочленов порядка не выше п, т.е.^А е Ап. Предположим, что нам удалось выбрать наилучший из возможных многочленов А е Ап т.е.

А*||= Ш51(К,Ап) = шш||К-А|| (4)

Известна оценка для (4), выраженная через (3) [39]. Если R е С[а,Ъ], т.е. непрерывна на отрезке [а,Ь], то

(На (Я,АП)<; 6.-игф,(Ь-а)/(2-(п-1))), (5)

Легко видеть из (5), что если функция на отрезке имеет какую-нибудь особенность, например, быстрое изменение на каком-нибудь интервале, которое увеличивает значение w (.,.), аппроксимация функции на всем отрезке может оказаться плохой. Зависимость от локальных свойств апроксимируемой функции - главный недостаток многочленной аппроксимации. Таким образом, если потребуются более сложные R, то многочлены могут стать непригодными для этой цели. Единственным способом уменьшения погрешности аппроксимации является уменьшение отношения (b - а)/(п - 1). Это можно сделать увеличением п и/или уменьшением (Ь - а). Заметим, что как разбиение отрезка [а,Ь] на к частей, так и использование многочленов порядка k-n одинаковым образом влияют на ограничение (5). Однако, вычисление значения многочлена порядка k-n требует выполнения операций с k-n коэффициентами и базисными функциями, сложность которых возрастает с увеличением k-n. Кроме того, приходится решать систему линейных уравнений п - го порядка. В то же время вычисление значения в некоторой точке кусочно-многочленной функции порядка nek частями требует операций с п коэффициентами и локальной базисной функцией ограниченной сложности. Нахождение коэффициентов кусочно-многочленной функции требует решения, как правило, ленточной системы уравнений, что представляет собой более простую задачу. По этой причине обычно эффективнее уменьшать (Ь - а), чем увеличивать п. Это утверждение служит обоснованием выбора в дальнейшем кусочно-многочленной аппроксимации для гладких функций R. Полный класс кусочных многочленов называется сплайнами. Удобным представлением кусочно-многочленной функции является разложение по, так называемым, базисным сплайнам (В - spline) [41].

4. ПЕРЕМЕННОЕ КВАНТОВАНИЕ С ПРОИЗВОЛЬНЫМ ОПЕРАТОРОМ ИНТЕРПОЛЯЦИИ.

Обозначим через V = I J - число пикселей в изображении U. Предположим далее, что известно множество параметров квантователей, заданных в редких точках Q = { q(m,n), m = 1,М, n = 1,N }, где q(m,n)={ t0(m,n),...,tL(m,n); q (m,n),...,q^(m,n) } -квантователь в точке (m,n), L - число уровней квантования, а К = M-N - число редких точек на изображении,

Зададим множество интерполирующих функций А = { Ацщ, m = 1,М, n = 1,N }, с помощью которых по множеству квантователей, заданных в редких точках восстанавливают множество квантователей в каждой точке исходного изображения Q = { qr(ij), i = 1,1, j = 1,J } согласно выражению

Выражение (6) по сути дела означает, что по массивам представительных и пороговых Уровней, заданных в редких точках Я = { Г] (т,п), т = 1,М, п = 1,К, 1 = 1,Ц, Т = { ^ (т,п), т = 1,М, п = 1,М, 1 = 0,Ь} восстанавливают массивы представительных и пороговых уровней в каждой точке исходного изображения Я = {ц (У), I = 1,1, j = 1,1, 1 - 1,Ь} и Т = { 11(т,п), т = 1,М, п = 1,]Ч, 1 = 0,Ь}, согласно выражениям

М N

qr(i,j)= X SAmn(iJ)-q(m,n),

(6)

m = ln = l

М N

(7)

т = ln = 1

М N

(8)

т = ln = 1

где везде Ащ^У) - значение интерполирующей функции А в точке (У).

Обозначая множество координат пикселей изображения, удовлетворяющих УСЛОВИЮ I]. 4Г(У) < и(У) <; 1|г(10> при фиксированном 1 через Б] , можно записать правило переменного квантования и^У) = Г1Г(1,3), если (У) е ^ где иг = {иг (У), 1 = 1,1, ) - 1,1 } -массив восстановленных пикселей изображения. Функционал ошибки квантования можно записать в виде

I J ,

Ep(Qr)=S D[(u(i,j)-ur(i,j)]2 =

L i = lj = 1 L <9>

£ 2 [(u(ij)-r,r(i,j)]2=

l = l(i,j)€F, 1 = 1

а задачу переменного квантования свести к минимизации функционала (9) по всем возможным массивам пороговых и представительных уровней т.е.

Е= min Erj(Qr), (10)

min EF(Qr),

Tr R г A1

Иными словами мы будем решать задачу оптимизации (потерь) искажений при фиксированных параметрах модели (Ь,2) переменного квантователя (т.е. фиксируется скорость передачи информации). Некоторые варианты решения задачи оптимизации скорости при фиксированных потерях можно найти в [24,27].

5. КОНСТРУКТИВНЫЕ АЛГОРИТМЫ ПЕРЕМЕННОГО КВАНТОВАНИЯ.

5.1. Оптимальное СКО переменное квантование

Решение задачи (10) требует полного перебора всевозможных массивов пороговых и представительных уровней. Эта процедура даже в одномерном случае является трудоемкой, а для указанного выше многомерного случая практически неосуществима. Необходим конструктивный алгоритм решения этой задачи. Воспользуемся идеями алгоритма Ллойда-Макса 1 [41] и применим его к нашей задаче. Для этого надо доказать, что условия оптимальности одного шага квантования в этом алгоритме соблюдаются и в случае переменного квантования. Для упрощения перейдем к векторному обозначению массивов и,иг,Я ,Т ,ЯГ ,ТГ.

Введем произвольный оператор интерполирования А. Тогда согласно условиям (7) и (8) векторы Я}, Я]1, Т], Т]г будут связаны уравнениями

К[ = А , 1 = 1, Ь (11)

Т[Г = А • Т,, 1 = 0,Ь (12)

Используя для множества номеров компонент вектора и, удовлетворяющих условию 1МГ(1) < и(0 £ такое же обозначение, как и для 'элементов

соответствующих массивов - запишем выражение для фукнционала ошибки квантования в интервале [Тц/Ц] в следующем виде

где U] = SrU, Si = diag (s111,s222,...,siw), s » efl

1 [0,otherwise

Основным требованием к значениям компонентов векторов представительных уровней является выполнение условия tQr(i) < rjr(i) < tir(i) < ... < tL_ir(i) < ri/(i) < tLr(i). Это требование приводит к следующему условию оптимальности вектора представительных уровней Rj при заданных пороговых векторах Tj_j и Tj.

Е* = шш Ер(К1)} (14)

11г_1(0<г1г(1)^11г(0 1

Задача (14) известна в теории, как задача на условный экстремум квадратичного функционала и решается методами квадратичного программирования. Решив Ь раз эту задачу для всех значений 1, мы получим совокупность векторов представительных уровней К], 1 = 1,Ь, удовлетворяющих условию оптимальности (14), по которым согласно (11) определим представительные векторы К|г.

Теперь необходимо записать условие оптимальности порогового вектора Т|, при фиксированных векторах представительных уровней в следующем виде

EF(R) + EF (R. )= min [Ef(R) + Ef (R )], (15)

Fi i Fw i+i tf_l(i)<t[(i)^+1(i), i 1 1+1 1+1

Аналогично, согласно (12) получим искомый вектор Tjr. Поскольку ошибка квантования (15) является суммой ошибок квантования каждой компоненты исходного вектора, выражение достигает минимума, если мы будем для каждой компоненты вектора принимать оптимальное решение. Если значение компоненты u(i) расположено между двумя значениями компонентов ti_ir(i) и ti+ir(i) при заданных значениях qr(i) и q+jr(i) , наилучшим решением в смысле (15) будет расположение значения компоненты tr(i) посередине между значениями компонент векторов представительных уровней, т.е. tj r(i) = (i]r(i)+ri-|-ir(i))/2. Если оператор А линеен, то учитывая представления (11) и (12), можно записать А-Т = (A-Rj + А R1+1)/2 откуда следует А-Т = A-(Rj + R]+i)/2 ^Tj* = (Rj + Rj+j )/2. Это означает, что это условие достаточно соблюсти в редких точках, а в промежуточных точках оно выполнится автоматически.

Окончательно условия оптимальности одного шага итерационной процедуры построения оптимального переменного квантователя можно записать

К1Г = °[Т1Г_1,Т1Г], 1 = 1,L,

Т1*Г = (Rf + Rf+1) /2, 1 = I,L-1, T* <.,...< 7[.

(16) (17)

где О - условное обозначение процедуры решения задачи (14).

Применяя последовательно эти процедуры, можно построить последовательность векторов квантователей, начиная с некоторого приближения 0°, О1,...,^,..., для которых будет удовлетворяться условие

EF (Р«**"1)) = Ef(Qk) < Ef (Qk_l),

(18)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где к - номер итерации, а Р - условное обозначение процедур (16) и (17). Сходимость этой процедуры обусловлена (18) и ограниченностью значения ошибки квантования снизу нулем. Процедура сходится к стационарному вектору квантователей 0 . Найденный оптимум является локальным. Нахождение глобального оптимума требует применения процедуры динамического программирования, обобщение которой на случай переменного квантования с произвольным оператором интерполяции не представляется возможным. Мы .показали пример разработки алгоритма переменного квантования на основе С КО критерия. Сложность алгоритма СКО обуславливается непредсказуемостью положения уровней квантователя. Можно упростить алгоритм квантования введя структурные ограничения, например, древовидные.

5.2 Переменное квантование с древовидной структурой.

Согласно алгоритму на первом уровне дерева необходимо найти оптимальный вектор квантователей с одним уровнем О. Пусть заданы квантователи в редких точках, по которым затем определяются квантователи в промежуточных точках <3Г—А-0. Иначе, полагая <2={То,Т1^1} и Ог={Тог,Т1г,К1г}, можно записать К^А-К^. Вектор К^ следует искать из условия минимума квадратичного функционала

Еу(к1> =1|и-к[||2 =||и - АК1||2, (19)

при ограничениях типа неравенств т.е.

Ev(Ri) = T04n^Ev(Ri>' (20)

где tQ(i)=umin, а t^iimax, 11^= MIN (u(l),...,u(V)), umax=MAX (u(l).....u(V)).

Воспользуемся более простой процедурой безусловной минимизации. Приравняв частные производные функционала по Rj нулю, получим систему линейных уравнений AT U = Ат-A-Ri, откуда оптимальное решение будет иметь вид

Rj =(АТ.АГ1-АТ.и, (21)

Используя (21) получим для квантователей в промежуточных точках

К^г=А.(АТ.АГ1-АТ.и, (22)

Удвоим число уровней квантования и образуем вектор разностей

А = U - R*r = U - А • (АТ • А)"1 АТ • U, (23)

Представим вектор А в виде А = д+ - д-, где Д+ =S-A, Д" =(E-S>A, а S - соответствующая матрица, получаемая из выражения

Ио.дохо' i = 1'V <24>

где вц - 1 - й диагональный элемент матрицы.

Далее необходимо задать векторы разностей Б+ и Б" в редких точках, по которым затем получим ' к

дГ+=А-0+, дг~ = А (25)

Делая несложные преобразования, получим системы уравнений

(26)

АТД =АТ-(Е-8)-А.В , ^28)

откуда, решая их, получим выражения для оптимальных векторов Б*"1" и О*"

= (АТ • в • А)"1 • АТ • Д+ = (АТ • Б ■ А)~1 ■ Л, (29)

= (АТ • (Е - в) • А)"1 • АТ • Д~ = (АТ • (Е - Б) • А)"1 • О, (30)

где Б = Ат-Д+ = - АТ Д".

Подставляя оптимальные векторы (29) и (30) в (25), а затем, умножая результат на соответствующие матрицы в и (Е-8) получим

Д*Г+=8.А.(АТ.8-А) 1-АТ.Д+, (31)

Д*5Г" =(Е-8)-А.(АТ.(Е-8).АГ1-АТ.Д-, (32)

Декодирование изображения на втором уровне дерева производится простым суммированием Д^1"1" и Д8*г"

иг=к^г + д5г+ + д*5г~, (33)

Если необходим вектор квантователей с большим числом уровней, процедура (33) не производится, число уровней удваивается, векторы вычитаются из исходных Д+ и Д" и полученные векторы разности, каждый в отдельности подвергается описанной выше процедуре.

5.3 Переменное равномерное квантование

Равномерный квантователь является простейшим устройством и требует минимального объема информации для его описания. Обобщим его на случай переменного квантования с произвольным оператором интерполяции.

Пусть заданы векторы Тдг и Т|/, определяющие множество минимальных и максимальных значений пороговых уровней квантования, заданных в редких точках. Тогда можно определить векторы Тог + Вг, ТЬГ - Вг и Вг, где ВГ=(Т^ - ТоО/Ь. Обозначив через и множество индексов компонентов вектора и, для которых удовлетворяются условия Ц)г(1) £ и(1) < г^ф + Ьг(0 и ^г(1) £ и(1) < + Ьг(1), где Ьг(1) -ья компонента вектора Вг, можно найти два вектора представительных уровней К^ и К^ из условия минимума квадратичных функционалов

Ер1 <5(о<г[(^(1)+ьг(1) Ер1(К1

Ер = min Ef (Rl), (35)

L t£(i)-br(i)<r[(i)^t[(i) L

где Ef (Rm)H|Um-R^I|2H|Um-Sra'A-Rml|2> m

Um =Sm U, Sm =diag(smll>sm22,...,smVV), m = 1, m = L,

_ Jl,t{,(i) su(i)< tj(i)-br(i) ^ = fl,t[ (i) -br(i) u(i) < t[(i)

S()ii ~ [o,otherwise . Lu [0,otherwise

Для простоты используем безусловную минимизацию. Решая системы уравнений

ATUm = AT-SmA.Rm, m = 1, m = L, (36)

получаем выражения для векторов представительных уровней

Rm = (АТ • Sm • А)"1 ■ АТ . U m, m = 1, ш = L, (37)

По полученным векторам можно определить остальные векторы уровней из выражения

Rk=R1+(k-l)-A, k=l,L A = (RL-R1)/(L-1), (38)

Пороговые уровни можно расставить оптимальным образом

Tk =(Rk+Rk+1)/2, к = 1, L-1 (39)

В промежуточных точках квантователи определяются с помощью интерполяции согласно (11) и (12).

Везде, где использовался метод безусловной минимизации, необходимо полученные решения проверять на выполнение условия tQr(i) < qr(i) < tjr(i) < ... < tL_jr(i) < TLr(i) < tLr(i), i = 1,K и если оно не удовлетворяется ограничивать их. Например, для произвольного вектора представительных уровней R^, полученного в результате минимизации, необходимо произвести преобразование

Rk =

Tk-l'Rk <Tk-l' Rk,Tk_1 ^Rk <Tk,

Tk Rk ^Tk>

а затем использовать полученный вектор Rk вместо

б^ЫСТРЫЕ АЛГОРИТМЫ ПЕРЕМЕННОГО КВАНТОВАНИЯ.

Наложим ограничения на оператор интерполяции А. Пусть А есть кусочный многочлен нулевого порядка. Тоща квантователи, определенные в редких точках будут

сохранять свои параметры (представительные и пороговые уровни) в промежуточных точках. Покажем, что в этом случае удается построить быстрые алгоритмы переменного квантования, так как решение многомерной задачи сводится к многократному решению более простой одномерной задачи Ллойда - Макса 1 [42].

При кусочно-многочленной аппроксимации нулевого порядка ядро оператора А принимает вид

A(i,j) =

1,1 < i < Km,l < j < Kn

(41)

^.otherwise

где Km = I/ M, Kn = J/N, а оператор определяется матрицей размерностью VN

А =

0

0

LM

(42)

где блоки А|, 1=1, М размерностью (Кт1) К имеют вид

А* =[В15В2.....ВКш1, 1 = 1,М

а блоки В^ размерностью 1-Ы

(43)

Bj =

>2 0 Ь.

1

0

N J

(44)

где Ь,Т = (1ц(1),Ь|(2),...,Ь|(Кп)), = 1,1 = 1,Кп.

Благодаря простой структуре матрицы А соблюдается условие ортогональности

АТ.А = Кт-Кп-Е, (45)

где Е - тождественный оператор, а выражения (7) и (8) преобразуются к следующему- виду

ijr (m- Km + i, n- Kn + j) = rj (m, n), t[(m, n) = (ij (ro, n) + (ro, n)) / 2,

(46)

Из (46) и (47) видно, что значения параметров квантователя в промежуточных точках (У) определяются только значениями параметров в точках (ш,п) и не зависят от квантователей в других точках, что является следствием ортогональности оператора А, В более общем случае ортогональность не соблюдается и значение параметров квантователя в точке (У) может зависеть от того, какие значения примут параметры квантователей в остальных точках.

Выполнение условия (45) позволяет нам переписать условия оптимальности (16) и (17) в следующем виде

г1(т,п)-0[1м(т>п)Л1(т,п)], т= 1,М,п = (48)

^ (т, п) = (Г|(т, п) + г1+1(т, п)) /2, (49)

где О - процедура оптимизации представительного уровня при заданных пороговых.

Легко видеть,что сложная задача квадратичного программирования свелась к К -кратному решению более простой скалярной задачи Ллойда-Макса 1.

Покажем, что при этом общий алгоритм древовидного переменного квантования с оператором интерполяции нулевого порядка сводится к известному быстрому алгоритму группового кодирования [23]. Действительно, из структуры матрицы АТ видно, что при условии ортогональности ее действие на вектор изображения сводится к простому суммированию значений элементов вектора, а действие матрицы (А^А)"^ к их нормированию. Выражение (21) будет иметь вид

11=<ХХи(^>/(КтКп>> (50)

* }

что означает вычисление арифметического среднего. Аналогично выражение (37) после очевидных преобразований будет иметь вид

г1 = (

1 = 1,2.

(51)

где иа^е^о.^)},

Е2 =Ш):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N1 - число элементов множества Р].

Легко видеть, что в случае равномерного переменного квантования выражение, определяющее представительные уровни равномерного квантователя сводится к простому условному среднему элементов изображения.

В заключении введем формальное определение переменного квантователя, использующего кусочный многочлен нулевого порядка, который для краткости будем называть блочной импульсно кодовой модуляцией (БИКМ).

Пусть исходный массив и разбивается на непересекающиеся подмножества, которые в дальнейшем будем называть блоками и ={11^ ш = 1,М, п = 1,К}. Блок размером Р^(т,п) = Ру(т,п) -Ъ = Кт-Кп имеет вид

и^ ={и(т.Кт + и.Кп + Я. 1 = 1,Кт^ = 1,Кп}, (52)

Каждый блок рассматривается как отдельное изображение, для которого определяется свой квантователь я(ш,п) по одному из известных в литературе методов квантования. Таким образом для квантования всего массива пикселей и необходимо сформировать

множество = К квантователей, или эквивалентно, К наборов представительных и пороговых уровней

Q = {q(m,n) = (t0(m, n),...,tL(m,n);]j(m,ii).....rL(m,n)),

m = 1,M, n = 1,N.

Заключение

На основе многослойной модели интерполяционного переменного квантования сформулирована задача оптимизации потерь в сжатии при фиксированной скорости передачи информации. Приводятся общие ее решения для СКО оптимального, древовидного и равномерного переменного квантователей при произвольном операторе интерполяции. Показано, что известные алгоритмы быстрого блочного квантования (групповое [23], блочное усеченное кодирование [22] и тд.) являются частными случаями общих алгоритмов при операторе нулевого порядка. Приведенные алгоритмы могут быть использованы в любом методе сжатия не только в области значений элементов изображения, но и в области коэффициентов таких преобразований, как Фурье, дискретное косинусное, Лапласа и др.

В дальнейшем предполагается распространить полученные результаты на переменные квантователи с переменными L и Z и векторные квантователи.

ЛИТЕРАТУРА

1. Шеннон К. Математическая теория связи. Работы по теории информации и кибернетике.- М. - ИЛ. 1963 - С.243 - 332.

2. Berger Т. Rate-Distortion Theory.-Englewood Clife. - N.J.: Prentice-Hall.- 1971.

3. Колмогоров A.H., Тихомиров B.H. е - энтропия и е - емкость множеств в метрических пространствах, Успехи математических наук. - 1959 14. 3.

4. Kieffer J.C. A Survey of the Theory of Source Coding with a Fidelity Criterion, IEEE Transactions on Inform. Theory, Vol.39, No.5. September 1993.

5. Tasto M. and Wintz P. A bound on the rate-distortion function and application to images, IEEE Trans, on Inf. Theory - 1972. v.IT - 18. - PP.150 - 159.

6. Anastassiou D. and Sakrison D. New Bounds to R(D) for Additive Sources and Applications to Images Encoding, IEEE Trans, on Inf. Theoiy - 1979 - v.IT - 25. - no.2. - PP.145 - 154.

7. Sakrison D.J. On the role of the observer and a distortion measure in image transmission IEEE Trans. Comm. - 1977. v.COM - 25. - PP. 1251 - 1267.

8. Granrath D J. The Role of Human Visual Models in Image Processing Proceedings of the IEEE. 1981 - v.69.-no.5.- PP. 552 - 561. ^^

9. Hall C.F. and Hall E.L. A nonlinear model for spacial characteristics of the human visual system, IEEE Trans. Syst. Man Cybern. - 1977. - v.SMC - 7. PP. 161 - 170.

10. Mannos J.L. and Sakrison DJ. Effects of a Visual Fidelity Criterion on the Encoding of Images, IEEE Trans, on Inform. Theory - 1974. v.IT - 20. - no.4.- PP.525 - 535.

11. Kronander T. Perception based image coding. Proceedings, of SSAB, Gothenburg, Sweden, March. - 1989.

12. Джайн A.K. Сжатие видеинформации. Обзор ТИИЭР - 1981. т.69. вып.З. - С.71 - 117.

13. Нетравали А., Лимб Дж. Кодирование изображений Обзор. ТИИЭР. - 1980. т.68. вып.З С.76 - 121.

14. Прэтт У. Цифровая обработка изображений. Пер с англ.-М Мир. 1982 . Т.1 312 с. и Т.2 480 с.

15. Jayant N. Signal Compression: Technology Targets and Research Directions, IEEE Journal on Selected Areas in Communications, Vol.10., No. 5, June, 1992.

16. Goodall W.M. Television by Pulse Code Modulation, Bel1 Syst. Techn. J. 30. 33 - 49. (January, 1951).

17. A.c. 120534 Способ анализа и синтеза телевизионного изображения/Ю.М.Брауде-Золотарев. Заявл. 22.11.1957, Опубл. 1959. Бюл. 12.

18. Cutler C.C. Differential quantization on communication signals, U.S. Patent 2605361. 1952.

19. Kretzmer E.R. Reduced - alphabet representation of television signals, Conv. Rec. IRE -1958. no.6.- P.58.

20. Schreiber W.F.,Knapp C.F. Bandwidth reduction by digital coding, Conv. Rec. IRE - 1958. no.6 - P.58.

21. Kishimoto Т., Mitsua E., Hoshida К A. Method of still Picture Coding by using Statistics Properties (in Japanese ), National Conference of the Inst, of Electronics and Communications of Japan. 1974.-no.974.

22. Delp E.J., Mitchel O.R. Image compression using Block Truncation Coding, IEEE Trans. Communs. - 1979. - v.COM - 27. - PP. 1335 - 1342.

23. Сардыко C.B., Цуккерман И.И. Групповое кодирование изображений. Техника кино и телевидения.-1977.- N9. С.52-54.

24. Тхор В.Б. Адаптивное квантование изображений, Обработка данных в информационных системах. Часть. 1. - М - 1986. - С.40-43.

25. iScop В.Б. Сравнение методов трехуровневого блочного квантования изображений, Тезисы докладов. Всесоюзный симпозиум "Сокращение избыточности в цифровых телевизионных системах". -Тбилиси, 1983. С.86-87.

26. Тхор В.Б., Гогоберидзе Л.И. Трехуровневое групповое кодирование изображений, Цифровое кодирование изображений и коммутация изображений, Труды ГПИ им. В.И. Ленина. -1985.- N10(292). С. 55-58

27. Тхор В.Б. Кодирование гаусс-марковских полей методом блочной импульсно-кодовой модуляции. Обработка данных в информационных системах. Часть 11.-М - 1986. С.28-31.

28. Тхор В.Б., Гогоберидзе Л.И. Блочная импульсно-кодовая модуляция и свойства источника, Цифровое кодирование и коммутация сигналов изображений, Труды ГПИ им.В.И Ленина,- 1987. N613 (8).- С.75-78.

29. Лебедев Д.С., Тхор В.Б. Интерполяционный подход к кодированию изображений методом блочной ИКМ, Тезисы докладов. И Всесоюзная конференция АСОИз - 86, 1986.- С.91-93.

30. Лебедев Д.С., Тхор В.Б. Интерполяционный подход к блочной импульсно-кодовой модуляции, Иконика. Кодирование и обработка изображений.-М. Наука.-1988.-С.5-21.

31. Тхор В.Б. Кодирование изображений с переменными параметрами квантования в системах обработки видеоинформации. Диссертация на соискание ученой степени кандидата технических наук.- Москва. 1988.

32. А.с. 1359914. Способ кодирования и декодирования телевизионного сигнала/Тхор В.Б. Заяв. 8.07.1985 Опубл. 1987. Бюл. 46.

33. Тхор В.Б. Arm роксим анионный подход к адаптивному квантованию изображений. Системы передачи и обработки информации. Часть 1.- Москва. - 1988.

34. Цифровое кодирование изображений, Под ред. Цуккерман а И.И. - М. Радио и связь. -1981.- 239 с.

35. Пилипчук Н.И., Яковлев В.П. Адаптивная импульсно-кодовая модуляция, Москва. Радио и связь.- 1986. - 296 с.

36. Yiyan W. and Coll D., Single Bit-Map Block Truncation Coding of Color Images, IEEE Journal on Selected Areas in Communications, Vol.10, no.5. 1992.

37. Monet P. and Dubois E., Block Adaptive Quantization of Images, IEEE Transactions on Communications, Vol.41., No.2., Feb. 1993.

38. Лебедев Д.С., Безрук A.A., Новиков B.M. Марковская модель изображения и рисунка, Препринт ИППИ АН СССР. М.- 1983. 40 с.

39. Лебедев Д.С. Статистическая модель изображения, Иконика. Пространственная фильтрация изображений. Фотографические системы М. Наука, 1970. С. 53-65,

40. Лебедев Д.С. Статистическая теория обработки видеоинформации. Учебное пособие. Московский Физикотехнический институт. Москва. 1988.

41. Де Бор К. Практическое руководство по сплайнам. - М. Радио и связь. 1985. - 303 с.

42. Max J. Quantizing for minimum distortion, IRE Trans, on Information Theorv. - 1960.-V.IT-6. PP. 7-12.

i Надоели баннеры? Вы всегда можете отключить рекламу.