Научная статья на тему 'Сжатие изображений с помощью тензорной аппроксимации'

Сжатие изображений с помощью тензорной аппроксимации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
572
105
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМЕРНЫЙ СИГНАЛ / ТЕНЗОР / ТЕНЗОРНАЯ АППРОКСИМАЦИЯ / СЖАТИЕ С ПОТЕРЯМИ / СНИЖЕНИЕ РАЗМЕРНОСТИ СИГНАЛЬНОГО ПРОСТРАНСТВА / АППРОКСИМАЦИИ ЦЕПОЧКОЙ ТЕНЗОРОВ / СИГНАЛЬНО-ЗАВИСИМЫЕ ФИЛЬТРЫ / MULTIDIMENSIONAL SIGNAL / TENSOR APPROXIMATION / LOSSY COMPRESSION / REDUCTION OF THE SIGNAL SPACE DIMENSION / APPROXIMATION CHAIN TENSORS / SIGNAL FUNCTIONALLY-SPECIFIC FILTERS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чобану Михаил Константинович, Макаров Дмитрий Викторович

Рассматривается задача сжатия изображений, представляемых в форме многомерных сигналов. Для ее решения предлагается использовать метод тензорной аппроксимации, разработанный для сжатия данных большой размерности и позволяющий ускорить вычисления. Приведен результат применения двух методов Tensor Train Decomposition ( TT ) и Wavelet Tensor Train ( WTT ) для сжатия изображений. Установлено, что метод WTT позволяет получить большее сжатие, чем TT. Сравнение WTT с популярными алгоритмами сжатия изображений (JPEG и JPEG2000) показало, что при использовании фильтров малого ранга WTT проигрывает, а при фильтрах большого ранга превосходит JPEG и JPEG2000.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMAGE COMPRESSION BY USING TENSOR APPROXIMATION

The paper considers the problem of image compression while images are supposed to be the multidimensional signals. There is introduced tensor approximation method, developed for high dimension data compression and enabling faster computing. The results of the two methods of Tensor-Train Decomposition (TT) and Wavelet Tensor-Train (WTT) for image compression are presented. It was found that the method WTT gives greater compression than the TT. WTT comparison with the popular image compression algorithms (JPEG and JPEG2000) shown that the use of low rank filters WTT loses, and if the filters of large rank exceeds JPEG and JPEG2000.

Текст научной работы на тему «Сжатие изображений с помощью тензорной аппроксимации»

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Lesnikov V., Naumovich T. Generation and enumeration of structures of IIR digital filters.

- GSPx-2005, (Pervasive Signal Processing Conference), Santa Clara, Ca, USA, October 24-27, 2005 (paper number: 1837).

2. Lesnikov V., Naumovich T. Number-theoretic and algebraic aspects of structural synthesis of digital filters. - GSPx-2004, (The Embedded Signal Processing Conference), Santa Clara, Ca, USA, September 27-30, 2004 (paper number: 1374).

3. Lesnikov V., Naumovich T. Explanation of effect of low sensitivity of digital filters with some structures. - GSPx-2004, (The Embedded Signal Processing Conference), Santa Clara, Ca, USA, September 27-30, 2004 (paper number: 1270).

4. Лесников В.А., Наумович Т.В. Теоретико-числовые и алгебро-топологические аспекты структурного синтеза цифровых фильтров. Сборник трудов X-й международной научнотехнической конференции "Радиолокация, навигация и связь”. Т. 1. - Воронеж, 2004.

- C. 209-217.

5. Lesnikov V., Naumovich T., Chastikov A., Armishev S.A. New paradigm in design of IIR digital filters // Proceedings of IEEE East-West Design & Test Symposium (EWDTS'09), 2009.

- P. 115-118. - URL: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp? arnumber=5742083.

6. Lesnikov V., Naumovich T., Chastikov A., Armishev S. Implementation of a new paradigm in design of IIR digital filters // Proceedings of IEEE East-West Design & Test Symposium (EWDTS'10), 2010. - P. 115-118. - URL: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp? arnumber=5742051.

7. Mitra S., Sherwood R. Digital ladder networks // IEEE Transactions on Audio and Electroacoustics, 1973. - Vol. AU21, № 1. - P. 30-36. - URL: http://ieeexplore.ieee.org/xpl/ articleDetails.jsp?reload=true&arnumber=1162423.

Статью рекомендовал к опубликованию д.т.н., профессор В.И. Пономарев.

Лесников Владислав Алексеевич - Вятский государственный университет; e-mail: leslex.vlad@gmail.com; 610000, г. Киров, ул. Московская, 36; тел.: +79127124032; кафедра радиоэлектронных средств; к.т.н.; доцент.

Наумович Татьяна Викторовна - e-mail: ntv_new@mail.ru; тел.: +79127163435; кафедра радиоэлектронных средств; старший преподаватель.

Частиков Александр Вениаминович - e-mail: alchast@mail.ru; тел.: +79229050423; кафедра радиоэлектронных средств; д.т.н.; профессор.

Lesnikov Vladislav Alexeevich - Vyatka State University; e-mail: ntv_new@mail.ru; 36, Moscow street, Kirov, 610000; Russia; phone: +79127124032; the department of radio electronic aids; cand. of eng. sc.; associate professor.

Naumovich Tatiana Victorovna - e-mail: ntv_new@mail.ru; phone: +79127163435; the department of radioelectronic aids; lecturer.

Chastikov Alexander Veniaminovich - e-mail: alchast@mail.ru; phone: +7 922 905 0423; the department of radioelectronic aids; dr. of eng. sc.; professor.

УДК 621.396

М.К. Чобану, Д.В. Макаров

СЖАТИЕ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ ТЕНЗОРНОЙ АППРОКСИМАЦИИ*

Рассматривается задача сжатия изображений, представляемых в форме многомерных сигналов. Для ее решения предлагается использовать метод тензорной аппроксимации, разработанный для сжатия данных большой размерности и позволяющий ускорить вычис-

* Работа выполнена при поддержке гранта РФФИ № 12-07-00762-а.

ления. Приведен результат применения двух методов Tensor-Train Decomposition (TT) и Wavelet Tensor-Train (WTT) для сжатия изображений. Установлено, что метод WTT позволяет получить большее сжатие, чем TT. Сравнение WTT с популярными алгоритмами сжатия изображений (JPEG и JPEG2000) показало, что при использовании фильтров малого ранга WTT проигрывает, а при фильтрах большого ранга превосходит JPEG и JPEG2000.

Многомерный сигнал; тензор; тензорная аппроксимация; сжатие с потерями; снижение размерности сигнального пространства; аппроксимации цепочкой тензоров; сигнально-зависимые фильтры.

M.K. Tchobanou, D.V. Makarov IMAGE COMPRESSION BY USING TENSOR APPROXIMATION

The paper considers the problem of image compression while images are supposed to be the multidimensional signals. There is introduced tensor approximation method, developed for high dimension data compression and enabling faster computing. The results of the two methods of Tensor-Train Decomposition (TT) and Wavelet Tensor-Train (WTT) for image compression are presented. It was found that the method WTT gives greater compression than the TT. WTT comparison with the popular image compression algorithms (JPEG and JPEG2000) shown that the use of low rank filters WTT loses, and if the filters of large rank exceeds JPEG and JPEG2000.

Multidimensional signal; tensor approximation; lossy compression; reduction of the signal space dimension; approximation chain tensors; signal functionally-specific filters.

Введение. К известным методам снижения размерности, используемым для сжатия изображений, можно отнести: метод главных компонент (Principal Component Analysis, PCA); разложение по собственным значениям (Singular Value Decomposition, SVD). Идея PCA заключается в поиске для заданных точек нового базиса меньшей размерности.

Метод эффективен, но требует большого количества вычислений для выявления взаимозависимости между элементами и построения нового базиса, а также значительного объема памяти для хранения промежуточных результатов. Поэтому для данных большой размерности использовать этот метод нерационально. Сложность алгоритма оценивается как O(m2n)+O(m3), где m и n - размеры матрицы с исходными точками. Более подробное описание алгоритма PCA изложено в [1].

Метод SVD [1] позволяет представить исходную матрицу в виде произведения двух ортогональных матриц (базисов U и V) и диагональной матрицы (Е) собственных значений A = UEVT +E , где E - матрица ошибки, норма ||E|| = 5. Под

операцией || . || подразумевается норма Фробениуса, равная A = J ^ A(,•••,id)2 .

Собственные значения на диагонали матрицы Е распложены в убывающем порядке: Ci > с2 > ... > cs > 0. Значения с позволяют судить о «полезности» каждого вектора в ортогональных базисах (чем больше значение, тем более значимым является вектор), и последние векторы, которым соответствуют нулевые (или близкие к нулю) значения в матрице Е, можно отбросить. Таким образом, получается снижение размерности исходного пространства.

Для сжатия многомерных данных предлагается применить методы, которые были разработаны для аппроксимации данных большой размерности. Тензорные аппроксимации (аппроксимации многомерных массивов) применяются в линейной алгебре для компактного представления данных большой размерности и для ускорения вычислений.

Тензорный анализ и теория тензорных аппроксимаций играют все более важную роль в области вычислительной математики и численного анализа. Эффективное представление d-мерного тензора (массива с d индексами) небольшим чис-

лом параметров может дать возможность работать с данными размерности й, равной 10, 100 или даже 1000 (такие проблемы возникают в квантовой молекулярной динамике, финансовом моделировании, при решении стохастических уравнений в частных производных).

Постановка задачи. Многомерный сигнал - это сигнал, каждый отсчет которого является точкой в й-мерном пространстве: х£ Ра, где х - отсчет сигнала, Ра - й-мерное пространство.

Изображение в оттенках серого является двумерным сигналом. Каждая точка такого сигнала принадлежит пространству Р2, и изображение представимо в виде матрицы. Цветное изображение в формате ИОБ представимо тремя матрицами (по одной матрице на каждый цвет), и, следовательно, каждый отсчет изображения принадлежит пространству Р3. Важным примером многомерного сигнала является видеосигнал, который является 4-мерным сигналом. Каждый кадр видеопоследовательности можно рассматривать как точку 3-мерного пространства. й-мерным сигналом могут являться данные, снимаемые параллельно с й датчиков и совместно отправляемые в систему.

Кроме того, изображение можно рассматривать как сигнал размерности больше, чем 2, если, например, принять (для изображения в оттенках серого) каждый столбец матрицы изображения за отсчет в й-мерном пространстве.

Решение задачи. Под снижением сигнального пространства понимается линейное отображение исходного й-мерного сигнала в пространство размерности к, где к < й. Оператор, осуществляющий такой переход, следует выбирать с учетом возможности обратного перехода в пространство Рй (т.е. возможности приблизительного восстановления сигнала). Примером такого линейного оператора может служить матрица с ортонормированными столбцами (Б) размера к х й. Для такой матрицы справедливо, что 8Т • 8 = Ек, при этом 8 • 8Т ф Ей, где 8Т - транспонированная матрица 8 размера й х к, Е - единичная матрица размера к х к. С помощью матрицы 8 можно снизить размерность вектора х следующим образом:

1 1 1 1 ** 1 I 1 * • 1 I

Jkl • Skd _ 1 * d 1 Vk _

где x - точка пространства P , v - точка пространства Pk. Вектор x можно приблизительно восстановить, умножив вектор v на транспонированную матрицу S.

При применении метода снижения размерности сигнального пространства можно использовать лемму Джонсона-Линденштрауса [2]:

Лемма: пусть ее ^0,-1 j и P есть набор точек {pb p2, ..., pN} из пространства

Pd. Тогда существует отображение f: Pd ^

(1 - е) II Pi - Pj

< (1 + е)|1 Pi - Pj Hf при этом k > 0(e-2logN).

По числу элементов в аппроксимации метод аппроксимации цепочкой тензоров (Tensor-Train Decomposition) приближается к канонической аппроксимации, при этом существует стабильный алгоритм для получения такой аппроксимации. К тому же метод TT можно использовать в связке с методом Такера для дополнительного снижения числа элементов.

Pk, такое что

f < II/(Pi) - f (Pj )||f <

Идея метода заключается в представлении тензора большой размерности цепочкой тензоров малой размерности (равной 3):

Т(г.Гг2’"”гй) = ^ °1(а0’1га1) '•'••

а0’-’ай

'Сй (“й-1, й, ай(1) где О - тензор размера гк-1 х пк х гк , . При этом аппроксимация выполняется с точностью е: ||Т - Т’ || < е||т|| , где Т - исходный тензор, Т’ - тензор, которым

был аппроксимирован Т. Тензоры О вычисляются с помощью алгоритма БУБ, что гарантирует получение декомпозиции для любых данных.

Аппроксимации более избыточная, чем каноническая, за счет введения дополнительного индекса. В данном представлении каждый трехмерный тензор О связан с последующим и предыдущим тензорами с помощью индекса ак, поэтому такая структура ассоциируется с «цепочкой» или «поездом». На рис. 1 приведено графическое представление тензора размерности 5 [3]. В кружочках приведены ссылки (индексы а) между аппроксимирующими элементами. В прямоугольниках - аппроксимирующие элементы для соответствующих индексов.

I \ 1 0.1120.2 □——С □—СЕ5—С ОЛлОл 1КЕМ ОЛзОз^

Рис. 1. Графическое представление тензора размерности 5 в формате

Твтот-Тгат

Сумму (1) можно представить матричным произведением, так как каждому значению 1к в трехмерном массиве Ок соответствуют матрицы Нк:

Щ,12,...,1й) = Н/г,)• Н2(12)•...• Нё(1ё ) , (2)

где Нк - матрица размером гк-1 х гк.

При этом необходимо, чтобы г0 = га = 1 (результатом матричного произведения должен быть единственный элемент). Графическое изображение матричного произведения (2) приведено на рис. 2 (тензор Т имеет размерность 5). Отсюда видна суть избыточности по индексам (связь последующего с предыдущим): она нужна, чтобы выполнялось условие существования матричного произведения (число столбцов в первом сомножителе равно числу строк во втором).

T(i1,i2,i3,i4,i5)

□ = О

1 X 1

H1 H2

Hs

H4 H5

1 X r1 r1 X r4 X 1

r1 А r2 r2 X rS rS X r4

Рис. 2. Графическое представление матричного произведения (2)

Так как ранги rk обычно невелики, то по числу элементов аппроксимация приближается к канонической и ее размер оценивается как 0((d-2)-n-r2+2-n-r). Если к каждому тензору Gk применить декомпозицию Такера, то удастся достичь аппроксимации размера 0(d-n-r + (d-2)-r3). Алгоритм метода и численные результаты изложены в [3].

Применение вейвлетной цепочки фильтров (Wavelet Tensor-Train, WTT [4]) является модификацией метода TT, позволяющей представить исходный сигнал в более разреженном виде. Идея заключается в использовании тензоров Hk в качестве фильтров для исходного сигнала (т.е. Hk используется как матрица без преобра-

зования в 3-мерный тензор). Так как фильтры получены на основе сигнала (сигнально-зависимые), то они являются оптимальным базисом для данного сигнала, и при проецировании сигнала на этот базис можно получить массив с большим количеством нулей (разреженное представление сигнала). Такой массив коэффициентов имеет малую энтропию и хорошо сжимается.

Чтобы фильтры не были очень большими, необходимо ограничить их ранг, иначе они будут в точности представлять сигнал. Введем параметр rmax, задающий максимальный ранг фильтров. Алгоритм получения фильтров приведен в [4], включая пакет программ - TT-Toolbox для MATLAB, в котором реализованы методы построения TT-декомпозиции и построения цепочки фильтров (WTT).

Параметр е задает точность алгоритма SVD (чем меньше точность, тем больше ранг) при получении фильтров. Значение е следует задавать довольно большим (порядка 10-8), иначе фильтры будут хуже по своим характеристикам, чем фильтры, рассчитанные с высокой точностью е, что приведет к последующему снижению разреженности массива коэффициентов. Сложность алгоритма оценивается как 0((d-1)-n-r3), где r = max {rk} (для тензора T размером n1 = n2 =.. .= nd = n).

Применение фильтров к изображению сводится к последовательному перемножению фильтра и матрицы изображения с предварительным изменением размера матрицы изображения под размер фильтра.

Сигнал можно восстановить, так как фильтры являются ортогональными (свойство SVD алгоритма) и выполняется соотношение Hk • HT = HT • Hk = E ,

где Hk - ортогональная матрица фильтра (размера rk х rk), HkT - транспонированная матрица Hk, E - единичная матрица размера rk х rk.

Результаты. Для оценки эффективности алгоритма сжатия изображений WTT было проведено сравнение с современными алгоритмами сжатия. Для сравнения были выбраны алгоритмы сжатия JPEG (на основе ДКП преобразования [5]) и JPEG2000 (на основе вейвлет-преобразования [5, 6]).

На рис. 3 приведен график зависимости показателя PSNR от количества бит на пиксель для WTT, JPEG и JPEG2000. Использовался WTT с максимальным рангом фильтров равным 3 и 80. Сжатие измерялось без учета данных фильтров.

Рис. 3. Сравнение WTT c JPEG2000 и JPEG для изображения «Lena»

Из графика сравнения видно, что WTT c фильтрами максимального ранга З проиграл алгоритмам JPEG и JPEG2GGG.

Проведено сравнение WTT, JPEG и JPEG2000 по времени сжатия. Использовался WTT с максимальным рангом 3. Результаты испытаний показали, что WTT работает достаточно быстро, даже с учетом того, что алгоритм еще недостаточно оптимизирован. Для работы WTT совместно с энтропийным кодером (FPAQ) заметно отставание, что объясняется тем, что FPAQ является отдельным модулем, не оптимизированным для работы совместно с WTT. Для эффективного энтропийного кодирования разреженных данных изображения можно применить более простой кодер (например, кодирование RLE или LZH) используя который можно добиться значительного ускорения.

Заключение. Метод Tensor-Train Decomposition разработан для аппроксимации данных большой размерности. Планируется провести исследования по применению метода для сжатия сигнала ТВ ультравысокой четкости и видео различных разрешений. Для сжатия видео планируется поместить в один тензор несколько кадров видеопоследовательности и применить тензорную аппроксимацию. Такой подход позволит получить значительное сжатие видеопоследовательности и выигрыш по сравнению c WTT и существующими блочно-гибридными методами сжатия видео. Кроме того, следует рассмотреть возможность устранения блочного эффекта, так как ухудшение качества изображений происходит в основном за счет него.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Orfanidis, S. SVD, PCA, KLT, CCA, and All That // Optimum Signal Processing, Rutgers University. - 2007.

2. Dasgupta S., Gupta A. An elementary proof of a theorem of Johnson and Lindenstrauss // Random Structures and Algorithms. - 2003. - Vol. 22. - P. 60-65.

3. Oseledets, I.V. Tensor-train decomposition // SIAM J. Sci.Comput. - 2011. - Vol. 33, № 5.

- P. 2295.2317.

4. Oseledets, I.V. Approximation of matrices with logarithmic number of parameters // Doklady Math. - 2009. - Vol. 428, № 1. - P. 23-24

5. Wallace G.K. The JPEG Still Picture. Compression Standard // Communication of the ACM.

- 1991. - Vol. 34. - № 4.

6. Чобану М. Многомерные многоскоростные системы обработки сигналов. - М.: Техносфера, 2009. - 480 c.

Статью рекомендовал к опубликованию д.т.н., профессор С.Г. Крутчинский.

Чобану Михаил Константинович - НИУ «МЭИ»; e-mail: tchobanou@yahoo.com; 111250,

г. Москва, ул. Красноказарменная, 14; тел.: 89151316461; кафедра ЭФИС; д.т.н.; профессор,

Макаров Дмитрий Викторович - e-mail: makarovdmv@gmail.com; тел.: 84953627463; кафедра ВМСС; магистрант.

Tchobanou Mikhail Konstantinovich - NRU "MPEI"; e-mail: tchobanou@yahoo.com; 14, Krasnokazarmennaya street, Moscow, 111250, Russia; phone: +79151316461; the department of EFIS; dr. of eng. sc.; professor.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Makarov Dmitry Viktorovich -e-mail: makarovdmv@gmail.com; phone: +74953627463; the department of VMSS; postgraduate student.

i Надоели баннеры? Вы всегда можете отключить рекламу.