Научная статья на тему 'ВОЗМОЖНОСТИ ПРЕОБРАЗОВАНИЯ ВЕЙЛЯ - ГЕЙЗЕНБЕРГА В СТАНДАРТЕ СЖАТИЯ JPEG'

ВОЗМОЖНОСТИ ПРЕОБРАЗОВАНИЯ ВЕЙЛЯ - ГЕЙЗЕНБЕРГА В СТАНДАРТЕ СЖАТИЯ JPEG Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЖАТИЕ ИЗОБРАЖЕНИЙ / JPEG КОДЕК / ДИСКРЕТНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ / ПРЕОБРАЗОВАНИЕ ВЕЙЛЯ - ГЕЙЗЕНБЕРГА / СУБДИСКРЕТИЗАЦИЯ / КВАНТОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Волчков Валерий Павлович, Асирян Валерий Мишевич

Данная статья посвящена разработке и исследованию новой технологии сж атия на основе базисов Вейля - Гейзенберга (WH-технологии) для модификации стандарта сжатия JPEG и улучшения его характеристик. С этой целью в работе анализируются основные этапы алгоритма сжатия JPEG, отмечаются его ключевые особенности и узкие места, ограничивающие дальнейшее повышение его эффективности. Для преодоления этих ограничений предлагается на этапе трансформационного кодирования вместо дискретного косинусного преобразования (DCT) использовать вещественный вариант дискретного ортогонального преобразования Вейля - Гейзенберга (DWHT). Это преобразование, в отличии от DCT, изначально имеет блочную структуру и строится на основе оптимального сигнального базиса Вейля - Гейзенберга, функции которого ортогональны и хорошо локализованы как в частотной, так и во временной области. Данная особенность DWHT позволяет обеспечить после трансформационного кодирования более эффективную декорреляцию и уплотнение значений элементов в каждом блоке изображения. Как следствие - получить более эффективную селекцию и отсеивание малозначимых элементов на последующих этапах квантования и информационного кодирования. В статье на основе DWHT разрабатывается новая версия алгоритма сжатия JPEG, предлагаются удобные критерии оценки эффективности сжатия и метрики качественных потерь. Приводятся результаты экспериментального исследования, подтверждающие более высокую эффективность сжатия у предложенного алгоритма по сравнению со стандартом сжатия JPEG.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

WEYL - HEISENBERG TRANSFORM CAPABILITIES IN JPEG COMPRESSION STANDARD

This article is devoted to the development and research of a new compression technology based on Weyl-Heisenberg bases (WH-technology) for modifying the JPEG compression standard and improving its characteristics. For this purpose, the paper analyzes the main stages of the JPEG compression algorithm, notes its key features and problems that limit further enhancement of its efficiency. To overcome these limitations, it is proposed to use the real version of the two-imensional discrete orthogonal Weyl-Heisenberg transform (DWHT) instead of the discrete cosine transform (DCT) at the stage of transformation coding. This transformation, unlike DCT, initially has a block structure and is built on the basis of the Weyl -Heisenberg optimal signal basis, the functions of which are orthogonal and well localized both in the frequency and time domains. This feature of DWHT allows for more efficient decorrelation and compression of element values in each block of the image after transformation coding. As a result, it is possible to obtain more e fficient selection and screening of insignificant elements at the subsequent stages of quantization and information coding. Based on DWHT, a new version of the JPEG compression algorithm was developed, and convenient criteria for evaluating the compression efficiency and metrics of quality losses were proposed. The results of an experimental study are presented, confirming the higher compression efficiency of the proposed algorithm in comparison with the JPEG compression standard.

Текст научной работы на тему «ВОЗМОЖНОСТИ ПРЕОБРАЗОВАНИЯ ВЕЙЛЯ - ГЕЙЗЕНБЕРГА В СТАНДАРТЕ СЖАТИЯ JPEG»

УДК 519.6

DOI 10.52575/2687-0932-2021-48-1-188-200

Возможности преобразования Вейля - Гейзенберга в стандарте сжатия JPEG

Волчков В.П., Асирян В.М.

Московский технический университет связи и информатики, Россия, 111024, г. Москва, ул. Авиамоторная, 8а Национальный исследовательский технологический университет «МИСиС», Россия, 119049, г. Москва, Ленинский проспект, д. 4 E-mail: volchkovvalery@mail.ru, E-mail: dmc5mod@yandex.ru

Аннотация. Данная статья посвящена разработке и исследованию новой технологии сжатия на основе базисов Вейля - Гейзенберга (WH-технологии) для модификации стандарта сжатия JPEG и улучшения его характеристик. С этой целью в работе анализируются основные этапы алгоритма сжатия JPEG, отмечаются его ключевые особенности и узкие места, ограничивающие дальнейшее повышение его эффективности. Для преодоления этих ограничений предлагается на этапе трансформационного кодирования вместо дискретного косинусного преобразования ( DCT) использовать вещественный вариант дискретного ортогонального преобразования Вейля - Гейзенберга (DWHT). Это преобразование, в отличии от DCT, изначально имеет блочную структуру и строится на основе оптимального сигнального базиса Вейля - Гейзенберга, функции которого ортогональны и хорошо локализованы как в частотной, так и во временной области. Данная особенность DWHT позволяет обеспечить после трансформационного кодирования более эффективную декорреляцию и уплотнение значений элементов в каждом блоке изображения. Как следствие - получить более эффективную селекцию и отсеивание малозначимых элементов на последующих этапах квантования и информационного кодирования. В статье на основе DWHT разрабатывается новая версия алгоритма сжатия JPEG, предлагаются удобные критерии оценки эффективности сжатия и метрики качественных потерь. Приводятся результаты экспериментального исследования, подтверждающие более высокую эффективность сжатия у предложенного алгоритма по сравнению со стандартом сжатия JPEG.

Ключевые слова: сжатие изображений, JPEG кодек, дискретное косинусное преобразование, преобразование Вейля - Гейзенберга, субдискретизация, квантование.

Для цитирования: Волчков В.П., Асирян В.М.. 2021. Возможности преобразования Вейля -Гейзенберга в стандарте сжатия JPEG. Экономика. Информатика, 48 (1): 188-200. DOI: 10.52575/2687-0932-2021-48-1-188-200.

Weyl - Heisenberg transform capabilities in JPEG compression

standard

V.P. Volchkov, V.M. Asiryan

Moscow Technical University of Communications and Informatics, 8a Aviamotornaya St., 111024, Moscow, Russia National University of Science and Technology MISiS, 4 Leninsky prospekt, 119049, Moscow, Russia E-mail: volchkovvalery@mail.ru, E-mail: dmc5mod@yandex.ru

Abstract. This article is devoted to the development and research of a new compression technology based on Weyl-Heisenberg bases (WH-technology) for modifying the JPEG compression standard and improving its characteristics. For this purpose, the paper analyzes the main stages of the JPEG compression algorithm, notes its key features and problems that limit further enhancement of its efficiency. To overcome these limitations, it is proposed to use the real version of the two-

dimensional discrete orthogonal Weyl-Heisenberg transform (DWHT) instead of the discrete cosine transform (DCT) at the stage of transformation coding. This transformation, unlike DCT, initially has a block structure and is built on the basis of the Weyl-Heisenberg optimal signal basis, the functions of which are orthogonal and well localized both in the frequency and time domains. This feature of DWHT allows for more efficient decorrelation and compression of element values in each block of the image after transformation coding. As a result, it is possible to obtain more efficient selection and screening of insignificant elements at the subsequent stages of quantization and information coding. Based on DWHT, a new version of the JPEG compression algorithm was developed, and convenient criteria for evaluating the compression efficiency and metrics of quality losses were proposed. The results of an experimental study are presented, confirming the higher compression efficiency of the proposed algorithm in comparison with the JPEG compression standard.

Keywords: image compression, JPEG codec, discrete cosine transform, Weyl-Heisenberg transform, downsampling, quantization.

For citation: Volchkov V.P., Asiryan V.M. 2021. Weyl - Heisenberg transform capabilities in JPEG compression standard. Economics. Information technologies, 48 (1): 188-200 (in Russian). DOI: 10.52575/2687-0932-2021-48-1-188-200.

Введение

Как известно, с появлением возможности отображения графической информации персональными компьютерами возникла сопутствующая проблема, связанная с эффективным хранением и передачей растровых изображений. Для решения этой проблемы в 1986 году был собран комитет экспертов со всего мира под названием Joint Photographic Experts Group (JPEG). Именно данная экспертная группа в последствии в 1992 году и разработала известный стандарт сжатия растровых изображений JPEG [T.81, 1992]. На сегодняшний день JPEG - самый распространённый формат кодирования, отправки и хранения растровых изображений, без которого невозможно представить современные информационные системы, фотокамеры, персональные компьютеры и мобильные устройства. Согласно заявленным данным, начиная с 2015 года, ежедневно создается несколько миллиардов изображений формата JPEG.

В исходной спецификации формат сжатия JPEG реализован на базе более ранних исследований, работ и патентов. Отправной точкой для разработки алгоритма сжатия JPEG послужило дискретное косинусное преобразование (DCT), которое впервые было предложено Насиром Ахмедом в качестве метода сжатия изображений в 1972 году. Позднее Н. Ахмед совместно с другими исследователями разработал практический алгоритм дискретного косинусного преобразования [ Ahmed N., Natarajan T., and Rao K.R., 1974], привлекший внимание других ученных [ Chen W., Pratt W.K., 1984; Chen W., Smith C., and Fralick S., 1977; Ахмед Н., Рао K.P., 1980], общий вклад которых стал основополагающим для стандарта сжатия JPEG.

На сегодняшний день значительный технологический прогресс, достигнутый в разработке новых алгоритмов передачи и обработки информации, делает особенно актуальными исследования все более сложных методов получения частотных и частотно-временных характеристик сигналов. Синтез универсального базиса, который позволяет функционально разделять сигнал в частотно-временной области на определенные фрагменты, а затем внутри них анализировать спектральные особенности сигнала, представляет сложную задачу. Однако, как отмечалось в предыдущих работах [ Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020; Асирян В.М., Волчков В.П., 2018; Асирян В.М., Волчков В.П., 2017] именно с помощью таких базисов можно учесть нестационарные особенности сигнала и получить большую эффективность сжатия.

Одним из возможных решений данной задачи является оконное преобразование Фурье (Short-time Fourier transform), которое позволяет получать характеристику распределения частоты сигнала во времени. Но главная проблема при использовании оконного преобразования Фурье связана с принципом неопределенности Гейзенберга, который действует в отношении параметров времени и частоты сигнала. В основе этого принципа лежит тот факт, что невозможно точно сказать в какой момент времени определенная частота присутствует в сигнале, можно говорить лишь об интервале времени или диапазоне частот. Кроме того, оконное преобразование Фурье обладает избыточностью поскольку является комплексным преобразованием и, как следствие, не подходит как инструмент сжатия изображений.

В свою очередь, применение вейвлет-преобразований (Wavelet transform), разработанных как инструмент, который решает проблему неопределенности Гейзенберга для получения частотно-временных характеристик сигнала и получивших распространение в задачах сжатия изображений - JPEG 2000 [Добеши И., 2001], не всегда является оптимальным средством. Кроме того, распространенным недостатком вейвлетов является несимметричность формирующих функций.

Именно по этим причинам одним из наиболее перспективных методов получения частотно-временных характеристик сигнала является использование обобщенных базисов Вейля-Гейзенберга, полученных путем равномерных сдвигов по времени и частоте одной или нескольких функций [Волчков В.П., 2009; Gabor D., 1946]. В ранних работах было показано, что базис Вейля -Гейзенберга, построенный на основе функции Гаусса, представляет особый интерес для исследований. Сегодня современные подходы и алгоритмы, направленные на синтез оптимального большого базиса Вейля-Гейзенберга, позволяют применять его к большим сигналам, в частности изображениям [Volchkov V.P., Sannikov V.G., 2018; Bolcskei H. et al., 1999].

Как отмечалось ранее, данная статья посвящена внедрению технологии сжатия на основе базисов Вейля-Гейзенберга (WH-технологии) для модификации стандарта сжатия JPEG. Хочется отметить, что стандарт JPEG хоть и не является относительно новым, однако он и по сей день обладает эффективными характеристиками сжатия. Кроме того, идеи стандарта JPEG легли в основу для более поздних алгоритмов сжатия, таких как JPEG2000, HEIF и другие. Для лучшего понимания предлагаемого решения по модификации стандарта JPEG ниже более подробно описываются основные этапы алгоритма сжатия JPEG, включающие в себя преобразование цвета, субдискретизацию, блочное дискретное косинусное преобразование, квантование и энтропийное кодирование. Также изучаются особенности стандарта JPEG, и предлагается новый подход к сжатию растровых изображений, основанный на применении дискретного ортогонального преобразования Вейля-Гейзенберга [Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020]. Для этого в рамках данного исследования строится двухстороннее вещественное преобразование Вейля -Гейзенберга, формулируются рекомендации для выбора параметров WH-базиса, вводятся соответствующие критерии оценки эффективности сжатия, метрики качественных потерь и проводится объективное сравнение предложенного подхода к сжатию изображений со стандартом JPEG.

JPEG кодек

Как отмечалось ранее, стандарт сжатия JPEG основан на дискретном косинусном преобразовании (DCT). Данное преобразование является ортогональным, а значит легко обратимым. По определению любое дискретное ортогональное преобразование линейно и имеет матричное представление. В предыдущих работах [Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020] были определены одномерные и двумерные дискретные ортогональные преобразования и было показано, что матрица

преобразования должна обладать свойством унитарности, которое описывается выражением

UU = UU = I,

(1)

где I - единичная матрица, U - квадратная матрица преобразования, у которой по столбцам стоят дискретные ортонормированные базисные функции (векторы). Таким образом, любое дискретное ортогональное преобразование задается матрицей базисных векторов.

Согласно определению матрица дискретного косинусного преобразования размерности определяется согласно следующему выражению

UDCT J) = <

—, if i = 0,

N

(n

cos

2J +1) î

2 N

else.

(2)

i = 0,..., N -1, J = 0,..., N -1.

и удовлетворяет свойству (1).

Фактически DCT позволяет представить любую конечную последовательность данных (отсчетов) в виде линейной комбинации дискретных базисных функций косинуса (2) с разными частотами. Следует отметить, что дискретное косинусное преобразование тесно связано с дискретным преобразованием Фурье (DFT) и эта связь является гомоморфизмом. Поэтому на практике, как правило, DCT вычисляется с использованием быстрых реализаций дискретного преобразования Фурье [ Makhoul J., 1980]. Тем не менее, в рамках данного исследования этот нюанс является не принципиальным, поэтому DCT для наглядности далее будет представляться в матричном виде (2).

Следует отметить, что предварительно перед применением блочного DCT, исходное растровое изображение в терминах каналов красного, зеленого и синего цветов (RGB) переводится в цветовое пространство YCbCr [T.81, 1992]. В данной цветовой модели компонента Y представляет яркость пикселя, а компоненты Cb и Cr представляют цветность, разделенную на синий и красный цвета соответственно. Преобразование из RGB в цветовое пространство YCbCr обеспечивает большую степень сжатия без значительного влияния на воспринимаемое качество изображения. Объясняется это тем, что информация о яркости более важна для конечного качества восприятия изображения, в то время как цветностью можно частично пренебречь. Для этого применяется цветовая субдискретизация - уменьшение частоты дискретизации путем прореживания отсчетов цветовых компонент Cb и Cr. В стандарте сжатия JPEG цветовая субдискретизация применяется в соотношении 4:2:0, то есть прореживание происходит через одну строку и один столбец [ T.81, 1992]. Данная процедура приводит к уменьшению размерности цветовых компонент Cb и Cr в 2 раза как по горизонтали, так и по вертикали. Уже на данном этапе исходное изображение удается сжать в 1.5 раза.

В рамках данной статьи для упрощения моделирования и интерпретации результатов, все эксперименты проводятся с монохромными растровыми изображениями, состоящими из одного канала - яркостной компоненты Y. Поэтому преобразование цвета и субдискретизация не используются. Однако, аналогичные результаты можно получить и для цветных изображений в терминах YCbCr.

Согласно стандарту JPEG [T.81, 1992], дискретное косинусное преобразование применяется не ко всему изображению целиком, а отдельно к каждому блоку изображения размерности 8*8. Иными словами исходное изображение делится на определенное количество блоков, каждый из которых подвергается независимой

обработке. Выбор такой размерности блоков обусловлен несколькими причинами. Во -первых, увеличение размерности блоков не приводит к сильному увеличению показателей сжатия, в то время как вычислительная сложность алгоритма возрастает. Во-вторых, возникает высокая вероятность наличия большого количества резких границ внутри одного блока, что может повлечь за собой эффект Гиббса.

Прямое и обратное блочные дискретные ортогональные преобразования записываются как

х(к) = и*у(^)и, (3)

\(к) =Ш(к)13\ (4)

где к - индекс определенного блока и, если не применялась процедура сжатия, ^ = \(к).

На рис. 1 представлены исходное растровое монохромное квадратное изображение «barbara.png» (512*512 пикселей) и результат применения описанной выше процедуры блочного дискретного косинусного преобразования (8*8 пикселей).

Рис. 1. Исходное изображение (слева), блочное DCT (справа) Fig. 1. Original image (left), block DCT (right)

После применения блочного DCT (рис. 1) к каждому полученному блоку применяется операция квантования, которая описывается выражением

где Z(k- к-ый блок матрицы элементов спектра изображения размерности (8*8), Q -матрица коэффициентов квантования, M - размерность блока (в данном случае M = 8), а R g N+ - натуральный коэффициент квантования по умолчанию равный 1.

Коэффициент квантования R управляет степенью сжатия - чем больше его значение, тем больше сжатие. В свою очередь матрица квантования Q (как указано в исходном стандарте JPEG) задается следующим образом

Q =

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

49 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

Операция округления (5) является единственной операцией с потерями во всем процессе сжатия (кроме цветовой субдискретизации). В результате выполнения процедуры квантования большая часть высокочастотных компонентов спектра округляется до нуля, а оставшееся часть состоит из небольших положительных или отрицательных чисел, для представления которых требуется намного меньше битов. Для эффективного кодирования оставшихся ненулевых элементов применяется так называемое zig-zag преобразование, которое позволяет перестроить каждый отдельный блок размерности (8*8) в соответствующий вектор размерности (n = 64) таким образом, что нулевые элементы оказываются в конце последовательности значений вектора. После чего большая часть нулевых элементов каждого полученного вектора отбрасывается и применяется энтропийное кодирование (например, кодирование Хаффмана) для преобразования полученной последовательности в биты [Chen W., Pratt W.K., 1984].

В свою очередь, при восстановлении изображения все описанные выше преобразования выполняются в обратном порядке. Кроме того, вместо процедуры квантования (5) применяется обратная процедура, которая описывается следующим выражением

а взамен прямому блочному дискретному косинусному преобразованию применяется соответствующее обратное преобразование.

Преобразование Вейля-Гейзенберга

Согласно ранним работам [Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020], унитарная комплексная матрица ортогонального базиса Вейля-Гейзенберга размерности (NXN) определяется выражением

U = Re{UÄ } + j Re{U}, (7)

элементы которой вычисляются согласно выражениям

2х1к (и-а/2)

U R(n,lM + k) = g[(n-lM)N]e M ,

M 2кjk (n-а/2)

U (n, IM + k) = jg[(n + M - IM)Ne M ,

n = 0,...,N-1, к = 0,...,M-1, l = 0,...,L-1, N = IM.

где М - количество сдвигов по частоте, Ь - количество сдвигов по времени, а - фазовый параметр, g() - оптимизированная формирующая WH-функция размерности N. При этом матрица U является унитарной, т.е. удовлетворяет (1).

Следует отметить, что в задачах сжатия изображений мы имеем дело с вещественным двумерным сигналом, а это значит, что применение комплексной матрицы Вейля-Гейзенберга не является целесообразным, поэтому мы используем вещественную версию матрицы (7), которая определяется выражением

Ü = Re {и} + Im{U}. (8)

Формула (8) может записана в эквивалентном виде

Ü = Re{lU + Re{U }. (9)

Ранее было показано, что преобразование матрица (9) ортогональна и удовлетворяет свойству (1) [ Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020].

Для того, чтобы сравнить разработанное дискретное ортогональное преобразование Вейля-Гейзенберга с блочным дискретным косинусным преобразованием в задаче сжатия изображения, мы берем значение числа частотных сдвигов М = 8 (что фактически соответствует разделению блоков 8*8), то значение фазового параметра а = М / 2 = 4. Запишем также формулу для расчета оптимального значения

1

с = —Г", М 2р

где в - параметр, обеспечивающий оптимальную локализацию функции Гаусса.

На рис. 2 представлены исходное растровое монохромное квадратное изображение «barbara.png» (512*512 пикселей) и соответствующие ему спектры блочного DCT и DWHT (при в = 2). Для удобства сравнения изображения спектры обрезаны до 16*16 пикселей.

Рис. 2. Исходное изображение (слева), блочное DCT (по середине), DWHT (справа) Fig. 1. Original image (left), block DCT (center), DWHT (right)

Аналогично алгоритму сжатия JPEG можно определить матрицу квантования Q для дискретного преобразования Вейля-Гейзенберга

Q

8 16 24 32 32 24 16 8

16 32 48 64 64 48 32 16

24 48 72 96 96 72 48 24

32 64 96 128 128 96 64 32

32 64 96 128 128 96 64 32

24 48 72 96 96 72 48 24

16 32 48 64 64 48 32 16

8 16 24 32 32 24 16 8

При этом значения элементов матрицы квантования Q для дискретного преобразования Вейля-Гейзенберга были подобраны исходя из особенностей получаемого спектра.

Результаты экспериментов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того, чтобы качественно оценить степень отличия между исходным изображением и его сжатой версией вычислим норму Фробениуса разности между матрицами исходного изображения и восстановленного после сжатия

где т, п - ширина и высота изображения соответственно. В дальнейшем формула (10) будет служить критерием качественных потерь, то есть главным не визуальным показателем отличия восстановленного изображения от исходного.

Зачастую для измерения уровня искажений при сжатии изображений используется такой показатель, как пиковое отношение сигнала к шуму (Р8ЫК). Поскольку большинство сигналов имеют широкий динамический диапазон, Р8ЫЯ обычно измеряется по логарифмической шкале в децибелах и определяется согласно выражению

PS—R = 10log

v MSE j

где т, п - ширина и высота изображения.

Для оценки степени сжатия введем показатель К - коэффициент сжатия, означающий отношение количества нулевых элементов спектра изображения к общему числу элементов изображения (в процентах)

N

K = —^ -100%.

N

где Nz - количество обнуленных элементов спектра изображения в том или ином базисе, а Nt - общее количество анализируемых элементов спектра (в общем случае для матрицы изображения NT = mn ).

Для объективного сравнения DCT (согласно JPEG спецификации) и DWHT (при в = 2) в задаче сжатия изображений было выполнено моделирование для различных значений коэффициента квантования R = 1, 4, 8 и были посчитаны значения показателей, описанных формулами (10-12).

На рисунках 3-4 в качестве примера демонстрируются результаты сжатия одного и того же изображения «barbara.png» (512*512 пикселей) при R = 1, 4, 8 с использованием DCT (JPEG) и DWHT, а в таблицах 1 -2 приведены полученные соответствующие численные результаты.

Таблица 1 Table 1

Сжатие с использованием DCT (JPEG) Compression using DCT (JPEG)

Коэффициент квантования 1 4 8

Коэффициент сжатия, K (%) 83.73 93.82 96.63

PSNR (дБ) 32.53 26.26 23.92

Потери качества, E 438.58 980.48 1339.16

Таблица 2 Table 2

Сжатие с использованием DWHT (при ß = 2) Compression using DWHT (for ß = 2)

Коэффициент квантования 1 4 8

Коэффициент сжатия, K (%) 85.68 94.68 96.87

PSNR (дБ) 33.87 27.65 25.29

Потери качества, E 336.66 776.45 1106.21

Рис. 3. Результаты сжатия с использованием DCT для R = 1, 4, 8 Fig. 3. Compression using DCT for R = 1, 4, 8

Рис. 4. Результаты сжатия с использованием DWHT для R = 1, 4, 8 Fig. 4. Compression using DWHT for R = 1, 4, 8

Сравнительный анализ визуальных и численных характеристик показывает, что наименьшие потери качества при сжатии изображения получаются именно в случае преобразования Вейля-Гейзенберга (DWHT). Согласно результатам моделирования DWHT в среднем обеспечивает сохранение до 20-25% качества изображений по сравнению с DCT (JPEG) при большем коэффициенте сжатия K.

Заключение

По итогам моделирования можно сделать вывод о том, что представленный новый подход к сжатию растровых изображений, базирующийся на основе вещественного дискретного ортогонального преобразования Вейля-Гейзенберга, обеспечивает высокую степень сжатия и большее сохранение качества изображения при восстановлении по сравнению с известным стандартом сжатия JPEG. Следовательно, использование дискретного ортогонального преобразования Вейля-Гейзенберга оказывается весьма эффективным инструментом в задаче сжатия и хранения растровых изображений. Данный феномен объясняется тем, что изображение представляет собой нестационарный двухмерный случайный процесс, особенности которого полноценным образом можно охватить лишь в частотно-временной области, разбив его на фрагменты. Что является критически важным для последующего отсеивания несущественных спектральных компонент и, как следствие, эффективного сжатия изображения.

Список литературы

1. Асирян В.М., Волчков В.П., 2017. Применение ортогонального преобразования Вейля-Гейзенберга для сжатия изображений. Телекоммуникации и информационные технологии, 4 (1): 50-56.

2. Асирян В.М., Волчков В.П., 2018. Вычислительно эффективная реализация прямого и обратного преобразований Вейля-Гейзенберга. Телекоммуникации и информационные технологии, 5 (1): 5-10.

3. Ахмед Н., Рао К.Р., 1980. Ортогональные преобразования при обработке цифровых сигналов. Пер. с англ. Под ред. Фоменко И.Б. М., Связь, 248 с. (Ahmed N, Rao K.R., 1975. Orthogonal Transforms for Digital Signal Processing. Berlin, Heidelberg, New York: SpringerVerlag, 264 р.).

4. Волчков В.П., 2009. Новые технологии передачи и обработки информации на основе хорошо локализованных сигнальных базисов. Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика, 15(70): 181-189.

5. Волчков В.П., Асирян В.М., 2017. Вычислительно эффективный алгоритм формирования оптимального базиса Вейля-Гейзенберга. Фундаментальные проблемы радиоэлектронного приборостроения. М., МИРЭА. Часть 4: 1151-1154.

6. Волчков В.П., Петров Д.А., 2009. Оптимизация ортогонального базиса Вейля-Гейзенберга для цифровых систем связи, использующих принцип OFDM/OQAM передачи. Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика, 1(56): 102-112.

7. Волчков В.П., Петров Д.А., 2009. Условия ортогональности обобщенных базисов Вейля-Гейзенберга для OFTDM сигналов. Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика, 15(70): 190-199.

8. Волчков В.П., Петров Д.А., 2010. Обобщенная теорема Найквиста для OFTDM сигналов. Системы синхронизации, формирования и обработки сигналов, 1(1): 28-32.

9. Добеши И., 2001. Десять лекций по вейвлетам. Ижевск, РХД, 464 с. (Daubechies I., 1992. Ten Lectures on Wavelets. Philadelphia, Pa.: Society for Industrial and Applied Mathematics, 378 р).

10. Ahmed N., Natarajan T., and Rao K.R., 1974. Discrete Cosine Transform. IEEE Transactions on Computers. C-23 (1): 90-93.

11. Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020. Image Compression Using Discrete Weyl-Heisenberg Transform. Proceedings - 2020 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology, USBEREIT 2020, 399-402.

12. Bolcskei H. et al., 1999. Efficient design of OFDM/OQAM pulse shaping filter. Proceedings of IEEE International Conference on Communications (ICC 99). Vol. 1: 559-564.

13. Chen W., Pratt W.K., 1984. Scene Adaptive Coder. IEEE Transactions on Communications, 32 (3): 225-232.

14. Chen W., Smith C., and Fralick S., 1977. A Fast Computational Algorithm for the Discrete Cosine Transform. IEEE Transactions on Communications, 25 (9): 1004-1009.

15. Digital compression and coding of continuous-tone still images - requirements and guidelines. 1992. V. 81, CCITT, 186 p.

16. Gabor D., 1946. Theory of communication. J. Inst. Elect. Eng. (London), 93 (111): 429-

457.

17. Makhoul J., 1980. A fast cosine transform in one and two dimensions. IEEE Transactions on Acoustics, Speech, and Signal Processing. Mathematics. Vol. ASSP-28, No. 1: 27-34.

18. Volchkov V. et al., 2019. Synthesis of Real Weyl-Heisenberg Signal Frames with Desired Frequency-Time Localization., 2019 24th Conference of Open Innovations Association (FRUCT), Moscow, Russia: 502-508.

19. Volchkov V.P., 2007. Signal bases with good time-frequency localization. Electrosvyaz, 2: 21-25.

20. Volchkov V P., Petrov D.A., 2009. Orthogonal Well-Localized Weyl-Heisenberg Basis Construction and Optimization for Multicarrier Digital Communication Systems. Proc. of ICUMT, St. Petersburg: Oct.

21. Volchkov V.P., Sannikov V.G., 2018. Algebraic approach to the optimal synthesis of real signal Weyl-Heisenberg bases. 2018 Systems of Signal Synchronization, Generating and Processing in Telecommunications (SYNCHROINFO 2018). Publ: Institute of Electrical and Electronics Engineers (IEEE), POD Publ: Curran Associates, Inc. (Oct 2018): 135-142.

22. Wexler J., Raz S., 1990. Discrete Gabor expansions. Signal Processing, 21 (3): 207-220.

References

1. Asiryan V.M., Volchkov V.P., 2017. Primenenie ortogonal'nogo preobrazovaniya Veilya-Geizenberga dlya szhatiya izobrazhenii. [Application of the Weyl-Heisenberg orthogonal transform for image compression]. Telekommunikacii i informacionnye tehnologii, 4 (1): 50-56.

2. Asiryan V.M., Volchkov V.P., 2018. Vychislitel'no effektivnaya realizatsiya pryamogo i obratnogo preobrazovanii Veilya-Geizenberga. [A computationally efficient implementation of the direct and inverse Weyl-Heisenberg transforms]. Telekommunikacii i informacionnye tehnologii, 5 (1): 5-10.

3. Akhmed N., Rao K.R., 1980. Ortogonal'nye preobrazovaniya pri obrabotke tsifrovykh signalov [Orthogonal transformations in digital signal processing]. Translated from English. Edited by Fomenko I.B. M., Svyaz', 248 p. (Ahmed N, Rao K.R., 1975. Orthogonal Transforms for Digital Signal Processing. Berlin, Heidelberg, New York: Springer-Verlag, 264 p.).

4. Volchkov V.P. 2009. A new technology of transmitting and processing of jnformation based on well-localized signal basis. Belgorod State University Scientific Bulletin. History Political science Economics Information technologies, 15(70): 181-189 (in Russian).

5. Volchkov V.P., Asiryan V.M., 2017. Computationally efficient algorithm of forming an optimal basis for the Weyl-Heisenberg. Fundamental problems of electronic instrument engineering. Moscow, MIREA. Part 4: 1151-1154 (in Russian).

6. Volchkov V.P., Petrov D.A., 2009. Orthogonal Weyl-Heisenberg basis optimisation for digital communication systems based on OFDM/OQAM. Belgorod State University Scientific Bulletin. History Political science Eco-nomics Information technologies, 1(56): 102-112 (in Russian).

7. Volchkov V.P., Petrov D.A., 2009. Generalized Weyl-Heysenbeg bases orthogonality conditions for OFTDM sygnals. Belgorod State University Scientific Bulletin. History Political science Economics Information technologies, 15(70): 190-199 (in Russian).

8. Volchkov V P., Petrov D.A., 2010. Obobshchennaya teorema Naikvista dlya OFTDM signalov. [The generalized Nyquist's theorem for OFTDM of signals]. Synchronization system, shaping and signal processing. M., Publishing House Media Publisher. 1(1): 28-32.

9. Daubechies I., 2001. Desjat' lekcij po vejvletam. [Ten lectures on wavelets]. Izhevsk: RHD, 464 p. (Daubechies I., 1992. Ten Lectures on Wavelets. Philadelphia, Pa.: Society for Industrial and Applied Mathematics, 378 p.).

10. Ahmed N., Natarajan T., and Rao K.R., 1974. Discrete Cosine Transform. IEEE Transactions on Computers. C-23 (1): 90-93.

11. Asiryan V.M., Volchkov V.P., Papulovskaya N.V., 2020. Image Compression Using Discrete Weyl-Heisenberg Transform. Proceedings - 2020 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology, USBEREIT 2020, 399-402.

12. Bolcskei H. et al., 1999. Efficient design of OFDM/OQAM pulse shaping filter. Proceedings of IEEE International Conference on Communications (ICC 99). Vol. 1: 559-564.

13. Chen W., Pratt W.K., 1984. Scene Adaptive Coder. IEEE Transactions on Communications, 32 (3): 225-232.

14. Chen W., Smith C., and Fralick S., 1977. A Fast Computational Algorithm for the Discrete Cosine Transform. IEEE Transactions on Communications, 25 (9): 1004-1009.

15. Digital compression and coding of continuous-tone still images - requirements and guidelines. 1992. V. 81, CCITT, 186 p.

16. Gabor D., 1946. Theory of communication. J. Inst. Elect. Eng. (London), 93 (111): 429 -

457.

17. Makhoul J., 1980. A fast cosine transform in one and two dimensions. IEEE Transactions on Acoustics, Speech, and Signal Processing. Mathematics. Vol. ASSP-28, No. 1: 27-34.

18. Volchkov V. et al., 2019. Synthesis of Real Weyl-Heisenberg Signal Frames with Desired Frequency-Time Localization., 2019 24th Conference of Open Innovations Association (FRUCT), Moscow, Russia: 502-508.

19. Volchkov V.P., 2007. Signal bases with good time-frequency localization. Electrosvyaz, 2: 21-25.

20. Volchkov V P., Petrov D.A., 2009. Orthogonal Well-Localized Weyl-Heisenberg Basis Construction and Optimization for Multicarrier Digital Communication Systems. Proc. of ICUMT, St. Petersburg: Oct.

21. Volchkov V.P., Sannikov V.G., 2018. Algebraic approach to the optimal synthesis of real signal Weyl-Heisenberg bases. 2018 Systems of Signal Synchronization, Generating and Processing in Telecommunications (SYNCHROINFO 2018). Publ: Institute of Electrical and Electronics Engineers (IEEE), POD Publ: Curran Associates, Inc. (Oct 2018): 135-142.

22. Wexler J., Raz S., 1990. Discrete Gabor expansions. Signal Processing, 21 (3): 207-220.

ИНФОРМАЦИЯ ОБ АВТОРАХ

Волчков Валерий Павлович, доктор технических наук, профессор кафедры общей теории связи Московского технического университета связи и информатики

Асирян Валерий Мишевич, студент магистратуры института информационных технологий и компьютерных наук Национального исследовательского

технологического университета «МИСиС»

INFORMATION ABOUT THE AUTHORS

Valery P. Volchkov, Doctor of Technical Sciences, Professor, Professor of the Department of General Communication Theory, Moscow Technical University of Communications and Informatics, Moscow, Russia

Valery M. Asiryan, Master's student at the Institute of Information Technology and Computer Science, National University of Science and Technology MISiS, Moscow, Russia

i Надоели баннеры? Вы всегда можете отключить рекламу.