Научно-образовательный журнал для студентов и преподавателей «StudNet» №11/2020
МЕТОД СЖАТИЯ ИЗОБРАЖЕНИИ НА ОСНОВЕ ВЕИВЛЕТ-ПРЕОБРАЗОВАНИЯ ХААРА
IMAGE COMPRESSION METHOD BASED ON THE HAAR WAVELET
TRANSFORM
УДК 004.932
Ляшева Майя Михайловна, студент Казанского национального исследовательского технического университета им. А.Н. Туполева-КАИ, Россия, г. Казань
Lyasheva M.M. [email protected]
Аннотация
В статье рассматривается сжатие изображений. Предложен метод, который предусматривает выполнение преобразования Хаара, анализ значимости детализирующих вейвлет-коэффициентов на основе оценки их энергии и кодирование элементов данных с помощью адаптивного метода Хаффмена. Описанный метод позволяет обеспечить не менее чем четырехкратное сжатие изображений.
Annotation
The article deals with the image compression. A method is proposed that provides for performing the Haar transformation, analyzing the significance of detailed wavelet coefficients based on their energy estimation, and encoding data elements using the adaptive Huffman method. The described method allows to provide not less than four times the compression of images.
Ключевые слова: обработка изображений, уровни обработки изображений, сжатие изображений, сжатие изображений с потерями, преобразование Хаара, энергия детализирующих коэффициентов
Keywords: image processing, image processing levels, image compression, lossy image compression, Haar transform, energy of detail coefficients
В современных информационных системах применяются различные технологии обработки информации, в том числе технологии обработки и анализа изображений [1].
Процедуры решения задач обработки изображений принято делить на три класса [2]:
1) процедуры обработки низкого уровня;
2) процедуры обработки среднего уровня;
3) процедуры обработки высокого уровня.
Данная классификация является условной и основана на виде входных и выходных данных. Для процедур низкого уровня и на входе, и на выходе наблюдаются изображения. Для процедур среднего уровня входные данные представляют собой изображения, а выходные - декрипторы, характеризующие изображения. Процедуры высокого уровня связаны с решением интеллектуальных задач - на вход подаются изображения и/или их дескрипторы, а на выходе формируются результаты классификации изображений или их фрагментов.
Все процедуры обработки изображений важны для эффективного решения задач в информационных системах. При этом в таких системах часто необходимо обеспечить оперативную передачу видеоинформации. Для сокращения времени передачи изображений применяются процедуры сжатия данных, относящиеся к среднему уровню обработки.
В зависимости от назначения и условий функционирования конкретной информационной системы в ней могут быть реализованы различные методы
сжатия изображений - симметричные или асимметричные, неадаптивные или адаптивные, с потерями или без потерь [3].
Наиболее эффективные результаты для сжатия изображений в случае их последующего представления человеку-оператору получаются при использовании методов с потерями. Такие методы обычно реализуются по следующей схеме:
1) снижение межэлементной избыточности;
2) квантование элементов данных;
3) кодирование элементов данных.
Для снижения межэлементной избыточности можно воспользоваться кратно-масштабным ортогональным вейвлет-преобразованием, например, преобразованием Хаара. Преобразование Хаара раскладывает изображение на масштабные уровни, связанные между собой соотношениями [4]:
aj ,m,n = (aj+1,2m,2n + Qj+1,2m+1,2n + Qj+1,2m,2n+1 + Qj+1,2m+1,2n+1)/4' dj,m,n = (aj +1,2m,2n + aj+1,2m+1,2n _ aj +1,2m,2n+1 _ aj+1,2m+1,2n+1)/4' dj,m,n = (aj +1,2m,2n _ aj +1,2m+1,2n + aj +1,2m,2n+1 _ aj+1,2m+1,2n+1)/4, dj,m,n = (aj+1,2m,2n _ aj+1,2m+1,2n _ aj+1,2m,2n+1 + aj+1,2m+1,2n+1)/4,
где ajn - аппроксимирующие коэффициенты уровня j в позиции (m, n);
dIjm n, dVj m n, djm n - горизонтальные, вертикальные и диагональные детализирующие коэффициенты уровня j в позиции (m, n); aj+12m2n,
aj+1,2m+1,2n , aj+1,2m,2n+1, aj+1,2m+1,2n+1 - аппроксимирующие коэффициенты
уровня j + 1 в позициях (2m, 2n), (2m + 1, 2n), (2m, 2n + 1) и (2m + 1, 2n + 1). При этом аппроксимирующие коэффициенты наибольшего уровня J равны значением интенсивности пикселей изображения.
Пример вейвлет-преобразования Хаара для тестового изображения из коллекции The USC-SIPI Image Database [5] показан на рисунке 1, где слева -исходное изображение, справа - результат трехуровневого разложения. Аппроксимирующие коэффициенты на рисунке показаны в виде пикселей копии изображения справа в верхнем левом углу, а детализирующие
коэффициенты показаны в виде пикселей остальных квадратных областей -чем больше по абсолютной величине значение детализирующего коэффициента, тем более темным показан соответствующий ему пиксель.
Как можно увидеть на рисунке 1, не все детализирующие коэффициенты одинаково значимы для представления изображения. Поэтому можно оценить необходимость в их передаче для последующего восстановления изображения. Такой анализ является основой для следующего шага процедуры сжатия изображений - квантование элементов данных.
Рисунок 1 - Пример вейвлет-преобразования Хаара Оценить значимость детализирующих коэффициентов можно с точки зрения их влияния на соответствующий им пиксель в позиции (т, п) на уровне у. Для этого вычислим значение энергии по формуле:
е. ={4" У+(/' ум? у.
],т,п \ ],т,п ) \ У ,т,п / \ у ,т,п }
Полученное значение энергии г^п далее сравним с порогом А,- для данного уровня у и будем считать детализирующие коэффициенты , ,
значимыми, если выполняется условие:
еУ,т,п ^ Д/.
Таким образом, изображение можно представить в виде наборов аппроксимирующих коэффициентов наименьшего уровня вейвлет-разложения -о и значимых детализирующих коэффициентов уровней -о, ..., 3 - 1.
Далее осуществляется нормализация значимых детализирующих коэффициентов, в результате которой их значения приводятся к диапазону от 0 до 255.
Последним шагом общей схемы сжатия является кодирование элементов данных. Здесь может быть использован какой-либо энтропийный метод, например, метод Хаффмена [6, 7]. При этом эффективно применение адаптивного метода для кодирования коэффициентов различных наборов независимо друг от друга.
Использование адаптивного метода Хафмена позволило обеспечить сжатие стандартных полутоновых изображений размера 512 х 512 пикселей из коллекции The USC-SIPI Image Database не менее чем в четыре раза.
Литература
1. Дворкович В.П. Цифровые видеоинформационные системы (теория и практика)/ В.П. Дворкович, А.В. Дворкович. - М.: Техносфера, 2012. -1008 с.
2. Гонсалес Р. Цифровая обработка изображений/ Р. Гонсалес, Р. Вудс. -М.: Техносфера, 2012. - 1104 с.
3. Сэломон Д. Сжатие данных, изображений и звука/ Д. Сэломон. - М.: Техносфера. 2004. - 368 с.
4. Ватолин Д. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео/ Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. -М.: ДИАЛОГ-МИФИ, 2003. - 384 с.
5. The USC-SIPI Image Database [Электронный ресурс]. -http://sipi.usc.edu/database/database.php (дата обращения: 05.08.2020).
6. Sayood K. Introduction to Data Compression / K. Sayood. - Morgan Kaufmann Publisher, 2018. - 790 p.
7. McAnlis C. Understanding Compression: Data Compression for Modern Developers/ C. McAnlis, A. Haesky. - O'Reilly Media, 2016. - 242 p.
Literature
1. Dvorkovich V.P. Digital video information systems (theory and practice)/ V.P. Dvorkovich, A.V. Dvorkovich. - Moscow, Technosphera, 2012. - 1008 p.
2. Gonzalez R. Digital Image Processing/ R. Gonzalez, R. Woods. - Moscow, Technosphera, 2012. - 1104 p.
3. Salomon D. Compression of data, images, and audio/ D. Salomon. - Moscow, Technosphera, 2004. - 368 p.
4. Vatolin D. Data Compression Methods: Archivers Structure, Pictures Compression and Video/ D. Vatolin, A. Ratushnyak, M. Smirnov, V. Yukin. - Moscow: DIALOG-MIFI, 2003 - 384 p.
5. The USC-SIPI Image Database [Electronic resource]. -http://sipi.usc.edu/database/database.php (Application date: 05.08.2020).
6. Sayood K. Introduction to Data Compression / K. Sayood. - Morgan Kaufmann Publisher, 2018. - 790 p.
7. McAnlis C. Understanding Compression: Data Compression for Modern Developers/ C. McAnlis, A. Haesky. - O'Reilly Media, 2016. - 242 p.