УДК 621.39
DOI 10.52575/2687-093 2-2022-49-3 -607-615
Субполосная аппроксимация изображений при сжатии объемов битовых представлений
1 Жиляков Е.Г., 2 Коськин А.В., 3 Лубков И.И., 1 Черноморец А.А.
1 Белгородский государственный национальный исследовательский университет, ул. Победы, д. 85, г. Белгород, 308015, Россия
2 Орловский государственный университет имени И.С. Тургенева,
ул. Комсомольская, д. 95, г. Орел, 302026, Россия 3 ООО «Технопроект», ул. Корочанская, д. 132а, г. Белгород, 308009, Россия
E-mail: [email protected]
Аннотация. Изображения представляют собой важный инструмент информационных процессов, так как являются естественной для человека формой информационного обмена, непосредственно воспринимаемой органами чувств. Как правило, аппаратура, предназначенная для фиксации изображений, содержит много регистрирующих датчиков и достаточно большое количество двоичных разрядов для цифрового представления их значений. Вместе с тем в зависимости от целевого использования визуальной информации такой объем данных может быть избыточным, и возникает необходимость его уменьшения, особенно при удаленной передаче. Такое уменьшение битовых представлений визуальной информации принято именовать сжатием. Важность применения сжатия вызвала разработку соответствующих методов, среди которых наибольшее распространение получили JPEG и JPEG2000. Не умаляя их достоинств, все же отметим их недостаточную гибкость с позиций важности сохранения в восстанавливаемых аппроксимациях исходных изображений тех или иных свойств. В данной работе предлагается метод сжатия данных с сохранением в восстанавливаемых аппроксимациях спектров в заданных двумерных подобластях области пространственных частот, что принято именовать субполосной аппроксимацией.
Ключевые слова: изображения, аппроксимация при сжатии битовых представлений, двумерный субполосный анализ и синтез
Для цитирования: Жиляков Е.Г., Коськин А.В., Лубков И.И., Черноморец А.А. 2022. Субполосная аппроксимация изображений при сжатии объемов битовых представлений. Экономика. Информатика, 49(3): 607-615. DOI 10.52575/2687-0932-2022-49-3-607-615
Images Subband Approximation in the Task of Bit Representations Volumes Compression
1 Evgeniy G. Zhilyakov, 2 Aleksand V. Koskin, 3 Ilya I. Lubkov, 1 Andrey A. Chernomorets
1 Belgorod National Research University, 85 Pobedy St, Belgorod, 308015, Russia 2 Orel State University named after I.S. Turgenev, 95 Komsomolskaya St, Orel, 302026, Russia
3 Tehnoproekt LLC, 132a Korochanskaya St, Belgorod, 308009, Russia
E-mail: [email protected]
Abstract. Images are an important tool of information processes, as they are a natural form of information exchange for a person, directly perceived by the senses. As a rule, the equipment intended for fixing images contains many recording sensors and a sufficiently large number of binary digits for the digital representation of their values. At the same time, depending on the intended use of visual information, such a volume of data may be excessive and there is a need to reduce it, especially when they are transmitted remotely. This reduction of bit representations of visual information is commonly referred to as compression. The importance of using compression has caused the development of appropriate methods, among which JPEG and JPEG2000 have become the most widespread. Without begging for their merits, we still note their lack of flexibility from the standpoint of the importance of preserving certain properties in the reconstructed
approximations of the original images. In this paper, we propose a method of data compression with preservation in the recoverable approximations of spectra in given two-dimensional subdomains of the spatial frequency domain, which is commonly referred to as subband. The results of the conducted comparative computational experiments illustrate the advantages of the proposed subband compression method of images bit representations over the currently most widely used JPEG2000 both in processing time and in the achieved visual quality of the reconstructed approximations.
Keywords: images, bit representation compression approximation, two-dimensional subband analysis and synthesis
For citation: Zhilyakov E.G., Koskin A.V., Lubkov I.I., Chernomorets A.A. 2022. Images Subband Approximation in the Task of Bit Representations Volumes Compression. Economics. Information technologies, 49(3): 607-615 (in Russian). DOI 10.52575/2687-0932-2022-49-3-607-615
1. Введение
Битовыми представлениями изображений называются определенным образом организованные наборы бит, которые позволяют воспроизвести изображения с использованием программно-аппаратных средств их визуализации. Именно используемая организация битовых представлений в основном определяет затраты ресурсов на их хранение и передачу по каналам связи. Исходный набор бит определяется двоичными представлениями чисел, отражающими уровни откликов датчиков на воздействующее на них электромагнитное излучение (пикселей). В рамках данной работы для простоты изложения речь идет об отдельных монохроматических кадрах съемок в оптическом диапазоне волн.
В настоящее время достаточно интенсивно осуществляется разработка и исследование таких способов преобразования исходных цифровых представлений пикселей изображений, которые максимально уменьшают объем сохраняемых бит (сжатие) при обеспечении возможности воспроизведения исходных изображений с допустимыми для решаемой задачи информационного обмена искажениями. В результате проводимых исследований создан ряд методов преобразования исходных двоичных представлений, в основе которых используются те или иные теоретические предпосылки (модели) [Радченко, 2002; Артюшенко, 2004; Гонсалес, 2012; Дворкович, 2012; Евсютин, 2013].
Легко понять, что в общем случае для достижения больших степеней сжатия изображений при обеспечении необходимого качества их дальнейшего воспроизведения необходимо использовать модели, адекватно отражающие свойства совокупности исходных пикселей, которые целесообразно считать двумерной функцией пространственных координат. Характерной чертой многих изображений является наличие квазипериодичности соответствующих функций, что позволяет говорить об адекватности использования методов анализа и синтеза Фурье в области пространственных частот. В качестве подтверждения справедливости такого вывода можно привести тот факт, что в настоящее время для сжатия изображений наиболее широко применяются форматы JPEG и JPEG2000, основанные на частотных представлениях. Наибольшую адекватность задаче сжатия демонстрируют теоретические основы формата JPEG2000, что порождает стремление к его совершенствованию [Авдеев, 2006; Кобелев, 2006; Умняшкин, 2006; Умняшкин, 2009; Крящев, 2011; Петров, 2013; Умняшкин, 2014]. Вместе с тем, используя частотные представления, можно предложить иной метод сжатия изображений, в некотором смысле более эффективный, чем JPEG2000. Разработке именно такого метода и посвящена данная работа.
2. Концептуальные основы метода сжатия изображений
В основе рассматриваемого подхода к сжатию изображений используется известный [Гонсалес, 2012; Дворкович, 2012] прием разложения их по ортогональным базисным векторам, частью проекций на которые с позиций решаемой прикладной задачи информационного
F = QWH =2! wnM, (4)
обмена допустимо пренебречь. Дальнейшее уменьшение объемов битовых представлений может быть достигнуто за счет низкоразрядного представления оставляемых проекций (квантования по уровню).
Уточним математическую формулировку этого процесса.
Пусть набор числовых значений пикселей изображения можно представить в виде, в общем случае, прямоугольной матрицы,
¥ = {/1к}, г = 1,..., М; к = 1,...,М. (1)
Если произвольные квадратные матрицы (штрих означает транспонирование)
в = ^X Яг = (Ян, -Ям,)' ; Н = ), К = (К,...,qм¡)' (2)
являются ортогональными, то есть выполняются условия [Стрелков, 2003; Кобелев, 2006]:
в * в = в'в = diag(1,...,1) ; Н * Н' = Н' Н = (1,...,1), (3)
где имеются в виду единичные матрицы соответствующей размерности, то справедливо представление,
м м
п=п1 т=1
если
W = Я ¥Н. (5)
Элементы матрицы W = {мпт), п = 1,..., М; т = 1,...,М будем называть проекциями (1) на определенные в (4) матрицы единичного ранга.
Так как на основе сжатых данных необходимо обеспечить дальнейшее воспроизведение изображений, то базисные матрицы (3) должны определяться заранее. При этом важнейшим условием выбора базисов является возможность ограничения числа слагаемых в представлении (4), так чтобы воспроизводимое изображение
¿в ¿и ^
¥ = ££ ^птЯ,Кк , (6)
п=п1 т=1
в том или ином смысле адекватно отражало свойства исходного.
Очевидно, что тогда в качестве оценки эффективности предлагаемой процедуры сжатия можно использовать отношение
г = мшг / JвJнdw, (7)
где ^ и ^ - число двоичных разрядов в представлении исходных пикселей и элементов
матрицы (5) соответственно.
Для дальнейшего уменьшения объемов битовых представлений целесообразно использовать обратимые кодирования, например, коды Хаффмана или арифметическое кодирование. Этот этап может дать дополнительное двукратное сжатие.
В рамках данной работы предлагается новый способ формирования матриц базисных векторов и принцип отбора их подмножеств для вычисления приближенных представлений вида (6).
3. Элементы субполосного анализа и синтеза изображений
Положим,
N M
ф¥(^ ¿2) = £ £ А ехрНО' -1)^ ехр(—Дк -1)¿2), (8)
¿=1 к=1
где
— л < ^ < л; — л < < л. (9)
В соответствии с равенством Парсеваля [Хургин, 1971] введем понятие части энергии изображения,
Pa (F) = { { \Фр z2)}2 dz1dz2/4ж2, (10)
2
ZGV z2eV2
приходящейся на двумерную подобласть области пространственных частот,
п = у П У2, (11)
которая является пересечением ортогональных к осям координат области пространственных частот линий границ соответствующих одномерных субполос,
Ух = С-^х-Пх) и (ГП, У21); (12)
У2 = (-Г^-У^) и (Гх2, ^22) . (13)
Из (9) следует, что для границ субполос должны выполняться неравенства,
0 < < у21 <ж , 0 < у12 < у22 <ж . (14)
Если в представление (10) подставить определение (8), то после некоторых преобразований можно получить следующее соотношение,
рп (Г) = г (ЛГВГ') , (15)
где
Л = {аш }, г, к = и, N; В = {Ь1к },г, к = и, М; ак = От^О"- г)) - 8тОи(/- г)))/0(/ - r)),аи = (У2! -Ухх)/ж ; (16)
Ьк = - Г)) - втО^О" - г))№0' - Г)), Ь = (^22 - Ух2)/^ , (17)
а символ 1г означает след матрицы.
Представляется естественным матрицы с элементами вида (16) и (17) называть субполосными. Они обладают рядом интересных свойств [Жиляков, 2009; Жиляков, 2015], которые представляют интерес с позиций сжатия изображений. В частности, их можно представить в виде
Л = <2ьд, В = ИБИ , (18)
где имеются в виду матрицы неотрицательных собственных чисел,
ь = ^); = ^ sм); (19)
и ортонормальных собственных векторов,
Л< = <Ь , ВИ = Ж, (20)
удовлетворяющих соотношениям вида (3).
В дальнейшем полагаем, что собственные векторы упорядочены по убыванию значений соответствующих собственных чисел, которые удовлетворяют неравенствам [Хургин, 1971],
х >\>Х2 > ..А > 0; х > > > ...^ > 0. (21)
Имея в виду представления (4) и (18) для матрицы справа в скобках (15) можно получить равенство
ЛГВГ' = <. (22)
Отсюда ввиду ортогонального подобия следует равенство [Гантмахер, 1967; Хорн,
1989]
N М
*(ЛГВГ) = *{1МЖ) = Ц . (23)
1=\ к=[
Пусть теперь имеет место
Г = X - У = <КИ'-<ОИ, (24)
так что
™к = Гк - 8гк . (25)
Тогда (23) можно интерпретировать как субполосную меру близости изображений
N М
7 'к ('¡к
Ta (X, Y) = £ I (Г, - 8Л)2. (26)
i=1 k=1
Отметим, что эта мера определяет среднеквадратическое отклонение двумерных спектров трансформант Фурье сравниваемых изображений в рассматриваемой двумерной подобласти области определения.
Важно отметить [Хургин, 1971], что часть собственных чисел субполосных матриц могут быть пренебрежимо малы. Иными словами, можно положить,
Л « 0, , > ^, ^ « 0, , > ^, (27)
где
3А = [ Ма и ] + 4, (28)
Jв = [МЬШ ] + 4. (29)
В соотношениях (28) и (29) квадратные скобки означают целую часть числа. Ясно, что эти соотношения могут применяться только тогда, когда их правые части меньше исходных размерностей субполосных матриц.
В связи с этим при выполнении равенств
81к = г,к, , = ^; к = ^•1в (30)
субполосная мера близости сравниваемых изображений (26) становится близкой к нулю.
Иными словами, с позиций такой меры сравниваемые изображения можно считать идентичными, так как одинаковы фрагменты их двумерных спектров в исходной двумерной подобласти.
Таким образом, можно сформулировать основной принцип сжатия изображений на основе субполосных представлений.
Если определена двумерная подобласть плоскости пространственных частот вида (11), в которой целесообразно сохранить фрагменты двумерного спектра исходного изображения X, то для сжатого изображения необходимо использовать следующее представление:
^А ^В ^
Х = 1 I ГкдХ, (31)
,=1 к=1
где
я = {Гк} = дхн, ,= 1,..., м к = 1,...,м, (32)
а число слагаемых в (31) определяются соотношениями (28) и (29).
Целесообразно отметить еще один эффект. Он заключается в том, что используемые в (31) элементы матрицы (32) сохраняют информацию о спектре исходного изображения не только в выбранной подобласти плоскости нормированных частот, но ив некоторой её окрестности. Это является следствием соотношений [Хургин, 1971],
Л = | I О(2) |2 /2* ; = | | Я(¿) I2 /2*, (33)
где подынтегральные функции представляют собой квадраты модулей спектров собственных векторов субполосных матриц, соответствующих их собственным числам.
Эти соотношения показывают, что соответствующие малым собственным числам определяемые соотношением (32) скалярные произведения спектров столбцов/строк матрицы X со спектрами собственных векторов (как это следует из теории Фурье [Хорн, 1989]) будут определяться окрестностями субполос V и К,.
Ясно, что для уменьшения трудоемкости целесообразно вычислять только те элементы матрицы (32), которые входят в представление (32).
Как уже отмечалось во втором разделе работы, дальнейшие действия связаны с использованием грубого квантования по уровню оставляемых элементов матрицы (32) и применением обратимых энтропийных кодирований. При этом в соответствии с (28) и (29) соотношению для коэффициента сжатия (7) можно придать следующий вид:
г « ёх / йг /(а Ьк + 4(ай / м + Ькк / М) +16/ ММ) . (34)
4. Вычислительные эксперименты
Ниже приводятся визуальные иллюстрации результатов вычислительных экспериментов по сжатию трех типов изображений с использованием JPEG2000 и предложенного субполосного метода (рис. 1, рис. 2). Термин «субполосная аппроксимация» отмечает тот факт, что при восстановлении используется только соответствующая субполосная компонента.
В качестве двумерной подобласти (12), (13) использовался квадрат, охватывающий начало координат области пространственных частот с длиной стороны л /Ю. Кроме того, коэффициенты разложения в (32) подвергались грубому квантованию с тремя разрядами.
Субполосная аппроксимация
Исходное изображение
JPEG2000
Рис. 1. Сравнение результатов сжатия с использованием предложенного субполосного метода
и JPEG2000 при степени сжатия 250 Fig. 1. Comparison of compression results using the proposed subband method and JPEG2000
with a compression ratio of 250
Очевидно, что предлагаемый подход даже при больших степенях сжатия позволяет сохранить детали изображаемых объектов, тогда как JPEG2000 уже при сжатии в 250 раз делает их слабо различимыми.
Отметим также, что для изображений из 5000*5000 пикселей субполосная аппроксимация вычисляется в 8 раз быстрее, чем аппроксимация JPEG2000. Это важно при реализации текущего контроля на основе съемок с летательных аппаратов как с позиций количества получаемых аппроксимаций, так и с позиций экономии затрат вычислительных ресурсов.
Рис. 2. Сравнение результатов сжатия с использованием предложенного субполосного метода
и JPEG2000 и при степени сжатия 1000
Fig. 2. Comparison of compression results using the proposed subband method and JPEG2000
with a compression ratio of 1000
Заключение
В работе предложен новый метод преобразования при сжатии битовых представлений визуальной информации, содержащейся в изображениях. В основе метода используется субполосная методология, позволяющая достигать точного совпадения в заданных подобластях области пространственных частот двумерных отрезков спектров Фурье исходного изображения и получаемой при восстановлении его аппроксимации. В этом смысле в отличие от используемых методов сжатия разработанный метод является оптимальным.
Результаты проведенных сравнительных вычислительных экспериментов иллюстрируют преимущества предлагаемого субполосного метода сжатия битовых представлений изображений перед наиболее широко используемым в настоящее время JPEG2000 как по времени обработки, так и по достигаемому визуальному качеству восстанавливаемых аппроксимаций.
Список литературы
Авдеев О.В., Чобану М.К. 2006. Сжатие изображений с помощью частичной сортировки вейвлет-коэффициентов. Цифровая обработка сигналов, № 2.
Артюшенко В.М., Шелухин О.И., Афонин М.Ю. 2004. Цифровое сжатие видеоинформации и звука. М.: Дашков и К.
Гантмахер Ф.Р. 1967. Теория матриц. М.: Наука.
Гонсалес Р., Вудс Р. 2012. Цифровая обработка изображений. М.: Техносфера.
Дворкович В.П., Дворкович А.В. 2012. Цифровые видеоинформационные системы (теория и практика). М.: Техносфера.
Евсютин О.О., Шелупанов А.А., Россошек С.К., Мещеряков Р.В. 2013. Сжатие цифровых изображений. М.: Горячая линия - Телеком.
Жиляков Е.Г., Черноморец А.А. 2009. Вариационные алгоритмы анализа и обработки изображений на основе частотных представлений: Белгород: Изд-во ГИК. 146 c.
Жиляков Е.Г. 2015. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности. Автомат. и телемех., 4: 51-66.
Кобелев В.Ю., Приоров А.Л. 2006. Применение неразделимых оптимизированных вейвлет-фильтров в задачах сжатия изображений. Цифровая обработка сигналов, № 2.
Крящев В.В., Бекренев В.А., Соловьев В.Е., Никитин А.Е. 2011. Улучшение качества JPEG2000-изображений на основе модифицированного билатерального фильтра. Цифровая обработка сигналов, № 3.
Петров Е.П., Харина Н.Л., Сухих П.Н. 2015. Метод сжатия цифровых изображений без спектральных преобразований. Цифровая обработка сигналов, № 3.
Радченко Ю.С. 2002. Алгоритм сжатия изображений на основе полиномиальных преобразований (алгоритм GDCT). Цифровая обработка сигналов, № 1.
Стрелков Ф.В., Умняшкин С.В. 2003. Контекстное кодирование коэффициентов дискретного косинусного преобразования (ДКП) в JPEG-подобной схеме компрессии. Цифровая обработка сигналов, № 2.
Умняшкин С.В., Коплович Д.М., Черкасов И.В. 2006. Об использовании контекстного векторного квантования в области дискретных вейвлет-преобразований для компрессии изображений. Цифровая обработка сигналов, № 2.
Умняшкин С.В., Курина В.В. 2009. Алгоритм сжатия изображений на основе дискретного псевдокосинусного преобразования. Цифровая обработка сигналов, № 3.
Умняшкин С.В., Гизятуллин Р.Р. 2014. Сжатие изображений на основе блочной декомпозиции в области пакетного вейвлет-преобразования. Цифровая обработка сигналов, № 1.
Хорн Р., Джонстон Ч. 1989. Матричный анализ. М: Мир.
Хургин Я.И., Яковлев В.П. 1971. Финитные функции в физике и технике. М.: Наука.
References
Avdeev O.V., Chobanu M.K. 2006. Image compression using partial sorting of wavelet coefficients. Digital signal processing, No. 2.
Artyushenko V.M., Shelukhin O.I., Afonin M.Yu. 2004. Digital compression of video information and sound. M.: Dashkov and K.
Gantmacher F.R. 1967. Matrix Theory M.: Nauka.
Gonzalez R., Woods R. 2012. Digital image processing. Moscow: Technosphere.
Dvorkovich V.P., Dvorkovich A.V. 2012. Digital video information systems (theory and practice). Moscow: Technosphere.
Evsyutin O.O., Shelupanov A.A., Rossoshek S.K., Meshcheryakov R.V. 2013. Compression of digital images. M.: Hotline - Telecom.
Zhilyakov E.G., Chernomorets A.A. 2009. Variational algorithms for image analysis and processing based on frequency representations": Belgorod: Publishing House of GaK. 146 p.
Zhilyakov E.G. 2015. Optimal subband methods of analysis and synthesis of signals of finite duration. Automatic. and Telemech., 4: 51-66.
Kobelev V.Yu., Priorov A.L. 2006. Application of inseparable optimized wavelet filters in image compression problems. Digital signal processing, No. 2.
Kryashchev V.V., Bekrenev V.A., Soloviev V.E., Nikitin A.E. 2011. Improving the quality of JPEG2000 images based on a modified bilateral filter. Digital signal processing, No. 3.
Petrov E.P., Kharina N.L., Sukhoi P.N. 2015. Digital image compression method without spectral transformations. Digital signal processing, No. 3.
Radchenko Y.S. 2002. Image compression algorithm based on polynomial transformations (GDCT algorithm). Digital signal processing, No. 1.
Strelkov F.V., Umnyashkin S.V. 2003. Contextual encoding of discrete cosine transform (DCT) coefficients in a JPEG-like compression scheme. Digital Signal processing, No. 2.
Umnyashkin S.V., Koplovich D.M., Cherkasov I.V. 2006. On the use of contextual vector quantization in the field of discrete wavelet transformations for image compression. Digital signal processing, No. 2.
Umnyashkin S.V., Kurina V.V. 2009. Image compression algorithm based on discrete pseudo-cosine transformation. Digital signal processing, No. 3.
Umnyashkin S.V., Gizyatullin R.R. 2014. Image compression based on block decomposition in the field of packet wavelet transformation. Digital signal processing, No. 1.
Horn R., Johnston Ch. 1989. Matrix analysis. M: Mir.
Hurgin Ya.I., Yakovlev V.P. 1971. Finite functions in physics and engineering. M.: Nauka.
Конфликт интересов: о потенциальном конфликте интересов не сообщалось. Conflict of interest: no potential conflict of interest related to this article was reported.
ИНФОРМАЦИЯ ОБ АВТОРАХ
Жиляков Евгений Георгиевич, доктор технических наук, профессор, профессор кафедры информационно-телекоммуникационных систем и технологий, Белгородский государственный национальный исследовательский университет, г. Белгород, Россия
Коськин Александр Васильевич, доктор технических наук, профессор, директор Департамента информатизации и перспективного развития, Орловский государственный университет имени И.С. Тургенева, г. Орел, Россия
Лубков Илья Игоревич, директор ООО «Техно-проект», Белгород, Россия
Черноморец Андрей Алексеевич, доктор технических наук, доцент, профессор кафедры прикладной информатики и информационных технологий, Белгородский государственный национальный исследовательский университет, г. Белгород, Россия
INFORMATION ABOUT THE AUTHORS
Evgeniy G. Zhilyakov, Doctor of Technical Sciences, Professor, Professor of the Department of Information and Telecommunication Systems and Technologies, Belgorod State National Research University, Belgorod, Russia
Aleksand V. Koskin, Doctor of Technical Sciences, Professor, Director of the Department of Informatization and Perspective Development, Orel State University named after I.S. Turgenev, Orel, Russia
Ilya I. Lubkov, Director Tehnoproekt LLC, Belgorod, Russia
Andrey A. Chernomorets, Doctor of Technical Sciences, Associate Professor, Professor of the Department of Applied Informatics and Information Technologies, Belgorod National Research University, Belgorod, Russia