Научная статья на тему 'Оценка возможности применения метода декомпозиции изображений по топологическим признакам для уменьшения энтропии при их сжатии'

Оценка возможности применения метода декомпозиции изображений по топологическим признакам для уменьшения энтропии при их сжатии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
26
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
декомпозиция изображений / топологический анализ / энтропия / сжатие с потерями / оценка качества изображений / image decomposition / topological analysis / entropy / lossy compression / image quality assessment

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Артём Владимирович Абакумов, Сергей Владимирович Еремеев

Введение. Стремительное увеличение объема визуальной информации в сети Интернет стимулирует усовершенствование существующих и поиск новых подходов для решения задачи сжатия изображений. Одной из важных характеристик при обработке изображений, в частности при их сжатия, является энтропия. В работе исследована возможность применения метода декомпозиции изображения по топологическим признакам для уменьшения энтропии с целью дальнейшего сжатия изображения при сохранении высокого качества. Метод. Топологическая декомпозиция предполагает разложение изображения на компоненты, каждая из которых отражает отдельный элемент на изображении. Топологическая декомпозиция позволяет сгруппировать глобальные структуры и их детали в отдельные матрицы специальные типа. Для уменьшения энтропии предложено удаление детализирующих составляющих и восстановление изображения. Отличительная особенность представленного подхода состоит в искажении не всего изображения, а части его области. Основные результаты. Предложенный метод апробирован на практической задаче сжатия изображений алгоритмом RLE, зависимым от энтропии. Полученные результаты показали, что применение топологического разложения обоснованно в вопросах уменьшения энтропии, что позволяет использовать предобработанное изображение для сжатия. Для оценки качества изображений использованы индексы PSNR, SSIM, MSE, NRM. Показано, что в сравнении с вейвлет-преобразованием при сопоставимой степени сжатия изображений предлагаемый подход конкурентно-способный по показателям оценки качества, а для определенного класса изображений со слабо зашумленными длинными объектами превосходит его. Обсуждение. Полученные результаты открывают возможности для дальнейшего изучения топологической декомпозиции для сжатия изображений с потенциально большей эффективностью и при меньших искажениях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Артём Владимирович Абакумов, Сергей Владимирович Еремеев

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Assessing the possibility of using the method of image decomposition based on topological features to reduce entropy during their compression

The rapid increase in the volume of visual information on the internet stimulates the improvement and search for new approaches to solving the problem of image compression. One of the important characteristics in the field of image processing, in particular in matters of compression, is entropy. The work explores the possibility of using the method of image decomposition based on topological features to reduce entropy in order to further compress the image while maintaining high quality. Topological decomposition involves decomposing an image into components each of which reflects a separate element in the image. Topological decomposition allows us to group global structures and their details into separate matrices of special types. To reduce entropy, it is proposed to remove some detail components and restore the image. A distinctive feature of the proposed approach is that it does not distort the entire image, but only some areas. The proposed method is tested in a practical compression problem using the entropy-dependent RLE algorithm. The results showed that topological decomposition is good at reducing entropy, which will allow us to use the preprocessed image for compression. PSNR, SSIM, MSE, NRM indices are used to assess image quality. When compared with the wavelet transform, the proposed approach is competitive in terms of image quality assessment at a comparable compression ratio, and exceeds it for a certain class of images with slightly noisy long objects. The results open up opportunities for further study of topological decomposition in image compression with potentially greater efficiency and less distortion.

Текст научной работы на тему «Оценка возможности применения метода декомпозиции изображений по топологическим признакам для уменьшения энтропии при их сжатии»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ ноябрь-декабрь 2023 Том 23 № 6 http://ntv.ifmo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS

l/ITMO

N

ISSN 2226-1494 (print) ISSN 2500-0373 (online)

m hn h v I ?я N fi „„//*, , ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ Н ОПТИКИ

November-December 2023 Vol. 23 No 6 http://ntv.ifmo.ru/en/ 4 '

doi: 10.17586/2226-1494-2023-23-6-1152-1161 УДК 004.932

Оценка возможности применения метода декомпозиции изображений по топологическим признакам для уменьшения энтропии

при их сжатии

Артём Владимирович Абакумов1, Сергей Владимирович Еремеев2®

!>2 Муромский институт (филиал) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 602264, Российская Федерация

1 artem210966@yandex.ru, https://orcid.org/0000-0001-5784-7147

2 sv-eremeev@yandex.ru®, https://orcid.org/0000-0001-8482-1479

Аннотация

Введение. Стремительное увеличение объема визуальной информации в сети Интернет стимулирует усовершенствование существующих и поиск новых подходов для решения задачи сжатия изображений. Одной из важных характеристик при обработке изображений, в частности при их сжатия, является энтропия. В работе исследована возможность применения метода декомпозиции изображения по топологическим признакам для уменьшения энтропии с целью дальнейшего сжатия изображения при сохранении высокого качества. Метод. Топологическая декомпозиция предполагает разложение изображения на компоненты, каждая из которых отражает отдельный элемент на изображении. Топологическая декомпозиция позволяет сгруппировать глобальные структуры и их детали в отдельные матрицы специальные типа. Для уменьшения энтропии предложено удаление детализирующих составляющих и восстановление изображения. Отличительная особенность представленного подхода состоит в искажении не всего изображения, а части его области. Основные результаты. Предложенный метод апробирован на практической задаче сжатия изображений алгоритмом RLE, зависимым от энтропии. Полученные результаты показали, что применение топологического разложения обоснованно в вопросах уменьшения энтропии, что позволяет использовать предобработанное изображение для сжатия. Для оценки качества изображений использованы индексы PSNR, SSIM, MSE, NRM. Показано, что в сравнении с вейвлет-преобразованием при сопоставимой степени сжатия изображений предлагаемый подход конкурентноспособный по показателям оценки качества, а для определенного класса изображений со слабо зашумленными длинными объектами превосходит его. Обсуждение. Полученные результаты открывают возможности для дальнейшего изучения топологической декомпозиции для сжатия изображений с потенциально большей эффективностью и при меньших искажениях. Ключевые слова

декомпозиция изображений, топологический анализ, энтропия, сжатие с потерями, оценка качества изображений Благодарности

Исследование выполнено при финансовой поддержке Российского научного фонда в рамках научного проекта № 23-21-10064.

Ссылка для цитирования: Абакумов А.В., Еремеев С.В. Оценка возможности применения метода декомпозиции изображений по топологическим признакам для уменьшения энтропии при их сжатии // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23, № 6. С. 1152-1161. doi: 10.17586/2226-1494-2023-23-6-1152-1161

© Абакумов А.В., Еремеев С.В., 2023

Assessing the possibility of using the method of image decomposition based on topological features to reduce entropy during their compression

Artyom V. Abakumov1, Sergey V. Eremeev2®

Murom Institute (Branch) of Vladimir State University, Murom, 602264, Russian Federation

1 artem210966@yandex.ru, https://orcid.org/0000-0001-5784-7147

2 sv-eremeev@yandex.ru®, https://orcid.org/0000-0001-8482-1479

Abstract

The rapid increase in the volume of visual information on the internet stimulates the improvement and search for new approaches to solving the problem of image compression. One of the important characteristics in the field of image processing, in particular in matters of compression, is entropy. The work explores the possibility of using the method of image decomposition based on topological features to reduce entropy in order to further compress the image while maintaining high quality. Topological decomposition involves decomposing an image into components each of which reflects a separate element in the image. Topological decomposition allows us to group global structures and their details into separate matrices of special types. To reduce entropy, it is proposed to remove some detail components and restore the image. A distinctive feature of the proposed approach is that it does not distort the entire image, but only some areas. The proposed method is tested in a practical compression problem using the entropy-dependent RLE algorithm. The results showed that topological decomposition is good at reducing entropy, which will allow us to use the preprocessed image for compression. PSNR, SSIM, MSE, NRM indices are used to assess image quality. When compared with the wavelet transform, the proposed approach is competitive in terms of image quality assessment at a comparable compression ratio, and exceeds it for a certain class of images with slightly noisy long objects. The results open up opportunities for further study of topological decomposition in image compression with potentially greater efficiency and less distortion. Keywords

image decomposition, topological analysis, entropy, lossy compression, image quality assessment Acknowledgements

This study was supported by the Russian Science Foundation, project no. 23-21-10064.

For citation: Abakumov A.V, Eremeev S.V. Assessing the possibility of using the method of image decomposition based on topological features to reduce entropy during their compression. Scientific and Technical Journal ofInformation Technologies, Mechanics and Optics, 2023, vol. 23, no. 6, pp. 1152-1161 (in Russian). doi: 10.17586/2226-1494-2023-23-6-1152-1161

Введение

По информации исследовательской компании Statista Research Department, объем интернета к 2025 году составит больше 180 зеттабайт1. Можно с уверенностью утверждать, что большую часть занимает аудиовизуальная информация, для хранения которой требуются эффективные методы сжатия. Данный факт стимулирует к созданию и внедрению новых подходов в этой области.

Разные данные имеют разную степень сжатия. Чем информация сложнее, тем она хуже сжимается. В случае сжатия изображений фактор сложности определяет информационная энтропия.

Стоит заметить, что многие современные методы сжатия изображений, основанные на классических подходах, подошли к некоторому пределу и, скорее, борются за скорость, чем за эффективность. Это можно увидеть на примере алгоритма Quite OK Image. В случае с видеофайлами ситуация схожая, о чем говорит популярность кодека кодирования H.265/HEVC [1].

Кроме того, современные тенденции двигаются от четко сформулированных алгоритмов к использованию нейронных сетей. В работе [2] машинное обучение исследовано с точки зрения сжатия изображений. Однако результат является сложно прогнозируемым и слабо

1 [Электронный ресурс]. https://www.statista.com/ statistics/871513/worldwide-data-created/ (дата обращения: 28.10.2023).

контролируемым, что может помешать повсеместному использованию таких методов.

Отдельно выделим класс топологического сжатия. Его особенность в том, что сжатие происходит контролируемо. Это выражается в возможности убрать одну область, не трогая другие. Так, в работе [3] показано сжатие поверхности, и при этом остаются нетронутыми определенные важные топологические регионы. К данному классу относится предложенный в настоящей работе подход.

Одним из популярных направлений для сжатия изображений является декомпозиция. Декомпозиция изображения представляет собой разложение исходного двумерного сигнала на отдельные структуры с возможностью обратного восстановления. Подходы к декомпозиции отличаются в зависимости от поставленной задачи. В отдельную группу входят методы, которые базируются на спектральном анализе, раскладывая изображение на низкие и высокие частоты. Яркие представители данного подхода — методы на основе вейвлет-преобразования [4-7]. Также существуют методы, которые раскладывают изображение на структуры и текстуры [8], используют иерархические преобразования сигнала [9]. Очень часто декомпозиция связана с деревом квадрантов [10, 11]. Широко используется анализ последовательности изображений с течением времени. В [12] показан метод разложения, который обрабатывает одну и ту же сцену при меняющемся освещении, а в [13] для анализа последовательностей применена декомпозиция на основе Фурье-преобразования.

Декомпозиция при разных подходах позволяет выделить наименее значимые коэффициенты разложения или области, обработка которых приведет к уменьшению энтропии изображения. Данный результат может повлиять на коэффициент сжатия при использовании энтропийных методов кодирования. Однако это также влияет и на качество изображений. Таким образом, важная задача декомпозиции — сохранение высокого качества изображений при высокой степени сжатия с потерями. Для оценки качества существуют специальные критерии, которые позволяют численно сравнить исходное и результирующее изображения.

В работе [14] авторами разработан метод топологической декомпозиции изображений. В его концепции лежит разделение исходного изображения на матрицы специального типа, которые содержат глобальные структуры изображения, а также детальные элементы.

Цель настоящей работы заключается в исследовании влияния топологической декомпозиции на качество изображения после отбрасывания малозначащих детальных структур. Исследован вопрос оценки качества изображений предлагаемого подхода и вейвлет-преоб-разования при сопоставимой степени сжатия.

Декомпозиция изображений

Топологическая декомпозиция. Теоретические основы метода декомпозиции изображений по топологическим признакам представлены в работах [14, 15]. Покажем основные принципы топологического разложения изображения и рассмотрим возможность его использования при сжатии.

Топологическая декомпозиция предполагает разложение изображения на структурные компоненты, представляющие собой определенные области из пикселов и соответствующие исследуемым объектам. Практически компоненты покрывают части изображения от локальных максимумов до локальных минимумов (рис. 1, а).

Каждая компонента характеризуется яркостью, на которой она появилась и, на которой прекратила существование. В точках локального минимума одна компонента сталкивается с другой. Компонента с более поздним появлением прекращает расширяться, а

с более ранним идет до следующей точки минимума (рис. 1, Ь). Анализ взаимодействия компонент происходит на каждой итерации от 255 до 0, что соответствует значениям яркости на изображении в градациях серого. Процесс происходит до тех пор, пока какая-либо компонента не покроет все изображение.

Разницу между значениями появления и прекращения существования компоненты назовем длиной компоненты и обозначим буквой Ь.

Рассмотрим рис. 2, на котором каждый пиксел схематично представим в виде набора кубических 3D-объектов, количество которых в столбце равно значению яркости. Выделим сначала все компоненты с длиной Ь = 1 и разместим на отдельном изображении (рис. 2, с). Также отдельно отобразим исходное изображение без компонент с длиной Ь = 1 (рис. 2, сС). По аналогии на рис. 2, е^ показан пример для Ь < 2, где на отдельных изображениях размещены все компоненты с длинами Ь < 2 и Ь > 2.

Обозначим исходное изображение буквой I, изображения с компонентами, удовлетворяющими условию Ь < к (к 6 {1, 2, ..., 255}) — Jдет, а изображение, содержащее остальные компоненты при Ь > к — Jгл. Тогда I определим в виде алгебраической суммы Jдет и Jгл. При небольших значениях к изображение Jдет будет содержать детали, а Jгл — глобальные структуры. При увеличении параметра к в Jдет могут быть найдены более крупные исследуемые объекты.

В общем виде каждой компоненте соответствует матрица, размер которой совпадает с размерами исходного изображения. Ненулевые элементы матрицы описывают компоненту.

Заметим, что Jдет группирует в одно изображение все компоненты с Ь = 1, 2, ..., к, а Jгл — с Ь = к + 1, к + 2, ..., 255. Если отсортировать все компоненты по возрастанию их длин Ь < Ь < ... < Ь < ... < Ь

то

получим формулу из алгебраической суммы матриц:

I

Jai + Ja2 + ... + Jak + ... + J

(1)

где а!, а2, ..., ср — индексы компонент, каждой из которых соответствует матрица; р — общее количество компонент.

Рис. 1. Визуализация построения компонент: исходный объект с точками локального минимума и максимума (а);

визуализация поглощения компонент (b) Fig. 1. Visualization of component construction: initial object with local minimum and maximum points (a), visualization of

component absorption (b)

Рис. 2. Визуализация топологической декомпозиции 3D-noBepxHocrn: исходная поверхность (а); исходная поверхность с отмеченными компонентами при длинах L = 1 (b) и L < 2 (e); отдельно выделенные компоненты с длинами L = 1 (с)

и L > 1 (d); компоненты с длинами L < 2 (/) и L > 2 (g) .Fz'g. 2. Visualization of the topological decomposition of a 3D surface: original surface (a), original surface with marked components at length L = 1 (b), separately selected components at L = 1 (c), separately selected components at L > 1 (d), original surface with marked components at length L < 2 (e), components at L < 2 (/), components at L > 2 (g)

Будем считать, что в формуле (1) матрицы Л Ja2, ..., Лак содержат компоненты с длиной Ь < к, а компоненты J„, ,, J„, „, ... Ла — с длиной Ь > к. Тогда

"■к+1 ухк+2 ™р

получим:

Лдет = Ja1 + Ja2 + . • • + Лак, Jгл = Jak+1 + Лак+2 + . • • + Лар-

При сжатии изображения с потерями отбросим Лдет и получим, что I = Лгл. Параметр к влияет на степень детализации. Если убрать все детальные компоненты, то получится ровная поверхность. Соответственно, уменьшится энтропия изображения, что, в свою очередь, повлияет на коэффициент сжатия. Подобные действия были совершены в работе [16], но на другой теоретической базе.

Таким образом, как видно из визуализации, подход на основе топологической декомпозиции прост в применении и прозрачен на практике.

Компоненты, собранные в Лдет, не обязательно безвозвратно отсеивать. В данном случае их особенностью является предсказуемость, так как максимальное значение яркости будет равно к. Пример предобработки с использованием рассмотренного подхода показан на

рис. 3, b-f со значениями к, равными 2, 5, 10, 15 и 30 соответственно.

Развивая теорию топологической декомпозиции, можно разделить все компоненты на две группы так, чтобы в обеих оказались как можно более равномерные значения для достижения наименьшей энтропии. Однако возможность подобного равномерного разделения зависит сугубо от исходных данных.

Особенностью метода является то, что он позволяет выравнивать яркости в изолированных областях, которые имеют некоторую топологическую постоянную область. У других подходов, например, у алгоритма JPEG, количество оттенков может уменьшиться, из-за чего градиент на изображении начинает выглядеть как отдельные полосы (рис. 4). Предложенный подход удалил только изолированные области, представляющие шум, который определен по показателю к. Чем показатель к выше, тем больше будет потерь, и, следовательно, больше сжатие.

Декомпозиция на основе вейвлет-преобразова-ния. Заметим, что схожим по принципу работы является дискретное вейвлет-преобразование. Существует множество видов вейвлетов. В настоящей работе вы-

Рис. 3. Предобработка изображения на основе топологической декомпозиции: исходное изображение (а); при к = 2, 5, 10, 15 исчез шум на черной арке справа, перекладине возле нее и белом столбе слева (b-e); при к = 30 с лица пропали некоторые

белые блики, а предметы интерьера справа стали более однородными по цвету (/) Fig. 3. Image preprocessing based on topological decomposition: the original image (a), at к = 2, 5, 10, 15 the noise on the black arch on the right, the crossbar next to it and the white pillar on the left disappeared (b-e), at к = 30 some white highlights disappeared from the face, interior items on the right became more uniform in color (/)

бран вейвлет CDF97, который используется в алгоритме JPEG 2000.

Вейвлеты раскладывают изображение на четыре компоненты, представляющие комбинацию высоких (H) и низких (L) частот. Выполнением несколько про-

стых тестов было определено, что обработка только НН частот ведет к недостаточно хорошим результатам при отсутствии заметных визуальных искажений. В связи с этим было принято решение дополнительно использовать коэффициенты ЬЬ и КН. Эксперименты показали,

Рис. 4. Проблема сжатия в алгоритме JPEG: исходное изображение с плавным градиентом (а); изображение после компрессии с резким переходом градиента в виде полос (b) Fig. 4. Compression problem in the JPEG algorithm: original image with a smooth gradient (a), image after compression with a sharp

gradient transition in the form of stripes (b)

что в этом случае визуально качество не ухудшается, но при этом достигаются лучшие показатели. Для этого коэффициенты подвергались делению на параметр D, причем D = 4 для НН, D = 2 для LL и LH.

В случае декомпозиции при работе с вейвлетами проявилась одна особенность — непосредственное влияние на все изображение, т. е. его сложно контролировать, когда необходимо локализовать действие. Это хорошо прослеживается в задачах сжатия.

Рассмотрим существующие подходы и выполним оценку влияния декомпозиции на качество изображения.

Результаты экспериментальных исследований

Критерии оценки качества изображений. Разделяют два направления для оценки качества изображений: без эталона (no-reference) [17] и с эталоном (reference-based) [18]. В первом случае происходит расчет некоторого коэффициента только по пикселам входной матрицы. Второе направление сравнивает исходное изображение с искаженным.

Один из базовых и часто используемых подходов — индекс пикового отношения сигнала к шуму (Peak Signal-to-Noise Ratio, PSNR), который вычисляется по формуле

(МАХ2\

PSNR = К>ЮЦ—)

J m-1 n-1

где MSE = — X X I(i, j) - K(i, j)|2 — среднеквадратич-mrii=o j=o

ная ошибка (Mean Squared Error, MSE); I и K — исходное и искаженное изображения; MAX — максимальное значение, принимаемое пикселом изображения K; n и m — ширина и высота изображения.

В качестве аналога PSNR часто выбирают индекс структурного сходства (Structure SIMilarity, SSIM), который имеет вид

SSIM = ■

(2Ц7Ц^ + С1)(2Ож + С2) (|1/2+ц| + с1Хо/2+о|+сг)'

где c1 = (0,01 х Б)2, с2 = (0,03 х B)2; ц и цК — средние значения яркостей изображений I и К; о/ и оК — дисперсии I и К; ок — ковариация I и К; Б — динамический диапазон пикселов (255 для полутоновых изображений).

Также допустимо использовать и более простые показатели, как например, MSE или ее нормализованную версию (МЯМ):

NRM =

MSE AVG(I2)

где ЛУО — среднее арифметическое.

Исследование влияния декомпозиции на качество изображений. Для проведения экспериментов из набора данных ImageNet1 выберем несколько изобра-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 [Электронный ресурс]. https://www.image-net.org (дата обращения: 28.10.2023).

жений. На данных изображениях выполним операцию удаления шумовой составляющей с различными показателями длины компоненты.

Сжатие зависит от выбранного алгоритма. Чтобы провести наиболее чистое сравнение, использован базовый алгоритм Run-Length Encoding (RLE).

Изображения, обработанные на основе топологической декомпозиции с разной длиной компоненты, и те же самые изображения, обработанные на основе вейвлетов, были сжаты алгоритмом RLE. В качестве тестовых данных выбрано четыре разнородных изображения (рис. 5).

Опишем визуальные различия при декомпозиции. Искажения вейвлетов проявляются непосредственно на каждом пикселе и не образуют характерных зон, в отличие от топологической декомпозиции. Топологическая декомпозиция не затрагивает объекты, которые не входят в диапазон длин компонент к, поэтому в целом искажения не ухудшают изображение, но убирают локальные области (рис. 6).

Для исследования влияния топологической декомпозиции на качество изображений отбросим все детализирующие составляющие с длинами компонент, не превышающими значения к, равные 5, 10, 15 и 30. При увеличении параметра к отдельные области станут более однородными, что приведет к уменьшению энтропии изображений и будет влиять на их показатели качества. Тестирование выполнено с помощью сравнения сжатого и оригинального изображений с параметром к = 30. Данное значение к выбрано из следующих соображений: оно достаточно для отсеивания крупных компонент и слишком мало, чтобы появились заметные искажения.

Построение вейвлетов осуществлено с помощью языка программирования Python и библиотеки PyWavelets. Результаты исследований показаны в табл. 1, полученные при расчете процентного отношения, сколько сжатое изображение занимает места относительно исходного. В табл. 2 приведены значения влияния двух методов декомпозиции на качество изображения, которое оценено через показатели PSNR (меньше значение — лучший результат), SSIM (чем ближе к 0, тем лучше результат), MSE (чем больше значение, тем лучше результат) и NRM (результат лучше при стремлении к 1). Данные показатели рассчитаны с помощью Python модуля skimage. Визуально изображения после топологической декомпозиции показаны на рис. 7.

Результаты индексов оценки качества изображений (табл. 2) показали, что наилучшие результаты при топологической декомпозиции получены при наличии слабо зашумленных длинных объектов или фона. Вследствие этого наилучший результат оказался на изображении «Магазин», где много слабо зашумленных длинных объектов. На изображении «Лена» присутствуют однотонные зоны, обработка которых при топологической декомпозиции позволила уменьшить энтропию при сохранении высокого качества изображения, что подтверждают индексы PSNR, NRM и MSE, лишь незначительно уступая вейвлет-преобразованию по индексу SSIM. Остальные два примера при топологической

Рис. 5. Тестовые изображения: Лена (a); Магазин (b); Камера (с); Книга (d) Fig. 5. Test images: Lena (a), Store (b), Camera (с), Book (d)

Рис. 6. Пример удаления деталей при топологической декомпозиции: исходное изображение (а); изображение после топологической декомпозиции при к = 30 (b). Метка A показывает, что на стене текстура стала более равномерной, а B и C

указывают на пропавшие засветы на шляпе и щеке

Fig. 6. An example of detail removal during topological decomposition: original image (a), image after topological decomposition at к = 30 (b). Mark A shows that the texture on the wall has become more uniform. Marks B and C indicate missing highlights on the

hat and cheek

Таблица 1. Сравнительный анализ сжатия изображений после вейвлет-преобразования и топологической декомпозиции

алгоритмом RLE, %

Table 1. Comparative analysis of image compression after wavelet transform and topological decomposition using the RLE

algorithm, %

Название изображения Вейвлет-преобразование Топологическая декомпозиция

к = 5 к = 10 к = 15 к = 30

Лена 96 98 96 95 90

Магазин 94 95 92 90 82

Камера 91 96 96 95 95

Книга 97 98 97 94 86

Таблица 2. Оценка качества изображений после вейвлет-преобразования и топологической декомпозиции, отн. ед. Table 2. Evaluation of image quality after wavelet transform and topological decomposition

Индекс Декомпозиция Название изображения

Лена Магазин Камера Книга

PSNR Вейвлет-преобразование 38,8489 39,8741 39,7013 38,5273

Топологическая декомпозиция к = 5 54,3991 51,0493 52,6356 43,7139

к = 10 47,8567 43,8544 48,6694 41,9514

k = 15 44,3965 41,6243 45,0380 39,8521

к = 30 38,8103 34,9010 40,6326 36,6074

NRM Вейвлет-преобразование 0,0208 0,0221 0,0196 0,0262

Топологическая декомпозиция к = 5 0,0034 0,0046 0,0044 0,0081

к = 10 0,0073 0,0105 0,0070 0,0099

к = 15 0,0110 0,0136 0,0106 0,0127

к = 30 0,0244 0,0488 0,0227 0,0209

MSE Вейвлет-преобразование 8,4760 11,8659 6,9653 28,7065

Топологическая декомпозиция к = 5 0,2361 0,5106 0,3544 2,7649

к = 10 1,0651 2,6769 0,8833 4,1489

к = 15 2,3627 4,4735 2,0383 6,7276

к = 30 11,6300 57,5903 9,3241 18,2569

SSIM Вейвлет-преобразование 0,9761 0,98883 0,9779 0,9752

Топологическая декомпозиция к = 5 0,9986 0,99880 0,9968 0,9983

к = 10 0,9960 0,99585 0,9949 0,9939

к = 15 0,9929 0,99302 0,9926 0,9875

к = 30 0,9769 0,95020 0,9808 0,9710

Рис. 7. Результаты предобработки изображений после топологической декомпозиции с к = 30: Лена (a); Магазин (b); Камера

(с); Книга (d)

Fig. 7. Results of image preprocessing after topological decomposition at к = 30: Lena (a), Store (b), Camera (с), Book (d)

декомпозиции продемонстрировали эффективность, сопоставимую с вейвлетом-преобразованием.

Степень сжатия в приведенных примерах является незначительной, однако стоит заметить, что в данной работе рассматривается не сам алгоритм сжатия, а влияние топологической декомпозиции на качество изображений. И результаты показали, что топологическая декомпозиция сохраняет высокое качество изображения при его сжатии. Это значит, что рассмотренный метод можно интегрировать в другие алгоритмы, например, описанные в работах [19, 20]. Преимуществом топологической декомпозиции является то, что она влияет только на выбранные области, что позволит избежать потерю качества для всего изображения.

При развитии предложенного подхода отсеянные компоненты можно также отдельно обработать для получения сжатия без потерь, что является темой дальнейшего исследования.

Заключение

В работе приведены результаты исследования возможности применения метода декомпозиции изображения по топологическим признакам для уменьшения энтропии с целью сжатия изображения при сохранении высокого качества. Показано, что предложенный подход позволяет разделить изображение на глобальные и детализирующие структуры с заданной степенью детализации. Уменьшение энтропии происходит за счет отбрасывания малозначащих элементов изображения, что приводит к искажению не всего изображения, а лишь определенных областей. Экспериментальные исследования подтвердили возможность применения предложенного подхода для сжатия изображений. Для этого проведена оценка качества изображений после их сжатия с использованием индексов PSNR, NRM, MSE и SSIM. Численные значения индексов показали, что метод топологической декомпозиции сопоставим с вейвлет-преобразованием CDF97, которое используется в JPEG 2000. Дальнейшее развитие метода топологической декомпозиции изображений может помочь разработать полноценный метод сжатия, как с потерями, так и без потерь.

Литература

1. Доан Тиен Бан, Тропченко А.А. Быстрый алгоритм внутрикадро-вого кодирования для HEVC на основе вероятности выбора режима // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20. № 1. С. 74-81. https://doi. org/10.17586/2226-1494-2020-20-1-74-81

2. Said A. Machine learning for media compression: challenges and opportunities // APSIPA Transactions on Signal and Information Processing. 2018. V. 7. N 1. P. e8. https://doi.org/10.1017/ ATSIP.2018.12

3. Soler M., Plainchault M., Conche B., Tierny J. Topologically controlled lossy compression // Proc. of the IEEE Pacific Visualization Symposium (PacificVis). 2018. P. 46-55. https://doi.org/10.1109/ pacificvis.2018.00015

4. Ma H., Liu D., Yan N., Li H., Wu F. End-to-end optimized versatile image compression with wavelet-like transform // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2022. V. 44. N 3. P. 1247-1263. https://doi.org/10.1109/TPAMI.2020.3026003

5. Yang X., Gong J., Wu L., Yang Z., Shi Y., Nie F. Reference-free low-light image enhancement by associating hierarchical wavelet representations // Expert Systems with Applications. 2023. V. 213. P. 118920. https://doi.org/10.1016/j.eswa.2022.118920

6. Сай С.В., Зинкевич А.В., Фомина Е.С. Сравнение дискретного косинус- и вейвлет-преобразований в системах сжатия RAW-изображений // Компьютерная оптика. 2022. Т. 46. № 6. С. 929938. https://doi.org/10.18287/2412-6179-C0-1094

7. Дворников С.В., Дворников С.С., Устинов А.А. Корреляционные свойства коэффициентов кратномасштабного преобразования типовых изображений // Информатика и автоматизация. 2022. Т. 21. № 5. С. 983-1015. https://doi.org/10.15622/ia.21.5.6

8. Mun H., Yoon G.-J., Song J., Yoon S.M. Scalable image decomposition // Neural Computing and Applications. 2021. V. 33. N 4. P. 9137-9151. https://doi.org/10.1007/s00521-020-05677-x

9. Лужков Ю.В., Тропченко А.Ю. Исследование алгоритмов сжатия с потерями на основе пространственной декомпозиции сигнала // Научно-технический вестник Санкт-петербургского государственного университета информационных технологий, механики и оптики. 2008. Т. 8. № 13. С. 37-42.

10. Zhou J., Ben J., Wang R., Zheng M., Du L. Lattice quad-tree indexing algorithm for a hexagonal discrete global grid system // ISPRS International Journal of Geo-Information. 2020. V. 9. N 2. P. 83. https://doi.org/10.3390/ijgi9020083

References

1. Doan Tien Ban, Tropchenko A.A. Fast in-frame coding algorithm for HEVC based on probability of mode selection. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2020, vol. 20, no. 1, pp. 74-81. (in Russian). https://doi. org/10.17586/2226-1494-2020-20-1-74-81

2. Said A. Machine learning for media compression: challenges and opportunities. APSIPA Transactions on Signal and Information Processing, 2018, vol. 7, no. 1, pp. e8. https://doi.org/10.1017/ ATSIP.2018.12

3. Soler M., Plainchault M., Conche B., Tierny J. Topologically controlled lossy compression. Proc. of the IEEE Pacific Visualization Symposium (PacificVis), 2018, pp. 46-55. https://doi.org/10.1109/ pacificvis.2018.00015

4. Ma H., Liu D., Yan N., Li H., Wu F. End-to-end optimized versatile image compression with wavelet-like transform. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, vol. 44, no. 3, pp. 1247-1263. https://doi.org/10.1109/TPAMI.2020.3026003

5. Yang X., Gong J., Wu L., Yang Z., Shi Y., Nie F. Reference-free low-light image enhancement by associating hierarchical wavelet representations. Expert Systems with Applications, 2023, vol. 213, pp. 118920. https://doi.org/10.1016/j.eswa.2022.118920

6. Sai S.V., Zinkevich A.V., Fomina E.S. Comparison of discrete cosine and wavelet transforms in RAW image compression systems. Computer Optics, 2022, vol. 46, no. 6, pp. 929-938. (in Russian). https://doi.org/10.18287/2412-6179-C0-1094

7. Dvornikov S.V., Dvornikov S.S., Ustinov A.A. Analysis of the correlation properties of the wavelet transform coefficients of typical images. Informatics and Automation, 2022, vol. 21, no. 5, pp. 9831015. (in Russian). https://doi.org/10.15622/ia.21.5.6

8. Mun H., Yoon G.J., Song J., Yoon S.M. Scalable image decomposition. Neural Computing and Applications, 2021, vol. 33, no. 4, pp. 9137-9151. https://doi.org/10.1007/s00521-020-05677-x

9. Luzhkov Yu.V., Tropchenko A. Yu. Analysis of algorithms of the lossy compression based on the space signal decomposition. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2008, vol. 8, no. 13, pp. 37-42. (in Russian)

10. Zhou J., Ben J., Wang R., Zheng M., Du L. Lattice quad-tree indexing algorithm for a hexagonal discrete global grid system. ISPRS International Journal of Geo-Information, 2020, vol. 9, no. 2, pp. 83. https://doi.org/10.3390/ijgi9020083

11. Jagadeesh P., Nagabhushan P., Kumar R.P. A novel image scrambling technique based on information entropy and quad tree decomposition // International Journal of Computer Science Issues. 2013. V. 10. N 2. P. 285-294.

12. Li Z., Snavely N. Learning intrinsic image decomposition from watching the world // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2018. P. 9039-9048. https://doi.org/10.1109/CVPR.2018.00942

13. Kizilkaya A., Elbi M.D. A fast approach of implementing the fourier decomposition method for nonlinear and non-stationary time series analysis // Signal Processing. 2022. V. 206. P. 108916. https://doi. org/10.1016/j.sigpro.2022.108916

14. Еремеев С.В., Абакумов А.В., Андрианов Д.Е., Титов Д.В. Метод разложения изображения по топологическим признакам // Компьютерная оптика. 2022. Т. 46. № 6. С. 939-947. https://doi. org/10.18287/2412-6179-C0-1080

15. Еремеев С.В., Абакумов А.В., Андрианов Д.Е., Ширабакина Т.А. Метод векторизации спутниковых снимков на основе их разложения по топологическим особенностям // Информатика и автоматизация. 2023. Т. 22. № 1. С. 110-145. https://doi.org/10.15622/ ia.22.1.5

16. Xin G., Fan P. Soft compression for lossless image coding based on shape recognition // Entropy. 2021. V. 23. N 12. P. 1680. https://doi. org/10.3390/e23121680

17. Kamble V., Bhurchandi K.M. No-reference image quality assessment algorithms: A survey // Optik. 2015. V. 126. N 11-12. P. 1090-1097. https://doi.org/10.1016/j.ijleo.2015.02.093

18. Saha A., Jonathan Wu Q.M. Full-reference image quality assessment by combining global and local distortion measures // Signal Processing. 2016. V. 128. P. 186-197. https://doi.org/10.1016/j. sigpro.2016.03.026

19. Ibrahim R.A., Youssef S.M., Elkaffas S.M. An enhanced fractal image compression integrating quantized quadtrees and entropy coding // Proc. of the 11th International Conference on Innovations in Information Technology (IIT). 2015. P. 190-195. https://doi. org/10.1109/INN0VATI0NS.2015.7381538

20. Lee J., Gong Q., Choi J.Y., Banerjee T., Klasky S., Ranka S., Rangarajan A. Error-bounded learned scientific data compression with preservation of derived quantities // Applied Sciences. 2022. V. 12. N 13. P. 6718. https://doi.org/10.3390/app12136718

Авторы

Абакумов Артём Владимирович — аспирант, Муромский институт (филиал) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 602264, Российская Федерация, sc 57215968427, https://orcid.org/0000-0001-5784-7147, айет210966@ yandex.ru

Еремеев Сергей Владимирович — кандидат технических наук, доцент, доцент, Муромский институт (филиал) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 602264, Российская Федерация, sc 56673892800, https://orcid.org/0000-0001-8482-1479, sv-eremeev@yandex.ru

Статья поступила в редакцию 25.09.2023 Одобрена после рецензирования 13.10.2023 Принята к печати 10.11.2023

11. Jagadeesh P., Nagabhushan P., Kumar R.P. A novel image scrambling technique based on information entropy and quad tree decomposition. International Journal of Computer Science Issues, 2013, vol. 10, no. 2, pp. 285-294.

12. Li Z., Snavely N. Learning intrinsic image decomposition from watching the world. Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2018, pp. 9039-9048. https://doi. org/10.1109/CVPR.2018.00942

13. Kizilkaya A., Elbi M.D. A fast approach of implementing the fourier decomposition method for nonlinear and non-stationary time series analysis. Signal Processing, 2022, vol. 206, pp. 108916. https://doi. org/10.1016/j.sigpro.2022.108916

14. Eremeev S.V., Abakumov A.V., Andrianov D.E., Titov D.V. Image decomposition method by topological features. Computer Optics, 2022, vol. 46, no. 6, pp. 939-947. (in Russian). https://doi. org/10.18287/2412-6179-C0-1080

15. Eremeev S.V., Abakumov A.V., Andrianov D.E., Shirabakina T.A. Vectorization method of satellite images based on their decomposition by topological features. Informatics and Automation, 2023, vol. 22, no. 1, pp. 110-145. (in Russian). https://doi.org/10.15622/ia.22.L5.

16. Xin G., Fan P. Soft compression for lossless image coding based on shape recognition. Entropy, 2021, vol. 23, no. 12, pp. 1680. https:// doi.org/10.3390/e23121680

17. Kamble V., Bhurchandi K.M. No-reference image quality assessment algorithms: A survey. Optik, 2015, vol. 126, no. 11-12, pp. 10901097. https://doi.org/10.1016/j.ijleo.2015.02.093

18. Saha A., Jonathan Wu Q.M. Full-reference image quality assessment by combining global and local distortion measures. Signal Processing, 2016, vol. 128, pp. 186-197. https://doi.org/10.1016/j. sigpro.2016.03.026

19. Ibrahim R.A., Youssef S.M., Elkaffas S.M. An enhanced fractal image compression integrating quantized quadtrees and entropy coding. Proc. of the 11th International Conference on Innovations in Information Technology (IIT), 2015, pp. 190-195. https://doi. org/10.1109/INN0VATI0NS.2015.7381538

20. Lee J., Gong Q., Choi J.Y., Banerjee T., Klasky S., Ranka S., Rangarajan A. Error-bounded learned scientific data compression with preservation of derived quantities. Applied Sciences, 2022, vol. 12, no. 13, pp. 6718. https://doi.org/10.3390/app12136718

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Authors

Artyom V. Abakumov — PhD Student, Murom Institute (Branch) of Vladimir State University, Murom, 602264, Russian Federation, sc 57215968427, https://orcid.org/0000-0001-5784-7147, artem210966@ yandex.ru

Sergey V. Eremeev — PhD, Associate Professor, Associate Professor, Murom Institute (Branch) of Vladimir State University, Murom, 602264, Russian Federation, sc 56673892800, https://orcid.org/0000-0001-8482-1479, sv-eremeev@yandex.ru

Received 25.09.2023

Approved after reviewing 13.10.2023

Accepted 10.11.2023

Работа доступна по лицензии Creative Commons «Attribution-NonCommercial»

i Надоели баннеры? Вы всегда можете отключить рекламу.