УДК 621.397: 004.932.2
В.В. Капустин, А.В. Каменский
Оценка качества изображений высокого разрешения при внутрикадровом сжатии в стандартах JPEG и JPEG2000
Рассмотрено влияние внутрикадрового сжатия на разрешающую способность изображений. Получены результаты оценки вносимых в изображение искажений после применения алгоритмов компрессии, основанных на дискретно-косинусном и дискретном вейвлет-преобразовании по таким параметрам, как пиковое отношение сигнал/шум, среднеквадратическая ошибка и разрешающая способность.
Ключевые слова: внутрикадровое сжатие, пиковое отношение сигнал/шум, среднеквадратическая ошибка, контрастно-частотная характеристика, разрешающая способность. doi: 10.21293/1818-0442-2016-19-3-27-31
Известно, что в настоящее время для внутри-кадрового сжатия видеоданных особой популярностью пользуются стандарты, в которых применяется дискретно-косинусное преобразование (ДКП). Современные видеокомпрессоры позволяют использовать для ДКП блоки разных размеров, включая адаптивный выбор размера блока в зависимости от области изображения. Для областей, содержащих мелкие детали, применяются блоки меньшего размера, области с монотонным содержанием разбиваются на блоки большего размера [1, 2]. Для устранения основного недостатка ДКП, связанного с возникновением на изображении блочной структуры, как правило, применяется постобработка. Дискретное вейв-лет-преобразование (ДВП) нашло применение в таких стандартах сжатия изображений как ШБ02000 и 1СБЯ. Использование ДВП для компрессии изображений не приводит к возникновению блочной структуры и поэтому не требует применения деблокинг-фильтров.
Постановка задачи
Задачей исследования является измерение разрешающей способности несжатых изображений, полученных при помощи непрофессионального цифрового фотоаппарата, определение, как алгоритмы внутрикадрового сжатия данных, основанные на ДКП и ДВП, влияют на качество изображений высокого разрешения при одинаковых коэффициентах компрессии. Необходимо установить зависимость падения разрешающей способности изображения от коэффициента компрессии изображения, применяемой схемы компрессии, размера блока ДКП, порядка используемого вейвлета при ДВП.
Теория
В качестве инструментального средства для оценки качества изображений при внутрикадровом сжатии применялась программа, разработанная в среде МЛТЬЛБ.
Язык МЛТЬЛБ является высокоуровневым интерпретируемым языком программирования, включающим основанные на матрицах структуры данных, широкий спектр функций, интегрированную среду разработки и объектно-ориентированные возможности [3].
Интерфейс программы позволяет сжимать изображения независимо как с применением ДКП, так и с использованием ДВП, что позволяет наглядно сравнить степень и характер вносимых в изображение искажений [4].
На рис. 1 показана упрощенная структурная схема работы алгоритма программы для сжатия изображений с использованием ДКП.
Рис. 1. Структурная схема алгоритма сжатия изображений с использованием ДКП
Алгоритмом предусмотрен выбор размера блока ДКП: 4x4, 8x8 и 16x16 элементов.
Матрица квантования генерируется в зависимости от выбранного размера блока и значения качества кодирования т по следующей формуле:
1+(I + у) • т, (1)
I - номер строки блока, у - номер столбца блока.
Значение элемента, расположенного в 1-й строке 1-го столбца матрицы, равно 16 и не зависит от значения т.
Структурная схема работы алгоритма программы для сжатия изображений с использованием ДВП, отличается тем, что блок ДКП заменен блоком ДВП, а блок выбора размера блока ДКП заменен блоком выбора типа вейвлет-фильтра и уровня вейвлет-разложения.
Для компрессии изображений с использованием ДВП алгоритмом программы предусмотрен выбор вейвлетов Добеши 2, 4 и 6-го порядка, а также вейв-лет Хаара. Уровень вейвлет-разложения регулируется в пределах от 1 до 5.
Расчет среднеквадратической ошибки (СКО) выполняется по формуле
СКО=хЖ :01 а, ]) - к а,} )|2, (2)
т ■ п ' и ■> и
где I - входное изображение; К - выходное изображение; т*п - размер изображения; / - номер строки изображения; ] - номер столбца изображения.
Значение пикового отношения сигнал/шум (ПОСШ) рассчитывается через значение СКО (2) по формуле (3):
ПОСШ =10logio
f MAX? ^
СКО
= 20logio
fMAX j Л
Тско
(3)
MAXi - максимальное значение пикселя, равное 255 для 8 битного изображения.
В качестве измерительного изображения использовалась таблица ISO 12233:2014, сгенерированная в программе Imatest. Данная измерительная таблица позволяет определить разрешающую способность изображения по вертикали и горизонтали до 2500 ТВЛ за счет горизонтальных и вертикальных клиньев линий. Для сохранения высокой детализации таблица была распечатана на фотобумаге по частям, после чего склеена из 10 листов формата А4 на подложку (рис. 2).
Рис. 2. Таблица ISO 12233:2014
Фотографирование таблицы осуществлялось при помощи цифрового фотоаппарата Canon SX50HS при естественном освещении. Формат матрицы фотоаппарата 1/2.3, разрешение 12 мегапикселей (4000x3000 пикселей).
Полученные фотоснимки сохранялись без применения внутрикамерной обработки и алгоритмов сжатия, в формате RAW. После чего при помощи программы FastStone Image Viewer фотоснимки были конвертированы в формат BMP. Также из изображения были удалены цветоразностные компоненты для дальнейшей обработки ДКП и ДВП компрессором.
Разрешающая способность изображения определялась визуально и при помощи программы Imatest.
Для того чтобы определить разрешающую способность изображения, необходимо знать функцию -зависимость контраста между черной и белой линиями от числа линий в кадре, так называемую контрастно-частотную характеристику (КЧХ), которую
позволяет измерить и сформировать программа 1та1еБ1 [5].
Таким образом, максимально возможное количество телевизионных линий (ТВЛ) будет получено в случае, если одна линия приходится на один пиксель, что соответствует значению 0,5 цикла на пиксель. Отсюда можно получить выражение для перевода числа циклов на пиксель в ТВЛ [6]:
ТВЛ = (СРР/0,5) х разрешение изображения.
Здесь СРР - число «циклов на пиксель» на уровне 0,5.
Результаты экспериментов
В ходе проведения эксперимента фотоизображение измерительной таблицы было сжато с использованием ДКП для блоков размером 8*8 и 16х16 элементов, а также с использованием ДВП для вейвлетов Хаара, Добеши 2, 4 и 6-го порядка при 5-м уровне вейвлет-разложения.
Для каждой из схем компрессии из изображения была удалена избыточность для достижения коэффициента компрессии равного 10, 20, 30, 40 и 50 раз.
Результаты измерения значений СКО и ПОСШ для схемы компрессии с использованием ДКП представлены в табл. 1 и 2.
Таблица 1 Результат компрессии изображения с применением
Размер блока ДКП 8x8
Коэффициент компрессии 10 22 30,3 40 43
СКО 2,77 4,18 5,68 24,56 68,58
ПОСШ 43,7 41,9 40,58 34,22 29,76
Таблица 2 Результат компрессии изображения с применением блока ДКП размером 16^16 элементов
Размер блока ДКП 16x16
Коэффициент компрессии 17,7 31,3 41,1 48 52,9
СКО 3,2 4,07 4,56 4,97 5,38
ПОСШ 43,02 42,02 41,53 41,15 40,81
Сводный график, отражающий результаты потери качества изображения по значению ПОСШ при использовании блоков ДКП размерами 8*8 и 16*16 элементов, представлен на рис. 3.
45 -
ш
я
40 -
5
о
25 •
10
20
30
40 50
Коэффициент компрессии
Рис. 3. Зависимости ПОСШ от коэффициента компрессии:
1 - ДКП-блок размером 8*8 элементов;
2 - ДКП-блок размером 16*16 элементов
На рис. 4, 5 представлены результаты измерения разрешающей способности изображения в программе 1та1еБ1 при использовании блоков ДКП размером 8x8 элементов и 16x16 элементов соответственно.
1200 -_ 1000 -- 800 _ м 600 400 -200 —
0
10
20
30 40 50 Коэффициент компрессии Рис. 4. Зависимости разрешающей способности от коэффициента компрессии для ДКП блока размером 8x8: 1 - вертикальное разрешение; 2 - горизонтальное разрешение
1400
2
1200 § 1000 800 600
0
10
20
30
40
50
60
Коэффициент компрессии
Рис. 5. Зависимость разрешающей способности от коэффициента компрессии для ДКП блока размером 16x16: 1 - вертикальное разрешение;
2 - горизонтальное разрешение
Результаты измерения значений СКО и ПОСШ для схемы компрессии с использованием ДВП представлены в табл. 3-6.
Сводный график, отражающий результаты потери качества изображения по значению ПОСШ при использовании вейвлетов Хаара, Добеши 2, 4 и 6-го порядка, представлен на рис. 6.
На рис. 7-10 представлены результаты измерений разрешающей способности изображения в программе 1та1е$1 при использовании фильтров Добеши 2, 4 и 6-го порядка и вейвлета Хаара соответственно.
Таблица 3 Результат компрессии изображения
Тип вейвлет-фильтра Добеши 2
Коэффициент компрессии 11,2 21 30,6 41,2 50,6
СКО 2,57 3,67 4,33 5,08 5,89
ПОСШ 44,01 42,48 41,75 41,06 40,42
Таблица 4 Результат компрессии изображения
Тип вейвлет-фильтра Добеши 4
Коэффициент компрессии 11,4 22,4 30,8 41,1 50,4
СКО 3,2 3,6 4,07 4,62 5,28
ПОСШ 44,09 42,56 42,02 41,48 40,89
Таблица 5 Результат компрессии изображения
Тип вейвлет-фильтра Добеши 6
Коэффициент компрессии 11,3 21,7 29,6 40,4 50
СКО 2,51 3,58 4,05 4,68 5,56
ПОСШ 44,12 42,58 42,05 41,42 40,67
Таблица 6 Результат компрессии изображения с применением вейвлета Хаара
Тип вейвлет-фильтра Хаар
Коэффициент компрессии 10 20 30 40 50
СКО 2,69 3,98 5,16 6,92 9,39
ПОСШ 43,83 42,12 41 39,72 38,4
10
20
30
40 50
Коэффициент копрссеии Рис. 6. Зависимости ПОСШ от коэффициента компрессии: 1 - вейвлет Добеши 2; 2 - вейвлет Добеши 4; 3 - вейвлет Добеши 6; 4 - вейвлет Хаара
1400 -
2
1200 3 1000 800
600 •
о
10
20
30 40 50 60 Коэффициент компрессии Рис. 7. Зависимости разрешающей способности от коэффициента компрессии для вейвлета Добеши 2: 1 - вертикальное разрешение; 2 - горизонтальное разрешение
1400 -1200
1000
коп -
600
40
50
60
О 10 20 30
Коэффициент конрессии Рис. 8. Зависимости разрешающей способности от коэффициента компрессии для вейвлета Добеши 4:
1 - вертикальное разрешение;
2 - горизонтальное разрешение
14ÜÜ 12ÜÜ 1000 S00 -
600 ■
О К) 20 W 40 50
60
Коэффициент гашрессин
Рис. 9. Зависимости разрешающей способности от коэффициента компрессии для вейвлета Добеши 6: 1 - вертикальное разрешение; 2 - горизонтальное разрешение
1400 -
1200 -_ 1000 800
6 00
0 10 20 30 40 50
60
Коэффициент компрессии Рис. 10. Зависимости разрешающей способности от коэффициента компрессии для вейвлета Хаара: 1 - вертикальное разрешение; 2 - горизонтальное разрешение
На рис. 11, 12 представлены сводные изображения вертикальных и горизонтальных клиньев линий измерительной таблицы ISO 12233:2014.
« :"> о
Ж
- В
|Г 1С I I-18 1-18
; I
к 1 в I ÍZ8
д 1-18 е1-18ж|-18
- 8
- 8
- 8
Рис. 11. Вертикальная мира, сводный рисунок при коэффициенте компрессии 50 раз: а - исходное; б - ДКП 8*8; в - ДКП 16*16; г - ДВП Добеши 2; д - ДВП Добеши 4; е - ДВП Добеши 6; ж - ДВП Хаара
' • 1 Vn 1 ' Ve' 1 ■
10 15а
....... 'У 1 '
10 15 -i
К, ' 16 б _
I ' 1 ' U' ' ' 'Ve' ' '
10 15 *
i i i ' '
lili*) i
........i >11 ' 1
10 15 в
.....10' ' ' 15 ' '
ж
10 15
Рис. 12. Горизонтальная мира, сводный рисунок при коэффициенте компрессии 50 раз: а - исходное; б - ДКП 8*8; в - ДКП 16*16; г - ДВП Добеши 2; д - ДВП Добеши 4; е - ДВП Добеши 6; ж - ДВП Хаара
Из рис. 11 и 12 видно, что при использовании ДКП с размером блока 8*8 и сжатии изображения в 50 раз качество изображения значительно проигрывает остальным представленным методам компрессии.
Обсуждение результатов
Разрешающая способность фотоизображения измерительной таблицы до применения алгоритмов компрессии, измеренная в программе 1та1е$1, составила 1160 вертикальных линий и 758 горизонтальных линий.
Стоит отметить, что такие низкие значения, разрешающей способности, полученные в программе 1та1е$1, связаны с недостаточным контрастом исходного изображения.
При визуальной оценке разрешающей способности изображения по клиньям линий значения ТВЛ превышают полученные в программе 1та1е51 Число визуально различаемых вертикальных линий составило 1400 ТВЛ, число горизонтальных линий около -1300 ТВЛ, но данная оценка является субъективной.
Кроме того, в ходе измерения разрешающей способности изображения, сжатого при помощи схемы, основанной на ДВП, были получены нестабильные результаты, показывающие рост разрешения при увеличении коэффициента сжатия. Такие же результаты после применения ДВП для искусственного изображения были получены в работе [7]. Данный факт свидетельствует о том, что использование вейвлетов вносит в изображение специфические искажения, влияющие на КЧХ.
ДКП с размером блока 16*16 элементов, также показал рост разрешающей способности изображения при коэффициенте компрессии 40, что связано, вероятно, с попаданием границы двух блоков в область измерения изображения в программе 1та1е81
Выводы и заключение
1. Применение ДКП с размером блока 8*8 элементов для компрессии изображений высокого разрешения малоэффективно. Эффективность компрессии в данном режиме резко падает при значениях коэффициентов компрессии более 30.
2. Применение ДКП с размером блока 16*16 элементов оптимально для сжатия изображений высокого разрешения. Однако стоит отметить тот факт, что при дальнейшем увеличении разрешения изображений в какой-то момент времени применение ДКП с размером блока 16*16 также станет малоэффективным, что потребует применения блоков большего размера. Кроме того, в ходе визуальной оценки вертикальной и горизонтальной миры сжатого изображения, при высоких коэффициентах компрессии становится заметна блочная структура анализируемых участков, проявляющаяся некоторым сдвигом линий относительно друг друга, что может негативно повлиять на эффективность алгоритмов автоматического распознавания объектов.
3. Использование ДВП и в частности фильтров Добеши позволяет эффективно сжимать изображения различных разрешений без возникновения блочной структуры на сжатом изображении. В ходе
визуальной оценки вертикальной и горизонтальной миры было установлено, что при высоких коэффициентах компрессии фильтры Добеши дают менее заметные искажения, приводящие к некоторому размытию линий.
4. Полученные в данном исследовании результаты могут быть использованы при проектировании систем компьютерного зрения для обнаружения и распознавания объектов.
Работа выполнена при финансовой поддержке Минобрнауки России в рамках базовой части государственного задания № 2014/225 на 2016 год по НИР «Исследование и разработка методов и средств повышения качества изображений активно-импульсных телевизионно-вычислительных систем видения в сложных метеоусловиях и малопрозрачных средах» (код проекта 3643) и при поддержке РФФИ в рамках гранта по научному проекту №1647-700939 «Исследование и разработка методов и средств повышения эффективности активно-импульсных телевизионно-вычислительных систем мониторинга и обеспечения комплексной безопасности объектов».
Литература
1. Дворкович В.П. Цифровые видеоинформационные системы: теория и практика / В.П. Дворкович, А.В. Дворкович. - М.: Техносфера, 2012. - 1008 с.
2. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - М.: Техносфера, 2005. - 1072 с.
3. Капустин В.В. Коррекция координатных искажений в телевизионно-вычислительных системах // Доклады Том. гос. ун-та систем управления и радиоэлектроники. -2015. - № 4 (38). - С. 174-177.
4. Капустин В.В. Инструментальные средства оценки качества изображений при внутрикадровом сжатии видеоданных // Матер. XI Междунар. науч.-практ. конф. «Электронные средства и системы управления». - Томск: В-Спектр, 2015. - Ч. 2. - С. 305-309.
5. Imatest Documentation by Norman Koren [Электронный ресурс]. - URL: http://www.imatest.com/docs/ (дата обращения: 1.03.2016).
6. Malanin M.Yu. Optimization of parameters of two-dimensional filters of increase of clearness of television images on contrastly to frequency characteristics / M.Yu. Malanin, A.V. Kamenski, M.I. Kuryachiy // Control and Communications (SIBCON), IEEE 2015 International Siberian Conference on. - 2015. - P. 1-4.
7. Kapustin V.V. Estimation of intra-frame compressed image quality for JPEG and JPEG2000 standards / V.V. Ka-pustin, A.V. Kamenskiy // 2016 17th International Conference of Young Specialists on Micro/Nanotechnologies and Electron Devices (EDM). - 2016. - P. 308-312.
Капустин Вячеслав Валериевич
Аспирант каф. телевидения и управления (ТУ) ТУСУРа
Тел.: +7-960-969-88-77
Эл. почта: [email protected]
Каменский Андрей Викторович
Аспирант каф. ТУ ТУСУРа Тел.: +7-952-892-78-35 Эл. почта: [email protected]
Kapustin V.V., Kamenskiy A.V.
Estimation of Intra-frame Compression Quality of a highresolution Image for JPEG and JPEG2000 Standards
This article discusses the impact of intra-compression on the resolution of the image. The results obtained in the evaluation of the image distortion introduced after applying compression algorithms based on the discrete cosine transform and discrete wavelet by parameters such as peak signal / noise ratio, standard deviation and resolution.
Keywords: intra-frame compression, peak signal-to-noise ratio, mean-square error, contrast-frequency characteristic, picture resolution.