УДК 004.627
ПРОГНОЗИРОВАНИЕ ПАРАМЕТРОВ СЖАТИЯ С ПОТЕРЯМИ ИЗОБРАЖЕНИЙ С ШУМОМ
ЗЕМЛЯЧЕНКО А.Н., АБРАМОВ С.К., ЛУКИНВ.В. Рассматриваются особенности сжатия с потерями изображений, на которых присутствует шум. Анализ проводится для кодера AGU, основанного на ДКП. Показывается, что имеется возможность прогнозировать пиковое отношение сигнал-шум и улучшение или ухудшение метрики визуального качества при разных параметрах сжатия (значениях шага квантования). Также можно прогнозировать коэффициент сжатия. Наличие этих возможностей позволяет выбрать параметры сжатия с учетом приоритета требований.
Ключевые слова: показатели качества, сжатие с потерями, изображение с шумом, прогнозирование. Key words: quality indicators, lossy compression, noisy image, prediction. Введение
Сжатие изображения в настоящее время является одной из основных операций обработки данных для мультимедийных приложений, дистанционного зондирования, охранных и медицинских диагностических систем [1, 2]. В литературных источниках, посвященных сжатию изображений, чаще всего полагают, что качество исходного изображения, подвергаемого сжатию, идеально или достаточно высоко, т.е. шум в нем отсутствует или, по крайней мере, человеческий глаз его не замечает. Тогда все искажения, вносимые методами сжатия с потерями, полагаются вредными и для описания сжатия используют кривую искажения-коэффициент сжатия (rate distortion curve) или ее модификации, где параметр (метрика, количественный критерий), описывающий искажения (потери), рассчитывается между сжатым и исходным изображениями.
Однако на самом деле во всех изображениях, независимо от их типа и условий получения, присутствует шум, который может быть разного вида и интенсивности. Есть приложения или условия, для которых шум практически незаметен, например, для оптических изображений, полученных в условиях хорошей освещенности. Для других приложений, например, для радиолокационных изображений, шум всегда виден [3] и его присутствие ограничивает возможности и эффективность решения задач вторичной обработки (обнаружения и локализации объектов [4], классификации [5]). В связи с этим шум, присутствующий на изображении, часто необходимо учитывать при разработке методов сжатия таких изображений и выборе параметров сжатия [6].
Первыми обратили внимание на эти моменты авторы работы [6]. Они показали, что сжатие с поте-
рями изображений с шумом приводит, в целом, к позитивному эффекту частичного подавления помех - своеобразной фильтрации. Кроме того, они продемонстрировали возможное наличие оптимальной рабочей точки (ОРТ) - таких параметров сжатия с потерями, что сжатое изображение оказывается более близким к истинному изображению (изображению без помех), чем исходное (первичное) изображение, подвергаемое сжатию, в соответствии с некоторой метрикой, например, средне-квадратическая ошибка (СКОш) или пиковое отношение сигнал-шум (ПОСШ) [6, 7].
С одной стороны, анализ метрик, рассчитываемых между сжатым и истинным изображениями, и их зависимостей от параметров сжатия возможен лишь при наличии истинного изображения, т.е. при проведении численного моделирования, когда пользователь имеет «чистое» (истинное) изображение, сам добавляет к нему помехи и выполняет компрессию. Поэтому может создаться впечатление, что сжатие в ОРТ (если ОРТ для данной ситуации существует) на практике невозможно в связи с отсутствием истинного изображения. Однако проведенные в последние годы исследования показали [7-9], что возможно сжатие с потерями в окрестности ОРТ при отсутствии истинного изображения путем либо применения итеративной обработки [8], либо выбора параметров кодера [9] с учетом характеристик помех, полагаемых априорно известными или оцененными с приемлемой точностью [10].
Поскольку ОРТ наблюдается не всегда (может отсутствовать), то желательно принимать решение, с какими параметрами осуществлять сжатие таким образом, чтобы обеспечить приемлемые качество и коэффициент сжатия (КС) или, по крайней мере, найти приемлемый компромисс между ними. Тогда желательно уметь прогнозировать параметры сжатия (некоторые точки кривой, описывающей значение метрики между истинным и сжатым изображением в зависимости от параметра, управляющего сжатием). В работе [11] нами было показано, что можно прогнозировать значения ПОСШ (или его отличия от ПОСШ для несжатого изображения) для окрестности ОРТ. Кроме того, в работе [12] было показано, что можно прогнозировать и значения КС.
В связи с этим, основная цель данного исследования - проверить, применима ли предложенная в работах [11, 12] методика для прогнозирования параметров сжатия, если оно выполняется не в окрестности ОРТ. Желательно также сформулировать подходы к принятию решений.
1. Особенности сжатия изображений с шумом
Сначала поясним, как можно описать сжатие с потерями изображений, на которых присутствует шум. Для этого воспользуемся простейшей моделью помех, предположив, что шум является аддитивным, белым и гауссовым, то есть ¡П = 1;™е + П],
где 1|™е - истинное значение изображения в у-м пикселе, п^ - аддитивный шум с нулевым сред-
_2
ним и дисперсией с в этом же отсчете, 1 = 1,...,^,] = - общее количество
пикселей.
После сжатия 1П,1 = 1,...,^,] = 1,...,^ с потерями имеем Т-Д = 1,...,^,] = 1,...,К2, которое отличается
от
It
и
от
,1 = 1,...,^,] = 1,...,^ ¡п,1 = 1,...,^,] = 1,...,N2 .
Тогда некоторую метрику можно вычислить между любыми парами изображений, а на практике только между
] = 1,...,^,] = 1,...^2 и ] = 1,...,^,] = 1,...,N2.
При этом по мере увеличения КС (уменьшения Ьрр=8/КС при стандартном восьмибитном представлении одноканальных изображений в градациях серого) значения метрики ухудшаются. Например, значения среднеквадратической ошибки
1 N N2
Ы8Б„с =—]^ - 1С)2
36
в
■О
| ш гs гв ■ 24 22
■ Aerial o2=10G -AifieMoS НЮ
■ Frisco Cf2-100 • Aerial (Й=300 ■Aificld (й-100 ■Frisco a2~2W
—I-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-r-1
возрастают, а
N1N2 - itj ПОСШ PSNRnc = 10lg(2552 /MSEnc) уменьшается.
А метрики, рассчитанные для сжатого и истинного изображений, могут вести себя своеобразно, имея глобальные минимумы или максимумы. В качестве примера на рис. 1 приведены зависимости PSNRct(QS) для кодера AGU [13], основанного на ДКП, выполняемого в блоках 32х32 пикселя, современных методах кодирования квантованных ДКП-коэффициентов и деблокинге после декомпрессии. Кодер управляется шагом квантования (ШК, QS - quantization step). Тестовое изображение Frisco имеет довольно простую структуру (много однородных участков большой площади), а изображения Aerial и Airfield - средней и примерно одинаковой сложности.
Рис. 1. Зависимость ПОСШ от ШК (Р8) для трех тестовых изображений при двух значениях дисперсии
Анализ зависимостей показывает, что при малых значениях ШК имеет место тенденция к медленному уменьшению значений PSNRct, которые при QS«2с немного меньше, чем
PSNRnc ^ ^ 0) = PSNRntrue. При дальнейшем возрастании ШК возможны различные варианты поведения PSNRct(QS):
1) зависимость имеет явно выраженный глобальный максимум, соответствующий ОРТ, где PSNRct(QSОРТ) больше PSNRct(QS ^ 0);
2) зависимость имеет локальный максимум, в котором PSNRct(QSлокмак0) ^ PSNR ы ^ ^ 0);
3) зависимость продолжает монотонно убывать (на рис. 1 такой пример отсутствует).
Ситуация 1, т.е. наличие ОРТ, наблюдается для достаточно простых по структуре изображений и/или при высоком уровне помех. Очевидно, что в таком случае имеет смысл выполнять сжатие в окрестности ОРТ. Причина, по которой речь идет об окрестности ОРТ, а не о самой ОРТ, такова. Как уже отмечалось, зависимость PSNRct(QS) можно получить только при моделировании, но не на практике. Для практики разработаны «инженерные» рекомендации по выбору ШК. Анализ зависимостей на рис. 1 показывает, что QSОРТ примерно равен 4с, т.е. при известной (точно оцененной) СКО помех можно попасть в окрестность ОРТ (для каждой конкретной зависимости QSОРТ может быть как больше, так и меньше 4с). В ситуации 2 (характерной для достаточно сложных изображений при помехах среднего уровня) QSлокмакс ~4с»^орт и сжатие в окрестности QS„окмaкс также может иметь смысл, если только
ЛОК Мс1 ко у
PSNRct(QSлокмак0) не намного меньше, чем PSNRct(QS ^ 0) (в противном случае может быть
полезным использовать QS « с , чтобы сжатие не
привело к резкому ухудшению качества изображения).
Наконец, в ситуации 3 (имеющей место для изображений сложной структуры и/или при невысоком уровне помех) явно нет смысла сжимать изображение с QS « 4с, поскольку это может привести к существенному ухудшению качества. Более разумным решением может быть сжатие с QS « 2с или даже с QS « с .
Приведенные выше рассуждения правомерны, если не накладываются ограничения на минимальное значение КС, которое нужно обеспечить. В противном случае принятие решения становится еще более сложной задачей. Однако в любом случае видно, что предсказанные зависимости PSNRct(QS), CR(QS) и, в итоге, PSNRct(CR) смогли бы помочь в принятии обоснованных решений (естественно, при условии, что предсказание является достаточно точным). 2. Анализ результатов сжатия изображений с шумом
Поскольку результаты для тестовых изображений Aerial и Airfield очень близки (см. рис. 1), в дальнейшем вместо Airfield будем использовать известное тестовое изображение Baboon, которое является примером изображения со сложной структурой (текстурного изображения). Поскольку нас будут интересовать различные уровни помех, то будем рассматривать восемь значений дисперсии помех: 0,25, 1 и 4 (первые два соответствуют крайне низкому уровню помех, все три соответствуют визуально незаметным помехам, т.е. практическим ситуациям, которые наиболее часто рассматриваются в теории сжатия изображений с потерями), 25 и 100 (соответствуют характерным для практики уровням помех, когда помехи на изображениях видны, по крайней мере, на однородных участках), 225, 400 и 900 (соответствуют интенсивным помехам или отношениям сигнал-шум, когда исходные изображения имеют низкое качество). Поскольку для этих ситуаций
PSNRntrue = 10lg(2552 / с2) лежит в очень широком диапазоне значений (от 54 до 19 дБ), то будем анализировать не зависимости PSNRct(QS), а APSNR(QS) = PSNRct (QS) - PSNRntrue, причем положительные значения APSNR(QS) свидетельствуют о том, что качество изображения вследствие сжатия с потерями в соответствии с метрикой PSNRct улучшилось, и наоборот.
Кроме того, будем анализировать APHVS(QS) = = PSNR-HVS-Mct (QS) - PSNR-HVS-Mntrue, где
PSNR-HVS-Mot = 10lg(2552/MSEHVS0t), MSE^Sct
- среднеквадратическая ошибка, вычисленная с учетом особенностей зрения человека [14], а PSNR-HVS-Mntrue - значение метрики PSNR-HVS-M для зашумленного изображения относительно истинного [14]. Метрика PSNR-HVS-M учитывает два важных аспекта зрения человека - разную чувствительность к искажениям для низких и высоких пространственных частот, а также эффекты маскирования (меньшей заметности искажений для текстур).
Данные моделирования представлены в табл. 1. Наряду с указанными выше значениями метрик приведены значения KC(CR), а также параметров P 2о и P27o. Эти параметры использованы при прогнозировании APSNR и APHVS в ОРТ [11], а также при прогнозировании КС [12]. Оба определяются для группы блоков размером 8х8 пикселей, где число блоков должно быть, как минимум, равно 300 для обеспечения приемлемо малого негативного влияния на точность прогнозирования. P2o
- вероятность того, что амплитуда ДКП-коэффициентов в блоках не превысит 2а, а P2j7o -вероятность того, что амплитуда ДКП-коэффициентов в блоках превысит 2,7а (коэффициент, отвечающий за среднее в блоках, при расчетах не учитывается). Тогда значения P 2а малы (а значения P27a велики) для малых значений дисперсии помех и/или изображений со сложной структурой (теоретически обе вероятности могут изменяться практически от нуля до почти единицы). Данные в таблице 1 приведены для трех значений ШК: QS = 2а, QS = 3,5а и QS = 5а, т.е. для ШК, который меньше QSOPT, примерно равен QSOPT и больше QSOPT, если ОРТ существует. Таким образом, можно выявить основные тенденции, которые заключаются в следующем:
1) по мере увеличения дисперсии помех при заданном ШК (например, QS = 2а) P 2а возрастает, а P^ уменьшается;
2) с увеличением дисперсии помех при ШК, пропорциональном СКО, также наблюдается рост КС, который варьируется в очень широких пределах -от 1,35 для тестового изображения Baboon при с2 = 0,2,QS = 2с до 142 для тестового изображения Frisco при с2 = 900,QS = 5с ;
3) при фиксированных СКО и ШК наблюдается явная зависимость достигаемого КС от степени
сложности изображения; например, при СКО=10 и ШК=35 КС равен 5,69 для изображения Baboon и 11,55 - для изображения Frisco;
4) в зависимости от дисперсии помех при QS = 2а APSNR изменяется от -1,4 дБ (при малых дисперсиях помех) до 0,05 дБ (при больших дисперсиях помех для изображений с простой структурой);
5) при QS = 3,5а APSNR изменяется от -3,1 дБ (при малых дисперсиях помех) до 6,1 дБ (при больших дисперсиях помех для изображений с простой структурой), т.е. пределы возможного изменения очень широкие и важность прогнозирования этих значений велика;
6) при QS = 5а APSNR лежит в пределах от -4,7 дБ (при малых дисперсиях помех) до 9,0 дБ (при больших дисперсиях помех для изображений с простой структурой); таким образом, пределы возможного изменения еще более широки и важность прогнозирования этих значений также велика;
7) в зависимости от дисперсии помех при QS = 2а APHVS изменяется от -1,9 дБ (при малых дисперсиях помех) до -0,2 дБ (при больших дисперсиях помех для изображений с простой структурой), т.е. в любом случае визуальное качество ухудшается, но не слишком существенно;
8) при QS = 3,5а APHVS изменяется от -4,4 дБ (при малых дисперсиях помех) до 3,2 дБ (при больших дисперсиях помех для изображений с простой структурой), т.е. пределы возможного изменения широкие и велика важность прогнозирования этих значений;
9) при QS = 5а APHVS лежит в пределах от -6,9 дБ (при малых дисперсиях помех для изображений со сложной структурой) до 4,0 дБ (при больших дисперсиях помех для изображений с простой структурой); следовательно, велика важность прогнозирования значений APHVS;
10) высока корреляция между значениями параметров, которые нужно предсказывать, и значениями параметров P2а и P2,7a - чем больше P2а и меньше P2,7a, тем больше APHVS и APSNR . Результаты могут быть представлены и в другом виде (табл. 2-4), который более наглядно показывает возможные ситуации. Результаты приведены для четырех значений P2a, которые соответствуют разным практическим ситуациям (степени сложности изображения и уровню помех). Значения APSNR и APHVS усреднены по нескольким изображениям. Приведены также значения PSNRnt, дБ
и исходное PSNR-HVS-M, дБ, что облегчает анализ.
Здесь необходимо отметить следующее [15]. Значения PSNRnt выше 37 дБ говорят о том, что помехи или искажения практически незаметны. О том же говорят значения PSNR-HVS-M выше 40 дБ. Значения PSNRnt выше 30 дБ и значения PSNR-HVS-M выше 33 дБ говорят о том, что качество изображений достаточно высокое, но искажения заметны. Наконец, значения PSNR nt порядка 23 дБ и значения PSNR-HVS-M порядка 27 дБ свидетельствуют о весьма низком качестве изображений. APHVS больше 1 дБ говорит о заметном на взгляд улучшении визуального качества, а меньше - 1 дБ - о заметном ухудшении. Учитывая сказанное выше, рассмотрим результаты в табл. 2-4. При QS=2a и P2a < 0,5 (табл. 2) искажения вследствие сжатия с потерями весьма малы и практически незаметны в связи с высоким качеством исходных изображений. При P2a > 0,5 качество изображений при сжатии не улучшается, но и ухудшения практически незаметны. Следовательно, QS=2a можно использовать практически в любой ситуации без существенной потери качества. Другой вопрос - какой КС при этом будет обеспечен?
При QS=3,5a и P2a ~ 0,3 (табл. 3) внесенные искажения незаметны, поскольку высоко качество исходных изображений (невысок уровень помех или высоки маскирующие свойства текстуры). При P2a ~ 0,5 искажения вследствие сжатия с потерями могут быть заметны, но они невелики. Более сложная ситуация имеет место, если P2a ~ 0,7 - качество исходных изображений невысоко, а сжатие может их заметно ухудшить. В таких ситуациях имеет смысл использовать меньшее значение ШК, например, QS=2a. Наконец, при P2a ~ 0,9, очевидно, имеет смысл сжимать изображение с QS=3,5a или, возможно, даже несколько большими значениями ШК.
При QS=5a и P2a ~ 0,3 (табл. 4) внесенные потери «не страшны», поскольку они визуально незаметны. Гораздо хуже ситуация, если P2a ~ 0,5 - внесенные искажения заметны и достаточно велики. Применение QS=5a представляется нецелесообразным - желательно использовать меньшее значение ШК. Аналогична ситуация имеет место при P2a ~ 0,7. И лишь при P2a ~ 0,9 качество сжатого изображения практически не хуже, чем исходного.
Image а2 0,25 1 4 25 100 225 400 900
P 2о 0,08 0,17 0,3 0,54 0,71 0,79 0,84 0,89
P 2,7о 0,89 0,78 0,62 0,35 0,19 0,12 0,08 0,04
QS = 2о
QS 1 2 4 10 20 30 40 60
CR 1,35 1,63 2,02 2,83 3,71 4,29 4,71 5,27
ДPSNR -0,99 -1,39 -1,25 -1,04 -0,77 -0,60 -0,45 -0,27
ДPHVS -1,09 -1,80 -1,75 -1,64 -1,39 -1,11 -1,00 -0,76
QS = 3,5 о
Baboon QS 1,75 3,5 7 17,5 35 52,5 70 105
CR 1,57 1,94 2,52 3,86 5,69 7,29 8,76 11,67
ДPSNR -3,04 -3,01 -2,88 -2,21 -1,05 -0,04 0,8 2,18
ДPHVS -3,43 -4,04 -4,21 -3,92 -3,03 -2,23 -1,67 -0,58
QS = 5 о
QS 2,5 5 10 25 50 75 100 150
CR 1,74 2,21 2,98 5,09 9,1 14,11 20,1 36,4
ДPSNR -4,53 -4,7 -4,48 -3,24 -1,41 0,06 1,3 3,19
ДPHVS -5,22 -6,55 -6,85 -5,98 -4,56 -3,41 -2,46 -0,98
P 2о 0,18 0,3 0,45 0,66 0,78 0,84 0,87 0,91
P 2,7о 0,77 0,63 0,46 0,25 0,14 0,09 0,06 0,04
QS = 2 о
QS 1 2 4 10 20 30 40 60
CR 1,48 1,81 2,27 3,19 4,08 4,62 5 5,55
ДPSNR -0,99 -1,35 -1,11 -0,81 -0,56 -0,39 -0,26 -0,04
ДPHVS -1,09 -1,87 -1,62 -1,39 -1,17 -1 -0,86 -0,65
QS = 3,5 о
Aerial QS 1,75 3,5 7 17,5 35 52,5 70 105
CR 1,74 2,2 2,92 4,54 6,72 8,56 10,32 14,22
ДPSNR -2,97 -2,79 -2,43 -1,38 0,06 1,2 2,01 3,41
ДPHVS -3,77 -3,8 -3,93 -3,39 -2,61 -1,95 -1,45 -0,61
QS = 5 о
QS 2,5 5 10 25 50 75 100 150
CR 1,96 2,55 3,55 6,42 11,87 18,15 25,56 43,39
ДPSNR -4,4 -4,3 -3,69 -1,96 0,21 1,72 2,82 4,4
ДPHVS -5,64 -6,09 -6,2 -5,26 -3,99 -3,01 -2,23 -1,17
P 2о 0,24 0,43 0,63 0,81 0,89 0,91 0,93 0,94
P 2,7о 0,68 0,46 0,26 0,11 0,05 0,03 0,02 0,01
QS = 2о
QS 1 2 4 10 20 30 40 60
CR 1,85 2,36 3,08 4,28 5,14 5,57 5,79 6,06
ДPSNR -0,97 -1,33 -1 -0,53 -0,25 -0,12 -0,06 0,04
ДPHVS -1,4 -1,88 -1,32 -0,74 -0,47 -0,38 -0,29 -0,19
QS = 3,5о
Frisco QS 1,75 3,5 7 17,5 35 52,5 70 105
CR 2,27 3,05 4,31 7,43 11,55 14,74 17,37 22,83
ДPSNR -2,98 -2,76 -1,95 0,41 2,43 3,67 4,61 6,05
ДPHVS -4,42 -3,86 -2,73 -0,57 0,81 1,54 2,21 3,21
QS = 5о
QS 2,5 5 10 25 50 75 100 150
CR 2,64 3,72 6,06 14,46 30,99 51,78 78,67 142,08
ДPSNR -4,41 -4,1 -2,59 0,51 3,41 5,28 6,77 8,98
1B ДPHVS -6,47 -5,64 -3,82 -1,16 0,56 1,55 RJ5 201 7. №95
Р 2а Описание ситуации дБ ДPSNR, дБ ИсхPSNR-HVS-M, дБ ДPHVS, дБ
0,3 Средняя/высокая сложность Шум низкой интенсивности >45 -1,2 >50 -1,7
0,5 Средняя/высокая сложность Шум средней интенсивности =38 -1,1 =42 -1,7
0,7 Средняя/низкая сложность Шум средней интенсивности =30 -0,7 =33 -1,3
0,9 Низкая сложность Шум высокой интенсивности =23 -0,2 =27 -0,6
Таблица 3. Данные для QS=3,5а
Р 2а Описание ситуации PSNRnt, дБ ДPSNR, дБ ИсхPSNR-HVS-M, дБ ДPHVS, дБ
0,3 Средняя/высокая сложность Шум низкой интенсивности >45 -2,9 >50 -4,0
0,5 Средняя/высокая сложность Шум средней интенсивности =38 -2,5 =42 -3,8
0,7 Средняя/низкая сложность Шум средней интенсивности =30 -1,5 =33 -3,1
0,9 Низкая сложность Шум высокой интенсивности =23 +4,0 =27 0
Таблица 4. Данные для QS=5а
Р 2а Описание ситуации PSNRnt, дБ ДPSNR, дБ ИсхPSNR-HVS-M, дБ ДPHVS, дБ
0,3 Средняя/высокая сложность Шум низкой интенсивности >45 -4,4 >50 -6,5
0,5 Средняя/высокая сложность Шум средней интенсивности =38 -3,6 =42 -5,9
0,7 Средняя/низкая сложность Шум средней интенсивности =30 -1,8 =33 -4,5
0,9 Низкая сложность Шум высокой интенсивности =23 +3,6 =27 -0,2
Таким образом, можно систематизировать результаты анализа в виде некоторой системы правил (инженерных рекомендаций). Если Р2а < 0,4, то вполне можно использовать QS=3,5а, обеспечивая незаметность внесенных искажений и достаточно большие значения КС (за исключением изображений со сложной структурой и низких уровней помех). Если 0,4 < Р2о < 0,8, то имеет смысл использовать QS=2а, обеспечивая практическую незаметность внесенных искажений. Наконец, при Р2о > 0,8 становится целесообразным выполнять сжатие в окрестности ОРТ, т.е. использовать QS=4а. 3. Прогнозирование параметров сжатия Методика получения зависимостей для прогнозирования описана в ряде работ [11, 12]. Она заключается в получении скаттерограммы искомого параметра сжатия от входного параметра (в данном случае от Р2о). Для получения скаттерограммы бе-
рут большое количество тестовых изображений, добавляют к ним шум с известной дисперсией и сжимают с заданным параметром (QS=2o для случая, показанного на рис. 2). Каждая точка скатте-рограммы представляет собой результат обработки одного тестового изображения с шумом заданной интенсивности, где по вертикали откладывается выходной (прогнозируемый) параметр (АР8КЯ на рис. 2), а по горизонтальной оси - входной параметр. Затем применяется регрессия данных, где для случая на рис. 2 использован полином пятой степени. Качество регрессии (вписывания кривой) можно характеризовать разными количественными критериями. Одним из основных является Я2 [16]. Если его значение близко к единице (0,957 для рассматриваемого примера), то это одновременно говорит как о хорошем вписывании, так и о высокой точности прогнозирования на основе вписыва-
К!, 2017, №1
19
ния (выполняемого предварительно). На практике аппроксимирующая зависимость (уравнение вписанной кривой) заранее известна и само прогнозирование осуществляется следующим образом. Для изображения, которое предполагается сжимать с заданным ШК, рассчитывают входной параметр (Р2а), подставляют его в формулу кривой как аргумент и получают прогнозируемое значение. Естественно, что оно отличается от того значения, которое будет получено для конкретного изображения, но эти отличия невелики (см. данные на рис. 2, СКО ошибок прогнозирования - порядка 0,1 дБ). Результаты на рис. 2 подтверждают выводы, сделанные ранее на основе анализа данных в табл. 2.
1 у — 46.- 111 1х* - |(К1 Ч» 1 - 37. 22жа + 4.77я - 11*1
Б5Б:1Г03
0 5 и — $Ч11йг(: /
Л|(|пМ|>|] И 'Ц11.11 с II V " I/ „ НИКЫ С. 107 */
0.1 0.2 0.3 0.-1 0.5 0.6 0.7 03 у» Я> 1 [ ♦ Р2п
, * -- ♦ ч ♦ ♦♦♦♦♦♦ +
Рис. 2. Скаттерограмма и результат регрессии, QS=2а
Учитывая, что двумерное ДКП в блоках размером 8х8 пикселей выполняется очень быстро, а количество блоков, в которых необходимо выполнять обработку для оценки Р2а, невелико, то получение прогноза АPSNR выполняется очень быстро. Аналогично быстро можно оценить и КС [12]. Один из возможных вариантов иллюстрируется рис. 3, хотя есть и другие, более точные подходы к прогнозированию. Данные на рис. 3 хорошо согласуются с данными в табл. 1. В частности, при Р2а порядка 0,5 значения КС при QS=3.5a немного превышают 3, что хорошо совпадает со значением, предсказываемым по вписанной кривой.
Рис. 3. Скаттерограмма и результат регрессии, QS=3.5c
Приведенная на рис. 3 скаттерограмма и результат вписывания показывают, что результаты прогнозирования КС можно анализировать одновременно с результатами прогнозирования АPSNR и АРНУ^. Представим, что первоочередной задачей является обеспечение приемлемого визуального качества сжатого изображения. Тогда для ШК, выбранного в соответствии с рекомендациями в разделе 2, можно определить КС и проверить, удовлетворяет ли он ограничениям, если таковые имеются. Если не удовлетворяет, то необходимо увеличивать ШК, что приведет к большим искажениям. Пример сжатия изображений с шумом с потерями приведен на рис. 4.
Рис. 4. Изображение Airfield с шумом (а) и результат его сжатия с QS=3.5c, о=10 (б)
Выводы
Результаты, приведенные выше, свидетельствуют о следующем. При наличии аддитивных помех сжатие с потерями имеет особенности, заключающиеся как в наличии эффекта специфической фильтрации, так и в особенностях используемых метрик и их поведении. В частности, возможно наличие ОРТ. Анализ полученных данных указывает на то, что основные параметры, характеризующие эффективность сжатия с потерями, можно прогнозировать. Это позволяет выбирать параметры сжатия для каждого конкретного изображения. Некоторые из эмпирических правил уже сформулированы. Дальнейшие исследования позволят их уточнить.
Лггература: 1. Blanes I., Magli E., Serra-Sagrista J. A Tutorial on Image Compression for Optical Space Imaging Systems // IEEE Geoscience and Remote Sensing Magazine. 2014. Vol 2(3). P. 8-26. 2. Taubman D., Marcel-lin M.JPEG2000 Image Compression Fundamentals, Standards and Practice. Springer, Boston: Kluwer, 2002. 777 p. 3. Lee J.-S., Pottier E. Polarimetric Radar Imaging: From Basics to Aplications. CRC Press, 2009. 422 p. 4. Marques R., Medeiros F. Ushizima D. Target Detection in SAR Images Based on a Level Set Approach // IEEE Trans. on Systems, Man and Cybernetics. 2009. Vol. 39(2). P. 214222. 5. Kussul N., Lemoine G., Gallego F. J., Skakun S. V., Lavreniuk M., Shelestov A. Y. Parcel-Based Crop Classification in Ukraine Using Landsat-8 Data and Sentinel-1A Data // IEEE J. of Select. Topics in Appl. Earth Observ. and Rem. Sens. 2016. Vol. 9(6). P. 2500-2508. 6. Al-Chaykh O.K., Mersereau R.M. Lossy compression of noisy images // IEEE Transactions on Image Processing. 1998, Vol. 7(12). P. 1641-1652. 7. Zemliachenko A.N., Kozhemiakin R.A., Uss M.L., Abramov S.K., Ponomarenko N.N., Lukin V.V., Vozel B., Chehdi K. Lossy compression of hyperspec-tral images based on noise parameters estimation and variance stabilizing transform // Journal of Applied Remote Sensing. 2014. Vol 8 (1). 25 p. 8. Ponomarenko N., Lukin V., Zriakhov M., Egiazarian K. Lossy compression of images with additive noise / Proceedings of International Conference on Advanced Concepts for Intelligent Vision Systems, Antwerpen, Belgium, 2005. P. 381-386. 9. Ponomarenko N., Krivenko S., Lukin V., Egiazarian K., Astola J. Lossy Compression of Noisy Images Based on Visual Quality: a Comprehensive Study // EURASIP Journal on Advances in Signal Processing, 2010. Article ID 976436. 13 p. 10. UssM.L., Vozel B., Lukin V., Chehdi K. Image Informative Maps for Component-wise Estimating Parameters of Signal-Dependent Noise // Journal of Electronic Imaging, 2013. Vol. 22(1). Doi:10.1117/1.JEI.22.1.013019. 11. Zemliachenko A., Abramov S., Lukin V., Vozel B., Chehdi K. Lossy Compression of Noisy Remote Sensing Images with Prediction of Optimal Operation Point Existence and Parameters // SPIE Journal on Advances in Remote Sensing, 2015. Vol. 9(1). 26 p. 12. Zemliachenko A., Kozhemiakin R., Vozel B., Lukin V. Prediction of Compression Ratio in Los-
sy Compression of Noisy Images / Proceedings of TCSET 2016, February, 2016, Lviv-Slavske, Ukraine. P. 693-697. 13. Ponomarenko N.N., Lukin V.V., Egiazarian K., Astola J. DCT Based High Quality Image Compression / Proceedings of 14th Scandinavian Conference on Image Analysis, Joensuu, Finland, June, 2005. P. 1177-1185. 14. Ponomarenko N., Silvestri F., Egiazarian K., Carli M., Astola J., Lukin V. On between-coefficient contrast masking of DCT basis functions / CD-ROM Proceedings of VPQM, USA, 2007. 4 p. 15. Lukin V., Ponomarenko N., Egiazarian K., Astola J. Analysis of HVS-Metrics' Properties Using Color Image Database TID2013 / Proceedings of ACIVS, October 2015, Italy. P. 613-624. 16. Cameron C., Windmeijer A., Frank A.G., Gramajo H., Cane D.E., Khosla C. An R-squared measure of goodness of fit for some common nonlinear regression models // Journal of Econometrics, 1997. Vol. 77(2). 16 p.
Поступила в редколлегию 10.03.2017 Рецензент: д-р техн. наук, проф. Баранник В.В.
Земляченко Александр Николаевич, канд. техн. наук, ассистент кафедры приема, передачи и обработки сигналов, Национальный аэрокосмический университет им. М.Е. Жуковского "Харьковский авиационный институт". Научные интересы: сжатие изображений. Адрес: ул. Чкалова, 17, Харьков, 61070, Украина. E-mail: [email protected]
Абрамов Сергей Клавдиевич, канд. техн. наук, доцент, доцент кафедры приема, передачи и обработки сигналов, Национальный аэрокосмический университет им. М.Е. Жуковского "Харьковский авиационный институт". Научные интересы: цифровая обработка сигналов и изображений. Адрес: ул. Чкалова, 17, Харьков, 61070, Украина. E-mail: [email protected] Лукин Владимир Васильевич, докт. техн. наук, профессор, зав. кафедрой приема, передачи и обработки сигналов, Национальный аэрокосмический университет им. М.Е. Жуковского "Харьковский авиационный институт". Научные интересы: цифровая обработка сигналов и изображений. Адрес: ул. Чкалова, 17, Харьков, 61070, Украина. E-mail: [email protected]
Zemlyachenko Alexander, candidate of science, lecturer, Transmitters, receivers and signal processing dept., National aerospace university. Scientific aria: image compression. Ukraine, Kharkov. alex818r@mail. ru
Abramov Sergey, candidate of science, associate professor, Transmitters, receivers and signal processing dept., National aerospace university. Scientific aria: image and signal processing. Ukraine, Kharkov. [email protected] Lukin Vladimir, doctor of science, professor, head of Transmitters, receivers and signal processing dept., National aerospace university. Scientific aria: image and signal processing. Ukraine, Kharkov. [email protected]