№ 4 (28) 2010
Д. В. Сидоров
Модификация алгоритма 881М1
В статье рассмотрен алгоритм оценки качества изображений SSIM, считающийся одним из лучших. Предложена модификация алгоритма, позволяющая повысить достоверность оценок. Приведены результаты сравнительного тестирования классического и модифицированного алгоритмов на наборе изображений TID20082.
При разработке и тестировании цифровых алгоритмов и систем обработки изображений весьма актуальной является задача оценки качества изображений [1, 2]. Известно, что самым надежным способом оценки качества изображений является экспертный подход, но его применение требует большого количества людей и времени. Эффективным решением указанных проблем является разработка и применение математических алгоритмов, дающих максимально приближенную к экспертному подходу оценку качества изображений [1- 4].
На сегодняшний день существует большое количество алгоритмов оценки качества изображений. Одни из них, например PSNR, MSE и MSAD, являются быстродействующими, но обладают плохой достоверностью (плохо коррелируют с экспертной оценкой) [1]. Другие алгоритмы, такие как CW-SSIM, WSSIM и MS-SSIM, показывают высокую достоверность, но сложны в программной реализации и работают медленно [4,5]. Также существует ряд алгоритмов,
1 Разработка алгоритма оценки качества поддерживается по программе «Участник молодежного научно-инновационного конкурса» («У. М. Н. И. К.») Фондом содействия развитию малых форм предприятий в научно-технической сфере.
2 ТЮ2008 — это набор, состоящий из 1700 специально отобранных и сгенерированных изображений, позволяющий при тестировании на нем различных метрик качества изображения определять наличие корреляции и коэффициенты корреляции между значениями метрики и численной оценкой человеческого восприятия качества изображений.
которые обладают хорошим соотношением скорость/достоверность [4]. Одним из таких алгоритмов является SSIM [3].
Алгоритм 881М
Согласно [3], алгоритм SSIM сводится к определению степени сходства соответствующих квадратных участков (окон) сравниваемых изображений по трем составляющим:
21х I у + С1 .
яркость L( х, у) =
|4 + I У + С1'
контраст С(х, у) =
2д х о у + С2
о2 + о У + С2'
структура Б( х, у) =
0 х,у + С3 0 х 0 у + С3 ,
где х — матрица отсчетов оригинального изображения, у — матрица отсчетов оце-
1 м
ниваемого изображения, |х =—Хюх — среднее значение для участка оригинального изображения размером М пикселей,
1 м
°х = м Xю/(х х )2 — стандартное откло-
м /=1
нение участка оригинального изображения,
1м
0х,у = мXю/(х/ )(у> -1у) — корреляционный момент, м = {ю/ I / = 1, 2,..., м} — коэффициенты гауссового симметричного нормализованного относительно 1,0 фильтра с ст =1,5; К, = 0,01; К2 = 0,03; Я = 255;
123
№ 4 (28) 2010
»5
I
Г
а
и §
С = (К Я)2; С3 = С2/2; — выравнивающие коэффициенты.
Значение вв/М для данного окна определяется следующим образом:
вв/М(х, у) = [Ц х, у)]а [С( х, у )]в [в( х, у)]х,
где а, р, 1 — весовые степени, показывающие вклад каждой из составляющих Ц, С и в в оценку.
Конечное значение вв/М для всего изображения вычисляется как среднее значение показателей вв/М всех участков, полученных в результате пошагового движения квадратного окна вдоль изображения:
1 Н
Мвв/М = вв/М( х, у),
где N — количество окон, покрывающих изображение.
Согласно [3], в алгоритме рекомендуется использовать следующие параметры:
• скользящее окно размером 11x11 (М = 121) пикселей для того, чтобы учитывать искажения, вызванные сильным JPEG-сжатием;
• значения а = р = 1 = 1,0;
• шаг скользящего окна — 1 пиксель.
Автор алгоритма в работе [3] указывает на
то, что значения параметров а, р, 1 являются неоптимальными и при соответствующем исследовании можно подобрать их значения таким образом, чтобы алгоритм давал более достоверные результаты. Поэтому в рамках данной работы был поставлен компьютерный эксперимент по подбору оптимальых параметров.
Компьютерный эксперимент
Цель эксперимента — поиск значений коэффициентов а, р и 1, позволяющих повысить достоверность оценок.
Исходные данные для эксперимента:
• набор изображений ТЮ2008, состоящий из 1700 изображений с различными видами помех [6];
• экспертные оценки для набора ТЮ2008 (предоставленные совместно с набором), являющиеся усредненным результатом 838 экспериментов, проведенных в различных странах Европы;
• реализованный автором согласно [3] алгоритм SSIM на языке Си [7];
• методы проверки достоверности результатов — методы ранговой корреляции Спирмена и Кендалла, рекомендованные в [6, 8];
• диапазон поиска значений коэффициентов согласно [3, 4] ае (0,1], Ре (0,1] и X е (0,1];
• шаг поиска значений коэффициентов 0,001 (принят автором).
Ввиду того, что поведение и вид функции в/ММ(х, у) неизвестен, и достаточно сложно сказать, какой из методов поиска решений будет наилучшим, автором было принято решение использовать метод последовательного приближения со следующими тремя шагами приближения [0,1; 0,01; 0,001].
Из полученных в ходе эксперимента данных было отобрано два набора результатов, первый — по максимальному значению коэффициента Спирмена, второй — по максимальному значению коэффициента Кен-далла. Полученные наборы были объединены и сведены в таблицу 1. Повторяющиеся результаты были отброшены.
Из приведенных в таблице 1 результатов а = 0,61; р = 0,077; 1 = 0,241 является лучшим. Полученные в ходе эксперимента значения коэффициентов были включены в алгоритм SSIM. В таблице 2 приведены значения коэффициентов Спирмена и Кендалла для модифицированного и классического алгоритмов SSIM. Также приведены результаты тестирования алгоритмов MSAD, MSE и PSNR [4, 9], полученные с использованием программного средства для оценки качества изображений IMQ [7].
124
№ 4 (28) 2010
Таблица 1 §
Результаты эксперимента по поиску коэффициентов a, b, l ч
Шаг Макс. значение коэфф. Спирмена Макс. значение коэфф. Кендалла
0,1 0,1 0,1 0,3 0,7268 0,5282
0,01 0,06 0,08 0,25 0,7280 0,5290
0,01 0,08 0,08 0,25 0,7277 0,5291
0,001 0,061 0,077 0,241 0,7282 0,5291
Таблица 2
Значения коэффициентов корреляции для модифицированного и классического алгоритмов SSIM, PSNR, MSE и MSAD
Алгоритм (метрика) Коэффициент Спирмена Коэффициент Кендалла
Модификация SSIM 0,7282 0,5291
Классический SSIM 0,6891 0,4930
PSNR 0,5529 0,4022
MSE 0,5529 0,4022
MSAD 0,3509 0,2557
Согласно таблице 2, модифицированный алгоритм SSIM дает прирост в достоверности оценки (относительно классического) по Спирмену на 5,6%, по Кендаллу на 7,3%.
Список литературы
1. Ватолин Д. Программный продукт оценки качества восстановленного изображения MSU Quality Measure [Электронный ресурс]. — Режим доступа: http://compression.ru/video/quality_measure/ index.html. — 7.03.2010.
2. Ватолин Д., Ратушняк А., Смирнов М, Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. — М: ДИАЛОГ-МИФИ, 2002, с. 31-35, 306-311, 321-332.
3. Wang Z. Image quality assessment: from error visibility to structural similarity. — IEEE transactions on image processing, vol. 3, 2004, p. 600-612.
4. WangZ., BovikA. C. Modern image quality assessment. — N. Y.: Morgan&Claypool, 2006. — 157 p.
5. Сидоров Д. В., Осокин А. Н., Марков Н. Г. Оценка качества изображений с использованием вейвлетов // Известия Томского политехнического университета, 2099 — т. 315, — № 5. — 104-107.
6. Пономаренко Н. Tampere image database 2008 TID2008, version 1.0 [Электронные ресурс]. — Режим доступа: http://www.ponomarenko.info/ tid2008.htm. — 08.08.2009.
7. Сидоров Д. В. Тестирование метрик [Электронный ресурс]. — Режим доступа: http://www.imq.tomsknet.ru/test.html. — 21.02.2010.
8. Шеломовский В. В. Электронный учебник по дисциплине «Математическая статистика» [Электронный ресурс]. — Режим доступа: http://www.exponenta.ru/educat/systemat/ shelomovsky/lab/lab10.asp. — 12.12.2009.
9. Javed O., Khan S, Shan M. Image Quality Measures [Электронные ресурс]. — Режим доступа: http://www.cs.ucf.edu/vision/public_html/projects/ ImageQuality/presentation/. — 24.06.2010.