Научная статья на тему 'Сравнительный анализ безэталонных мер оценки качества цифровых изображений'

Сравнительный анализ безэталонных мер оценки качества цифровых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
864
163
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНКА КАЧЕСТВА ИЗОБРАЖЕНИЯ / NR-МЕРА / ГАММА-КОРРЕКЦИЯ / КОНТРАСТ / ОТРЕТУШИРОВАННОЕ ИЗОБРАЖЕНИЕ / ФОКУСНОЕ РАССТОЯНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Старовойтов В.В., Старовойтов Ф.В.

В статье описываются результаты сравнительного анализа 34 функций, опубликованных в научной литературе и использующихся для оценки качества изображений при отсутствии эталона. В англоязычной литературе они называются no-reference (NR) measure или мерами NR-типа. Первая статья, использующая термин no-reference, была опубликована в 2000 году и ежегодно растет число публикаций о новых мерах NR-типа. Тем не менее, сравнительных исследований таких мер практически не проводилось. Наличие NR-мер очень актуально для, а) оценки качества сделанных фотографий, б) оценки результатов преобразований, ориентированных на улучшение изображений, и выбор параметров этих преобразований (яркостные изменения, сжатие динамического диапазона яркости, преобразование цветного в полутон и другие). Базы тестовых изображений, используемые для исследования без эталонных мер качества (TID2013 и другие), содержат по 4, 5 вариантов изображений определенного типа искажений параметры которых не описаны. Поэтому разработано шесть типов экспериментов с целью анализа корреляции вычисляемых количественных оценок с визуальными оценками качества тестируемых изображений. Четыре из них являются принципиально новыми: сравнение изображений после гамма-коррекции и изменения контраста с разными параметрами, а также сравнение отретушированных изображений и фотографий, сделанных с разным фокусным расстоянием. Экспериментально показано, что ни одна из исследуемых мер оценки качества изображения не является универсальной, а вычисленная оценка не может быть преобразована в качественную шкалу без учета факторов, влияющих на искажение качества изображения. Большинство исследованных мер вычисляет локальные оценки в малых окрестностях, а их среднее арифметическое является оценкой качества всего изображения. Если на изображении доминируют большие области однородной яркости, меры такого типа могут дать неверные оценки качества, не совпадающие с визуальными оценками.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Comparative analysis of no-reference quality measures for digital images

This paper presents results of a comparative analysis of 34 measures published in the scientific literature and used for evaluation of the image quality without a reference image. In English literature, they are called no-reference (NR) measure or measures NR-type. The first article, the term no-reference, was published in 2000 and each year a growing number of publications on new measures NR-type. However, comparative studies of such measures is not practically conducted. Such measures are very important for a) just made photo quality evaluation, b) assessment of image enhancement transformations and selection of their parameters (such as contrast and brightness adjustments, tone-mapping, decolorization and others). Publicly available image quality databases used for study no-reference quality measures (TID2013, etc.), contain 4-5 variants of images distorted by predefined transformations with unknown parameters. We presented six types of experiments to analyze correlation of the computed numerical quality values with visual estimates of the test images quality. Four of the experiments are new: comparison of images after gamma-correction and contrast enhancement with different parameters, as well as analysis of the retouched images and photos taken with different focal length. It was shown experimentally that no one of the known no-reference quality assessment measure is universal, and the calculated value cannot be converted to a quality scale, excluding factors influencing the distortion of the image. Most of the studied measures calculates local estimates in small neighborhoods, and their arithmetic mean is the quality index of the image. If the image contains large areas of uniform brightness, the measures of this type can give incorrect quality assessment, which will not correlate with the visual assessments.

Текст научной работы на тему «Сравнительный анализ безэталонных мер оценки качества цифровых изображений»

УДК 004; 004.93

В. В. СТАРОВОЙТОВ, Ф. В. СТАРОВОЙТОВ

СРАВНИТЕЛЬНЫЙ АНАЛИЗ БЕЗЭТАЛОННЫХ МЕР ОЦЕНКИ КАЧЕСТВА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ

Объединенный институт проблем информатики НАН Беларуси

В статье описываются результаты сравнительного анализа 34 функций, опубликованных в научной литературе и использующихся для оценки качества изображений при отсутствии эталона. В англоязычной литературе они называются no-reference (NR) measure или мерами NR-типа. Первая статья, использующая термин no-reference, была опубликована в 2000 году и ежегодно растет число публикаций о новых мерах NR-типа. Тем не менее сравнительных исследований таких мер практически не проводилось. Наличие NR-мер очень актуально для, а) оценки качества сделанных фотографий, б) оценки результатов преобразований, ориентированных на улучшение изображений, и выбор параметров этих преобразований (яркостные изменения, сжатие динамического диапазона яркости, преобразование цветного в полутон и другие). Базы тестовых изображений, используемые для исследования без эталонных мер качества (TID2013 и другие), содержат по 4, 5 вариантов изображений определенного типа искажений параметры которых не описаны. Поэтому разработано шесть типов экспериментов с целью анализа корреляции вычисляемых количественных оценок с визуальными оценками качества тестируемых изображений. Четыре из них являются принципиально новыми: сравнение изображений после гамма-коррекции и изменения контраста с разными параметрами, а также сравнение отретушированных изображений и фотографий, сделанных с разным фокусным расстоянием. Экспериментально показано, что ни одна из исследуемых мер оценки качества изображения не является универсальной, а вычисленная оценка не может быть преобразована в качественную шкалу без учета факторов, влияющих на искажение качества изображения. Большинство исследованных мер вычисляет локальные оценки в малых окрестностях, а их среднее арифметическое является оценкой качества всего изображения. Если на изображении доминируют большие области однородной яркости, меры такого типа могут дать неверные оценки качества, не совпадающие с визуальными оценками.

Ключевые слова: оценка качества изображения, NR-мера, гамма-коррекция, контраст, отретушированное изображение, фокусное расстояние.

Введение

Рассматривая два изображения, человек может сделать вывод, что одно лучше другого или они примерно одинаковые. Он может про ранжировать 3-5 изображений, визуально оценив их качество, например, по пятибальной шкале: очень низкое, низкое, среднее, выше среднего, высокое. Если требуется визуально оценить качество десятков или сотен изображений, это сделать труднее, а проранжировать их по уровню их качества практически невозможно.

Функции, вычисляющие количественные оценки различий двух сигналов известны давно. Наиболее популярные из них коэффициент корреляции, среднеквадратичное отклонение и т. п. Цифровое изображение - это двумерный

сигнал. Сходство или различие цифровых изображений также можно оценить подобными функциями, но они не учитывают корреляцию между соседними строками и столбцами. Это привело к появлению множества мер сравнения двух изображений. Как правило, одно изображение считается эталонным, а второе преобразованным, например, восстановленным после сжатия. Мера дает оценку близости второго изображения к первому. Множество подобных мер и методика их построения подробно описаны в монографии [1]. Такие меры относятся к классу мер сравнения с эталоном, а в англоязычной литературе они называются full-reference (FR) measure. На практике эталонное изображение имеется не всегда. Например, изображение только что зафиксировано или преобразовано с целью улучшения его визу-

ального восприятия. В таких случаях (при отсутствии эталона) для оценки качества цифровых изображений применяют так называемую безэталонную меру или no-reference (NR) measure. Будем их называть мерами NR-типа.

Следует отметить, что функции рассматриваемого типа не являются метриками (как часто пишут в литературе), т. к. не может быть вычислена величина «расстояния» между двумя объектами (в данном случае изображениями) ввиду наличия только одного объекта.

Первая статья, использующая термин no-reference, была опубликована в 2000 году [2], c тех отмечается нелинейный рост публикаций на данную тему (см. обзоры [3-6]). Поскольку сравнительных исследований мер исследуемого типа практически не было, целью настоящей работы является сравнительный анализ большого множества безэталонных мер качества цифровых изображений, исследование корреляции полученных количественных оценок с визуальными оценками качества тестируемых изображений.

Качество изображения - это субъективное понятие. Выразить одним числом все возможные аспекты субъективного понятия качества достаточно сложно. Перечислим основные типы искажений, которые влияют на качество цифрового изображения, формируемого оптической системой:

• освещенность снимаемой сцены,

• контрастность снимаемой сцены,

• смаз изображения в результате движения камеры или объекта съемки,

• глубина резкости,

• способ квантования зарегистрированного сигнала,

• метод и степень сжатия изображения при записи в файл.

Следует также отметить, что некорректно сравнивать количественные оценки качества изображений, искаженных разными типами преобразований, например, размытое изображение с малоконтрастным. В таких случаях можно лишь делить изображения на два класса: «хорошие» и «плохие». Границы этих классов должен устанавливать эксперт в определённой прикладной области, например, криминалистике.

Под сценой будем понимать все, что попадает в кадр фотокамеры. Искажения, вносимые

алгоритмами квантования и сжатия, в данной работе не рассматриваются. Недостаточная глубина резкости также может влиять на качество изображения из-за размытия деталей второго плана. Таким образом, среди анализируемых мер будем искать такие, оценки качества изображения которых совпадают с визуальными оценками наблюдателя при первых четырех типах искажений.

1. Исследуемые меры качества

В работе исследовались 34 меры, перечисленные ниже. Для экономии места формулы вычисления исследуемых мер не описываются, но приводятся ссылки на статьи, содержащие их подробное математическое описание.

В результате изучения литературы был сделал вывод, что многие меры, используемые для анализа автофокусировки оптических систем, также могут быть опробованы в качестве NR-мер оценки качества изображений. Хороший обзор таких мер представлен в работе [7]. Кратко опишем, на чем базируется вычисление исследуемых мер. Подавляющее большинство мер, исследуемых в данной работе, вычисляет локальные оценки в окрестности каждого пиксела, а затем вычисляет их среднее арифметическое в качестве финальной оценки.

Локальные оценки вычисляются в окрестности каждого пиксела, а затем суммируются. Запишем аббревиатуры исследуемых мер и опишем величины, вычисляемые в одной окрестности:

— BREN - квадрат разности яркости левого и правого соседей через один пиксел [7].

— CONT - сумма разностей яркости центрального пиксела и его соседей в окрестности [7].

— CURV - отношение яркости пиксела к средней яркости в окрестности [7].

— DCTE - сумма отношение квадратов коэффициентов AC и ВС после ДКП [7].

— CURV - Сумма модулей коэффициентов, определяющих квадратичную поверхность в окрестности пиксела [7].

— GDER - сумма квадратов после свертки гауссовых производных с окрестностью пиксела [7].

— GLLV - локальная дисперсия уровней яркости [7].

— GLVM - дисперсия поэлементной разности значений яркости изображения и его локально сглаженного варианта [7].

— GRAE - квадрат градиента Робертса [7].

— GRAT - модуль максимальной разности с ближайшим пикселом, превышающий порог

[7].

— GRAS - квадрат разности яркости соседних горизонтальных пикселов [7].

— HELM - отношение Хелмли яркости пиксела к усредненной по окрестности, причём в числителе находится большая из этих величин [7].

— LAPE - квадрат значений после свертки с лапласианом [7].

— LAPM - сумма модулей вторых производных по двум направлениям [7].

— LAPV - дисперсия после изображения свертки с лапласианом [7].

— LAPD - сумма модулей вторых производных по четырем направлениям [7].

— SFIL - максимум после свертки изображения с одномерным поворачивающимся фильтром Гаусса [7].

— SFRQ - квадратный корень из суммы квадратов разностей яркости горизонтального и вертикального соседних пикселов [7].

— TENG - Градиент Собела в квадрате [7].

— TENV - Дисперсия градиента Собела в квадрате [7].

— VOLA - горизонтальная автокорреляция изображения [7].

— WAVS - сумма трех вейвлет-коэффици-ентов первого уровня после преобразования изображения [7].

— FFT - среднее значение спектра Фурье в децибелах [7].

— Q - среднее от произведения первого собственного числа и коэффициента когерентности, вычисленных для матрицы градиентов изображения [7].

— S3 - на базе локального среднеквадрати-ческого отклонения яркости формируется карта локального контраста яркости, по ней вычисляется наклон блока в спектральной области, а затем карта локальной резкости [10].

— GABA - посредством псевдо-Вигнерова распределения данных о яркости изображения вычисляется пространственно-частотный индекс качества изображения [11].

— CHAN - локальные дисперсии яркости в окрестности пиксела [13].

— STDI - среднеквадратические отклонения яркости в окрестности пиксела [13].

Глобальные меры вычисляются для всего изображения и базируются на статистических оценках изображения целиком:

— ACMO - абсолютный центральный момент значений яркости изображения [7].

— GLVA - глобальная дисперсия уровней яркости изображения [7].

— GLVN - отношение глобальной дисперсии к глобальному среднему яркости [7].

— HISE - энтропия яркости [7].

— HISR - диапазон значений яркости [7].

— WAVV - сумма дисперсий трех вейвлет-коэффициентов первого уровня после преобразования изображения [7].

— WAVR - отношение среднего от суммы квадратов трех вейвлет-коэффициентов третьего уровня к среднему от суммы восстановленных вейвлет-коэффициентов [7].

— CRET - изображение размывается горизонтально и вертикально, вычисляются разности яркости соседних пикселов исходного и размытого изображения, мера определяет величину максимального суммарного размытия по горизонтали или вертикали относительно исходного изображения [8].

— KURT - коэффициент эксцесса распределения яркости изображения.

2. Экспериментальные исследования

Экспериментальные исследования выполнялись на двух группах изображений. Первая -это 17 стандартных тестовых изображений из базы [14]. Вторая включала отобранные в сети интернет 14 цифровых фотографий пяти разных сцен, полученных с разным фокусным расстоянием (для анализа качества изображений одной сцены с разной четкостью ее элементов), а также 7 пар изображений типа фотография и её улучшенная разными редакторами (например, [15]) копия с устранёнными морщинами, прыщами, веснушками. Оценки вычислялись для полутоновых представлений изображений.

2.1. Оценка качества после гамма-коррекции изображений

Была выполнена оценка качества 17 вариантов каждого тестового изображения первой группы, полученных путем гамма-коррекции с параметром у, изменяющимся от 0.2 до 3.6

Рис. 1. Тестовое изображение bridge после гамма-коррекции яркости при гамма равном 0.25, 0.75, 1 (совпадает с исходным изображением), 1.25 и 3.3, соответственно

CONT the best quality image for Mean(measure)

12

Рис. 2. Пример меры, имеющей четкий пик для значения гамма = 0.9 (слева), справа - соответствующие ему изображение и гистограмма локальных оценок качества

Рис. 3. Варианты изменения контраста изображения (в центре - оригинальное)

с шагом 0.2 по формуле newIm(ij) = 255*(Im(ij)/ 255)у. Всего тестировалось 17x17 = 289 изображений (рис. 1).

Это преобразование формирует ряд изображений от светлого до темного с нелинейно изменяющейся яркостью. Наиболее качественные с визуальной точки зрения изображения находятся в середине ряда, значит графики значений мер качества для такого ряда должны иметь экстремумы в середине (см. рис. 2, справа). Ожидаемый тип графика наблюдался не у всех исследуемых мер.

2.2. Оценка качества после изменения контраста изображений

Было сформировано 7 вариантов каждого изображения первой группы с разными коэффициентами контраста k от 0.2 до 2.6 с шагом

0.2, яркость каждого пиксела (¡, у) изменялась согласно формуле newIm(i, у) = Р(1т^', у) -127.5) + 127.5 (рис. 3).

2.3. Оценка качества после линейного приращения яркости изображения

Для каждого изображения первой группы выполнялось преобразование яркости изображений типа newIm(i,у) = Ш^,у) + c, т. е. к значению яркости каждого пиксела (}, у) добавлялась константа c (с учетом ограничений диапазона [0-255]), принимающая значения от -100 до +100 с шагом 25 (см. рис. 7). Всего тестировалось 13x9 = 117 изображений (рис. 4).

2.4. Оценка качества после размытия

изображений

Для каждого изображения первой группы выполнялось размытие изображений стандарт-

Рис. 5. Изображение bridge, размытое фильтром Гаусса (слева - исходное изображение)

Рис. 6. Пример изображений, полученных фотографированием с фокусными расстояниями f5 и f32 (верхний ряд), f11 и f22 (нижний ряд)

ным фильтром Гаусса с изменением значения сигма от 1.0 до 4.0 с шагом 0.75 (см. рис. 5).

2.5. Оценка качества изображений с разной глубиной резкости Пары изображений второй группы, полученных фотографированием одной сцены с разными фокусными расстояниями (см. рис. 6).

Изображения f11 и f22 очень похожи, но получены с использованием разных фокусных расстояний (f11 и f22). Отличия слегка заметны в резкости деталей заднего плана. Подобно визуальным оценкам сравнительного качества этих изображений, оценки полученные исследуемыми мера разделились.

Рис. 7. Пример портрета и его улучшенной копии

2.6. Оценка качества отретушированных изображений

Исследовались 7 пар изображений (фотография и её отретушированная копия, см. рис. 7), т. е. копия априори должна быть более высокого качества. Тем не менее ни одна мера не подтвердила это количественно, вычислив более высокую оценку для второго изображения.

Заключение

В Таблице собраны результаты экспериментов шести типов, перечисленных выше. Четыре из них являются принципиально новыми для тестирования NR-мер предложены 4

Соответствие количественных оценок визуальным для нескольких вариантов тестов

№ мера № 1 № 2 № 3 № 4 № 5 № б время, sec

1 ACMO ----?- ?_____ 00000000 0.004S

2 BREN ?--+-+ --+— +???+? ++++++ +++++++ ++++-+-+ 0.020S

3 CONT ?--+-+ --+— ++??+- ++++++ +++++++ ++++-- -+ 1.б4б5

4 CURV ----?- +-+?++ ----?- -—+- --++— ++++-000 0.0173

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 GDER ?--+-+ --+— +???+? ++-+++ ++++++- +++- -+++ 0.0243

б GLVA +--+-+ --+— +???+- ++++++ ++++++- +++- -+++ 0.0029

7 GLLV ?--+-+ --+— +???+? ++++++ +++++-- ++++-+++ 0.0192

S GLVN --+— ++++++ ++++--+ +++- -+++ 0.0017

9 GRAE ??-?-- --+— --+— ++++++ +++++++ ++++-+-+ 0.012б

10 GRAT ?--+-+ --+— ++++++ +++++++ ++++-+-+ 0.0203

11 GRAS —+-+ --+— +???+? ++++++ +++++++ ++++-+-+ 0.00S9

12 HELM --+— —++- ++++++ ++++-++ ++++-- -+ 0.0224

13 HISE --+— -—+- --++— ++++-000 0.0017

14 LAPE ---+-+ --+— +???+? ++++++ +++++++ ++++-+-+ 0.0120

15 LAPM ---+-+ --+— +???+? ++++++ +++++++ ++++-- -+ 0.0293

1б LAPV ---+-+ --+— +???+? ++++++ +++++++ ++++-+-+ 0.004S

17 LAPD —+-+ --+— +???+? ++++++ +++++++ ++++-- -+ 0.0277

18 SFIL ?--+?+ --+— +???+? +---+? ++++++- +++--+0+ 0.0бб1

19 SFRQ ?--+-+ --+— +???+- ++++++ +++++++ ++++-- -+ 0.01S3

20 TENG ?--+-+ --+— +???+? ++++++ +++++++ ++++-+-+ 0.0152

21 TENV ---+-+ --+— +???+? ++++++ ++++++- ++++-+-+ 0.0077

22 VOLA ?--+?+ --+— +????- ++++++ +++++++ ++++-+-+ 0.0157

23 WAVS —+-+ --+— +???+? ++++++ +++++++ ++++-- -+ 0.0б4б

24 WAVV -----+ --+— ?-??+? ++++++ +++++++ ++++-- -+ 0.0393

25 WAVR —+-- --+— ++++++ +++++++ ++++-- -+ 0.0810

2б GLVM --+— +???+? ++++++ +++++++ ++++-+-+ 0.0151

27 HISR --+— ++++++ ++++++ ++--+-- +++-++-+ 0.0007

28 FFT —+-+ --+— +???+- ++++++ +++++++ ++++-+-+ 0.0307

29 CRET ---?+- +????- 0.023б

30 Q ?--+?+ --+— +?-?+- ?++++- +++++-+ +++- -+++ 0.495S

31 S3 ---?++ --+— -—++ ++++++ +++++++ ++++-- -+ 9.б81б

32 KURT ?--?+? --?--- +-++++ +++-++- +- -++-++ 0.02б1

33 CHAN --+— ++++++ +—++- +++- -+-+ 0.0700

34 STDI +--+-+ --+— +???+? ++++++ ++++++- +++- -+++ 0.0б00

новых типа экспериментов (№1-2, № 5-6). Если количественная оценка меры совпадала с визуальной, записан знак «+», в противном случае «-». Когда максимальное значение меры соответствовало пологому пику и было почти правильным, ставился знак «?». Ноль ставился, когда для всех вариантов изображений теста значения меры были равными.

В последнем столбце записано среднее время обработки изображения размером 512x512 пикселов на персональном Asus K501-UXDM-112. Характеристики компьютера: процессор Intel Core i7 6500U с тактовой частотой 2500 МГц, объём оперативной памяти 6 Гб, операционная система Windows 10. Программы выполнялись в среде Matlab R2016b.

В результате выполненных сравнительных исследований можно сделать следующие выводы:

1. Выполнено шесть типов экспериментов с целью анализа корреляции вычисляемых количественных оценок с визуальными оценками качества тестируемых изображений. Четыре из них являются принципиально новыми: сравнение изображений после гамма-коррекции и изменения контраста с разными параметрами, а также сравнение отретушированных изображений и фотографий, сделанных с разным фокусным рассеянием.

2. Тест №1 оказался довольно сложным: только 4 меры (SFIL, VOLA, Q, KURT) дали около половины правильных или близких к правильным ответам.

3. Практически все меры на тестовых изображениях показали плохой результат в тесте № 2, определяя изображение с максимальным коэффициентом контраста как наилучшее (визуально только изображение отпечатка пальца выглядит лучшим). В то же время на тестах № 4 (размытие) и № 5 (различная фокусная глубина) оценки практически всех мер совпали с визуальными оценками качества.

4. В целом самыми плохими оказались меры ACMO и HISE, плохо сработавшие на всех тестах. Мары GLVN, GRAE, HISE, WAVR, CHAN сработали хорошо только на самых простых тестах № 4 и № 5 и плохо на остальных. Мера HISR неудовлетворительно сработала на тестах № 1 и № 2, но лучше других на тесте № 3.

5. Интересная особенность проявилась у меры CURV. Это мера показала неверные результаты на всех тестах, кроме самого сложного теста № 2, где у неё было наибольшее количество верных оценок.

6. Широко цитируемая мера S3 (149 ссылок в scholar. google. com) вычисляется в среднем в 641 раз медленнее меры GLVM, но показывает сравнимые с ней оценки качества.

7. Все меры вычисляются быстро (менее 0.1 с на изображениях 512x512 пикселов), за исключением трёх: CONT (1.64c), Q (0.49 с) и S3 (9.68 с).

8. Корректность оценки сильно зависит не только от меры или типа теста, но и от тестируемого изображения. Так, в тесте № 1 для изображения «lena» гораздо больше мер

выдало верный ответ, чем для изображения «boat».

9. В среднем не полную, но удовлетворительную корреляцию с визуальными оценками качества показали следующие меры: BREN, CONT, GDER, GLVA, CLLV, SFRQ, TENG, VOLA, CLVM, Q, STDI (выделены жирным и курсивом в таблице).

Подавляющее большинство исследованных в работе мер вычисляет локальные оценки в малой окрестности каждого пиксела, а затем вычисляет для них среднее арифметическое в качестве финальной оценки. Если на изображении доминируют большие области однородной яркости, меры такого типа могут дать неверные оценки качества, не совпадающие с визуальными оценками. Кроме того, тест № 2 продемонстрировал, что для большинства мер наиболее качественным является максимально контрастный вариант изображения, т. е. практически черно-белый. Таким образом, все исследованные меры относятся к классу контекстно-независимых и не могут полностью совпадать с визуальной оценкой качества изображений.

Экспериментально показано, что ни одна, ни одна из тестируемых мер оценки качества изображения не является универсальной, а вычисленная оценка не может быть преобразована в качественную шкалу без учета факторов, влияющих на искажение качества изображения.

Следует разрабатывать меры качества, учитывающие контекст содержания и формирующие оценки, отличные от средней величины множества локальных оценок.

Литература

1. Старовойтов, В. В. Локальные геометрические методы цифровой обработки и анализа изображений. - Минск: Ин-т техн. кибернетики НАН Беларуси, 1997. Starovoitov, V. V. Lokal'nye geometricheskie metody cifrovoj obrabotki i analiza izobrazhenij. - Minsk: In-t tehn. kibernetiki NAN Belarusi, 1997.

2. Caviedes, J. et al. Impairment metrics for digital video and their role in objective quality assessment // Visual Communications and Image Processing, Perth, Australia, 30 May 2000. - P. 791-800.

3. Lin, W., Kuo, C. C. J. Perceptual visual quality metrics: A survey //Journal of Visual Communication and Image Representation, 2011. - Vol. 22. - №. 4. - P. 297-312.

4. Mittal, A., Moorthy, A. K., Bovik, A. C. No-reference image quality assessment in the spatial domain // IEEE Transactions on Image Processing. - 2012. - Vol. 21. - №. 12. - P. 4695-4708.

5. Chandler, D. M. Seven challenges in image quality assessment: past, present, and future research // ISRN Signal Processing. - 2013. - Vol. 2013, 53 p.

6. Manap, R. A. Shao L. Non-distortion-specific no-reference image quality assessment: A survey // Information Sciences, 2015. - Vol. 301. - P. 141-160.

7. Pertuz, S., Puig, D., Garcia, M. A. Analysis of focus measure operators for shape-from-focus // Pattern Recognition, 2013. - Vol. 46. - № 5. - P. 1415-1432.

8. Crete, F. et al. The blur effect: perception and estimation with a new no-reference perceptual blur metric // Proc. on Human Vision and Electronic Imaging XII, San Jose, CA, USA, January 28, 2007, Vol. 6492. - P. 64920I-1-64920I-11.

9. Zhu, X., Milanfar, P. Automatic parameter selection for denoising algorithms using a no-reference measure of image content // IEEE transactions on image processing, 2010. - Т. 19. - № 12. - С. 3116-3132.

10. Vu, C. T., Phan, T. D., Chandler, D. M. A spectral and spatial measure of local perceived sharpness in natural images // IEEE transactions on image processing, 2012.- Vol. 21.- №3.- P. 934-945.

11. Gabarda, S., Cristybal, B. Blind Image quality assessment through anisotropy // Journal of the Optical Society of America, 2007. - Vol. 24. - № 12. - P. 42-51.

12. Zhang, C. J. et al. Approach to enhance contrast of infrared image based on wavelet transform // Hongwai yu Haomibo Xuebao / Journal of Infrared and Millimeter Waves (China). - 2004. - Vol. 23. - №. 2. - P. 119-124.

13. Wang, Z. et al. Image quality assessment: from error visibility to structural similarity // IEEE transactions on image processing, 2004. - Vol. 13. - № 4. - P. 600-612.

14. База стандартных тестовых изображений: Signal and Image Processing Institute, University of Southern California, CA. - Режим доступа: http://sipi.usc.edu/database/database.php?volume=misc, 44 images, tiff. - Дата доступа: 10.02.2017.

15. Интернет-редактор изображений «Ретушь лица». - Режим доступа: http://makeup.pho.to/ru/. - Дата доступа: 10.02.2017.

Поступила После доработки Принята к печати

14.02.2017 22.02.2017 06.03.2017

Starovoitov V. V., Starovoitov F. V.

COMPARATIVE ANALYSIS OF NO-REFERENCE QUALITY MEASURES

FOR DIGITAL IMAGES

This paper presents results of a comparative analysis of 34 measures published in the scientific literature and used for evaluation of the image quality without a reference image. In English literature, they are called no-reference (NR) measure or measures NR-type. The first article, the term no-reference, was published in 2000 and each year a growing number ofpublications on new measures NR-type. However, comparative studies of such measures is not practically conducted. Such measures are very important for a) just made photo quality evaluation, b) assessment of image enhancement transformations and selection of their parameters (such as contrast and brightness adjustments, tone-mapping, decolorization and others). Publicly available image quality databases used for study no-reference quality measures (TID2013, etc.), contain 4-5 variants of images distorted by predefined transformations with unknown parameters. We presented six types of experiments to analyze correlation of the computed numerical quality values with visual estimates of the test images quality. Four of the experiments are new: comparison of images after gamma-correction and contrast enhancement with different parameters, as well as analysis of the retouched images and photos taken with different focal length. It was shown experimentally that no one of the known no-reference quality assessment measure is universal, and the calculated value cannot be converted to a quality scale, excluding factors influencing the distortion of the image. Most of the studied measures calculates local estimates in small neighborhoods, and their arithmetic mean is the quality index of the image. If the image contains large areas of uniform brightness, the measures of this type can give incorrect quality assessment, which will not correlate with the visual assessments.

Keywords: image quality assessment, no-reference measure, gamma-correction, contrast, retouched image, focal length.

Работа частично выполнена в рамках белорусско-сербского проекта Ф16СРБГ-004.

Старовойтов Валерий Васильевич, доктор технических наук, профессор. Главный научный сотрудник ОИПИ НАН Беларуси. Лауреат премии Ленинского комсомола БССР и Государственной премии Республики Беларусь. С 2000 г. преподает по совместительству в разных университетах курсы, связанные с обработкой и анализом цифровых изображений. Сфера научных интересов: обработка и анализ цифровых изображений, полученных в разных участках электромагнитного спектра. Опубликовал более 150 работ в научных журналах и трудах конференций, 3 монографии. Индекс Хирша ^^ п0 данным scholar, google, com равен 13. Подготовил 6 кандидатов наук.

Starovoitov Valery, Doctor of Sciences and professor of computer science. He is a Principal research fellow at the United Institute of Informatics Problems, National Academy of Sciences of Belarus (UIIP NAN Belarus). Awards: the Belarus Lenin Komsomol Prize and the State Prize of the Republic of Belarus in science. Since 2000, he teaches at different universities lecture courses related to the processing and analysis of digital images. Research interests

of professor Starovoitov are processing and analysis of digital images obtained in different parts of the electromagnetic spectrum. He has published over 150 papers in scientific journals and conference proceedings, including 3 monographs. His Hirsch index according to scholar. google. com is 13. Professor Starovoitov supervised by 6 PhD students successfully who defended their thesis.

Старовойтов Фёдор Валерьевич, студент 5 курса факультета прикладной математики и информатики Белорусского государственного университета. В настоящее время работает над дипломным проектом по теме «Анализ качества цифровых изображений в отсутствие эталона» в ОИПИ НАН Беларуси.

Starovoitov Fedor is the 5th year student of the Applied Mathematics and Informatics Faculty of the Belarusian State University. Currently he is working on a thesis project entitled "No-reference image quality assessment" at the UIIP NAN Belarus.

i Надоели баннеры? Вы всегда можете отключить рекламу.