Научная статья на тему 'Алгоритм эталонной оценки качества сжатых изображений с использованием метода нечеткой классификации объектов'

Алгоритм эталонной оценки качества сжатых изображений с использованием метода нечеткой классификации объектов Текст научной статьи по специальности «Математика»

CC BY
289
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНКА КАЧЕСТВА СЖАТОГО ИЗОБРАЖЕНИЯ / L-КОМПАКТНОСТЬ / QUALITY RATING OF THE SHRUNK IMAGES / L-COMPACTNESS

Аннотация научной статьи по математике, автор научной работы — Салтыкова Татьяна Николаевна

Предлагается алгоритм оценки качества сжатого изображения с использованием метода нечеткой классификации объектов на основе гипотезы l-компактности, что позволит приблизить автоматическую оценку качества изображения к экспертной.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Absolute standard rating algorithm to evaluate identify quality of the shrunk images using the object fuzzy classification method

The paper proposes an absolute standard rating algorithm to identify quality of the shrunk images using the object fuzzy classification method based on the l-compactness hypothesis, which makes it possible to approximate automatic rating quality of the images to expert one.

Текст научной работы на тему «Алгоритм эталонной оценки качества сжатых изображений с использованием метода нечеткой классификации объектов»

УДК 004.627

Т. Н. Салтыкова

АЛГОРИТМ ЭТАЛОННОЙ ОЦЕНКИ КАЧЕСТВА СЖАТЫХ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДА НЕЧЕТКОЙ КЛАССИФИКАЦИИ ОБЪЕКТОВ

Предлагается алгоритм оценки качества сжатого изображения с использованием метода нечеткой классификации объектов на основе гипотезы Х-компактности, что позволит приблизить автоматическую оценку качества изображения к экспертной.

Ключевые слова: оценка качества сжатого изображения, Х-компактность.

Проведенный анализ существующих методов и критериев оценки качества сжатых изображений позволяет автору данной работы согласиться с мнением большинства исследователей по вопросу оценки качества изображений: в настоящий момент лучшим инструментом для проведения оценки качества изображения являются человеческие глаза. Каждый из известных количественных критериев оценки качества имеет свои особенности и предполагает наличие определенных требований к оцениваемому изображению.

Исходя из этого, было принято решение проанализировать возможность использования методов распознавания образов (изображений) для оценки качества сжатых изображений с целью максимально приблизить эффективность количественного критерия оценки качества изображения к его визуальной оценке.

Распознавание образов - это отнесение наблюдаемых данных к определенному классу на основе выделения существенных признаков, характеризующих эти данные [1].

В целом, можно выделить три метода распознавания образов [2].

В основе первого из них, метод перебора, лежит сравнение объекта с базой данных, где для ка лею го вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, с разными масштабами, смещениями, деформациями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д. В случае распознавания звуковых образов происходит сравнение с некоторыми известными шаблонами (например, словом, произнесенным несколькими людьми).

При втором подходе проводится более глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических характеристик, звуковой образец может подвергается частотному, амплитудному анализу и т. д.

Наконец, третий метод - это использование искусственных нейронных сетей (ИНС). Метод требует либо большого количества примеров при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая, по сравнению с другими методами, эффективность и производительность.

Выделяют следующие типы задач распознавания:

1) задача распознавания - отнесение предъявленного объекта по его описанию к одному из заданных классов;

2) задача автоматической классификации - разбиение множества объектов, ситуаций, явлений по их описаниям на систему непересекающихся классов (таксономия, кластерный анализ, самообучение);

3) задача выбора информативного набора признаков при распознавании;

4) задача приведения исходных данных к виду, удобному для распознавания;

5) динамическое распознавание и динамическая классификация аналогично задачам 1 и 2, но для динамических объектов;

6) задача прогнозирования - по сути, задача 5, в которой решение должно относиться к некоторому моменту в будущем.

Во многих прикладных задачах измерять степень сходства объектов существенно проще, чем формировать признаковые описания. Например, гораздо легче сравнить две фотографии и сказать, что они принадлежат одному человек, чем понять, наосновании каких признаков они схожи. Задача классификации объектов на основе их сходства друг с другом, когда принадлежность обучающих объектов каким-либо классом не задается, называется задачей кластеризации.

Кластерный анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации (англ. cluster - гроздь, пучок, скопление, группа элементов, характеризуемых каким-либо общим свойством) [3].

Критерий качества кластеризации в той или иной мере отражает следующие неформальные требования:

а) внутри групп объекты должны быть тесно связаны меяеду собой;

б) объекты разных групп должны быть далеки друг от друга;

в) при прочих равных условиях распределения объектов по группам должны быть равномерными.

Требования а и б выражают стандартную концепцию компактности классов разбиения; требование в состоит в том, чтобы критерий не навязывал объединения отдельных групп объектов.

Узловым моментом в кластерном анализе считается выбор метрики (или меры близости объектов). От этого выбора решающим образом зависит окончательный вариант разбиения объектов на группы при заданном алгоритме разбиения. Для каждой конкретной задачи этот выбор производится по-своему, с учетом главных целей исследования, физической и статистической природы используемой информации и т. п.

Другой важной величиной в кластерном анализе является расстояние между целыми группами объектов.

Выбор той или иной меры расстояния между кластерами влияет, главным образом, на вид выделяемых алгоритмами кластерного анализа геометрических группировок объектов в пространстве признаков. Так, алгоритмы, основанные на расстоянии ближайшего соседа, хорошо работают в случае группировок, имеющих сложную, в частности, цепочечную структуру. Расстояние дальнего соседа применяется, когда искомые группировки образуют в пространстве признаков шаровидные облака. И промежу точное место занимают алгоритмы, использующие расстояния центров тяжести и средней связи, которые лучше всего работают в случае группировок эллипсоидной формы.

Нацеленность алгоритмов кластерного анализа на определенную структуру группировок объектов в пространстве признаков может приводить к неоптимальным или даже неправильным результатам, если гипотеза о типе группировок неверна. В случае отличия реальных распределений от гипотетических указанные алгоритмы часто «навязывают» данным несвойственную им структуру и дезориентируют исследователя. Поэтому экспериментатор, учитывающий данный факт, в условиях априорной неопределенности прибегает к применению батареи алгоритмов кластерного анализа и отдает предпочтение какому-либо выводу на основании комплексной оценки результата работы этих алгоритмов.

Решение задачи кластеризации принципиально неоднозначно, и тому есть несколько причин. Во-первых, не существует наилучшего критерия качества кластеризации. Известен целый ряд достаточно разумных критериев, а также ряд алгоритмов, не имеющих четко выраженного критерия, но осуществляющих достаточно разумную кластеризацию «по построению». Все они могут давать разные результаты. Во-вторых, число кластеров, как правило, не известно заранее и устанавливается в соответствии с некоторым субъективным критерием. В-третьих, результат кластеризации существенно зависит от метрики, выбор которой, как правило, также субъективен и определяется экспертом.

В классической задаче классификации считается, что множество классов О = {о)...о) } является конечным, и

V ’ т} ’

классы образуют полную группу подмножеств из и. В общем случае классов может быть и бесконечно много и они могут не составлять полную группу множеств [4].

Классифицировать образ х е С по классам со 1,..., сот -это значит найти так называемую индикаторную функцию g:UУ, У = {у , ут|. которая ставит в соответствие образу х е ( ' метку у1 е У того класса та,., которому он принадлежит, т. е. g(x) у . если х е та,..

Автоматическое нахождение границ классов - одна из основных задач теории распознавания образов. Границы классов распознаваемых объектов можно определять по-разному, например, с помощью понятия решающей функции.

Линейными решающими функциями (ЛРФ) называются решающие (дискриминантные) функции вида с!(х) = с1(х,,хп, ...,Х ) = 14',X, +... + М> X +М> г1 = (\¥,х), где\¥-

\ / \ 1? 2’ ’ п/ 11 п п п+1 у 7

вектор весовых коэффициентов ЛРФ, х - вектор парамет-

ров образа: w = (wv..., м>п, м>п+ у, х = (хр..., хп, \)Т. Разделяющая поверхность d(\) = О представляет собой гиперплоскость в пространстве R".

Если классы нельзя разделить с помощью ЛРФ в пространстве R", то следует вложить эти классы в пространство R1 большей размерности / п с помощью некоторого отображения ср: R"—>R'. причем это отображение должно быть таким, чтобы классы в R1 можно было линейно разделить.

Пространство образов х* = cp(x),x е R", в котором классы будут линейно разделимы, называется спрямляющим пространством, а отображение Ф - спрямляющим отображением. Для построения спрямляющего отображения можно использовать обобщенные решающие функции (ОРФ) вида: d(\) = +... + wt_1fl_t(x) + wp

где f(\ ) - скалярные функции в R"

Классификация с помощью функций расстояния предполагает определение функции, оценивающей меру принадлежности предъявленного для классификации образах классу та,., т. е. некоторой функции d (х, та,.), котораяудов-летворяла бы условию х е та,., если й? (х, та,.) < o' (х, та ;) для всех / ^i.

Чтобы определить меру принадлежности образа х классу та, нужно выбрать способ определения меры близости между двумя образами, между образом и классом и, наконец, между двумя классами. Так как каждый образ х характеризуется некоторым вектором признаков х, то меру близости меяеду образами х ну можно задать с помощью меры близости d(\,y) между векторами-образами х и у их признаков. В качестве такой меры близости чаще всего используют метрику.

Векторы признаков, между которыми измеряется расстояние, могут иметь разную размерность, разные порядки величин, различные приоритеты. Поэтому прежде чем использовать метрики, желательно нормализовать и стандартизировать значения признаков.

Рассмотрим гипотезу /--компактности применительно к задачам распознавания образов.

Зрительный аппарат человека обладает уникальными способностями делать классификацию (таксономию) множества объектов, если они представлены точками на плоскости [5]. Результаты этой естественной для человека таксономии не могут быть получены или объяснены с позиции гипотезы компактности. Гипотеза же /--компактности позволяет легко получать и просто объяснять такие результаты.

Если определить расстояния между всеми парами точек множества^, то можно построить полный граф, соединяющий все точки со всеми, и найти самое длинное ребро - диаметр графа (D). Выделим две любые точки а и h и обозначим длину связывающего ребра через a(ab). Будем считать нормированным расстояние между этими точками величину d = a/D.

Теперь среди ребер, смежных ребру (ab), найдем самое короткое, длину которого обозначим через Pmin. Отношение длин этих смежных отрезков обозначим через х* = ot/Pmin. Чтобы сделать эту величину нормированной в диапазоне от 0 до 1, найдем в полном графе наибольшее значение х . Величина х = х*/х является нормирован-

max шах А А

ной характеристикой локальной неоднородности плотно-

сти множества в окрестностях точек а и Ь. Использование /--расстояний вместо евклидовых позволяет получать более естественную таксономию, совпадающую с результатами, полученными экспертами. При этом оказалось, что параметр с! играет более важную роль по сравнению с параметром х. Наилучшее совпадение экспертных суждений с формальными получалось в том случае, если в качестве меры расстояния использовалась величина X = х2 • й?.

Находя /.-хара ктср исти к и для всех отрезков, соединяющих точки множества^, мы делаем отображение этого множества из евклидова пространства в новое /--пространство. В этом пространстве можно построить граф без петель, который связывает между собой все точки и имеет минимальную суммарную /--длину своих ребер. Такой граф в евклидовом пространстве называется кратчайшим незамкнутым путем (КНП). По аналогии, КНП в /--пространстве обозначим через /--КНП. Строятся такие графы следующим образом [6]. Сначала находятся две самые близкие точки, которые соединяются ребром. Затем соединяется ребром следующая пара самых близких точек. Для каяедой следующей пары ближайших точек предварительно проверяется, нельзя ли пройти из одной в другую ребрами уже построенного графа. Если можно, то они из дальнейшего рассмотрения исключаются, а если нет, то строится ребро графа между ними. Так продолжается до объединения в общий граф всех т точек множества^. Теперь /--расстоянием между двумя любыми точками считаем сумму /--характеристик тех ребер, по которым проходит путь между ними по /--КНП.

Если геометрическая близость точек связывалась с понятием компактности, то близость по /--расстояниям назавем /--компактностью. Исходя из этого, по аналогии с гипотезой компактности, гипотезу /--компактности (/.Н) можно сформулировать следующим образом: реализации одного и того же образа обычно отражаются в признаковом /--пространстве в близкие точки, образуя /--компактные сгустки [7].

Если выделить п описывающих признаков X и целевой признак г. то в пространстве (X, г) /--компактное множество объектов^ характеризуется тем, что оно /--компактно одновременно и по признакам X, и по признаку г. Эго означает, что между признаками X и г есть закономерная связь или что система описывающих признаковХинформативна для предсказания значений целевого признакам. Если к множеству . I добавить новый объект q с известными значениями описывающих признаковХ и неизвестным значением целевого признака г и при этом окажется, что множество (А, д) /--компактно в пространствеХ, то из гипотезы /--компактности следует, что оно будет /--компактно и в пространстве (X, г). Эго дает возможность предсказывать значение целевого признака г для любого объекта д.

Обозначим факт /--компактности объектов А в пространствеХ символом кС?. Тогда тестовый алгоритм гипотезы /--компактности можно представить следующим выражением:

И (ХС^ &ХС*д) Шеп У2\л.

Сформулированное выше условие компактности для решения задач распознавания образов является необхо-

димым, но не достаточным. Условие, при котором точки разных образов (А и В) взаимно не компактны, т. е. сгустки точек разных образов не налагаются друг на друга, обозначим через /д. С учетом этого гипотезу /--компактности /_Н для распознавания образов можно записать в следующем виде:

* (1С£ &ХСГ &1С1Ч) Шеп хсхч.

В задачах разделения множества А на таксоны простой формы, которые описываются непересекающими-ся выпуклыми оболочками, стремление к наибольшей компактности или /--компактности приводит к одинаковым результатам. Но для более сложных случаев гипотеза /--компактности обеспечивает получение результата, более естественного по сравнению с гипотезой компактности. Следовательно, гипотеза /--компактности является более сильной эмпирической гипотезой, чем широко применяемая сейчас гипотеза компактности.

В результате проведенного анализа методов кластеризации и классификации объектов, принято решение использовать для разработки алгоритма оценки качества сжатых изображений метод нечеткой классификации объектов на основе гипотезы /--компактности,

У нас имеется множество^ пикселов оригинала изображения, у каждой точки в качестве признаков имеются координаты точки, яркость и цвет (допустим, в системе 1ШВ). Также имеется множество В пикселов сжатого изображения с теми же характеристиками.

Первый шаг алгоритма. Предлагается провести таксономии всех точек как множества^, так и множества В методом нечеткой классификации с использованием гипотезы /--компактности. Количество необходимых классов можно определить одним из двух способов:

- с помощью проведения иерархической классификации, когда на первом этапе все множество объектов помещается в один большой класс, а на следующем шаге классификации этот класс разбивается на два более мелких класса, и так далее до достижения некоторого установленного допустимого минимального значения /--расстояния меяеду объектами;

- установив конкретное значение заранее в зависимости от необходимых результатов и требований к алгоритму.

В результате первого шага алгоритма мы получим две выборки точек, составляющих границы «сгустков» сжатого изображения и оригинала.

Второй шаг алгоритма. Допускается, что полученные на предыдущем шаге выборки будут содержать точки с несовпадающими номерами пикселов. Поэтому для адекватного сравнения необходимо привести их к единому виду, что достигается достаточно просто, дополнением выборки отсутствующими точками. Полученные выборки сортируются по возрастанию номеров пикселов в исходном и сжатом изображениях. Далее, проходом по векторам точек границ сгустков множеств^ и В определяются как точки из границ множества^, отсутствующие в векторе границ множества В, так и наоборот, точки из границ множества В, отсутствующие в векторе границ множества А. При обнаружении таких точек выборка с точками границ из множества А дополняется точками

множества^ с соответствующими координатами, и, соответственно, при обнаружении таких точек выборка с точками границ из множества В дополняется точками множества В с соответствующими координатами. В результате второго шага мы получим две выборки точек с совпадающим количеством пикселов и их координатами, но, возможно, с различными значениями их признаков.

Третий шаг алгоритма. Предполагается проведение процедуры сравнения полученных на предыдущем шаге выборок точек границ таксонов исходного и сжатого изображений. Сравнение может производиться с использованием любых существующих метрик качества изображения, когда выполняется сравнение сжатого изображения с оригиналом. Предлагается использовать среднеквадратичное отклонение, рассчитываемое по формуле

1 от~1 И~1

мщ/,,/2)=—XX ||л О'. Д- ь у)!

тп ,=0 ,=0

где 1(1, ]) - пиксел полученной выборки точек границ классов исходного изображения; / (г, ]) - пиксел полученной выборки точек границ классов сжатого изображения.

Таким образом, в результате предложенного алгоритма оценки качества сжатого изображения мы получим адекватную количественную метрику качества сжатия изображения, основанную на реальных возможностях и особенностях зрительного аппарата человека. Что позволит приблизить автоматическую оценку качества изображения к экспертной.

Главное отличие предложенного алгоритма от существующих состоит в том, что для проведения оценки качества сжатого изображения не рассматривается все множество точек изображения, а проводится предварительная классификация всех точек изображений и выбираются пикселы границ различных объектов на

изображении. Данный метод особенно хорошо применим к изображениям, содержащим картографические данные, которые отличаются достаточной однородностью и возможностью выделения отдельных областей картинки.

Для большей эффективности проведения оценки качества сжатого изображения с менее однородной структурой можно использовать сочетание предложенного алгоритма с уже существующими стандартными методами оценки. Однако этот вопрос требует выполнения дополнительных исследований, которые могут быть проведены в будущих работах автора.

Библиографический список

1. Бондарев, В. Н. Искусственный интеллект : учеб. пособие для вузов / В. Н. Бондарев, Ф. Г. Аде; Севостоп. нац. техн. ун-т. Севастополь, 2002.

2. Горелик, А. Л. Методы распознавания: учеб. пособие для вузов / А. Л. Горелик, В. А. Скрипник. 3-е изд., перераб. идоп. М.: Высш. шк., 1989.

3. Мандель, И. Д. Кластерный анализ / И. Д. Мандель. М.: Финансы и статистика. 1988.

4. Лепский, А. Е. Математические методы распознавания образов: курс лекций / А. Е. Лепский, А. Г. Броневич. Таганрог: Изд-во Таганрог, гос. радиотехн. ун-та, 2007.

5. Загоруйко, Н. Г. Какими решающими функциями пользуется человек? / Н. Г. Загоруйко // Вычисл. системы. Новосибирск, 1967. Вып. 28. С. 69-79.

6. Прим, 3. Л. Кратчайшие связывающие сети и некоторые обобщения / 3. Л. Прим // Кибернетический сб. 1961. №2. С. 95-107.

7. Загоруйко, Н. Г. Гипотезы компактности и /.-компактности в методах анализа данных / Н. Г. Загоруйко // Сиб. журн. индустр. математики. 1998. Вып. 1. С. 114-126.

T. N. Saltykova

ABSOLUTE STANDARD RATING ALGORITHM TO EVALUATE IDENTIFY QUALITY OF THE SHRUNK IMAGES USING THE OBJECT FUZZY CLASSIFICATION METHOD

The paper proposes an absolute standard rating algorithm to identify quality of the shrunk images using the object fuzzy classification method based on the X-compactness hypothesis, which makes it possible to approximate automatic rating quality of the images to expert one.

Keywords: quality rating of the shrunk images, X-compactness.

i Надоели баннеры? Вы всегда можете отключить рекламу.