ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ СИСТЕМЫ X
УДК 519.2:681.3
РАЗРАБОТКА МЕРЫ ОЦЕНКИ ИНФОРМАЦИОННОГО РАССТОЯНИЯ МЕЖДУ ГРАФИЧЕСКИМИ ОБЪЕКТАМИ
Л. А. Кузнецов,
доктор техн. наук, профессор Д. А. Бугаков,
магистрант
Липецкий государственный технический университет
Разработана оригинальная методология оценки близости информационного содержания графических объектов на основе представлений теории информации. Информационное содержание отдельных объектов оценивается энтропиями, а мера информационного расстояния — отношением дизъюнкции к конъюнкции энтропий сопоставляемых объектов. Разработанные меры информационного расстояния соответствуют метризации пятимерного пространства, используемого для представления графических информационных объектов. Приводятся примеры, дающие наглядное представление об эффективности разработанных мер в сравнении с существующими.
Ключевые слова — графический объект, пятимерное пространство, вероятностная модель, энтропия, информационное расстояние, метризация, оценка близости.
Введение
Проблемы сопоставления и классификации графических объектов в настоящее время являются весьма актуальными. В технологических системах часто используются следящие системы, результаты работы которых представляются в виде последовательности кадров (или снимков) состояния объектов или процессов, сделанных через определенные промежутки времени. Одной из важнейших задач является автоматизация процессов визуального слежения за состоянием подобного рода объектов и формирования по визуальным образам количественных оценок состояния и эволюции сканируемого объекта. Зачастую современные следящие системы не обладают эффективными инструментами для достаточно однозначной трансформации визуальных образов в количественные меры, пригодные для автоматического формирования управляющих воздействий.
Решение такой задачи предполагает разработку способа получения некоторой количественной оценки графического изображения, представляющей скалярную свертку (меру) количества информации, содержащегося в плоском изображении. Наличие меры позволит упорядочивать и сопоставлять состояния процесса (объекта), отражаемые визуальными изображениями. Мера мо-
жет использоваться как обычный сигнал в системах автоматического управления для выработки управляющих воздействий на управляемый процесс. Управляющее воздействие может формироваться в функции отклонения изображения, получаемого со следящего устройства, образцу, визуально описывающему эталонное состояние выпускаемого продукта либо штатный режим работы технологического объекта или процесса. Сложность задачи состоит в том, что в технических системах, в отличие от, например, биометрических, часто неизвестно эталонное состояние идентифицируемого объекта. При этом в результате экспертной оценки известна градация изображений, отражающая качество технологического процесса, и требуется выявить принадлежность идентифицируемого изображения к одному из выделенных классов.
Наиболее распространенной в современных графических форматах и простой моделью в настоящее время является цветовая модель RGB [1, 2]. Широко используется метод цветовых гистограмм [3-5], основанный на RGB-модели и позволяющий проводить сравнение изображений по их цветовому составу. Основным недостатком этого метода является отсутствие информации о пространственном расположении точек сравниваемых изображений, а также невозможность применить его для решения задачи классифика-
ции образов. Авторами разработана модификация алгоритма цветовых гистограмм, которая состоит в добавлении к имеющимся осям RGB координатных осей X и Y. Переход к построению пятимерных гистограмм в RGBXY-пространстве позволяет преодолеть описанный недостаток. Однако в некоторых случаях точность работы модифицированного алгоритма оказывается недостаточной для решения задач, возникающих в производственной сфере. Необходима разработка универсальной методики, с использованием которой станет возможным принятие управляющих решений на основе анализа поступающих графических данных.
В настоящей статье рассматривается оригинальный алгоритм, который, по сути, не опирается на существующие алгоритмы и не является их продолжением. В отличие от метода цветовых гистограмм он использует иную математическую основу и позволяет рассматривать графические образы в информационно-вероятностном аспекте.
Вероятностная модель графического объекта
Более детальное представление графического объекта, учитывающее цветовые интенсивности пикселей и информацию об их пространственном положении в координатной плоскости изображения, может быть получено на основе представления исследуемого изображения в виде вероятностной модели. Вероятностными моделями оперирует теория информации, в которой существует формальная процедура синтеза представления различного рода объектов [6]. Она специально разработана для получения максимально полного вероятно-статистического описания, которое включает в себя пространство элементарных исходов О, алгебру событий К и их вероятности Р.
Фактически задача оценки уровня совпадения графических объектов подобна задаче оценки потерь (искажений) информации в линии связи, для которой К. Шенноном первоначально и была применена теория информации [7]. К. Шеннон ввел энтропию в теорию информации в качестве меры количества информации, которое выражается через распределение вероятностей. Энтропия является вероятностной мерой количества информации. Энтропия исхода определяется в виде логарифма вероятности этого исхода:
Н(%,-) = -|П Р(%;), (1)
а усредненная энтропия случайной величины % выражается через функцию распределения ее вероятностей в виде
Н =-£ Р(%)'п Р(%)' (2)
%
где % — случайная величина, р(%) < 1 — ее распределение вероятностей.
Чтобы воспользоваться результатами теории информации для оценки уровня близости графических объектов, эталонный образ можно трактовать передатчиком, а идентифицируемый образ — приемником. Качество передачи осуществляется сопоставлением энтропии идентифицируемого образа, полученного от системы наблюдения за технологическим объектом или процессом, с энтропией эталонного графического образа.
Применение энтропии для сравнения графических объектов
Анализ недостатков метода цветовых гистограмм приводит к выводу о том, что для качественного решения поставленной задачи необходимо предварительно разделить изображение на небольшие сегменты. Это позволит сравнивать идентифицируемый образ и эталон по сегментам, не привлекая информацию о пространственном расположении точек изображения.
Каждый сегмент после проведения сегментации будет содержать одинаковое количество точек. Алгоритм следует применить как к эталону, так и к исследуемому изображению. Получаемые вероятностно-статистические цветовые модели графического информационного объекта являются формально-математическими представлениями образов эталона и идентифицируемого образа, наделенными количественными характеристиками для оценки их близости. Эти образы, помимо статистических вероятностей, будут содержать в себе энтропии сегментов изображения Н;, I = 1, 2, ..., п, где п — количество сегментов. Суммарная энтропия Е графического объекта может
П
быть вычислена по формуле Е = ^ Н
1=1
Методика и реализующий ее алгоритм сравнения инвариантны по отношению к способу разбиения графического объекта. Поэтому выбор конфигурации и количества областей могут выбираться пользователем исключительно для обеспечения целесообразного уровня детализации специфики сопоставляемых объектов. Как обычно, в задачах подобного рода увеличение масштаба сетки разбиения приводит к интеграции (сглаживанию) локальных особенностей, а уменьшение масштаба — к дифференциации локальных эффектов.
Энтропии сегментов эталона и исследуемого образа однозначно характеризуют исследуемые объекты и поэтому могут быть использованы для оценки уровня их подобия. Значения энтропий сег-
ментов могут рассмотриваться как два статистических ряда, что позволяет применить для оценки их статистической близости традиционный корреляционный анализ [8]. Формула коэффициента корреляции в данном случае принимает вид
£ (Н - н )Н - н ])
Я— 1-1
£ (Н - Н)2 £ (Н - Н] )2
1=1 V 1=1
(3)
где I = 1, 2, ..., п, п — количество сегментов; Н,
Н] — энтропия £-го сегмента эталона и идентифицируемого образа соответственно; Н, Н1 — средняя энтропия эталона и идентифицируемого образа.
Энтропийный анализ является достаточно простым, эффективным и наглядным инструментом, который открывает широкие возможности для статистического описания как одного графического образа, так и целой группы графических образов. Сравнение энтропийных характеристик позволит решить задачу классификации и как частный случай классификации — задачу сопоставления графических объектов. При этом практический интерес представляет способ подсчета вероятностей р(%!) (1), соотнесенных с цветовой емкостью сегментов изображения.
Интегральный и дифференциальный методы энтропийного анализа графического объекта
Предположим, что был выполнен этап сегментации исследуемого графического объекта и количество выделенных сегментов равно п. Это означает, что получено равномерное разбиение плоскости изображения, при котором количество отрезков на каждой координатной оси равно л/П и каждый сегмент содержит равное количество точек k.
Вероятностно-статистическая цветовая модель графического объекта предполагает, что изображение, а также его каждый сегмент имеют определенную цветовую емкость. Эти величины непосредственно используются при подсчете вероятностей pi. Интегральный метод предполагает определенный способ расчета вероятности pi для каждого сегмента:
к к к
£ %+£,$+£в,
р -М—М—М-, <4>
£Ъ+£е+£В >1 >1 j=1
где I = 1, 2, ..., п — номер сегмента, п — количество сегментов; &/, Су, % — значения цветовых
интенсивностей точек £-го сегмента; k — количество точек в сегменте графического объекта; M — общее количество точек, содержащихся в графическом объекте.
Смысл формулы (4) достаточно прост: числитель содержит суммарную цветовую емкость точек !-й области графического объекта, знаменатель — суммарную цветовую емкость всего исследуемого графического объекта. Таким образом, каждому сегменту изображения соответствует одно число — его взвешенная цветовая емкость (вероятность p>. Отсюда следует название интегрального метода.
Дифференциальный метод предполагает несколько иной способ расчета вероятности pi для каждого сегмента:
к
£ в
рв =_______£1_________■
М М М '
£^+£С+£В
>1 >1 j=1
к
£ С
С = j=1 ■
Р> = М М М ■
£^+£%+£в,
j=1 j=1 >1
к
£ В
РВ =__________________ (5)
р> М М М , (5)
£ Ъ+£ С+£ %
j-1 ,-1 ,=1
где обозначения аналогичны (4).
Разберем смысл формул (5): числитель каждой формулы содержит суммарную цветовую емкость точек £-й области графического объекта по одному из цветовых каналов ^, G или B), знаменатель — суммарную цветовую емкость всего исследуемого графического объекта. Таким образом, каждому сегменту изображения соответствует три числа — его взвешенные цветовые емкости по каждому из цветовых каналов (вероятности р^, р^, р%). Отсюда следует название дифференциального метода.
В данном методе, в отличие от предыдущего, каждый сегмент характеризуется тремя значениями вероятностей, поэтому расчет энтропии сегмента необходимо выполнять по формуле (2).
По полученным значениям эмпирических вероятностей можно произвести расчет энтропии (1) для каждого сегмента и для всего графического объекта (2). Сравнение энтропийных характеристик исследуемого образа и эталона посредством регрессионного анализа позволяет оценить степень подобия графических объектов.
Вероятностная метризация — вычисление расстояния между графическими объектами
Энтропия (1), (2) может быть использована как универсальная мера количества информации, содержащегося в графическом объекте, представленном в виде вероятностной модели. Информация о реальных объектах, как правило, представляет композицию детерминированной и случайной составляющих. Во многих реальных объектах случайная составляющая может иметь значительный вес. Такие объекты допускают формальное представление вероятностной моделью, которая позволяет адекватно отразить закономерности, скрытые в их случайной составляющей. Для количественной оценки информации, содержащейся в вероятностной модели, целесообразно использовать энтропию. Энтропия дает возможность сопоставить состояния разнообразных объектов, а количество совместной информации — оценить близость информационного содержания различных объектов.
В частности, ее применение можно найти в работах по управлению технологическими процессами и качеством продукции [9, 10], по оценке степени подобия текстов на естественном языке [11, 12].
Рассмотрим применение энтропии как средство метризации расстояния между графическими объектами при проведении их исследования методом модифицированных цветовых гистограмм. Полученная в результате работы модифицированного алгоритма гистограмма представляет собой вероятностно-статистический цветовой образ исследуемого графического информационного объекта. В качестве элементарного события рассматривается событие принадлежности точки к определенной области RGBXY-пространства. В данном случае роль вероятности играет относительная частота попадания точек изображения в область: рЬ = п/п, где щ — суммарное количество точек, попавших в данную область RGBXY-пространства; п — общее количество точек, содержащихся в графическом объекте.
Расчетом вероятностей определяется статистический закон распределения точек графического объекта в RGBXY-пространстве. Это позволяет применить формулу (2) для расчета энтропии образа графического объекта.
Поскольку задача состоит в определении близости идентифицируемого изображения, получаемого с выхода системы наблюдения, с некоторым эталонным образом, то представляется возможным оценить степень сходства, используя критерий, оценивающий информационное расстояние между исследуемым образом и эталоном.
Например, в геометрии для оценки расстояния между объектами используется обычный метрический критерий. Для оценки информационного (семантического) расстояния могут быть введены аналогичные по смыслу критерии следующего вида:
1) энтропийноерасстояние, являющееся мерой оценки близости объектов в информационном масштабе:
М
г-1 ни = 1£ *и)'п *и)
’=2 Н(П)=2 £МП)'п МП)
1=1
где символом и обозначено суммарное количество точек образа и эталона, попавших в Ь-ю область RGBXY-пространства;
символом П обозначено совместное количество точек, попавших в Ь-ю область RGBXY-пространства, одновременно принадлежащих и образу и эталону;
Ь = 1, ..., М — количество выделенных областей в RGBXY-пространстве;
р( и), р( П) — вероятности соответствующих событий;
Н( и), Н( П) — энтропии соответствующих событий.
2) вероятностное расстояние представляет меру оценки близости объектов в абсолютном вероятностном масштабе:
М
1 £ р«
Гр = 2 М--------------------■ (7)
£ р(П)
/=1
где обозначения аналогичны обозначениям формулы (6).
Для выяснения минимального и максимального значения введенных критериев рассмотрим два предельных случая. В первом пусть вероятностностатистический образ идентифицируемого изображения Ои не имеет ничего общего с образом эталона Оэ. Отсутствие общего означает, что вероятность р( П) = 0. В теории информации принято 0^0 = 0, поэтому знаменатели формул (6) и (7) будут стремиться к нулю. Из этого следует, что расстояния гэ и гр будут стремиться к бесконечности.
Во втором случае пусть идентифицируемое изображение полностью совпадает с эталоном, т. е. Оэ = Ои. Тогда для обоих объектов совпадут вероятности попадания точек в определенную область RGBXY-пространства. Это означает, что вероятности р( и) и р( П) будут связаны соотношением р( и) = 2р( П). Следовательно, расстояния в данном случае примут минимально возможные значения: г™'п и г™п = 1.
Формулы (6) и (7) определяют функции, монотонно возрастающие от некоторого минимального значения до бесконечности. Чем больше степень сходства графических объектов, тем меньше расстояния гэ и г, и наоборот, чем меньше степень близости объектов, тем больше расстояния гэ и гр. Характер поведения энтропийной (6) и вероятностной (7) мер близости графических объектов соответствует интуитивным представлениям о расстоянии.
Пример применения вероятностно-статистических алгоритмов для решения задачи сравнения графических объектов
Рассмотрим результаты сопоставления графических объектов, полученные с помощью существующих и разработанных алгоритмов (таблица). Условимся считать образ № 1 эталонным.
Видно, что образы № 1 и 2 совершенно различны, но с применением классических алгоритмов разбиения RGB-осей на интервалы и разбиения RGB-пространства по прямоугольным параллелепипедам полученное значение коэффициента подобия свидетельствует об обратном. Если использовать типичное пороговое значение степени
соответствия 0,65, принятое в алгоритмах биометрической идентификации [13], то два исследуемых изображения, исходя из полученных результатов, следует считать совершенно неразличимыми, что не соответствует действительности.
Коэффициент подобия образов № 1 и 2 при использовании оригинального, предложенного в работе модифицированного алгоритма имеет значение R = 0,324, которое более чем в 2 раза ниже коэффициента, полученного с использованием классических алгоритмов. Для интегрального и дифференциального методов, использующих энтропийную меру, значения коэффициентов подобия близки к нулю. Разработанный метод количественно показывает значительно меньшую степень близости исследуемых изображений друг другу. На основании оценки расстояний между объектами мерами (6), (7) можно сделать вывод, что исследуемые изображения следует считать совершенно различимыми, что полностью отражает реальную ситуацию.
Рассмотрим результаты сравнения образов № 1 и 3. Несмотря на то, что различия между этими образами невелики, для существующих алгоритмов коэффициенты подобия близки к значениям, полученным в предыдущем случае при сопоставлении существенно различающихся образов № 1
■ Результаты исследования степени близости графических объектов
Метод Характеристики для образов
Образ 1 Образ 2 Образ 3 Совместная
Тип Графическое представление ц “в ІІЯ -
Классические Разбиение RGB-осей - - - *12 = 0,897 Д13 = 0,735
Разбиение RGB-пространства - - - *12 = 0,7 Д13 = 0,746
Разработанные Модифицированный метод - - - 43 21 ,3 ,9 II II сч сс о? о?
Интегральный метод Е1 = 461,811 Е2 = 463,793 Е3 = 462,152 52 52 ,0 ,9 II II сч сс * о?
Дифференциальный метод Е1 = 1134,189 Е2 = 1280,136 Е3 = 1234,701 *12 = 0,069 *-^3 = 0,938
Энтропийное расстояние Н12( и) = 971,602 Н13( и) = 1227,317 Н12( П) = 110,171 Н13( П) = 740,361 гэ12 = 4,41 гэ13 = 0,829
Вероятностное расстояние Н12( и) = 2 Н18( и) = 2 Н12( П) = 0,27 Н13( П) = 0,618 г1 = 3,697 гр13 = 1,618
и 2. В то же время значения, полученные при использовании разработанных алгоритмов, указывают на то, что образы № 1 и 3 обладают высокой степенью сходства.
Заключение
Представлены результаты исследования оригинальных количественных мер близости визуальных плоских изображений. Разработаны скалярные меры оценки количества информации в изображениях, получаемых автоматически с помощью видеокамер. На наглядных примерах показана эффективность разработанных скалярных мер, содержание которых соответствует интуитивным представлениям о расстоянии. Скалярные меры оценки близости изображений необходимы для автоматизации процедуры принятия решения в системах, получающих информацию о состоянии объекта видеокадрами.
Достаточно высокая разрешающая способность разработанных мер достигается применением вероятностно-статистического подхода для формального представления графических объек-
Литература
1. Поляков А. Ю., Дорофеев С. Ю. Геометрическое моделирование в системах автоматизированного проектирования: учеб. пособие. — Томск: ТУСУР, 2007. — 215 с.
2. Фисенко В. Т., Фисенко Т. Ю. Компьютерная обработка и распознавание изображений: учеб. пособие. — СПб.: СПбГУ ИТМО, 2008. — 192 с.
3. Stricker M., Orengo M. Similarity of Color Images // Proc. of the SPIE Conf. 1995. Vol. 2420. P. 381-392.
4. Swain M. J., Ballard D. H. Color Indexing // Intern. J. of Computer Vision. 1991. Vol. 7(1). Р. 11-32.
5. Васильева H. C. Выбор шага квантования при построении цветовой гистограммы в задаче поиска изображений // Вестник СПбГУ. Сер. 10. Прикладная математика, информатика, процессы управления. СПб.: Изд-во СПбГУ, 2009. Вып. 2. C. 155-164.
6. Гнеденко Б. В. Курс теории вероятностей: учебник. Изд. 9-е, испр. — М.: Издательство ЛКИ, 2007. — 449 c.
7. Шеннон К. Работы по теории информации и кибернетике. — М.: Изд-во иностр. лит., 1963. — 833 с.
8. Гмурман В. Е. Теория вероятностей и математическая статистика. — М.: Высш. шк., 1996. — 368 с.
тов, который обеспечивает необходимый для отражения специфики объектов уровень их детализации. Графические объекты интерпретируются вероятностными моделями, алгебры которых позволяют отразить специфику исследуемых графических объектов. Информационная емкость графических объектов количественно оценивается энтропией. Для количественной оценки близости изображений используются вероятности и энтропии случайных событий, образующих алгебры их вероятностных моделей.
Меры количества информации в графических объектах и информационного расстояния между объектами могут идентифицироваться по эмпирической информации, получаемой с объекта в процессе его штатной эксплуатации. Для решения задач подобного рода разработаны и используются различные статистические инструменты и методы: структурная и параметрическая идентификация, регрессионный анализ, дисперсионный анализ. Подробно технология обработки исходных данных, синтеза модели и анализа взаимодействия факторов описана авторами в работе [14].
9. Кузнецов Л. А. Управление качеством в сложных технологических процессах // Проблемы управления. 2007. № 3. С. 47-53.
10. Кузнецов Л. А. Энтропийный критерий мониторинга металлургической технологии // Сталь. 2007. № 6. С. 79-86.
11. Кузнецов Л. А. Теоретические основы автоматизированной оценки знаний // Качество. Инновации. Образование. 2010. № 11. С. 8-19.
12. Кузнецов Л. А. Вероятностно-статистическая оценка адекватности информационных объектов // Информатика и ее применения. 2011. Т. 5. Вып. 4. С. 39-50.
13. Гаспарян А. В., Киракосян А. А. Система сравнения отпечатков пальцев по локальным признакам // Вестник РАУ Сер. Физико-математические и естественные науки. 2006. № 2. С. 85-91.
14. Кузнецов Л. А., Кузнецова В. Ф., Бугаков Д. А. Формализация некоторых оценок в образовательном процессе // Информатизация образования и науки. 2012. № 2. С. 112-124.