Научная статья на тему 'Условные морфологические меры сложности и информативности изображений'

Условные морфологические меры сложности и информативности изображений Текст научной статьи по специальности «Математика»

CC BY
226
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
математическая морфология / сложность форм / информативность форм. / mathematical morphology / shape complexity / shape information.

Аннотация научной статьи по математике, автор научной работы — Брянский Станислав Андреевич, Визильтер Юрий Валентинович

Предложены новые условные меры сложности и информативности, а также взаимной информативности изображений. Предложенные оценки сложности и информативности отличаются от ранее известных тем, что зависят не только от площадей областей разбиения кадра, но и от их формы. Для этого мозаичные модели формы изображений, характерные для морфологии Пытьева, используются совместно с фигурными картами толщин, рассматривавшихся ранее лишь в рамках математической морфологии Серра. В статье исследованы математические свойства морфологических карт толщин и соответствующих им оценок морфологической сложности и информативности в зависимости от свойств используемых наборов структурирующих элементов. Приведены качественные примеры вычисления всех предложенных характеристик формы, а также численные результаты экспериментов по оценке и сравнению сложности форм на открытой базе изображений Kimia99.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Брянский Станислав Андреевич, Визильтер Юрий Валентинович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Morphological estimates of image complexity and information content

We propose new morphological conditional estimates of image complexity and information content as well as morphological mutual information. These morphological estimates take into account both the number and the shape of image tessellation (mosaic) regions. We provide such a region shape account via joint use of mosaic image shape models based on the morphological image analysis (MIA) proposed by Yu. Pyt’ev and morphological thickness maps from the mathematical morphology (MM) introduced by J. Serra. Mathematical properties of morphological thickness maps are explored w.r.t. properties of structured elements, and corresponding properties of the proposed morphological image complexity and information content are proved. Some experimental results on image shape comparison in terms of shape complexity and information are reported. Open access images from a Kimia99 database are utilized for these experiments.

Текст научной работы на тему «Условные морфологические меры сложности и информативности изображений»

УСЛОВНЫЕ МОРФОЛОГИЧЕСКИЕ МЕРЫ СЛОЖНОСТИ И ИНФОРМАТИВНОСТИ ИЗОБРАЖЕНИЙ

С.А. Брянский '"2, Ю.В. Визильтер2 1 Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский авиационный институт (национальный исследовательский университет)»" Москва, Россия, 2 Федеральное государственное унитарное предприятие «Государственный научно-исследовательский

институт авиационных систем», Москва, Россия

Аннотация

Предложены новые условные меры сложности и информативности, а также взаимной информативности изображений. Предложенные оценки сложности и информативности отличаются от ранее известных тем, что зависят не только от площадей областей разбиения кадра, но и от их формы. Для этого мозаичные модели формы изображений, характерные для морфологии Пытьева, используются совместно с фигурными картами толщин, рассматривавшихся ранее лишь в рамках математической морфологии Серра. В статье исследованы математические свойства морфологических карт толщин и соответствующих им оценок морфологической сложности и информативности в зависимости от свойств используемых наборов структурирующих элементов. Приведены качественные примеры вычисления всех предложенных характеристик формы, а также численные результаты экспериментов по оценке и сравнению сложности форм на открытой базе изображений К1ш1а99.

Ключевые слова: математическая морфология, сложность форм, информативность форм.

Цитирование: Брянский, С.А. Условные морфологические меры сложности и информативности изображений / С.А. Брянский, Ю.В. Визильтер // Компьютерная оптика. -2018. - Т. 42, № 3. - С. 501-509. - Б01: 10.18287/2412-6179-2018-42-3-501-509.

Введение

В морфологии Пытьева [1] понятие «морфологической сложности» мозаичной формы изображения традиционно вводится следующим образом.

Пусть изображение представляет собой непрерывно определенную двумерную функцию распределения яркости на кадре

/ (х, у): О^Я, Ос Я2

(1)

где О - область кадра ограниченного размера, Я -множество действительных чисел, Я2 - плоскость кадра. Кадр будем считать прямоугольным, хотя в общем случае форма кадра может быть произвольной. Такие изображения являются элементами гильбертова пространства Ь2(О) со скалярным произведением (/ g), нормой ||/|| и евклидовым расстоянием /, g) = ||/- ё||.

Пусть теперь мозаичное изображение представляет собой кусочно-постоянную функцию вида

/(х, у) = Х ,=,.„/ х Е (х, у), (2)

где п - число областей разбиения Е кадра О на связные непересекающиеся области постоянной яркости, Е = {Еь ..., Еп}, /= (/ь ...,/п) - вектор действительных значений яркости, соответствующих каждой области разбиения; %Е, (х, у)е{0, 1} - характеристическая функция /-й области яркости:

1Х( х, у) £ Е ,

X (х у) =

0,( х, у) г е,.

(3)

Множество изображений одной формы разбиения кадра Е в таком случае образовывает выпуклое и замкнутое подпространство Ес£2(Ц):

Е = {/(х, у) = X,=1...п /У^ (х, у), / £ Яп }.

(4)

В рамках данной работы мы будем говорить о пыть-евских разбиениях кадра как о мозаичных формах. Легко убедиться, что пытьевские формы образуют алгебраическую структуру типа «решетка», в которой для любых двух форм Е и О можно указать форму более сложную Е л О и менее сложную Е V О. Более сложные формы получаются из менее сложных разбиением, а менее сложные из более сложных - слиянием областей. Форма Е л О содержит набор областей, образующихся попарным пересечением исходных форм Е и О. Форма Е V О - это такая форма, которая является наиболее сложной среди всех форм, являющихся более простыми как по отношению к Е, так и по отношению к О. При этом образуется множество монотонно вложенных друг в друга пытьевских форм (классов изображений), получаемых последовательным разбиением исходной формы (или, напротив, последовательным слиянием областей базовой формы).

Как видно, введенное таким образом отношение «более сложный по форме» (записывается Е> О » Е=Е л О » Е з О) является отношением не полного, а частичного порядка - большинство форм являются несравнимыми по сложности. В связи с этим в работе [10] был предложен способ распространения морфологического отношения «более сложный по форме» на множество всех пытьевских форм, причем формируется не только бинарное отношение, но и мера сложности. Мерой сложности образа было предложено называть любую такую неотрицательную функцию от некоторого дескриптора формы образа, которая монотонно увеличивается при таких последовательных трансформациях образа, при

которых число его элементов увеличивается. В частности, ранее было показано, что для мозаичных форм изображений, описываемых разбиением Е кадра О площади на непересекающиеся связные области Е, с соответствующими площадями подобной мерой сложности является:

Цн (F) = £ pt • (1 - Pi) =

i=1

n S

= 1 -EP¡, Pi =7T, i = 1...n .

(5)

Заметим, что количество информации по Шеннону (информативность)

I (F) = -£ Pi • log Pt (6)

i

также является мерой сложности мозаичной формы в указанном смысле.

Такое определение мер сложности и информативности полностью согласовано с морфологией Пытьева, однако не вполне согласовано с интуитивным представлением о сложности мозаичных форм, поскольку эти функции зависят лишь от площадей областей мозаичной формы, но не от формы областей, которая также может быть более или менее сложной. Рассмотрим простые примеры мозаичных форм на дискретном кадре размера 6*6, показанные на рис. 1. Дискретные изображения будем рассматривать как частный случай непрерывных, таких, что каждому пикселу дискретного изображения соответствует квадратная область единичного размера на непрерывном изображении. Заметим, что интуитивно кажется, что форма A, содержащая 2 области равной площади, существенно проще не только по сравнению с формой В, содержащей больше областей меньшей площади, но и по сравнению с формой Б, содержащей такое же количество областей той же площади, что и A (2 области площадью полкадра). При этом впечатление большей сложности формы Б возникает, очевидно, не за счет изменения количества или различий в размерах (площади) областей, а за счет их сложной формы: визуально форма Б, состоящая из узких полос, ближе по сложности к форме В, также состоящей из узких полос, чем к форме A, состоящей из широких полос. Этот простой пример показывает, что учет только распределения площадей областей разбиения недостаточен для оценки сложности мозаичной формы.

-1\-1\-1 ее ее ее

вое 1+7 +1

-1 -1 -1 3+7 +1 +1

-1 -1 -1 3+7 +1 +1

вое 3+7 +1 +1

ееееее

а)

Рис. 1. Примеры мозаичных форм различной сложности: 2 области простой формы (а); 2 области сложной формы («спираль») (б); 6 простых областей, схожих с формой «спираль» (в)

Чтобы преодолеть этот недостаток, в данной работе предлагается объединить аппарат мозаичных моделей формы Пытьева с аппаратом карт толщин, ра-

нее рассматривавшийся лишь в рамках математических морфологий типа Серра [2]. Карты толщин ранее были рассмотрены, в частности, в работе [3], где они использовались в качестве вспомогательного инструмента для построения морфологических спектров, впервые предложенных Марагосом [4] и затем обобщенных в работе [5].

1. Условные меры сложности и информативности

Пусть задан некий набор структурирующих элементов (связных бинарных фигур, СЭ) B, упорядоченных по размеру (площади), которые называются множеством элементов покрытия. Тогда картой толщин бинарной фигуры H относительно B называется такая функция тн,В (х, у), которая каждой точке фигуры ставит в соответствие площадь максимального покрывающего ее элемента из B, целиком вписанного в фигуру Н. Соответственно, картой толщин мозаичной формы Е = {Е1 ... Еп} относительно B называется такая функция Тр,Б (х, у), которая каждой точке кадра (х, у) ставит в соответствие площадь максимального покрывающего ее элемента из В, целиком вписанного в ее область принадлежности:

те, в (х, у) = Те , в (х, у) : (х, у) е Е, .

Используя мозаичную модель формы, карту толщин можно описать как

TF,в (X У) = E,■=i..n ТF,B (X У) XF (X У).

(7)

Введем понятие аморфных СЭ. Пусть аморфный СЭ с центром в некоторой точке кадра целиком заполняет связную область Е, мозаичной формы Е, которой принадлежит эта точка (т.е. принимает форму и размер этой области Е,). Легко убедиться, что в случае, когда В представляет собой множество А аморфных СЭ, тЕ,А (х, у) = 5,, если (х,у) е Е. Отсюда:

£ Tf,a (x, y)dx dy = E П=1 S/ = S2 • (1 - цh (F)):

цн (F) = 1 - mean с

,(*, У)

S

(8)

mean Q (f (x, y)) =

£ f (x y)dx dy

iL1d* dy '

т.е. введенная ранее мера сложности цн (Е) может интерпретироваться как средняя нормированная площадь максимальной покрывающей фигуры из множества А аморфных СЭ. Обобщая эту идею, условной морфологической сложностью цнВ (Е) мозаичной формы Е относительно заданного набора структурирующих элементов в, предлагается называть функцию

Ц н, в(F) =1 - mean с

,(x, y)

S

(9)

Для того, чтобы качественно оценить свойства введенной функции морфологической сложности, рассмотрим формы с рис. 1. Соответствующие им

i=1

прямоугольные карты толщин (здесь В - множество всех прямоугольников) показаны на рис. 2. Как видно, карта прямоугольных толщин для формы В оказалась строго меньше не только карты толщин для формы Л, но и даже карты толщин для формы В, а значит, ця,В (Б) > ^Нв(В) > |ая,В (Л). Интуитивно это понятно - в форме В есть не только вертикальные, но и горизонтальные области, а также углы, отрезки разной длины, т.е. она разнообразнее, а значит, сложнее. Таким образом, мы убедились, что на качественном уровне введенное понятие морфологической сложно -сти форм вполне соответствует интуитивным представлениям человека.

пШмШШЖ

181Ц8ЩШШ

18М18ЩЩЩ

181818ЩШШ 18М18ЩЩЩ 18\18\18ШШШ

Рис. 2. Карты толщин, соответствующие формам с рис. 1

Важным частным случаем такой условной меры сложности является случай, когда В = Б - множество дисковых структурирующих элементов произвольного размера. В этом случае мера сложности мозаичной формы будет инвариантна к повороту и масштабированию изображения. Кроме того, такая карта толщин, а значит, и мера сложности может быть быстро вычислена при помощи непрерывного скелета [3]. В других случаях могут применяться другие наборы СЭ, например, эллиптические, прямоугольные и т.п. При этом будут получаться различные меры условной сложности, характеризующие не только распределение размеров, но и распределение локальных форм мозаичных областей.

Аналогично легко заметить, что:

1 (Р) = -Х Р, ■ 1оё Р, =

-1 к *

с( X, у)

К Я

Откуда

!л (Р) = - теапа

(10)

^ dy.

Д X, у)

Я

(11)

Соответственно, условной морфологической информативностью 1В (Р) мозаичной формы Р относительно заданного набора структурирующих элементов В предлагается называть минус средний логарифм нормированной площади максимального покрывающего СЭ из данного множества:

( (Т ,л\Л

1в (Р) = - теап с

1оя

3( X, у)

Я

(12)

Такая условная информативность характеризует распределение информации не только по размерам, но и по формам локальных областей мозаичной формы.

Необходимо отметить, что предложенные обобщения мер сложности и информативности будут являться полностью корректными лишь в тех случаях, когда они удовлетворяют введенному ранее условию: они должны монотонно увеличиваться при таких последовательных трансформациях образа, при которых число его элементов увеличивается. Для мозаичных форм это означает, что при любом разбиении любой области мозаичной формы на две подобласти введенные функции |Н, В (Р) и 1В (Р) должны увеличиваться (отсюда автоматически следует, что при любом слиянии двух соседних областей формы в одну эти функции должны уменьшаться). В исходных выражениях (т.е. при В = Л, для множества аморфных СЭ) выполнение этого условия очевидно, т. к. при разбиении любой области мозаичного покрытия на две части средний размер области строго уменьшается. Однако обобщенные выражения монотонно зависят от, вообще говоря, произвольной функции тР, В (х, у), и, следовательно, их свойства зависят от свойств данной функции, а именно: функции |Н, В (Р) и 1В (Р) увеличиваются, если тРВ (х, у) убывает, и убывают, если тР, В (х, у) возрастает. В связи с этим исследуем поведение карты толщин при разбиении областей мозаичной формы.

Докажем сначала более слабое свойство.

Утверждение 1. При любом заданном множестве структурирующих элементов В, карта толщин мозаичной формы Р не возрастает при разбиении областей формы: Р > О ^ тР, В (х, у) < тО, В (х, у).

Доказательство. Фиксируем некоторую точку (х, у) и рассмотрим множества всех покрывающих ее элементов из В, целиком вписанных в ее область принадлежности в формах Р и О соответственно. Поскольку область принадлежности любой точки в более сложной (по Пытьеву) форме Р всегда целиком принадлежит области принадлежности в менее сложной форме О, то, соответственно, и множество вписанных СЭ такой области из Р целиком принадлежит множеству вписанных СЭ содержащей ее области из О. Отсюда следует, что ни одного нового вписанного СЭ, покрывающего рассматриваемую точку в Р по сравнению с О, появиться не может. А, значит, при переходе от О к Р максимальный размер покрывающего СЭ в данной точке не может увеличиться, поскольку в Р не появится новый максимальный покрывающий вписанный СЭ, больший, чем в О. Поскольку такое рассуждение справедливо для всех точек карты толщин, можно заключить, что при любых последовательных разбиениях мозаичной формы значения карты толщин монотонно не возрастают.

Отсюда следует, что справедливо следующее утверждение:

Следствие 1. При любом заданном множестве структурирующих элементов В, функции |Н, В (Р) и 1В (Р) не убывают при разбиении областей мозаичной формы: Р> О ^ |н,в (Р) > |н,в (О), 1в (Р) > 1в (О ).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Однако для точного соответствия ранее введенным определениям этого недостаточно. Необходимо,

чтобы эти функции строго возрастали при разбиениях областей формы, а для этого необходимо, чтобы и карты толщин удовлетворяли следующему более сильному свойству - они должны строго убывать при разбиениях кадра:

(Е > О : Е > О, Е Ф О) ^

^Тев (х, у) <Тов (х, у) »

' ' (13)

» х, у): т е , в (х, у) < То, в (х, У);

3 (х, у): т е , в (х, У) < То, в (х, У).

К сожалению, для СЭ произвольной формы это условие не выполняется. Рис. 1 демонстрирует пример разбиения фигуры (области) прямоугольной формы, при котором размер максимального покрывающего элемента квадратной формы остается неизменным. Как показано на рис. 3 вверху, можно указать такие точки исходной области (фигуры), для которых разрез пересекает максимальные покрывающие СЭ. Однако, как показано на рис. 3 ниже, при этом все равно можно найти другие покрывающие СЭ того же размера, что и прежний максимальный СЭ, не затронутые разрезом. Нижний рисунок на рис. 3 показывает, что в данном случае вся карта толщин после разреза останется неизменной, поскольку вновь образовавшиеся области можно целиком покрыть объединением оставшихся прежних максимальных СЭ, не затронутых разрезом (не пересекающихся с линией разреза).

о

{1

о

Рис. 3. Пример разбиения фигуры (области) прямоугольной формы, при котором размер максимального покрывающего элемента квадратной формы остается неизменным во всех точках кадра

Однако, как показано на рис. 4, в случае строго выпуклых, в частности, дисковых СЭ, ситуация меняется (строго выпуклые фигуры - это такие выпуклые фигуры, границы которых не содержат прямолинейных отрезков). Теперь можно указать точки, в которых после разреза более не существует ни одного покрывающего СЭ прежнего размера. На рис. 4 снизу темным показано объединение всех исходных максимальных СЭ, не затронутых разрезом - в этих точках значение карты толщин после разреза не меняется. Во всех остальных точках (помечены белым цветом) значение карты толщин после размера строго уменьшается, т. е. вся карта толщин как единая функция на

кадре в данном примере строго убывает вследствие произведенного разреза.

Естественно, одного примера и общего качественного рассуждения недостаточно для доказательства желательного свойства дисковой карты толщин. Ниже приведено строгое доказательство этого утверждения.

Рис. 4. Пример разбиения фигуры (области) прямоугольной формы, при котором размер максимального покрывающего элемента дисковой формы уменьшается (во всех точках, помеченных светлой областью на нижнем рисунке)

Утверждение 2. При использовании множества структурирующих элементов Б дисковой формы дисковая карта толщин мозаичной формы Е убывает при разбиении областей формы:

(Е > О: Е > О, Е Ф О) ^

^ Те б (х, у) < То б (х, у) » » х, у): Те,Б (х, у) < То,б (х, у); 3 (х, у): Те,в (х, у) < То,в (х, у).

(14)

Доказательство. Первая часть данного утверждения непосредственно следует из Утверждения 1:

Е > О ^ Е > О ^

(15)

х, у): Те, (х, У) <То, ( х, У ).

Для доказательства второй части утверждения необходимо показать, что существует хотя бы одна точка фигуры (области), в которой после разреза значение карты толщин уменьшится. Рассмотрим максимальный покрывающий диск, касающийся границы фигуры в некоторой точке контура Р (рис. 3). Для любой невырожденной точки контура, где существует касательная к контуру, существует единственный максимальный вписанный круг, покрывающий данную точку контура. Это связано с тем, что множество всех вписанных дисков, покрывающих данную точку, представляет собой множество дисков, касающихся контура в данной точке, т.е. имеющих радиус, исходящий из этой точки и перпендикулярный касательной к контуру в этой точке. Назовем это семейство дисков касательными дисками для точки Р. Все они упорядочены по размеру, и не существует двух касательных дисков одинакового размера. Максимальный из этих дисков касается границы фигуры как минимум еще в одной точке. Это единственный макси-

мальный покрывающий диск для данной точки, поскольку все остальные касательные диски для этой точки меньше его по размеру.

Предположим, что произведен разрез фигуры, разделяющий ее на части и при этом разрезающий (пересекающий) максимальный касательный диск для точки Р. В этом случае такой диск больше не может быть максимальным касательным диском для Р, т. к. он не вписывается целиком в уменьшившуюся часть области (фигуры), содержащую Р. Новым максимальным касательным диском для Р станет такой касательный диск, который целиком содержится в новой области принадлежности точки Р и при этом касается также линии разреза. Поскольку исключенный (разрезанный) диск был максимальным, а все остальные касательные диски были меньшего размера, то после разреза значение карты толщин в точке Р уменьшится (рис. 5).

Рис. 5. Максимальный покрывающий диск (заливка), касающийся границы фигуры в заданной точке; касательная к контуру фигуры в данной точке; семейство

покрывающих дисков, касающихся границы фигуры в заданной точке (пунктирные окружности); линия разреза фигуры, пересекающая максимальный покрывающий диск; новый (меньший) максимальный покрывающий диск,

касающийся границы фигуры в данной точке, а также касающийся линии разреза (темная заливка)

Но всегда ли можно утверждать, что при любом разрезе фигуры любой произвольной формы на ее контуре обнаружится такая точка Р, максимальный касательный диск которой окажется разрезан? Да, это можно утверждать, поскольку существует конструктивный способ отыскать такую точку. Идея этого способа показана на рис. 6. Как известно, дисковым скелетом двумерной фигуры называется множество центров всех максимальных вписанных дисков. Доказано, что такой скелет всегда представляет собой плоский пла-нарный граф, и существуют эффективные алгоритмы построения таких скелетов, в частности, для полигональных фигур произвольной формы [6]. После разреза скелет изменится. Теперь он будет состоять из объединения скелетов двух получившихся после разреза фигур. При этом часть прежних максимальных вписанных дисков в любом случае окажется разрезан, а их центры будут исключены из совокупного скелета разрезанной фигуры. Таким образом, достаточно построить дисковые скелеты фигуры (области) до и после разреза, а затем определить, какие точки скелета оказались из него исключены - так мы узнаем, какие мак-

симальные вписанные диски перестали быть таковыми. Выберем любую такую исключенную точку исходного скелета и определим точки касания соответствующего максимального диска на контуре исходной фигуры. Это и есть искомая точка, в которой карта толщин после разреза строго уменьшается.

\п \ /

/к. ) \

о

\ /'У Ж к

о

/Щ V \

Рис. 6. Исходный дисковый скелет; измененный скелет после разреза; точка на удаленной после разреза части исходного скелета; проекция этой точки на контур исходной фигуры; семейство касательных дисков к точке-проекции; новый (уменьшенный) максимальный касательный диск

Таким образом, Утверждение 2 можно считать полностью доказанным.

Следствие 2. При использовании множества структурирующих элементов Б дисковой формы функции Ця, о (Е) и 1о (Е) возрастают при разбиении областей мозаичной формы:

Е > О ^ Ця,о (Е) > Ця,о (О), 1о (Е) > 1о (О ).

На самом деле изложенное выше доказательство справедливо не только для дисковых, но и для любых строго выпуклых СЭ, для которых существуют касательные семейства вписанных СЭ и скелеты обладают схожими свойствами (обобщенным скелетом двумерной фигуры по множеству СЭ заданной формы называется множество центров всех максимальных вписанных СЭ этой формы). Выпуклые СЭ многоугольной формы не являются строго выпуклыми, т.к. допускают наличие нескольких различных максимальных вписанных касательных СЭ в точке контура фигуры. Именно этим объясняется сохранение неизменной карты толщин квадратных СЭ при разрезе прямоугольника (рис. 1). Однако на практике любой полигональный СЭ легко преобразуется в близкий по форме строго выпуклый СЭ путем замены всех линейных отрезков контура дугами окружностей малой положительной кривизны с теми же конечными точками. Поэтому в дальнейшем мы будем считать, что в является семейством (набором) строго выпуклых СЭ. Для таких наборов СЭ предложенные обобщения мер сложности и информативности полностью корректны.

2. Эксперименты с условными мерами сложности и информативности

Для проведения численных экспериментов с предложенными мерами сложности и информативности были использованы карты толщин на основе дискового структурирующего элемента. Были рассчитаны условные меры сложности и информативности для бинарных объектов, входящих в базу изображений Клт1а99 [11].

База К1ш1а99. Размеры изображения - 275x275 пикселей. Объекты крупные, занимают не менее 50 % изображения, располагаются в центре изображения. Изображения бинарные, то есть состоят из двух областей, которые условно можно назвать объектом и фоном. Мера сложности изображения представляет собой набор мер сложности для каждой из областей изображения. Следовательно, каждому изображению базы ставится в соответствие двумерный вектор признаков («вектор информативности»), включающий условную меру сложности (информативности) области объекта и области фона (в дальнейшем просто «объекта» и «фона»).

Условные меры сложности

График распределения условных мер сложности по классам набора изображений приведён на рис. 7.

Условная мера сложности фона

0,85-

0,5 0,6 0,7 0,8 0,9 1,0 Условная мера сложности объекта

Рис. 7. Распределение условных мер сложности изображений базы Ктга99 по классам. По горизонтальной оси отложена условная мера сложности объекта, а по вертикальной - фона

На рис. 7 видно, что объекты одного класса имеют схожие показатели мер сложности как для объекта, так и для фона. Отклонения объектов класса от центра класса в данном двумерном пространстве признаков представлены в табл. 1.

В табл. 2 более подробно представлены изображения двух классов из этой базы, расположенных по мере увеличения их сложности. Для каждого класса в таблице приведены изображение и длина собственного вектора данного изображения.

Как видно из приведенных выше таблиц и рис. 7, мера сложности объекта растет в связи с увеличением детализации объекта и уменьшается с уменьшением детализации соответственно. Также видно, что объекты

класса «Животные», имеющие одинаковый биологический вид, обладают и близкими мерами сложности.

Табл. 1. Примеры отклонений объектов от центра класса

Эталонное изображение

0,929 0,81

0,856 0,845

0,603 0,865

0,426 0,841

0,753 0,871

0,827 0,882

0,611 0,862

0,849 0,89

0,893 0,895

1-е отклонение

0,897 0,818

0,799 0,864

0,529 0,864

0,361 0,84

0,695 0,871

0,76 0,88

0,581 0,864

0,75 0,884

0,878 0,876

2-е отклонение

0,931 0,832

0,86 0,869

0,668 0,852

0,441 0,841

0,793 0,872

0,858 0,901

0,714 0,861

0,883 0,912

0,912 0,904

Табл. 2. Примеры изображений объектов двух классов, отсортированных по мере увеличения их меры сложности

8-й класс «Животные»

и*

1,16

1,17

1,21

1,22

1,22

1,23

1,23

1,24

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1,24

1,26

1,27

6-й класс «Самолёт»

41

1,163

1,179

1,189

1,194

1,203

1,209

1,224

1,226

1,236

1,244

1,244

Аналогично мерам сложности приведены график и таблицы с результатами для мер информативности. График распределения условных мер сложности по классам набора изображений приведён на рис. 8. Условная мера информативности фона

^ Условные меры

информативности

. . 1,5 2,0 2,5 3,0

Условная мера информативности объекта

Рис. 8. Распределение условных мер информативности изображений базы Ктга99 по классам. По горизонтальной оси отложена условная мера информативности объекта, а по вертикальной - фона

Условные меры информативности

В табл. 3 приведены изображения двух классов из этой базы, расположенных по мере увеличения их информативности.

Табл. 3. Примеры условных мер информативности объектов

Наибольшая информативность

2,335 1,978

1,869 2,109

0,891 2,042

0,65 1,936

1,757 2,178

1,988 2,233

1,091 2,037

1,845 2,232

2,501 2,236

Наименьшая

информативность

2,889 1,955

ч 2,475 2,227

* 1,271 2,119

♦ 0,864 1,955

2,174 2,19

р 2,54 2,438

г 1,486 2,056

м 2,701 2,535

2,87 2,442

В табл. 4 приведены примеры изображений с наибольшими и наименьшими показателями условной меры информативности. В качестве показателя условной меры считалась длина условного вектора,

проведённого из начала координат в точку пространства, характеризуемую координатами - составляющими вектора информативности.

Табл. 4. Примеры изображений объектов двух классов, отсортированных по мере увеличения их меры сложности

6-й класс «Самолёт»

2,990

3,022

3,053

3,084

3,106

3,267

3,347

3,367

3,415

3,443

3,521

8-й класс «Животные»

2,896

2,938

3,156

3,185

3,221

3,248

3,305

3,360

3,363

3,626

3,704

Как видно из приведенных выше таблиц и рис. 8, мера информативности объекта растет в связи с увеличением детализации объекта и уменьшается с уменьшением детализации соответственно. В отличие от меры сложности самолёты, хвост которых перекрыт прямоугольником, в большинстве случаев имеют меньшую информативность, чем их неперекрытые изображения. Также видно, что объекты класса «Животные», имеющие одинаковый биологический вид, обладают и близкими мерами информативности.

По рис. 8 можно определить, что объекты одного класса, то есть имеющие схожую форму, могут иметь разные меры информативности, и объекты разной формы могу иметь схожие значения информативности.

Также на меру информативности влияет искривление деталей на объекте, повышение детализации объекта или же, наоборот, отсутствие каких-нибудь частей объекта. Как видно из табл. 2, именно такие объекты обладают наибольшими и наименьшими показателями информативности в своём классе.

Заключение

В данной статье были введены понятия условной морфологической сложности и условной морфологи-

ческой информативности определяемых относительно заданных наборов структурирующих элементов некоторой формы и вычисляемых с использованием соответствующих морфологических карт толщин. Исследованы математические свойства морфологических карт толщин и соответствующих им оценок морфологической сложности и информативности в зависимости от свойств используемых наборов структурирующих элементов.

Проведенные на открытой базе изображений Kimia99 эксперименты подтвердили, что предложенные оценки морфологической информативности действительно характеризуют степень детализации объекта: чем выше детализация, тем больше значение информативности. Как правило, изображения объектов одного типа имеют схожие показатели сложности и информативности. При этом, естественно, объекты различной формы могут иметь схожие показатели -мера информативности не является дескриптором формы, а лишь оценкой ее сложности.

Благодарности

Исследование выполнено за счёт гранта Российского научного фонда (проект № 16-11-00082).

Литература

1. Пытьев, Ю.П. Методы морфологического анализа изображений / Ю.П. Пытьев, А.И. Чуликов. - М.: Физмат-лит, 2010. - 336 c. - ISBN: 978-5-9221-1225-3.

2. Serra, J.P. Image analysis and mathematical morphology / J.P. Serra. - Orlando, USA: Academic Press Inc, 1982. -610 с. - ISBN: 978-0-12637240-3.

3. Сидякин, С.В. Разработка алгоритмов построения морфологических спектров для анализа цифровых изо-

бражений и видеопоследовательностей : дис. ... канд. техн. наук : 05.13.17 / Сидякин Сергей Владимирович. -М., 2013. - 163 с.

4. Maragos, P. Pattern spectrum, multiscale shape representation / P. Maragos // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1989 - Vol. 11, Issue 7. -P. 701-716. - DOI: 10.1109/34.192465.

5. Визильтер, Ю.В. Параметрические и морфологические спектры / Ю.В. Визильтер, С.В. Сидякин // Компьютерная оптика. - 2015. -Т. 39, № 1. - С. 109-118. - DOI: 10.18287/0134-2452-2015-39-1-109-118.

6. Местецкий, Л.М. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. - М.: Физ-матлит, 2009. - 288 с. - ISBN: 978-5-9221-1050-1.

7. Ломов, Н.А. Площадь дискового покрытия - дескриптор формы изображения / Н.А. Ломов, Л.М. Местецкий // Компьютерная оптика. - 2016. - Т. 40, № 4. - С. 516525. - DOI: 10.18287/2412-6179-2016-40-4-516-525.

8. Chochia, P.A. Comparison of two-dimensional variations in the context of the digital image complexity assessment / P.A. Chochia, O.P. Milukova // Journal of Communications Technology and Electronics. - 2015. - Vol. 60, Issue 12. -P. 1432-1440. - DOI: 10.1134/S1064226915120049.

9. Yu, H. Image complexity and spatial information / H. Yu, S. Winkler // 2013 Fifth International Workshop on Quality of Multimedia Experience (QoMEX). - 2013. - P. 12-17. -DOI: 10.1109/QoMEX.2013.6603194.

10. Vizilter, Yu.V. Shape-based image matching using heat kernels and diffusion maps / Yu.V. Vizilter, V.S. Gorbat-sevich, A.Yu. Rubis, S.Yu. Zeltov // International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. - 2014. - Vol. XL-3. - P. 357-364. - DOI: 10.5194/isprsarchives-XL-3-357-2014.

11. Binary image dataset Kimia99 [Электронный ресурс]. -URL: https://github.com/mmssouza/kimia99 (дата обращения 14.05.2018).

Сведения об авторах

Брянский Станислав Андреевич, 1992 года рождения, в 2015 году окончил ФГБОУ ВПО «Московский авиационный институт (национальный исследовательский университет)». В настоящее время является аспирантом ФГБОУ ВПО «Московский авиационный институт (национальный исследовательский университет)». В настоящее время является инженером ФГУП «ГосНИИАС». Область научных интересов: обработка и анализ изображений, математическая морфология, распознавание образов. E-mail: [email protected] .

Визильтер Юрий Валентинович, 1970 года рождения, в 1992 году окончил ФГБОУ ВПО «Московский авиационный институт (национальный исследовательский университет)». В 1997 г. защитил кандидатскую, а в 2009 году - докторскую диссертацию. В настоящее время является начальником подразделения ФГУП «ГосНИИАС». Область научных интересов: обработка и анализ изображений, цифровая фотограмметрия, машинное зрение, математическая морфология, распознавание образов, машинное обучение, биометрия. E-mail: [email protected] .

ГРНТИ: 28.23.15.

Поступила в редакцию 7 декабря 2017 г. Окончательный вариант - 16 мая 2018 г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

MORPHOLOGICAL CONDITIONAL ESTIMATES OF IMAGE COMPLEXITY AND INFORMATION CONTENT

S.A. Brianskiy1, Yu.V. Vizilter1,2

1 Moscow Aviation Institute, Moscow, Russia,

2FGUP "GosNIIAS, Moscow, Russia

Abstract

We propose new morphological conditional estimates of image complexity and information content as well as morphological mutual information. These morphological estimates take into account both the number and the shape of image tessellation (mosaic) regions. We provide such a

region shape account via joint use of mosaic image shape models based on the morphological image analysis (MIA) proposed by Yu. Pyt'ev and morphological thickness maps from the mathematical morphology (MM) introduced by J. Serra. Mathematical properties of morphological thickness maps are explored w.r.t. properties of structured elements, and corresponding properties of the proposed morphological image complexity and information content are proved. Some experimental results on image shape comparison in terms of shape complexity and information are reported. Open access images from a Kimia99 database are utilized for these experiments.

Keywords: mathematical morphology, shape complexity, shape information.

Citation: Brianskiy SA, Vizilter YuV. Morphological conditional estimates of image complexity and information content. Computer Optics 2018; 42(3): 501-509. DOI: 10.18287/2412-6179-2018-423-501-509.

Acknowledgements: The work was partially funded by the Russian Science Foundation under grant # 16-11-00082.

References

[1] Pyt'ev YuP, Chulikov AI. Methods of morphological analysis of images [In Russian]. Moscow: "Fizmatlit" Publisher; 2010. ISBN: 978-5-9221-1225-3.

[2] Serra JP. Image analysis and mathematical morphology. Orlando, USA: Academic Press Inc; 1982. ISBN: 978-012637240-3.

[3] Sidyakin SV. Morphological pattern spectra algorithm development for digital image and video sequences analysis [In Russian] The Thesis for the Candidate's Degree in Technical Sciences. Moscow; 2013.

[4] Maragos P. Pattern spectrum, multiscale shape representation. IEEE Transactions on Pattern Analysis and Machine Intelligence 1989; 11(7): 701-716. DOI: 10.1109/34.192465.

[5] Vizilter YuV, Sidyakin SV. Parametric and morphological spectra [In Russian]. Computer optics 2015; 39(1): 109118. DOI: 10.18287/0134-2452-2015-39-1-109-118.

[6] Mestetskiy LM. Continuous morphology of binary images: figures, skeletons, circulars [In Russian]. Moscow: "Fizmatlit" Publisher; 2009. ISBN: 978-5-9221-1050-1.

[7] Lomov NA, Mestetskiy LM. Area of the disk cover as an image shape descriptor. Computer Optics 2016; 40(4): 516-525. DOI: 10.18287/2412-6179-2016-40-4-516-525.

[8] Chochia PA, Milukova OP. Comparison of two-dimensional variations in the context of the digital image complexity assessment. Journal of Communications Technology and Electronics 2015; 60(12): 1432-1440. DOI: 10.1134/S1064226915120049.

[9] Yu H, Winkler S. Image complexity and spatial information. Fifth International Workshop on Quality of Multimedia Experience (QoMEX) 2013: 12-17. DOI: 10.1109/QoMEX.2013.6603194.

[10] Vizilter YuV, Gorbatsevich VS, Rubis AYu, Zeltov SYu. Shape-based image matching using heat kernels and diffusion maps. International Archives of the Photogram-metry, Remote Sensing and Spatial Information Sciences 2014; XL-3: 357-364. DOI: 10.5194/isprsarchives-XL-3-357-2014.

[11] Binary image dataset Kimia99. Source: (https://github.com/mmssouza/kimia99).

Author's information

Stanislav Andreevich Brianskiy (b.1992) graduated from Moscow Aviation Institute (National Research University) in 2015. Currently he is the graduate student at Moscow Aviation Institute. Currently he works as the engineer at the FGUP "GosNIIAS". Research interests are processing and image analysis, computer vision, mathematical morphology, pattern recognition. E-mail: [email protected] .

Yuri Valentinovich Vizilter (b.1970) graduated from Moscow Aviation Institute (National Research University) in 1992. He received his candidate of Technical Sciences in 1997 and Dr. Sci. in Physics and Mathematics in 2009. Currently he works as the head of department at the FGUP "GosNIIAS". Research interests are processing and image analysis, digital photogrammetry, computer vision, mathematical morphology, pattern recognition, machine learning, biometry. E-mail: [email protected] .

Received December 7, 2017. The final version - May 16, 2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.