Научная статья на тему 'Классификация изображений в нечеткой морфологии: алгоритм эмпирического построения решающего правила'

Классификация изображений в нечеткой морфологии: алгоритм эмпирического построения решающего правила Текст научной статьи по специальности «Математика»

CC BY
104
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОРФОЛОГИЧЕСКИЙ АНАЛИЗ ИЗОБРАЖЕНИЙ / MORPHOLOGICAL IMAGE ANALYSIS / НЕЧЕТКАЯ МОРФОЛОГИЯ / FUZZY MORPHOLOGY / ТЕОРИЯ ВОЗМОЖНОСТЕЙ / POSSIBILITY THEORY / ЧИСЛЕННЫЕ АЛГОРИТМЫ / NUMERICAL ALGORITHMS

Аннотация научной статьи по математике, автор научной работы — Зубюк Андрей Владимирович

Разработан и проиллюстрирован в вычислительном эксперименте алгоритм эмпирического построения решающего правила в задаче классификации изображений сцен в теоретико-возможностной постановке, который может быть использован для анализа формы акустических сигналов в геофизике [1], для решения задач интерпретации спутниковых изображений [2] и др.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Зубюк Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация изображений в нечеткой морфологии: алгоритм эмпирического построения решающего правила»

Классификация изображений в нечеткой морфологии: алгоритм эмпирического построения решающего правила

А. В. Зубюк

Московский государственный университет имени М. В. Ломоносова, физический факультет, кафедра компьютерных методов физики. Россия, 119991, Москва, Ленинские горы, д. 1, стр. 2.

E-mail: zubjuk@physics. msu. ru

Статья поступила 29.06.2012, подписана в печать 09.10.2012.

Разработан и проиллюстрирован в вычислительном эксперименте алгоритм эмпирического построения решающего правила в задаче классификации изображений сцен в теоретико-возможно-стной постановке, который может быть использован для анализа формы акустических сигналов в геофизике [1], для решения задач интерпретации спутниковых изображений [2] и др.

Ключевые слова: морфологический анализ изображений, нечеткая морфология, теория возможностей, численные алгоритмы.

УДК: 519.226. PACS: 02.50.Le, 02.50.Tt.

Введение

В настоящей работе рассмотрены математические методы и алгоритм классификации изображений сцен, основанные на математических методах морфологического анализа изображений [3] и методах нечеткой морфологии [4]. Примерами таких объектов могут служить рукописная цифра, так как при ее написании происходят случайные искажения пропорций ее элементов, человек (вообще, а не какой-либо конкретный), так как геометрические формы разных людей различны, и др.

Методы морфологического анализа изображений разработаны для решения таких задач, как поиск известного объекта на неизвестном фоне, выделение неизвестного объекта на известном фоне, классификация изображений сцен и т. п. Трудности при решении подобных задач связаны с тем, что всякое изображение сцены содержит информацию не только о регистрируемой сцене, но также и об условиях регистрации, при которых оно получено и которые, как правило, неизвестны. Такими условиями являются, например, характер освещения объектов сцены, их оптические свойства и т. п. В основе математических методов морфологического анализа изображений лежит понятие формы изображения (см. определение 4 ниже) как максимального инварианта относительно изменения условий регистрации. Форма изображения сцены несет наиболее полную информацию о форме сцены, доступную по ее изображению.

Однако методы морфологического анализа изображений непригодны для решения задач анализа сцен, состоящих из объектов, форма изображения которых не может быть четко определена в силу того, что сами эти объекты не имеют определенной геометрической формы [5]. Кроме того, разработаны алгоритмы наиболее точного эмпирического построения оптимального правила классификации, отличные от алгоритмов, представленных в [6], позволяющих наиболее точно восстанавливать нечеткую модель в задаче классификации. Одновременно с этим всякое изображение сцены,

на которой представлены такие объекты, содержит информацию об условиях регистрации, при которых оно получено.

Математические методы нечеткой морфологии, о которых пойдет речь в настоящей работе, ориентированы на решение задач анализа сцен по их изображениям в ситуациях, когда форма изображения представленных на сцене объектов не может быть четко определена. При этом предполагается, что условия регистрации, при которых получено изображение сцены, неизвестны. Для моделирования нечеткости в настоящей работе используется аппарат теории возможностей [6].

1. Мера возможности

В работе [6] теория возможностей и мера возможности рассмотрены как альтернатива теории вероятностей и вероятности при моделировании неясности и неопределенности, отражающих неполноту знаний исследователя об объекте исследования. В частности, теория возможностей может быть применена для моделирования стохастического объекта, т. е. такого объекта, моделью которого в каждом испытании является некоторое вероятностное пространство, вообще говоря, изменяющееся от испытания к испытанию.

Пусть У — множество элементарных событий, и 7{У) — (Т-алгебра1 всех подмножеств множества У. Определение 1 (см. [6]). Возможностью, определенной на измеримом пространстве {У,7{У)), будем называть всякую функцию Р(-): 7{У) [0,1], обладающую свойствами счетной аддитивности относительно

операции «sup»: pfu^M = SUP Р(^0> полунепре-

\i=1 ) 1=1,2,...

рывности снизу: Р( (J f] Ai) ^ liminfP^), Аг е У(У),

/=1,2,..., и нормированную на 1: Р(30 = 1.

Тройку (У, 7{У), Р) будем называть пространством с возможностью. Эксперимент, моделью которого является пространство с возможностью, будем называть нечетким.

'Здесь и далее запись вида !Р(Л) обозначает сг-алгебру всех подмножеств множества А.

Заметим, что возможность, в отличие от вероятности, всегда может быть определена на <т-алгебре всех подмножеств множества элементарных событий.

Рассмотрим проблему моделирования стохастического объекта теоретико-возможностными методами. Дадим в этой связи следующие определения.

Определение 2 (см. [6]). Будем говорить, что возможность Р согласована с вероятностью Рг на <т-ал-гебре 21, если существует такая функция ¡р(-) е Ф, что Р(Л) = ¡р(Рг(Л)), Л €21. Здесь Ф — класс всех монотонно неубывающих функций <р(-)\ [0,1] -¥ [0,1]. Возможность Р в этом случае будем называть стохастически измеримой.

Определение 3 (см. [6]). Будем говорить, что возможность Р максимально согласована с вероятностью Рг на (Т-алгебре 21, если она согласована с Рг на 21, и для любой возможности Р', согласованной с Рг на 21, найдется такая функция ¡р'(-) е Ф, что Р'(Л) = ¡р'(Р(Л)), Лей.

Пусть в 1-м эксперименте в серии статистически независимых в совокупности экспериментов моделью стохастического объекта является вероятностное пространство 1= 1,2,... . Пусть, кроме того, каждая вероятность Ргг, 1=1,2,..., содержится в классе вероятностей Рг^(Р), с которыми на <т-алгеб-

ре 21 максимально согласована возможность Р (как показано в [6], класс Рг^(Р) состоит, вообще говоря, не из единственной вероятности).

Возможностной моделью такого стохастического объекта разумно считать пространство с возможностью (У, 1)(У),Р)- При этом для любых событий Ль Лг €21, отвечающих условию Р(Л0 > Р(Лг), в достаточно длинной серии испытаний почти наверное частота А\ больше, чем частота Лг, что определяет эмпирическое истолкование возможности: чем больше возможность события, тем чаще оно происходит [6].

Заметим, что в случае, когда про возможность Р и вероятности Ргг, 1= 1,2,..., априори ничего не известно, такой стохастический объект не может быть смоделирован теоретико-вероятностными методами. Действительно, в такой ситуации на основе результатов первых Ь экспериментов невозможно ничего сказать о вероятностях Ргг при / = 1+1,1+2,..., как бы велико ни было Ь. Возможность же Р, одинаковая для всех 1= 1,2,..., при достаточно общих условиях почти наверное может быть точно определена на основе конечной серии испытаний [6].

Таким образом, существуют стохастические объекты, которые могут быть смоделированы теоретико-воз-можностными методами, однако не могут быть смоделированы теоретико-вероятностными. В настоящей статье внимание будет уделено именно таким объектам.

2. Классификация изображений в нечеткой морфологии

Пусть X = {хи ... ,хп} — конечное подмножество координатной плоскости, которое в дальнейшем будем называть полем зрения, и И — евклидово пространство размерности п. Пусть в пространстве 71 определен

и фиксирован ортонормированный базис {е1,...,еп}. Математической моделью черно-белых (полутоновых) изображений будем считать элементы пространства 71, координаты которых в базисе {еи ...,еп} будем интерпретировать как яркости соответствующих изображений в точках х\,... ,хп поля зрения X.

Зададим класс С = {7: 71 -¥ 71} преобразований пространства 71, содержащий тождественное преобразование и являющийся полугруппой относительно композиции преобразований.

Определение 4 (см. [3]). Формой изображения / £71 будем называть множество = {7 о / | 7 е С} с 71.

В морфологическом анализе изображений [3] класс С определяют так, чтобы форма V} любого изображения / £71 содержала изображения той же сцены, что и /, но полученные, возможно, при других условиях

регистрации. Обозначим ¥ = Щ | / е 71} множество всех форм.

Определение 5 (см. [4]). Нечеткой формой изображения будем называть пространство с возможностью (¥, 3>(¥), Р).

Процесс регистрации изображения, моделью которого является нечеткая форма (¥, Р(¥), Р), состоит из двух этапов [7]. На 1-м этапе в результате нечеткого эксперимента, моделью которого является пространство с возможностью (¥, Р(¥), Р), из ¥ выбирается форма V. На 2-м этапе из формы V выбирается предъявляемое изображение / £71.

Пусть на Р(¥х'Ё) х V задана переходная возможность Р*(- | •), распределение которой [6] обозначим р*(-,- | •): V х 71 х V [0,1], где V = {1,...,Щ. Определим возможности Р;: Р(¥) -¥ [0,1] и Р^: 7{71) —> [0,1] следующим образом:

Рг(Л) = Р*(Л хК\1), А £ 3>(¥),

/ _ у

Р(г/)(В) = Р*(¥ х В | г), В£Р(Ю, ""' '

задав таким образом N нечетких форм (¥, Р(¥), Р;). Потребуем, чтобы возможность Р(„) не зависела от г. Обозначим А множество всех отображений А.: ¥-4Й, ставящих в соответствие каждой форме V е ¥ изображение Ау € V.

Пусть предъявляемые изображения регистрируются по схеме

С = + (1)

где пара (V, р) является каноническим нечетким элементом пространства с возможностью (4x71, Р(¥х71), Р*(- | /)) при некоторых (неизвестных) / £Т>, А. е А. Требуется по реализации g £71 нечеткого элемента £ определить неизвестный номер /.

При заданном / е V схема (1) представляет собой модель регистрации изображений, имеющих нечеткую форму (¥,Р(¥),Р;), полученных при неизвестных условиях регистрации, которые моделируются неизвестным отображением А. е А, и искаженных нечетким аддитивным шумом р. Слагаемое Ау в (1) представляет собой изображение, имеющее нечеткую форму (¥,Р(¥), Р,) [7].

Будем считать, что на Р(2) х А) задана априорная возможность С}, распределение которой обозначим (?(■,■): Т> х А ^ [0,1]. Номер /е V и отображение А. е А в схеме (1) будем считать результатом нечет-

кого эксперимента, модель которого суть пространство с возможностью (DxA, У(Т>х A), Q).

Определим переходную возможность Р?!'?-"-•): У {11) xDxA-4 [0,1] и возможность PS*: У {К хР)ч -¥ [0,1] следующим образом:

(в|/\ а.) = p*({(y,g-ay)|v g ¥, g g в}|/), ВеУ(П), i g V, A. gA,

P«'"(ß x D) = max sup min(P€^-(ß|/, A.), q{¿, A.)),

А.ел

В G 7{U), D еЗ>(2>).

Обозначим pí/,7(-, •): И x V -¥ [0,1] распределение возможности

Согласно схеме (1), при заданных i е V и A. g А нечеткий элемент £ является каноническим для пространства с возможностью (1Z, 7{И), Р^М- (-1¿, А.)). В связи с этим задачу классификации изображений будем рассматривать как многоальтернативную байесовскую задачу проверки гипотез, в которой /-я гипотеза состоит в том, что предъявляемое изображение получено в результате нечеткого эксперимента, моделью которого является пространство с возможностью (к, р(7г),р«|"-л(-|/,А.)).

Определим функцию pi(-, -): VxD -¥ [0,1], значение р1(г,/) которой будем интерпретировать как возможность потерь, которые могут возникнуть в ситуации, когда верна /-я гипотеза, но решение принято в пользу i-п. В описанной задаче проверки гипотез будем использовать четкое [6] решающее правило, в соответствии с которым при предъявлении изображения g g 1Z решение следует принять в пользу гипотезы с номером %) e/(g), где

/(g) = {/ = 1,..., ЛГ: a¿(g) = min a,(g)},

I i = l,...,N ' J

a¿(g) = max min (pl(/,/), p &,J(g,/)), i = l,...,N.

Как показано в [7], при использовании такого решающего правила возможность потерь равна sup an-, Jg)

gen

и не зависит от выбора i(g) из 1(g), причем для любого другого четкого или фазифицированного [6] решающего правила возможность потерь оказывается не меньше. То есть предложенное правило оптимально с точки зрения минимизации возможности потерь.

3. Эмпирическое построение решающего правила

Как было показано в начале статьи, существуют стохастические объекты, которые не могут быть смоделированы теоретико-вероятностными методами, однако могут быть смоделированы теоретико-возможностными. В настоящем пункте рассмотрим ситуацию, когда пара (У,г/) в (1) является случайным элементом, стохастическая модель которого неизвестна и непредсказуемо изменяется от испытания к испытанию, в связи с чем не может быть построена эмпирически, в то время как соответствующая ей в смысле определения 3 возмож-ностная модель остается неизменной. Рассмотрим, как в этом случае может быть решена задача классификации изображений методами, описанными в предыдущем пункте. При этом будет предложен алгоритм,

позволяющий для любого предъявленного изображения g € И эмпирически построить подмножество множества /(§), а значит, и классифицировать предъявленное изображение g так, чтобы возможность ошибки была минимальна.

Для простоты предположим, что А.) = 1, / с V, А. с А, и р1(/,/) = 0 при / = /, р1(/,/) = 1 при /, / с V. Это позволит упростить выкладки, но при этом в полной мере продемонстрировать идею предлагаемого метода.

Итак, пусть на множестве ¥ определена метрика р-у. Пусть, кроме того, на измеримом пространстве (¥, 21у), где 21у — (Т-алгебра подмножеств множества ¥, содержащая все замкнутые шары, определены мера ц-у и неизвестные вероятности Рт\щ\ щ = 1 ,...,£/;,

/ = 1.....А". абсолютно непрерывные относительно

где £/; — некоторые натуральные числа. Таким образом, для каждого /= 1.....А" имеем £/; вероятностей:

РгР,..., Рг-Од . Пусть также на измеримом пространстве {И,Ъ), где ® — ст-алгебра всех борелевских подмножеств в пространстве И, определена неизвестная вероятность Ргд?+1, абсолютно непрерывная относительно меры Лебега .

Рассмотрим ситуацию, когда при верной 1-й гипотезе в схеме (1) случайные элементы V и V статистически независимы и контролируются вероятностями и Ргд?+1 соответственно, причем от испытания к испытанию номера щ могут непредсказуемо изменяться в пределах множеств {1,... ,£/;}.

Пусть У = ¥д? х 11, и 21 — ст-алгебра подмножеств множества У, содержащая все подмножества вида А1 х ... х Ам х В, Л; е 21у, / = 1,..., Ы, Вб®. Обозначим рт\щ>(-): ¥^[0,оо) и рг^+1(-): 7г^[0,оо) плотности распределений Рг-"г) и Ргд?+1 соответственно. Обозначим Рг<и'■•••■«*> произведение вероятностей Рг(!и1) х ... х Рфу) х Ргд?+1, определенное на 21, а плотность распределения рг("ь-.«л") обозначим У^ [0,оо), щ= \,...,ии 1=\,...,Ы.

Потребуем, чтобы

ргд?+1(х) = /(||х||), хеК, (2)

= /(«1.-.«*>(а,(у)), (3)

Щ = 1,...,£/ь ¿=1,...,Ы,

где /(•): [0, оо) -¥ [0, оо) — строго монотонно убывающая функция, ; [0,1] -)• [0, оо) — строго монотонно возрастающие функции, ш(-): У[0,1].

Пусть существуют, но не известны априори множества (гранулы) 34 € 21, к=\,...,К, образующие разбиение множества У и удовлетворяющие для всякой комбинации номеров щ = 1,..., £/;, /= 1,... ,Ы, условиям

А

рг(»ь-.«А')(з;А,) + 2РГ("ь-.»^(з;а) = 1 + ак, (4) У € 34. г/€34+1, к=1,...,К-1,

где ак — некоторые положительные константы. В этом случае всякая вероятность рг("ь .«л) принадлежит классу Рг^су,,вероятностей, максимально согласованных с возможностью Р, удовлетворяющей условию 1 = Р(У0 > Р(У2) > ... > Р(З^), на алгебре &(У\, ■ ■ ■, У к), порожденной разбиением У на гранулы Уи ■ ■ ■, У к [6]. Распределение возможности Р обозначим р(-): У^ [0,1].

Таким образом, возможностная модель в задаче классификации изображений, определяемая возможностью Р, полагается фиксированной, в то время как вероятностная модель может непредсказуемо изменяться в определенных выше пределах от испытания к испытанию.

В связи с тем, что возможность Р полагается неизвестной, рассмотрим метод эмпирического построения решающего правила в задаче классификации изображений. Итак, проведем серию из (N+1) х Ь статистически независимых в совокупности экспериментов, в результате чего получим N+1 выборок объема Ь, которые в дальнейшем будем называть обучающей последовательностью:

выборка из Pif¡): выборка из

V?,

лЛ

V?,

шг(г) sS mL(r) = ß^iOriV)) sS rrii(r), Fe¥, / - 1.....:Y. r > 0.

[J {(k(t, 1),---, k(t, N + 1))} = {1,..., I}A?+1,

t=i

где

N

vdt) = ргдж П vf] (Ort (V1^)).

1=1

Здесь — частота попадания элементов г-й вы-

борки в обучающей последовательности (6) в множество А, г = 1,... ,Ы.

[2]. Определим индексы ^ и к = 1,... ,К, следующим образом:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— I

éP = ma х< t

if = min ji vL(t) < vL([LN+lbk^]) ^Цт^,

k = 2,...,K

N 1

vL(t) > fd[LN+lbk]) + eL + rL\[ml(rL)V

i=l J

k / k— l \ , где bk= Y, ck, ck = (1+—• X; ck, /2, k = l,...,K-l,

и квадратными скобками обозначена операция округления до ближайшего снизу целого числа. В случае, если для некоторого k множество под знаком «max» («min»)

пусто, положим = LN+1 + 1 (tf = 0) ■

Определим функцию p(i)('): {1. ■ ■ ■ ,L}N+l [0,1]:

p(¿) (lL(t,\),..., k(t,N+\)) = '2i-k

AL) AL)

If, i=l,...,N, xL. (6)

При этом в серии экспериментов, соответствующей г-й выборке в (6), номер щ от эксперимента к эксперименту может произвольным образом изменяться в пределах множества {1,..., Ц}, 1 = 1,...,Ы.

Пусть {еьег. ■■■} и {гьгг,...} — последовательности положительных чисел, каждая форма V £ ¥ является линейным подпространством в 71. Обозначим Ог(\/) замкнутый шар радиуса г^ Ос центром 1/е¥. Пусть

k=l,...,K,

о, t* u{iiL,.iiL) + i....Jf}.

k=i

Для каждого g£Tl определим величины aP(g) следующим образом:

af(g) = max . max р® (/,,..., Id),

где номера J¡L)(g,l), i=l,...,N, l=l,...,L, g£ll, определяются из условия

lN = l,...,L

i=\,...,N,

7<L),

■J)

mm l' = \,...,L

(7)

[б]. Положим, наконец, I<L>(g) = {i = l...... Y:

mm a

Pfe)}-

Обозначим / тождественный оператор в 71, а Пу : Ж-4 V — ортогональный проектор на форму V £ ¥.

При предъявлении изображения g е 72 построим множества с V согласно следующему алгоритму.

[Т]. Определим номера /¿(М)> I = 1,...ДЛ?+1, 1=1,... , N+1, согласно условиям

Можно показать, что при определенных условиях для всякого g £ 72 почти наверное с при

достаточно больших Ь. А именно верна следующая теорема.

Теорема. Пусть мера р-у и метрика р-у удовлетворяют условию (7), вероятности Рг-"'\ Ргд?+1

к

и измеримое разбиение У = 0 Уи — услови-

k=i

ям (2)-(5), и рг\щ,(У)^рг\щ,(У) ^ Cpv(V,V'),

pr\Ui)(V) ^ С, prN+l(z) ^ С, V, V' е ¥, z £ [0,оо), щ = 1,..., Uи i = I,... ,N. Пусть вероятность того,

(Mi)

что рг

(«i,

(у) £ [с—8, с+5] стремится к 0 при 8^-0 равномерно по с, щ = 1,...,и1, 1=\,...,Ы. Пусть при каждом g £71 функция аргумента V непрерывна.

Пусть Е1 = 0 < Ь < 1/2, где

—0 и

ео

положительная константа, rL

L-*c

N

г£Пт(гь)

i=i

L—>оо

■+0.

Тогда для всякого g £71 почти наверное найдется такой номер Ь(£), что с при любом

1>Щ).

4. Приближенное эмпирическое построение решающего правила

Алгоритм, предложенный в предыдущем пункте, требует упорядочения массива размером Ьы 11 чисел, что уже при N = 10, Ь = 25 отнимет несколько лет при использовании современных ЭВМ. В связи с этим в настоящем пункте будет рассмотрен существенно более быстрый алгоритм, являющийся приближенной версией алгоритма, предложенного выше.

Итак, построим N + 1 разбиений (вообще говоря, разных) множества {1.....Ь} на Я частей:

я

{1.....Ь} = у Ц, выбрав из каждой части по одному

г=1

элементу: И-еЦ, г= 1.....Я, / = 1.....Л^+1. Далее

определим функции р(Л)(0 согласно пунктам [Т]-[3], ис-

и}

пользуя вместо (6) выборки V- '.....V- ', / = 1.....N,

и л'ЛА'1.....л'л5'1 объема Я. При этом будем использовать 61 и Г1 вместо ец и гк и частоты р)ь>{-), построенные на основе (6), вместо / = 1.....АЧ-1.

Функции р(-): {1.....Ь}м п [0,1] определим следующим образом:

р(/1...../л/ц) = Р,й,(М'1.....

/¿е!-', / = 1.....Л^+1.

Множества 1<ь>g £71, определим согласно пунктам [Ц, [5], однако используя р(-) вместо р(1)(')-

При Я = Ь алгоритмы, предложенные в настоящем и предыдущем пунктах, совпадают. При Я < Ь функция р(-) приближает функцию р(1)(') [7], чт0 позволяет считать предложенный в настоящем пункте алгоритм приближенной версией алгоритма [Т]-[5]. Однако первый требует упорядочения массива размером Яы 11 чисел вместо Ьы 11 для алгоритма [Т]-[5], что дает существенный выигрыш в скорости вычислений.

5. Вычислительный эксперимент

В проведенном вычислительном эксперименте поле зрения X имело размер 50 х 50 пикселей. Нечеткие формы (¥,21,Р;), /=1,2,3, соответствовали рукописным цифрам «0», «3» и «6». Для получения обучающей и тестовой последовательностей использовалась программа, генерирующая незашумленные изображения рукописных цифр со случайным начертанием. Тестовая последовательность содержала по 1000 изображений каждой из цифр, искаженных случайным аддитивным шумом, имеющим плотность распределения ргд, (1 (х) = Л/(||л'|| /20)250 при ||л'|| ^ 20 и 0 в остальных случаях, хеН. Здесь А — нормировочная константа, определенная условием / ргд,, 1 (х)йцтг(х) = 1 ■ Примеры

к

изображений из тестовой последовательности приведены на рис. 1. Для определения множеств 1<ь>(§), g £71, использовался алгоритм приближенного эмпирического построения решающего правила, значение параметра Я было выбрано равным 100.

В случае, когда теоретико-вероятностная модель не изменяется в процессе получения обучающей и тестовой последовательностей, рассматриваемая задача классификации изображений может быть поставлена как

Рис. 1. Примеры изображений из тестовой последовательности

минимаксная теоретико-вероятностная задача проверки статистических гипотез, решением которой является теоретико-вероятностное правило, минимизирующее максимальную по номеру гипотезы /= 1.....N вероятность потерь. Можно показать [6], что всякое теоретико-вероятностное правило минимизирует возможность потерь, т. е. является также и теоретико-возможност-ным. При этом обратное, вообще говоря, неверно.

Были проведены две серии экспериментов. В ходе 1-й серии теоретико-вероятностная модель оставалась неизменной (рис. 2, а), в ходе 2-ой серии — изменялась (рис. 2,6, в). В обоих случаях было проведено сравнение теоретико-возможностного правила с теоретико-вероятностным. При этом за показатель качества

была принята максимальная по 1=1.....N частота

ошибочных решений при классификации изображений из тестовой последовательности, т. е. тот параметр, по которому теоретико-вероятностное правило является оптимальным при достаточно большой длине тестовой последовательности.

На рис. 2, а показаны зависимости максимальной по

/= 1.....N частоты ошибочных решений от длины Ь

обучающей последовательности. Теоретико-вероятностная модель в ходе испытаний оставалась неизменной. Как и следовало ожидать, частота ошибок для воз-можностного правила выше, чем для теоретико-вероятностного. При этом с увеличением Ь частота ошибок уменьшается для обоих правил.

При получении результатов, представленных на рис. 2,6, в, обучающая и тестовая последовательности состояли из цифр, имеющих два разных типа начертания. Доля каждого типа в обучающей последовательности составляла 0.5, а в тестовой последовательности изменялась от 0 до 1. На рис. 2,6 показана зависимость максимальной частоты ошибок

а а

б

в

Рис. 2. Результаты вычислительного эксперимента. На а и б сплошной линией отмечены зависимости для теоретико-возможностного решающего правила, пунктирной — для теоретико-вероятностного

от доли ß цифр 1-го типа в тестовой последовательности для двух рассматриваемых решающих правил, а на рис. 2, в — их отношение. Как видно, при ß, близких к 0.5, наблюдается существенное превосходство теоретико-вероятностного правила над возможностным. Если же теоретико-вероятностные модели при обучении и тестировании различаются (ß^=0.5), но возможност-ные модели совпадают (величина \ß - 0.5| не слишком велика), качества обоих правил могут практически сравниваться.

Заключение

Разработан адаптивный алгоритм классификации изображений, имеющих нечеткую форму. Алгоритм может быть использован в ситуациях, когда теоретико-вероятностная модель классификации неизвестна априори и непредсказуемо изменяется в процессе обучения и/или классификации. Вычислительный эксперимент продемонстрировал эффективность алгоритма в задаче классификации изображений рукописных цифр.

Автор выражает благодарность профессору Ю.П. Пытьеву за плодотворное обсуждение результатов, представленных в настоящей статье.

Работа выполнена при финансовой поддержке РФФИ (гранты 11-07-00338-а, 11-07-00722-а).

Список литературы

1. Куличков С.Н., Чуличков А.И., Демин Д.С. 11 Морфологический анализ инфразвуковых сигналов в акустике. М., 2010.

2. Пытьев Ю.П. // Математические методы исследования природных ресурсов Земли из космоса. М., 1984.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Пытьев Ю.П. // ДАН СССР. 1983. 269, № 5. С. 1061.

4. Пытьев Ю.П., Зубюк A.B. // Мат-лы IX Междунар. конф. «Интеллектуальные системы и компьютерные науки». 2006. Т. 1. Ч. 2. С. 222.

5. Пытьев Ю.П., Чуличков А.И. // Методы морфологического анализа изображений. М., 2010.

6. Пытьев Ю.П. // Возможность как альтернатива вероятности. Математические и эмпирические основы, применение. М„ 2007.

7. Зубюк A.B. // Вестн. Моск. ун-та. Физ. Астрон. 2012. № 6. С. 47.

Image classification in fuzzy morphology: empirical reconstruction of decision rule algorithm A.V. Zubyuk

Department of Computer Methods in Physics, Faculty of Physics, M. V. Lomonosov Moscow State University, Moscow 119991, Russia. E-mail: zubjuk@physics.msu.ru.

The algorithm for empirical reconstruction of decision rule used for possibility-theoretic image classification is developed and widely tested in numerical experiment. The algorithm can be used for acoustic signal analysis in geophysics [1], satellite images interpretation [2], etc.

Keywords: morphological image analysis, fuzzy morphology, possibility theory, numerical algorithms. PACS: 02.50.Le, 02.50.Tt. Received 29 June 2012.

English version: Moscow University Physics Bulletin 1(2013).

Сведения об авторе

Зубюк Андрей Владимирович — мл. науч. сотрудник; тел.: (495) 939-46-94, e-mail: zubjuk@physics.rnsu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.