Научная статья на тему 'Оптимальное гранулирование многомерной информации'

Оптимальное гранулирование многомерной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
708
137
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бутенков С. А., Кривша В. В., Аль-доуяни С. Х.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимальное гранулирование многомерной информации»

управления, SЮPRO-2000”.-М.: Институт проблем управления им.

В.А.Трапезникова РАН, 2000.-С. 1656-1684.

С.А. Бутенков, В.В. Кривша, С.Х. Аль-Доуяни ОПТИМАЛЬНОЕ ГРАНУЛИРОВАНИЕ МНОГОМЕРНОЙ ИНФОРМАЦИИ

Перспективным направлением низко- и высокоуровневой обработки (или обработки и понимания) различных видов информации, особенно многомерной, является объединение информационных элементов в группы или кластеры, называемые гранулами [1, 2]. В работах Л. Задэ и других исследователей дано обоснование того факта, что использование гранулирования информации открывает путь к эффективной обработке различных видов информации. Однако определение понятия гранулы и методов работы с ней в значительной степени зависит от контекста задачи. В данной работе рассматривается один из возможных подходов к использованию теории информационной грануляции Задэ в задачах обработки и анализа изображений с целью исследования их формы на примере задач автоматического выделения целей сложной формы и окраски на сложном же фоне, ориентируясь на методы, подобные перцептуальным методам восприятия, характерным для зрительной системы человека.

Статья написана следующим образом: в разделе 1 дается краткий обзор наиболее известных подходов к гранулированию информации; в разделе 2 вводится аналитическое описание класса инкапсулирующих декартовых гранул; в разделе 3 дается оптимизационная постановка задачи гранулирования; в разделе 4 рассматриваются результаты применения предложенного оптимизационного подхода к задачам гранулирования дискретной информации на плоскости (изображений), в разделе 5 даются основные оценки качества предложенного метода, а в разделе 6 - выводы и направления дальнейшей работы.

1. Обзор моделей информационной грануляции. Согласно основному принципу грануляции по Л. Задэ, “в результате грануляции объекта А мы получаем набор элементов А (или гранул), образующих “облака” точек (объектов), связанных отношениями неразличимости, сходства или функциональности [2]. Обзор основных работ по теории информационного гранулирования дан в [3, 4]. В работах польской математической школы [5, 6] также даны основы одного из возможных подходов к математической формализации понятий гранул и гранулирования в задачах обработки информации в реляционной (табличной) форме.

Несмотря на значительные успехи теории и практики информационного гранулирования, до настоящего времени известно мало работ, посвященных важной проблеме применения подобных методов в задачах обработки многомерной информации. Одним из важнейших методов представления многомерной информации является представление в виде подмножества декартова произведения двух координат на плоскости, т.е. изображения. Частично этот пробел восполнен в наших предыдущих работах [7, 8] по использованиюм геометрических методов грануляции в задачах обнаружения и распознавания объектов сложной формы, где был предложен ряд соответствующих алгоритмов [8].

Согласно полученным ранее результатам различных исследователей, процедуру вычислений на гранулированной информации (Granular Computing, GrC) можно представить в виде двух основных этапов:

■ Первоначальная грануляция непрерывной или дискретной входной информации;

■ Обработка с использованием алгоритмов гранулированных вычислений.

Базовой проблемой, требующей дальнейшей математической формализации, является создание корректных и практически полезных методов грануляции различных типов исходной информации. Большинство известных методов грануляции [4, 6] не связаны с оптимизацией гранулированных представлений и оценками потери информации при гранулировании, несомненно имеющей место в соответствии с Руководящим принципом мягких вычислений по Задэ. В данной работе нами предложен один из возможных математических подходов к гранулированию двумерной информации, основанный на идеях максимального правдоподобия при оптимальном по точности представлении элементов изображений различной размерности.

Обзор предыдущих исследований позволяет выделит несколько типов моделей гранулирования, имеющих наибольшее значение.

1.1. Общая модель гранулирования информации по Л. Задэ. Основы подхода к информационной грануляции с позиций принципа обобщенных ограничений изложены в [2] применительно к теории нечетких множеств.

Пусть X - переменная, принимающая значения из множества U. Обобщенное ограничение на значения переменной X записывается в виде X is r R, где R - ограничивающее отношение, is r - связка, в которой r является дискретной переменной, значения которой указывают на способ, которым отношение R ограничивает переменную X . Примерами ограничений являются ограничения равенства, возможности, вероятности, нечеткие ограничения и т.д. Например, ограничение эквивалентности записывается при r = e как X is e a , что означает X = a. Возможностное ограничение задается пустым значением r = blank и записывается как X is R, где R - распределение возможностей для X . В наиболее общем случае гранула может определяться как нечеткое множество G = {X | X is r R} . Одним из наиболее практически важных видов гранул являются декартовы гранулы, связанные с понятиями упрощения исходной информации и представления ее в виде нечетких графиков [2].

На этой идеологии основаны идеи представления информации неточными множествами (Rough Sets, RS).

1.2. Гранулированная информация и неточные множества. Пусть множество U представляет собой декартово произведение на плоскости, разбитое на множество непересекающихся прямоугольников (ячеек сетки). Тогда информация об этом множестве может связываться с его границей, представляющей связное множество ячеек, точно принадлежащих исходному множеству. Определим отношение на R ^ U xU в виде xRy о x and y для всех ячеек. В таком виде R представляет собой

отношение эквивалентности, относящее каждую ячейку строго к определенному классу Я. Пусть X - область в и, тогда верхней

аппроксимацией X для X назовем объединение всех классов Я, которые пересекаются с X, а нижней аппроксимацией назовем объединение всех классов Я,полностью содержащихся в X. Введем обозначения

отношение эквивалентности на множестве и [5]. Таким образом, задание пространства аппроксимации позволяет различать объекты, принадлежащие разным классам эквивалентности R, но не внутри одного

выполняются следующие аксиомы:

1. А и В - пустые множества либо объединения классов эквивалентности из Н;

2. А с В ;

3. Если С - отдельный подкласс из В, то С с А .

Неточные множества являются аппроксимациями подмножеств и в следующем смысле. Для любого X с и мы не можем различать элементы внутри классов эквивалентности Н и можем с уверенностью утверждать, что любой X е и является элементом X только для целых классов Я(х). Аналогично мы можем быть уверены в том, что X £ X , только если класс Я(х) не имеет общих элементов с X. Тогда (1) и (2) определяют неточную аппроксимацию. Эти понятия хорошо согласуются с интерпретациями в духе модальной логики: x е X , если X точно является

элементом X, и х е X, если х возможно является элементом X, в соответствии со знаниями, использованными при грануляции (введении

отношения неразличимости) для R . Такое разбиение обозначается и .

гранулами. Все знания об исходном универсуме ограничиваются знаниями об отдельных элементарных гранулах (внутренние элементы гранул неразличимы).

В такой интерпретации знания выражаются в виде связей между отдельными гранулами. Пустое множество, а также объединения элементарных гранул обычно называются определяемыми,

наблюдаемыми, измеримыми или составными множествами. Часто их также называют гранулами (не элементарными). Множество всех гранул

обозначается ОК(и) и является подмножеством множества 2и.

X = {х: Я(х) п X ^0} = и {^(х):х є X}, X = {х: Я(х) е X ^0} = {х: Я(х) е X}. Пространством аппроксимации назовем пару

(1)

(2)

где R -

класса. Неточное множество (Rough

Классы эквивалентности разбиения

называются элементарными

Расширяя классы эквивалентности, заданные уравнением [х]Я = {у | хЯу} на подмножество X с и, мы получаем

Таким образом, каждый элемент ОК (и) может рассматриваться как эквивалентная гранула, содержащая одно подмножество, тогда множество ОК (и) может быть определено как

Множество гранул ОК (и) является замкнутым для операций пересечения и объединения. Тогда семейство классов эквивалентности

элемента О е ОК (и) мы можем записать О = О = О. Остальные свойства неточных множеств описаны в [5, 6].

Одним из практически важных методов введения отношения эквивалентности (3), (4) на множествах информационных элементов изображений (рассматриваемых как подмножество декартова произведения) является введение прямоугольной (или другой ортогональной) сетки и использование в качестве элементарных гранул декартовых произведений подмножеств координатных осей.

2. Инкапсуляция многомерной информации. В работах Л. Задэ [1, 2] показана фундаментальная роль покрытий подмножеств на плоскости гранулами, представляющими собой декартовы произведения разбиений координатных осей, и называемыми декартовыми гранулами. Процесс покрытия исходных подмножеств декартовыми гранулами Задэ назвал инкапсуляцией. Целью инкапсуляции является упрощение исходной информации, представленной теперь отношениями на декартовых (а не на произвольных) гранулах. Эти отношения успешно представляются с помощью набора правил (четких или нечетких) [2].

В результате за счет некоторой потери информации при инкапсуляции достигается прозрачность модели для пользователя. Модели, построенные на правилах, в отличие от формально-математических моделей типа “черного ящика”, в последнее время стали именовать моделями “стеклянного ящика”.

Вторая фундаментальная особенность покрытий декартовыми произведениями заключается в возможности получения на одном и том же материале различных видов информации о свойствах элементов покрытия (гранул), что важно в задачах классификации [7, 8].

Основы такого подхода к геометрическому представлению объектов декартова пространства произвольной размерности заложены в работах Г. Грассмана и, в дальнейшем, развиты в работах Ф. Клейна [9]. С этой целью были введены “базовые элементы” пространства, представляемые в виде всех возможных миноров следующих детерминантов:

(3)

ок (и) = {[ X ] я | X е и}.

(4)

задает а -алгебру подмножеств и. Тогда для произвольного

Для трехмерного пространства детерминанты Грассмана записываются в

виде

' х1 У1 г1 1> ' х1 У1 г1 1>

х1 У1 г1 1), Х2 У 2 ^2 1 , х2 У 2 ^2 1 и т.д.

V х3 Уз ^3 ъ V х3 Уз ^3 Ъ

На основе (5) мы можем получить ряд миноров, представляющих уравнения элементов плоскости, в виде

У = Уі - У 2 , Х = Х1 - Х2 , N = Х1У2 - Х2 Уі-

В этом примере X и У определяют проекции произвольного отрезка прямой, заключенного между точками (х1, у1) и (х2, у2). Выражение для N определяет ориентированную площадь треугольника с вершинами в точках (0,0), (^ У1) и (х2, У2). Эти выводы легко обобщаются на пространство любой

размерности. Таким образом, мы можем извлекать из координат декартовой гранулы геометрическую информацию, необходимую в задачах классификации.

В работе [1] получена параметризованная форма представления декартовых гранул на плоскости в соответствии с (5)

Ґ

%(х ^ ^ Ь) =

х У Л

х + У 1

х + У 1

(6)

где точка (X, у) определяет угол гранулы, а параметры ^ и к определяют ширину и высоту гранулы. Тогда в соответствии с (4) мы можем аналитически описать покрытие множества N декартовыми гранулами (6):

ск (и) = и % (хк, ук, ^, К).

(7)

к=1

Полученные на основе (1)-(7) результаты позволяют разработать высокоэффективные алгоритмы гранулирования для обработки, кластеризации и классификации форм на изображениях [7, 10]. Важнейшей задачей гранулирования, тем не менее, остается оптимизация получаемого гранулированного представления [8]. В следующем разделе ставится оптимизационная задача для получения покрытий произвольных бинарных изображений декартовыми гранулами.

3. Основы метода максимально правдоподобного гранулирования информации. Задача оптимизации покрытия (7) может быть представлена как задача параметрической оптимизации по параметрам гранул (6), описывающих исходное изображение. В такой постановке она сходна с задачей оптимизации параметров распределения по заданной выборке, решаемой с помощью предельного перехода методом максимального правдоподобия [11]. С другой стороны, руководящий принцип мягких вычислений предлагает достигать основных преимуществ мягких моделей (эффективность, “прозрачность” (см. раздел 1) и т.д. за счет отказа от “излишней” точности представления информации. В качестве третьего ограничения введем требование “обратной асимптотичности” предлагаемого метода, заключающееся в том, что при

уменьшении размеров инкапсулирующих гранул покрытие должно приближаться к исходному массиву пикселов.

Введем монотонную нормированную весовую функцию, определенную на инкапсулирующей декартовой грануле (6) для бинарных изображений в виде

р(8(х, у, >■>•,к)) = , + N,) • <8>

где N1 - число пикселов объекта, принадлежащих текущей грануле, N2 -

число пикселов фона, находящихся внутри этой гранулы. Теперь мы имеем

отображение множества натуральных значений параметров

р: 2п ^[0,1]. В соответствии с введенными ограничениями, функцию

максимального правдоподобия для покрытия (7) можно представить в мультипликативной форме как

N

К 81,82* "^) = П Р( 8г( Хг’Уг^г,кг)) . (9)

г=1

Тогда для каждой локальной гранулы критерий оптимизации сводится

к

чи ] е {1, .., N} Р(8г (хг, Уг, ^ , кг ) ^ таХ .

Критерий (9) можно представить в аддитивной форме путем логарифмирования:

N

!(8l,82,■■■,8N) = -£ 1п(Р(8г(Хг,Уг,^’г,кг))) ^ ШаХ . (1 0)

г=1

Полученные критерии (9) и (10) позволяют разработать алгоритмы оптимизации параметров гранул (6), обеспечивающие адаптацию покрытия (7) к выбранному размеру сетки, обеспечивающей первичное отношение неразличимости (см. раздел 1). Необходимым и достаточным условием применения (9) и (10) является выполнение общего требования в форме

У/*] е Д 8г п 8} = 0,г * ] , (11)

для чего предельная площадь гранулы должна стремиться к 1. В этом заключается принципиальное отличие предложенного “геометрического” подхода от подхода, принятого в статистике, где критерии максимального правдоподобия эффективны при увеличении размера выборки.

4. Применение метода правдоподобного гранулирования. На основе предложенных критериев были разработаны алгоритмы поиска оптимального покрытия декартовыми гранулами, позволяющие решать на основе гранулированных представлений основные задачи анализа формы изображений - выделение целеподобных объектов, их классификация и анализ сцены (см. [7, 8]).

Следующий рисунок демонстрирует различия между аппроксимацией неточными множествами и оптимальным покрытием декартовыми гранулами.

Рис. 1,а изображает исходное изображение с искусственно увеличенными пикселами. Рис. 1,Ь изображает аппроксимацию этого изображения по методу неточных множеств и, наконец, рис.1,с изображает результат оптимальной грануляции по методу (10).

□□□□□□□□□□□□ста □□□□□□□□□□□□□□а □■■■■■■■□□□□□□а

□□■□■■■■□□□□□□а □□■■■□□□■□□□□□а □□■■■□□□■■□□□□а □□□□■□□□■■■□□□а □□■■■□□■■■■□□□а □□■■■□□□■■■□□□а □□■■■□□□■□□□□□а □□■■■■□□■□□□□□а □□■□□■■■□□□□□□а □□■■■■■■□□□□□□а □□■■■■■■□□□□□оа □□■■■□■■■■□□□□а □□■■■□□■■■□□□оа □□□■■□□□■■■□□□а □□■■■□□□□■■□□□а □□■■■□□□□□■■□□а □□■■■□□□□□■■□□а □□■■■□□□□□■■□□а □■■■■■□□□■■■■□а □□□□□□□□□□□□□□а

а Ь с

- Нижняя аппроксимация пикселов изображения символа;

- Разность, определяющая принадлежность к неточному множеству.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 1 Пример аппроксимации печатного символа различными

методами

Количественные оценки качества аппроксимации приведены в следующей таблице.

Сравнительные результаты применения различных методов гранулирования

Метод гранулирования Значение функции правдоподобия

Верхняя неточная аппроксимация 1.8-10-11

Нижняя неточная аппроксимация 1.3 -10-3

Оптимальная аппроксимация 1.5 -10-2

Можно заметить, что представленное изображение содержит всего 360 пикселов, что явно недостаточно для получения репрезентативных оценок параметров методами теории вероятностей [11]. После оптимального гранулирования мы получаем всего 28 гранул, описываемых аналитически в виде (6). Это свойство предложенного подхода полезно в системах хранения и передачи визуальной информации [10].

Следующий рисунок содержит пример применения полученных результатов в программной системе выделения целеподобных объектов на сложном фоне.

Рис. 2 демонстрирует этапы выполнения алгоритма захвата сложной (камуфлированной) цели на неоднородном естественном фоне по одному кадру (в отличие от стандартных систем целевыделения, обычно использующих последовательность изображений для выделения подвижных целей). Исходное изображение имеет малые размеры и 16 оттенков серого цвета.

Рис. 2 Последовательность этапов выделения камуфлированного объекта на сложном фоне с помощью оптимального гранулирования

Программная система разработана с использованием основных результатов настоящей работы, а также предложенных в [7] методов перцептуального (в смысле работ Л. Задэ [1, 2]) анализа изображений.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Zadeh L.A. Fuzzy sets and information granularity, in: Advances in Fuzzy Set Theory and Applications, Gupta N., Ragade R. and Yager R. (Eds.), North-Holland, Amsterdam, 3-18, 1979.

2. Zadeh L.A. Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic, Fuzzy Sets and Systems, 4, ЮЗ-111, 1997.

3. Yao Y. Granular Computing: basic issues and possible solutions, Proceedings of the 5th Joint Conference on Information Sciences/, 2000. Pp. 186-189.

4. Yao Y. Rough sets, neighborhood systems, and granular computing, Proceedings of the 1999 IEEE Canadian Conference on Electrical and Computer Engineering}, Edmonton, Canada, May 9-12, 1999, Meng, M. (Ed.), IEEE Press, P. 1553-1558.

5. Pawlak Z. Granularity of knowledge, indiscernibility and rough sets, Proceedings of 1998 IEEE International Conference on Fuzzy Systems, 106110, 1998.

6. Polkowski L., Skowron, A. Towards adaptive calculus of granules, Proceedings of 1998 IEEE International Conference on Fuzzy Systems, 111-116, 1998.

7. Karkishchenko A., Butenkov S., Krivsha V. Fuzzy Geometrical Features in Environmental Monitoring Image Analysis, in: Proc. SCM’2000, Russian National Conf. On Soft Computing, St. Petersburg. 2000, V.2, 193-196.

8. Butenkov S., Krivsha V. Classification using Fuzzy Geometric Features, In Proc. IEEE International Conf. On Artificial Intelligence Systems “ICAIS 2002”, Divnomorskoe, Russia, 5-10 September, 2002, Computer Press, Los Alamos, CA, USA, P. 89-91.

9. Klein F. Elementarmathematik vom Höheren Standpunkte Aus Erster Band, Berlin, Verlag von Julius Springer, 1924.

10. Karkischenko A., Butenkov S., Itenberg I., Krivsha V. Compact Presentation of the Graphic Information in the Systems of the Image Processing and Transmission, In Proc.of 3rd International Conf. “Digital Signal Processing and its Applications”, Moscow, November 2000, P.64-66.

11. Feller W. An Introduction to Probability Theory and its Applications, Wiley & Sons, 1960.

РЕДУКЦИЯ РАЗМЕРНОСТИ СОСТОЯНИЙ ПРИ АНАЛИЗЕ УПРАВЛЯЕМОСТИ И НАБЛЮДАЕМОСТИ ЛИНЕЙНЫХ МОДЕЛЕЙ ЭНЕРГОСИСТЕМ

Показано, что анализ управляемости и наблюдаемости линейной модели стационарной энергосистемы путем редукции сводится к анализу управляемости и наблюдаемости линейных систем с существенно меньшей размерностью пространства состояний. Предельным случаем редукции являются скалярные системы.

Ключевые слова: энергосистема, стационарная модель,

состояние, управляемость, наблюдаемость, тесты Попова-Белевича-Хотиса, собственные значения, редукция.

Рассмотрим линейную стационарную модель энергосистемы

где x(t) е Xn - вектор состояния; u(t) е Ur - вектор управления;

y(t) е Ym - вектор выхода; rank B = r , rank C = m .

Известными (модальными) критериями управляемости и

наблюдаемости (1) являются тесты Попова-Белевича-Хотиса (PBH-tests) [1]. Согласно этим тестам для управляемости и наблюдаемости (1)

необходимо и достаточно, чтобы

М.Ш. Мисриханов, В.Н. Рябченко

x(t) = Ax(t) + Bu (t), y (t) = Cx(t),

(1)

УАєЛ: rank ——— = n .

VÄG Л: rank [ A - ÄIn \ B ] = n,

J A-ЛІп 1

(2)

(3)

i Надоели баннеры? Вы всегда можете отключить рекламу.