Научная статья на тему 'Об информационной значимости цифровых изображений'

Об информационной значимости цифровых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
123
19
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Е.Н.Кирсанова, М.Г.Садовский

Предложена характеристика цифровых изображений (значимость) и метод ее определения через условную энтропию распределения малых фрагментов изображения относительно ожидаемого. Степень структурированности мера отличия реального распределения малых фрагментов изображения от "равновесного". Показана величина информационной значимости изображений различной структуры. Обсуждаются приложения этой величины.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

New method to estimate images is proposed. Information capacity is the specific entropy of small fragments distribution versus the expected one. It discretes the random and periodic images from the complex ones. The data obtained for different patterns are discussed.

Текст научной работы на тему «Об информационной значимости цифровых изображений»

УДК 577.21

ОБ ИНФОРМАЦИОННОЙ ЗНАЧИМОСТИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ

Е.Н.Кирсанова, М.Г.Садовский

Предложена характеристика цифровых изображений (значимость) и метод ее определения через условную энтропию распределения малых фрагментов изображения относительно ожидаемого. Степень структурированности - мера отличия реального распределения малых фрагментов изображения от "равновесного". Показана величина информационной значимости изображений различной структуры. Обсуждаются приложения этой величины.

New method to estimate images is proposed. Information capacity is the specific entropy of small fragments distribution versus the expected one. It discretes the random and periodic images from the complex ones. The data obtained for different patterns are discussed.

ВВЕДЕНИЕ

Цифровые изображения (ЦИ) являются широко распространенным объектом при работе с задачами распознавания образов, сцен и т.п. ЦИ являются основой компьютерного представления графики в случае растровых изображений, широко встречающихся как в приложениях, так и в фундаментальных задачах информатики. Изучение тех свойств ЦИ, которые обусловлены его дискретной природой, является важнейшей теоретической задачей, а также представляет прикладной интерес для ряда специальных задач. Так, проблема поиска, выделения и описания тех или иных структур в ЦИ представляет собой актуальную задачу некоторых разделов теории распознавания образов, теории адаптивных процессов, теории алгоритмов [1-3]. При этом под структурой ЦИ могут пониматься различные свойства - от "семантических" (контуры, образы, сцены и т.п.) до тех, которые имеют лишь косвенное отношение к этим первым, и определяются исключительно взаимным расположением тех дискретных единиц, которые составляют изображение, например, пикселов [4, 5]. Очевиден тот факт, что структуры второго типа существенно зависят от способа их определения. При этом не приходится утверждать, что какие-то из выделяемых структур "правильные", а другие - "неправильные", скорее здесь можно вести речь о том, насколько вновь выделяемые структуры коррелируют с представляющими прикладной интерес для исследователей. В этой ситуации возникает задача создания своего рода библиотеки различных структур (и методов из выделения и описания) и каталога взаимосвязей между ними.

Настоящая работа посвящена описанию метода выделения тех структур в ЦИ, которые обусловлены исключительно взаимным расположением пикселов (либо иных элементарных единиц) в них. Отметим сразу, что проблема исследования тех свойств ЦИ, которые обусловлены взаимным расположением пикселов (либо иных элементарных его единиц) оказывается существенно связанной с тем форматом представления ЦИ, который использован в

данном конкретном приложении. Несмотря на то, что сам метод не зависит от конкретного вида представления ЦИ, его программная, а зачастую и алгоритмическая реализация оказываются существенно зависящими от него. Мы будем излагать развиваемый здесь метод на примере простейших ЦИ лишь для наглядности, помня о том, что это никак не ограничивает его общности. Предложенный метод выделения и описания структур в ЦИ

1) опирается только на информацию о частотах сравнительно малых фрагментов фиксированного размера (пиксели либо их сочетания), встречающихся в изучаемом ЦИ,

2) позволяет выделять те структуры, которые определяются информационными и статистическими характеристиками ЦИ,

3) не требует привлечения дополнительной (по отношению к знанию частот отдельных фрагментов) информации,

4) позволяет, как выделять информационные структуры в обширных ЦИ (например, в аэрокосмических снимках), так и сравнивать между собой ЦИ.

Метод основан на вычислении условной энтропии реального распределения всех фрагментов фиксированного размера относительно их ожидаемого распределения; впредь будем называть такую величину (информационной) ценностью. Под ожидаемым распределением фрагментов (пикселов либо их комбинаций) понимается такое распределение фрагментов заданного размера, которое можно получить, опираясь только на распределения аналогичных фрагментов меньшего размера. Подчеркнем также, что развитый здесь метод не может непосредственно выделять такие структуры ЦИ, как контур, либо иные структуры "семантического" ряда. Сказанное не означает, однако, что развитый здесь метод не имеет никакого отношения к поиску и выделению "традиционных" структур в ЦИ. Условия применения развитого здесь метода к данному классу задач и тип тех ЦИ (например, текстуры), для которых информационные и статистические характеристики будут мощным дополнительным методом выявления этих "традиционных" структур в ЦИ требует специального анализа. Перейдем к строгим утверждениям и точным формулировкам.

ОПИСАНИЕ МЕТОДА

Рассмотрим ЦИ размером NX М элементов. Точнее, пусть имеется решетка, в узлах которой могут стоять символы, являющиеся элементами какого-либо алфавита. Выделим в ней область размером N X М. Будем рассматривать только такие области, для которых в каждом узле решетки находится какой-нибудь элемент (связные области). Любой связный квадрат размером q X д узлов, 1 < д < шт{М,М} встречающийся в ней будем называть

смальтой (размера д). Будем называть верхний левый (для определенности) узел смальты ключом; положение смальты будет определяться положением (координатами) ключа внутри рассматриваемой области. Понятно, что ключ может пробежать (N - д + 1) X (М - д + 1) положение - часть из них окажутся недоступными из-за конечности размера мозаики. Совокупность всех смальт данного размера, встречающихся в рассматриваемом ЦИ, будем называть д-носителем. Сопоставив каждой смальте из д-носителя число ее копий в изучаемом ЦИ, получим конечную мозаику Мд (размера д). Данная конструкция является конечным объектом и требует для ее исследования соответствующих подходов и техники.

Переход к частотам в мозаике означает переход от конечного ЦИ к ансамблю всех изображений, порождающих данную мозаику. Не обсуждая здесь далее различия между конечной и частотной мозаиками, отметим только, что построение частотной мозаики требует использования одного технического преобразования исходного ЦИ: для построения частотной мозаики его необходимо замкнуть в тор. Тогда ключ смальты будет пробегать N X М положений, а частота смальты будет определяться как отношение числа копий данной смальты, подсчитанного на торе, к общему числу смальт (=N X М).

Очевидна нормировка для частотной мозаики:

д) =

= 1

(1)

Здесь индекс $ перечисляет смальты, а /$д) обозначает частоту этой смальты; верхний индекс указывает на ее размер.

Предложенный в настоящей статье метод выделения и описания структурированности ЦИ опирается на идею сравнения заданного распределения (мозаики) с равновесным. Если в нашем распоряжении имеется равновесное распределение, то относительную энтропию некоторого заданного распределения относительно этого равновесного можно вычислить всегда. Действительно [6, 7, 8], такая энтропия одного распределения ф относительно другого ("равновесного") ф* равна:

(2)

5 = 1Ф' 1ПI фУ Ф .

дачей перехода от мозаик одного размера к мозаикам другого. Переход от мозаики размера д к мозаике размера t, 1 < t < д всегда однозначен; для этого частоты мозаики Мд необходимо просуммировать по любой угловой паре строки и столбца; угловой парой будем называть такую, которая пересекается по элементу, расположенному в одной из вершин смальты1. Обратный переход далеко не всегда однозначен. Условием однозначности перехода от мозаики размера д к мозаике размера д^, д1 > д является единственность существования любой пары смальт размера д, пересекающихся по подсмальте размера д - 1 . При этом для всякой смальты размера д должно найтись три других смальты того же размера, единственным образом пересекающихся по подсмальте размера д - 1 ; очевидно, что для любой смальты размера д - 1 должно найтись шесть уникальных пар смальт размера д для того, чтобы переход от мозаики размера д к мозаике размера д1 был единственным.

Если переход от мозаики Мд размера д к мозаике

Мд + $ размера д + s не может быть совершен однозначно, тогда вместо одной мозаики (размера д + $ ) возникнет их семейство. В работах [9-12] предложен общий принцип выбора той мозаики большего размера, которую следует считать порожденной (восстановленной) по заданной: среди всех возможных мозаик размера д + $ следует выбрать ту, у которой энтропия максимальна. Данный принцип означает, что в этой мозаике содержатся все те смальты (размера д + $ ), которые могут рассматриваться как продолжения смальт исходной мозаики, а их частоты являются наиболее ожидаемыми. Такая восстановленная мозаика не несет в себе никакой дополнительной, априорной информации. Понятно, что в общем случае возможно восстановление мозаик сколь угодно большого размера по заданной. Использование сформулированного выше экстремального принципа позволяет вычислить частоты смальт в восстановленной мозаике явным образом. Рисунок 1 иллюстрирует процедуру восстановления. Мы остановимся здесь на случае восстановления мозаики размера д+1:

Лд) Лд) Лд) Лд) + 1) = / < 1) / < 2) / < 3) / < 4)

дегп) )3

(3)

Не обсуждая пока вопроса о том, какую именно мозаику следует считать равновесной, заметим, что сравнение ЦИ с помощью вычисления энтропии одной мозаики относительного другой требует, чтобы носитель одной из них ("равновесной") полностью содержал в себе носитель другой. Такое вложение нельзя гарантировать заранее. В нашем случае эта проблема легко преодолевается, что связано с тем, что в качестве "равновесного" распределения будет использоваться мозаика, для которой реализуется гипотеза о наиболее вероятном продолжении смальт.

Определение "равновесной" мозаики тесно связано с за-

Здесь + 1) - частота восстанавливаемой смальты $'

(размера д+1), /(¡у - частота соответствующей смальты, занимающей г-ю (из четырех возможных - см. рис. 1) позицию, /(кегП) - частота центральной смальты. Для случая д = 1, имеем

/ (2) = Л1) Л1) Л1) Л1)

/ $ /< 1) / <2) / (3) / (4) .

(4)

1.Замыкание ЦИ в тор было необходимо для того, чтобы все эти четыре суммы совпадали между собой.

5(Мд(д - 1 )|Мд) = I{Ад)- 1п^ .

/

(д )

Подставляя (1) либо (2) в (3), имеем

Б(Мд(д - 1 )| Мд) = (д) • 1/дУ -

I Ад) • 1п/[д>-1 + 3 ЪЛд) • ь/^З.

Суммируя по "лишним" индексам, соответствующим тем строкам и столбцам смальты размера д, которые не входят в подсмальту размера д-1 либо д-2, получаем окончательно

Б(Мд(д - 1 )|Мд) = 45д- 1 - - 35д-2, (7)

где - абсолютная энтропия мозаики размера I. Для случая д = 2(5) имеет вид:

Б (М2 (1 )| М2) = 451 -

(8)

Рисунок 1 - Процедура восстановления смальты

Описав процедуру восстановления мозаики большего размера по заданной, перейдем к описанию метода информационного анализа ЦИ. Итак, в распоряжении исследователя имеется мозаики размера д = 1, 2, 3, ... и задача исследования состоит в том, чтобы сравнить реальные частоты смальт размера д и те их частоты этого размера, которые можно ожидать, оперируя лишь знанием частот смальт меньшего размера. Для этого необходимо рассмотреть реальную мозаику размера д и восстановленную до того же размера мозаику по мозаикам меньшего размера t, 1 < t < д . Подчеркнем, что восстановленная согласно (1, 2) мозаика будет содержать все смальты, встречающиеся в реальной мозаике и, возможно, еще некоторые. С точки зрения описываемого метода несущественно, по каким именно мозаикам меньшего размера t проводится восстановление; всюду далее в данной работе, однако, будут

рассматриваться мозаики Мд(д - 1) , восстановленные по

реальным Мд_^ размера д - 1 .

Итак, имея восстановленную мозаику размера д, можно всегда вычислить ее условную энтропию относительно восстановленной:

(5)

(6)

Подчеркнем еще раз, что для вычисления условной энтропии реальной мозаики размера д относительно восстановленной до того же размера не требуется проводить реальное ее восстановление (по мозаикам меньшего размера).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Обсудим подробнее проблему выбора тестовых изображений. Несмотря на то, что метод, развитый выше, применим формально к любым мозаикам, содержательные результаты могут быть получены лишь для таких мозаик, которые достаточно далеки от "равновесных". Не обсуждая в деталях, какие именно мозаики следует считать равновесными и, что именно следует в мозаиках понимать под равновесием, отметим только, что для получения содержательных (нетривиальных) результатов необходимо, чтобы в мозаике не содержалось слишком много уникальных (т.е. имеющих частоту (NX М)-1 ) смальт. Именно здесь проявляется специфика машинного представления растровых ЦИ: если к построению мозаики подойти формально, то для 256-цветного изображения зачастую уже мозаика размера (2 X 2 ) оказывается полностью уникальной. Понятно, что здесь многое зависит от исходного изображения, однако проблему это не снимает.

Другая проблема заключается в том, чтобы выбрать такие ЦИ, которые можно было бы считать эталонными, и для которых, соответственно, получаемые результаты имели достаточно простую интерпретацию. Естественным объектом такого рода является ЦИ, представляющее собой случайное поле с черными и белыми пикселами, распределенными случайно и нескоррелированно, с фиксированной вероятностью (например, с равными вероятностями появления пикселов каждого цвета). Возможны и иные монохромные ЦИ, используемые как эталонные: ЦИ, имеющие простую (например, периодическую) структуру, для них результаты определения информационной значимости могут легко быть получены аналитически и, тем самым, поддаются простой интерпретации. Если такого рода периодические ЦИ подвергнуть случайным мутациям, то можно исследовать влияние случайных изменений на уровень информационной значимости.

Здесь следует сделать одно важное замечание. Говоря об информационной ценности того или иного ЦИ, мы всегда имеем в виду лишь те свойства, которые порождены закономерностями взаимного расположения пикселов в

5

4

нем. Информационная ценность не имеет никакого отношения к семантике ЦИ - его смысловому содержанию, значению тех образов, которые на нем изображены и т.п. Изображение, воспринимаемое наблюдателем как имеющее существенное значение и порождающее у него различные реакции в отношении изображенного объекта, может иметь крайне низкую информационную ценность, понимаемою в смысле условной энтропии реальной мозаики относительно восстановленной. Видимо, наиболее ярким примером изображения такого рода следует считать знаменитый "Черный квадрат" К. Малевича.

Еще одним типом эталонных ЦИ могут служить такие,

которые с одной стороны достаточно близки по своим внешним признакам к случайным изображениям, а с другой - имеют достаточно простое и ясное порождающее правило. Одномерным аналогом таких изображений могут служить некоторые разложения действительных чисел в бесконечную непериодическую ¿-ичную дробь, либо иные последовательности, порождаемые неким преобразованием и обладающие статистическими свойствами, полностью аналогичными свойствам истинно случайных последовательностей. Среди изображений также встречаются аналоги подобных символьных последовательностей - это так называемые фракталы.

Рисунок 2 - Исследуемые изображения

Анализ реальных ЦИ сталкивается еще с одной проблемой - это проблема конечности анализируемого исходного ЦИ. Заранее невозможно сказать, что именно - структура исходного ЦИ или конечность рассматриваемого изображения оказали влияние на тот или иной эффект при определении информационной значимости ЦИ (точнее - его мозаики). Одним из способов получения ответа на этот вопрос является анализ таких ЦИ, для которых можно предполагать, что их внутренняя структура весьма однородна по пространству, а кроме того, возможно получение тех или иных теоретических оценок. Тест-объектом для такого рода верификации метода являются случайные ЦИ: изображения, состоящие из черных и белых пикселов, разбросанных случайно и нескоррелировано по фрагменту решетки, причем число пикселов каждого цвета близко к его вероятности в бесконечном ЦИ.

На рисунке 2 показаны фрагменты исследуемых ЦИ размером 60 X 60 , для которых оценивалась информационная ценность. Исходный размер всех изображений равен 310 X 310 пикселов. Все расчеты приведены для размеров мозаик от 2 до 10 пикселов. Такой выбор размера не случаен, поскольку для большинства представленных ЦИ на размере 10 все смальты мозаик почти уникальны, и значения информационной ценности либо равны нулю, либо слабо изменяются.

Хорошим тест-объектом, позволяющим получить содержательные и простые теоретические оценки влияния эффектов конечности и эффектов структуры исходного изображения, являются различные ковры - периодические замощения плоскости. Несмотря на то, что характерный размер уникальности д* для таких изображений, как правило, весьма велик (он имеет порядок N — д* , где N - раз-

мер исходного ЦИ), тем не менее, единственность продолжения наступает также очень быстро - для смальт размера порядка q* + 1 . Тем самым, можно с уверенностью говорить, что изменения значений условной энтропии реальной мозаики размера l ~(N - q*)/ 2 обусловлены исключительно краевыми эффектами (эффектами конечности исходного изображения). Поскольку теоретически оценить значения периодических ковров весьма просто, постольку представляется интересным изучение влияния случайного шума - случайных искажений, вносимых исследователем в исходно правильную периодическую структуру. Случайный шум заключался в изменении цвета пиксела (черный заменялся на белый и наоборот) с различными интенсивностями. В таком эксперименте использовался Striped.bmp (Рис. 2а) и его искажения с уровнем шумов 5, 10 и 20 % (Рис. 2d, j, h соответственно). Кривые изменения значений условной энтропии реальной мозаики относительно восстановленной для этих ЦИ по мере увеличения размера q смальт в мозаике показаны на рисунке 3. Для Striped.bmp пик величины приходится на размер 3, а ее минимум - на 6 (все смальты уникальны), что соответствует периодам, наблюдаемым в ЦИ. Максимум кривой для InvStriped20.bmp на размере 5 объясняется преобладанием уровня шума над периодической структурой ЦИ. И соответственно, малый уровень шума не способен замаскировать структуру ЦИ, однако, заметно искажает ЦИ, что создает обманчиво гладкую кривую. Иначе говоря, малый уровень шумов порождает интерференцию двух эффектов - периодической структуры исходного ЦИ и случайного изображения, что может создавать дополнительные трудности при анализе информационных характеристики тех или иных изображений.

Рисунок 3 - Семейство Striped.bmp

Рисунок 4 - Информационная ценность для ЦИ с периодической структурой

Другим важным тест - объектом, имеющим достаточно ясную и просто интерпретируемую структуру, является развертка Гильберта - пример фрактала. В отличие от Striped.bmp, развертка Гильберта не имеет самопересечений и по этому топологическому показателю существенно отличается от периодической структуры. Однако, с точки зрения набора малых фрагментов, развертка Гильберта мало чем отличается от Striped.bmp.

На рисунке 4 показаны характеристики всех ЦИ, имеющих периодическую структуру.

В отличие от случайных точек на плоскости (RndPoints1.bmp) и периодических структур, для развертки Гильберта возникновение смальт критического размера д* всегда обусловлено конечностью исходного ЦИ; в случае бесконечной развертки, занимающей всю плоскость, для смальты любого размера всегда найдется еще одна ее копия в этом изображении и, следовательно, они будут иметь различные (неединственные) продолжения. С другой стороны, развертка Гильберта является весьма специальным объектом с точки зрения нашего анализа: она имеет слишком смещенное распределение черных и белых пикселов.

Рассмотрим результаты определения информационной ценности изображения, состоящего из случайно расположенных черных и белых пикселов. Теоретически, следует ожидать, что для случайных изображений не будет наблюдаться никакого заметного роста информационной ценности мозаики того или иного размера. Действительно, пос-

кольку вероятность появления любой смальты (заданного размера д) есть произведение вероятностей появления смальты размера 1 (пиксела соответствующего цвета), постольку для идеального случая - бесконечного ЦИ - не будет наблюдаться никакого прироста (и, соответственно, убывания) значений условной энтропии. С другой стороны, эффект конечности изображения проявляется в том, что начиная с определенного размера д* , все смальты становятся во-первых, уникальными, а во-вторых, имеют единственное продолжение. В этом случае также никакого изменения значений условной энтропии не наблюдается: восстановление может быть продолжено до мозаик сколь угодно большого размера, вплоть до всего исходного изображения. Наблюдаемый на размере 5 пик значения условной энтропии объясняется двумя факторами: во-первых, конечностью изображения, а во-вторых, неточностями в работе генератора случайных чисел, с помощью которого порождалось данное случайное ЦИ. Конечность исходного ЦИ означает, что в нем представлена смещенная выборка из всех мыслимых смальт размера 5 X 5 - общее число смальт такого размера столь велико, что распределение, полученное на исходном ЦИ весьма неточно представляет таковое, получаемое для бесконечного изображения. Другая возможная причина - наличие корреляций в появлении пикселов разных цветов. Результаты вычисления информационной ценности всех ЦИ показаны на рисунке 5.

Рисунок 5 - Условная энтропия реальной мозаики относительно восстановленной

Сравнение реальных частот малых фрагментов ЦИ с наиболее ожидаемыми позволяет оценить информационную ценность мозаики. Информационная ценность - величина, зависящая от размера д смальты в мозаике. Тем самым, само по себе ЦИ характеризуется не одним параметром, а набором значений условной энтропии для размеров смальт от 1 до д* . Два различных ЦИ, имеющие одинаковую информационную ценность на одном размере смальт, могут существенно различаться на другом. Еще одно важное свойство этого показателя заключается в том, что он принципиально не связан с "семантическими" характеристиками изображения. Это не означает, что такие нелокальные характеристики ЦИ, как связность контура, число его самопересечений и т.п. являются "плохими"; информационная ценность изображения и его "семантические" характеристики независимы и взаимодополняют друг друга. Такой показатель, как информационная ценность, может быть полезным при анализе текстур и подобных им изображений, имеющих сложную, нерегулярную, мелкозернистую структуру, плохо поддающуюся описанию и анализу в стандартных терминах теории распознавания образов. Вообще, введение в набор средств анализа информационной ценности ЦИ является шагом в развитии методологии исследования дискретных объектов с помощью энтропийных и статистических методов; одно из ближайших продолжений в этом направлении - поиск и выделение информационно значимых смальт в анализируемом ЦИ.

ЗАКЛЮЧЕНИЕ

В статье введена новая информационная характеристика растрового изображения - информационная ценность его мозаики (набора малых фрагментов), и представлены результаты определения этой характеристики для различных растровых изображений. Показано, что ЦИ различной структуры (случайные точки, фракталы, множества Мандельброта, развертка Гильберта, периодические и почти периодические изображения) различаются по такому показателю как информационная ценность мозаики того или иного размера. Указанные различия выявляют некоторые внутренние характеристики структуры изучаемого ЦИ.

Подчеркнем еще раз, что развитый в настоящей статье метод информационного анализа ЦИ заметно отличается по смыслу и содержанию получаемых результатов от тех методов, которые используются при обработке изображений, распознавании образов и т. п. Основным отличием является то, что результаты, получаемые энтропийными методами, носят "нелокальный" характер: они характеризуют изображение в целом, не выделяя и не описывая в нем локальные характеристики - контуры, точки самопересечений и т. п. Сказанное означает, что информационная ценность изображения есть показатель его отличия от случайного ЦИ, либо от ЦИ с весьма упорядоченной структурированностью - периодического и т.п. Прикладные задачи, однако, зачастую требуют

извлечения иного знания из ЦИ; развитый в настоящей статье метод несомненно может быть использован для этого, однако поиск и установление связи между энтропийными характеристиками растрового изображения и методами распознавания образом, анализа сцен и т.д. требует отдельных исследований.

ПЕРЕЧЕНЬ ССЫЛОК

1. Witkin A., Kass M. Reaction-diffusion textures // Computer Graphics, 1991, vol.25, pp.299-308.

2. Luciano Da Fontoura Costa, Roberto Marcondes Cesar Jr. Shape Analysis And Classification: Theory And Practice

3. Song Chun Zhu, Ying Nian Wu, David Mamford Minimax Entropy Principle and Its Application to Texture Modeling // Neural Computation, vol.9, (1997), pp.1627-1660.

4. Bergen J.R., Adelson E.H. Theories of visual texture perception. / Spatial Vision (D.Regan, ed.), Boca Raton, FL: CRC Press, 1991, 462 p.

5. Winkler G. Image analysis, random fields and dynamic Monte Carlo methods. Berlin: Springer-Verlag, (1995), 547 p.

6. Балеску P. Равновесная и неравновесная статистическая механика. M.: Мир, 1976. Т.1.

7. Бугаенко Н.Н., Горбань А.Н., Карлин И.В. Универсальное разложение трехчастичной функции распределения // Теор. и матем. физика (1990), т. 28, с.430-441.

8. Горбань А.Н. Обход равновесия. Новосибирск: Наука, Сибирское Отд., 1984. 386 с.

9. Bugaenko N.N., Gorban A.N., Sadovsky M.G. Maximum entropy method in analysis of genetic text and measurement of its information content // Open System & Information Dynamics, 1998. v.5, № 3, pp. 265-278.

10. Gorban' A.N., Popova T.G., Sadovsky M.G. Classification of symbol sequences over thier frequency dictionaries: towards the connection between structure and natural taxonomy // Open Systems & Information Dynamics, 2000, v.7, № 1, pp.1-17.

11. Kirsanova E.N., Sadovsky M.G. Entropy approach to a comparison of images // Open System & Information Dynamics, 2001, (в печати).

12. Кирсанова Е.Н., Садовский M.Г. Метод статистического сравнения объектов// Радиоэлектроника. Информатика. Управление.- 2000.- №2.- С.71-82.

УДК 681.32

НЕЧЕТКИЙ ПОДХОД К СИНТЕЗУ КОМПЬЮТЕРНОЙ СЕТИ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Л.Г.Комарцова

Предложена методология нечетного вывода архитектуры компьютерной сети на основе проблемно-настраиваемой экспертной систем.

The metodology of fuzzy constraction of computer network architecture on the basis of problem ajusted expert system.

ВВЕДЕНИЕ

Неточности и неопределенности в задании исходных данных, наличие нечеткой постановки задачи по выбору характеристик компьютерной сети на начальном этапе ее проектирования приводят к необходимости использования методов нечеткой математики. Аппарат нечеткой математики позволяет формализовать понятия, которыми оперирует эксперт или проектировщик при описании своих представлений о реальной системе. Наиболее существенные особенности нечетких моделей реальных систем состоят в следующем:

1) большая гибкость по сравнению с традиционными четкими, т.к. они позволяют описывать знания и опыт эксперта в привычной для него форме;

2) большая адекватность реальному миру, поскольку позволяют получить решение, по точности соотносимое с исходными данными;

3) возможность в ряде случаев более быстрого получения окончательного результата, чем на "точных" моделях, в силу специфического построения и простоты используемых нечетких операций.

Нечеткие методы, используемые при выводе в базе знаний экспертной системы (ЭС), в которой хранятся формализованные знания эксперта о данной предметной области, можно охарактеризовать тремя отличительными чертами:

1) использование так называемых лингвистических переменных вместо числовых переменных или в дополнение к ним;

2) простые отношения между переменными описываются с помощью нечетких высказываний;

3) сложные отношения описываются нечеткими алгоритмами.

В статье предлагается методология нечеткого вывода архитектуры компьютерной сети на основе проблемно настраиваемой экспертной системы.

СТРУКТУРА РАЗРАБАТЫВАЕМОЙ

ЭКСПЕРТНОЙ СИСТЕМЫ (ЭС)

ЭС включает следующие компоненты: интерфейс с проектировщиком (в виде диалогового монитора); рабочую память; базу фактов, хранящую список рабочих нечетких переменных и их значений; базу правил, содержащую знания экспертов об архитектурах вычислительных сетей в формате вида: ЕСЛИ условие ТО заключение (условие - последовательность логических операций сравнения, соединенных логическими связками И, ИЛИ; заключение - присвоение значений нечетким переменным); машину вывода - ядро системы, осуществляющую вывод путем выполнения правил в зависимости от состояния переменных, находящихся в рабочей памяти. Рабочая память экспертной системы - это множество нечетких переменных, содержащих входные данные (задание на проектирование), результаты работы машины вывода и некоторые промежуточные результаты. Методология построения проблемно настраиваемой ЭС включает несколько стадий. На первой стадии осуществляется описание переменных, характеризующих проектируемую сеть, с помощью нечетких переменных.

i Надоели баннеры? Вы всегда можете отключить рекламу.