Научная статья на тему 'Методика построения кластерных экспертных систем'

Методика построения кластерных экспертных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
23
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Частиков А. П., Малыхина М. П., Янаева М. В.

Предложены основные принципы интеграции экспертных систем, работающих в смежных предметных областях, в кластерную экспертную систему. Рассмотрены математические основы интеграции экспертных систем и метод кластеризации, позволяющие объединять экспертные системы в единый кластер без их перепроектирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика построения кластерных экспертных систем»

(4) Стоимость порта коммутатора Ethernet зависит от количества портов в устройстве (чем больше портов, тем ниже стоимость каждого из них) и от дополнительной функциональности коммутатора, включая функции дистанционного управления, организации независимых VLAN, возможности автоматической реконфигурации резервных каналов с использованием протокола STP и пр.

(5) В стоимости портов Ethernet не учтена стоимость конверторов среды передачи сигнала, требуемых, например, для построения территориально распределенных магистральных сетей и протяженных абонентских каналов («последней мили»). Стоимость оптоволоконных конверторов технологии Fast Ethernet зависит от типа кабеля (многомодовый, одномодовый) и его протяженности. Для многомодового кабеля (расстояние не более 2 км) она составляет менее 100 долларов. Стоимость одномодовых конверторов для минимальных (около 20 км) расстояний составляет около 100 долларов (конверторы MRV NBase). По технологии Gigabit Ethernet стоимость одномодовых конверторов для минимальных расстояний (до 8 км) достигает 1200 долларов.

(6) Стоимость портов маршрутизатора для всех технологий указана без стоимости шасси, которая составляет от 2 до 20 тысяч долларов в зависимости от производительности модели маршрутизатора. Стоимость портов (интерфейсных модулей) для разных моделей маршрутизаторов также различна и возрастает с ростом производительности (и стоимости) модели маршрутизатора.

Ростовский государственный университет

Выводы

По результатам проведенного анализа может быть сделан вывод о том, что по большинству рассмотренных показателей наилучшей технологией построения инфраструктуры НОТС оказывается технология Ethernet. Главным очевидным недостатком этой технологии выступает отсутствие развитых средств QoS. Тем не менее этот недостаток преодолим, например, путем совместного использования технологий Ethernet и MPLS. Возможно также применение иных специальных решений [5]. Способы построения инфраструктуры НОТС на основе базовой технологии Ethernet с применением других технологий для решения различных частных проблем составляют предмет отдельной статьи.

Литература

1. Нетес В.А. Основные принципы синхронной цифровой иерархии // Сети и системы связи. 1996. № 6. С. 58-62.

2. Олифер В.,Г. Олифер Н.А. Компьютерные сети. Принципы, технологии, протоколы. СПб., 2001.

3. Кульгин М.В. Коммутация и маршрутизация IP / IPX трафика. М., 1998.

4. Бордман Б. Многоликие MPLS VPN // Сети и системы

связи. № 9. 2002.

5. Букатов А.А., Шаройко О.В. Методы и средства резервирования каналов удаленного доступа к вычислительным ресурсам регионального центра высокопроизводительных вычислений // Искусственный интеллект: Науч.-техн. журн. Академии наук Украины. 2003. № 3. С. 32-38.

23 декабря 2003 г.

УДК 681.03

МЕТОДИКА ПОСТРОЕНИЯ КЛАСТЕРНЫХ ЭКСПЕРТНЫХ СИСТЕМ © 2004 г. А.П. Частиков, М.П. Мальхина, М.В. Янаева

Имеющиеся в области создания интеллектуальных систем разработки подтверждают необходимость повышения их эффективности и увеличения уровня интеллектуализации. Следует отметить, что многие программные разработки в сфере экспертных систем (ЭС) используются неэффективно, что связано с их разрозненностью и отсутствием возможности обмена информацией вследствие программной и технической несовместимости. Возникает проблема, связанная с объединением разных подходов, методов и технологий в некоторую согласованную и оптимальную форму. Известные публикации в области интеграции ЭС решают лишь часть проблем и не представляют четкой концепции проектирования.

Остаются нерешенными проблемы единого представления знаний в интегрированной среде, не разработаны методы организации процессов обмена данными между ЭС, методы распределения и обработки запросов на уровне пользователя. В этих работах нет единства используемых подходов и моделей, которые в сочетании со строгими математическими методами позволяли бы решать широкий круг задач [1-4]. Необходимость интеграции ЭС и послужила поводом для исследования данной проблемы, основная идея которой заключается в разработке теоретических и технологических методов совместного использования различных средств проектирования и управления.

Интеграция обычно связывается с построением целостной системы как совокупности частей, взаимодействие которых обеспечивает работоспособность системы в целом. В качестве основы для объединения разнородных ЭС смежных областей проектирования может быть использована теория кластеризации [5]. В этом случае интегрированная ЭС реализуется в виде кластеров. Кластер рассматривается не как вычислительная система, а как информационная единица, способная объединить в себе возможности нескольких ЭС. Достоинство кластерного анализа в том, что он позволяет производить разбиение на объекты, в данном случае на самостоятельно функционирующие экспертные системы, не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов и позволяет анализировать множество исходных данных практически произвольной природы. В отличие от существующих интегрированных систем кластерные экспертные системы (КЭС) объединяют относительно независимые друг от друга ЭС, каждую из которых можно спроектировать отдельно, что не нарушает при этом работоспособности кластера в целом. Узлы кластера контролируют работоспособность друг друга и обмениваются специфической кластерной информацией. Отдельный кластер можно рассматривать как единый информационный ресурс.

Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве правил Х, необходимых для решения поставленной задачи, выделить множества правил О в т (т -целое) полнофункциональных кластеров (подмножеств) Q1, Q2, ..., Qm, так, чтобы каждое правило О) принадлежало одному и только одному подмножеству разбиения и чтобы правила, принадлежащие одному и тому же кластеру, были сходными, в то время как правила, принадлежащие разным кластерам, были бы разнородными.

Решением задачи кластерного анализа являются разбиения множества правил ЭС, удовлетворяющие некоторому критерию оптимальности. Этот критерий выражает уровни желательности различных разбиений и группировок тех или иных правил. Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.

Неотрицательная вещественная функция Б(Х1 ; Х) = Б у называется мерой сходства, если

1) 0 < Б(Х , Х) с 1 для Х # Х ;

2) Б(Х , Х) = 1;

3) Б(Х , Х) = Б(Х , Х).

Пары значений мер сходства можно объединить в матрицу сходства

Г 1 512 • Л 1 n

S = 5 21 1 • • 5 2 n

ч 5 n 1 5 n 2 • • 1 У

Величину Бр называют коэффициентом сходства.

При этом каждое правило первоначально рассматривается как одноточечный кластер. Правила группируются по следующему принципу: два кластера объединяются, если мера сходства одного одноточечного кластера с другим максимальна. Процедура состоит из п - 1 шагов и результатом являются разбиения правил на группу полнофункциональных кластеров. В этом случае алгоритм последовательной кластеризации выглядит следующим образом: рассмотрим I = (11, 12, ... 1п) как множество одноточечных кластеров {11}, {12}, ..{1п}. Выберем два из них, например I и I), которые в некотором смысле более близки друг к другу, и объединим их в один кластер. Новое множество кластеров, состоящее уже из п-1 кластеров, будет: {I!}, {12}. , {I 1 , I)}, ..., {!,}.

Повторяя процесс, получим последовательные множества кластеров, состоящие из (п-2), (п-3), (п-4) и т.д. кластеров. Процесс повторяется до тех пор, пока возможно объединение хотя бы двух кластеров.

Получаем так называемый алгоритм «ближайшего соседа», позволяющий выделять кластеры сколь угодно сложной формы при условии, что различные правила таких кластеров состоят из близких друг к другу элементов.

Очень важным вопросом является проблема выбора необходимого числа кластеров. Иногда можно т число кластеров выбирать априорно. Однако в общем случае это число определяется в процессе разбиения множества правил на кластеры. Было установлено, что число кластеров должно быть принято для достижения вероятности того, что найдено наилучшее разбиение.

Графически описанный процесс можно представить в виде, показанном на рисунке, который соответствует случаю для шести правил (п=6). Объекты А и С наиболее близки и поэтому объединяются в один кластер, объекты Б и Е также объединяются, но в другой кластер. Теперь имеем 4 кластера:

(А, С), (Р) (Б, Е), (В).

Далее образуются кластеры (А, С, Р) и (Е, Б, В), как более близкие по смыслу правила.

А •-л

<»-

С •-"

Р •-

Е •-

(1-

Б •-1

В •-

Процесс кластеризации множества правил экспертных систем

Таким образом, получаем из множества правил, необходимых для решения комплексной задачи, два набора правил для решения подзадач, входящих в ее состав. При этом полученные кластеры полнофункциональны и могут использоваться как самостоятельные ЭС.

Предложенный метод позволяет провести декомпозицию правил ЭС и определить целесообразность их интеграции в кластер.

Целесообразность интеграции неоднородных ЭС определяется высокой степенью общности информационных, предметных областей. Оценка целесообразности может быть осуществлена с помощью методов формального анализа, совокупности матричных моделей и теории автоматической классификации. Для интеграции ЭС и процессов взаимосвязи их различных частей общими являются задачи увязки локальных моделей и устранения дублирования.

Пусть Б = {ё,} - множество информационных элементов, описывающих предметную область к-го пользователя, В = {Ь,} - множество информационных элементов, описывающих предметную область т-го пользователя. Степень общности или сходства предметных областей к-го и т-го пользователей определим методом последовательного получения и анализа попарных пересечений их информационных множеств. Количественная характеристика степени общности предметных областей определяется с использованием меры подобия, применяемого в теории автоматической классификации.

Пусть заданы информационные множества к-го и т-го пользователей - Б и В, описывающие их предметные области. Тогда мерой подобия предметных областей пользователей назовем отображение пересечения множеств Б п В на некоторое множество вещественных чисел, выраженное неотрицательной функцией 5", значение которой лежит в диапазоне [0..1]. Меру подобия предметных областей пользователей можно рассчитать по формуле:

где

b =

(1, _ если _ dj е D, dj е B

0, иначе

(1, если dj е D, dj g B

0, иначе

(1,_ если _ dj g D, dj е B

S = ■

a + X ьг + £ сг

I 0, _ иначе .

Путем задания на множестве U = {uk} экспертных систем отношения принадлежности R, соответствующего критической мере подобия S*, проводится классификация ЭС.

(uk, um) е R(S*) о S к S*,

Такой метод оценки позволяет обосновать целесообразность интеграции на основе выделения множества правил экспертных систем, решающих близкие по смыслу задачи.

Для управления запросами внутри кластера и распределения задач между ЭС необходимо разработать специальные алгоритмы, однако их работа остается совершенно прозрачной для пользователя. Основным достоинством кластерной ЭС можно считать ее расширяемость и отсутствие необходимости перепроектирования экспертных систем.

Литература

1. Частиков А.П., Гаврилова Т.А., Белов Д.Л. Разработка экспертных систем. Среда CLIPS, СПб, BHV. СПб., 2003.

2. Стогний А.А., Вольфенгаген В.Э. Проектирование интегрированных баз данных. Киев, 1991.

3. Элти Дж., Кумбс М. Экспертные системы: концепции и примеры. М., 1990.

4. Рыбина Г.В. Задачно-ориентированная методология автоматизированного построения интегрированных экспертных систем для статических проблемных областей // Изв. РАН. Теория и системы управления. 1997. № 5.

5. Зелов С. Кластерные технологии. М., 1999. № 3.

Кубанский государственный технологический университет

12 февраля 2004 г.

УДК 621.391.266

АЛГОРИТМ ОБРАБОТКИ ИЗМЕРЕНИИ, УСТОИЧИВЫИ К СИСТЕМАТИЧЕСКИМ ОШИБКАМ

© 2004 г. А.В. Елисеев

Измерение параметров случайного процесса сопряжено, как правило, с появлением ошибок различного вида. На практике принято выделять ошибки трех видов: грубые, случайные (регулярные), систематические (сингулярные) [1]. Для борьбы с грубыми ошибками на этапе предварительной обработки изме-

рений используются процедуры отбраковки аномальных измерений. Случайные ошибки существенно уменьшаются при использовании методов статистической обработки, например метода наименьших квадратов (МНК). Для исключения систематических ошибок могут использоваться результаты определения

a =

с=

i Надоели баннеры? Вы всегда можете отключить рекламу.