Научная статья на тему 'Формирование и оптимизация баз знаний интеллектуальных систем динамического типа на основе генетических алгоритмов'

Формирование и оптимизация баз знаний интеллектуальных систем динамического типа на основе генетических алгоритмов Текст научной статьи по специальности «Математика»

CC BY
151
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Формирование и оптимизация баз знаний интеллектуальных систем динамического типа на основе генетических алгоритмов»

• снижение сложности и повышение степени интуитивности действий пользователя на основе использования визуальных средств интерфейса (конструкторов и диалогов);

• -

ния реальных задач к различным ПГП, вопросов повышения эффективности применения конкретных схем поиска, настройки и использования отдельных ;

основе накопления и совершенствования механизмов представления знаний как о конкретных решаемых задачах, так и об элементах ГА;

новым промышленным стандартам в области разработки программного обеспечения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дубинин Н.П. Избранные труды. Том 1. Проблемы гена и эволюции. М.: Наука, 2000.

2. Букатова ИЛ. Эволюционное моделирование и его приложения. М.: Наука, 1994.

3. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. М.: Эдиториал УРСС, 2002. 352с.

4. Holland John H., Adaptation in Natural and Artificial Systems: An Introductory Analysis with Application to Biology, Control, and Artificial Intelligence. USA: University of Michigan, 1975.

5. Goldberg David E. Genetic Algorithms in Search, Optimization and Machine Learning. USA: Addison-Wesley Publishing Company, Inc., 1989.

6. Koza J.R. Genetic Programming. Cambridge / MA: MIT Press, 1998.

7. . . : . : -

во TP ТУ, 2002.

8. . . . : -ВГТУ, 1995.

9. . . ,

решений. Монография. Таганрог: Изд-во ТРТУ, 2001.

10. Редько ВТ. Эволюционная кибернетика. М.: Наука, 2001.

11. . ., . ., . ., . ., . ., . ., . . : / . . . -

ка. Таганрог: Изд-во ТРТУ, 2002. 122с.

12. MSDN Library. Visual Studio .Net. Microsoft Corporation, 2001.

УДК 519.816

АЛ. Шабельников, В.В. Курейчик, В.М. Курейчик, СМ. Ковалев ФОРМИРОВАНИЕ И ОПТИМИЗАЦИЯ БАЗ ЗНАНИЙ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ДИНАМИЧЕСКОГО ТИПА НА ОСНОВЕ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ

.

прикладных интеллектуальных систем (ИС) динамического типа, способных функционировать в слабо структурированных предметных областях в условиях неполной, нечеткой и динамически изменяющейся информации. В связи с этим возника-

ет целый ряд научных и технических проблем. Одной из них является проблема формирования динамических баз знаний, аккумулирующих в себе наиболее значимую информацию по исследуемому процессу, в том числе и информацию, отражающую динамику процесса.

Среди прикладных ИС большое практическое распространение получили не, ( ). объектами продукционных БЗ для ИС динамического типа являются нечеткие ди-, -, . -ществляется путем реализации специальных процедур логического вывода для нечетких динамических описаний [Ковалев и др., 2000].

При разработке продукционных БЗ центральной проблемой является формирование нечетких правил. Одним из перспективных подходов к ее решению является подход, основанный автоматическом извлечении правил из данных с использованием методов машинного обучения. При этом возможностными источниками данных являются результаты экспериментальных наблюдений в рассматриваемой предметной области (результаты мониторинга, примеры поведения экспертов, результаты обработки графических протоколов и т.п.)

В настоящей работе на примере одной из задач, связанных с управлением вагонными замедлителями в системах железнодорожной автоматизации, предлагается подход к автоматическому формированию нечетких динамических правил на основе использования методов анализа статистики по исследуемому процессу с привлечением инструментария нечеткой логики и генетических алгоритмов. Такой выбор обусловлен тем, что методы нечеткой логики и адаптивного случайного поиска позволяют эффективно решать широкий круг задач, связанных с анализом слабо формализованных объектов и процессов в условиях, когда точные алгоритмы неизвестны или недоступны.

1. Описание процесса управления замедлителем и механизма вывода в . , систем горочной автоматизации на железнодорожном транспорте, является задача

( ). -

чается в разработке методов управления вагонными замедлителями, обеспечивающими оптимальный режим "вытормаживания" скатывающихся с горки отцепов с учетом ряда критериев и факторов, включая слабо формализуемые факторы, характеризующие ходовые свойства отцепов и общую динамику протекания процес.

В силу слабой формализованное™ задачи регулирования построение полностью автоматических систем АРС является весьма сложной и пока еще не решен. -альных подсистем АРС, основанных на знаниях и способных обеспечивать эффективную экспертную поддержку принятия решений в сложных технологических ситуациях, когда точные модели не дают нужных результатов и требуется вмеша-- .

Формальным описанием динамического процесса торможения отцепа (ДПТ) является многопараметрический временной процесс ^ = S(t) = (^(г),s(t ),...,5(г )),

заданный в виде временной последовательности первичных параметров 5(|) е S,

характеризующих мгновенные состояния ДПТ в моменты времени | . Первичными

параметрами ДПТ являются: скорость движения отцепа, мгновенное ускорение (замедление) отцепа, номер включенной тормозной позиции, число осей, находящихся в активной зоне замедлителя, и др. Значения первичных параметров посту-

100

( ), . Объем ДБД, равный 20 отсчетам, определяет временное окно анализа ДПТ S в 2 .

В рассмотрение вводится множество нечетких признаков п = {р,Р ,...,Р },

интерпретируюмых в качестве вторичных параметров ДПТ £. Нечеткие признаки определены на векторных значениях первичных параметров и характеризуют наиболее информативные с точки зрения экспертов интегральные свойства ДПТ £ или его отдельных фрагментов (подпоследовательностей

Д,у = [5(| ),5(1. 1),...,5(1.)] С £). Вторичными параметрами являются: усредненное ускорение (замедление) отцепа, среднее число осей, находящихся в активной , . нечетких признаков используются подходящим образом подобранные функционалы р : Д£ ^ [01], пРе°бразук>щие векторные значения первичных параметров, 4

характеризующих конкретные фрагменты ДПТ Д£, в значения нечетких признаков р (Д£), характеризующих интегральные свойства соответствующих фрагментов ДПТ £.

БЗ ПС АРС образуют нечеткие динамические правила регулирования вида

V г, имитиРУюЩие выработку решений. Предусловиями правил являются

обобщенные описания динамических ситуаций принятия решений вида

V = &(Р г! Р ), сформированные с использованием нечетких признаков р е п,

связанных временными отношениями. В качестве временных отношений выступает семейство темпоральных отношений логики Аллена ЯТ = {г^,г1 ,..., г1 },

включающее 7 основных типов темпоральных отношений между интервально-.

Нечеткие описания V, входящие в предусловия правил, представляют собой,

1

по сути дела, отдельные фрагменты технологических знаний о возможной динамике протекания процесса роспуска. Заключением каждого из правил является конкретная управляющая команда г е Я на включение той ил и иной ступени замед-

к

, -.

Функционирование ИС АРС осуществляется на основе процедур нечеткологического вывода в БЗ ИС. Исходная информация о текущей ситуации, пред-

5г , -

тируется антецедентами нечетких правил V => г путем вычисления истинност-

1 к

ных оценок обобщенных описаний V на заданной реализации ДПТ 5.. Полу-

1 1

ченные нечетко-истинностные оценки J(V) предусловий нечетких правил присваиваются их заключениям и в результате формируется нечеткое подмножество

решений Я с Я. В качестве управляющего решения выбирается то, которое имеет наибольшую оценку истинности при условии, что она превышает некоторое, заранее оговоренное значение порога достоверности £ .

2. Постановка задачи оптимизации БЗ. При формировании БЗ на основе механизмов обучения основным источником знаний является накопленная статистика по исследуемому процессу. Она представлена в виде множества примеров конкретных реализаций ДПТ £, для каждого из которых оператором-экспертом указано конкретное решение, которое необходимо выработать в сложившейся динамической ситуации. Формирование БЗ сводится к поиску для каждого класса примеров реализаций ДПТ обобщенных описаний, на основе которых формируются нечеткие правила БЗ. Конечной целью при этом является формирование таких наборов правил V'' = {V => Г ^=>г ^ =>г }(г е Я), которые обеспечи-

1-1 к’ 2 к ' т ^ ^ к '

вают верный вывод решений для как можно большего числа примеров из множества обучающих данных при заданном ограничении на общее количество нечетких правил, входящих в БЗ.

"Верный" вывод для реализации 5 на основе набора нечетких правил Жк

означает следующее. В случае, если 5 принадлежит в обучающей выборке классу

решений г , то в наборе нечетких правил Жк должно существовать как минимум

к

одно правило, предусловие которого принимает истинное значение (в нечетком смысле) на данной реализации, а в случае, если 5 не принадлежит классу решений

Г , то предусловия всех правил, входящих в набор Жк, принимают ложные (в нечетком смысле) значения на 5 .

1

В приведенной постановке задача формирования БЗ сводится к известному в теории искусственного интеллекта классу задач обобщения [Финн, 1999]. Для поиска обобщенных описаний на графах, в принципе, можно использовать алгебраические методы, основанные на поиске изоморфных наложений формируемых структур темпоральных отношений в структуры обучающих данных [Вагин и др., 1982]. Однако, эти методы отличаются высокой вычислительной сложностью, что затрудняет их практическое использование.

Специфика исследуемых динамических моделей знаний заключается в том, что они сформированы из пар временных отношений, которые можно интерпретировать в процедурах вывода в качестве элементарных независимых признаков. Это дает возможность существенно упростить задачу обобщения и привести для нее более эффективную постановочную модель и модель решения.

3. Теоретико-множественные модели задачи оптимизации БЗ. Пусть £ = (5(!1),5(!2),...,5(!п)) - реализация ДПТ, V = &(Р П1 Р ) - нечеткое динамическое описание, £ - некоторое числовое значение, имеющее смысл порога достоверности. Значение истинности нечеткого описания V на реализации ДПТ £ определяется на основе нечетких значений истинности элементарных пар темпоральных отношений р г! Р , входящих в описание V .

1 I j

Нечеткое темпоральное отношение Р г1 Р называется £ -истинным на £

г I j

(в дальнейшем просто истинным), если в £ существует такая пара фрагментов

Д£ с £ и Д£ С £, которые находятся во временном отношении г11 и для которых имеет место р (Д£ ) > £ И р (Д£ ) > £. Истинность обобщенного опи-

Е1 ‘ ~ ч 1 >

сания J(V) определяется через коньюнкцию истинностных значений, образующих его элементарных пар отношений Р гг Р .

1 I 1

Для приведенного критерия существует простая теоретико-множественная модель.

Обозначим через 3 множество, элементами которого являются всевозможные пары временных отношений т = Р г^ Р (1,1 = 1,2,...п,к = 1,2,...,7). Тогда любому конкретному описанию V = & Т можно однозначно сопоставить в

3 подмножество 3^), образованное теми и только теми отношениями Т , которые входят в исходное описание V. Каждой конкретной реализации ДПТ £ можно также сопоставить в 3 подмножество 3(£), образованное теми и только

теми элементарными отношениями Т., которые являются истинными на £. Несложно показать, что обобщенное описание V будет истинным на £ тогда и только тогда, когда подмножество 3^) вложимо в подмножество 3(£) в теоретико-множественном смысле.

Опираясь на приведенную модель критерия истинности, сформулируем строго задачу автоматической генерации оптимальных наборов нечетких правил на основе обучающих данных. При этом формирование нечетких правил будем осуществлять независимо для каждого из классов решений г е Я.

к

На основе исходной обучающей выборки примеров сформируем два подмножества: £+ = {5 +} - подмножество положительных примеров И £ " = {5 "} - подмножество отрицательных примеров. Первое включает примеры реализаций ДПТ, относящихся к классу решений гк, для которого формируется набор нечетких

правил. Второе включает множество контпримеров - примеров реализаций ДПТ, относящихся к другим классам решений г е я (1 ф к).

Как и ранее, обозначим через 3 множество, элементами которого являются всевозможные пары отношений т = Р г1 Р, на основе которых формируются

1 1 I 1

искомые обобщенные описания. Множество 3 будем интерпретировать в качестве вершин.

Каждому из обучающих примеров 5 е £+ и £” указанным выше образом сопоставим в 3 подмножество 3(5). В результате на множестве элементов 3 оказывается сформированным два семейства подмножеств 3(£+) = {3(5)/5 е Б+} И 3(£“) = {3(5)/5 е Б~}, которые переобозна-чим £+ = 3(£+) и £“ = 3(£ “) и будем интерпретировать в качестве ребер.

Определенные выше множества вершин 3 и ребер £+ и £” образуют моделирующий гиперграф некоторого частного вида Н = (3, £+ и £“), содержащий

ребра двух сортов - положительные, соответствующие положительным примерам обучающей выборки и отрицательные, соответствующие контрпримерам.

Пример моделирующего гиперграфа Н = (3, £ +и £~) приведен ниже на

Рис.1. Пример моделирующего гиперграфа

Для моделирующего гиперграфа введем два понятия, связанных с вершинным вложением ребер.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть 3* - некоторое подмножество вершин (3* сЗ), а £*+ и £- некоторые подмножества соответственно положительных и отрицательных ребер моделирующего гиперграфа.

3* будем называть покрытием £*+ если оно вложимо в каждое из ребер

+ О *+

Є £ . Множество положительных ребер, покрываемое вершинами 3*, будем обозначать через £+ (3*), то есть £+ (3*) = {э,+ Є £+ /3* С э + }.

3 будем называть антипокрытием £ , если оно не вложимо ни в одно из ребер э . Є £ * . Множество отрицательных ребер, для которых множество вершин 3* является антипокрытием, будем обозначать через £ (3*), то есть

£-(3*) = {э; є £- /3 £ }

Для моделирующего гиперграфа, приведенного на рис.1, множество вершин , Тз} является покрытием множества ребер {э1+, Э3+ } и одновременно антипокрытием множества ребер {э1 ,Э2}, то есть £ + ({т2,тз}) = {э1 ,эз } и

£~ ({ТТ}) = К, э ;}.

Определим аналогичные понятия для семейств вершинных подмножеств гиперграфа Н.

Пусть Ж = {31, 32,..., 3 п } (3; С 3) - некоторое семейство подмножеств вершин моделирующего гиперграфа Н, а £ *+ и £ - некоторые подмножества

положительных и отрицательных ребер моделирующего гиперграфа.

О *+

Тогда семейство ^ является покрытием £ , если для каждого ребра

э+ Є £ *+ „ „ 3

' в семействе ^ найдется покрывающее его подмножество вершин 3;.

Множество ребер, покрываемое семейством ^ будем обозначать через £+ (^).

Семейство Ж является антипокрытием £ * , если каждое подмножество 3,-семейства Ж является антипокрытием £ . Множество ребер, для которых семейство Ж является антипокрытием будем обозначать через £ (Ж).

На рисунке (см. рис. 1) семейство вершинных подмножеств

Ж = {{т,т2}, {т2,т3}} я

11 15 21,1 2’ 3,1 является покрытием реберного подмножества

£ + (Ж) = {5 + 5 + |

v ’ I 1 ’ 3 * и одновременно антипокрытием реберного подмножества

£-(Ж) = К|.

На основе приведенных определений сформулируем модель постановки общей задачи обучения.

Общая модель задачи обучения. Для моделирующего гипергафа

Н = (3 £+ и )

^ ' и некоторого заранее оговоренного целого числа О найти такое

семейство Ж, включающее не более О вершинных подмножеств, которое является покрытием и одновременно антипокрытием для как можно большего числа ребер, т. е.

Ж = тах(/ £+(Ж) / +/ £ (Ж) ^

Ж

где /£+ (Ж)/ И /£ (Ж)/) - мощности множеств £+ (Ж) и £ (Ж) соответственно.

Для гиперграфа (см. рис.1) оптимальным решением поставленной задачи (при любом значении о) будет семейство, включающее одно подмножество вершин Ж = {{т,, т3| |, которое является покрытием и одновременно антипокрытием для максимально возможного в данном случае множества из 5 ребер:

£+ (Ж) = {<, <}, £ - (Ж) = {5-, 5 -, }.

Приведем некоторые практически важные частные модели общей задачи обучения.

Интерес представляет задача обобщения по положительным примерам, ориентированная на формирование поддерживающих моделей, опираясь на нечеткие правила инверсного вида .

Частная модель обучения по положительным примерам. Для моделирующего гипергафа Н = (3, £+ и £~) найти минимальное (по числу содержащихся подмножеств) семейство вершинных подмножеств Ж, являющееся покрытием для всего множества положительных ребер £+, т.е.

Ж = тт(/(Ж)/ / Ж-покрытие£+),

Ж

где /(Ж) / - число подмножеств В Ж .

Для примера (см.рис.1) решением частной задачи является одноэлементное семейство (по совпадению содержащее одноэлементное подмножество)

Ж = {{т}}.

При формировании БЗ, не содержащих дизьюнктивных форм организации нечетких правил (каждому решению соответствует единственное правило), интерес представляет задача обобщения на основе одноэлементных семейств вершинных подмножеств (семейств, включающих по одному подмножеству вершин).

Частная модель обучения в классе одноэлементных семейств.^пя моделирующего гипергафа Н = (3,£+ и £~) найти подмножество вершин 3* С 3, которое является покрытием и одновременно антипокрытием для максимально возможного числа ребер, то есть

3*= тах(/ £+ (3*))/ + / £- (3*)/)

3*с3 .

Для примера (см. рис.1) решением частной задачи обучения в классе одноэлементных семейств является подмножество 3* = {т1, Т3}.

4. Модель решения задачи обобщения динамических описаний. В основу формирования обобщенных описаний положен итерационный алгоритм направленного случайного поиска на моделирующем гиперграфе во взаимодействии с локально-градиентным методом "доформировывания" семейств вершинных подмножеств.

В качестве ЦФ выступает потенциал сформированного семейства подмножеств - общее число покрываемых и одновременно непокрываемых им ребер. Ограничение на число подмножеств, входящих в искомое семейство, задается в виде фиксированного значения О , выступающего в качестве параметра алгоритма.

Стартовые семейства формируемых подмножеств вершин (начшгьная популяция) генерируются случайным образом с учетом потенциала вершин и включает в себя несколько конкурирующих между собой вариантов решения. Далее к сгенерированным подмножествам вершин последовательно добавляются новые таким

образом, чтобы на каждом шаге I максимизировать суммарный потенциал формируемого оптимального семейства.

Репродуцирование популяции, полученной путем доформирования частичных решений локально-градиентным методом, осуществляется путем попарного скрещивания решений. При этом в качестве оператора кроссинговера используется теоретико-множественная операция пересечения подмножеств, обеспечивающая механизм наследования наиболее "перспективных" подмножеств вершин. Селекция решений осуществляется на основе принципа колеса рулетки, с использованием в качестве ЦФ потенциалов семейств вершинных подмножеств.

Заключение. В работе рассмотрен подход к автоматическому формированию БЗ прикладных ИС динамического типа, основанный на использовании методов машинного обучения. Благодаря сведению задачи обучения к оптимизационной задаче на графах удалось разработать эффективный алгоритм ее решения с использованием простых теоретико-множественных операций. Предложенный подход может быть использован для решения широкого круга задач, связанных с автоматическим формированием, оптимизацией и адаптацией БЗ ИС, основанных на структурах временных и нечетко-временных отношений.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Вагин В.Н.,Викторова НМ. Вопросы структурного обобщения и классификации в системах принятия решений. Изв. АН СССР: Техническая кибернетика. 1982. №5. С. 64-73.

2. Финн ВТ. Правдоподобные выводы и правдоподобные рассуждения // Итоги науки и техники. Сер. теория вероятностей, математическая статистика и теоретическая кибернетика. Т. 28. М.: ВИНИТИ. 1988. С.3-84.

3. Ковалев С.М., Шабельников А.Н. Моделирование процессов управления замедлителем на основе композиционных цепочек нечеткого вывода. Изв. ТРТУ. Тематический вы-

пуск: Интеллектуальные САПР / материалы международной НТК "ИСАПР" Таганрог: Изд-во ТРТУ, 2000. №2. С.75-78.

УДК 681.3:536.2.072

Б.К. Лебедев, В.Б. Лебедев

ГЕНЕТИЧЕСКИЙ ПОИСК ПРИ ПЛАНИРОВАНИИ МЕТОДОМ “НЕ ГИЛЬОТИННОГО” РАЗРЕЗА*

. -

бой возрастание сложности СБИС. В ближайшем будущем, будут проектироваться схемы технологии меньше 0.1 |ак при количестве транзисторов, превышающем 100 миллионов. Такие схемы могут быть спроектированы только на основе иерархи.

Планирование СБИС заключается в размещении на поле кристалла блоков, имеющих заданную площадь и не имеющих фиксированных размеров [1]. Блоки и кристалл имеют форму прямоугольников. В результате планирования решаются сразу две задачи: определяется взаимное расположение блоков (модулей) друг относительно друга, т.е. их размещение, а также фиксируются размеры каждого блока. В результате планирования строится план кристалла, представляющий собой

,

сегментами на неналагающиеся прямоугольники, в которые следует поместить

. , -мещения модулей с фиксированными размерами Основной целью оптимизации является минимизация общей площади кристалла.

Размещение схемы на каждом уровне иерархии является комплексной задачей. Хорошее размещение элементов не только уменьшает площадь микросхемы, но и уменьшает стоимость внутренних соединений, что играет решающую роль при определении производительности микросхемы. Хотя задача размещения элементов и присутствует и во многих других алгоритмах, но она же и остается совсем не простой задачей.

План или размещение элементов, чрезвычайно важен для самого процесса проектирования. Задача планирования относится к классу №. Анализ существующих подходов к решению поставленной задачи показал, что наиболее удачными являются подходы, основанные на методах моделирования отжига [2,3] и методах генетической эволюции [4]. Эти методы отличаются друг от друга, как постановками, так и моделями. Однако, недостаточно полный учёт специфики рассматри-, -туальной проблему построения более совершенных эволюционных моделей.

Одной из главных задач при планировании является задача представления . ,

,

.

В последнее время были предложены новые подходы такие, как представление размещения в виде бинарных и последовательных пар, ББО.

* Работа выполнена при поддержке Мин. образования, грант № Т02-02.3-491

i Надоели баннеры? Вы всегда можете отключить рекламу.