9. Бенсон С. Термохимическая кинетика. - М.: Мир, 1999.
10. Cohen N.11 J. Phys. Chem. Rev. Data, 1996, V.25, N6 p.1411.
11. Орлов Ю.Д., Лебедев Ю.А., Сайфуллин И.Ш. Термохимия органических свободных радикалов. - М.: Наука, 2001. -304 с.
12. Барон Р., Шанон М. Компьютерное планирование органического синтеза. В кн: ЭВМ помогает химии. / Под ред. Г. Вернена, М. Шанона - Л.: Химия, 1990. - С. 11-83.
13. Кларк Т. Компьютерная химия.- М.: Мир, 1990.- 383 с.
14. Smith E.G., Becker P.A. The Wisswesser Line Formula Chemical Notation. L.: Cherry Hill, 1976.
15. Репин А.А., Орлов Ю.Д. Тополого-групповой алгоритм фрагментации органических соединений. // Ученые записки ТГУ. - 1999. - Т.5. С. 102-105.
16. Репин А.А., Орлов Ю.Д. Алгоритм автоматизации расчета энергий диссоциации связей // Там же. - 2001. - Т.6. -С. 78-81.
ПРОТОТИП ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ УПРАВЛЕНИЯ ЭНЕРГООБЪЕКТОМ
(Исследование проводится при финансовой поддержке РФФИ (грант 02-07-90042) и РФФИ-БФФИ (грант 00-01-81081))
А.П. Еремеев, Л.С. Денисенко
Интеллектуальные системы поддержки принятия решений (ИСППР), ориентированные на динамические проблемные области и реальный масштаб времени (РВ), относятся к классу интегрированных интеллектуальных систем, сочетающих строгие модели и методы поиска решения с нестрогими, эвристическими (логико-лингвистическими) моделями и методами, базирующимися на знаниях специалистов-экспертов, моделях человеческих рассуждений, неклассических логиках и накопленном опыте [1].
Реализовать ИСППР РВ в полном объеме возможно при условии использования современных технологий конструирования интеллектуальных систем, основанных на концепциях распределенного искусственного интеллекта, динамических (адаптивных) моделей знаний, параллельной обработки информации при поиске решения на основе экспертных моделей и методов правдоподобного вывода, а также ориентируясь на мощные вычислительные платформы типа рабочих станций и соответствующие инструментальные комплексы.
Семиотическая ИСППР РВ как система распределенного интеллекта определяется набором [1] 88= <М, ЩМ), Е(М), Е(88)>, где М={М1,...,Мп} - множество формальных или логико-лингвистических моделей, реализующих некие интеллектуальные функции; ЩМ) - функция выбора необходимой модели (совокупности моделей) в текущей ситуации; Е(М)={Е(М1),...,Е(Мп)} - множество функций модификации моделей М1,...,Мп; Е(88) - функция модификации собственно системы 88, ее базовых конструкций М, ЩМ), Е(М) и, возможно, самой Е(88).
Поиск (вывод) решения в рамках индивидуальной модели М1 поддерживается правилами монотонного или при необходимости немонотонного и нечеткого вывода. Переход же с одной модели на другую или корректировка модели ведет, как правило, к нарушению (разрыву) монотонности и осуществляется посредством реакции на соответствующее событие.
Основные принципы построения ИСППР РВ семиотического типа [1-8] применены в разрабатывае-
мом в Московском энергетическом институте (техническом университете) совместно с ЦНИИ комплексной автоматизации прототипе для оперативно-диспетчерского персонала сложного энергообъекта типа атомного энергоблока.
При создании прототипа СППР РВ для оперативно-диспетчерского персонала атомного энергоблока АЭС необходимо использовать мощное инструментальное средство разработки. Опыт последних лет показал, что таким средством является инструментальный комплекс конструирования экспертных систем РВ G2+GDA (Gensym Corp., USA) [9,10].
Инструментальный комплекс G2+GDA - самодостаточная среда (complete environment) для разработки, внедрения и сопровождения приложений в широком диапазоне отраслей, которая интегрирует в себе современные технологии программирования и обработки информации: открытые системы; объектно-ориентированное программирование; клиент-сервер; рассуждения, основанные на правилах; рассуждения, основанные на динамических моделях (имитационное моделирование); процедурные рассуждения; параллельное выполнение в РВ многих независимых процессов; активную объектную графику; структурированный естественный язык для описания данных и знаний; интегрированность технологии систем, основанных на знаниях с технологией традиционного программирования (с пакетами программ, СУБД, контролерами и концентраторами данных и т.д.).
Программный комплекс энергоблока разбивается на модули, соответствующие различным подсистемам энергоблока. Разработанный с помощью инструментального комплекса G2+GDA модуль прототипа ИСППР РВ предназначен для управления системой автоматического охлаждения зоной реактора (САОЗ). В пределах АЭС возможны аварии, связанные с разуплотнением в элементах реакторного контура. Назначение САОЗ - не допустить расплавления активной зоны и распространения радиоактивности за пределы защитных герметичных помещений АЭС даже при максимальной проектной аварии.
Прототип ИСППР для оперативно-диспетчерского управления САОЗ позволяет персоналу энергоблока (ЛПР - лицу, принимающему решения):
• наблюдать за общим состоянием САОЗ;
• по необходимости переключать внимание ЛПР на одну из подсистем САОЗ;
• наблюдать графики изменения текущих значений отдельных параметров;
• проводить диагностику состояний системы САОЗ и ее подсистем;
• отслеживать процесс управления системы;
• прогнозировать состояние параметров управления;
• вмешиваться в процесс управления;
• проводить тестирование.
Система САОЗ состоит из 4 однотипных подсистем. Состояние САОЗ характеризуется набором параметров. Все параметры разбиваются на аналоговые и дискретные. На основании показателей параметров делаются выводы о состоянии системы, выявляются отклонения параметров от нормы, выдается перечень управляющих рекомендаций. Для представления каждого параметра в приложении имеется свой объект. Объекты группируются в классы.
Каждый из непрерывных параметров имеет свои уставки - верхнюю и нижнюю. Значения параметров изменяются во времени определенным образом. Если в течение определенного времени непрерывный параметр находится в норме (его значение между нижним и верхним пределами), то на схеме его иконка имеет зеленый цвет. Если параметр вышел за указанные рамки, то цвет меняется на красный. Такая сигнализация позволяет оператору быстро отреагировать на поступивший сигнал и принять необходимые меры [11]. Контроль за значениями параметров осуществляется с помощью специального типа правил, начинающихся с ключевого слова whenever (как только). Правила whenever возбуждаются в первую очередь и обладают наибольшим приоритетом, что гарантирует своевременную реакцию системы на изменения в окружающем мире. Таким образом, события могут управлять обработкой. Приведем пример правила whenever.
for any analogparams PA whenever the curmeaning of PA receives a value and when the curmeaning of PA > the toplimit of PA or the curmeaning of PA < the lowlimit of PA then inform the operator for the next 5 seconds that "Значение параметра [the name of PA] выходит за допустимую границу"
{для любого аналогового параметра PA как только PA получает значение и если значение PA > верхней уставки или значение PA < нижней уставки тогда информировать оператора в течение 5 секунд, что значение параметра выходит за допустимую границу}
Это правило будет запускаться, как только какой-либо аналоговый параметр будет получать значение. Если значение параметра выходит за верхнюю или нижнюю границу, то об этом правило сообщает оператору.
При оперативно-диспетчерском управлении энергоблоком АЭС выделяются режимы нормального (штатного), и аномального (аварийного) функцио-
нирования объектов с различными методиками и схемами управления [2,11,12].
В нормальном режиме для реализации распознавания состояний подсистем используются наборы правил, представленные в виде деревьев управления, которые описывают множества возможных цепочек правил. По мере "прохождения" по дереву управления элементы блок-схемы меняют цвет, что позволяет оператору наблюдать за тенденцией развития процесса. Деревья управления разработаны экспертами и реализованы в прототипе в виде процедур. Обработка деревьев приводит к однозначному решению оптимального управления для всех подсистем. Каждая подсистема представлена своим деревом управления на отдельном рабочем пространстве. Рабочие пространства отображаются независимо друг от друга. Поэтому оператор может одновременно наблюдать за состоянием всех подсистем САОЗ.
Обработка САОЗ описывается набором общих правил, использование которых позволяет больше чем в 4 раза сократить объем знаний по обработке параметров САОЗ.
По мере работы приложения создаются и переносятся в специальные рабочие пространства нужные сообщения. Все сообщения разделяются на аварийные, предупреждающие и рекомендации. В зависимости от важности сообщения имеют различные цвета, что позволяет оператору быстрее среагировать на наиболее важные сообщения.
В разработанном прототипе для отслеживания поведения каждого непрерывного параметра используются графики. График изображает изменение значений параметра во времени.
Рабочее пространство имеет четыре области. В правой верхней области расположена мнемосхема установки. На ней ЛПР может видеть состояние аналоговых и дискретных параметров. Левая нижняя область - информационное подпространство, контролирующее подсистему. В этом же месте по мере необходимости оператор может просматривать дерево управления. По нему ЛПР отслеживает динамику изменения состояний.
В левой верхней области находится окно для выдачи сообщений и рекомендаций ЛПР. Наиболее серьезные рекомендации выделены красным цветом, предупреждая тем самым ЛПР о необходимости срочных действий по устранению аномальной ситуации. Правая нижняя область - это область для просмотра динамики изменения значения любого параметра. ЛПР может высветить график интересующего его параметра. Не представляющие в данный момент интереса для ЛПР графики можно закрыть.
Любое из перечисленных пространств можно увеличить, уменьшить или вовсе закрыть при необходимости. Например, если ЛПР захочет подробнее увидеть работу дерева управления или проверить правильность его работы, можно увеличить соответствующее пространство до нужных размеров. Если ЛПР не обязательно знать о том, как идет анализ системы, можно закрыть пространство, чтобы высветить на этом месте графики параметров, за значением которых в данный момент необходимо следить.
Таким образом, ЛПР может использовать гипертекстовую технологию, то есть в любой момент времени раскрыть интересующий его объект с любой степенью детализации. Кроме этого, использование в приложении элементов когнитивной графики позволяет ЛПР более эффективно осуществлять процесс управления энергоблоком.
Обычно в штатном режиме поиск решений осуществляется с помощью последовательных деревьев управления, для которых среднее время поиска выполнимого правила (время поиска решения) минимально. Однако в случае аварийной или предаварий-ной ситуаций в работе системы может наблюдаться одновременно ряд отклонений от нормального режима работы, поэтому поисковые деревья оказываются непригодными. В этом режиме, когда существует повышенная опасность аварийных нарушений, первоочередная задача - выявление возможности таких нарушений, выяснение причин их возникновения и выдача рекомендаций оперативно-диспетчерскому персоналу, направленных на восстановление нормального режима работы. В такой ситуации необходимо максимально использовать параллелизм в обработке знаний. В этом случае при параллельном распознавании состояний подсистемы используется табличная модель [5,13] (см. фрагмент таблицы решений, реализованной в прототипе).
T-7 R59 R60 R61 R62 R63 R64 R65 R66
1 T519B01<30 0 0 0 0 0 0 0 0
2 TH13S24< закр.
3 TH13S24 > откр. 1 1 1 1 1 1 1 1
29 TP519B01>63.8
30 T511B01< 1 0 1 1 0 1 0
Код 5h 5h 5h 5e 5e 5e 5c 6c
Табличная модель позволяет производить сопоставление всех правил одновременно. Вычисление значений условий, определяющих текущее состояние и используемых в левых частях правил, также можно производить параллельно. В этом случае время формирования вектора данных, представляющего состояние предметной области, определяется временем обработки наиболее трудоемкого условия. Кроме того, можно одновременно выполнять действия, указанные в правой части активизируемого правила.
Для осуществления параллельного поиска применимой продукции в цикле используется конструкция do in parallel [until one completes]:
For i=0 to n do in parallel {процедура, проверяющая, удовлетворяет ли вектор данных i-му правилу} end;
В результате происходит параллельная проверка применимости всех имеющихся правил и находятся все альтернативные решения. Проверка на применимость любого правила решений также распараллеливается. Таким образом, время формирования вектора действий определяется временем вычисления значений наиболее трудоемких из невычисленных на текущий момент условий.
Одним из основных свойств ИСППР РВ является возможность оперировать неопределенной информацией. Это обусловливается тем, что существенная часть информации в базе знаний прикладной систе-
мы является нечеткой, неполной или недостаточно надежной. В такой ситуации необходимо использовать неклассические логики и модели для работы с неопределенностью в обработке знаний (немонотонные, тернарные, нечеткие и т.д.) [4,13-15].
Инструментальный комплекс G2 содержит набор встроенных средств для работы с неопределенностью [10]. Среди них наибольший интерес вызывает определенный в системе истинностный тип Truth-Value, переменные которого принимают значения от -1.0 (абсолютная ложь) до +1.0 (абсолютная истина). Используя тип Truth-Value, можно составлять различные высказывания или формулы, принимающие произвольные значения на отрезке [0,1]. Кроме того, с помощью типа Truth-value можно задавать факторы уверенности для различных знаний в базе знаний. G2 позволяет использовать истинностные выражения в антецедентах правил. G2 запускает такое правило после сравнения значения выражения с системным атрибутом Truth-threshold. Значения этого атрибута принадлежат диапазону от 0.0 до 1.0. По умолчанию значение атрибута устанавливается в 0.8. Когда G2 активизирует правило, вычисленное значение истинностного выражения в антецеденте правила сравнивается со значением Truth-threshold. Если вычисленное значение > значения Truth-thresold, выполняются действия, заключенные в консеквенте правила.
Например,
If the temperature of tank-1 >100 (+ - 2) then
Conclude that the tank-is-boiling of tank-1 is true
{Если температура резервуара-1 находится в диапазоне 98°-102 ° то заключить, что резервуар кипит}
Например,
Если температура tank-1 равна 101.8, то значение выражения
the temperature of tank-1 >100 (+ - 2) равно + 0.9 true. Так как +0.9 true больше +0.8 true (по умолчанию), G2 присваивает атрибуту the tank-is-boiling объекта tank-1 значение true (то есть заключает, что резервуар кипит).
GDA содержит дополнительный набор средств для оперирования с неопределенной информацией. Используя логические блоки GDA, можно строить различные схемы для работы с неопределенностью. Однако для разработки прототипа ИСППР РВ имеющихся встроенных в G2+GDA средств оперирования с неопределенностью недостаточно. В связи с этим актуальной является задача расширения этих средств за счет подсоединения дополнительных программных модулей.
В процессе работы прототипа в аномальном режиме появляется неопределенность в сведениях о показателях объекта и неопределенность в самих правилах. Для того чтобы диагностировать ситуацию и дать рекомендации по ее устранению, система должна перейти к модели принятия решений в условиях неопределенности.
В прототипе в аномальном режиме для реализации распознавания состояний подсистем используется аппарат теории возможностей [16]. Неопределенность фактора уверенности посылки правила и неопределенность применения самого правила оценивается с помощью мер необходимости и возможности.
Оценки неопределенности применения правил должны быть установлены инженером знаний априорно. Эти оценки косвенно отражают степень важности или приоритет правил в процессе вывода.
Может оказаться, что в аномальном режиме мы не можем все диагностировать однозначно. Система может предлагать несколько решений с различными оценками возможности и необходимости.
В настоящее время для управления сложными объектами в экспертных системах широко используются нечеткие выводы [4,14]. Строгие методы обычно используются при принятии решений в условиях определенности, нечеткие - в условиях риска и неопределенности, а также если применение строгих методов практически невозможно из-за большой размерности задачи и громоздкости вычислений.
В прототипе задаются схемы нечетких рассуждений следующего типа:
Если аша12,...,а1т то Ь иначе, если а21,а22,...,а2т то Ь2 иначе, если арЬар2,...,арт то Ьр иначе... Здесь ау представляют нечеткие переменные входных параметров с функциями принадлежности , а Ь1 - нечеткие переменные выходных параметров с функциями принадлежности ^ы . Под нечетким выводом понимается процесс получения нечеткого результата вывода Ь' при новом наборе вектора значений входных лингвистических переменных
/ / / / ч
а = (а1,...,ат) .
Для осуществления схемы нечеткого вывода необходимо определить множество входных и выходных параметров, а также множество лингвистических правил. Лингвистические переменные и правила задаются экспертом, исходя из личного опыта. База знаний прототипа содержит набор определенных для параметров САОЗ лингвистических переменных. Кроме того, этот набор может расширяться за счет введения новых лингвистических переменных и подстраиваться под субъективную логику конкретного ЛПР (оператора). Для задания множества лингвистических правил в прототипе используются массивы сущностей и текстовые массивы.
Число наблюдаемых параметров (управляемых и неуправляемых) для сложного объекта типа энергоблока может достигать десятков тысяч. Поэтому естественно возникает задача определения функций принадлежности входных и выходных параметров таким образом, чтобы упростить вычисления в процессе нечеткого вывода.
В прототипе реализовано несколько различных алгоритмов нечеткого вывода в зависимости от вида лингвистических переменных, которые используются при описании входных и выходных параметров. Помимо дедуктивного вывода для функций произвольного вида в прототипе реализована процедура нечеткого дедуктивного вывода на шкалах и нечеткий вывод с применением (Ь-К) аппроксимации функций принадлежности. Из-за временных ограничений в прототипе преимущественно используется нечеткий вывод с лингвистическими переменными, заданными на шкалах [4].
Под режимом работы энергосистемы подразумевается совокупность процессов, определяющих в любой момент времени состояние параметров режима. Параметры режима - показатели, характеризующие режим системы и условия ее работы: мощности, напряжения, перетоки по ЛЭП и т.д. [2]. Чтобы поддерживать режим, необходимо на каждую переменную ставить регулятор. Разработан нечеткий логический регулятор для управления процессом подогрева воды. Регулятор включен в состав прототипа. Экспериментально показано, что нечеткое управление дает лучшие результаты, по сравнению с получаемыми при общепринятых алгоритмах управления.
Список литературы
1. Вагин В.Н., Еремеев А.П. Конструирование интеллектуальных систем поддержки принятия решений реального времени // Интеллектуальное управление: новые интеллектуальные технологии в задачах управления (1С1Т'99).-Тр. между-нар. конф. -М.: Наука, Физматлит, 1999.- С.27-32.
2. Башлыков А.А., Еремеев А.П. Экспертные системы поддержки принятия решений в энергетике / Под ред. А.Ф. Дьякова. - М.: Изд-во МЭИ, 1994, 216 с.
3. Vagin V.N., Yeremeyev A.P. Parallel Inferense in Knowledge Representation Models //Proc. of Symp. on Robotics and Cybernetics, CESA'96 IMACS Multiconference, July 9-12, 1996. Lille-France. -p.184-188.
4. Трахтенгерц Э.А. Компьютерная поддержка принятия решений: Науч.-практич. изд. - М.: Синтег, 1998.
5. Еремеев А.П., Тихонов Д.А. Средства параллельной обработки информации в системах поддержки принятия решений реального времени // Программные продукты и системы, 1999. - №2. - С.39-44.
6. Yeremeyev A.P. The Organization of Real Time Decision Support Systms of a Semiotic Type// Sixth National Conf. with In-tern.Participations CAI'98. Workshop Applied Semiotics and Abstracts of CAI'98 Reports. 5-11 Oct. 1998. Pushchino, Russia,
1998, Vol.III. - p.3-7.
7. Еремеев А.П., Тихонов Д.А., Шутова П.В. Поддержка принятия решений в условиях неопределенности на основе немарковской модели // Изв. РАН. Теория и системы управления,
1999. - №5.- С.87-93.
8. Yeremeyev A.P., Shutova P.V. Organizing of Learning for Real-Time Support Systems of Semiotic Type // 14th European Conf. on Artificial Intelligence, ECAI 2000. Workshop "Applied Semiotics: Control Problems (ASC 2000)." 20-25 Aug. 2000. Berlin, 2000.-p.25-29.
9. G2 Course: Part 1, Exercise Manual For Version 3.0 of G2, 1993 Gensym Corporation.
10. Попов Э.В., Фоминых И.Б., Кисель Е.Б., Шапот М.Д. Статические и динамические экспертные системы. - М.: Финансы и статистика, 1996.
11. Еремеев А.П., Симонов Д.Н., Чибизова Н.В. Реализация прототипа системы поддержки принятия решений реального времени на основе инструментального комплекса G2// Программные продукты и системы, 1996. - №3. - С.21-26.
12. Башлыков А.А., Вагин В.Н., Еремеев А.П. Экспертные системы поддержки интеллектуальной деятельности операторов АЭС // Вестник МЭИ,1995. - №4.-С.27-36.
13. Еремеев А.П. Построение решающих функций на базе тернарной логики в системах принятия решений в условиях неопределенности // Изв. РАН. Теория и системы управления, 1997. - №5. -С.138-143.
14. Нечеткие множества в моделях управления и искусственного интеллекта /Под ред. Д.А.Поспелова - М.: Наука, 1986.
15. Вагин В.Н. Не-факторы знания и нетрадиционные логики // Третья междунар. летняя школа-сем. по искусств. ин-телл. для студентов и аспирантов / Сб. науч. тр.- Минск: БГУИР,1999. - С.10-14.
16. Дюбуа Д., Прад А. Теория возможностей. - М.: Радио и связь, 1990.