г(0 = [я + л(*)М*)Ь(*-)я’(*)[0(<)+
Здесь «+» - символ псевдообращения, Afi(t) = n(t) - fi(t—), а матричнозначная функция 7(f) удовлетворяет обобщенному уравнению Рикатти с мерой
7(f) =1о+[ [*(«) + h(s)~t(s) -I- 7(s)/i*(s)]d/i(s)+
J]o,t]
+ [ r(s)[p(s) + H(s)~,(s-)H*(s)A,,(s)}r*(s)dLi(s)+
+ ^2 л(т*)7(п-)Л*(г4)(Дд(п))2,
Ti<t
где 7o = cov (7T0,7Tq), a r,-. t = 1.2.,.. - детерминированные моменты скачков меры <!/*(■)•
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Krichagina N.V., Liptser R.Sh. andRubinovich E.Ya. Kalman filter for Markov processes // In: Statistics and control of stochastic processes. - New York: Publ. Div., 1985. - P. 197-213.
2. Капылов А.К. О нелинейной фильтрации случайных процессов при дискретно поступающих данных // Problems of Control and Information Theory. - 1979. - Vol. 8 (1). - P. 39-54.
3. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. - М.: Наука, 1974. - 696 с.
4. Miller B.M., Rubinovich E.Ya. Regularization of a generalized Kalman filter // Mathematics and Computers in Simulation. - 1995. - Vol. 39. - P. 87-108.
Статью рекомендовал к опубликованию д.т.н. Е.П. Маслов.
Рубинович Евгений Яковлевич - Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук; e-mail: [email protected]; 117997, г. Москва, ул. Профсоюзная, 65; тел.: 84953349111; д.т.н.; профессор; зам. директора по научной работе.
Rubinovich Evgeny Yakovlevich - V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences; e-mail: [email protected]; 65, Profsoyuznaya street, Moscow, 117997, Russia; phone: +74953349111; dr. of eng. sc.; professor; deputy director on R&D.
УДК 681.5-192
А.Б. Филимонов, Н.Б. Филимонов
АВТОМАТ ОГРАНИЧЕНИЙ УПРАВЛЯЕМЫХ ДИНАМИЧЕСКИХ
ПРОЦЕССОВ*
Обсуждается концепция гомеостатического управления, основанная на распространении феномена гомеостаза живых организмов на технические системы. Технический смысл гомеостаза заключается в ограничении контролируемых динамических параметров системы. Данные функции возлагаются на автомат ограничений. Предлагаются механизмы функционирования автоматов ограничений на основе концепции динамических барьеров в фазовом пространстве системы и стратегий упреждающего гомеостатического управления. Развивается полиэдральная методология синтеза автомата ограничений.
Гомеостаз в технических системах; автомат ограничений, динамические барьеры; упреждающее гомеостатическое управление; полиэдральный подход.
*
Работа выполнена при поддержке РФФИ, грант № 13-08-00161.
A.B. Filimonov, N.B. Filimonov
THE AUTOMATIC MACHINE OF RESTRICTIONS OF CONTROLLED DYNAMIC PROCESSES
The concept of homeostasis control based on the extension of a phenomenon of homeostasis of alive organisms to technical systems is discussed. The technical sense of homeostasis consists in restriction of controlled dynamic parameters of system. The given functions are assigned to automatic machines of restrictions. The mechanism of realization of automatic machines of restrictions on the basis of the concept of dynamic barriers in phase space of the system and anticipatory strategies of homeostasis controls is offered. The polyhedral methodology of synthesis of automatic machines of restrictions is developed.
Homeostasis in technical systems; the automatic machine of restrictions; dynamic barriers; anticipatory homeostasis control; polyhedral approach.
В реальных условиях функционирования технических систем возможны неприемлемо большие возмущения номинального режима, которые должны ограничиваться надлежащими средствами и методами автоматического управления. В связи с этим актуально развитие технической гомеостатики как одного из перспективных научных направлений автоматики, изучающего открытый в биологии феномен гомеостаза [1] и пути его возможных инженерных приложений.
Гомеостатические механизмы живого организма. Идея гомеостаза живого организма впервые высказана К. Бернаром. Он ввел понятие «внутренней среды» организма и сформулировал принцип ее постоянства для обеспечения требуемого уровня активности жизненных процессов органов и тканей. Развитие данной идеи достигло своего апогея в работах У.Б. Кеннона, который в 1929 г. ввел термин «гомеостаз» (от гр. homoios - подобный и stasis - стояние), обозначающий относительное динамическое постоянство внутренней среды и устойчивость основных физиологических функций организма.
Современные представления физиологии о гомеостазе значительно расширились [2]. Гомеостаз организма зиждется на принципе устойчивого неравновесия
Э.С. Бауэра, согласно которому организм стремится к достижению некоего, в общем случае «подвижного», равновесия со средой его обитания. В связи с этим появилось понятие динамического гомеостаза и специальные термины: «гомеоки-нез» (от kinco - движение), предложенный А. Ибераллом и У. Мак-Каллоком, и «гомеорез» (от rheo - течение), предложенный К. Уодингтоном, подчеркивающие свойство удержания в заданных пределах постоянно изменяющихся гомеостатических констант организма. Установлено, что в основе гомеостатических механизмов организма лежат процессы саморегуляции, под которыми понимается совокупность внутренних для организма физиологических механизмов управления жизнедеятельностью, с помощью которых гомеостатические константы устанавливаются и поддерживаются в пределах так называемой физиологической нормы.
В работах основателей биокибернетики П.К. Анохина и Н.А. Бернштейна показано, что одной из важнейших функций саморегуляции организма является «защита» его нормальной жизнедеятельности от всякого рода вредоносных воздействий внешней среды, превышающих зону нормы и приводящих к патологическим изменениям в организме. При этом способность «защиты» приобретает в организме характер активного оборонительного поведения, известного как компенсация, направленного на устранение или ослабление функциональных сдвигов в организме, вызванных неадекватными факторами среды в виде противодействия дезорганизующему их влиянию. Здесь компенсация является «физиологической мерой организма» в ответ на какое-либо нарушение его функций, означающей мобилизацию в необходимом объеме защитно-приспособительных компенсаторных меха-
низмов, обеспечивающих повышение резистентности (сопротивляемости) организма и, в итоге, полное восстановление нарушенных функций. Защитно-приспособительные механизмы являются составной частью резервных сил организма, как динамичные, быстро возникающие физиологические средства его «аварийного обеспечения». При этом П. К. Анохиным была вскрыта закономерность, именуемая «золотым правилом» нормы, согласно которому «механизмы сопротивления всегда нарастают в значительно более сильной степени, чем само отклонение от нормального функционирования организма».
Важно отметить, что выход за границы гомеостаза не смертелен для организма - он продолжает патологически функционировать, т.е. в организме, помимо области гомеостаза, существует еще одна область жизнедеятельности, характеризующая его патологические состояния. Данная область патологии организма охватывает снаружи область гомеостаза, так что нижней границей ее является граница гомеостаза, а верхней - граница совместимости с жизнью, определяющая предельные возможности организма. Следовательно, если за пределами области гомеостаза возникают процессы патогенеза, то за пределами области патологии возникают несовместимые с жизнью необратимые изменения, ведущие к его распаду, смерти. Таким образом, в случае экстремальных патогенных возмущающих воздействий для самосохранения организма необходимо не только удерживать его гомеостатические константы в пределах области гомеостаза, но и не допускать их выхода за пределы области патологии. В связи с этим целью гомеостатических механизмов является возвращение скорейшее возвращение организма в область гомеостаз. Данная точка зрения впервые высказана в работах Е.В. Гублера, А.А. Пер-возванского и И.Б. Челпанова (см., например, [3]), где область патологии именуется зоной болезни, а процесс вывода организма из этой зоны - саногенетическим (от лат. Бапш - здоровый) или аварийным регулированием.
Автомат ограничений управляемых процессов. Средства защиты технических и технологических объектов управления от недопустимых возмущений нормальных режимов их функционирования принято называть автоматами ограничений или автоматами безопасности [4].
Впервые проблема построения автомата ограничений (АО) была поставлена в 1914 г. для обеспечения безопасности полетов летательных аппаратов (ЛА), а с начала 1970-х гг. АО стал обязательным элементом бортовой автоматики, призванным удерживать ЛА в границах допустимых диапазонов параметров полета [5]. Здесь нештатными (аварийными) режимами движения ЛА являются режимы планирования, глубокого сваливания, штопора и т.д. В настоящее время АО в том или ином виде применяются в промышленности, энергетике и транспорте для предотвращения всевозможных критических режимов и аварийных ситуаций [4], причем они реализуются либо как автономные устройства автоматики, либо как специализированные функциональные подсистемы общей системы автоматизации.
Различают автоматы ограничений пассивного и активного действия. Пассивные автоматы ограничений направлены на предотвращение возможных нарушений нормальных режимов функционирования системы и связаны с принятием профилактических мер безопасности либо с созданием специальных «непроницаемых» (отражающих либо поглощающих) экранов, призванных воспрепятствовать выходу ее режимных параметров из допустимой области. Активные автоматы ограничений направлены на предотвращение опасного развития нарушений, т.е. на исключение случаев их перерастания в аварийные и катастрофические ситуации. Они связаны либо с принятием решения по предотвращению появления аварийной ситуации в объекте на основе диагностики его состояния, либо с парированием последствий уже произошедших нарушений его нормального функционирования, т.е. с формиро-
ванием некоторого механизма, возвращающего объект в область нормальных режимов. Среди работ, посвященных синтезу активных АО, следует отметить работы А. А. Красовского и В.Н. Букова [5, § 6.4; 6, § 5.7; 7, § 3.2].
В литературе известны два способа реализации заданных ограничений на переменные состояния автоматической системы. Первый способ заключается в формировании управления, обеспечивающего «скользящее удержание» движения в допустимой области путем организации скользящего режима на ее границе, играющей роль гиперплоскости скольжения (см., например, [8, гл. VI, § 7]). Второй способ заключается в формировании управления, обеспечивающего «оптимальное удержание» движения в допустимой области путем штрафования критерия оптимальности за выход из этой области (см., например, [9]).
Следует заметить, что задача синтеза АО не относится к классу так называемых задач управления с фазовыми ограничениями, поскольку в последних, наряду с ограничениями на текущие состояния управляемого объекта, постулируются также и ограничения на его начальные состояния. Однако такие ограничения противоречат самому смыслу действий АО, подразумевающих возможность любых возмущений состояния объекта. Далее возникновение критических или аварийных режимов управляемого объекта будем рассматривать как результат возмущающего воздействия внешней среды, а не как следствие неэффективности процесса управления.
Двухрежимная структура автомата ограничений. В работе [10] предложена концепция активного двухрежимного автомата ограничений, экстренно включаемого в критических ситуациях с целью скорейшего возвращения состояния объекта в область «нормы». Изложим основные положения данной концепции.
Пусть динамика состояния объекта описывается разностным уравнением
x(t +1) = F(x(t), u(t)),
где Ге Z + ; хе X = Rп , ие U с Rг; F :XхU^X, причем Р(0,0)=0.
Нулевое состояние объекта х* = 0 считается целевым.
Выделим в пространстве состояний X две области: рабочую зону О — с X, соответствующую нормальному (штатному) режиму функционирования объекта, а также аварийную зону ОА = X\G—, соответствующую его запрещенным (критическим) состояниям. Полагаем, что рабочая зона включает целевое состояние (х*еО — ) вместе с некоторой его окрестностью. Таким образом, нормальное функционирование объекта предполагает его движение в рабочей зоне.
Полагаем, что множество О — - является замкнутым односвязным, а ЭО — -его граница. В идеале последняя должна быть непроницаемой для фазовых траекторий, берущих начало внутри рабочей зоны О — . Однако это, вообще говоря, невозможно вследствие динамических свойств объекта. В связи с этим в работе [10] поставлена другая - более реалистичная задача управления: формирование защитного динамического барьера («буфера»), охватывающего рабочую зону О— и препятствующего выходу объекта из нее. В этом случае динамический барьер приобретает смысл проницаемой границы рабочей зоны и условие безопасности функционирования объекта сводится к требованию минимизации времени выхода и глубины проникновения объекта в аварийную зону О А . Данную функцию выполняет АО. Кстати, в реальных технических системах рабочая и аварийная зоны часто разделены областью промежуточных состояний, в которой кратковременное пребывание допустимо, но длительное нахождение нежелательно или опасно.
Итак, принцип действия активного АО заключается в захватывании областью О — и последующем удержании в ней фазового потока (т.е. всего семейства фазовых траекторий) объекта. Действие АО предлагается рассматривать с позиций двухрежимного управления [11]: в рабочей зоне действует штатный закон управления, обеспечивающий реализацию основного функционального назначения объекта в нормальной штатной ситуации, а в аварийной зоне - гомеостатическое управление (ГУ).
Логично задачу ГУ формулировать как задачу предельного быстродействия -минимизацию времени пребывания объекта в аварийной зоне. Изложим основы полиэдрального подхода [12] к проблематике ГУ.
Полиэдральный формализм гомеостатического управления. Принимаем линейную динамическую модель объекта управления:
х(Г + 1) = Ах(Г) + Ви(Г), (1)
где А е Rпхп, В е Rпхг.
Заметим, что в рабочей зоне должен осуществляться режим стабилизации целевого состояния объекта посредством некоторого штатного регулятора.
Поскольку ГУ призвано осуществлять скорейший перевод объекта из аварийной зоны в рабочую, то естественно управление вне рабочей зоны О — формировать как релейное с максимальным использованием располагаемых ресурсов.
Применение полиэдральной методологии требует постулирования полиэдральной структуры области управления и и рабочей зоны О — . Полагаем, что и является полиэдром, содержащий некоторую окрестность начала координат в пространстве Rг, и, следовательно, управляющие переменные могут менять знак. В частности, и может быть г-мерным параллелепипедом:
и = {и = ео1(м1, и2, ..., иг) | < иг < , г = 1, г} ,
где иг, - заданные граничные значения управляющего входа иг.
Считаем, что рабочая область О — также является полиэдром и задана полиэдральным неравенством
О- = {х| б(х) < 0}, (2)
где Q(x) - некоторая полиэдральная функция.
Закон ГУ включается при попадании текущего состояния в аварийную зону
О А и обеспечивает движение объекта в направлении рабочей зоны (2). Принци-
пиальное значение имеет следующее свойство полиэдральной функции Q(x): в области ОА она принимает положительные значения и может служить мерой расстояния до границы рабочей зоны . В связи с этим в качестве такой меры расстояния будем использовать модификацию полиэдральной функции Q(x):
Q+ (х) = тах{ Q(x), 0}. (3)
Отметим, что эта функция неотрицательна и на множестве О — совпадает с Q(x).
Если использовать (3) в качестве целевой функции задачи ГУ:
Q+(х) ^ т1п ,
то такая оптимизационная задача будет иметь полиэдральную структуру.
Стратегия упреждающего гомеостатического управления. Одношаговые стратегии ГУ малоэффективны. Большие возможности открывают стратегии упреждающего гомеостатического управления на основе многошаговой экстраполяции динамики объекта. Заметим, что идея использования упреждающих стратегий в АО высказана в работах В.Н. Букова [6].
Будем осуществлять управление посредством экстраполяции движения объекта на некоторый конечный период времени (глубину прогноза) Т е Z +, Т > 0.
Пусть в момент времени Г = Г0 объект попадает в аварийную зону: х(Г0)е О А.
Потребуем, чтобы ГУ возвращало объект в рабочую зону за минимальное время,
которое будем обозначать через Т *. Последнее определяется условием
Т*= тт{те К|х(Г0 +т)е О — }, (4)
где N - множество натуральных чисел.
Обозначим через П(х(Г0), т) область достижимости управляемых движений объекта из состояния х(Г0) за т шагов. Каждая из точек данного множества в силу (1) определяются формулой
х = Атх(^) + X Ат~9Ву(0) , (5)
0=1
где V е и .
Условие (4) означает, что
Я(х(*0), т) П О - ^0 ^ т> Т *.
Разработанный метод решения задачи ГУ основан на следующем предложении.
Предложение. Управляемое движение х(Г) в аварийной зоне О А возвращает объект в рабочую зону О — и является при этом оптимальным по быстродействию тогда и только тогда, когда оно обладает следующим экстремальным свойством:
Q + (х(г0 + Т*) = тт{ Q + (х) | хе Жх^), Т*)} = 0, причем при любом те N , т < Т*,
тт{ Q + (х) | хе й(х(?0), т)} > 0.
Алгоритмической основой предлагаемой стратегии ГУ служит следующая базовая задача оптимального планирования траекторий (БЗОПТ): необходимо найти выпущенную из точки х0 еО А траекторию х(Г): х(Г0) = х0, которая за фиксированное время т приближает состояние объекта к рабочей зоне на минимально возможное расстояние
Q+(х(Г0 + т)) ^ т1п .
Важно подчеркнуть, что данная экстремальная задача является задачей полиэдрального программирования [12], поскольку, в силу (3) и (5) ее целевая функция является полиэдральной функцией управляющих переменных
v(1), v(2), ..., v(т) е и .
Изложим алгоритмическую схему оптимального по быстродействию ГУ.
Пусть х(Г)еОА. Сначала находим программу оптимального по быстродействию перевода объекта из данного состояния в рабочую зону О —. Для этого последовательно решается ряд БЗОПТ для промежуточных горизонтов прогнозирования Г + т, т = 1, 2, ..., причем для каждой из этих задач концевая точка планируемой траектории должна отвечать условию экстремума
Q + (х(( + т)) ^ тт .
Далее определяем горизонт прогнозирования t + T *, обеспечивающий попадание планируемой траектории в рабочую зону G W :
Q + (X (t + T *)) = 0.
Соответствующая БЗОПТ как раз и дает искомое решение в виде программы управления: {v(1), v(2), ..., v(T*-1)}. Формируемая управляющая обратная связь определяется первым шагом v(1) найденной программы:
u(t) = v(1),
благодаря чему объект направляется по вычисленной экстремальной траектории.
Заметим, что прогноз повторяется на каждом такте, реализуя так называемое «управление при скользящем интервале прогноза».
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Гомеостатика живых, технических, социальных и экологических систем / Под ред. Ю.М. Горского. - Новосибирск: Наука, 1990. - 350 с.
2. Нефедов В.П., Ясайтис А.А., Новосельцев В.Н.и др. Гомеостаз на различных уровнях организации биосистем. - Новосибирск: Наука, 1991. - 232 с.
3. Гублер Е.В. Болезнь как процесс аварийного регулирования в живом организме // Бионика. - М.: Наука, 1965. - С. 460-463.
4. Майоров А.В., Москатов Г.К., Шибанов Г.П. Безопасность функционирования автоматизированных объектов. - М.: Машиностроение, 1988. - 264 с.
5. Красовский А.А. Системы автоматического управления полетом и их аналитическое конструирование. - М.: Наука, 1973. - 560 с.
6. Буков В.Н. Адаптивные прогнозирующие системы управления полетом. - М.: Наука, 1987. - 232 с.
7. Красовский А.А., Буков В.Н., Шендрик В.С. Универсальные алгоритмы оптимального управления непрерывными процессами. - М.: Наука, 1977. - 272 с.
8. Теория систем с переменной структурой / Под ред. С.В. Емельянова. - М.: Наука, 1970. - 592 с.
9. Красовский А.А. Аналитическое конструирование автоматов ограничений // Автоматика и телемеханика. - 1975. - № 6. - С. 14-20.
10. Филимонов Н.Б. Гомеостатические системы и автомат ограничений состояния управляемых динамических объектов // Изв. вузов. Приборостроение. - 1998. - № 1-2. - С. 17-34.
11. Филимонов Н.Б. Системы многорежимного регулирования: концепция, принципы построения, проблемы синтеза // Изв. вузов. Приборостроение. - 1988. - № 2. - С. 18-33.
12. Филимонов Н.Б. Методы полиэдрального программирования в дискретных задачах управления и наблюдения / Методы классической и современной теории автоматического управления: Учебник. В 5-и т. Т. 5. Методы современной теории автоматического управления. Гл. 7. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. - С. 647-720.
Статью рекомендовал к опубликованию д.т.н., проф. И.Ф. Чебурахин.
Филимонов Александр Борисович - Московский государственный университет приборостроения и информатики; e-mail: [email protected]; 107996, г. Москва, ул. Стромынка, 20; тел.: 89032929125; кафедра компьютерных информационно-управляющих систем; д.т.н.; профессор.
Филимонов Николай Борисович - Московский государственный университет им. М.В. Ломоносова; e-mail: [email protected]; 119991, Москва, ГСП-2, Ленинские горы; тел.: 89165147102; кафедра физико-математический методов управления; д.т.н.; профессор.
Filimonov Aleksandr Borisovich - Moscow State Univercity of Measurements and Information; e-mail: [email protected]; 20, Stromynka street, Moscow, 107996, Russia; phone: +79032929125; chair of computer information-control systems; dr. of eng. sc.; professor.
Filimonov Nikolay Borisovich - M.V. Lomonosov Moscow State University; Leninskie Gory, Moscow, 119991, Russia; [email protected]; phone: +79165147102; chair of physics and mathematical methods of control; dr. of eng. sc.; professor.