Информатика, вычислительная техника и управление
37. Производство алюминия и сплавов на его основе: справочник металлурга / Б.И. Зельберг и др. Иркутск : Издательство ИрГТУ. 2015. 764 с.
38.Наноструктуры и алюминиевая промышленность / В.В. Кондратьев и др. // Вестник ИрГТУ. 2015. № 8.С. 77-85.
УДК 519.362.50
Сизых Виктор Николаевич,
д. т. н., профессор кафедры «Автоматизация производственных процессов», Иркутский государственный университет путей сообщения,
e-mail: [email protected] Данеев Алексей Васильевич, д. т. н., профессор кафедры «Информационные системы и защита информации», Иркутский государственный университет путей сообщения,
e-mail: [email protected] Палатов Дмитрий Андреевич, аспирант кафедры «Автоматизация производственных процессов», Иркутский государственный университет путей сообщения
МЕТОДОЛОГИЯ ПРИБЛИЖЕННО- ОПТИМАЛЬНОГО СИНТЕЗА НЕЧЕТКИХ РЕГУЛЯТОРОВ ПО СХЕМЕ УЛУЧШЕНИЯ И ЛОКАЛИЗАЦИИ
V. N. Sizykh, A. V. Daneev, D. A Palatov
THE METHODOLOGY OF APPROXIMATELY OPTIMAL SYNTHESIS OF FUZZY CONTROLLERS ACCORDING TO THE CIRCUIT OF IMPROVEMENTS
AND LOCALIZATION
Аннотация. На основе системного подхода изложены материалы по аналитическому конструированию параметрически самоорганизующихся, линейных и нелинейных интегрированных систем автоматического управления (САУ) реального (ускоренного) масштаба времени, основанный на совместном использовании технологий динамического программирования, методов квазилинеаризации и продолжения по параметру. Для непрерывных динамических систем приведены основные положения теории нелинейного синтеза в вырожденной (синергетической) формулировке. Разработано алгоритмическое и программное обеспечение интегрированной системы автоматического управления, стратифицированное по уровням управления воздушным судном (информационный, траекторный и пилотажный уровни). Работоспособность алгоритмов нелинейного синтеза проверена на ряде тестовых примеров и на модельных задачах динамики перспективных автоматизированных систем предупреждения столкновений и преодоления сдвига ветра при заходе на посадку самолета среднего класса.
Ключевые слова: непрерывная динамическая система, управление, приближенно-оптимальный синтез, квазилинеаризация, динамическое программирование, метод продолжения по параметру.
Abstract. The paper presents a systematic approach to the analytical parametric design of self-organizing, linear and nonlinear integrated automatic control systems (ACS) with real (fast) time scale, based on combined use of dynamic programming techniques, methods of quasilinearization and parameter continuation. For continuous dynamical systems basics of theory of nonlinear synthesis in a degenerate (synergistic) formulation are given.
Keywords: continuous dynamic system, control, approximately optimal synthesis, quasilinearization, dynamic programming, method of parameter continuation.
Введение
Подход к проблеме синтеза обыкновенных динамических систем, ориентированный на принцип оптимального управления (ОУ) в реальном (ускоренном) времени, был предложен в начале 70-х годов В. С. Шендриком (по инициативе Б. Н. Петрова) и развит А. А. Красовским и его учениками [1]. Наибольший вклад в развитие данного направления теории ОУ внес В. Н. Буков [2]. В начале 90-х принцип управления в реальном времени был «переоткрыт» Р. Габасовым и Ф. М. Кирилловой и успешно развивается в белорусской школе математиков [3].
Известно, что на традиционные алгоритмы последовательных улучшений накладываются достаточно жесткие условия по сходимости и выбору начальных приближений. На пути использования только достаточных условий оптимальности
или теории квазилинеаризации простых и надежных (гарантирующих поточечную сходимость) методов, как отмечалось еще Р. Беллманом [4], создать не удалось. Для преодоления этих трудностей в работе [5] приведена двухметодная технология, основанная на сочетании метода квазилинеаризации с достаточными условиями оптимальности Беллмана - Кротова. Предлагается применить квазилинеаризацию для локальной оптимизации в окрестности точек стационарности, а достаточные условия оптимальности - для интервальной оптимизации. Основная идея двухметодной технологии - за счет интервальной оптимизации осуществлять грубый поиск начального приближения по достаточным условиям, а затем итерационным путем уточнять полученное приближение по условиям локальной оптимальности: стационарности или в форме принципа минимума.
ИРКУТСКИМ государственный университет путей сообщения
Использование для непрерывных динамических систем процедур квазилинеаризации и достаточных условий оптимальности на текущих временных интервалах позволяет выделить четыре базовых схемы решения двухточечных краевых задач (ДТКЗ) [5]: 1) схема традиционного ДП (R. Bellman); 2) схема дифференциального ДП (D. H. Jacobson, В. Ф. Кротов); 3) схема приближений в пространстве политик (дискретный аналог: R. Bellman, R. Calaba); 4) аналог вариационной схемы.
В статье через продолжение решений исходной оптимизационной задачи по непрерывному ограниченному параметру обобщается подход, основанный на сочетании идеи квазилинеаризации с достаточными условиями оптимальности Белл-мана - Кротова. Суть такого обобщения состоит в том, что сначала через достаточные условия оптимальности осуществляется грубый поиск начального приближения оптимального решения, а затем итерационным путем полученное решение раздельно уточняется через его продолжение по нечетко заданному параметру и по условиям локальной оптимальности.
Для организации минимизирующих последовательностей слабой, сильной и абсолютной минималей формулируется вспомогательная (вырожденная по формулировке) задача приближенно-оптимального синтеза. Вырожденность здесь заложена в саму постановку проблемы управления и проявляется особым образом: исходная (невырожденная) задача синтеза доопределяется до сингулярной с целью включения предельных функций состояния и/или управления в множество допустимых, но таким образом, чтобы преобразованная задача содержала оптимальное решение. Если в традиционных постановках вырожденных задач управления сингулярная кривая подлежит определению, то в преобразованной задаче она известна: ею является оптимальная траектория исходной задачи.
Показано, что нечеткие системы регулирования совместимы с логическими процедурами более высокого уровня управления.
Наиболее важным представляется тот факт, что задача нелинейного синтеза формулируется в вырожденной (синергетической) постановке, которая необходима для исследования диссипатив-ных (открытых, самоорганизующихся) систем. 1. Постановка задачи приближенно-оптимального синтеза Под оптимизацией непрерывных процессов управления будем понимать решение задачи выбора на отрезке времени T = [to, tk] позиционного управления
и = и(г0, х(г0), г, х(г)) (1)
и/или состояния
х = х(г0, х(г0), г, и(г)) (2)
для динамической системы
х = / (г, х, и) (3)
такого, чтобы на траектории движения объекта x(t), удовлетворяющей заданным ограничениям на множествах начального и конечного состояний
ц(70,x(t0),tK,x(tK)) = 0, це Rp,
(4)
функционал
h
I = Vt (t^, x(t^), t,, x(t,)) + J f (t, x(t),u(t))dt, I e R1, (5)
t0
достигал минимума (максимума) или наименьшей (наибольшей) точной грани (инфимума inf или супремума sup). Здесь функцииf ц, V3 иf - заданные кусочно-непрерывные по t и непрерывные и достаточно гладкие по x, u (дифференцируемые или кусочно-дифференцируемые) векторные и скалярные функции указанных аргументов.
В дальнейшем будем рассматривать менее общую постановку задачи оптимизации - постановку задачи нелинейного синтеза ОУ, для которой условие (3) без потери общности может учитываться в конструкции модифицированного лагранжиана, а скалярная функция
Vc (x(h )) = Vt (t,, x(tb))
определяет граничные условия только на правом конце траектории (терминальное множество). Граничные условия на левом конце траектории
x(t0) = x° e Rn выбираются произвольными. Конечные ограничения на граничные условия и на значения управляющих функций и траектории процесса (3) будем записывать как
(x(t),u(t)) e F(t) , (6)
где
F(t) c Gx x Gu ,Gx = X£u = U
является декартовым произведением множеств топологической степени (n + m), зависящим от времени t.
Множество пар вектор-функций {x(t), u(t)}, удовлетворяющих дифференциальной связи (3) и конечным ограничениям (6), называют множеством допустимых D. Предполагается, что D^0. Пару функций {x,. (t),u„. (t)}e D
будем называть оптимальным процессом (мини-малью) для I на D, если
I(x.. (t),u... (t)) = d. (7)
Информатика, вычислительная техника и управление
Здесь
й = М I (х(г ),и(*))
- нижняя точная грань функционала (5).
Функционал (7) в общей теории экстремальных задач называют опорным функционалом (опорой) [6].
Последовательность
(х,(Г(г)}е В,
на которой
1 (х* , us У
. ,„ , . „ , (8)
является минимизирующей для функционала I на множестве D.
Введем непрерывную и достаточно гладкую (дифференцируемую или кусочно-дифференцируемую) функцию
ф(Г, х) е Ф и рассмотрим следующие конструкции:
. дф(г, х) дфг, х) г/ Ш, х, и) = ^ ' + ^ ' f(г, х, и) +
да дх (9)
+ fo(t, х u),
Ф(х(10), х(^)) = ^ (х(^)) - ф(^, х(^)) + ф(t0, х(t0)). (10)
Достаточные условия абсолютного минимума задачи (1)-(6) формулируются теоремой о ми-нимали (теоремой В. Ф. Кротова для двойственной задачи) [7].
Теорема 1. Для того чтобы пара (х,., и,,.) е В была минималью в задаче (1)-(6) достаточно существования такой гладкой функции ср(г, х), чтобы выполнялись условия
) = Щ, х,,., и,,.) = тГ Щ, х, и)
(х,и )еР (г)
(11)
Ф(х-. (О,х- (^)) = т£ Ф(х(0,х(^)), (12)
для любого t е [Ц, Ц ],
х(% )еРх(Ц)
где включение
х() е ^)
определяет ограничение на значения вектора состояния системы (1), Fx(t) - проекция множества F(t) на пространство X.
Доказательство теоремы связано с реализацией принципа снятия части ограничений на условия задачи (1)-(6) за счет игнорирования дифференциальной связи (3), то есть за счет перехода к так называемой тривиальной задаче [7] на расширенном множестве
Е = ^(г) з В.
Имеющийся произвол в задании функции р(t,x) позволяет лучше приспособиться к специфике конкретной задачи и определяет метод ее
решения. Связь с другими методами оптимизации рассмотрена в ряде монографий [7]. При этом к выбору функции ф(t, x) можно подходить таким образом, что аналогов среди известных методов не будет [8]. Однако такая общность допускает множество частных рекомендаций и методик, которые тесно связаны с опытом разработчика, а, значит, приближаются к искусству. Конкретные примеры и практические результаты применения теоремы 1 можно найти в [6-8].
2. Принцип локализации и улучшения в задаче оптимизации по неклассическим функционалам качества В данном параграфе ставится и решается задача синтеза нелинейных систем управления по непрерывным и ограниченным неклассическим функционалам качества (в том числе с нечетко заданным параметром а„ е [0,1]).
Включение непрерывного нечетко заданного параметра осуществляется через функционал качества некоторой другой задачи управления, называемой задачей улучшения [6-8] (деформационной вариационной задачи [9]). Если в процессе решения задачи улучшения ее экстремаль остается изолированной и если при каком-либо значении параметра а = а.,а„ е [0,1], эта экстремаль реализует минимум, то она реализует минимум исходной задачи оптимального управления (ОУ) при всех значениях этого параметра. Это основное положение в различных приложениях строго доказывается в монографиях [9, 10].
2.1. Улучшение и принцип локализации В задаче оптимизации непрерывных процессов (1)-(6) вместо функционала (5) будем использовать семейство функционалов
Iа (2) = а1 (2) + (1 -а)У (2,7 + ) , (13)
где
2 = (х, и) е В а е [0,1]
I (х, и) = Уз( х(гк)) + | fo1(t, х, и)Ж .
Функционалы J(z,z*) в рамках развиваемого подхода, связанного с квазилинеаризацией в окрестности точек стационарности, имеют смысл функционалов расстояний и для конкретных схем динамического программирования (ДП) записываются в следующем виде:
1) для схемы дифференциального ДП:
J = uo);
2) для схемы приближений в пространстве политик:
J = J2(x, xo);
3) для аналога вариационной схемы:
J = Jl(u, щ) + J2(x, Xo).
Покажем, каким образом постановка задачи улучшения на основе принципа локализации соотносится с точной формулировкой задачи синтеза (1)-(6). Для этого перепишем однопараметриче-ское семейство функционалов (13) в виде
I„ (г) = а[I(2) — 3(г, 7 +)] + 3(г, 7 +), где выражение в квадратных скобках соответствует доопределению опорного функционала
I* = I(2*) = П I(7) до функционала (5) исходной задачи
I„ (2) =(XI(2 + ) + 3(2, 2 + ). (14)
В зависимости от выбранной системы ДП [5] выражение (14) принимает вид:
1) для схемы дифференциального ДП
Iа (х<),и) = х[I(хд, и) - 3 (и,ид )] + 3 (и, ид ); (15)
2) для схемы приближений в пространстве политик
Iа (х, ид ) = ([I (х, ид ) — ^^ (х, хд )] + (х, хд ); (16)
3) для аналога вариационной схемы
IX (х, и) = а^ (х, и) — 31(и, и0) — 3 2 (х, х0)] + + 3 (и, и0) + 32 (х, х0).
Если для семейства функционалов (15)—(17) при а = 1 дополнительно выполняется предположение об оптимальности по переменным x и/ или u на отрезке tk], то т£ ^ (х, и) = 8(х0) = S(u0) = I (х0, и0) — 31(и, и0) =
= inf I (х, и) = I.
Таким образом, конкретные конструкции однопараметрического семейства функционалов в задаче улучшения и локализации (1)-(4), (6), (13), полученные через квазилинеаризацию дифференциальной связи (3) и интегрантов в критериях (15)-(17), имеют вид:
1) для схемы дифференциального ДП
г
к
I (и()) = а/* + \
г,
0
Л
V
ди
5и
Ж;
у
2) для схемы приближений в пространстве политик
I (х( • )) = аД + | ^ 5х ^Л;
3) для аналога вариационной схемы
I (х( ), и( )) = а1, + |
дк ди
5х \Ж,
дх
где
I* = х»(г,)) + )/»(г,х»(г),ио(г)}Зг - опорный функ-
<0
ционал исходной задачи синтеза (1)-(6).
В основу построения схем приближенно-оптимального синтеза здесь положен гомотопический метод (метод продолжения по параметру [9]). Общая схема метода имеет простую и наглядную трактовку: если имеется какое-либо уравнение и нужно получить информацию об его решениях (доказать существование решения, локализовать решение или построить приближения к решению), то это уравнение включают в некоторое специальным образом построенное однопараметрическое семейство уравнений, сводящее изучаемое уравнение к эталонному уравнению, решение которого известно. Затем это решение «притягивается по параметру» к отыскиваемому решению исходного уравнения. Поясним эту схему на формальном уровне в нашем случае.
Предположим, что требуется определить абсолютный локальный минимум функционала (5) из условия
Щ = 0 (18)
и включить (18) в однопараметрическое семейство функционалов
4 (2) = 0, 0 <а< 1. (19)
Условие (18) иначе записывается в виде
1^*} + J(z,z*) = 0. (20)
Аналогично через формулу (13) переписывается условие (19)
а 1^*} + J(z,z*) = 0. (21)
При а = 0 уравнение (21) имеет решение z = z+, получаемое из эталонного уравнения
J(z,z*) = 0
оптимизационной задачи, а при а =1 решения уравнений (20) и (21) совпадают.
Таким образом, задача (1,П) погружается в однопараметрическое семейство задач синтеза (1а0), решение которых при некотором параметре а ^ 1
притягивается к решению исходной задачи.
Схема решения задачи улучшения и локализации может быть представлена в непрерывном или дискретном виде. В случае дискретного представления промежуток [0, 1] разбивается точками
0 = а0 <а1 < .. .< ап = 1 на п равных частей. В качестве параметра а здесь естественно принять относительное время
г
а, = —, П = tk].
гк
Тогда в начальный нулевой момент времени ^ = 0 параметр а0 = 0, а в конечный момент времени - ап = 1. Шаг дискретизации можно выбрать из условия [10]
Информатика, вычислительная техника и управление
8 = тах (аг+1 -аг).
0<г<и-1
Если 5 достаточно мало, то можно предположить, что точка z(0) = z+ будет близка к решению x(аl) уравнения (21). Беря ее в качестве начального приближения какой-либо итерационной процедуры (например, метода Ньютона), находим с достаточной точностью новое приближение Zl к z(аl). Точка Zl, в свою очередь, рассматривается как начальное условие в (21) к приближенному построению решения z(a2) и т. д. На последнем шаге с нужной точностью получается решение z(1), которое одновременно локализует решение уравнения (18).
2.2. Квазилинеаризация и достаточные условия оптимальности в задаче продолжения по параметру В данном параграфе через продолжение решений оптимизационной задачи (I,D) по непрерывному ограниченному параметру обобщается подход, основанный на сочетании идеи квазилинеаризации с достаточными условиями оптимальности Беллмана - Кротова. Суть такого обобщения заключается в следующем. Сначала через достаточные условия оптимальности осуществляется грубый поиск начального приближения оптимального решения, а затем итерационным путем полученное решение раздельно уточняется через его продолжение по параметру ае[0, 1] и по условиям локальной оптимальности: стационарности (и = Rn) или в форме принципа минимума (и с К1).
Такое раздельное уточнение начального приближения полученного при интервальной оптимизации решения становится очевидным, если обратиться к формализму формулировок задачи улучшения и локализации по схемам ДП: в семействах функционалов (15)-(17) параметр а изменяет свойства только опорного функционала £(х0) = £ (и0) = 1 (x0, и0) = 1 и не оказывает влияния на условия локальной оптимальности.
Последнее утверждение поясняют следующие математические выкладки.
А. Достаточные условия абсолютного минимума. В исходных конструкциях (11), (12) теоремы 1 учтем разложение функций / и /о в ряд Тейлора в малой окрестности локальной минима-ли ^о, ио)
f (г,х,и):
: /(t, х0,и0) + д (X х,и0)
д/ (t, xo, и)
-8х +
ди
дх
0) 8и + о (| 8х,8и|),
/0(г,х,и) = afo(t, х0,и0) +
дfo(t, х0 , и)
дх
8х +
(22)
8и + о ( 8х,8и|).
Тогда достаточные условия абсолютного минимума (11), (12) с учетом (22) перепишутся в виде
. дф(г,х) дф(г,х) г/ Л
1п£ I —-+ —-/и) + а/0(t,х0 ,и0) I +
хеР* I дг дх I
+ М
хеЕх
дф(t, х)/ дх дх дх
8х I +
(23)
М
иеи
дф<Хх) д/ + д/0
дг ди ди
8и I + о (|8х,8и|). = р(г),
1ПГ,,((а^(^)) ^)))8х(^) +
дх(гк)
х(!0 )еР (¡0)
х(гк )ерх (¡к)
+ дф(г0, х0(г0)) 8х(^)) = 0. дх(0
дх(г к )
(24)
Формула (23) через скалярную функцию
Н (¡, х, фх ,и) = / + /0
дх
при допущении
О (| 5х,5и|). = ) принимает более компактный вид:
М
хеР.
(дф(г, х) дф(г, х)
дг
дх
(
+ 1пГ
хеРг
+м
иеи
дН (¡, х0фх, и) дх _
дН (г,х0фх, и0)
ди
/ (t, х0,и0) + а/0(г,х0,и0)
8х
8и
= 0.
(25)
Непосредственно из формул (24), (25) видно, что условия локальной оптимальности (условия стационарности) не зависят от параметра а, что и требовалось показать.
Б. Необходимые и достаточные условия слабой, сильной и абсолютной локальной минима-ли в методе продолжения. Из теоремы 1 и анализа формул (24), (25) формулируется ряд положений, обобщающих условия теорем 2-5 работы [5].
Теорема 2 (обобщение необходимых и достаточных условий локальной оптимальности в форме принципа минимума). Если в задаче (1)-(4), (6), (13) существует локальная минималь ^щ), то в каждой точке стационарности выполняются следующие условия:
1)
дф(г,х0) дф(г,х0)
' -/ (г,х0,и 0) + а/0(г,х 0,и 0) = 0,
дг
дх
дф(г,х0) т
-= у ;
дх
+
+
+
+
2) а^з(х0(гк)) = Ф(г к, х0(<к)) — ф(<0, х0 (г0));
3) н(г, х0, у) = Н(г, х0, у, и0) = шТ Н(г, х0, у, и).
иеП
Здесь условиям 1), 2) соответствует канонически сопряженная система уравнений: уравнения оптимального процесса и косостояний
. дНт (г, х, у)
9у
' _ f(t,x0,мо),хо(^а) = x ,
У =
ОТ
(t, x0, u0) afr Хо, uo)
Ox
-y-a-
Ox
(26)
_ „ SV3 (Xo(tk))
У (tk) = a"
dx(tk)
Если условие 3) разрешимо относительно вектора управления
щ (t) = arg min H(t, x0, y, u),
u^U
то в локальном смысле доставляется минимум функционалу
L = inf I(x,u),
(x,u )eD
а, следовательно, и минимум функционалу
Ia (Х0, u0) = , inf Ia (Х,u) = aI-
(x,u)eD
Другими словами, решение оптимизационной задачи (1)-(4), (6), (13) при любом непрерывном ограниченном параметре a из промежутка [0, 1] гомотопирует к решению исходной задачи синтеза (1)-(6) и как бы деформирует это решение. Поэтому параметр a называется параметром деформации [10]. Справедливо и обратное утверждение.
Утверждение 1. Если в процессе деформации исходной задачи синтеза (1)-(6) ее экстремаль остается изолированной и при каком-либо значении параметра деформации эта экстремаль доставляет минимум семейства функционалов (13), то она реализует минимум задачи улучшения (1)-(4), (6), (13) при всех значениях этого параметра.
Теорема 3 (обобщение необходимых и достаточных условий слабой локальной минимали). Для того чтобы пара (xi0, ui0) была слабой локальной минималью задачи (1)-(4), (6), (15), необходимо и достаточно выполнение следующих условий:
ЗфО^о) . °ф<Хx0)
f (t,x0,uо) + af0(t,x0,u0) = 0
Теорема 3 обобщает решение задачи локально-оптимального синтеза управлений по схеме дифференциального ДП на случай регулятора с нечетко заданным параметром. Здесь локальное улучшение управления производится в два этапа. На первом этапе по условиям 1), 2) определяются грубые начальные приближения в точках стационарности по управлению, которые итерационным путем уточняются через дискретное изменение параметра деформации а. Если при каком-либо значении параметра а = а доставляется минимум функционалу (15) (утверждение 1), то через квазилинеаризацию дифференциальной связи (3) и ин-тегранта семейства функционалов качества (22) в малой окрестности ив(0
x = f x0,u0) +f ou
(27)
Ia ("(•)) = a*I* + П -OfL gu dt
ди
'0 4
организуется процедура приближений
иоп (t, ^ > иоп (t, 0 = ио ().
Значения функционалов стремятся к нижней точной грани
а»I» : ^ / = а»I»
и
и при а ^ 1 приближенно достигается нижняя точная грань 1+ функционала исходной задачи (1)-(6).
Теорема 4 (обобщение необходимых и достаточных условий сильной локальной минимали). Для того чтобы пара (х0, и0) была сильной локальной минималью задачи (1)-(4), (6), (16) необходимо и достаточно выполнение следующих условий:
| дф(,х) + дф(г,х) /(г, х ,и ) + а/1 (г,х ) 1 = 0,
1) | дг дх / (,0, 0) /0(,0, ,
дфг, x) Т
■ = p (t),
0x inf ((a
0V3( x0(tk )) дф(к ,x0(tk ))
2) x(t0)gF W dx(t,)
2/ x(tk )sFx (tk) Vk/
0x(tk)
)gx(tk ) +
°ф(? 0,x0(t 0)) 0x(t 0)
gx(t 0)) = 0;
1) дг дх
дф7,х0) дS (г,х0) т -=-= у ;
дх дх
2) а^з(х0(гк)) = Ф(гк,х0(гк)) — Ф(гo,х0(г0));
3) днXo,и0) ^ 0 для и или и = Яш и при ненулевой
ди
допустимой вариации управления ди.
3) дн(1,^p,и°) = 0 для Х=Кп и при ненулевой
дх
допустимой вариации траектории дх.
Теорема 4 обобщает решение задачи локально-оптимального синтеза по методу приближения в пространстве политик при синтезе регулятора с нечетко заданным параметром.
Здесь локальное улучшение траектории также включает два этапа. Первоначально по условиям интервальной оптимальности 1), 2) определя-
k
Информатика, вычислительная техника и управление
ются грубые начальные приближения в точках стационарности по переменной x, которые итерационным образом уточняются через дискретное изменение параметра а. На втором этапе при некотором значении параметра а = а+, доставляющем минимум функционалам (16), осуществляется квазилинеаризация дифференциальной связи (3) и подынтегрального выражения (16) в малой окрестности xo(t)
(28)
д/
х = / (г, х0, и0) +--8х,
дх
V д/
I а (х(-)) = а * I * + П/ 8х к V дх I и через процедуру приближений
х(т) х— > хо (О определяется его нижняя точная грань:
1пГ / = а I».
В
При а+ — 1, как и при вычислениях по схеме дифференциального ДП, приближенно достигается нижняя точная грань
I» = 1пГI
В
функционала задачи (1)-(6).
Теорема 5 (обобщение необходимых и достаточных условий абсолютной локальной мини-мали). Для того чтобы пара ^щ) была абсолютной локальной минималью задачи (1)-(4), (6), (17), необходимо и достаточно выполнение следующих условий: 1)
. с(дф(г,х) дф(г,х) ш£ I —-—+—— / (г,х0,и 0) + а/0 (г,х0,и 0)
хеРх V дг дх
дф(г,х) Т
■ = Р (г);
= 0,
дх
1пГ
((а —---—)8х(гк) +
2) ^Г дх(гк) дх(гк)
дф<7 0,х0(г 0)) дх( 0)
8х(г 0)) = 0;
дН(t,Xo,p,и0) ^ 0 для X = Кп и при ненулевой до-
дх
пустимой вариации траектории дх;
4) дНхp,и0) ^ 0 для и/или и = Кп и при ненулевой ди
допустимой вариации управления 8и.
Теорема 5 обобщает решение задачи локально-оптимального синтеза по аналогу классической схемы вариационного исчисления на случай синтеза регулятора с нечетко заданным параметром. Локальное улучшение управления и состояния включает несколько этапов. Сначала по
условиям интервальной оптимальности 1), 2) вычисляются грубые начальные приближения решения задачи синтеза в точках стационарности по переменным x и и. Затем через варьирование параметра деформации по условию минимума функционалов (17) итерационным путем уточняются начальные приближения точек стационарности. Далее при некотором наилучшем в смысле минимума функционалов значении параметра а = а+ осуществляется квазилинеаризация дифференциальной связи (3) и интегранта функционалов (17) в окрестности локальной минимали ^о, ио)
х = / (г, х0, и0) + д/ 8х + -д/- 8и
дх
гк
Iа (х(-), и (•)) = а *I* + П/ 8х +
ди
/ 8х + /
дх ди
(29)
8и ш
и через организацию итерационных процедур:
иоп х) х—г > иоп (t, О = ио () и х(т) X—г > хо ^)
обеспечивается выполнение условий тГ Iа = а *I*, тГ Iа — 1пГ I = I*
В а В а В
при а+ — 1.
Утверждения теорем 2-5 реализуются в конкретных конструкциях алгоритмов слабого и сильного улучшения, а также в процедуре поиска абсолютной локальной минимали.
2.3. Алгоритмы приближенно-оптимального синтеза по схеме улучшения и локализации
Для практической реализации рассмотренных выше схем ДП задачи (1)-(4), (6), (13) необходимо сформировать стратегию приближенно-оптимального синтеза через релаксационное расширение пространства состояний, которое связано с исследованием свойств предельных элементов минимизирующих последовательностей поиска управлений и/ или траекторий и с их фиксацией в точках стационарности на основе применения ФОР А. А. Красовского.
Метод и алгоритмы получения оптимального решения на основе итерационных процедур поиска слабой, сильной и абсолютной минималей подробно рассмотрены в работах [5, 11, 12].
Аналогичные результаты могут быть сформулированы и в общем случае при применении метода продолжения по параметру.
Требуется организовать итерационные процедуры поиска слабой (теорема 3), сильной (теорема 4) и абсолютной (теорема 5) минималей, обеспечивающие инфимум ФОР
Iх (У(0) = xSз(у(гк)) +
гк
+ | [бр (0, У) + ¿31 (9) + ¿31 (9 0 ) + ¿32 (Л) + ¿32 (Л 0
(30)
ди
формируемой через решение канонически сопряженной системы: дифференциальной связи (29) и уравнений
/(г,хр,и) . д(дхтрдх) , д(дитрди)
при дифференциальных связях (27), (28), (29). Ин-тегранты линеаризованного в окрестности векторов и0 и/или Х0 семейства функционалов (13) задаются в виде:
б (г,у) = а/ (г, х,и)+/ди - для схемы дифференци-
Р х =—а-
Рх (гк ) =а
дх
дУ! (х(гк))
дх
дх^к)
/ (г, х,,и) д/т (г, х,,и)
дх
дх
-Рх +-
Рх,
дх дх
Рд.
д/т (г, х,и0) д/т (г, х, ц ,)
"Рх,
ального ДП, б (г, у) = а/0 (г, х0, и0)+/ дх - для схемы
Р ди
приближений в пространстве политик,
бр (I, у) = х/0 (г, х0, и0) + / дх + / ди - для аналога ва-
дх ди
риационной схемы.
Утверждения теорем 3-5 конкретизируются через применение метода характеристических полос. Наиболее общий вид алгоритмов с нечеткой прогнозирующей моделью по схемам ДП соответствует аналогу вариационной схемы и формулируется следующей теоремой.
Теорема 6. Для процесса (3) оптимальные в смысле достижения локального минимума семейства функционалов (17) и семейства ФОР (30) управление и состояние определяются процедурой поиска абсолютной локальной минимали
иоп (г, т) > иоп (г, т) = и0 (г),
х(^) > хоп (г) = х0 (г),
ди ди
Л=—РРдх , 9=—ГРди ,
д/ (г х и)
(ф(г, х, дх, ди) = —а/о (г, х0, и0 )--0--——-дх —
дх
д/0 (г, х0 , и 0 ) ди
ди,
фСк, х(гк)) = а¥3(х(гг)),
где ф - функция Ляпунова - Кротова для задачи с расширенным вектором состояния (дх ,ди), дфт дфт дфт
Рх =■
Рдх =
Рди =■
дх ди -"ЛС4
дх ддх дди
а параметр а непрерывно или дискретно изменяется по условиям организации внешнего контура.
Доказательство теоремы 6 осуществляется по методике, изложенной в работе [5], через прямое преобразование достаточных условий оптимальности Беллмана - Кротова к более простым достаточным условиям в форме уравнения Ляпу-
Рис. 1. Структура нечеткого регулятора
Информатика, вычислительная техника и управление
нова для расширенного пространства состояний с последующим решением уравнения в частных производных методом характеристик.
Структуры алгоритмов с нечетко заданной прогнозирующей моделью имеют два контура (рис. 1). При реализации схем ДП они содержат внутренний контур для уточнения точек стационарности по условиям 8и — 0 и/или 8х — 0 и внешний контур - для определения наилучшего в смысле минимума функционалов (17)-(19) параметра а = а+, при котором получаемое решение гомотопирует к оптимальному решению исходной задачи (1)-(6).
Параметр а имеет смысл функции принадлежности и путем количественной интерпретации содержательного смысла нечетких значений лингвистических переменных позволяет количественно описать поведение системы управления.
Нечеткие регуляторы в неявной форме, в которых используется промежуточная модель процесса (в нашем случае прогнозирующая модель) для синтеза в реальном времени, именуются самоорганизующимися, основанными на нечеткой логике [13].
Добавление более высокого (информационного) уровня необходимо для создания автоматизированных продукционных систем поддержки принятия решения (СППР) и встраивания других функций, например таких, как интеграция возможностей человека и машины; интеллектуальный интерфейс; приближение конструктивных и алгоритмических решений к организации деятельности человека; моделирование деятельности оператора и др.
Заключение
На основе условий теорем 3-6 разработано алгоритмическое обеспечение интегрированной САУ, стратифицированное по уровням управления воздушным судном (информационный, траектор-ный и пилотажный уровни). Работоспособность алгоритмов нелинейного синтеза проверена на ряде тестовых примеров и на модельных задачах динамики перспективных автоматизированных систем предупреждения столкновений и преодоле-
ния сдвига ветра при заходе на посадку самолета
среднего класса.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Справочник по теории автоматического управления / под ред. А.А. Красовского. М. : Наука, 1987. 712 с.
2. Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М. : Наука, 1987. 230 с.
3. Габасов Р., Кириллова Ф.М. Принципы оптимального управления // Доклады НАН Беларуси. 2004. Т. 48. С. 15-18.
4. Беллман Р., Калаба Р. Квазилинеаризация и нелинейные краевые задачи. М. : Мир, 1968. 184 с.
5. Мухопад Ю.Ф., Сизых В.Н. Квазилинеаризация и достаточные условия оптимальности // Проблемы информатики. 2012. № 3 (15). С. 39-55.
6. Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. М. : Машиностроение, 1969. 287 с.
7. Гурман В.И. Принцип расширения в задачах управления. М. : Наука, 1997. 288 с.
8. Гурман В.И. Вырожденные задачи оптимального управления. М. : Наука, 1977. 304 с.
9. Гомотопии экстремальных задач / С.В. Емельянов и др. М. : Наука, 2001. 350 с.
10.Бобылев Н.А., Емельянов С.В., Коровин С.К. Геометрические методы в вариационных задачах. М. : Магистр, 1998. 658 с.
11. Сизых В.Н. Итерационно-релаксационный метод приближенно-оптимального синтеза регуляторов // Доклады РАН. 2000. Т. 371. № 5. С. 571-574.
12. Сизых В.Н. Итерационно-релаксационный метод нелинейного синтеза регуляторов // АиТ. 2005. № 6. С. 108-119.
13.Интеллектное управление динамическими системами / С.Н. Васильев и др. М. : Физматлит, 2000. 352 с.