ИННОВАЦИОННЫЕ ПРОГРАММЫ ИНЖЕНЕРНЫХ ИССЛЕДОВАНИЙ
УДК 62-50, 519-714
ДВУХЭТАПНЫЙ СИНТЕЗ СИСТЕМЫ УПРАВЛЕНИЯ МЕТОДОМ СЕТЕВОГО ОПЕРАТОРА*
А.И. Дивеев, Е.Ю. Шмалько
Федеральное государственное бюджетное учреждение науки Вычислительный центр им. А.А. Дородницына Российской академии наук ул. Вавилова, 40, Москва, Россия, 119333
Рассмотрена задача синтеза системы управления и ее решение вычислительным методом сетевого оператора. В отличие от известного подхода, в котором метод сетевого оператора непосредственно решает задачу синтеза управления по заданным критериям и терминальным условиям, в настоящей работе рассмотрен подход на основе двухэтапного синтеза. Новый подход должен обеспечить близость управлений, полученных в результате синтеза, к оптимальным управлениям. На первом этапе численно решаются задачи оптимального управления для различных начальных значений из заданной области. На втором этапе методом сетевого оператора решается задача аппроксимации полученного на первом этапе множества оптимальных траекторий. Приведен пример двухэтапного синтеза системы управления спуском космического аппарата на поверхность Луны.
Ключевые слова: синтез системы управления, оптимальное управление, генетический алгоритм, метод сетевого оператора, управление космическим аппаратом.
В работе рассматривается задача синтеза системы управления. В задаче необходимо найти управление в виде многомерной функции, описывающей зависимость значения вектора управления от вектора координат пространства состояний объекта. Аналитические методы решения задачи синтеза управления имеют ограниченное применение. Последние достижения в области алгоритмизации, в частности современные методы символьной регрессии, методы генетического программирования [1; 2], грамматической эволюции [3], аналитического программирования [4] и сетевого оператора [5—10] позволяют создавать вычислительные методы для решения задачи синтеза управления.
* Работа выполнена при поддержке гранта РФФИ № 14-08-00008а.
Вычислительный метод синтеза системы управления на основе метода сетевого оператора включает поиск математического выражения, описывающего функцию управления, с помощью генетического алгоритма, построенного на основе принципа малых вариаций базисного решения, по заданным критериям качества, определяющим условия достижения цели управления и оптимальное значение показателя качества управления. Одним из недостатков метода сетевого оператора является отсутствие возможности проверки близости полученного решения к оптимальному решению. Полученная в результате решения задачи синтеза функция управления после ее подстановки в правые части дифференциальных уравнений, описывающих математическую модель объекта управления, должна давать систему уравнений без вектора управления в правых частях. Решение полученной системы обыкновенных дифференциальных уравнений при начальных значениях из заданной области, используемой при решении задачи синтеза, должно совпадать с оптимальными траекториями, которые могут быть получены в результате решения задачи оптимального управления.
В настоящей работе рассматривается вычислительный метод синтеза системы управления, состоящего из двух этапов. На первом этапе решаем задачи оптимального управления для каждого начального состояния из заданного дискретного множества начальных условий. Для решения задачи оптимального управления используем вычислительный метод, построенный на основе вариационного генетического алгоритма. После решения каждой задачи оптимального управления получаем оптимальные значения управления и оптимальные траектории движения объекта. На втором этапе методом сетевого оператора решаем задачу аппроксимации множества точек оптимальных траекторий.
В качестве прикладного примера в работе рассматривается задача управления спуском космического аппарата на поверхность Луны [11].
Рассмотрим формальную постановку задачи синтеза системы управления.
Задана математическая модель объекта управления
X = f(x, u), (1)
где x — вектор состояния объекта управления; u — вектор управления; x е R", u е U с Rm, x = ... xn]T, u = [ux ... xm]T, U — ограниченное замкнутое множество.
Для системы (1) задано множество начальных значений
x(0) е X0 с R". (2)
Заданы терминальные условия
9;(x(f)) = 0, i = Tj, (3)
где f — время окончания процесса управления.
Задан критерий качества управления
tf
J = J fo (x(t), u(t))dt ^ min. (4)
o
Необходимо найти управление в виде
u = h(x), (5)
где h(x) — многомерная функция, удовлетворяющая условиям
h(x): Rn ^ Rm, (6)
h(x(x0, t)) e U, (7)
tf tf
jfo (x(x0, t), h(x(x0, t)))dt = min jfo (x(t), u(t))dt, (8)
0 ue 0
где x(x0, t) — решение системы
X = f(x, h(x)), (9)
при начальных условиях Vx(0) = x0 e X0.
Для решения задачи синтеза (1)—(8) можно использовать численный метод сетевого оператора, подробно описанный в работах [5—10]. Метод обеспечивает поиск решения в форме (5) по критерию оптимизации (4) и терминальным условиям (3).
Если искать решение для одного конкретного начального значения
x(0) = x0 (10)
в виде функции времени
uo = (u(t) : t e [0, tf]), (11)
то получим задачу оптимального управления (1), (3), (4), (10), (11).
После решения задачи оптимального управления для начального значения x0 e X0 решение x(t) системы уравнений
X = f(x, u(t)) (12)
должно совпадать с решением x(x0, t) системы уравнений (9)
x(x0, t) = x(t). (13)
Неудовлетворение условия (13) говорит о том, что найденная в результате решения задачи синтеза функция h(x) не позволяет получать оптимальные траектории движения объекта управления, т.е. не удовлетворяет условию (8).
Для получения решения, учитывающего условие (13) близости к оптимальному решению, задачу синтеза управления решаем в два этапа. На первом этапе решаем задачи оптимального управления для множества начальных значений из
заданной области (2). Сохраняем множество точек оптимальных траекторий и оптимальных значений управления. На втором этапе решаем задачу аппроксимации множества полученных точек многомерной функцией методом сетевого оператора.
Опишем формальные соотношения двухэтапного синтеза системы управления.
Заменим множество начальных условий конечным множеством точек
X = {х0,г е X : I = 1, М}. (14)
Решаем М задач оптимального управления для каждого начального значения из (14), и сохраняем множество точек оптимальных траекторий
т = {(¿0, Х'(/о), иад, (/1, Х'^), и'^)), ..., (к Х(К), иг'(Ш, (15)
где г = 1, М, ^ = ] = 0, К, Ы — шаг дискретизации.
На первом этапе решения задачи оптимального управления используем вариационный генетический алгоритм многокритериальной оптимизации [12].
На втором этапе решаем задачу аппроксимации точек (15) многомерной функцией. Для решения задачи используем метод сетевого оператора и критерий качества аппроксимации
M к 2
J = ХЛЁ(()-h(j))) min- (17)
i=1 V j=0
В качестве примера используем рассмотренный метод для решения задачи синтеза системы управления спуском космического аппарата (КА) на поверхность Луны [11].
Модель объекта управления описывается следующей системой дифференциальных уравнений:
d— = W cos (u-0)-g cos 0, (18)
d 0 1
= - ( sin (-0) + g sin 0), (19)
— = V cos 0, (20) dt
— = V sin 0, (21) dt
dm = P0 + u2
~di~~ pud '
Я = Я0 + н
ю
где V — модуль скорости движения космического аппарата; Ж — ускорение, создаваемое тягой двигателя торможения; 0 — угол наклона траектории относительно гравитационной вертикали; Н — высота полета КА; Я — модуль радиус-вектора от центра Луны до космического аппарат; Я0 — средний радиус поверхности Луны; Ь — дальность вдоль поверхности; т — масса КА; Р — тяга коррекционно-тормозного двигателя (Н); РиЛ — удельный импульс коррекционно-тормозного двигателя (м/с); g0 — гравитационное ускорение свободного падения на поверхности Луны; Я0 = 1738,4 км; Р0 = 440 кг; РиЛ = 319 с; g0 = 1,623 м/ с2; g~ = 9,80665 м/с2.
Заданы области начальных значений:
П0) = V), 0(0) = 00, Н(0) е [Н-, Н+], ф(0) = Фо, т(0) = то, (23)
где 00, 0+ — наименьшее и наибольшее начальные значения угла наклона траектории; Н-, Н+ — наименьшее и наибольшее значения начальной высоты.
Заданы терминальные условия:
V(tf) е [V-, V/], Н($ е [Н-, Н+ ]
(24)
t + — иначе
(25)
где V-, ^^ — наименьшее и наибольшее терминальные значения модуля скорости; Н-, Н+ — наименьшее и наибольшее терминальные значения высоты; (+ — максимальное время полета.
Значения компонент управления ограничены
и1 е [и1 , и+], и2 е [и2 , и+]
(26)
где и-, и+ — наименьшее и наибольшее значения компоненты управления и, I = 1,2. Заданы терминальные условия:
V
/
(27)
\2
(28)
Заданы критерии качества управления:
J1 = a\Lf - Щ\ + \hf + h+ - 2h(tf)\ ^ min, (29)
J2 = \Vf - Vf ^ min, (30)
где а — весовой коэффициент; Lf — заданное терминальное значение дальности.
При решении задачи непрерывные интервалы начальных значений были заменены множествами точек
[h-, h0+f ^ {h0,0, h0,1, h0,khb (31)
где hoj = h- + jAh{), (32)
где Ah0 — величины приращений по углу наклона траектории и высоте.
В вычислительном эксперименте были использованы следующие параметры модели: V(0) = 1689 м/с, 00 = 1,6 рад, h- = 16,648 км, h+ = 19,648 км, ф(0) = 0 рад, m(0) = 940 кг, u- = 0 рад, u+ = 3,14159265 рад, u- = -80 кг, u- = +80 кг, Vf = 0 м/с, Vf = +5 м/с, h- = 1,2 км, h+ = 1,8 км, Lf = -240 км, A00 = 0,05 рад, Ah0 = 1,5 км, kh = 2, а = 0,1.
На первом этапе была решена задача оптимального управления для различных начальных значений, определенных соотношениями (30)—(33). Решение задачи осуществляли численно методом вариационного генетического алгоритма [12]. Для каждого оптимального решения были сохранены множества точек оптимального управления и оптимальных траекторий (15).
Затем на втором этапе по критерию (17) была решена задача синтеза системы управления методом сетевого оператора [5—10].
Для синтеза методом сетевого оператора было выбрано следующее базисное решение
ui =
u-, если ui < u-
u+, если ui > u+, i = 1, 2,
u — иначе
где
а 0
Ü =q? (n + ^ + h (hf-h)$(hf-h),
0e --= h0 + h+ ^>4 = J1, если A > 0
й =-a0ecos0, h =—-Ö(A) = '
2 10, иначе
n = 3,14159265, q0 = 1, q20 = 1, q0 = 1.
В результате синтеза было получено следующее управление:
щ = Чл+)1п (|в|+1)+С+ке^+ад,
и2 = и1 — и3 + ев — #39ео8(9) + 0(^39) — д2,
где л =
л = 8ВП (гп )(! -1) + гю + (-Н'
В = -
е - ^е еок(е)
92
ц(г9 ^п(Е )(еЕ -1),
С = Е?22
8ВП(Е ^+92 + (\ Н)+(е+п) - (е+п)3
Б =
8вп(£ )^Е+92+(М+(е+п) - (е+п)3,
1 - е -?2
Е = -^91(е + п), 9! = 4,008, 92 = 6,927, ?3 = 12,07.
На рис. 1—3 приведены результаты моделирования полученной системы управления. На рисунках представлены графики изменения основных переменных модели, используемых в критериях качества при решении задачи оптимального управления, V, Н и Ь, для различных начальных значений. На этих же графиках приведены точками оптимальные траектории, полученные в результате численного решения задачи оптимального управления.
Рис. 1. Скорость КА
Графики на рис. 1—3 получены при следующих начальных значениях: а) Н(0) = 16,648 км, б) Н(0) = 19,648 км.
Из результатов моделирования видно, что полученная система управления обеспечивает движение вблизи оптимальных траекторий по скорости и дальности полета. Наибольшее отличие от оптимальной траектории наблюдается по изменению высоты. Несмотря на то, что отклонение от оптимальной траектории по высоте достигало 6 км, терминальные условия выполняются достаточно точно: при Н(0) = 16,648 км, У{) = 5,27 м/с, Н()) = 1,758 км, Щ) = -240,986 км, при Н(0) = 19,648 км, У) = 5,45 м/с, Н()) = 4,931 км, Щ) = -240,955 км.
ЛИТЕРАТУРА
[1] Koza J.R., Keane M.A., Rice J.P. Performance improvement of machine learning via automatic discovery of facilitating functions as applied to a problem of symbolic system identification // IEEE International Conference on Neural Networks I. 1993. San Francisco, USA. 1993. P. 191— 198.
[2] Bourmistrova A., Khantsis S. Control System Design Optimization via Genetic Programming in Proc. of IEEE Congress on Evolutionary Computation, Singapore, 2007, P. 1993—2000.
[3] O'Neill M., Ryan C., Keijzer M., Cattolico M. Crossover in Grammatical Evolution, Genetic Programming and Evolvable Machines 4(1), 2003, P. 67—93.
[4] Zelinka I., Nolle L., Oplatkova Z. Analytic Programming — Symbolic Regression by Means of Arbitrary Evolutionary Algorithms // Journal of Simulation. 2012. Vol. 6, N 9. P. 44—56.
[5] Дивеев А.И. Метод сетевого оператора. М.: ВЦ РАН, 2010. 178 с.
[6] Дивеев А.И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Известия РАН ТиСУ. 2012, № 2. С. 63—78.
[7] ДивеевА.И., Софронова Е.А. Метод сетевого оператора и его применение в задачах управления. М.: Изд-во РУДН, 2012. 182 с.
[8] Дивеев А.И., Пупков К.А., Софронова Е.А. Повышение качества систем управления на основе многокритериального синтеза методом сетевого оператора // Вестник РУДН. Серия «Инженерные исследования». 2009, № 4. С. 5—12.
[9] Diveyev A.I., Sofronova E.A. Application of network operator method for synthesis of optimal structure and parameters of automatic control system // Proceedings of 17-th IFAC World Congress, Seoul, 2008, 05.07.2008—12.07.2008. P. 6106—6113.
[10] Diveev A.I., Sofronova E.A. The Network Operator Method for Search of the Most Suitable Mathematical Equation. Chapter in the book Bio-Inspired Computational Algorithms and Their Applications / Edited by Shangce Gao. Intech. Printed 2012. February, Croatia. P. 19—42.
[11] Дивеев А.И., Пупков К.А., Софронова Е.А. Синтез управления спуском космического аппарата на поверхность Луны методом сетевого оператора // Вестник МГТУ им. Н.Э. Баумана. Серия «Приборостроение». 2013. № 4. С. 14—29.
[12] Дивеев А.И., Шмалько Е.Ю. Вариационный генетический алгоритм для решения задачи оптимального управления // Современные проблемы науки и образования. 2014. № 1. URL: http://www.science-education.ru/115-11474
TWO-STAGE SYNTHESIS OF CONTROL SYSTEM BY THE NETWORK
OPERATOR METHOD
A.I. Dh^^ E.Yu. Shmalko
Dorodnicyn Computer Center of Russian Academy of Sciences Vavilov str., 40, Moscow, Russia, 119333
The paper focuses on the problem of control system synthesis and a numerical method of the network operator is proposed to search a solution. Apart from a well-known approach when the stated control synthesis problem is solved directly by the method of network operator considering given criteria and terminal conditions, the present paper describes a two-stage synthesis. The first stage is supposed to solve numerically a set of optimal control tasks for different initial values from some given space. The second stage makes an approximation of the previously received optimal trajectories by means of the network operator. An example illustrates the two-stage synthesis of a control system for a spaceship descent to the Moon.
Key words: control system synthesis, optimal control, genetic algorithm, method of network operator, spaceship control.
REFERENCES
[1] Koza J.R., Keane M.A., Rice J.P. Performance improvement of machine learning via automatic discovery of facilitating functions as applied to a problem of symbolic system identification // IEEE International Conference on Neural Networks I. 1993. San Francisco, USA. 1993. P. 191— 198.
BecTHHK PynH, cepua HHwernpmie uccnedoeaHrn, 2015, № 3
[2] Bourmistrova A., Khantsis S. Control System Design Optimization via Genetic Programming in Proc. of IEEE Congress on Evolutionary Computation, Singapore, 2007, P. 1993—2000.
[3] O'Neill M., Ryan C., Keijzer M., Cattolico M. Crossover in Grammatical Evolution, Genetic Programming and Evolvable Machines 4(1), 2003, P. 67—93.
[4] Zelinka I., Nolle L., Oplatkova Z. Analytic Programming — Symbolic Regression by Means of Arbitrary Evolutionary Algorithms // Journal of Simulation. 2012. Vol. 6, N 9. P. 44—56.
[5] Diveev A.I. Method of network operators. M.: VTs RAN, 2010. 178 p.
[6] Diveev A.I. Digital method of network operators for syntheses systems of management with undetermined begins data // Bulletin RAN TiSU. 2012, № 2. p. 63—78.
[7] Diveev A.I., Sofronova E.A. Application of network operator method in management. M.: Publ. PFU, 2012. 182 p.
[8] Diveev A.I., Pupkov K.A., Sofronova E.A. Up quality of management systems with application of network operator method // Bulletin PFU. Series Engineering researches. 2009, № 4. p. 5—12.
[9] Diveyev A.I., Sofronova E.A. Application of network operator method for synthesis of optimal structure and parameters of automatic control system // Proceedings of 17-th IFAC World Congress, Seoul, 2008, 05.07.2008—12.07.2008. P. 6106—6113.
[10] Diveev A.I., Sofronova E.A. The Network Operator Method for Search of the Most Suitable Mathematical Equation. Chapter in the book Bio-Inspired Computational Algorithms and Their Applications / Edited by Shangce Gao. Intech. Printed 2012. February, Croatia. P. 19—42.
[11] Diveev A.I., Pupkov K.A., Sofronova E.A. Sintez upravlenia spuskom kosmicheskogo apparata na poverkhnost Luny metodom setevogo operatora // Vsstnik MGTU im. N.E.Baumana. Ser. «Priborostroenie». 2013. № 4. S. 14—29.
[12] Diveev A.I., Shmalko E.Yu. Variational genetic algorithm for solving optimal control problems // Modern problems of science and education. 2014. № 1. URL: http://www.science-education. ru/115-11474