Инженерия
ОПТИМИЗАЦИЯ ГАРАНТИИ В ЗАДАЧАХ УПРАВЛЕНИЯ МЕХАНИЧЕСКИМИ СИСТЕМАМИ
- Ь
А. Н. КРАСОВСКИИ, доктор физико-математических наук, профессор, !I620?J5’ г Екатеринбург,
А. Н. ЛАДЕИЩИКОВ, ^ младший научный сотрудник, ] e-mail: ankrasovskiigigmail.com, Уральская государственная сельскохозяйственная академия [email protected]
Положительная рецензия представлена С. А. Ляпцевым, доктором технических наук, профессором, заведующим кафедрой технической механики Уральского государственного горного университета.
Цель и методика исследований.
В работе рассматривается задача об оптимальном управлении по принципу обратной связи динамической системой при неполной (неточной) информации
о действующих динамических помехах [1]. Критерий качества процесса управления задается в виде функционала, зависящего от реализации управляющих воздействий и помех и движения управляемой системы. Такие критерии качества часто встречаются в типичных задачах управления механическими системами, в частности, в сельском хозяйстве. Задача на минимакс-максимин заданного критерия качества формализуется в антагонистическую дифференциальную игру двух игроков-противников. Задача первого игрока формировать управляющие воздействия, нацеленные на минимизацию критерия качества. Задача второго игрока формировать свои управляющие воздействия-помехи для первого игрока, нацеленные на максимизацию критерия качества.
Такими задачами занимались многие специалисты в стране и за рубежом, в частности, Р. Айзекс [1], Л. С. Понтрягин [11], Р. Беллман [12], Н. Н. Красовский [7, 13], А. В. Кряжимский [14], А. Б. Куржанский [8], Ю. С. Осипов [10, 14], А. И. Субботин [7] и др.
Рассматриваемая задача решается с использованием метода экстремального сдвига [3, 13], формальное описание которого приводится в работе.
Теоретические результаты иллюстрируются при решении конкретного механического примера, охватывающего полную совокупность сил, встречающихся в механике. Приводятся результаты численного моделирования на ЭВМ.
Результаты исследований.
Будем рассматривать динамические системы (х -объекты), описываемые нелинейными дифференциальными уравнениями вида:
¿X
— = Г(г, х, и, и), г <г<г ,иеР, иеQ. (1)
— нач кон
Здесь и — управление, и — помеха, моменты времени 1нац и 1кон заданы и зафиксированы, множество р определяет ресурс органа управления, то есть набор имеющихся в нашем распоряжении управляющих воздействия б . Например, сила тяги реактивного двигателя ограничена по величине. Соответственно, б — ресурс органа, формирующего помехи и.
Уравнения такого вида описывают различные процессы в технике, например, при рассмотрении движения различных механических систем: маятниковых в робототехнике, летательных аппаратах в авиации и космонавтике, тракторов и комбайнов в сель-
ском хозяйстве. Например, в случае движения комбайна управляющими воздействиями и будут вращающий момент на ведущих колесах и углы поворота руля. Помехами и будут силы ветра и люфты в управляющих воздействиях.
Как видим, здесь рассматриваются дифференциальные уравнения первого порядка по времени ¿, то есть | = ...I не второго порядка -¡-2 = -оторые получаются, если для описания движения механической системы использовать второй закон Ньютона или уравнения Лагранжа второго рода [2]. Это объясняется тем, что теория оптимального управления исторически появилась как развитие теории устойчивости движения и теории стабилизации движения [9] и вся теория устойчивости движения сделана для дифференциального уравнения первого порядка по времени ^, то есть ¡X=- .
Рассматриваются критерии качества процесса управления х, зависящие от движения системы (х -объекта) и управляющих воздействий и и помех , реализовавшихся при формировании движения
х [ t ], t < t < t , то есть:
*- -* нац кон
у = ф (х [ t ], и [ ( ], и [ t ], ^нач< t < О (2)
Например, к таким критериям качества относится широко распространенный критерий вида:
У = ^ (х [ (кон ]). (3)
В данной работе рассматривается критерий качества следующего вида:
г кон
у = |ш(г, X[г],и[г],и[г])¡1 + а(х[гкон]) (4)
г нач
Здесь функция т непрерывна по (, х, и, и, а функция а непрерывна по х.
Такой критерий качества можно рассматривать, например, при решении задачи о приведении механического движущегося х - объекта в заданную точку х* с минимальными затратами энергии. В этом случае функционал у (4) принимает вид;
Y = J® ( u[ t ])dt+||x [ tKOJ - x*
(5)
где символ х обозначает евклидову норму вектора х .
Например, критерий качества (5) можно рассматривать при решении задачи управления трактором с тележкой, транспортирующем груз в тележке в заданное место (х*). Тогда первое слагаемое в критерии (5) при соответствующем виде функции т можно трактовать, как экономию горючего затрачиваемого
Инженерия
при выполнении этой работы. При этом роль управляющего воздействия u [ t ] е Р, t < t < tKoH будет играть функция изменения вращательного момента M на ведущих колесах трактора.
Задача первого игрока (роль первого игрока исполняем мы) формировать управляющие воздействия u [ t ] е Р, t < t < t , нацеленные на миниопт L J нач— — кон
мизацию критерия качества J. Задача второго игрока формировать свои управляющие воздействия-помехи для первого игрока u [ t] eQ, tHa4 < t < t нацеленные на максимизацию этого же критерия качества у. То есть:
1 игрок: иопт ^ min у
2 игрок: ^опт ^ max у.
В соответствии с принципом обратной связи используется известная и хорошо изученная схема управления (рис. 1).
Решение рассматриваемой задачи существует в классе позиционных алгоритмов (стратегий) управления [1, 4, 7, 8]. А именно, существуют оптимальные по рассматриваемому критерию качества процесса управления у стратегии первого и второго игроков u (t, x [ t]) и и (t, x [ t]). Эти стратегии представляют из себя некоторые правила, которые по точной информации о реализующейся в момент времени t позиции объекта x [ t ], назначают соответственно управление иопт е Р и помеху ^опт е Q, но не на весь оставшийся отрезок времени [t, t], а только до момента времени t* < t следующего измерения состояния управляемого объекта x[ t ] (рис. 2).
При этом оптимальные стратегии Uonm(t, x [ t ]) и и (t, x [ t ]) строятся конструктивно так называемым методом экстремального сдвига на сопутствующие точки [3, 13], широко применяемым в настоящее время при решении конкретных примеров дифференциальных игр и задач оптимального управления механическими системами при различных критериях качества процесса управления у . Проиллюстрируем
суть этого метода на построении оптимальной стратегии и (•) = и х, е) первого игрока. При этом важ-
опт' ^ опт' '
ную роль играет понятие функции цены р0 (х, ( ) [13]. Способы построения функциир0 ( х, () для рассматриваемой дифференциальной игры для х - объекта (1) с критерием качества у (2) описаны в работах [4, 13].
Оптимальная стратегия и0(^)= и0((, х, е) первого игрока строиться по известной функции цены игры р0 ( х, ( ) методом экстремального сдвига на сопутствующие точки следующим образом:
Пусть в момент времени (., i = 1,..., k (моменты времени и схемы управления по принципу обратной связи) реализовалось фазовое состояние объекта х[ г .] (рис.3).
Надуваем вокруг «точки» х [ ] шарик (сферу)
Ке [ г. ] радиуса £ , где £ > 0 достаточно малый параметр, выбираемый первым игроком до момента начала решения задачи *нац(рис. 4).
В этой сфере находим точку х [ [ удовлетворяющую условию:
Р0(0х0]) = ттрЧоХ
хеКЕ[-;]
то есть точку в сфере Ке [ г. ] в которой цена игры р0 ( х, ( ) наименьшая. Эта точка х [ * * называется сопутствующей точкой для фазового состояния х [ (. ]
(рис. 5).
Строим вектор ^ 1° ] = х [ [ ]- хи [ [ ; направленный от точки х([[ * к х [ ] (рис. 6).
Производим экстремальный сдвиг реальной точки х [ г. ] объекта к виртуальной сопутствующей точке х0 [ г. ] путем выбора управляющего воздействия и0 [ г.] = и0 (г., х [ г £) е Р исходя из условия
, х [ ] и 0 [ ] и )■ ^ = тгп ^ , х [ ] и, и ) ■ ]^,
то есть направляем вектор оптимального управления и0 [ г.] против вектора я[ [ г. ](рис. 7).
Аналогичным образом определяется экстремальный сдвиг для второго игрока при построении его оптимальной стратегии и0(^)= и0((, х, е).
Рисунок 3
Рисунок 2
Инженерия MZ
Проиллюстрируем постановку рассматриваемой задачи на следующем конкретном механическом примере движения точки л с переменной массой р [г](рис. 8).
Точка двигается в горизонтальной плоскости { т1? г2 } под действием центральной силы ^Ц [ ^ ], силы трения В'Г [ г ], управляющей силы Вр [ г ] и силы нерегулируемой помехи В,' [ ^ ] (например, ветер). Центральная сила и сила трения Вт[ г ] (сила сопротивления воздуха) определены равенствами:
йт
ВцЦ Ц ] = Р[ в ] хх, — ] ] = ос[ а ] X—,
аг
где т = {г1, г2} — радиус-вектор точки ¡л ; в [ г ] и а [ г ] — известные функции времени.
Вектор Р'р [ ^ ] пропорционален по модулю век-
тору Ku [t]
d ^ [ t ]
dt
Люфт (помеха) и * [ г ] меняется в пределах от - П до 72. Сила ветра В* [ г ], неконтролируемая нами, ограничена заданной величиной || и* [ г ] || < 1.
Решается задача о построении оптимального управления V0 [ г ], которое формируется по принципу обратной связи и обеспечивает, возможно, меньшее расстояние объекта /л от начала координат {т= 0, г2 = 0} в момент времени г = г .
Г кон
Поэтому показатель качества процесса управле-
ния имеет вид:
Уг
но составляет с ним угол и* [ t ].
Угол поворота и* [ г ] можно трактовать как следствие люфта в управляющем устройстве. Масса р [ г ] меняется по времени по выбираемой программе р [ г ] > 0, гш< г > гк0н; и = { и1 [ г ], и2 [ г ]} — двумерный вектор управления, который формируется по принципу обратной связи.
Движение точки /л описывается известным дифференциальным уравнением движения точки с переменной массой Мещерского [2]:
г а V [ г ] г йт [ г ] _ г г п „ г „ г п
Ц[г] — 2 =а [г]х —— +р [г] — т[г] + [г] + [г],
аг аг *
где Вр[г] = /(г,и,и*)х й^] и нелинейная функция: аг
/(t, u, u*) = {/[ t ], /2[ t ]}_______
/[ [ ] ] = K x( U j[ ] ] x cos U*[ t * — —[ t ] x sin u*[ t ** f2 [ Í ] = К x( x j[ Í ] X sin U *t t * + u 2[ Í ] x cos U *t t * *.
Ресурс ^ управляющего воздействия u[t] состоит из четырех единичных двумерных векторов
у = (т1 ? ] + г72[ 2 ])■
< V 1 Ь кон 1 2 2- кон 2 2
При оптимальных законе управления и способе V0 формирования помехи, отвечающим оптимальным стратегиям игроков и (г, х, £) и и (г, х,£) при некоторых начальных данных получили у = 1,1614 и следующую траекторию движения (рис. 10):
При неоптимальных действиях второго игрока, и оптимальной стратегии первого игрока и (г, х,£) получили у = 0,4659 и траекторию движения (рис. 11):
При неоптимальных действиях первого игрока, и оптимальной стратегии второго игрока и (г, х, £) получили у = 1,6135 и траекторию движения (рис. 12):
Выводы.
Установлено существование решения задачи об оптимальном управлении иопт (t, х ) по принципу обратной связи динамической (механической) системой (1) при неполной информации о действующих помехах V. Формализованная в антагонистическую дифференциальную игру задача с критерием качества процесса управления у (4) доведена до построения конструктивных алгоритмов управления, эффективно реализуемых на ЭВМ.
(]) „,([) „,(3) (4)
u , и
и
(рис. 9).
Рисунок 6
Рисунок 7
Рисунок 8
Инженерия
1 I um
„(3)
a<4) 1 !
Рисунок 9
Рисунок 10
Литература
1. Айзекс Р. Дифференциальные игры. M. : Мир, 1967.
2. Бухгольц Н. Н. Основной курс теоретической механики. М. : Наука, 1969.
3. Красовский А. Н. О позиционном минимаксном управлении // Прикл. математика и механика. 1980. Т. 44. № 4. С. 602-610.
4. Красовский А. Н. Дифференциальная игра для позиционного функционала от фазовых координат и управляющих воздействий // Докл. АН СССР. 1992. Т. 322. № 5. С. 180-183.
5. Красовский А. Н., Ладейщиков А. Н. Об одной задаче конфликтного управления при неполной запаздывающей информации // Математическая теория игр и ее приложения. 2011. Т. 3. Вып. 2.
6. Красовский А. Н., Ладейщиков А. Н. Некоторые задачи игрового управления. Екатеринбург : УрГСХА, 2012.
7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М. : Наука, 1974.
8. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М. : Наука, 1977.
9. Малкин И. Г. Теория устойчивости движения. М. : Наука, 1966.
10. Осипов Ю. С. Дифференциальные игры систем с последействием // Докл. АН СССР. 1971. Т. 196. № 4. С. 779-782.
11. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. В. Математическая теория оптимальных процессов. М. : Наука, 1983.
12. Bellman R. Introduction to the Mathematical Theory of Control Processes. New York : Academic Press, 1971.
13. Krasovskii A. N., Krasovskii N. N. Control Under Lack of Information. Boston : Birkhauser, 1994.
14. Osipov Y. S., Kryazhimskii A. V., Inverse Problem of Ordinary Differential Equation : Dynamical solutions. Gordon and Breach, 1995.