Научная статья на тему 'Оптимизация гарантии в задачах управления механическими системами'

Оптимизация гарантии в задачах управления механическими системами Текст научной статьи по специальности «Математика»

CC BY
131
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
НЕЛИНЕЙНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА / УПРАВЛЕНИЕ / ПОМЕХА / КРИТЕРИЙ КАЧЕСТВА / ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ / ЭКСТРЕМАЛЬНЫЙ СДВИГ / ЦЕНА ИГРЫ / ОПТИМАЛЬНАЯ СТРАТЕГИЯ / NONLINEAR DYNAMICAL SYSTEM / CONTROL / DISTURBANCE / QUALITY INDEX / GUARANTEED RESULT / EXTREMAL SHIFT / VALUE OF THE GAME / OPTIMAL STRATEGY

Аннотация научной статьи по математике, автор научной работы — Красовский А. Н., Ладейщиков А. Н.

Рассматривается задача об оптимальном управлении по принципу обратной связи нелинейной динамической системой при дефиците информации о действующих помехах. Задача на минимакс-максимин гарантированного результата для заданного позиционного критерия качества формализуется в антагонистическую дифференциальную игру двух лиц в рамках концепции свердловской (ныне екатеринбургской) школы по теории дифференциальных игр. Исследования в работе основываются на подходах, методах и конструкциях из теории оптимальных процессов управления, теории устойчивости движения, отслеживания и наблюдения процессов и т. д., которые создавались и развивались в работах Р. Беллмана, Р. Айзекса, Н. Н. Красовского, А. В. Кряжимского, А. Б. Куржанского, Ю. С. Осипова, Л. С. Понтрягина, А. И. Субботина и др. Устанавливается существование оптимальных алгоритмов управления. Решение задачи базируется на методе экстремального сдвига на сопутствующие точки, разработанном одним из авторов статьи. Приводится иллюстрирующий пример с результатами его компьютерной симуляции. Постановка рассматриваемых в работе задач и методы их решений основаны на математической формализации задач оптимизации управляемых процессов с показателем гарантированного результата и особенно задач управления в концепции теории дифференциальных игр, которая развивается в Екатеринбурге в Уральской государственной сельскохозяйственной академии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The optimization of guaranty for the mechanical control problem620075,

The optimal feedback control problem is considered for the nonlinear dynamical system under lack of information on disturbances. The minimax-maximin problem on the guaranteed result for a given positional quality index is formalized in the framework of concepts of the Sverdlovsk-Yekaterinburg school on the theory of differential games, as the two-person antagonistic differential game. The investigations in the work are based on the approaches, methods and constructions from the theory of optimal control processes, theory of stability, tracing and observation of the of the processes and so on, which were proposed and developed in the works of Bellman R., Isaacs R., Krasovskii N. N., Kryazhimskii A. V., Kurzhanskii A. B., Osipov Y. S., Pontryagin L. S., Subbotin A. I. and many other authors. The existence of the optimal algorithms of control is obtained. The solution of a problem is based on the method of extremal shift to accompanying points, elaborated by one of authors of the paper. Results are illustrated by the model example and its numerical simulation. The statement of the considered here problems and the methods of its solutions are based on the mathematical formalization for the problems on the optimization of the control processes under the criterion of ensured result and in particular for the problems on the control in conception of differential games that is developed au Ural state agricultural academy in Yekaterinburg.

Текст научной работы на тему «Оптимизация гарантии в задачах управления механическими системами»

Инженерия

ОПТИМИЗАЦИЯ ГАРАНТИИ В ЗАДАЧАХ УПРАВЛЕНИЯ МЕХАНИЧЕСКИМИ СИСТЕМАМИ

- Ь

А. Н. КРАСОВСКИИ, доктор физико-математических наук, профессор, !I620?J5’ г Екатеринбург,

А. Н. ЛАДЕИЩИКОВ, ^ младший научный сотрудник, ] e-mail: ankrasovskiigigmail.com, Уральская государственная сельскохозяйственная академия [email protected]

Положительная рецензия представлена С. А. Ляпцевым, доктором технических наук, профессором, заведующим кафедрой технической механики Уральского государственного горного университета.

Цель и методика исследований.

В работе рассматривается задача об оптимальном управлении по принципу обратной связи динамической системой при неполной (неточной) информации

о действующих динамических помехах [1]. Критерий качества процесса управления задается в виде функционала, зависящего от реализации управляющих воздействий и помех и движения управляемой системы. Такие критерии качества часто встречаются в типичных задачах управления механическими системами, в частности, в сельском хозяйстве. Задача на минимакс-максимин заданного критерия качества формализуется в антагонистическую дифференциальную игру двух игроков-противников. Задача первого игрока формировать управляющие воздействия, нацеленные на минимизацию критерия качества. Задача второго игрока формировать свои управляющие воздействия-помехи для первого игрока, нацеленные на максимизацию критерия качества.

Такими задачами занимались многие специалисты в стране и за рубежом, в частности, Р. Айзекс [1], Л. С. Понтрягин [11], Р. Беллман [12], Н. Н. Красовский [7, 13], А. В. Кряжимский [14], А. Б. Куржанский [8], Ю. С. Осипов [10, 14], А. И. Субботин [7] и др.

Рассматриваемая задача решается с использованием метода экстремального сдвига [3, 13], формальное описание которого приводится в работе.

Теоретические результаты иллюстрируются при решении конкретного механического примера, охватывающего полную совокупность сил, встречающихся в механике. Приводятся результаты численного моделирования на ЭВМ.

Результаты исследований.

Будем рассматривать динамические системы (х -объекты), описываемые нелинейными дифференциальными уравнениями вида:

¿X

— = Г(г, х, и, и), г <г<г ,иеР, иеQ. (1)

— нач кон

Здесь и — управление, и — помеха, моменты времени 1нац и 1кон заданы и зафиксированы, множество р определяет ресурс органа управления, то есть набор имеющихся в нашем распоряжении управляющих воздействия б . Например, сила тяги реактивного двигателя ограничена по величине. Соответственно, б — ресурс органа, формирующего помехи и.

Уравнения такого вида описывают различные процессы в технике, например, при рассмотрении движения различных механических систем: маятниковых в робототехнике, летательных аппаратах в авиации и космонавтике, тракторов и комбайнов в сель-

ском хозяйстве. Например, в случае движения комбайна управляющими воздействиями и будут вращающий момент на ведущих колесах и углы поворота руля. Помехами и будут силы ветра и люфты в управляющих воздействиях.

Как видим, здесь рассматриваются дифференциальные уравнения первого порядка по времени ¿, то есть | = ...I не второго порядка -¡-2 = -оторые получаются, если для описания движения механической системы использовать второй закон Ньютона или уравнения Лагранжа второго рода [2]. Это объясняется тем, что теория оптимального управления исторически появилась как развитие теории устойчивости движения и теории стабилизации движения [9] и вся теория устойчивости движения сделана для дифференциального уравнения первого порядка по времени ^, то есть ¡X=- .

Рассматриваются критерии качества процесса управления х, зависящие от движения системы (х -объекта) и управляющих воздействий и и помех , реализовавшихся при формировании движения

х [ t ], t < t < t , то есть:

*- -* нац кон

у = ф (х [ t ], и [ ( ], и [ t ], ^нач< t < О (2)

Например, к таким критериям качества относится широко распространенный критерий вида:

У = ^ (х [ (кон ]). (3)

В данной работе рассматривается критерий качества следующего вида:

г кон

у = |ш(г, X[г],и[г],и[г])¡1 + а(х[гкон]) (4)

г нач

Здесь функция т непрерывна по (, х, и, и, а функция а непрерывна по х.

Такой критерий качества можно рассматривать, например, при решении задачи о приведении механического движущегося х - объекта в заданную точку х* с минимальными затратами энергии. В этом случае функционал у (4) принимает вид;

Y = J® ( u[ t ])dt+||x [ tKOJ - x*

(5)

где символ х обозначает евклидову норму вектора х .

Например, критерий качества (5) можно рассматривать при решении задачи управления трактором с тележкой, транспортирующем груз в тележке в заданное место (х*). Тогда первое слагаемое в критерии (5) при соответствующем виде функции т можно трактовать, как экономию горючего затрачиваемого

Инженерия

при выполнении этой работы. При этом роль управляющего воздействия u [ t ] е Р, t < t < tKoH будет играть функция изменения вращательного момента M на ведущих колесах трактора.

Задача первого игрока (роль первого игрока исполняем мы) формировать управляющие воздействия u [ t ] е Р, t < t < t , нацеленные на миниопт L J нач— — кон

мизацию критерия качества J. Задача второго игрока формировать свои управляющие воздействия-помехи для первого игрока u [ t] eQ, tHa4 < t < t нацеленные на максимизацию этого же критерия качества у. То есть:

1 игрок: иопт ^ min у

2 игрок: ^опт ^ max у.

В соответствии с принципом обратной связи используется известная и хорошо изученная схема управления (рис. 1).

Решение рассматриваемой задачи существует в классе позиционных алгоритмов (стратегий) управления [1, 4, 7, 8]. А именно, существуют оптимальные по рассматриваемому критерию качества процесса управления у стратегии первого и второго игроков u (t, x [ t]) и и (t, x [ t]). Эти стратегии представляют из себя некоторые правила, которые по точной информации о реализующейся в момент времени t позиции объекта x [ t ], назначают соответственно управление иопт е Р и помеху ^опт е Q, но не на весь оставшийся отрезок времени [t, t], а только до момента времени t* < t следующего измерения состояния управляемого объекта x[ t ] (рис. 2).

При этом оптимальные стратегии Uonm(t, x [ t ]) и и (t, x [ t ]) строятся конструктивно так называемым методом экстремального сдвига на сопутствующие точки [3, 13], широко применяемым в настоящее время при решении конкретных примеров дифференциальных игр и задач оптимального управления механическими системами при различных критериях качества процесса управления у . Проиллюстрируем

суть этого метода на построении оптимальной стратегии и (•) = и х, е) первого игрока. При этом важ-

опт' ^ опт' '

ную роль играет понятие функции цены р0 (х, ( ) [13]. Способы построения функциир0 ( х, () для рассматриваемой дифференциальной игры для х - объекта (1) с критерием качества у (2) описаны в работах [4, 13].

Оптимальная стратегия и0(^)= и0((, х, е) первого игрока строиться по известной функции цены игры р0 ( х, ( ) методом экстремального сдвига на сопутствующие точки следующим образом:

Пусть в момент времени (., i = 1,..., k (моменты времени и схемы управления по принципу обратной связи) реализовалось фазовое состояние объекта х[ г .] (рис.3).

Надуваем вокруг «точки» х [ ] шарик (сферу)

Ке [ г. ] радиуса £ , где £ > 0 достаточно малый параметр, выбираемый первым игроком до момента начала решения задачи *нац(рис. 4).

В этой сфере находим точку х [ [ удовлетворяющую условию:

Р0(0х0]) = ттрЧоХ

хеКЕ[-;]

то есть точку в сфере Ке [ г. ] в которой цена игры р0 ( х, ( ) наименьшая. Эта точка х [ * * называется сопутствующей точкой для фазового состояния х [ (. ]

(рис. 5).

Строим вектор ^ 1° ] = х [ [ ]- хи [ [ ; направленный от точки х([[ * к х [ ] (рис. 6).

Производим экстремальный сдвиг реальной точки х [ г. ] объекта к виртуальной сопутствующей точке х0 [ г. ] путем выбора управляющего воздействия и0 [ г.] = и0 (г., х [ г £) е Р исходя из условия

, х [ ] и 0 [ ] и )■ ^ = тгп ^ , х [ ] и, и ) ■ ]^,

то есть направляем вектор оптимального управления и0 [ г.] против вектора я[ [ г. ](рис. 7).

Аналогичным образом определяется экстремальный сдвиг для второго игрока при построении его оптимальной стратегии и0(^)= и0((, х, е).

Рисунок 3

Рисунок 2

Инженерия MZ

Проиллюстрируем постановку рассматриваемой задачи на следующем конкретном механическом примере движения точки л с переменной массой р [г](рис. 8).

Точка двигается в горизонтальной плоскости { т1? г2 } под действием центральной силы ^Ц [ ^ ], силы трения В'Г [ г ], управляющей силы Вр [ г ] и силы нерегулируемой помехи В,' [ ^ ] (например, ветер). Центральная сила и сила трения Вт[ г ] (сила сопротивления воздуха) определены равенствами:

йт

ВцЦ Ц ] = Р[ в ] хх, — ] ] = ос[ а ] X—,

аг

где т = {г1, г2} — радиус-вектор точки ¡л ; в [ г ] и а [ г ] — известные функции времени.

Вектор Р'р [ ^ ] пропорционален по модулю век-

тору Ku [t]

d ^ [ t ]

dt

Люфт (помеха) и * [ г ] меняется в пределах от - П до 72. Сила ветра В* [ г ], неконтролируемая нами, ограничена заданной величиной || и* [ г ] || < 1.

Решается задача о построении оптимального управления V0 [ г ], которое формируется по принципу обратной связи и обеспечивает, возможно, меньшее расстояние объекта /л от начала координат {т= 0, г2 = 0} в момент времени г = г .

Г кон

Поэтому показатель качества процесса управле-

ния имеет вид:

Уг

но составляет с ним угол и* [ t ].

Угол поворота и* [ г ] можно трактовать как следствие люфта в управляющем устройстве. Масса р [ г ] меняется по времени по выбираемой программе р [ г ] > 0, гш< г > гк0н; и = { и1 [ г ], и2 [ г ]} — двумерный вектор управления, который формируется по принципу обратной связи.

Движение точки /л описывается известным дифференциальным уравнением движения точки с переменной массой Мещерского [2]:

г а V [ г ] г йт [ г ] _ г г п „ г „ г п

Ц[г] — 2 =а [г]х —— +р [г] — т[г] + [г] + [г],

аг аг *

где Вр[г] = /(г,и,и*)х й^] и нелинейная функция: аг

/(t, u, u*) = {/[ t ], /2[ t ]}_______

/[ [ ] ] = K x( U j[ ] ] x cos U*[ t * — —[ t ] x sin u*[ t ** f2 [ Í ] = К x( x j[ Í ] X sin U *t t * + u 2[ Í ] x cos U *t t * *.

Ресурс ^ управляющего воздействия u[t] состоит из четырех единичных двумерных векторов

у = (т1 ? ] + г72[ 2 ])■

< V 1 Ь кон 1 2 2- кон 2 2

При оптимальных законе управления и способе V0 формирования помехи, отвечающим оптимальным стратегиям игроков и (г, х, £) и и (г, х,£) при некоторых начальных данных получили у = 1,1614 и следующую траекторию движения (рис. 10):

При неоптимальных действиях второго игрока, и оптимальной стратегии первого игрока и (г, х,£) получили у = 0,4659 и траекторию движения (рис. 11):

При неоптимальных действиях первого игрока, и оптимальной стратегии второго игрока и (г, х, £) получили у = 1,6135 и траекторию движения (рис. 12):

Выводы.

Установлено существование решения задачи об оптимальном управлении иопт (t, х ) по принципу обратной связи динамической (механической) системой (1) при неполной информации о действующих помехах V. Формализованная в антагонистическую дифференциальную игру задача с критерием качества процесса управления у (4) доведена до построения конструктивных алгоритмов управления, эффективно реализуемых на ЭВМ.

(]) „,([) „,(3) (4)

u , и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и

(рис. 9).

Рисунок 6

Рисунок 7

Рисунок 8

Инженерия

1 I um

„(3)

a<4) 1 !

Рисунок 9

Рисунок 10

Литература

1. Айзекс Р. Дифференциальные игры. M. : Мир, 1967.

2. Бухгольц Н. Н. Основной курс теоретической механики. М. : Наука, 1969.

3. Красовский А. Н. О позиционном минимаксном управлении // Прикл. математика и механика. 1980. Т. 44. № 4. С. 602-610.

4. Красовский А. Н. Дифференциальная игра для позиционного функционала от фазовых координат и управляющих воздействий // Докл. АН СССР. 1992. Т. 322. № 5. С. 180-183.

5. Красовский А. Н., Ладейщиков А. Н. Об одной задаче конфликтного управления при неполной запаздывающей информации // Математическая теория игр и ее приложения. 2011. Т. 3. Вып. 2.

6. Красовский А. Н., Ладейщиков А. Н. Некоторые задачи игрового управления. Екатеринбург : УрГСХА, 2012.

7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М. : Наука, 1974.

8. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М. : Наука, 1977.

9. Малкин И. Г. Теория устойчивости движения. М. : Наука, 1966.

10. Осипов Ю. С. Дифференциальные игры систем с последействием // Докл. АН СССР. 1971. Т. 196. № 4. С. 779-782.

11. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. В. Математическая теория оптимальных процессов. М. : Наука, 1983.

12. Bellman R. Introduction to the Mathematical Theory of Control Processes. New York : Academic Press, 1971.

13. Krasovskii A. N., Krasovskii N. N. Control Under Lack of Information. Boston : Birkhauser, 1994.

14. Osipov Y. S., Kryazhimskii A. V., Inverse Problem of Ordinary Differential Equation : Dynamical solutions. Gordon and Breach, 1995.

i Надоели баннеры? Вы всегда можете отключить рекламу.