Метод накрытий для решения задачи терминального управления

Четвериков В.Н.

НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА

НАУКА и ОБРАЗОВАНИЕ

Эл № ФС77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408

электронный научно-технический журнал

Метод накрытий для решения задачи терминального управления # 02, февраль 2014 Б01:10.7463/0214.0699730 Четвериков В. Н.

УДК 517.977

Россия, МГТУ им. Н.Э. Баумана

[email protected]

Введение

Одной из важнейших задач нелинейной теории управления является терминальная задача, заключающаяся в определении программного движения (программной траектории и программного управления), переводящего динамическую систему из заданного начального состояния в заданное конечное состояние. Время движения из начального состояния в конечное может быть фиксировано или выбираться из каких-либо дополнительных соображений.

Для нелинейных динамических систем подходы к решению задачи терминального управления известны лишь для отдельных классов систем. Один из наиболее широких таких классов образуют плоские системы [1, 2]. А именно, каждое решение плоской системы однозначно определяется некоторым набором функций времени, который называют плоским выходом системы. Известный [1,2] метод решения задачи терминального управления для плоских систем основан на построении программной траектории, удовлетворяющей граничным условиям и соответствующей полиномиальной зависимости плоского выхода от времени. При этом суммарная степень полиномов равна количеству граничных условий.

Однако сказать, что задача терминального управления для плоских систем полностью решена, нельзя, потому что указанный подход не учитывает ограничения системы. Действительно, плоский выход может быть построен так, что его область значений не совпадает со всем пространством. Кроме того, ограничения на его область значений возникают и из физической постановки задачи (см. пример 3 ниже). Решение в многочленах, найденное упомянутым методом, может не удовлетворять тем или иным ограничениям. Поэтому для плоских систем (как и для неплоских систем) актуальна разработка методов синтеза программного движения, основанных на использование разных классов функций, а не только многочленов.

Среди неплоских систем, для которых разрабатывались подходы к решению задачи терминального управления, отметим аффинные системы с векторным управлением, эквивалентные системам квазиканонического вида. В работе [3] решалась задача терминального управления с нефиксированным временем движения для систем из этого класса с одной переменной (а), определяющей нулевую динамику. При этом положительна производная а в силу системы. После выбора а в качестве новой независимой переменной исходная задача терминального управления преобразуется в такую терминальную задачу для системы квазиканонического вида, что условия в конечной точке налагаются только на канонические переменные. Этот факт позволяет обобщить на такие системы известный [4, 5] метод решения задачи терминального управления.

В данной работе предлагается новый подход к решению задачи терминального управления, основанный на использовании накрытия [6]. Предлагаемый подход заключается в дополнении исходной системы с управлением новыми уравнениями до определенной динамической системы Е ив построении специального отображения (накрытия) из множества решений дополненной системы Е в множество решений какой-либо динамической системы У. При этом отображение должно быть сюръективным, а условия терминальной задачи должны преобразовываться в граничные условия для системы У в конечной точке. Тогда программное движение находится как решение двух связанных специально поставленных задач Коши для динамических систем Е и У. Любое решение дополненной системы Е есть одновременно решение исходной системы. Дополненную систему Е, для которой строится накрытие с указанными свойствами, мы называем г-замыканием задачи терминального управления.

Данный подход, называемый далее методом накрытий, может быть применен и к плоским, и неплоским системам. Ниже показано, как для произвольной плоской системы построить г-замыкание, решениями которой являются только многочлены. Таким образом, предлагаемый метод накрытий обобщает упомянутый метод решения задачи терминального управления для плоских систем. Кроме того, показано (см. теорему 3 ниже), что в качестве г-замыкания для плоской системы можно выбрать любую определенную динамическую систему нужной размерности, а значит, многочлены можно заменить решениями любой такой системы. Наконец, в статье приводится пример применения метода накрытий к неплоской системе, описывающей движение вертолета по горизонтальной прямой.

Статья организована следующим образом. В разделе 1 определяются плоские системы. В разделах 2 и 3 подробно излагается метод синтеза программного движения для плоских систем с использованием многочленов. Раздел 4 содержит описание метода накрытий. В разделе 5 для произвольной плоской системы строится г-замыкание, решениями которого является произвольное семейство функций. Завершается статья примером построения г-замыкания для неплоской системы.

1. Плоские системы с управлением

Рассмотрим систему вида

x = f (t,x,u), x GXc Rn, u GUc Rm, (1)

где t — независимая переменная; x = (xi, ..., xn) G c/X — вектор состояния; u =

= (ui, ..., um) G U — вектор управления; f = (f1, ..., fn) — гладкая векторная функция;

, dx _______—

x = — — производная по времени. Под гладкостью здесь и далее понимается бесконечная

(О п Ч

d-j ) = m для всех

д Hi /

рассматриваемых значений переменных t, x, u.

Пусть / — некоторое неотрицательное целое. Считая переменные

^ x 1, . . . , xn, u 1, . . . , um, u 1, . . . , um, u 1, . . . , um (2)

независимыми, рассмотрим пространство с такими координатами. Через O(l) будем обозначать какую-либо область этого пространства. Вектор (x1, ..., xn) будем называть состоянием точки из O(l) с координатами (2).

Регулярную систему (1) называют плоской в области 0(г), если на 0(0 определены такие функции

y1 = h1 (t,x,u, u , ...,u(l)), ..., ym = hm(t,x,u,u , ...,u(l)), (3)

что переменные x выражаются через t, функции (3) и их производные в силу системы (1) до какого-то конечного порядка:

x = X (t,y1,y/1,...,yíkl),y2,...,ymkm)), (4)

а любой конечный набор функций (3), их производных в силу системы (1) и функции t функционально независим. При этом набор функций (3) называют плоским, или линеаризующим, выходом системы (1).

Из регулярности плоской системы следует (см. [7], теоремы 1 и 2), что переменные u выражаются через t, x и x- , а значит, в совокупности представляют собой векторную функцию вида

u = U (t,y1,y/1,...,y(fcl+1),y2,...,ymfcm+1)). (5)

Пример 1. Движение автомобиля при отсутствии проскальзывания описывается системой [2]

u

x = u cos z = u sin г? = — tg (6)

где x, z — декартовы координаты середины задней оси автомобиля; u — скорость автомобиля; ? — угол между осью абсцисс и прямой, проходящей через середины двух осей; ^ — угол поворота колес передней оси относительно указанной прямой; / — расстояние между

серединами двух осей. Вектор (х, г, д) является состоянием системы, а вектор (и, ф) — ее управлением.

Система (6) плоская в области {и = 0} с плоским выходом у1 = х,у2 = г, так как переменные состояния х, г, д и управления и и ф выражаются через плоские выходы и их производные в силу системы:

х = у1, г = у2, д = аг^ — при у1 = 0 и д = агс^ — при уу2 = 0,

У1 УУ2

и = Л 1У2+У~2 ф = аГС|В г(у2у/1 - у1 Уу2)

и = V у1 + У/2, ф = аГС1§ (уу2 + уу2)3/2 •

2. Построение динамической обратной связи, линеаризующей плоскую систему

Динамической обратной связью системы (1) называют соотношения вида

С = а(г,х,С,у), и = Ь(г,х,£,ь), С е Ша, V е Ет (7)

Множество точек пространства с координатами г, х, и, для которых существуют такие векторы С, V, что функции а и Ь определены, и второе равенство в (7) выполняется, называют областью определения, а число в — размерностью динамической обратной связи (7).

Динамическую обратную связь (7) можно понимать как преобразование системы (1) в систему

х = /(г,х,Ь(г,х,С,'У)), С = ^^^^ (8)

с состоянием (х, С) е Шп+а и управлением V. Второе равенство в (7) определяет отображение из множества решений системы (8) в множество решений системы (1).

Говорят, что система (1) линеаризуема динамической обратной связью (7) (или просто динамически линеаризуема), если получающаяся после замыкания этой связью система (8) преобразуется в эквивалентную систему вида

у?'+1) = V,, к > 0, г = 1~т, (9)

обратимой заменой переменных вида

г = г, у = У(г,х,с), V = V, (10)

где у = (у1, //1, • • •, у(к1), у2, • • •, у^) — состояние системы (9).

Указанная обратимая замена определяет биекцию между решениями систем (8) и (9). Таким образом, динамическая обратная связь, линеаризирующая систему (1), определяет отображение из множества решений линейной системы вида (9) в множество решений системы (1).

Отметим также, что каждое решение системы вида (9) однозначно определяется функциями у1(г),.. ., ут(г), которые могут быть выбраны произвольными (^(¿) = у(кг+1) (г)). Таким образом, соотношения (3) определяют отображение из множества решений системы (1)

в множество решений системы (9). Это отображение есть биекция, если (3) — плоский выход системы (1). Действительно, сюръективность этого отображения следует из функциональной независимости любого конечного набора функций (3), их производных и t. А соотношения (4) и (5) задают обратное отображение. Отображение из множества решений линейной системы (9) в множество решений плоской системы (1), заданное соотношениями (4) и (5), будем называть отображением плоского выхода (3) и обозначать через Fo.

Следующая теорема доказана в [7] и уточняет теорему из [1].

Теорема 1 ([7]). Пусть в области O(l) регулярная система (1) плоская с плоским выходом (3), и имеет место равенство (4). Тогда для любой точки е O(l) в некоторой окрестности соответствующей точки из существует динамическая обратная связь размерности d = fci + ... + km + m — n, которая линеаризует систему (1), а определенное ею отображение из множества решений линейной системы (9) в множество решений системы (1) совпадает с ограничением отображения плоского выхода (3) на окрестность точки .

Доказательство теоремы 1 (см. [7]) дает следующий алгоритм построения динамической обратной связи, линеаризующей плоскую систему.

Пусть функции (3) образуют плоский выход системы (1), и выполняются соотношения (4). Выберем функции £ь . .., £d переменных t, y = (y1, yb ..., y(kl), y2, ..., ymm)) так, чтобы матрица Якоби dбыла квадратной и невырожденной. Производные £ь ..., £d этих функций в силу системы (1) и функции u1,.. ., um выражаются через t, y и v = (v1, ..., vm), где Vj = yfi+1), i = 1, m. Переходя от переменных t, y, v к переменным t, £, x, v, получаем линеаризующую динамическую обратную связь.

Пример 2. Переменные состояния системы (6) выражаются через y = (y1, y2, yy1, y2). Поэтому k1 = k2 = 1, d =1. Выберем функцию £ переменных y так, чтобы переход от переменных t, x, z, £ к переменным t, y был обратим. Положим: £ = \/y2 + y2. Тогда y1 и y2 выражаются через $ и £: y1 = £ cos y2 = £ sin Выразим £, u, ф через y, y1, y2:

y1¿/1 + y2y2 _ 1,2 . -2 ______1(y2?/1 — y1?/2)

-(у2 + уЮ./- и= ^ + у2' ф =агс^ (у2 + Й)з/»-

Переходя к переменным г, х, г, д, С, v1 = у1, v2 = у2, получаем линеаризующую динамическую обратную связь

u = £, ф = arctg — (v2 cos $ — v1 sin $), £ = v1 cos $ + v2 sin $ £2

с областью определения {u = 0}. Соответствующее отображение F"1 из множества решений системы (6) в множество решений линейной системы y1 = v1, y2 = v2 определяется соотношениями

u2 u2 F"1 : t = t, y1 = x, y2 = z, v1 = ucos $ —— tg ф sin v2 = uusin $ + — tg ф cos

3. Решение задачи терминального управления для динамически линеаризуемых систем

Пусть система (1) линеаризуема динамической обратной связью (7), определенной во всей области определения системы (1), и поставлена задача терминального управления с граничными условиями

ж(£н) = Хн, х(^) = Хк. (11)

А именно, требуется найти такое решение системы (1), которое удовлетворяет условиям (11). Покажем, как решается эта задача. Рассмотрим систему (8), в которую преобразуется система (1) после применения динамической обратной связи (7). Для вектора £ дополнительных переменных зададим начальное (£н) и конечное (£к) значения. Если нет каких-либо ограничений на £ физического, технического и иного характера, эти условия можно выбрать произвольными и получить задачу терминального управления для системы (8): х(£н) = хн, £(¿н) = £н, х(£к) = хк, £(¿к) = £к. Применяя преобразование (10), получаем для системы (9) задачу

= У(£н,Хн,£н), Ш = ^(¿к,Жк,£к). (12)

Если нет ограничений на переменные у и V, решение этой задачи ищут в пространстве мно-

гочленов. А именно, если для i = 1, m функция y¿(í) есть многочлен степени < + 1, то условия (12) представляют собой крамеровскую систему линейных алгебраических уравнений на коэффициенты этих многочленов (см. [5, п. 2.2.6]). Решая эту систему и подставляя полученное решение yi(t), ..., ym(t), vi(t) = y(kl+i)(t), ..., vm(t) = ymm+i)(t) задачи (12) в функции, задающие обратное преобразование к замене переменных (10), получаем решение исходной задачи (11).

Отметим однако, что образ преобразования (10) может быть только частью пространства переменных y и v. Кроме того, на переменные состояния x, управления u и производные управления U, .. ., u(1) системы (1) могут налагаться некоторые ограничения, которые также преобразуются в условия на y, v и производные v. Задачу (9), (12) необходимо решать с учетом всех ограничений на y и v. При выборе £н и £к следует учитывать второе равенство в (7) и ограничения на x, u и производные u.

В случае плоской системы линеаризующая динамическая обратная связь строится указанным выше методом, а для преобразования ограничений на x и u используется отображение плоского выхода Fo. При этом, если в области O(1) переменные (2) удовлетворяют всем ограничениям задачи и система плоская, то преобразованным ограничениям удовлетворяют точки некоторой области пространства с координатами

t, yi, yi, ..., yífcl), У2, ..., yLfcm), vi, ¿1, ...,v(1), v2, ..., v«. (13)

Задачу (9), (12) следует решать именно в этой области, которую мы обозначаем через Fo(O)(1).

Пусть ¿н < ¿к, а система (1) определена при t G [¿н, ¿к]. Обозначим через O\ множество

I 60

всех состояний, лежащих в пересечении области O(1) с плоскостью {t = to}. Состояние

xK G O\. называют достижимым из состояния xH G O\. за интервал времени \tH) tJ по

IÍK Iíh

области O(1), если существует решение ((x(t), u(t)), t G \tH, tK], системы (1), удовлетворяющее условиям:

x(tH) = xH, x(tK) = xK, (x(t), u(t), uU(t), ..., u(í)(t)) G O(1) при t G \tH, tK].

Систему (1) называют управляемой за интервал времени \tH, tK] в области O(1), если любое состояние xK G O \. достижимо из любого состояния xH G O \. за интервал времени \tH, tK]

iík i íh

по области O(1).

Теорема 2 ([7]). Пусть система (1) плоская в области O(1) с плоским выходом (3), а Fo — соответствующее отображение плоского выхода, заданное соотношениями (4) и (5).

1. Состояние xK G O\. достижимо из состояния xH G O\. за интервал времени \tH,tK]

I ÍK I ÍH

по области O(1), если xH = X(tH, yH), xK = X(tK,yK), и состояние yK G Fo(O)\ линейной

i ík

системы (9) достижимо из состояния yH G Fo(O)\ за интервал времени \tH, tK] по обла-

i íh

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

сти Fo(O)(1).

2. Плоская система (1) управляема за интервал времени \tH, tK] в области 0(0, если управляема линейная система (9) за интервал времени \tH, tK] в области Fo(O)(1).

Из теоремы 2 следует, что вопросы достижимости состояний и управляемости плоских систем сводятся к соответствующим вопросам для линейных систем вида (9). Однако эти вопросы трудны для исследования даже в случае систем (9), которые управляемы во всем пространстве состояний, но могут быть не управляемы в области этого пространства (примеры и некоторые известные результаты см. в [4] и [5, § 2.2]). В настоящее время методы определения управляемости системы вида (9) в заданной области не разработаны, и вопрос об управляемости конкретной плоской системы решается, исходя из особенностей поставленной задачи.

Пример 3. Рассмотрим задачу парковки автомобиля, движение которого описывается системой (6). На переменные состояния и управления налагаются следующие естественные ограничения: на область парковки (например: |x| < xo, |z| < zo), на скорость (|u| < uo), на угол поворота передних колес (|ф| < ф0), на ускорение (|u| < а) и др. В области {u = 0}, где система (6) плоская, указанные условия преобразуются в следующие условия на переменные y линейной системы:

11^ 11^ n ^ -2 . 2 |y2y1 - y1y21 tg фо |y1y1 + y2y2l

Ы < Х0, |У2| < z0, 0 < 2/1 + У/2 < U0, (y)2+ y2) 3/2 <— , (?12+ y2)1 /2 < «.

Вопросы достижимости и управляемости в этой области нетривиальны, хотя разрешимость задачи парковки общеизвестна.

4. Описание метода накрытий

Рассмотрим сначала случай, когда m = 1, а система (9) состоит из одного уравнения второго порядка:

У = v. (14)

Задача терминального управления (см. (12)) для системы (14) имеет граничные условия

уСУ = Ун, у(£н) = ун, у(£к) = ук, у/СО = у/к. (15)

Будем искать решение в пространстве многочленов. Так как данная задача включает четыре граничных условия, то рассмотрим многочлены не выше третьего порядка, т.е. искомое решение удовлетворяет уравнению

У(4) = 0. (16)

Таким образом, задача терминального управления (14)-(15) переформулируется в краевую задачу (16), (15).

Для решения краевой задачи (16), (15) рассмотрим функцию

р = у - 1(*к - ¿)2У(2) - 3(*к - ¿)3у(3). (17)

Для любого решения у уравнения (16) имеем

Р = у+ (¿к - ¿)у(2) + 2(¿к - ¿)2У(3), (18)

р = 0. (19)

Отметим, что функция р такова, что значения р(£к), р(£к) однозначно определяются значениями у (¿к), у (¿к), а значения у(2)(^н), у(3)(^н) — значениями р(^), р(*н), у(*н), у(*н). Поэтому задача (14)-(15) может быть решена следующим образом. Из конечных условий (15) находятся значения р(£к), р(£к). Эти значения однозначно определяют решение р(£) уравнения (19), как решение задачи Коши в сторону уменьшения времени: от ¿к до ¿н. Находим р(£н), р(£н), а из уравнений (17)-( 18) — значения у(2) (¿н), у(3) (¿н). Наконец, решая задачу Коши для уравнения (16) с известными значениями у(¿н), у(£н), у(2)(¿н), у(3) (¿н), находим зависимость у(¿), а из уравнения (14) — функцию г>(£) = у(¿). Данная функция есть решение задачи (16), (15), так как соответствующая функция у(¿) удовлетворяет начальным условиям (15) по построению, а конечным условиям (15) — согласно уравнениям (17), (18). Рассмотрим общий случай задачи терминального управления (11) для системы (1). Пред-

положим, что мы нашли функции [/¿, ^, фj•, г = 1, т, ] = 1, п, переменных

¿, Х1, ..., хп, «, й 1, ..., м(1к1-1) ,и2, ..., иттт-1), +... + удовлетворяющие следующим условиям:

а) соотношения pj• = ^, qj• = фj, = 1, п, задают преобразование системы

1г

в систему вида

Хj = (¿,Х1, . . . ,Хга,йЬ . . . ,йт), = 1, П, (20)

= щг,х1,...,хп,и1,й 1,...,и1к1-1),и2,...,иткт-1)), г = 17т, (21)

д = дм,р), ? е (22)

р = Р(¿,р), р е Ега; (23)

б) заданные конечные значения х(£к) однозначно определяют значения рк = р(£к) и, наоборот, значения р(£к) однозначно определяют значения х(£к);

в) если рн —значение в точке ¿н решения р(£) системы (23), удовлетворяющего условию р(^к) = рк, то система нелинейных уравнений

рн = ^(¿н,Х1,н, . . . , Хга,н, й1 (¿н) , йй 1 (¿н) , . . . , и!^1-1) (¿н) , «2 (¿н) , . . . , «пт™-^1 (¿н)) (24)

имеет решение относительно «1 (¿н), и 1(^н), ..., и1к1-1)(^н), и2(£н), ..., «тгт-1)(£н).

В случае выполнения условий а)-в) задача (1), (11) может быть решена следующим образом.

1. Из конечных условий (11) вычисляем значение р(£к).

2. Находим решение р(£) системы (23), удовлетворяющее условию р(£к) = рк (решение задачи Коши в сторону уменьшения времени: от ¿к до ¿н).

3. Вычисляем р(£н).

4. Из системы (24) находим значения

и1 (¿н), и 1(и ..., и1к1-1) (¿н), ^(¿н), ..., «^(¿н).

5. Решая задачу Коши для системы (20)-(21) с начальными значениями

¿н, Х1,н, ..., Хп,н, и1 (¿н), ии 1 (¿н), ..., и^1-^ (¿н), и2 (¿н), . .., итГ^^н),

находим решение (х(£),и(£)) системы (1).

Найденное таким образом решение есть решение задачи (1), (11), так как функция х(£) удовлетворяет начальным условиям (11) по построению, а конечным условиям (11) — из условия б).

Изложенный алгоритм решения задачи терминального управления основан на построении таких функций Ц1, .. ., Цт, для которых соответствующая система (20)-(21) эквивалентна системе вида (22)-(23).

Система (22)-(23) накрывает систему (23). А именно, пусть Е и У — две определенные системы обыкновенных дифференциальных уравнений. Накрытием из системы Е в систему У называют сюръективное отображение расширенного фазового пространства системы Е в расширенное фазовое пространство системы У, при котором график любого решения системы Е отображается в график решения системы У, а прообраз графика любого решения системы У состоит из графиков решений некоторой подсистемы системы Е. При этом говорят, что система Е накрывает систему У, слоем накрытия называют прообраз любой точки расширенного фазового пространства системы У, систему У называют базовой, ее зависимые переменные — базовыми, а остальные зависимые переменные системы Е — переменными слоя.

Отметим, что мы сформулировали определение накрытия определенных систем обыкновенных дифференциальных уравнений. Определение накрытия систем с управленем можно

найти, например, в [8], а общее определение накрытия систем дифференциальных уравнений (в том числе с частными производными) — в [6].

Композиция эквивалентного преобразования и накрытия есть накрытие. Поэтому система (20)-(21) также накрывает систему (23). Условие б) устанавливает связь этого накрытия с конечными условиями поставленной задачи терминального управления, а условие в) — с начальными условиями этой задачи. Таким образом, изложенный метод решения задачи терминального управления основан на построении таких функций [Д, . .., ит, для которых соответствующая система (20)-(21) накрывает систему вида (23), причем накрытие обладает свойствами б) и в).

Систему вида (20)-(21), удовлетворяющую условиям а)-в) для некоторых функций ^,

фj•, ] = 1, п, будем называть т-замыканием задачи терминального управления (1), (11). Как показано выше, т-замыкание позволяет решать задачу (1), (11).

Заметим, что если система (1) регулярная, то из нее переменные управления и можно выразить через г, х и удалить и из системы (20)-(21). Такого вида т-замыкания мы и будем рассматривать в следующем разделе.

5. Метод накрытий для плоских систем

Покажем сначала, что рассуждения предыдущего пункта для уравнения (14) применимы к любой системе (9), а значит, к любой плоской системе. Так как переменные у^, V входят только в г-е уравнение системы (9), то вычислять их можно независимо от остальных переменных задачи (9), (12). Поэтому достаточно рассмотреть случай т =1.

К уравнению у(п) = V добавим уравнение у(2п) = 0, т.е. уравнение (21) есть v("') = 0. В качестве переменных базы накрытия возьмем р, р(1), . .., р(п-1), где

Р = у - ^^^^у(п) + «1 у(п+1) + ... + ап-1 (г(- ^Г"1 у(2п-1),

п! (п + 1)! (2п — 1)!

а числа а1, . .., ап-1 подберем так, чтобы выполнялось уравнение базы р(п) = 0. Условие б) выполняется, так как р(г)(гк) = у(г)(гк), г = 0, 1, ..., п — 1. Можно доказать существование чисел а1, . .., ап-1 и справедливость условия в). Переменные слоя искать необязательно, так как при решении задачи терминального управления они не используются.

Получающееся указанным способом решение задачи терминального управления есть решение в многочленах, так как пространство решений уравнения у(2п) =0 — это пространство многочленов степени не ниже 2п — 1.

Приведем пример использования других функций: к уравнению (14) добавим уравнение

у(4) = —у(2). (25)

Выберем следующие переменные базы:

Ро = у — (г — гк)у(1) + (1 — ес8(г — гк ))у(2) + (8т(г — гк) — г + гк)у(3), Р1 = у(1) — у(2) 81п(г — гк) + (1 — ес8(г — гк))у(3).

Уравнения на них есть

po = 0, Pi = 0. (26)

Таким образом, уравнение (25) накрывает систему (26). Это накрытие удовлетворяет условию б), так как p0(tK) = y(tK), p1 (tK) = y(1)(tj. Кроме того,

Po(¿н) = У(*н) - У(1)(^н)г + У(2)(^н)(1 - COS Т) + у(3)(£н)(8Ш Т - Т), Pi (¿н) = У(1) (¿н) - У(2) (¿н) Sin Т + y(3) (¿н)(1 - COS Т) ,

где т = ¿н - ¿к. А значит, на у(2)(£н), y(3) (¿н) мы имеем систему линейных алгебраических уравнений с матрицей

1 - COS Т Sin Т - Т - Sin Т 1 - COS Т

Поэтому условие в) выполняется, если определитель этой матрицы отличен от нуля: 2 - 2 cos т - т sin т = 0.

Рассмотрим плоскую систему общего вида (1) и задачу терминального управления (11) для нее. В п. 3 было показано, что эта задача сводится к задаче терминального управления (12) для системы (9) в области F0(O)(1) пространства переменных (13). В случае использования только многочленов решение задачи (9), (12) может выходить за пределы области Fo(O)(1). Поэтому рассмотрим общий случай, когда решениями r-замыкания являются не только многочлены.

Ранее мы отмечали, что переменные y¿, v входят только в i-е уравнение системы (9). Однако каждое из неравенств, определяющих область Fo(O)(1), может содержать y, v с разными i (см. пример 3). Поэтому в общем случае необходимо рассматривать уравнения (9) в совокупности. Тем не менее, для простоты мы рассмотрим только случай, когда можно отделить переменные y¿, v с разными i. Например, когда область Fo(O)(1) удается уменьшить до области, заданной неравенствами, содержащими переменные y¿, v только с одним i. В рассматриваемом случае условия на переменные y¿, v отделяются от условий для других y, Vj, j = i, и поэтому достаточно рассмотреть случай m =1.

Таким образом, решается задача терминального управления для системы, состоящей из одного уравнения

У(п) = v (27)

с состоянием (t, y, y(1), ..., y(n-1)) и управлением v. Из всех дальнейших выражений будем удалять переменную v, используя уравнение (27). Пусть y = x(t, z1,..., z2n) — такая функция, что матрица

(а«»= (аИ-Щ)• i = ^ j = ^ (28)

невырождена в точке (¿к, z0), z0 = (z1,0, ..., z2n,0). Тогда по теореме о неявной функции в некоторой окрестности точки (¿к, z0) переменные z1, . .., z2n представляют собой функции

от г, у, у(1), ..., у(2п-1):

= ^¿(г, у, у(1),..., у(2п-1)), г = 17^. (29)

Рассмотрим дифференциальное уравнение порядка 2п:

у(2п) = ^(г, ад,у,у(1),...,у(2п-1)), ..., ^„(г,у,у(1),...,у(2п-1))), (30) определенное в окрестности точки

(гк, уо = хС^о^ у01) = ^^¿о^ ..., у02п-1) = д^п-ИХ (гк,^о^. (31)

По построению, для любого набора значений г1, . .., г2п из окрестности точки г0 функция у = х(г, г1,..., г2п) есть решение уравнения (30), а функции (29) — первые интегралы этого уравнения. Поэтому функции

Р1 = х(гк, ^ (г,у,у(1),...,у(2п-1)), ..., ^2„(г,у,у(1),...,у(2п-1))),

Р2 = (гк, ^1(г,у,у(1),...,у(2п-1)), ..., ^2„(г,у,у(1),...,у(2п-1))),

(32)

дп-1х

(гк, ад,у,у(1),...,у(2п-1)), ..., ^2„(г,у,у(1),...,у(2п-1))),

<9гга-1

как функции первых интегралов (здесь гк — константа) также есть первые интегралы уравнения (30). Следовательно, их производные в силу этого уравнения равны нулю:

р = 0, г =1, п. (33)

Функции (29) как первые интегралы уравнения (30) не зависят от г. Поэтому

д ¿ 1 х

у(г-1)(гк) = (гк, *!,...,*!„)= Рг(гк), г = ТТ^. (34)

Теорема 3. Пусть у = х(г, г1,..., г2га) — такая функция, что матрица (28) невырождена в точке (гк, г0), г0 = (г1,0, ..., г2п,0). Тогда существует такое 5 > 0, что при гн € (гк — 5, гк) существует такая окрестность V С Кга точки

дХи дп-1х

(х^о) дХ^о) ..., ^(гн^:

что для любой точки (ун, ун1), ..., унп из V уравнение (30) есть т-замыкание задачи терминального управления

у(гн) = ун, у(1)(гн) = ун1), ..., у(п-1)(гн) = унп-1), у(гк) = уо, у(1)(гк) = у01), ..., у(п-1)(гк) = у0п-1)

для уравнения (27), здесь числа у0, у01), .. ., у0"" 1) определяются соотношениями (31).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. В качестве функций . .., возьмем функции (32). В окрестности точки (31) выберем функции ^, ..., так, чтобы они вместе с функциями ¿, .. ., определяли замену переменных расширенного фазового пространства уравнения (30). Тогда уравнение (30) преобразуется этой заменой в систему вида (22), (33). А значит, условие а) выполняется.

Из равенств (34) следует, что условие б) также выполняется.

Для проверки условия в) используем параметрическое представление функций (32):

дг—1 х _

Р = д^-г— 1 (¿к,^1, . . . ,^2п), % = 1, п,

а?—1 х _

3Ц = ;(Мъ...,^), 3 = 1, 2п,

где переменные г1, ..., г2п понимаются как параметры. Учитывая то, что г1, .. ., г2п постоянны на решениях уравнения (27), получаем

дг—1х дг-1Х

(У _

Рг,н = Рг(*н) = д^ — 1 (¿к,¿1,-. ,*2п), % =1, п, (35)

Ун* —1) = (¿н,^,...,^), % =1~П, (36)

• д3—1х

У3 — 1)(^н) = (^н, , . . . , ^2га) , 3 = ^ 2п

(37)

Заметим, что если система (35)-(36) разрешима относительно г1, .. ., г2п, то подставляя ее решение (г1, ..., г2п) в уравнения (37), получаем значения ^(г— 1)(^н) = у(г+п— 1)(^н), % = 1, п, т.е. условие в) выполняется в этом случае.

Для доказательства разрешимости системы (35)-(36) используем теорему об обратной функции. Рассмотрим функцию

/ дп—1Х дп—1Х \ С: * - (х(^), ^ (Ь^ х(^) ^ (^)) ,

где г = (г1, ..., г2п). Покажем, что якобиан этой функции в точке отличен от нуля. Первые п строчек матрицы Якоби функции С в точке состоят из чисел

дг х _ _ _

д^—гдг;(^к,^о), % = 1,п, 3 = 1,2п,

последние — из

д гх ___

(^¿о) % = 1,n, 3 = 1, 2п. (38)

Таким образом, первые п строчек совпадают с соответствующими строчками матрицы

(а; (¿к, ¿о)) (см. (28)).

Используя формулу Тейлора и обозначение А = ¿н — ¿к, преобразуем элементы (38) к виду

д*х и - ^ д*х ^ - ^ , д д*+1х ^ - ^ , , АП д*+Пх и - ^ , /дт

д^*—1д; (^н, ¿о) = д; ^го)+А д^ (<-го) +... + -пг д^+п—д; ^го)+о(А).

Добавляя линейные комбинации первых п строчек якобиана функции С в точке (гк, ;0) к последним п строчкам, преобразуем их элементы к виду

Дга-г+1 Яга+1,, Дп а г+гах

Х (гк, ¿о) +... + (гк, ¿0) + о(Дп). (39)

(п — г + 1)! дгпд;г/ ^ п!

Добавляя линейные комбинации строчек (39) с меньшими номерами г к строчкам (39) с большими номерами г, преобразуем (39) к виду

Заметим, что после указанных преобразований последние п строчки якобиана С пропорциональны с точностью до о(Дп) соответствующим строчкам матрицы (a¿j• (гк, ¿о)) с коэффициентом пропорциональности Дп/п!. Поэтому

(гк, *о)) = (^Д-)" (гк, ¿о)) + о(Дп2).

По условию матрица (a¿j•) невырождена в точке (гк, г0). Поэтому существует такое 5 > 0, что при гн € (гк — 5, гк) якобиан функции С в точке г0 отличен от нуля. По теореме об обратной функции существует такая окрестность и точки

Зга—1-. 1т

_ / _ д х _ д х \

G(Zo) = (Х^к^ ^^ х(^о), "dt^rr :

в которой определена обратная функция G-1. Заметим, что

X(tK,zo) = ^ ^(tK,zo) = ^ д--f(tK,zo) = y0n r). (40)

Обозначим через V пересечение окрестности U с n-мерным подпространством, у точек которого первые n координат равны (40) соответсвенно. Тогда V есть окрестность точки

/ _ дх д"-1 х _ \

(x^o), ^^^ "dtn-rta^J.

Если точка (ун, У^, ..., Ун"-^) лежит в V, то система (35)-(36) имеет решение

(Z1, ..., Z2n) = G-1(yo, yor), ..., yon-1), Ун, унт), ..., У^), а значит, условие в) выполняется. Теорема доказана. Теорема доказана.

6. Пример синтеза программного движения для неплоской системы

Движение вертолета по горизонтальной прямой описывается (см. [9]) неплоской системой

u

x = -g tg tf - —--, tf = Lu, (41)

M cos tf

где (ж, ж, tf, tf) — состояние, u — управление системы. Для этой системы в работе [9] стандартная задача терминального управления с нефиксированным временем движения сведена к задаче

ж(*н) = Жн, tf (¿н) = tfн, жс(*н) = ХХн, tf (¿н) = tfrn ж(^) = Хк, tf(tj = "$к, (42)

где момент ¿н начала движения задан, а момент ¿к окончания движения может быть выбран произвольно с учетом очевидного требования ¿к > ¿н.

По аналогии с работой [3] перейдем к новой независимой переменной tf, считая переменные t, ж, z = ж, £ = tf зависимыми. Используя операторное равенство

d 1 d

dtf = £ ~dV

и обозначая через п' производную переменной п по tf, получаем систему

/1 , z Lu . ж 1 ( u \

t' = т, ж' = -, £' = —, z' = т = 7 -g tg tf - —-- , (43)

£' £ s £ £ £ V y s M cos tf/' v 7

которая эквивалентна системе (41). Задача (42) в новых переменных переписывается как

¿("#н) = ¿н, ж(tfн) = Жн, z^) = Жн, £С^н) = "$н, ж(tfк) = Жк,

Так как эта задача содержит пять условий, то ее r-замыкание получается добавлением к системе (43) уравнения вида u' = U. Условие в конечной точке налагается только на ж. Поэтому по аналогии с плоскими системами одну из производных ж положим равной нулю. Так как ж''' — первая из производных ж, зависящая от u', то искомое r-замыкание построим добавлением к системе (43) уравнения ж''' = 0. В качестве базовой переменной возьмем функцию

p = ж + ^ - tf)ж' + - tf)V.

Тогда уравнение базы есть p' = 0.

Переходя обратно к независимой переменной t, переписываем уравнение ж''' = 0 в виде

d^ , (1 d \2, ч жг? - ж tf ,лл. -г = 0, где ^ = (--;- (ж) =-=-, (44)

dt Vtf dt/ г?з ' v 7

которое вместе с системой (41) представляет собой r-замыкание задачи (42). Соответствующее уравнение базы есть

ж 1

p = 0, где p = ж +(tfк - tf)— + -("#к - tf)V

tf 2

С использованием изложенного здесь метода в [9] успешно решена задача (42).

Заключение

Сформулирован новый метод решения задачи терминального управления для динамических систем. Метод основан на дополнении исходной системы уравнениями на производные управления и переформулировке терминальной задачи в краевую задачу для дополненной системы E. Дополнительные уравнения следует выбирать так, чтобы из фазового пространства системы E существовало такое сюръективное отображение (накрытие) в фазовое пространство какой-либо динамической системы Y, чтобы решения E отображались в решения Y, условия краевой задачи в конечной точке переходили в граничные условия на решения Y, а условиям в начальной точке удовлетворяли все решения Y. Тогда решение задачи терминального управления находится как решение двух связанных задач Коши для динамических систем E и Y. Дополненную систему E, обладающую указанными свойствами, мы назвали r-замыканием задачи терминального управления.

В разделе 5 доказано, что для произвольной плоской системы в качестве r-замыкания можно выбрать произвольную определенную систему обыкновенных дифференциальных уравнений, порядок которой равен количеству условий терминальной задачи. А именно, показано, как по общему решению этой системы построить накрытие с упомянутыми выше свойствами. При этом доказан только локальный факт, т.е. когда начальный момент времени близок конечному моменту, а начальные условия близки конечным условиям. Однако построенное таким образом r-замыкание может быть применимо и к другим терминальным задачам с теми же конечными условиями.

Полученный результат может быть использован для синтеза программных движений плоских систем с учетом ограничений. Кроме того, конструкция r-замыкания из теоремы 3 может быть обобщена на случай неплоской системы, когда удается найти ее решение, зависящее от k параметров, где k — количество условий задачи терминального управления.

Работа выполнена при финансовой поддержке гранта Президента РФ поддержки ведущих научных школ НШ-53.2014.1 и грантов РФФИ №№ 13-07-00736 и 14-01-00424.

Список литературы

1. Fliess M., Lévine J., Martin Ph., Rouchon P. A Lie-Backlund approach to equivalence and flatness of nonlinear systems // IEEE Trans. on Automatic Control. 1999. Vol. 44, no. 5. P. 922937. DOI: 10.1109/9.763209

2. Martin Ph., Murray R., Rouchon P. Flat systems // Proc. of the 4th European Control Conf. Plenary lectures and Mini-courses. Brussels, 1997. P. 211-264.

3. Крищенко А.П., Фетисов Д.А. Задача терминального управления для аффинных систем // Дифференциальные уравнения. 2013. Т. 49, №11. С. 1410-1420.

4. Крищенко А.П. Преобразования аффинных систем и их множества достижимости // Дифференциальные уравнения. 1997. Т. 32, №8. С. 1144-1145.

5. Краснощеченко В.И., Крищенко А.П. Нелинейные системы: геометрические методы анализа и синтеза. М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. 520 с.

6. Бочаров А.В., Вербовецкий А.М., Виноградов А.М., ДужинС.В., КрасильщикИ.С., Само-хин А.В., Торхов Ю.Н., Хорькова Н.Г., Четвериков В.Н. Симметрии и законы сохранения уравнений математической физики / Под ред. А.М. Виноградова и И.С. Красильщика. 2 изд., испр. и доп. М. : Факториал, 2005. 474 с.

7. Четвериков В.Н. Управляемость плоских систем // Дифференциальные уравнения. 2007. Т. 43, №11. С. 1518-1527.

8. Четвериков В.Н. Динамически линеаризуемые системы управления и накрытия // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. №9. Режим доступа: http://technomag.edu.ru/doc/601455.html (дата обращения 01.01.2014). DOI: 10.7463/0913.0601455

9. Белинская Ю.С., Четвериков В.Н., Ткачев С.Б. Автоматический синтез программного движения вертолета вдоль горизонтальной прямой // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. №10. Режим доступа: http://technomag.edu.ru/ doc/660675.html (дата обращения 01.01.2014). DOI: 10.7463/1013.0660675

SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU

SCIENCE and EDUCATION

EL № FS77 - 48211. №0421200025. ISSN 1994-0408

electronic scientific and technical journal

The covering method for the solution of terminal control problem

# 02, February 2014 DOI: 10.7463/0214.0699730 Chetverikov V. N.

Bauman Moscow State Technical University 105005, Moscow, Russian Federation

[email protected]

A new method for solving the terminal control problem for dynamical systems is formulated. This problem is to determine a program trajectory and a program control that takes the system from a given initial state to a given final state. The method is based on the addition of equations with control derivative to the source system and reformulation of the problem in the boundary value problem for the augmented system E. Additional equations must be chosen so as to satisfy the following conditions. There is a surjective map (covering) from the phase space E to the phase space of some dynamical system Y. The covering takes solutions of E to solutions of Y. Boundary conditions in the final moment are mapped to the boundary conditions on the solutions of Y. Any solution of Y satisfies the boundary conditions in the initial moment. Then the solution of the terminal control problem is as the solution of two Cauchy problems for dynamical systems E and Y. Augmented system E satisfying mentioned properties is called r-closure of the terminal control problem.

It is shown that this approach generalizes the well-known method for solving the terminal control problem for flat systems. A flat system is a system whose solutions are uniquely determined by a certain set of functions of time (flat output). The mentioned well-known method is based on polynomial dependence of flat output of time and do not take into account constraints on the system.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

It is proved that for an arbitrary flat system r-closure can be chosen any determined system of ordinary differential equations of the corresponding order. It is showed how to construct a covering with the above-mentioned properties using the general solution of this system. The properties of the covering are proved only locally, i.e. when the initial time is close to the final time, and the initial conditions are close the final conditions. But this covering may be applicable to other terminal problems with the same final conditions. This result can be used to solve the terminal control problem for flat systems with constraints. In addition, an example demonstrates the possibility of applying this method to non-flat systems.

Publications with keywords: tracking control, coverings of systems of differential equations, flat systems

Publications with words: tracking control, coverings of systems of differential equations, flat systems

References

1. Fliess M., Levine J., Martin Ph., Rouchon P. A Lie-Backlund approach to equivalence and flatness of nonlinear systems. IEEE Trans. on Automatic Control, 1999, vol. 44, no. 5, pp. 922937. DOI: 10.1109/9.763209

2. Martin Ph., Murray R., Rouchon P. Flat systems. Proc. of the 4th European Control Conf. Plenary lectures and Mini-courses, Brussels, 1997, pp. 211-264.

3. Krishchenko A.P., Fetisov D.A. [Terminal control problem for affine systems]. Differentsial'nye uravneniya, 2013, vol.49, no. 11, pp. 1410-1420. (English translation: Differential Equations, 2013, vol. 49, iss. 11, pp. 1378-1388. DOI: 10.1134/S0012266113110062).

4. Krishchenko A.P. [Transformation of Affine systems and their attainability set]. Differentsial'nye uravneniya, 1997, vol. 32, no. 8, pp. 1144-1145. (in Russian).

5. Krasnoshchechenko V.I., Krishchenko A.P. Nelineinye sistemy: geometricheskie metody analiza i sinteza [Nonlinear systems: geometric methods of analysis and synthesis]. Moscow, Bauman MSTUPubl., 2005. 520 p. (in Russian).

6. Bocharov A.V., Verbovetskiy A.M., Vinogradov A.M., Duzhin S.V., Krasil'shchik I.S., Samokhin A.V., Torkhov Yu.N., Khor'kova N.G., Chetverikov V.N. Simmetrii i zakony sokhra-neniya uravneniy matematich-eskoy fiziki [Symmetries and laws of conservation of equations of mathematical physics]. Moscow, Faktorial, 2005. 474 p. (in Russian).

7. Chetverikov V.N. [Controllability of flat systems]. Differentsial'nye uravneniya, 2007, vol. 43, no. 11, pp. 1518-1527. (English translation: Differential Equations, 2007, vol.43, no. 11, pp. 1558-1568. DOI: 10.1134/S0012266107110110).

8. Chetverikov V.N. [Dynamically linearizable control systems and coverings]. Nauka i obrazo-vanie MGTU im. N.E. Baumana [Science and Education of the Bauman MSTU], 2013, no. 9. DOI: 10.7463/0913.0601455 (in Russian).

9. Belinskaya Yu.S., Chetverikov V.N., Tkachev S.B. [Automatic synthesis of the helicopter programmed motion along the horizontal line]. Nauka i obrazovanie MGTU im. N.E. Baumana [Science and Education of the Bauman MSTU], 2013, no. 10. DOI: 10.7463/1013.0660675 (in Russian).

Метод накрытий для решения задачи терминального управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Четвериков В. Н.

Похожие темы научных работ по математике , автор научной работы — Четвериков В. Н.

Текст научной работы на тему «Метод накрытий для решения задачи терминального управления»