УДК 531.31:62-56
Самонастраиваемое управление процессом безударного приведения состояния механических систем в заданное
многообразие
И. А. Мухаметзянов
Кафедра теоретической механики Российский университет дружбы народов улица Миклухо-Маклая, 6, Москва, Россия, 117198
Описана процедура построения самонастраиваемого управляющего вектора для приведения состояния механических систем без удара в заданное многообразие за конечный промежуток времени в условиях неопределённости.
Ранее было получено решение задачи приведения фазового состояния системы в заданную окрестность многообразия, образованного нестационарными голономными программными связями. В данной работе этот подход распространяется на решение задачи безударного приведения фазового состояния системы за конечный промежуток времени в многообразие, образованное голономными и неголономными программными связями. При этом сама механическая система может иметь кроме стационарных и нестационарные связи. Получено множество векторов управления, обеспечивающих решение этой задачи самонастраиваемым управлением по принципу обратной связи по квазиускорениям в дискретные моменты времени. А затем из этого множества выделяются векторы управления с размерностью, меньшей числа степеней свободы системы, в том числе вектора минимальной размерности. В случаях, когда размерность векторов управления больше минимальной, выделяются векторы с минимальной евклидовой нормой.
Полученные результаты позволяют решать задачи прикладного характера, такие как управление процессом безударной стыковки наземных, плавательных, летательных и космических аппаратов при их свободном движении в пространстве, а также процессом безударной посадки спускаемых аппаратов на подвижные платформы, характер движения которых известен не полностью.
Для иллюстрации эффективности предложенного способа решения таких задач приводится пример управления процессом безударного придания положению тела заданной ориентации при преследующем движении центра масс тела по принципу пропорциональной навигации.
Ключевые слова: самонастраиваемое управление, безударный, приведение в многообразие, конечное время, механическая система.
1. Введение
В работе [1] был предложен «принцип декомпозиции» для управления процессом приведения фазового состояния механических систем со стационарными связями из одной точки в любую другую неподвижную точку за конечное время. Решение этой задачи предполагает наличие вектора управляющих обобщённых сил с размерностью, равной числу степеней свободы системы. Дальнейшее развитие идеи, предложенные в [1], получили в работах [2-5].
В данной работе предлагается самонастраиваемое управление процессом приведения состояния механических систем, в том числе и систем с нестационарными связями, за конечное время в многообразие, образованное голономными и него-лономными программными связями [6]. Решение задачи возможно и при размерности вектора управляющих сил, меньшей числа степеней свободы системы. При этом предполагается, что массоинерционные параметры системы и действующие на неё неуправляющие силы, в том числе возмущающие силы, известны неточно.
Задача имеет механический смысл, иллюстрируемый на примере управления процессом приведения тела без удара в заданную ориентацию режима преследующего движения по принципу пропорциональной навигации [7]
Статья поступила в редакцию 21 мая 2013 г.
Работа выполнена при финансовой поддержке РФФИ, проект 13-08-00535-а.
2. Постановка задачи
Рассматривается механическая система, динамика которой описывается уравнениями Лагранжа второго рода
ё (дТ \ дТ ^ .
-(-г) — ^ = Я + Я', (1)
где
1 А.Т А(„ Л\ А I АТ
dt\ dq 1
Т = 2Г A(q, t)q + q1 b(q, t) + T0(q, t) (2)
есть кинетическая энергия системы, q, q, £ Rn — векторы обобщённых координат и скоростей, Q — вектор управляющих обобщённых сил, Q' — вектор неуправляющих активных сил, в том числе случайных возмущений, которые будем считать непрерывными и ограниченными по величине. Матрица кинетической энергии А
положительно определена
n 1 n
^ $ < 2 ^А(q, W ^ К = 00X181 > О- (3)
г=1 г=1
Элементы агк(q, t) матрицы A(q, t), вектора b(q, t) и T0(q, t) предполагаются гладкими.
Пусть программное многообразие системы задано в виде
ü)i(q, t) = 0, ¿2 = ¿2 + а2(q, t) = 0, (4)
где ¿1 — ^-мерный, а ¿2,ш2,а2 — ^-мерные векторы, ¿2 = A(q, t)q, где A(q, t) — матрица (k2 х п) с гладкими элементами, удовлетворяющими условию det || ÜÜT || = 0, Q = || doJ1/dq, А || — матрица (k х п), k = k1 + k2.
Задача заключается в построении выражения Q, обеспечивающего безударное приведение за конечное время фазового состояния системы (1) в многообразие (4) при любых начальных условиях qo, qo, to, независимо от конкретного вида A(q, t), b(q, t),To(q, t),Q', используя лишь информацию об отклонениях от многообразия (4), выражаемых через q и q.
3. Алгоритм управления укороченной системой
Для решения задачи переходим от координат qv к другим координатам ш1,ш2, , являющимся элементами вектора Ш\, и квазикоординатам Шj(^ = к\ + 1, к1 + 2,..., к), где к = к1 + к2, а также координатам р1,р2,...,рп-к, ортогональным = 1,2,..., к). Введём вместо квазискорости
¿1 = ¿1 + а,1, (5)
где а1 = — вектор с элементами , > 0 (и = 1, 2,..., к1).
Присоединим к ним ¿2 = ¿2 + а2. В результате получим к-мерный вектор 0т = (¿1,102).
Выражая Т в виде Т = Тш+Тр+То, где Тш = шт Ашш/2+штЬш, То = То+Т°, Ьш = Ьш — Аша, Т(2) = [атАш[а/2, получим уравнение (1) в квазикоодинатах
d f дТа,\ дТш ' дТ дТа,
dt Uw - Ж = Q+ Q- + дь -ж, (6)
dt\dр) дР -Пр + п
Систему (6) назовём укороченной системой.
Подставляя дТ*/дш — А*ш + Ь* в (6), получим
где
В* —
d , , ¿ч г, ~ дТ~
ъ(А>ш)+в*ш -~дШ
(2)
— п + П*,
(дь* дь1 \ &—п +
дТ дТ* дш дш
дЬ* . д
дЬ* + дТ1 &t дш
(7)
(8)
Умножая уравнение (8) скалярно на ш, получим
&Т,-
(2)
dt
— шЧПш + П * +
1^дАшЛ 1.тdA*.
„ ——ш--ш ——ш.
2 доз 2 di
Вектор обобщённых сил управления выберем в виде
П* — и* — DUj , D > 2
dA„
d
где
U* — —(sign ш)(и0 + штDoш)
(9)
(10)
(11)
Щ — постоянный вектор с положительными элементами и^и > ш1 Дош —
вектор с элементами ШтДо»Ш; До» и Д — определённо положительные матрицы (к х к), удовлетворяющие условию (10) и
Doi > 2 max
дАи
дшг
sign ш — диагональная матрица с элементами sign ш¿. При этом правая часть (9) становится определённо отрицательной функцией по ш. Следовательно, значение |ш| со временем будет убывать. Заметим, что при выборе U* в виде (11) при любых начальных значениях ш(0) время обращения |ш| в нуль будет конечным [1].
4. Алгоритм самонастраиваемого управления
При выборе управляющей силы (10) чёткие рекомендации для назначения величин Uo,Do,D в (10), (11) до сих пор отсутствуют. Следовательно, это обстоятельство не позволяет считать алгоритм управления вполне универсальным. С целью устранения этого недостатка предложим следующий метод построения самонастраиваемого управления. Представим (8) в виде
А*(ш,р, ф — П* + П*, (12)
где П* — сумма всех векторов неуправляющих обобщённых сил.
Вектор П* обобщённых управляющих сил в правой части (6), (12) ищем в виде
П* — — (signed* + ДП*), (13)
где sign ш — диагональная матрица (к х к) с элементами sign ши(v — 1, 2,..., к).
Векторы и АQШ в (13) построим без использования информации об элементах матрицы Аш и вектора Qследующим образом. При £ = 0 сообщаем системе (12) управление
Qш = (14)
где sign ш — диагональная матрица с элементами sign , X — к-мерный вектор с достаточно большими элементами Хи > 0 (и = 1, 2,..., к). Начинаем измерение ш(£) с момента £ = 0 до момента ¿о обращения ш в нуль, при котором правая часть (12) обращается в нуль и наступает равенство (¿0) = —sign ш(0)(Х£0). Заметим, что в случае ш(0) = 0 имеет место Q^(¿0) = 0 и ¿0 = 0.
Если ш(0) = 0, то ¿0 = 0. Теперь, зная ¿0, при £ = ¿0 + Д£, где — бесконечно малая положительная величина, примем значение ^^ | равным | = Х£0 + А, где А — задаваемый нами вектор с элементами Ди > 0 ( и = 1, 2,..., к). Заметим, что при £ = ¿0 + Аt прежнее значение ш(¿0) = 0 становится равным
¿(¿0 + Д^ = — 6, > 0, (г/ = 1, 2,...,к). (15)
Из (15) следует, что элементы вектора ё определяются измерением элементов вектора 0 + Д£). Измерение продолжим с момента £ = ¿0 + Д£ до тех пор, пока не наступит равенство (£1и) + 50и = 0, где 50и — элементы вектора 50и = = 7<5, 7 — диагональная матрица с элементами 7и, 1 > 7и > 0. В момент времени ¿1и добавим к Qшu(£1и) величину Ди. Тогда элементы вектора (13) принимают значения
Qшv & 1„ + Д£) = —sign (£ 1„ + ДЭДХ*¿0 + Ди (1 + V)], (16)
где %и = 1 соответствует очередному номеру 1 времени ¿1и наступления в первый раз равенства (£ 1и) + 50и = 0.
При продолжении измерения возможно наступление следующего момента времени £ 2 и, при котором
'ши (¿2и) + = 0. (17)
Заметим, что момента времени £ 2 и, удовлетворяющего (17), может и не быть. Если £2и существует, то за ги в (16) принимается ги = 2.
Таким образом, процедура определения ги в (16) продолжается до тех пор, пока не наступит время обращения в нуль всех элементов ши вектора ш.
Итак, искомые выражения элементов вектора (13) имеют вид
QU1V+ Д£) = —sign (и„ + Д*)[Х„¿0 + Ди(1 + Ъи)], (18)
где %и = 1, 2,...; Д£ — бесконечно малая положительная величина, соизмеримая со временем, затраченным на измерение ш в моменты времени .
Таким образом, элементы искомых векторов в правой части (13) имеют вид
Q°u = Хи ¿0 + Д и, ДQШи = Д ^ = 1,2,..., к, ъи = 1, 2,....
В заключение заметим, что предложенный выше способ самонастраиваемого управления можно назвать принципом обратной связи по квазиускорениям в дискретные моменты времени £ = ии + Д£.
5. Управление системой в «режиме торможения»
Заметим, что в некоторый конечный момент времени t\ изображающие точки (ши), согласно (5), окажутся на линиях разрыва
+ = 0 (v = 1, 2,...,ki),
представляющих собой уравнения прямых в координатных плоскостях ).
При этом знаки ш»(ti) и (t\) будут противоположными.
При t > ti движения изображающих точек будут происходить по закону
^ = ш»(ti) е-^(t-il)
асимптотического приближения к началу координат ш» = 0, ш» = 0 в скользящем режиме. Следовательно, процесс достижения начала координат будет продолжаться бесконечно долго.
С целью достижения начала координат за конечный промежуток времени с момента ti переведём систему в «режим торможения», заменяя элементы вектора (5) на
¿¿3»(т) = -ш„(т) + (ti)+ Tsign ¿v(т) (v = 1,2,..., ki), (19)
2ш„ (ti)
где т = t — ti. При этом значения ш» и ¿оv обращаются в нуль одновременно в моменты времени
= h + 2it^1 (u = 1, 2,..,ki). (20)
v (t i)|
Заметим, что при этом уравнения линий разрыва будут иметь следующий вид: о 2(т)=й 2 (ti) + (г).
о (t О1
Таким образом, приведение системы без удара в терминальное состояние (4) за конечный промежуток времени t2 = max t2w можно осуществить выбором элементов вектора Qш в (10) в виде
Quv = — sign ¿¿о» (Uqv + — (Dw)v, (v = 1,2,..., k), (21)
а в (13) — в виде элементов вектора (18), где ¿¿0 — вектор с элементами ¿00» = = ¿0»sign ¿02 + ¿0sign (1 — sign ¿02); ¿о» — элементы вектора шт = (¿0i,w2); ¿0i имеет вид (5), а w2 — вид (4).
6. Управление исходной системой
Для управления исходной системой (1) необходимо выразить Q через Qu. С этой целью определим сумму элементарных работ ёА1^ всех активных управляющих сил, совершаемых лишь при вариациях 5ш = Пёq, где П =|| duJi/dq, А || — матрица (k х п). Приравнивая эту работу 5А" = Q^du к такой же работе 5Аа = QT5q, где 5q являются выриациями q, обусловленными лишь вариациями 5ш в виде 5q = Пт(ППт)-15ш. При этом получаем Qu = (ППт)-iQQ, где Qu имеет вид (21).
Если Q задавать в виде Q = М0и, где M0(q, q, t) — матрица (п х г), и — г-мерный вектор управления, то при det || МтМ0 || = 0 и ПМ0 = 0 получается
следующая система к уравнений для определения г элементов вектора и:
(ППТ )-1ПМ0и = Qш.
Решение этого уравнения относительно и можно представить в виде [6]
и = ПТ (ППТ )-1Qш + иг, (22)
где П = (ППТ)-1ПМ0, || || = 0, иг — г-мерный вектор, удовлетворяющий
условию Пиг = 0, которое можно представить в виде [6]:
иг = [Е — П1 (ПП1 )-1П]'
где Е — единичная матрица, и — произвольно задаваемый вектор. Заметим, что при г = к матрица П является квадратной. Следовательно, иг = 0, так как при этом Е — П1 (ПП1 )-1 П = 0.
Отсюда следует, что минимальная размерность вектора управления и в случае к ^ г может быть равна размерности к вектора ш, что является существенным преимуществом перед способом решения поставленной в пункте 2 задачи по принципу декомпозиции [1]. Следует также отметить, что при размерности г > к, полагая иг = 0, получим вектор и с минимальной евклидовой нормой.
7. Пример. Управление процессом безударного приведения тела в заданную ориентацию режима преследующего движения по принципу пропорциональной
навигации
Рассмотрим твёрдое тело, жёстко связанное с подвижной системой координат CXYZ, оси которой являются главными центральными осями инерции тела.
Построим главный вектор внешних сил, при котором центр масс С тела движется по принципу пропорциональной навигации [7]:
= Ьше, (23)
где — угловая скорость вращения скорости V точки С тела, Ше — угловая скорость вращения линии визирования СО, О — преследуемая точка, b — положительный коэффициент пропорциональности.
Компонента внешних сил, направленная по главной нормали траектории точки С, выражается в виде Fn = т(ши х Ü), где т — масса тела. Подставляя = Ьше, получим
Fn = тb(ше ху). (24)
Сила Fn состоит из двух составляющих
Fn = Ü + Ü',
где Ü — управляющие, а Ü' — неуправляющие.
Следовательно, при управлении центром масс С силой
Üi = mb(ше х Ü) - Ü'
движение точки С будет происходить в режиме преследующего движения по принципу пропорциональной навигации.
Теперь определим главный момент управляющих сил Ü(Üp, Üq, Ür) так, чтобы ось СZ тела с ортом уз из любого положения, удовлетворяющего условию
(Пз ■ П) > 0, была приведена без удара за конечное время в положение, совпадающее с V. При таком положении тела имеет место
Wi = J ■ "J = O, (i = l, 2),
где Ji — орты осей СХ и СY. Введём квазискорости (5):
ш i
ùi + ßi(Ji ■ J), ßг У O,
(25)
(26)
где шг = ш0 ■ (ki х V) + (П ■ V) ш0 (р, д, г) — угловая скорость тела. Из (26) следует
ш0 ■ (к хУ) = ш1 + (г = 1,2), (27)
где В^ = — ■ V) — ^г(кг ■ П) (г = 1,2). Решение системы (27) имеет вид
Wo = m (¿ + Я),
где В(В1, В2), M = Пт(ППт)-1, П — матрица (2 x 3) вида
(2S)
П =
O -(" ■ J3) (" ■ J2)
(" ■ J3) O -(" ■ J1)
Теперь вектор Qш может быть построен с элементами вида (21), где к = 2. Зная Qш, определим вектор управляющих моментов
и = М (МТМ ,
(29)
имеющий минимальную евклидову норму.
Заметим, что в случае равенства нулю одного из компонентов вектора и из (29) следует двумерное управление.
8. Заключение
Результаты работы можно рассматривать в качестве определённого вклада в теорию самонастраиваемого управления механическими системами, когда целью управления является безударное приведение состояния системы в многообразие, образованное программными связями при неполной информации о массоинерци-онных параметрах системы и действующих на неё неуправляющих силах и возмущениях. При этом переходный процесс завершается за конечный промежуток времени.
Литература
1. Пятницкий Е. С. Принцип декомпозиции в управлении механическими системами // Доклады АН СССР. — 19SS. — Т. З00, № 2. — С. З00-З0З. [Pyatnickiyi E. S. Principle of Decomposition in the Management of Mechanical Systems // DAN SSSR. — 19SS. — Vol. З00, № 2. — P. З00-З0З ]
2. Матюхин В. И. Универсальные законы управления механическими системами. — М.: МАКС Пресс, 2001. — 249 с. [Matyukhin V. I. Universal Laws of Control of Mechanical Systems. — M.: MAKS Press, 2001 ]
3. Матюхин В. И. Безударный контакт твёрдых тел // ДАН. — 2009. — Т. 42Т, № 1. — С. 44-47. [Matyukhin V. I. Unstressed Contact of Solids // DAN. — 2009. — Vol. 427, № 1. — P. 44-47. ]
4. Ананьевский И. М. Непрерывное управление по обратной связи возмущёнными механическими системами // ПММ. — 2003. — Т. 67, вып. 2. — С. 163178. [Ananjevskiyj I. M. Continuous Feedback Control of Perturbed Mechanical Systems // Journal of Applied Mathematics and Mechanics. — 2003. — Vol. 67, issue 2. — P. 163-178. ]
5. Ананьевский И. М. Синтез непрерывного управления механической системой с неизвестной матрицей инерции // Известия РАН. Теория и системы управления. — 2006. — № 3. — С. 24-35. [Ananjevskiyj I. M. Synthesis of Continuous Control of Mechanical Systems with Unknown Inertia Matrix // Izvestiya RAN. Teoriya i sistemih upravleniya. — 2006. — № 3. — P. 24-35. ]
6. Мухаметзянов И. А. Построение уравнений программных движений // Автоматика и телемеханика. — 1972. — № 10. — С. 16-23. [Mukhametzyanov I. A. Construction of Equations of Program Motions // Automation and Remote Control. — 1972. — № 10. — P. 16-23. ]
7. Кан В. Л., Кельзон А. С. Теория пропорциональной навигации. — Л.: Судостроение, 1965. — 423 с. [Kan V. L., Keljzon A. S. Theory of Proportional Navigation. — L.: Sudostroenie, 1965. ]
UDC 531.31:62-56
Process Self-Adjusting Control of Non-Impact Bringing of the Condition of Mechanics Systems to Given Set
I. A. Mukhametzyanov
Department of Theoretical Mechanics Peoples' Friendship University of Russia 6, Miklukho-Maklaya str., Moscow, Russia, 117198
The procedure for building auto-adjustment control vector to bring the state of the mechanical systems without impact in a given manifold for a finite period of time in the face of uncertainty is described.
Previously obtained the solution of the problem of bringing the phase state of the system in a given neighborhood of the manifold formed by the non-stationary holonomic program constraints. In this paper we extend this approach to the task of bringing non-impact phase of the system for a finite period of time in the manifold formed by the holonomic and nonholonomic program constraints. In this case, even the mechanical system can have besides stationary and non-stationary communications. Received a lot of control vectors that provide a solution to this problem of self-adapting control of feedback on the quasi-accelerations at discrete points in time. Then this set of control vectors allocated dimension smaller than the number of degrees of freedom of the system, including the minimum dimension vector. In cases where the vectors control more than the minimum, stand vectors with minimal Euclidean norm.
The obtained results allow us to meet the challenges of an applied nature, such as process control unstressed docking surface, swimming, aircraft and spacecraft as they move freely in space, but also a process of unstressed landers landing on the moving platform, the nature of the movement are not fully known.
To illustrate the effectiveness of the proposed method for solving such problems an example of a process control of non-impact bringing of position of the body in a predetermined orientation with haunting movement of the center of mass of the body on the basis of proportional navigation is proposed.
Key words and phrases: self-adjusting control, non-impact, bringing to given set, finite time, mechanical system.