2014
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
Математика. Механика. Информатика
Вып. 4(27)
УДК 519.7
Управление с "поводырем" двухзвенным манипулятором с вращательными парами
С. В. Лутманов, Е. С. Попова
Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букерева, 15 mpu@psu.ru; (342)239-63-09
Решается игровая задача управления о переводе схвата манипулятора на базовую траекторию движения в предположении, что измерение фазового вектора игры производится с некоторой погрешностью. Численно подтверждено, что процедура управления с "поводырем" является эффективным средством управления конфликтно-управляемым динамическим объектом в условиях неточного измерения фазового вектора дифференциальной игры.
Ключевые слова: манипулятор; математическая модель; дифференциальная игра; управление с "поводырем".
Введение
На горизонтальной плоскости рассматривается двухзвенный механический манипулятор с двумя вращательными парами (рис. 1), управление которым осуществляется моментами, развиваемыми в соединительных парах. Задана траектория схвата и его закон движения вдоль этой траектории. Указанный закон движения реализуется посредством известных программных управлений. В случае, когда начальные условия для схвата нарушаются, его дальнейшее движение будет отклоняться от базового.
© Лутманов С. В., Попова Е. С., 2014
Возвращение схвата на базовую траекторию осуществляется посредством применения дополнительных управлений. В предположении, что нарушения начальных условий незначительны, задача о возращении схвата на базовую траекторию сводится к задаче приведения фазового вектора линеаризованной модели в начало координат. Линеаризация производится в окрестности базового закона движения. В работе [2] эта задача была решена в предположении, что в соединительных парах могут возникать неконтролируемые помехи в виде вращательных моментов. Неконтролируемой помехе предписывалось стремление максимально навредить в решении задачи перевода схвата на базовую траекторию. На дополнительные управления и вращательные моменты, развиваемые неконтролируемой помехой, накладывались геометрические ограничения в виде выпуклых компактных множеств.
В данной статье допускается, что измерение фазового вектора линеаризованной модели производится неточно. Известно [3], что в этих условиях оптимальная стратегия управления, реализованная в форме прицеливания на соответствующий стабильный мост, является неустойчивой по отношению к ошибке измерения фазового вектора. В данной статье оптимальное управление манипулятором осуществляется в виде процедуры управления с "поводырем" [1], преодолевающей этот недостаток.
1. Линеаризованная модель
Манипулятор представляет собой механизм с двумя степенями свободы. Пусть
Ч№* д0 ' [0' 1] ^ К4 закон движения, манипулятора, порожденный управлением м* (•) и выходящий из начального положения , а Чм* д0* • [0,1] ^ К4 ~ выходящий из начального положения . Полагаем
*(*) = Ч^*)"Ч^Ч (*)' * е[0,1].
Предполагается, что величина ||ч0* - ,0|| мала. Дифференциальные уравнения линеаризованной модели имеют вид [2]
х = А (*) х + В (*) (и + V), (1.1)
где
А (* ) =
дQ (*,ч, и)
Г 0 0
0
В (* ) =
д, Ч=Ч * 0(*) м ,ч
0 1 0 \
0 0 1
дОз ] * Г дОз Т Г дОз ] *
д,2 у Кдчз у
дО4 ^ * ГдО4 V ГдО ^ *
д,2 ) КдЧз у Кд,4 у у
дО (*, Ч,
дм
0 0
Ч=Ч * 0 (*^
н> ,Ч• ' 0 0
*(* )
дОз дн'1
дО4
Л* (
КК^ у
дОз Кд^2 у
Кдм2 у у
О =
Г ОЛ 02 Оз
К О4 У
= Чз, О2 = Ч4,
Оз =
Ьм1 - Ьс,4 - ч2) аЬ - с2 соб2(, - ,2)
^2 соб(,1 - ,2)
аЬ - с2 соб2 (, - ч2)
1 с2,з2 Бт[2(,1 - ,2)]
О4 =
2 аЬ - с2соб2(,1 - ,2) ам2 + ас,32 бш^ - ч2)
аЬ - с2 соб2(, - ч2) с^1соб(,1 - ,2)
+
аЬ - с2 соб2(,1 - ,2)
1 с25т[2(,1 - ,2)]
н----2-2-
2 аЬ - с соб (, - ,2)
Здесь и е К - вектор дополнительных
управляющих параметров, а V е К2 - вектор управляющих парамет
зов помех. При этом
и е Р =
Г иЛ
К и2 у
V е О =
К V2 у
и1 + и2 < а V2 + ^ < р2 ^, а > р > 0.
Задача возвращения схвата на базовую траекторию представляет собой антагонистическую дифференциальную игру наведения-уклонения, целевым множеством для которой служит начало координат. В этой игре первый игрок распоряжается управляющими параметрами и е Р, а второй - параметрами V е О. Первый игрок решает задачу наведения и поэтому является игроком-союзником. Свою оптимальную стратегию он строит в форме экстремального прицеливания на стабильный мост, обрывающийся в конечный момент на целевом множестве. Выше уже отмечалось, что такой способ управления является эффективным, если измерение фазового вектора игроком-союзником производится без погрешностей. В противном случае игрок-союзник должен применить процедуру управления с "поводырем".
2. Процедура управления с "поводырем"
Предполагается, что в любой момент времени выполнено неравенство
||х(*)- х* (*)||< С С ^ 0,
0
*
где х* (г) - измеренное значение фазового
вектора линеаризованной модели. Следуя [1] опишем позиционную процедуру управления с "поводырем". Пусть Ж — стабильный мост первого игрока в антагонистической дифференциальной игре с динамикой (1.1), обрывающийся в момент времени 3 е [0, Т] в
начале координат. Введем виртуальный динамический объект, который будем называть "поводырем". Его динамика описывается тем же дифференциальным уравнением (1.1), что и реальный объект. Для отличия фазовый вектор "поводыря" будем обозначать буквой . Таким образом,
w
= A ( t ) w + B ( t )( u + v )
г е[г0, Т ], w е Rn, и е Р, V е Q.
Рассмотрим разбиение А промежутка времени [г0,3] на полуинтервалы:
К), 5 = 0,1,...,к — 1, Д = г0,тк = 3.
Опишем действия первого игрока на каждом из указанных полуинтервалах (см. рис. 2).
Рис. 2. Траектория "поводыря" Полуинтервал [д^Д ). Определяем точку на сечении моста как ближайшую к
x . Имеем
x - w0|| = min ||x - w||
w (t.) I
(2.1)
где x измеренное первым игроком в начальный момент времени t0 положение фазового вектора. Управление u0 = const первого игрока на полуинтервале [t0,Tj) находится из условия
'z0, Bu Л = min( z0, Bu), (2.2)
' ueP * '
где z0 = x* — w0. Если условия (2.1), (2.2) определяют вектор u0 е P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения
x = A (t) x + B (t )(u0 + v (•)),
x(t.) = x., t е [to,Tj) .
Полагаем x, = lim x (t) . Движение пово-
t ^Tj
дыря w (•) отождествим с тем решением дифференциального уравнения в контингенциях W е A(t)x + B(t)(P + v0),
w(t.) = wo. t е[тоТ), z0, Bv0) = max (z0, Bv
' veQ *
для которого выполнено включение w (t1 )eW (t ) . Такое решение существует по определению стабильного моста. Полагаем
w1 = lim w (t) .
t
Полуинтервал [t,t2) . Пусть x. — измеренное первым игроком в момент времени T1 положение фазового вектора. В общем
случае w1 ^ x. . Управление u1 = const первого игрока на полуинтервале [t,t2 ) определяем из условия
(z,, Bu^ = min( z,, Bu), (2.3)
где zl = x. — wl. Если условие (2.3) определяет вектор u е P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения
x = A (t) x + B (t )(ul + v (•)),
x (Tl ) = xi. t e[Tl,T2 ) .
Полагаем x2 = lim x (t) . Движение "по-
t
водыря" w (•) отождествим с тем решением
дифференциального уравнения в континген-циях
w е A(t)x + B(t)(P + v1),
w(Ti ) = wi,t ФоТ),
z,, Bv1) = max (z,, Bv),
1 I vеQ x '
для которого выполнено включение w(z2)eW(г2). Такое решение существует по определению стабильного моста. Полагаем w2 = lim w (t). и т. д.
Полуинтервал [ts, Ts+1) . Пусть
*
Xs —
измеренное первым игроком в момент времени zs положение фазового вектора. В общем
случае ws ^ х*. Управление us = const первого игрока на полуинтервале [rs,TS+1) определяем из условия
z , Bus) = mim z , Bu
ueP
(2.4)
где zs = xs - ws. Если условие (2.4) определяет вектор us е P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения
X = A (t) x + B (t)(us + v (•)),
x ) = xs,t +1) .
Полагаем xs+1 = lim x (t) . Движение
t ^s+1
"поводыря" w (•) отождествим с тем решением дифференциального уравнения в контин-генциях
w е A(t)x + B(t)(P + vs),
w ) = ws , t +1 ) ,
lzs, Bvs) = max( , Щ,
\ ' veg * '
для которого выполнено включение w (rs+1 )eW (rs+1) . Такое решение существует по определению стабильного моста. Полагаем ws+1 = lim w (t) . и т. д.
^s+1
Таким образом, на каждом полуинтервале [rs,rs+1), s = 0,1,...,k -1 разбиения промежутка времени [t„ ,T] будет получено движение "поводыря" w (•) и движение
реального динамического объекта x(•).Справедливо следующее утверждение [1].
Позиционная процедура управления с "поводырем" позволяет по любому s > 0 подобрать величины Q (s) > 0 и 5 (s) > 0,
для которых бы выполнялось xA (ö) < s , где
(•) — ломаная Эйлера, выходящая из
начального положения
( ^ х0 )еW и
порожденная процедурой управления с "поводырем", если длина шага разбиения А меньше 5 (^) > 0 , а точность измерения
фазового вектора не ниже С (£) > 0.
3. Численный эксперимент
В рассматриваемой дифференциальной игре стабильный мост первого игрока, обрывающийся в момент времени 3 е [0, Т] в начале координат, имеет вид
W = {(*, х)| е(*, х)< 0, * е [0,3]},
где
(*, х ) =
Т
(х, 5 (*)) +
= max
j0, x, s (0)+1 iueiPn(B (т)u, s (T)d
T
+ J max^B (т) v, s (r^jdz
— max( m, l
meM *
(3,1)
5(4)={/ е Я2\\|/|| = 1}, 5 (т) = ( X [Т ,т])' /0,
т е [*, Т], /0 е 5(4) - вектор, доставляющий
максимум в (з.1).
При проведении численного эксперимента были установлены следующие значения параметров задачи. Каждое звено двух-звенного манипулятора имеет длину /1 = /2 = 1 м, масса схвата т=1 кг , массы стержней - т1 = т2 = 1 кг . Отклонение
схвата манипулятора от начального положения определяется вектором
х0* =
f—0.21 рад ^ 0.40 рад
0 рад сек
0 р^д
и составляет величину р0 = 0.45177 . Заметим, что
(0,х0*)еW. Принимается также, что а = 10 н • м, р = 1 н • м, 5 = 0.005 м .
х
2
Все вычисления проводились в среде пакета МаШешайса 8. В рамках численного эксперимента рассмотрены два случая. В первом случае в условиях неточного измерения фазового вектора игрок-союзник реализует свою стратегию в виде стандартного прицеливания на мост, а во втором случае - в форме процедуры управления с "поводырем".
В процессе прицеливания на мост определение — точки моста, ближайшей к точке
х £ Ж(г) = {х е Д4|(г, х) е Ж}, г е [0,3]
осуществляется путем решения задачи математического программирования на условный минимум с ограничением типа неравенства
(Р1 — х1 )2 + (Р2 — х2 )2 + (Р3 — х3 )2 +
+ (Р4 — Х4 )2
^ Ш1П,
г(г, х1, х2, х3, х4,) < 0 .
(3.2)
(3.3)
Заметим, что задача (3.2), (3.3) является невырожденной задачей выпуклого программирования. Тогда необходимые условия локального минимума в форме правила множителей Лагранжа служат для нее и достаточными условиями глобального минимума. При реализации процедуры управления с "поводырем", описанной в предыдущем пункте, удержание "поводыря" на стабильном мосту на каждом шаге процесса осуществляется выбором управляющего па-
йг _
раметра первого игрока из условия-< 0 .
йг
Случай первый. Управление манипулятором производится в форме стандартного прицеливания на стабильный мост в условиях неточного измерения фазового вектора. На рис. 3 показана траектория фазового вектора игры в проекции на первые две координаты, в предположении, что второй игрок действует самым неблагоприятным для первого игрока образом. Расстояние фазового вектора до начала координат (по всем четырем координатам) в конечный момент времени равно рк = 0.06224, что говорит о неэффективности приведенной процедуры управления.
Рис. 3. Траектория движения управляемого объекта
Случай второй. В условиях неточного измерения фазового вектора управление манипулятором осуществляется в форме позиционной процедуры управления с "поводырем". На рис. 4 показана траектория фазового вектора игры в проекции на первые две координаты, в предположении, что второй игрок действует самым неблагоприятным для первого игрока образом. Расстояние фазового вектора до начала координат (по всем четырем координатам) равно рк = 0.00031. В случае, когда второй
игрок действует случайно, оно практически равно нулю. Полученные результаты являются приемлемыми.
Рис. 4. График движения управляемого объекта при оптимальном действии помехи
Заключение
В работе численно подтверждено, что процедура управления с поводырем является эффективным способом управления в дифференциальной игре наведения в условиях неточного измерения фазового вектора игры. Этот факт позволил решить задачу возвращения схвата манипулятора на базовую траекторию с заданной степенью точности, в предположении, что его отклонение от базового закона движения в каждый момент времени измеряется с погрешностью.
2
Список литературы
1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 456 с.
2. Лутманов С.В., Попова Е.С. Игровые задачи управления двухзвенным манипулятором с вращательными парами // Про-
блемы механики и управления: межвуз. сб. науч. тр. Пермь, 2012. Вып. 44. С. 59-73.
3. Лутманов С.В., Попова Е.С. Реализация процедуры управления с "поводырем" в одной антагонистической дифференциальной игре двух лиц наведения на целевое множество // Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2013. Вып. 45. С. 39-54.
Control with a "leader" the double-hinged arm with rotatory pairs
S. V. Lutmanov, E. S. Popova
Perm State University, Russia, 614990, Perm, Bookirev st., 15 mpu@psu.ru; (342) 239 63 09
The game task of management about translation of gripper of manipulator decides on the base trajectory of motion in supposition, that measuring of phase vector of game is produced with some error. It is numeral confirmed that management procedure with a "leader" is the effective means of management by the conflict-guided dynamic object in the conditions of the inexact measuring of phase vector differential game.
Key words: manipulator; mathematical model; differential game; control with a "leader".