2014
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
Математика. Механика. Информатика
Вып. 3(26)
МЕХАНИКА МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 519.7
Решение задачи предельного быстродействия управления движением плоского двухзвенного манипулятора
Л. В. Куксенок, С. В. Лутманов
Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букирева, 15 [email protected].; (342) 239-63-09
Строится и исследуется математическая модель плоского двухзвенного манипулятора с двумя вращательными кинематическими парами. В предположении, что в начальный момент схват манипулятора не лежит на базовой траектории, решается задача об оптимальном (в смысле предельного быстродействия) возращении его на указанную траекторию.
Ключевые слова: манипулятор; математическая модель; оптимальное управление; предельное быстродействие.
Введение
Задачи теории оптимального управления нелинейными динамическими объектами и в частности задача предельного быстродействия являются весьма трудными для решения. В статье исследуется возможность сведения задачи о возвращении схвата манипулятора на базовую траекторию наибыстрейшим образом к задаче предельного быстродействия по приведению фазового вектора линеаризованной модели манипулятора в начало координат. Такое сведение обосновывается тем, что возмущение траектории схвата, возникающее вследствие малых отклонений начального положения схвата от его базового положения, является малым. Указанный подход позволил применить методы теории оптимального управления линейными динамическими системами к решению задачи наибыстрейшего возвращения схвата на базовую траекторию. В частности, определение оптимального времени перехода свелось к реше-
© Куксенок Л. В., Лутманов С. В., 2014
нию трансцендентного уравнения, а построение оптимального управления - к решению задачи математического программирования специального вида.
1. Математическая модель манипулятора
В работах [3, 4] была построена математическая модель плоского горизонтального двухзвенного манипулятора (рис. 1). Каждое
звено манипулятора представляет собой абсолютно жесткий однородный стержень длиной 11 = 12 = I и массой mi, i = 1,2.
Первое звено соединено с неподвижным основанием вращательной парой 01, а со вторым звеном - вращательной парой 02. Принимается, что масса схвата манипулятора - т. В соединительных парах могут развиваться управляющие вращательные моменты, соответственно v1 и v2. На горизонтальной плоскости, в которой расположен манипулятор, введем прямолинейную ось 01X . Обозначим через pi угол, образованный i -м звеном манипулятора, i = 1,2 , с осью 01X . Трение в шарнирах отсутствует. Дифференциальные уравнения движения манипулятора, записанные в форме уравнений Лагранжа второго рода, имеют вид
4 = Чз, 42 = ^
Ъ =
bv - bcq\ sin(q1 - q2) ab - c2 cos2(q1 - q2)
cv2cos(qi - Ъ2)
Ъ4 =
ab - c2 cos2 ( q1 - q2 )
1 _ q'sin[2(qi - q2)]
2 ab - c2cos2(q1 - q2)
av2 + acq32 sin(q1 - q2) ab - c2 cos2(q1 - q2) cv1 cos(q1 - q2)
(1.1)
+
ab - c2 cos2(q - q2)
1 c2q4sin[2(qt - q2)]
н----2-2-'
2 ab - c cos (q1 - q2)
где
14 2 1 4 2
a =4 (3" ^ + 4да2 н 4m)l , b = - (- m2 + 4m)l ,
1 2
c = — (2m + m2)l .
q1 = ^ q2 = < q3 = ^ q* = <2.
Считаются заданными начальный t0 и
конечный T моменты времени процесса, кинематический закон движения схвата в декартовых координатах
X = X(t), Y = Y(t), t е [t0, Т], а также программные управления
< = v;(t)t е [to,Т], i = 1,2,
реализующие указанный закон движения. При этом движение схвата происходит по заданной (базовой) траектории Y = F (X), а в моменты времени t0 и Т схват имеет нулевую
скорость. В предположении, что в начальный момент времени схват был смещен относительно базовой траектории и что это смещение невелико, в указанных выше работах была решена задача о возращении схвата на базовую траекторию до момента окончания процесса Т с помощью дополнительных управлений и1 (•), и2 (•) . При этом в работе
[3] управления и1 (•), и2 (•) были оптимальны в смысле критерия
I к-)] =
Кu2(z) + u^(z)) dz
а в работе [4] - в смысле критерия
I[u(-)] = vrai max дУu12 (z) + u^ (z) .
TE[i0,i
(1.2)
(1.3)
В книге [1] критерий (1.2) носит название "минимум энергии", а критерий (1.3) -"минимум силы". Решение задач было осуществлено с использованием линеаризованной системы дифференциальных уравнений движения схвата в окрестности базового закона движения (линеаризованная модель). Оно свелось к задаче перевода фазового вектора системы в начало координат. Сама же линеаризованная система имела вид
где
A(t ) =
x = A(t)x + B(t)u , ÔQ(t, q, u )
(1.4)
dq
q=q (t),v=v (t)
( 0 0 1 0 1
0 0 0 1
ÔQ3 ÔQ3 ÔQ3 ÔQ3
8q1 Ôq2 Ôq3
ÔQ4 ÔQ4 ÔQ4 ÔQ4
Ôq2 Ôq3 ÔqA )
q=q (t),v=v (t)
B(t) =
dQ(t, q, u )
dv
q=q (t),v=v (t)
Г 0 0
0 ^ 0
dQ3 dQ3
dvi dv2
5Q4 sq4
v5vi
dv.
2 у
Q =
Qi = qз, Q2 = q4,
Q3 =
Г Qi^
Q2 Q3
V Q4 у
bvi - bcq42sin(qi - q2)
ab - c2 cos2(qi - q2)
cv2cos(qi - q2)
ab - c2 cos2 (qi - q2)
1 _ c'q3 sin[2(qi - q2)]
2 ab - c2cos2(qi - q2)
Q4 =
av2 + acq3 sin(qi - q2) ab - c2 cos2(qi - q2) cvicos(qi - q2)
- +
q4 =
av2 + acq32 sin(qi - q2) ab - c2 cos2(qi - q2)
cvi cos(qi - q2) ab - c2 cos2(qi - q2)
,22
- +
1 c q4sin[2(qi - q2)]
н----2-2-,
2 ab - c cos (qi - q2)
с соответствующими начальными условиями.
2. Задача предельного быстродействия
В настоящей работе на основе приведенной выше математической модели манипулятора решается задача возвращения схвата на базовую траекторию за наименьшее время с использованием дополнительного управления u (•). Относительно управляющих параметров u предполагается, что они стеснены геометрическими ограничениями
u е P =
Ги^
Vu2 У
е R2
2 2 2 ui + u2 < а
Следуя статье [2], опишем алгоритм построения оптимального по быстродействию управления для системы (1.4). Для начального
}4
ab - c cos (qi - q2)
1 q42sin[2(qi - q2)]
+----2-2-
2 ab - c cos (qi - q2) ,
а q*: [t0, T] ^ R2 - закон изменения вектора
обобщенных координат манипулятора, отвечающий базовому кинематическому закону движения схвата. Движение реального механизма можно получить, проинтегрировав систему дифференциальных уравнений
qi = Чз,
q2 = q^
положения |t, х} е [t0, T]х R4 полагаем s (t, x,T) = max |0, max(X '[T, t]l,
T
+J min( X '[T ,t] l, B (t) u)rfr
x +
(2i)
Здесь S(4) =
ir l л
12 13 е R4 t12 = i i=i
V l4 у
^/3 =
b (v* (t)+ui0 (t))- bcq4 sin(qi- q2)
ab - c2 cos2(qi - q2)
- c ( У*(t)+u20 (t)) cos(qi - q2) -
ab - c2 cos2 (qi - q2)
1 ^ c2q3 sin[2(qi - q2)]
2 ab - c2cos2(qi - q2)'
X[7,т] — фундаментальная матрица Коши
для однородной системы дифференциальных уравнений х = Л (7)х. Функция е называется гипотетическим рассогласованием. Ее геометрический смысл состоит в том, что величина е( t, х,Т) представляет собой расстояние от области достижимости динамического объекта из начальной позиции (7, х) в конечный
момент времени Т до начала координат. Известно [5], что в области е( 7, х,Т )> 0 максимум в правой части равенства (2.1) достигает-(1.5) ся на единственном векторе 10 (7, х,Т)е ^,
q=q (t),v=v (t)
функция гипотетического рассогласования является непрерывно дифференцируемой функцией аргументов ^, х), а ее частные производные вычисляются по формулам
д£0
(t, х) = А (t) х, ^^ - тт(В (t) и, s
dt
es0_
dx
(t, x ) = 50,
где s0 = X'[Т,t]10 (t,х,Т) .
Допустимое программное управление и0 (•) , переводящее фазовый вектор в ту точку области достижимости, расстояние от которой до начала координат равно £ (t, х, Т) > 0 , удовлетворяет условию
^В(t)и0 (t)) = 1Шп(sВ(t)и),
t е [^о, Т]. (2.2)
Решение задачи быстродействия сводится к построению монотонно возрастающей последовательности
Т }, Т > to, к = 1,2, —, £ (и х, Тк 0,
удовлетворяющей условию £ [Тк ] > 0 . При
вычислении значений £ [Тк ], к = 1,2,— по
формуле (2.1) приходится решать задачу математического программирования максимизации строго вогнутой, положительно однородной функции на единичной сфере. Данная задача осложнена наличием определенных интегралов в выражении для целевой функции, которые не берутся аналитически. При практической реализации алгоритма процесс построения членов последовательности \Тк }, к = 1,2, — следует остановить, когда
удается подобрать такое число Т, для которого £ [Т] = 0 и Т- Тк < /, где р > 0 параметр точности. В этом случае Т0 е[Тк,Т„), а за оптимальное программное управление принимается функция и0 (•), найденная из условия (2.2).
Время перехода Т0 можно улучшить, если применить позиционную процедуру
управления. С этой целью промежуток Т] разбивается на полуинтервалы
[^,'^+1) , i = 0,1" ■, k, Т0 = t0, = T, < Я .
На полуинтервале [т0,т) управление u(0)Q строится так, как это описано выше. Пусть х(0) (t) - решение системы дифференциальных уравнений (1.5), где в качестве дополнительного управления применяется u(0) (•) .
Далее полагается х(1) = lim х(0) (т) . На полуинтервале [т0,т1) управление u(1)Q строится так же, как u(0) (•), с той лишь разницей, что в качестве начальной позиции здесь бе-
f (!)) рется позиция т,xw > и т. д.
3. Численный эксперимент
Принимаем, что массово-геометрические характеристики манипулятора, а также время процесса, кинематический закон движения схвата и его начальное смещение совпадают с аналогичными параметрами из статей [3], [4]. Тогда
т = т1 = т2 = 1кг, 11 = 12 = 1 м, t0 = 0, Т = 1сек, Y = — cos X +1, 3 = 0,000001сек,
4
х1(0) = 1,21 • 10-1 рад, х2(0) = 0.53 •Ю-1 рад,
х3(0) = 0 Р0*., х-4(0) = 0 Ра*.
сек сек
Ограничение на управление имеет вид
Г и \
и =
и
е P =
VU 2 J
е R2
VU 2 J
и2 + и2 < 5 }•.
В принятых предположениях решается задача быстродействия по алгоритму, описанному в пункте 2. Величина гипотетического рассогласования здесь вычисляется по формуле
£[0, х[0], T ] = max [(X [T, 0]х0, l) +
T
| mm[u< (т, l) + u2<2 (т, l)]dz iax [(X [T, 0]х0, l) -
5^<2(т, l) + <22(т, l) dz
+
= max|
T
где выражения р1(т, I), р2(т, I) представляют собой известные функции элементов фундаментальной матрицы Коши X[Т,т].
Построим последовательность Т }, Т > 70, к = 1,2,-, е( 7, х, Тк 0.
Имеем Т1 = 0, Т2 = 0.1,..., Тк—2 = 0.4179239, Тк—1 = 0.417924, Тк = 0.4179241, где Тк—2 — Тк < 3 . Тогда
оптимальное время перехода Т0 = 0.417924.
Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле
'_ <Р1(т,10) Л
м0(7) = ^ (7,10, Т0) = —5
>12(т, 10) + 10)
7 е [70,Т0].
(3.1)
Эффективность найденного дополнительного программного управления (3.1) проверяется путем подстановки его в исходные нелинейные дифференциальные уравнения движения (1.5) и интегрирования их с выбранными смещенными начальными условиями. Численно показано, что в результате
схват в момент времени Т0 выходит на базовую траекторию и продолжает движение вдоль нее после выключения дополнительных управлений.
На рис. 2 приводится базовая траектория движения схвата манипулятора и его траектория, полученная в результате решения задачи быстродействия в классе программных управлений.
Рис. 2. Траектория движения схвата: 1 -движение схвата после его возвращения на базовую траекторию; 2 - оптимальная траектория схвата, отвечающая времени
перевода Т0 = 0.417924; 3 - базовая траектория движения схвата
В момент времени Т0 = 0.417924 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно
ЩТ0) = 0,54 • 10—2 рад, Л?2 (Т0) = 0,27 -10—2 рад
А^Т0) = 3,3-10—2 , А/ДТ0) = 1,04-10—2
сек сек
В момент времени 7 = 1 эта разность составляет
Ад1 (1) = 0,22 -10—2 рад, Лд2 (1) = 0,24 -10—2 рад
Ад3 (1) = 0,32-10
—2 рад
сек
Лд4(1) = 0,2 -10
—2 рад
сек
Далее решается задача быстродействия по схеме позиционного управления. В таблице приведены результаты решений задач быстродействия на различных участках разбиения промежутка [70, Т ].
Оптимальное время перехода при позиционном управлении
[Т Тг+1) Т о
[0;0,1) 0,417924
[0,1;0,2) 0,417457
[0,2;0,3) 0,416732
[0,3;0,416011) 0,416011
На рис.3 представлены траектории движения схвата манипулятора, получающиеся в результате позиционного управления манипулятором.
Рис. 3. Траектория движения схвата: 1 -движение схвата после его возвращения на базовую траекторию; 2 - оптимальная траектория схвата, отвечающая времени
перевода Т0 = 0.416011; 3 - базовая траектория движения схвата
В момент времени Т0 = 0.416011 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно
х1(Т0) = 0,38 • 10-4рад,х2(Т0) = 0,12 • 10-4рад,
х3(Т0) = 4,48 -10-3 , х4 (Т0) = 7,35 -10-3 ^ сек сек .
В момент времени / = 1 эта разность составляет
х1 (1) = 0,25 • 10 3 рад, х2 (1) = 0,11 • 10 3 рад
х3(1) = 0,93• 10-3 ^,Х4(1) = 0,18•Ю-3 ^ сек сек
Заключение
В статье показано, что программное управление, решающее задачу предельного быстродействия для линеаризованной модели, приемлемо для решения задачи о наибыстрейшем возвращении схвата манипулятора на базовую траекторию. Сравнивая качество программного и позиционного управлений, построенных в работе, можно отметить, что при позиционном управлении схват с большей точностью попадает на заданную траек-
торию, а время перехода при этом меньше,
чем в случае программного управления.
Список литературы
1. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.
2. Лутманов С.В., Стрелкова Н.А. Оптимальное по быстродействию управление поступательным перемещением твердого тела // Вестник Пермского университета. Сер. Математика. Механика. Информатика. 2010. Вып. 1 (1). С.50-57.
3. Куксенок Л.В., Лутманов С.В. Управление движением плоского двухзвенного манипулятора по критерию "минимум энергии" // Проблемы механики и управления: меж-вуз. сб. науч. тр. Пермь, 2012. С. 33-41.
4. Куксенок Л.В., Лутманов С.В. Управление движением плоского двухзвенного манипулятора по критерию "минимум силы" // Проблемы механики и управления: меж-вуз. сб. науч. тр. Пермь, 2013. Вып. 45. С. 20-29.
5. Лутманов С.В. Вариационное исчисление и теория оптимального управления в примерах и упражнениях: учеб. пособие / Перм. гос. ун-т. Пермь, 2010. 200 с.
Solution of task of maximum fast-acting of control by motion of the flat double-hinged arm
L. V. Kuksyonok, S. V. Lutmanov
Perm State University, Russia, 614990, Perm, Bukirev st., 15 [email protected]; (342) 239 63 09
The mathematical model of the flat double-hinged arm is built and investigated with two rotatory kinematics pairs. In supposition, that in initial moment the gripper of manipulator does not lie on a base trajectory, a task decides about optimal in sense of maximum fast-acting of return him on the indicated trajectory.
Key words: manipulator; mathematical model; optimal control; maximum fast-acting.