Научная статья на тему 'РЕШЕНИЕ ЗАДАЧИ ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ УПРАВЛЕНИЯ ДВИЖЕНИЕМ ПЛОСКОГО ДВУХЗВЕННОГО МАНИПУЛЯТОРА'

РЕШЕНИЕ ЗАДАЧИ ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ УПРАВЛЕНИЯ ДВИЖЕНИЕМ ПЛОСКОГО ДВУХЗВЕННОГО МАНИПУЛЯТОРА Текст научной статьи по специальности «Математика»

CC BY
90
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАНИПУЛЯТОР / MANIPULATOR / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / MATHEMATICAL MODEL / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / ПРЕДЕЛЬНОЕ БЫСТРОДЕЙСТВИЕ / MAXIMUM FAST-ACTING

Аннотация научной статьи по математике, автор научной работы — Куксенок Л. В., Лутманов С. В.

Строится и исследуется математическая модель плоского двухзвенного манипулятора с двумя вращательными кинематическими парами. В предположении, что в начальный момент схват манипулятора не лежит на базовой траектории, решается задача об оптимальном (в смысле предельного быстродействия) возращении его на указанную траекторию.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOLUTION OF TASK OF MAXIMUM FAST-ACTING OF CONTROL BY MOTION OF THE FLAT DOUBLE-HINGED ARM

The mathematical model of the flat double-hinged arm is built and investigated with two rotatory kinematics pairs. In supposition, that in initial moment the gripper of manipulator does not lie on a base trajectory, a task decides about optimal in sense of maximum fast-acting of return him on the indicated trajectory.

Текст научной работы на тему «РЕШЕНИЕ ЗАДАЧИ ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ УПРАВЛЕНИЯ ДВИЖЕНИЕМ ПЛОСКОГО ДВУХЗВЕННОГО МАНИПУЛЯТОРА»

2014

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика

Вып. 3(26)

МЕХАНИКА МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

УДК 519.7

Решение задачи предельного быстродействия управления движением плоского двухзвенного манипулятора

Л. В. Куксенок, С. В. Лутманов

Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букирева, 15 [email protected].; (342) 239-63-09

Строится и исследуется математическая модель плоского двухзвенного манипулятора с двумя вращательными кинематическими парами. В предположении, что в начальный момент схват манипулятора не лежит на базовой траектории, решается задача об оптимальном (в смысле предельного быстродействия) возращении его на указанную траекторию.

Ключевые слова: манипулятор; математическая модель; оптимальное управление; предельное быстродействие.

Введение

Задачи теории оптимального управления нелинейными динамическими объектами и в частности задача предельного быстродействия являются весьма трудными для решения. В статье исследуется возможность сведения задачи о возвращении схвата манипулятора на базовую траекторию наибыстрейшим образом к задаче предельного быстродействия по приведению фазового вектора линеаризованной модели манипулятора в начало координат. Такое сведение обосновывается тем, что возмущение траектории схвата, возникающее вследствие малых отклонений начального положения схвата от его базового положения, является малым. Указанный подход позволил применить методы теории оптимального управления линейными динамическими системами к решению задачи наибыстрейшего возвращения схвата на базовую траекторию. В частности, определение оптимального времени перехода свелось к реше-

© Куксенок Л. В., Лутманов С. В., 2014

нию трансцендентного уравнения, а построение оптимального управления - к решению задачи математического программирования специального вида.

1. Математическая модель манипулятора

В работах [3, 4] была построена математическая модель плоского горизонтального двухзвенного манипулятора (рис. 1). Каждое

звено манипулятора представляет собой абсолютно жесткий однородный стержень длиной 11 = 12 = I и массой mi, i = 1,2.

Первое звено соединено с неподвижным основанием вращательной парой 01, а со вторым звеном - вращательной парой 02. Принимается, что масса схвата манипулятора - т. В соединительных парах могут развиваться управляющие вращательные моменты, соответственно v1 и v2. На горизонтальной плоскости, в которой расположен манипулятор, введем прямолинейную ось 01X . Обозначим через pi угол, образованный i -м звеном манипулятора, i = 1,2 , с осью 01X . Трение в шарнирах отсутствует. Дифференциальные уравнения движения манипулятора, записанные в форме уравнений Лагранжа второго рода, имеют вид

4 = Чз, 42 = ^

Ъ =

bv - bcq\ sin(q1 - q2) ab - c2 cos2(q1 - q2)

cv2cos(qi - Ъ2)

Ъ4 =

ab - c2 cos2 ( q1 - q2 )

1 _ q'sin[2(qi - q2)]

2 ab - c2cos2(q1 - q2)

av2 + acq32 sin(q1 - q2) ab - c2 cos2(q1 - q2) cv1 cos(q1 - q2)

(1.1)

+

ab - c2 cos2(q - q2)

1 c2q4sin[2(qt - q2)]

н----2-2-'

2 ab - c cos (q1 - q2)

где

14 2 1 4 2

a =4 (3" ^ + 4да2 н 4m)l , b = - (- m2 + 4m)l ,

1 2

c = — (2m + m2)l .

q1 = ^ q2 = < q3 = ^ q* = <2.

Считаются заданными начальный t0 и

конечный T моменты времени процесса, кинематический закон движения схвата в декартовых координатах

X = X(t), Y = Y(t), t е [t0, Т], а также программные управления

< = v;(t)t е [to,Т], i = 1,2,

реализующие указанный закон движения. При этом движение схвата происходит по заданной (базовой) траектории Y = F (X), а в моменты времени t0 и Т схват имеет нулевую

скорость. В предположении, что в начальный момент времени схват был смещен относительно базовой траектории и что это смещение невелико, в указанных выше работах была решена задача о возращении схвата на базовую траекторию до момента окончания процесса Т с помощью дополнительных управлений и1 (•), и2 (•) . При этом в работе

[3] управления и1 (•), и2 (•) были оптимальны в смысле критерия

I к-)] =

Кu2(z) + u^(z)) dz

а в работе [4] - в смысле критерия

I[u(-)] = vrai max дУu12 (z) + u^ (z) .

TE[i0,i

(1.2)

(1.3)

В книге [1] критерий (1.2) носит название "минимум энергии", а критерий (1.3) -"минимум силы". Решение задач было осуществлено с использованием линеаризованной системы дифференциальных уравнений движения схвата в окрестности базового закона движения (линеаризованная модель). Оно свелось к задаче перевода фазового вектора системы в начало координат. Сама же линеаризованная система имела вид

где

A(t ) =

x = A(t)x + B(t)u , ÔQ(t, q, u )

(1.4)

dq

q=q (t),v=v (t)

( 0 0 1 0 1

0 0 0 1

ÔQ3 ÔQ3 ÔQ3 ÔQ3

8q1 Ôq2 Ôq3

ÔQ4 ÔQ4 ÔQ4 ÔQ4

Ôq2 Ôq3 ÔqA )

q=q (t),v=v (t)

B(t) =

dQ(t, q, u )

dv

q=q (t),v=v (t)

Г 0 0

0 ^ 0

dQ3 dQ3

dvi dv2

5Q4 sq4

v5vi

dv.

2 у

Q =

Qi = qз, Q2 = q4,

Q3 =

Г Qi^

Q2 Q3

V Q4 у

bvi - bcq42sin(qi - q2)

ab - c2 cos2(qi - q2)

cv2cos(qi - q2)

ab - c2 cos2 (qi - q2)

1 _ c'q3 sin[2(qi - q2)]

2 ab - c2cos2(qi - q2)

Q4 =

av2 + acq3 sin(qi - q2) ab - c2 cos2(qi - q2) cvicos(qi - q2)

- +

q4 =

av2 + acq32 sin(qi - q2) ab - c2 cos2(qi - q2)

cvi cos(qi - q2) ab - c2 cos2(qi - q2)

,22

- +

1 c q4sin[2(qi - q2)]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

н----2-2-,

2 ab - c cos (qi - q2)

с соответствующими начальными условиями.

2. Задача предельного быстродействия

В настоящей работе на основе приведенной выше математической модели манипулятора решается задача возвращения схвата на базовую траекторию за наименьшее время с использованием дополнительного управления u (•). Относительно управляющих параметров u предполагается, что они стеснены геометрическими ограничениями

u е P =

Ги^

Vu2 У

е R2

2 2 2 ui + u2 < а

Следуя статье [2], опишем алгоритм построения оптимального по быстродействию управления для системы (1.4). Для начального

}4

ab - c cos (qi - q2)

1 q42sin[2(qi - q2)]

+----2-2-

2 ab - c cos (qi - q2) ,

а q*: [t0, T] ^ R2 - закон изменения вектора

обобщенных координат манипулятора, отвечающий базовому кинематическому закону движения схвата. Движение реального механизма можно получить, проинтегрировав систему дифференциальных уравнений

qi = Чз,

q2 = q^

положения |t, х} е [t0, T]х R4 полагаем s (t, x,T) = max |0, max(X '[T, t]l,

T

+J min( X '[T ,t] l, B (t) u)rfr

x +

(2i)

Здесь S(4) =

ir l л

12 13 е R4 t12 = i i=i

V l4 у

^/3 =

b (v* (t)+ui0 (t))- bcq4 sin(qi- q2)

ab - c2 cos2(qi - q2)

- c ( У*(t)+u20 (t)) cos(qi - q2) -

ab - c2 cos2 (qi - q2)

1 ^ c2q3 sin[2(qi - q2)]

2 ab - c2cos2(qi - q2)'

X[7,т] — фундаментальная матрица Коши

для однородной системы дифференциальных уравнений х = Л (7)х. Функция е называется гипотетическим рассогласованием. Ее геометрический смысл состоит в том, что величина е( t, х,Т) представляет собой расстояние от области достижимости динамического объекта из начальной позиции (7, х) в конечный

момент времени Т до начала координат. Известно [5], что в области е( 7, х,Т )> 0 максимум в правой части равенства (2.1) достигает-(1.5) ся на единственном векторе 10 (7, х,Т)е ^,

q=q (t),v=v (t)

функция гипотетического рассогласования является непрерывно дифференцируемой функцией аргументов ^, х), а ее частные производные вычисляются по формулам

д£0

(t, х) = А (t) х, ^^ - тт(В (t) и, s

dt

es0_

dx

(t, x ) = 50,

где s0 = X'[Т,t]10 (t,х,Т) .

Допустимое программное управление и0 (•) , переводящее фазовый вектор в ту точку области достижимости, расстояние от которой до начала координат равно £ (t, х, Т) > 0 , удовлетворяет условию

^В(t)и0 (t)) = 1Шп(sВ(t)и),

t е [^о, Т]. (2.2)

Решение задачи быстродействия сводится к построению монотонно возрастающей последовательности

Т }, Т > to, к = 1,2, —, £ (и х, Тк 0,

удовлетворяющей условию £ [Тк ] > 0 . При

вычислении значений £ [Тк ], к = 1,2,— по

формуле (2.1) приходится решать задачу математического программирования максимизации строго вогнутой, положительно однородной функции на единичной сфере. Данная задача осложнена наличием определенных интегралов в выражении для целевой функции, которые не берутся аналитически. При практической реализации алгоритма процесс построения членов последовательности \Тк }, к = 1,2, — следует остановить, когда

удается подобрать такое число Т, для которого £ [Т] = 0 и Т- Тк < /, где р > 0 параметр точности. В этом случае Т0 е[Тк,Т„), а за оптимальное программное управление принимается функция и0 (•), найденная из условия (2.2).

Время перехода Т0 можно улучшить, если применить позиционную процедуру

управления. С этой целью промежуток Т] разбивается на полуинтервалы

[^,'^+1) , i = 0,1" ■, k, Т0 = t0, = T, < Я .

На полуинтервале [т0,т) управление u(0)Q строится так, как это описано выше. Пусть х(0) (t) - решение системы дифференциальных уравнений (1.5), где в качестве дополнительного управления применяется u(0) (•) .

Далее полагается х(1) = lim х(0) (т) . На полуинтервале [т0,т1) управление u(1)Q строится так же, как u(0) (•), с той лишь разницей, что в качестве начальной позиции здесь бе-

f (!)) рется позиция т,xw > и т. д.

3. Численный эксперимент

Принимаем, что массово-геометрические характеристики манипулятора, а также время процесса, кинематический закон движения схвата и его начальное смещение совпадают с аналогичными параметрами из статей [3], [4]. Тогда

т = т1 = т2 = 1кг, 11 = 12 = 1 м, t0 = 0, Т = 1сек, Y = — cos X +1, 3 = 0,000001сек,

4

х1(0) = 1,21 • 10-1 рад, х2(0) = 0.53 •Ю-1 рад,

х3(0) = 0 Р0*., х-4(0) = 0 Ра*.

сек сек

Ограничение на управление имеет вид

Г и \

и =

и

е P =

VU 2 J

е R2

VU 2 J

и2 + и2 < 5 }•.

В принятых предположениях решается задача быстродействия по алгоритму, описанному в пункте 2. Величина гипотетического рассогласования здесь вычисляется по формуле

£[0, х[0], T ] = max [(X [T, 0]х0, l) +

T

| mm[u< (т, l) + u2<2 (т, l)]dz iax [(X [T, 0]х0, l) -

5^<2(т, l) + <22(т, l) dz

+

= max|

T

где выражения р1(т, I), р2(т, I) представляют собой известные функции элементов фундаментальной матрицы Коши X[Т,т].

Построим последовательность Т }, Т > 70, к = 1,2,-, е( 7, х, Тк 0.

Имеем Т1 = 0, Т2 = 0.1,..., Тк—2 = 0.4179239, Тк—1 = 0.417924, Тк = 0.4179241, где Тк—2 — Тк < 3 . Тогда

оптимальное время перехода Т0 = 0.417924.

Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле

'_ <Р1(т,10) Л

м0(7) = ^ (7,10, Т0) = —5

>12(т, 10) + 10)

7 е [70,Т0].

(3.1)

Эффективность найденного дополнительного программного управления (3.1) проверяется путем подстановки его в исходные нелинейные дифференциальные уравнения движения (1.5) и интегрирования их с выбранными смещенными начальными условиями. Численно показано, что в результате

схват в момент времени Т0 выходит на базовую траекторию и продолжает движение вдоль нее после выключения дополнительных управлений.

На рис. 2 приводится базовая траектория движения схвата манипулятора и его траектория, полученная в результате решения задачи быстродействия в классе программных управлений.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 2. Траектория движения схвата: 1 -движение схвата после его возвращения на базовую траекторию; 2 - оптимальная траектория схвата, отвечающая времени

перевода Т0 = 0.417924; 3 - базовая траектория движения схвата

В момент времени Т0 = 0.417924 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно

ЩТ0) = 0,54 • 10—2 рад, Л?2 (Т0) = 0,27 -10—2 рад

А^Т0) = 3,3-10—2 , А/ДТ0) = 1,04-10—2

сек сек

В момент времени 7 = 1 эта разность составляет

Ад1 (1) = 0,22 -10—2 рад, Лд2 (1) = 0,24 -10—2 рад

Ад3 (1) = 0,32-10

—2 рад

сек

Лд4(1) = 0,2 -10

—2 рад

сек

Далее решается задача быстродействия по схеме позиционного управления. В таблице приведены результаты решений задач быстродействия на различных участках разбиения промежутка [70, Т ].

Оптимальное время перехода при позиционном управлении

[Т Тг+1) Т о

[0;0,1) 0,417924

[0,1;0,2) 0,417457

[0,2;0,3) 0,416732

[0,3;0,416011) 0,416011

На рис.3 представлены траектории движения схвата манипулятора, получающиеся в результате позиционного управления манипулятором.

Рис. 3. Траектория движения схвата: 1 -движение схвата после его возвращения на базовую траекторию; 2 - оптимальная траектория схвата, отвечающая времени

перевода Т0 = 0.416011; 3 - базовая траектория движения схвата

В момент времени Т0 = 0.416011 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно

х1(Т0) = 0,38 • 10-4рад,х2(Т0) = 0,12 • 10-4рад,

х3(Т0) = 4,48 -10-3 , х4 (Т0) = 7,35 -10-3 ^ сек сек .

В момент времени / = 1 эта разность составляет

х1 (1) = 0,25 • 10 3 рад, х2 (1) = 0,11 • 10 3 рад

х3(1) = 0,93• 10-3 ^,Х4(1) = 0,18•Ю-3 ^ сек сек

Заключение

В статье показано, что программное управление, решающее задачу предельного быстродействия для линеаризованной модели, приемлемо для решения задачи о наибыстрейшем возвращении схвата манипулятора на базовую траекторию. Сравнивая качество программного и позиционного управлений, построенных в работе, можно отметить, что при позиционном управлении схват с большей точностью попадает на заданную траек-

торию, а время перехода при этом меньше,

чем в случае программного управления.

Список литературы

1. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.

2. Лутманов С.В., Стрелкова Н.А. Оптимальное по быстродействию управление поступательным перемещением твердого тела // Вестник Пермского университета. Сер. Математика. Механика. Информатика. 2010. Вып. 1 (1). С.50-57.

3. Куксенок Л.В., Лутманов С.В. Управление движением плоского двухзвенного манипулятора по критерию "минимум энергии" // Проблемы механики и управления: меж-вуз. сб. науч. тр. Пермь, 2012. С. 33-41.

4. Куксенок Л.В., Лутманов С.В. Управление движением плоского двухзвенного манипулятора по критерию "минимум силы" // Проблемы механики и управления: меж-вуз. сб. науч. тр. Пермь, 2013. Вып. 45. С. 20-29.

5. Лутманов С.В. Вариационное исчисление и теория оптимального управления в примерах и упражнениях: учеб. пособие / Перм. гос. ун-т. Пермь, 2010. 200 с.

Solution of task of maximum fast-acting of control by motion of the flat double-hinged arm

L. V. Kuksyonok, S. V. Lutmanov

Perm State University, Russia, 614990, Perm, Bukirev st., 15 [email protected]; (342) 239 63 09

The mathematical model of the flat double-hinged arm is built and investigated with two rotatory kinematics pairs. In supposition, that in initial moment the gripper of manipulator does not lie on a base trajectory, a task decides about optimal in sense of maximum fast-acting of return him on the indicated trajectory.

Key words: manipulator; mathematical model; optimal control; maximum fast-acting.

i Надоели баннеры? Вы всегда можете отключить рекламу.