УДК 621.865.8
АДАПТИВНОЕ УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ С УПРУГИМИ ЗВЕНЬЯМИ
© 2009 г. Саад Загхлюл С. Ал-Кхаиит
Южно-Российский государственный South-Russian State Technical University
технический университет (Novocherkassk Polytechnic Institute)
(Новочеркасский политехнический институт)
Рассматривается вопрос построения и реализации системы управления траекторией манипулятора с упругими звеньями, в архитектуре которой используется адаптивная нейронная сеть. Для моделирования упругости руки робота используется метод конечных элементов. Адаптивное управление применено для движения по заданной траектории с демпфированием вибраций. Система управления состоит из пропорционально-дифференциального (ПД) регулятора, который должен обеспечивать устойчивость системы, и адаптивной нейронной сети с обратной связью, которая контролирует отклонение от заданной траектории путём расчёта крутящего момента в шарнире, позиционирующего рабочий орган многозвенного универсального робота. Результаты моделирования демонстрируют эффективность системы управления с учётом гравитации и её способность демпфировать вибрации рабочего органа робота как во время отслеживания траектории, так и после достижения заданной позиции.
Ключевые слова: упругий робот-манипулятор, метод конечных элементов, нейронная сеть, адаптивное управление, отслеживание траектории.
This paper is concerned with the design and implementation of trajectory tracking controller for flexible-link manipulator based on adaptive neural network. The finite element model is used to model the elastic behavior of the robot's arm. Adaptive control structure is used to track the desired trajectory and dampen the end-point vibration. It is consisted from PD controller to stabilize the system and neural network with feedback error on-line learning scheme to control the elastic deflection by computing the joints torque that position the end effecter of multi-link flexible robot along prescribed trajectory. Simulation's results show the effectiveness of the control scheme when gravitational force exists and how it is succeeded in reducing the end-point vibration during trajectory tracking and after reaching the desired position.
Keywords: flexible robot manipulator, finite element method, neural network, adaptive controller, trajectory tracking.
Введение
Гибкие роботы-манипуляторы демонстрируют множество преимуществ по сравнению с жёсткими роботами-манипуляторами: на их изготовление требуется меньше материала; у них меньше вес; они потребляют меньше энергии; нуждаются в приводах (исполнительных механизмах) меньшего размера; имеют более высокую грузоподъемность на единицу массы (весовой коэффициент робота). Однако при обеспечении точности позиционирования возникают проблемы, обусловленные упругостью системы, ведущие к вибрации, а также трудности получения точной модели системы и минимальных фазовых характеристик системы [1]. Если не отказываться от преимуществ, связанных с облегченной массой робота, нужно разрабатывать точные модели и эффективные системы управления.
Уже существуют ранее разработанные методы моделирования гибких манипуляторов. Их можно разделить на две главные категории: метод расчетных режимов (МРР) и метод численного анализа. Метод расчётных режимов касается получения приближённых режимов путём решения дифференциального уравнения с частными производными, характеризующего динамическое поведение системы. При использовании этого подхода, с помощью специально разра-
ботанного численного метода [2] демпфирования вибрации гибкого робота, решается обратная задача кинематики. Метод управления на конечной стадии движения робота-манипулятора, в котором применяется пропорционально-интегрально-дифференциальное (ПИД) регулирование, описан в [3]. Также на основе МРР была предложена нейронная сеть с нечеткой логикой для позиционного регулирования упругого манипулятора робота [4]. Но в той работе рассматривался однозвенный манипулятор (манипулятор только с одним звеном).
К методам численного анализа относятся: метод конечных разностей (КР) и метод конечных элементов (КЭ). Метод КЭ использован в [5, 6] для моделирования специального гибкого двухзвенного манипулятора, в котором сочетались метод малых возмущений и регуляторы с нечеткой логикой, соответственно [5, 6]. Эти исследования показали, что можно использовать метод КЭ для хорошей репрезентации системы.
Моделирование и экспериментальные результаты характеристик гибкого манипулятора были представлены в работе [7]. Известно, что МРР не всегда даёт представление о мелких деталях системы, в то время как при использовании метода КЭ достаточно одного элемента, чтобы довольно хорошо описать динамическое поведение (динамические характеристики) гибкого манипулятора.
В данной работе крайне нелинейные динамические характеристики гибкого манипулятора робота анализируются с помощью метода КЭ. Формулировка задачи включает в себя все нелинейные эффекты Ко-риолиса и центробежные эффекты, а также гравитационную силу. Предлагается структура системы управления, в которой используется пропорционально-дифференциальный (ПД) регулятор, а адаптивную нейронную сеть (НС) обучают в оперативном режиме (в режиме реального времени) управлять упругим отклонением и компенсировать нелинейности системы.
Уравнения движения отдельного звена
Отдельное гибкое звено, изображённое на рис. 1 а, представляет часть плоского многозвенного манипулятора с общей длиной I, массой на единицу длины т , моментом инерции I, площадью сечения А, модулем Юнга (модулем упругости) Е, модулем сдвига G и коэффициентом сдвига у [8]. Масса груза величиной Ыг сосредоточена в схвате, а момент инерции шарнира Iш - в другом конце. Центр шарнира совпадает с центром привода. Тш - неизвестный крутящий момент, возникающий в шарнире. Я/у, R х и Tt - это силы реакции и крутящий момент конца следующего звена. Подстрочные индексы Ш и t обозначают соответственно «шарнир» и «схват». Точка Р, расположенная на расстоянии х от центра шарнира, подверглась упругим деформациям, имеющим значения их и иу , и вращению 9. Их значения определяются относительно номинального положения, характеризуемого движущейся рамой основания робота (е^), е2(0), соединённой с шарниром, который вращается с заданной (номинальной) угловой скоростью и ускорением 6 ш и 0 ш соответственно (рис. 1 а).
К»
Як
e2 г ih
Uy(l)
6(0
их{Г)
б
Рис. 1. Манипулятор с гибким звеном: а - движение с жестким звеном (пунктирная линия) и с наличием упругой деформации (сплошная линия); б - разделение по методу конечных элементов для гибкого звена
Используя теорию расчёта балки Тимошенко, в которой учитывается влияние деформации сдвига и вращательной инерции, можно применить принцип возможных перемещений, чтобы непосредственно вывести уравнения движения.
Затем область перемещения можно подвергнуть дискретизации, используя метод конечных элементов в безосевых граничных условиях (рис. 1б). Следуя стандартным процедурам образования и сбора матриц элементов, уравнения движения звена можно выразить системой дифференциальных уравнений по времени в форме
М V + [ С + Сс (0„)] V + [К + кс ф„ ,0ш) ] V = /(ёй ,6ш),
где М и К - это стандартные матрицы массы и жёсткости конечного элемента, соответственно; Сс и Кс -меняющиеся во времени матрицы Кориолиса и центробежной жёсткости. Для представления внутреннего вязкого демпфирования материала добавлена матрица С. Вектор / содержит реакции связей и вращающие моменты в шарнире и на конце звена, а также известные силы, обусловленные вращением. Если учитывается гравитационный эффект, его также можно включить в / [9]. Вектор V содержит 9Ш и внутренние упругие степени свободы. Для дополнительной информации о вышеуказанных матрицах смотреть [8, 9].
В этой работе вращающий момент в шарнирах вычислен адаптивной нейронной сетью, чтобы достичь заданной траектории перемещения.
Нейросеть с радиальной базисной функцией (НС-РБФ)
Радиальная базисная функция с функциями Гаусса имеет хорошую локальную интерполяционную функцию и степень обобщенности, поэтому их широко используют в качестве основы нейросетей для идентификации и регулирования нелинейных систем [10]. В случае с базисной функцией Гаусса выход нейросе-ти с радиальной базисной функцией с числом нейронов N выражается уравнением
N
ЯX, j) = exp
z=1
II II 2
— IX -mI
j = [w 0
■W ,
H1.....H N
, CT,
■.CT N L
где м>, о - совокупность параметров активационной функции Гаусса, а || || обозначает Евклидову норму.
Входной вектор - это х, а у состоит из ряда параметров, которые должны регулироваться обучающим алгоритмом. На рис. 2 изображена схема этой нейросети.
Радиальный Линейный базисный слой
слои
Рис. 2. Схема нейросети с радиальной базисной функцией (НС-РБФ)
х
а
6
h
Сеть с ресурсным распределением (СРР)
Главная проблема радиальной базисной функции (РБФ) заключается в том, что общее количество нейронов значительно растёт в зависимости от размерности входа. Это становится особенно важно, когда используются НС-РБФ большой размерности в решении задач в реальном времени. Чтобы избежать проблем размерности, имеющих место в стандартных РБФ, Платт [11] предложил последовательный метод обучения НС-РБФ, где особое значение имеют такие факторы, как быстрое обучение, хорошая обобщенность и компактная форма. Разработанная в результате архитектура получила название сеть с ресурсным распределением (СРР) и оказалась применимой для моделирования нестационарных технологических процессов в режиме реального времени. Обучающий алгоритм СРР представлен следующим образом:
- критерий оценки текущих погрешностей, где погрешность должна быть больше, чем пороговая величина
e(k) = уф) - уф) > El ,
здесь у(к) - это функция, подлежащая аппроксимации нейронной сетью в момент времени к;
- нововведенный критерий
N
М|) -ц г ф)|| > E2,
'=1
где ближайшее межцентровое расстояние должно быть больше, чем пороговая величина;
- средняя (основная) погрешность должна быть больше пороговой величины
1 Т
-Е [y(k -Т+О -уф -Т+')] > Ез ,
Т '=0
где Т - период времени.
Когда удовлетворяются все три критерия, к сети добавляется новый нейрон (N+1); этому новому нейрону присваиваются следующие начальные значения центра, ширины и веса соответственно:
-Ц N+1^) = хф) ;
N
-ст N+1 = "к ^ х^) - ц(k) ;
1 =1
N+1 ^) = еф) = у^) - у ф),
где X - это постоянная, называемая перекрывающийся фактор (коэффициент перекрытия).
Когда один из критериев (или более) не удовлетворяется или максимально разрешенное количество нейронов достигнуто, вектор ]ф), содержащий регулирующие параметры НС-РБФ, корректируется при помощи следующего соотношения
5 у^)
j(k +1) = j(k) -л-
11]:
e(k),
неизменными, в то время как параметры обновляются по принципу «победитель получает всё» (следуя алго-ритму-«победителю»). На практике обновляются параметры только самого активного нейрона, а все другие остаются неизменными. Этот принцип предполагает значительное сокращение количества параметров, которые потребуется обновлять в процессе работы, и по этой причине его использование особенно целесообразно в режиме работы в реальном времени.
Обучение нейросети с использованием сигнала обратной связи
Адаптивное управление можно осуществить, используя для обучения нейросети сигнал обратной связи. Этот метод широко используется для управления системами с неопределённой или неизвестной динамикой. В структуре этого метода контрольное (заданное) значение (х1) и выход системы (х1) принимаются как входы НС для того, чтобы обучать инверсно-динамическую модель систем управления [13]. Цель управления - минимизировать погрешность (е), которую определяют как разницу между контрольным (заданным) (х^1) и выходным значением системы (х1). На рис. 3 видно, что общий управляющий сигнал (и), который будет использоваться в системе, становится суммой выхода традиционного контроллера (ис) и выхода нейросети (иш): и = ис + иш .
В этом методе обучения используется выход традиционного контроллера с обратной связью для вычисления погрешности на выходе нейросети. Когда выход традиционного контроллера становится равным нулю, погрешность тоже равна нулю. Следовательно, цель управления достигнута.
5 j(k)
где п - это скорость обучения.
В дальнейшем вышеописанный алгоритм был усовершенствован [12]. Механизмы роста и упрощения (увеличения и уменьшения) нейросети остаются
Рис. 3. Схема обучения нейросети с использованием сигнала обратной связи
Управление гибким звеном
В общем трудно осуществить управление гибкими манипуляторами для достижения и сохранения точного местоположения, поэтому в научных работах представлено много методов управления. Отклонение концевой точки (схвата) гибкого звена является важным параметром управления, помогающим добиться гладкой траектории [2]. Джнифене и др. [14] использовали тензодатчики для измерения упругого отклонения вибрирующего звена. Затем это отклонение использовали как ошибку ввода (погрешность по
входу) в системе управления с нечеткой логикой с целью уменьшения вибрации схвата манипулятора в ответ на ступенчатое входное воздействие.
В данной работе предлагается использовать ошибку полного перемещения схвата при вычислении и формировании пропорционального коэффицинта ПД-регулятора. Дифференциальный коэффициент ПД-регулятора определен по разнице погрешностей между заданной скоростью шарнира (0 ^ ) и реальной
скоростью шарнира (0 ш) (рис. 4). Использование скорости шарнира поддержит устойчивость предлагаемой управляющей схемы, потому что звено прикреплено к шарниру.
Контроллер нейросети
\г
Рис. 4. Схема управления робота с гибким звеном
С учётом линейных перемещений полное перемещение у(х^) на расстояние х от центра шарнира можно представить как функцию обоих движений: движения жёсткого манипулятора и нормального упругого отклонения иу(х,{), как в [7]
у(х, t) = I ёш ^) + иу (х, t),
где заданное полное перемещение конца звена определено как
У"г = I ё Ш ^) .
Для управления концом звена упругого робота в работе [15] предлагается отклонить конец звена в обратную сторону. Дело в том, что стабилизирующий
контроллер демпфирует вибрации и иу(1,0^0 при ^ю. Следовательно, в предлагаемой системе управления полное перемещение конца звена имеет вид:
Уг = I ё ш (0 - и у (I, 0.
Результаты моделирования
Имитационная модель звена робота в процессе моделирования состоит из пяти элементов. Сначала испытанию подвергается манипулятор Шеффилда [7]. Однозвенный гибкий манипулятор построен с использованием алюминиевого сплава, длина балки I = 0,9 м; А=0,608-10"5 м2; 1=5,253-10-11 м4; !ш=5,859-10"4 кг-м2; р=2710 кг/м3; Е=7,1Ь109 Н/м2; у=5/6. Для стабилизации системы решено использовать следующие коэффициенты усиления ПД-регулятора: для управления по шарниру Кп = 3,5 и Кд = 1,0; а для управления по схвату Кп = 0,35 и Кд = 0,08. Параметры нейронной сети показаны в таблице.
На рис. 5 показаны в сравнении полное перемещение концевой точки от заданной ступенчатой траектории, полученное при помощи предложенного регулятора, и отклонение от той траектории, которая возникает в результате регулирования шарнира. В случае регулирования шарнира в концевой точке при движении возникает сильная вибрация. Такая ситуация складывается при работе жёсткого манипулятора, а предложенный регулятор способен минимизировать вибрацию во время движения по траектории и после достижения целевой точки движения.
Вторым испытанием предложенной системы управления является исследование реакции на заданную синусоидальную траекторию в присутствии гравитационной силы. Моделируемый робот-манипулятор состоит из двух гибких звеньев и двух вращательных сочленений, приводимых в движение непосредственно серводвигателями [16].
Звенья изготовлены из алюминия и имеют следующие характеристики:
- первое звено: L=0,66 м ; А= 2,5401 10 4 м2; 1=2,116710-9 м4 ; М =1,049 кг; 1ш=0,0011823 кг-м2';
- второе звено: L=0,66 м ; А= 0,5842-10"4 м2; !=2,5753-10-11 м4 ; М =0,0248 кг; 1ш=0,00048 кг-м2.
Обновленные параметры нейросети
Параметр Уровень Описание
Число входов Ni 4 Заданные и реальные величины положения и скорости звеньев
Число выходов N0 1 Аппроксимация выхода
Максимальное количество нейронов ^ах 5 Ограничение для роста нейросети
Настройка радиусов 5 Ограничения для скорректированных нейронов
[ П^ По Пц ] [0,05 0,05 0,05] Скорость обучения для весов, ширин и центров
[Е1 Е2 Е3] [0,1 0,2 0,1] Ограничения (пределы) для трех условий критерия роста
X 6,4 Коэффициент перекрытия функции активации
Поперечное сечение звена получено при условии, что рука робота ведёт себя жёстко в горизонтальном направлении и гибко в вертикальном направлении. Для стабилизации системы используются следующие коэффициенты усиления ПД-регулятора: для управле-
ния по шарниру Кп=[0,45 0; 0 0,45] и Кд=[0,1 0; 0 0,10], а для управления по схвату Кп=[0,95 0; 0 0,65] и Кд=[0,05 0; 0 0,07]. Параметры НС те же самые, что в таблице: Ni =8 и N0 =2. На рис. 6, 7 показано полное перемещение концевой точки для обоих звеньев.
у, м 0,8 0,6 0,4 0,2 0 -0,2
^^^WmWWmWWW^
м f - Заданная траектория .....Управление по шарширу
fi
МНЬЦ А?
y, м 0,8 0,6 0,4 0,2 0 -0,2
12
16
12
16
Время , с
Время, с б
Рис. 5. Перемещение конечной точки манипулятора с учетом сил тяжести и со ступенчатым возбуждающим сигналом:
а - управление по шарниру; б - управление по схвату
у, м
y, м
0,5
-0,5
-1,0
-Заданная траектория Управление по шарниру
г '! 1 '1 /'
1 ji Ч!!:'
10
Время, с
15
20
0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 -0,8
-Заданная траектория
..........Управление по схвату
10
Время, с б
15
20
Рис. 6. Перемещение конца первого звена с учетом сил тяжести и синусоидальным возбуждающим сигналом:
а - управление по шарниру; б - управление по схвату
y, м 0,8 0,6 04 0,2 0 -0,2 -0,41 -0,(5 -0,8
Заданная траектория Управление по шарниру
У, м 0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 -0,8
- Заданная траектория ' Управление по схвату
5 10 15
Время, с
а б
Рис. 7. Перемещение конца второго звена с учетом сил тяжести и синусоидальным возбуждающим сигналом: а - управление по шарниру; б - управление по схвату
а
0
0
5
0
5
а
В начале движения возникает вибрация, потому что НС ещё не обучена. Отмечается сильная вибрация на первом звене из-за воздействия первого двигателя и реакции на работу второго. В начале движения второго звена также наблюдается большая погрешность при отслеживании траектории, но через 2 с достигается требуемая точность движения.
Выводы
Гравитационная сила вызывает значительный изгиб манипулятора с гибкими звеньями. Нейронная сеть с радиальной базисной функцией имеет динамическую структуру благодаря стратегии упрощения, поэтому она стремится к заданной цели, что делает её подходящей для обучения в режиме реального времени. Использование НС с алгоритмом обучения и обнаружения ошибки в режиме реального времени улучшает работу системы с точки зрения повышения точности движения по заданной траектории.
Моделирование ситуаций для гибкой руки показали эффективность предложенной схемы управления. Использование полного перемещения схвата (уг) и скорости шарнира в управляющей системе привело к значительному снижению вибрации на концевой точке гибкого многозвенного робота манипулятора. Использование различных значений для параметров ПД-регулятора и сочетание ПД-регулятора с НС улучшают отслеживание траектории и контролирование вибрации на концевой точке упругого манипулятора во время движения и после достижения заданной позиции. Ошибка положения конца звена (схвата) в предложенной системе управления для манипулятора Шеффилда снизилась до 6,8 мкм при учете гравитационной силы, в то время как для упругого двухзвен-ного манипулятора ошибка снизилась до 14,4 мкм и 9,8 мкм для обоих звеньев соответственно.
Важной особенностью предложенной схемы управления является то, что не только отслеживается траектория, но и минимизируются колебания. Таким образом, в целом движение системы не отличается от движения системы с жесткими звеньями.
Литература
1. Modelling and Control of Flexible Manipulators - Revisited / J. C. Piedboeuf, M. Farooq, M.M. Bayoumi, G. Labinaz, M.B. Argoun // Proc. 36th Midwest Symp. on Circuits and systems. Detroit, 1993. P. 1480-1483.
Поступила в редакцию
2. Лукьянов А.А. Отслеживание траектории пространственными гибкими манипуляторами с помощью решения обратной задачи кинематики и гашения колебаний // Меха-троника, автоматизация, управление. 2004. № 11. С. 23-29.
3. Санкин Ю.Н., Барахов В.М. Математическое моделирование и управление манипуляторами как стержневыми системами переменной конфигурации // Вестн. машиностроения. Ульяновск, 2007. № 3. С. 28-33.
4. Yeon Gyu Choo, Han Ho Tack, Chang Geun Kim. The Study on Position Control of a Flexible Robot Manipulator using Fuzzy Neural Networks // Third International Conference on Knowlege-Based Intelligent Information Engineering Systems. Adelaide, Australia, 1999. P. 226-229.
5. Aarts R.G.K.M., Jonker J.B., Waiboer R.R. Modelling and
Efficient Dynamic Simulation of Flexible Link Manipulators // Proc. Of WESIC 2001, University of Twente, The Netherlands, 27-29 June 2001. P. 413-422.
6. Green A., Sasiadek J.Z. Dynamic and Trajectory Tracking Control of a Two-Link Robot Manipulator // Journal of Vibration and Control. 2004. № 10. P. 1415-1440.
7. Approaches for Dynamic Modelling of Flexible Manipulator
Systems / J. M. Martins, Z. Mohamed, M.O. Tokhi, J. Sa'da Costa, M. A. Botto // IEEE Proc. Control Theory Appl. 2003. Vol. 150, № 4. P. 401-411.
8. García J., de Jalón, Bayo E. Kinematic and Dynamic Simulation of Multibody Systems. The Real-Time Challenge. New York, 1994.
9. Naganathan G., Soni A.H. Coupling Effects of Kinematics and Flexibility in Manipulators // International Journal of Robotics Research. 1987. Vol. 6, № 1. P. 75-85.
10. Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6 / под общ. ред. В.Г. Потемкина. М., 2002.
11. Platt J.C. A Resource Allocation Network for Function Interpolation // Neural Computation. 1991. Vol. 3, № 2. P. 213-225.
12. Lu Y., Sundararajan N., Saratchandran P. Analysis of Minimal Radial Basis Function Network Algorithm for Realtime identification of nonlinear dynamic systems // IEEE Proceedings on Control Theory and Application. 2000. Vol. 4, № 147. P. 476-484.
13. Chen H., Hirasawa K., Hu J. Robust Feedback Error Learning Method for Controller Design of Nonlinear Systems // IEEE International Conference on Neural Networks. 2004. P. 1835-1840.
14. Jnifene A., Andrews W.R. Experimental Study on Active Vibration Control of a Single-Link Flexible Manipulator Using Tools of Fuzzy Logic and Neural Network // IEEE Transactions on Instrumentation and Measurement. 2005. Vol. 54, № 3. P. 1200-1208.
15. Neto A., Neto W. Feedback Error Learning for Controlling a Flexible Link // Sixth Brazilian Symposium on Neural Networks, 2000. P. 273-278.
16. Bayo E. Computed Torque for The Position control of Open-Chain Flexible Robots // IEEE International Conference on Robotics and Automation. 1988. Vol. 1. P. 316-321.
30 сентября 2008 г.
Саад Загхлюл С. Ал-Кхаиит - аспирант кафедры автоматизации производства, робототехники и мехатроники Южно-Российского государственного технического университета (Новочеркасского политехнического института).
Saad Zaghlul S. Al-Khayyt - post-gaduante student of departament of automatic production, robot-technique and mechatronic of South-Russian State Technical University (Novocherkassk Polytechnic Institute).