УДК 621.865.8
МЕТОД НЕЙРОСЕТЕВОГО УПРАВЛЕНИЯ МАНИПУЛЯЦИОННЫМИ СИСТЕМАМИ С УПРУГИМИ ЗВЕНЬЯМИ
© 2009 г. Саад Загхлюл Саид Аль-Кхаиит
Южно-Российский государственный South-Russian State
технический университет Technical University
(Новочеркасский политехнический институт) (Novocherkassk Polytechnic Institute)
Представлен метод построения системы управления траекторией манипулятора с упругими звеньями. Система управления движением каждого звена состоит из пропорционально-дифференциального регулятора и нейронной сети. Нейронная сеть обучается в режиме реального времени. Результаты моделирования демонстрируют эффективность системы управления и её способность демпфировать колебания рабочего органа робота.
Ключевые слова: упругий робот-манипулятор; метод конечных элементов; нейронная сеть; адаптивное управление; отслеживание траектории.
The method of the building control system for trajectory of manipulator with flexible links is presented. The controller for each link is consisted from proportional-differential regulator and neural network. The neural network is trained in real time regime. The Results of modeling had shown the effectiveness of the control system and its ability to damp vibrations of working robot's arm.
Keywords: flexible robot manipulator; finite element method; neural network; adaptive control; trajectory tracking.
Введение
Роботы-манипуляторы становятся постепенно неотъемлемой частью оборудования и технологической оснастки в различных отраслях промышленного производства, сферы услуг.
Исследования динамики и кинематики современных промышленных роботов основаны на предположении, что звенья манипуляторов являются абсолютно твердыми телами [1]. Уменьшение массы конструкции манипулятора за счет использования облегченных упругих звеньев является источником ряда негативных факторов. Упругие прогибы от действия внешних сил и сил тяжести, а также колебания звеньев, возникающие при движении вследствие инерционных, центробежных и кориолисовых сил, не позволяют точно переместить рабочий орган в заданную точку пространства или приложить к объекту манипулирования, увеличивают время переходного процесса при движении рабочего органа из одной точки в другую. В результате управляемость и быстродействие упругого манипулятора значительно снижаются [2].
Для решения проблемы управления манипуляци-онными системами с упругими звеньями с необходимой точностью целесообразно использовать адаптивные системы с интеллектуальными регуляторами, строящимися на базе нейронных систем.
В данной статье предлагается структура системы управления, в которой для каждого звена используется пропорционально-дифференциальный регулятор, а нейронная сеть (НС) обучается в режиме реального времени, что позволяет управлять упругим отклонением и компенсировать нелинейности системы.
Нейросеть с радиальной базисной функцией
Наиболее распространённой архитектурой НС, применяемой в нелинейном управлении, является нейросеть с радиальной базисной функцией (РБФ НС). Использование нейросети для систем управления по отклонению с алгоритмом обучения методом обратного распространения ошибки имеет проблемы с точками экстремума, а сам алгоритм отличается невысокой скоростью сходимости. Таким образом, его использование ограничивается применениями, не связанными с обучением в режиме реального времени. В этой связи интерес представляют нейросети с радиальной базисной функцией и функцией активации Гаусса, широко используемые в нелинейном управлении в качестве базовой структуры нейросетей благодаря их хорошей способности к обобщению и простой структуры сети, что избавляет от длинных и избыточных вычислений. РБФ НС с обучающим алгоритмом используется при этом для компенсации существенных нелинейностей (трение и сила тяжести) для обеспечения компактности структуры сети и быстрой сходимости, необходимой для применения в процессе обучения в режиме реального времени [3].
На рис. 1 изображена структура этой нейросети. В случае использования активационной функции Гаусса выход нейросети с радиальной базисной функцией выражается уравнением
£(x,j) = woZ exp
-1
~2~
x "h
где ] = [^о ... wN, ц ... ••• оМ - вектор, регули-
рующийся обучающим алгоритмом; w, ц, о - параметры функции Гаусса - вес, центр и смещение соот-вественно; N - количество нейронов; x - входной вектор.
2
Радиальный Линейный базисный слой слой
Рис. 1. Структура нейросети с радиальной базисной функцией (НС-РБФ)
Для того чтобы избежать проблем, возникающих из-за большого количества нейронов, имеющих место в стандартных базисных сетях, Платт [4] предложил использовать последовательный обучающий алгоритм для нейросети. В дальнейшем он был усовершенствован [5]. Механизмы расширения и сужения нейросети остаются неизменными, при этом обновляются параметры только самого активного нейрона, а все другие остаются неизменными. По этой причине его использование является особенно целесообразным при работе в режиме реального времени.
Метод управления манипулятором с упругими звеньями
Адаптивное управление манипулятором с упругими звеньями можно осуществить, используя для обучения нейросети сигнал обратной связи. Для вычисления погрешности на выходе нейросети в этом методе обучения используется выход типового ПД-регу-лятора с обратной связью. Заданное значение регулируемого параметра и выход системы принимаются как входы НС, что дает возможность осуществлять обучение инверсно-динамической модели системы управления [6]. Общий управляющий сигнал (и), использованный в системе, является суммой выхода типового регулятора (ис) и выхода нейросети (и^И): и - ис + иш .
В данной работе предлагается использовать ошибку полного перемещения схвата в обратной связи на входе ПД-регулятора (рис. 2). Полное перемещение у(х, 0 на расстоянии х от центра шарнира можно представить как функцию движения жёсткого манипулятора 9^(0 и нормального упругого отклонения иу(х,0 в виде у(х^) -19к ) + иу (х, /).
Проблема возникает, когда требуется повысить точность модели, что связано с необходимостью увеличения значения степени уравнения, описывающего движение.
К К
Он
о
ё
CD
03 £
<D
К
и
CD
о
е-
о О
С
Уге/
У Hl $2
нс\
Um
е2 ПД ис +
) ^
VN и
<у
ПД-Регулятор
-
екая модель звена 2
4h)
yf=h е/
Расчёт реакций в шарнире 2
Динамическая модель звена 1
4h)
щ{Н)
JV=(Öa2-ÖI(/I )) h-Uyih)
yref—Qh\h-UyQ\)
d
0
9
\d
Рис. 2. Структурная схема системы управления манипулятора с упругими звеньями
Для устранения этой проблемы предлагается альтернативная выходная переменная - отклонение концевой точки уг = I (9к (?) - 9(1)) - иу (I, ^ , где
I (9к (?) - 9(1))- отклонение жесткого звена; иу (I, I) -
отклонение упругого звена; I — длина упругого звена; 9Й - угол поворота в шарнире; 9(1) - угол поворота поперечного сечения концевой точки упругого звена.
Эта переменная физически реализуема. Синтез и применение робастного регулятора, использующего у или уг в качестве выходных параметров, позволяет стабилизировать значение регулируемых величин. Такой регулятор позволяет демпфировать колебания: му(1,?)^-0 при
Работа системы управления осуществляется путем реализации метода рекурсивной процедуры, использующей отдельный регулятор для построения траектории каждого упругого звена, начиная интеграцию с последнего для моделирования многозвенного упругого робота. Как только вращающий момент для последнего звена получен, на следующем шаге вычисляются реакции, которые будут переданы к последующему звену в цепи. Эти реакции рассчитываются исходя из условия равновесия. Процедура продолжается со следующим звеном в цепи так же, как и с предыдущим, но теперь силы реакции присутствуют и поэтому учитываются в расчетах. Процесс продолжа-
1,5 1,2 0,9
„ 0,6 §
^ 0,3 0
Заданная траектория Действительная траектория
-0,3
6 9 12 Время, с
ется до тех пор, пока не будет определен вращающий момент первого звена.
Имитационное моделирование манипулятора с упругими звеньями
Имитационная модель звена робота состоит из пяти элементов. Для изучения вида и характеристик предлагаемого регулятора тестирование проводилось с использованием треугольной траектории перемещения. Параметры модели двухзвенной руки представленного робота-манипулятора взяты из [7]. Подобная траектория была использована в [7] для того, чтобы можно было представить расчетные и экспериментальные результаты, применяя метод особых возмущений. Координаты точек для этой траектории, м: (0,0; 0,5), (-0,3;0,0), и (0,3;-0,5). Робот должен перемещаться между этими точками в равном интервале времени с). Выбираются две различные скорости: одна низкая, tf = 3,5 с, другая относительно высокая, tf = 1,5 с. Короткий интервал (4 = 0,3 с) добавлен перед трассировкой последующего отрезка линии, для уменьшения амплитуды колебаний. Для стабилизации системы используются следующие коэффициенты усиления ПД-регулятора: Кп = [310 0; 0 190] и Кд = = [5 0; 0 16]. Параметры нейронной сети показаны в табл. 1.
На рис. 3, 4 представлено перемещение концевых точек обоих звеньев.
1,4
1,2
1,0
0,8
0,6
-0,4
-0,2
0 У, м
0,2
0,4
б
Рис. 3. Траектория движения при использовании предлагаемого регулятора ^ = 3,5 с): а - перемещение концевой точки звена; б - декартовы координаты траектории
1,5 1,2 0,9 0,6 0,3 0 -0,3
--- Заданная траектория
- Действительная траектория
0
1,4 Г 1,2 2Л,0 0,8 -0,6
4 6 Время, с
-0,4
-0,2
0 Y, м
0,2
0,4
б
Рис. 4. Траектория движения при использовании предлагаемого регулятора ^ = 1,5 с): а - перемещение концевой точки звена; б - декартовы координаты траектории
а
а
Таблица 1
Обновленные параметры нейросети
Параметр Уровень Описание
Число входов N1 4 Заданные и реальные величины положения и скорости звеньев
Число выходов N 1 Аппроксимация выхода
Максимальное количество нейронов: Мтах 7 Ограничение для роста нейросети
[ ^ По Пц ] [0,03 0,01 0,01] Скорость обучения для весов, радиусов, центров
[^1 Е2 Е3] [0,001 0,2 0,1] Ограничения (пределы) для трех условий критерия роста
X 6,4 Коэффициент перекрытия функции активации
Таблица 2
Сравнительная оценка погрешности перемещения манипулятора двух упругих звеньев
Заданная траектория Ошибка перемещения звена 1, м Ошибка перемещения звена 2, м
Максимальная Среднеквадратичная Максимальная Среднеквадратичная
Треугольная f=3,5 c 25,310-6 50,110-6 27,810-6 53,810-6
Треугольная f=1,5 c 30,3-10-6 63,810-6 33,610-6 71,810-6
а б
Рис. 5. Траектория движения при использовании метода особых возмущений [7]: а - tf=3,5 с; б - tf=1,5 с
В начале движения возникают колебания и наблюдается большая погрешность при отслеживании траектории, в этот момент НС ещё не обучена. Через 2 с после начала обучения нейросети достигается требуемая точность движения. Результаты моделирования представлены в табл. 2. Предлагаемый регулятор способен демпфировать колебания и отслеживать заданную траекторию. Результаты моделирования показали небольшое различие качественных
показателей при движении с высокой и низкой скоростями.
Предлагаемый метод особых возмущений показывает ухудшение точности отслеживания заданной траектории (рис. 4 и 5). В предлагаемом алгоритме особых возмущений производные по времени более высокого порядка должны быть проигнорированы для реализации в режиме on-line, так как точность и время вычисления зависят от порядка производных.
Выводы
На сновании проведенных исследований по разработке системы адаптивного управления манипулятором с упругими звеньями на базе обучаемых в режиме реального времени нейросетей и полученных результатов можно сделать следующее заключение:
1. Благодаря реализации стратегии упрощения, нейронная сеть с радиальной базисной функцией является обучаемой в режиме реального времени, имеет динамическую структуру и обеспечивает надежное достижение заданной цели управления.
2. Моделирование различных возможных ситуаций для упругого звена показало эффективность предложенной схемы управления. Использование полного перемещения схвата (у^) в управляющей системе привело к значительному снижению колебаний концевой точки многозвенного манипулятора с упругими звеньями.
3. Важной особенностью предложенной схемы управления является возможность отслеживания траектории перемещения и минимизация амплитуды колебаний. Таким образом, в целом движение системы не отличается от движения системы с жесткими звеньями.
Поступила в редакцию
Литература
1. Фу К., Гонсалес Р., Ли К. Робототехника. М., 1989.
2. Лукьянов А.А. Моделирование движений упругих манипуляторов и мобильных роботов. Иркутск, 2003. 304 с.
3. Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6
/ под общ. ред. В.Г. Потемкина. М., 2002. 489 с.
4. Platt J.C. A Resource Allocation Network for Function Interpolation // Neural Computation. 1991. Vol. 3, № 2. P. 213-225.
5. Lu Y., Sundararajan N., Saratchandran P. Analysis of Minimal Radial Basis Function Network Algorithm for Real-time identification of nonlinear dynamic systems // IEEE Proceedings on Control Theory and Application. 2000. Vol. 4, № 147. P. 476-484.
6. Chen H., Hirasawa K., Hu J. Robust Feedback Error Learning Method for Controller Design of Nonlinear Systems // IEEE International Conference on Neural Networks, 2004. P. 1835-1840.
7. Cheong J., Chung W. K., Youm Y. Inverse Kinematics of Multilink flexible robots for high-speed Applications// IEEE transactions on robotics and automation, April. 2004. Vol. 20, № 2. P. 269-282.
18 мая 2009 г.
Саад Загхлюл Саид Аль-Кхаиит - аспирант, кафедра «Автоматизация производства, робототехники и мехатро-ники», Южно-Российский государственный технический университет (Новочеркасский политехнический институт). Тел.: +79508689437. E-mail: alkhyaat@yahoo.com
Saad Zaghlul Said Al-Khayyt - post-graduate student, departament «Automatic production, robot-technique and mechatronic», South-Russian State Technical University (Novocherkassk Polytechnic Institute). Ph.: +79508689437. E-mail: alkhyaat@yahoo.com