Научная статья на тему 'Нейро-нечеткая структура системы управления перемещением робота-манипулятора'

Нейро-нечеткая структура системы управления перемещением робота-манипулятора Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
426
70
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственные нейронные сети / нечеткая логика / управление перемещения / робот-манипулятор / динамическая модель / artificial neural network / Fuzzy logic / Motion control / robot manipulator / Dynamic model

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Фирас А. Рахим

Описана разработанная автором структура интеллектуальной системы управления перемещением манипулятора по запланированной траектории, которая состоит из двух нечетких ПД-регуляторов и четырех многослойных нейронных сетей. Особенностью данной системы управления является то, что выходы первой пары многослойных нейронных сетей, обученной на основе инверсной динамической модели робота-манипулятора, используются для обучения второй их пары, участвующей в настройке входов в НПД-регуляторы. Компьютерное моделирование предложенной интеллектуальной системы управления доказало эффективность ее использования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In this Paper the author suggests using a structure of the intelligent motion control system for a robot manipulator (intelligent trajectory tracking system) which is consists from two fuzzy PD regulators and four multilayer perceptron neural networks (MLPNN). The first and second neural networks used to learn the inverse dynamical model of the robot manipulator and to produce two signals for learning the third and the forth neural networks every iteration. The third and the forth neural networks produce two signals used for tuning the inputs of the fuzzy PD regulators during tracking the trajectory. The computer modeling results prove that this structure solve the problem of robot manipulator trajectory tracking effectively.

Текст научной работы на тему «Нейро-нечеткая структура системы управления перемещением робота-манипулятора»

УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

УДК 621.865.8:004.045

НЕЙРО-НЕЧЕТКАЯ СТРУКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ПЕРЕМЕЩЕНИЕМ РОБОТА-МАНИПУЛЯТОРА

© 2009 г. Фирас А. Рахим

Южно-Российский государственный South-Russian State Technical University

технический университет (Novocherkassk Polytechnic Institute)

(Новочеркасский политехнический институт)

Описана разработанная автором структура интеллектуальной системы управления перемещением манипулятора по запланированной траектории, которая состоит из двух нечетких ПД-регуляторов и четырех многослойных нейронных сетей. Особенностью данной системы управления является то, что выходы первой пары многослойных нейронных сетей, обученной на основе инверсной динамической модели робота-манипулятора, используются для обучения второй их пары, участвующей в настройке входов в НПД-регуляторы. Компьютерное моделирование предложенной интеллектуальной системы управления доказало эффективность ее использования.

Ключевые слова: искусственные нейронные сети, нечеткая логика, управление перемещения, робот-манипулятор, динамическая модель.

In this Paper the author suggests using a structure of the intelligent motion control system for a robot manipulator (intelligent trajectory tracking system) which is consists from two fuzzy PD regulators and four multilayer perceptron neural networks (MLPNN). The first and second neural networks used to learn the inverse dynamical model of the robot manipulator and to produce two signals for learning the third and the forth neural networks every iteration. The third and the forth neural networks produce two signals used for tuning the inputs of the fuzzy PD regulators during tracking the trajectory. The computer modeling results prove that this structure solve the problem of robot manipulator trajectory tracking effectively.

Keywords: artificial neural network, fuzzy logic, motion control, robot manipulator, dynamic model.

Введение

Разработка интеллектуальной системы управления перемещением манипулятора по запланированной траектории относится к числу актуальных задач робототехники. В рамках развития современных подходов к управлению перемещением робота по запланированной траектории всесторонне исследованы вопросы нелинейности, тесно связанные с его динамикой. При этом в расчет принимаются особенности структуры динамических моделей робота, тогда как нелинейное трение и другие вероятностные параметры обычно не рассматриваются.

Методы, применяемые для решения проблемы управления перемещением робота-манипулятора по запланированной траектории, обычно предполагают наличие точной динамической модели робота (например, метод вычисления крутящих моментов). Для функционирования системы управления, основанной на методе вычисления крутящих моментов, требуется определение значений скорости и ускорения перемещения робота. При этом ускорение измеряется с помощью акселерометра, чувствительного к внешним помехам. В связи с этим, по мнению П. Келли и его коллег, нежелательно, чтобы управление зависело от параметра ускорения [1].

Среди основанных на динамической модели робота классических методов управления наиболее эффективным считается пропорционально-дифференциальное регулирование (ПД-регулирование) с прямым расчетом крутящего момента. Однако данный метод требует выполнения затратной по времени процедуры вычисления полной модели инверсной динамики робота [2-5].

С недавнего времени для управления перемещением робота по запланированной траектории используются такие методы искусственного интеллекта, как нечеткая логика, нейронные сети и их комбинации. Считается, что применение принципов нечеткой логики к разработке нелинейных методов управления открывает широкие перспективы их совершенствования. Нечеткое пропорционально-интегральное регулирование (ПИ-регулирование), ПД-регулирование и пропорционально-интегрально-дифференциальное регулирование (ПИД-регулирование) являются часто применяемыми формами динамической компенсации с точки зрения обеспечения устойчивого состояния или переходного режима системы. Разработка нечеткого ПИД-регулирования предполагает совместное применение нечеткого ПД-регулирования и нечеткого ПИ-регулирования либо комбинацию нечеткого ПД-регулирования с интегральным регулированием.

На этой основе могут быть сформированы различные виды взаимодействия между их параметрами. Однако настройка нечетких параметров является основным затруднением процесса разработки систем нечеткого управления [6, 7].

Дж. Джантзен предложил использовать вместо обычного ПИД-регулятора комбинацию нечеткого ПД-регулятора и интегрального регулятора [8]. Новая система управления перемещением робота по запланированной траектории включала нормализацию, фа-зификацию, нечеткие базовые правила, устанавливающие соответствие между нечеткими входными и выходными параметрами, дефазификацию и денорма-лизацию. Определение масштабных коэффициентов для нечетких входных и выходных параметров выполнялось с помощью классического метода настройки ПИД-регулятора.

Нейронные сети обладают как возможностями моделирования нелинейных систем, воспроизводя зависимость входных и выходных параметров, так и потенциалом для обучения в целях генерирования управляющих сигналов. Параллельные процессы, характеризующие функционирование нейронных сетей, открывают возможности обработки большого количества информации в режиме реального времени [9, 10].

Применение нейронных сетей в области управления робототехническими системами предполагает определение модели прямой динамики или модели инверсной динамики с последующим включением этой информации в процесс управления роботом. В настоящее время разработаны различные подходы в использовании нейронных сетей в блоках управления. Основным принципом здесь выступает обучение нейронной сети на основе характеристик робота, а затем использование полученных данных для выработки управляющих сигналов. Важнейшим преимуществом управления на основе использования нейронных сетей является формирование обучающегося блока управления, способного функционировать в условиях неизвестной среды [9, 11-13].

Когда робот имеет два или более сочленения, для каждого звена разрабатывается отдельная модель нейронной сети в виде многослойного персептрона (МСП). В МСП используются значения ошибки, полученные от блока прямого управления (ПД-регулятор или ПИД-регулятор), которые настраивают веса нейронной сети на основе алгоритма обратного распространения ошибки. МСП функционируют как компенсаторы, непрерывно обучаясь на основе сигнала ошибки в режиме реального времени, получаемой на выходе блока прямого управления. Результирующий управляющий сигнал представляет собой сумму значения этой ошибки и выходного сигнала нейронной сети. После каждой итерации происходит обновление весов сети в режиме он-лайн для минимизации ошибки обратной связи. Экспериментальные исследования с использованием рассматриваемой структуры управления перемещением робота показали, что точность следования манипулятора по запланированной траектории повышается по сравнению с использованием в структуре управления только ПД-регулятора

без нейронной сети. При этом не требуется информации о параметрах динамической модели робота [3, 4, 14].

Нейро-нечеткая система управления

С целью решения проблемы управления перемещением робота-манипулятора по запланированной траектории разработана нейро-нечеткая структура, которая состоит из двух нечетких ПД-регуляторов (НПД-регуляторов), а также четырех многослойных нейронных сетей, функционирующих параллельно в режиме он-лайн (рис. 1). Отметим, что в качестве исследуемой модели использован двухзвенный робот-манипулятор.

Первая пара многослойных нейронных сетей (МСП-1 и МСП-2) обучается характеристикам инверсной динамики манипулятора. Входными параметрами МСП-1 и МСП-2 являются угол (9) и скорость (6) перемещения каждого звена робота. Отклонения между значениями сигналов, продуцируемых МСП-1 и МСП-2, и значениями сигналов крутящих моментов служат для обучения этой пары многослойных нейронных сетей по методу обратного распространения ошибки. В свою очередь, их нормализованные выходные сигналы применяются для обучения второй пары многослойных нейронных сетей, которые участвуют в формировании двух гибридных ней-ро-нечетких регуляторов.

Вторая пара многослойных нейронных сетей (МСП-3 и МСП-4) необходима для настройки в режиме он-лайн четырех масштабных коэффициентов (ke1, , ke2, kAe2), выступающих в роли входных параметров двух нечетких ПД-регуляторов. На каждой программной итерации выполняется отбор входных параметров для МСП-3 и МСП-4, в качестве которых используются значения сигнала ошибки положения первого и второго звеньев манипулятора е1 (nT) и в2 (nT) (разность между запланированной и реальной траекторией соответствующего звена), а также значения изменения этого сигнала Дб1 (nT) и

Де2 (nT). МСП-3 и МСП-4 обучаются в режиме онлайн по методу обратного распространения ошибки с помощью нормализованных выходных сигналов МСП-1 и МСП-2. Выходные сигналы НПД-регу-ляторов умножаются на соответствующие масштабные коэффициенты, формируя выходные сигналы крутящих моментов, управляющие перемещением звеньев манипулятора. Окончательные управляющие сигналы крутящих моментов можно представить в следующем виде:

Т1 (пТ) = тет (пТ) + хУ1 (пТ);

^(М) = Xр2^) + Х^(пТ) ,

где Т - время дискретизации; п - порядковый номер программной итерации; х1 (пТ), х2 (пТ) - окончательные управляющие сигналы крутящих моментов для первого и второго звеньев манипулятора; хр1 (пТ), хр2 (пТ) - управляющие сигналы крутящих

моментов; ту1 (nT), ту2 (nT) - сигналы возмущения первого и второго звеньев робота.

Структура нечетких ПД-регуляторов

Процесс формирования выходных сигналов НПД-регуляторов состоит из стадий нормализации, дефа-зификации, инференц-процедуры, дефазификации и денормирования с соответствующими нечеткими базовыми правилами.

Как сказано выше, значения сигнала ошибки положения каждого звена манипулятора, а также значения изменения этого сигнала выбраны в качестве входов в НПД-регуляторы. Их можно представить в виде следующих уравнений:

^(пТ) = 0Ы (пТ) -0l(nT); ^(пТ) =02^ (пТ) -02(nT);

^(пТ) - в1(( п - 1)Т)

Ae1 (nT) = -

T

Ae2(nT) =

e2(nT) -в2((n - 1)T)

нечеткий ПД-регулятор посредством стадии нормализации происходит преобразование значений в1 (пТ),

в2 (пТ), Дв1 (пТ) и Дв2 (пТ) из реальной предметной области в нормализованную предметную область, лежащую в диапазоне от -1,0 до 1,0. При этом используются масштабные коэффициенты kв1, kДв1 для первого звена и kв2, kДв2 для второго звена. Их значения определяются с помощью МСП-3 и МСП-4 соответственно. Этот процесс описывается следующими уравнениями:

Е1(пТ) = kвl(nT )в1(пТ); (1)

AE1 (nT) = kAe1 (nT )Ae1 (nT); E2 (nT) = ke2 (nT )e2 (nT); AE2(nT) = kAe2(nT )Ae2(nT),

(2)

(3)

(4)

где 0Ы (пТ), 0М (пТ) - значения углов перемещения

первого и второго звеньев в момент времени пТ , которые соответствуют запланированной траектории; 01 (пТ), 02 (пТ) - значения углов перемещения первого и второго звеньев робота в момент времени пТ , которые соответствуют реальной траектории.

В качестве выходов НПД-регуляторов используются значения тР1 (пТ) и тр2 (пТ). На входе в каждый

где Е1 (пТ) , ДЕ1 (пТ), Е2 (пТ) и ДЕ2 (пТ) - входные параметры НПД-регуляторов, значения которых получены в ходе настройки.

На стадии фазификации осуществляется дальнейшая трансформация преобразованных ранее значений в соответствующие нечеткие множества с использованием функций принадлежности. В НПД-регуляторах для каждого входного сигнала используются одиннадцать функций принадлежности (ФП), две из которых симметричные трапецеидальные и девять - симметричные треугольные. Для выходного сигнала разработаны одиннадцать треугольных ФП. Эти функции принадлежности показаны на рис. 2.

Рис. 1. Структура нейро-нечеткой системы управления перемещением двухзвенного робота-манипулятора

по запланированной траектории

ОМ ООМ

Н ПОМ ПМ

Й § 0,75

(3 Ц 5 |0,5

|^0,25

-1 -0,8333 -0,6667 -0,5 -0,3333 -0,1666 0 0,1666 0,3333 0,5 0,6667 0,8333 1

ei(nT), рад

ОБ ОС ОМ ООМ Н ПОМ ПМ ПС ПБ

£ 1

-1 -0,8333 -0,6667 -0,5 -0,3333 -0,1666 0 0,1666 0,3333 0,5 0,6667 0,8333 1

Де1(пТ), рад/с

ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ ПС ПБ ПОБ

£ 1

Я й 0,75

S |

&0,25

-1 -0,8333 -0,6667 -0,5 -0,3333 -0,1666 0 0,1666 0,3333 0,5 0,6667 0,8333 1

иР1(пТ), В

Рис. 2. Функции принадлежности двух входов и одного выхода НПД-регуляторов

При этом использованы следующие условные обозначения: ООБ - отрицательное очень большое, ОБ - отрицательное большое, ОС - отрицательное среднее, ОМ - отрицательное малое, ООМ - отрицательное очень малое, Н - ноль, ПОМ - положительное очень малое, ПМ - положительное малое, ПС -положительное среднее, ПБ - положительное большое, ПОБ - положительное очень большое.

Структура двух НПД-регуляторов идентична, так как одинаковы диапазоны нормализации их входов. При этом они отличаются значениями масштабных коэффициентов как на входе, так и на выходе. Значение усиленного выходного сигнала для каждого НПД-регулятора определяется согласно следующим формулам:

х Р1

(пТ ) = k0lUFl(nT);

Х Р 2 (пТ) = К2иР2 (пТ),

где иР1 (пТ), ир2 (пТ) - выходы НПД-регуляторов.

Как известно, нечеткий механизм логического вывода основан на нечетких базовых правилах. В рамках структуры нечетких ПД-регуляторов разработана система, включающая 121 нечеткое базовое правило (табл. 1).

Значения иР1 (пТ) и ир2 (пТ) вычисляются с использованием следующих формул:

иР1 (пТ) = IЕ1 (е1 ] ) ° ДЕ1 (Де1k ) ° П1 (е1 ] , Дe1k, ир1т)};

иР2 (') = {Е2 (е2] ) ^ ДЕ2 (Де2к ) ^ П2^ (е2] , Дe2k , иР2т )} ,

где индекс ] указывает на то, что соответствующие ФП представляют собой первый вход в нечеткий ПД-регулятор; индекс k соответствует ФП второго входа; индекс т - ФП выхода; П1 и П2 - матрицы нечетких базовых правил НПД-регуляторов.

Таким образом, на стадии дефазификации генерируются управляющие выходные сигналы иР1 (пТ) и

ир2 (пТ) с использованием центроидного метода.

Входы в нечеткие блоки вычисляются при этом в рамках приведения к четкости следующим образом [14, 15]:

Е ьк М k)

и стр = _k_

ир< = П^) '

k

где Ь1<, - центр ФП правила ) - обозначает

площадь ФП.

Таблица 1

Система нечетких базовых правил

ФП Ae1(nT) (Ae2(nT))

ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ ПС ПБ ПОБ

ООБ ООБ ООБ ООБ ООБ ООБ ООБ ОБ ОС ОМ ООМ Н

ОБ ООБ ООБ ООБ ООБ ООБ ОБ ОС ОМ ООМ Н ПОМ

р ОС ООБ ООБ ООБ ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ

ОМ ООБ ООБ ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ ПБ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

р ¿т ООМ ООБ ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ ПБ ПОБ

Н ООБ ОБ ОС ОМ ООМ Н ПОМ ПМ ПБ ПОБ ПОБ

ПОМ ОБ ОС ОМ ООМ Н ПМ ПМ ПБ ПОБ ПОБ ПОБ

ПМ ОС ОМ ОММ Н ПОМ ПМ ПС ПБ ПОБ ПОБ ПОБ

ПС ОМ ОММ Н ПОМ ПМ ПС ПБ ПОБ ПОБ ПОБ ПОБ

ПБ ОММ Н ПОМ ПМ ПС ПБ ПОБ ПОБ ПОБ ПОБ ПОБ

ПОБ Н ПОМ ПМ ПС ПБ ПОБ ПОБ ПОБ ПОБ ПОБ ПОБ

Зависимость между входами и выходом каждого нечеткого ПД-регулятора можно представить в виде трехмерного графика (рис. 3).

Рис. 3. Трехмерный график зависимости между входами и выходом НПД-регулятора

Структура многослойной нейронной сети

Как было указано выше, входами рассматриваемых многослойных нейронных сетей являются значения угла и скорости перемещения каждого звена робота. МСП-1 и МСП-2 являются двухслойными и включают двенадцать нейронов в скрытом слое и один нейрон в выходном слое (входной слой обычно рассматривается как буферный слой и в некоторых источниках в структуре нейронной сети не учитывается). Необходимо отметить, что поскольку обучение МСП производится в режиме он-лайн и непрерывно выполняется на каждой программной итерации, разработке структуры многослойных нейронных сетей придается важное значение. Например, количество нейронов в скрытом слое было определено в ходе компьютерного моделирования методом подбора.

Обучение МСП-1 и МСП-2 осуществляется в режиме он-лайн с использованием значений отклонения между окончательными управляющими сигналами крутящих моментов (т1 (пТ), т2 (пТ)) и выходами этой пары многослойных нейронных сетей (у1 (пТ), у2 (пТ)) (см. рис. 1). Значения т1 (пТ) и

т2 (пТ) перед использованием в процессе обучения

должны быть нормализированы.

Обучение МСП-1 и МСП-2 реализуется в ходе прямого расчета и расчета по методу обратного распространения ошибки. В ходе разработке скрытого нейронного слоя использована гиперболическая тангенциальная функция активации

Вторая пара многослойных нейронных сетей используется для настройки входов НПД-регуляторов, которые продуцируют управляющие сигналы. МСП-3 настраивает масштабные коэффициенты kв1 и kДв1 -входные параметры первого НПД-регулятора, в свою очередь, МСП-4 настраивает kв2 и kДв2 - входные параметры второго НПД-регулятора (рис. 1). Рассматриваемая пара многослойных нейронных сетей имеет структуру, идентичную структуре МСП-1 и МСП-2.

Входами МСП-3 являются в1 (пТ) и Дв1 (пТ), а

в2 (пТ) и Дв2 (пТ) - входные параметры МСП-4.

Однако у двух рассматриваемых пар нейронных сетей применяются различные функции активации скрытого и выходного слоев. Так, в скрытом и выходном слоях МСП-3 и МСП-4 используются сигмоидальные функции. Обучение МСП-3 и МСП-4 выполняется с использованием нормализованных значений сигналов, поступающих от МСП-1 и МСП-2 соответственно. Этот процесс основан на методе обратного распространения ошибки. Настройка масштабных коэффициентов - входов в НПД-регуляторы - осуществляется в режиме он-лайн в ходе каждой программной итерации в течение обучения нейронных сетей, включающего обновление значений весов. При настройке

масштабных коэффициентов необходимо использовать часть сигнала распространяющейся ошибки в выходном слое. Это требуется для обновления весов между выходным и скрытым слоями. При разработке срытого слоя каждой многослойной нейронной сети второй пары использована сигмоидальная функция активации.

Процесс обучения МСП-4 с обновлением входов НПД-регулятора 2 выполняется аналогично, а выходным параметром МСП-4 является у4 (пТ). Таким

образом, настраивающие НПД-регуляторы масштабные коэффициенты можно представить в следующем виде:

кл (nT) =

1

k31 >"3 (nT)(1 - >"3 (nT))

kAe1 (nT ) =

ke2 (nT) =

k32>3 (nT)(1 - >3 (nT))

k41>4 (nT)(1 - >4 (nT))

kAe2 (nT) =

k42>4 (nT)(1 - >4 (nT))

где к31, kз2 - коэффициенты усиления, используемые для настройки входов в первый НПД-регулятор (с помощью ^ и преобразуются произведенные МСП-3 сигналы); k4l, - коэффициенты усиления, служащие для настройки входов во второй НПД-регулятор (с помощью k41 и k42 преобразуются произведенные МСП-4 сигналы).

Полученные значения масштабных коэффициентов необходимо подставить в уравнения (1)-(4) и найти окончательные нормализованные значения входов в НПД-регуляторы (Е1 (пТ) , ДЕ1 (пТ), Е2 (пТ) ,

АЕ2 (пТ ) ).

Исследуемая модель робота-манипулятора

Для построения интеллектуальной системы управления перемещением робота по запланированной траектории необходимо описать динамическую модель жесткого робота-манипулятора, используя значения параметров, описанных в источнике [16]. Схема манипулятора, используемого в качестве исследуемой модели, изображена на рис. 4. При этом используются следующие условные обозначения: 11 и 12 - длины первого и второго звеньев манипулятора; т1 и т2 - масса его звеньев; 1с1 и 1с2 - расстояния между осью вращения и центрами масс звеньев робота; 11 и 12 -моменты инерции каждого звена манипулятора по осям, которые проходят через центры масс параллельно оси абсцисс; 91 и 92 - углы перемещения звеньев робота, при этом 92 измеряется по отношению к изменению положения первого звена; g - ускорение силы тяжести.

Рис. 4. Схема двухзвенного робота-манипулятора, используемого в качестве исследуемой модели

После подстановки динамических параметров робота-манипулятора, выбранного в качестве исследуемой модели, конечное уравнение его динамической модели имеет следующий вид [16]:

2,351+0,168cos(62 )0,102+0,084cos( 62) 0,102+0,084cos(62) 0,102

_Т2 _

- 0,168sin(62)62 +bl +

0,084sin(e2)ej

/qsgn(e1)

-0,084sin( e2)e 2

b + /c2 sgn(e2 )

"e 1" +

_e 2.

38,465 sin(ej) +1,8247 sin^j + e 2) 1,8247sin(ej +e 2)

где Ь - параметр вязкого трения; ^ - параметр ку-

лоновского трения. Для компьютерного моделирования перемещения двухзвенного робота-манипулятора

необходимо найти его ускорение (6), а затем интегрировать полученные результаты с использованием метода Рунге - Кутта и найти 9.

Компьютерное моделирование нейро-нечеткой системы управления двухзвенным роботом-манипулятором

Для компьютерного моделирования выбраны четырнадцать параметров: коэффициенты скорости обучения: ^ = 0,08; = 0,08; = 0,1; = 0,08; коэффициенты моментов: а1 = 0,1; а 2 = 0,1;

коэффициенты настройки:

а3 = 0,15

а4 = 0,15 :

k31 = 0,288; = 17,65; k41 = 0,18326; = 26,6 коэффициенты преобразования: ko1 = 200 и ko2 = 15.

+

2

+

х

2

х

3

fcf

m

«н 1

Ф

-í 0

Ф

-1

-2

-3

_ ! | ! !

hd 9,

ll......V.........

0 6 8 Время, с

w

03

а

-1,5 1

0,5

-0,5 -1

-1,5

i i i —¿

л \

' \

и \

i i ¡

0

ь 8 Время, с

Рис. 5. Графики запланированной и реальной траекторий для первого и второго звеньев робота-манипулятора, полученные в ходе первого тестирования

0,6 & 0,4

£ 0,2

0

0,6

^ 0,4 а

~ 0,2

5 6

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 8 9 Время, с

i i i i i i i i i i

Vi í i ¡ ¡ ¡ ¡

0 1 2 3 4 5 6 7 8 9 Время,

й а

0 -■0,02-■0,04 -■0,06-

1

x 103

56 в

7 8 9 Время, с

2

3

4

56

г

7 8 9 Время, с

В ходе первого тестирования, длящегося 10 с, траектории перемещения двух звеньев робота-манипулятора были заданы уравнениями:

01d (nT) = л sin (nnT);

e2d (nT )="2sin (nnT).

Возмущения не учитывались (TV1 (nT) = 0 и xv2 (nT) = 0). Полученные результаты представлены на рис. 5-7.

На рис. 5 показаны графики запланированной и реальной траекторий, а на рис. 6 - графики отклонений между ними. На рис. 6 а, б показаны отклонения с начала переходного процесса, достигающие своего максимального значения (приблизительно 0,6 рад как для 01, так и для 02) в течение 0,5 с от начала тестирования. При этом среднеквадрати-ческая ошибка составила для 01 6500-10-6 рад, для 92 - 5900-10-6

рад. В свою очередь, на рис. 6 в, г изображены графики сигналов отклонения реальной траектории от запланированной после первых 0,5 с от начала тестирования, когда среднеквадратическая ошибка составила для 01 0,43459-Ш-6 рад, а для 62 - 1,9696-Ш"6 рад. На рис. 7 показаны графики сформированных сигналов крутящего момента, являющихся выходными параметрами НПД-ре-гуляторов хF1 (nT) и хF2 (nT).

Второе тестирование отличалось от первого тем, что были учтены случайные сигналы возмущения, значения которых составили 10 % от максимальных значений крутящих моментов для каждого звена манипулятора:

Xvi (nT) e [-20; 20]

и Xv2 (nT)e [-1,5; 1,5].

Среднеквадратическая ошибка значений отклонения для 01 составила 660040"6 рад, а для 62 -6200-10"6 рад. Величина данного показателя для второй пары графиков отклонения для 01 равня-

Рис. 6. Графики отклонения между запланированной и реальной траекториями для двухзвенного робота-манипулятора, полученные в ходе первого тестирования: а и б -

графики отклонения для первого и второго звеньев с начала тестирования; в и г - лась 0,62846-10 рад, для 02 -

графики отклонения для первого и второго звеньев после 0,5 с от начала тестирования 2,949-10~б рад.

1

2

3

4

2

3

4

Время, с

£

0 12 3 4 5 6 7 8 9 Время, с

б

Рис. 7. Графики крутящих моментов, произведенные НПД-регуляторами (первое тестирование)

Таким образом, можно сделать вывод, что возмущения оказывают влияние на выходные параметры МСП-1 и МСП-2, которое минимизируется второй парой многослойных нейронных сетей, ответственной за настройку масштабных коэффициентов - входных параметров в НПД-регуляторы. Это ведет к тому, что в итоге возмущения не оказывают значительного влияния на выходную траекторию.

величины крутящих моментов не приводит к увеличению значения отклонения реальной траектории от запланированной и, следовательно, не влияет на точность перемещения двухзвенного робота-манипулятора по запланированной траектории. Это происходит потому, что возмущения оказывают влияние на выходные параметры первой пары многослойных нейронных сетей, которое минимизируется их второй парой, настраивающей масштабные коэффициенты - входные параметры в НПД-регуляторы. В итоге возмущения не оказывают значительного влияния на выходную траекторию.

Таким образом, результаты компьютерного моделирования рассматриваемой системы управления показали эффективность ее использования.

Литература

Выводы

Структура предлагаемой системы управления перемещением манипулятора по запланированной траектории состоит из двух нечетких ПД-регуляторов и четырех многослойных нейронных сетей, первая пара которых используется для обучения параметрам инверсной динамической модели робота, а вторая пара -для настройки входов в нечеткие НПД-регуляторы. При этом, в отличие от разработанных ранее систем управления роботами, выходы двух многослойных нейронных сетей, обучающихся инверсной динамической модели, добавляются в качестве сигналов компенсации к управляющим сигналам. Особенностью рассматриваемой системы управления является то, что выходы первой пары многослойных нейронных сетей используются для обучения второй их пары, участвующей в настройке входов в НПД-регуляторы.

Результаты компьютерного моделирования разработанной системы интеллектуального управления перемещением манипулятора по запланированной траектории показали, что:

- процесс обучения двух пар многослойных нейронных сетей занимает около 0,5 с, после чего запускается настройка входов в НПД-регуляторы на требуемом уровне;

- воздействие на систему управления возмущений с заданными значениями в 10 % от максимальной

Поступила в редакцию

1. Kelly R., Santibanez V., Loria A. (2005). Control of Robot Manipulators in Joint Space. London, 2005.

2. Jin Y. (1998). Decentralized Adaptive Fuzzy Control of Robot Manipulators. URL:http://ieeexplore. ieee.org.

3. Newton T.R., Xu Y. (1993). Neural Network Control of a

Space Manipulator. URL:http://ieeexplore. ieee.org.

4. Jung S, Hsia T.C. (1995). New Neural Network Control

Technique for Non-model Based Robot Manipulator Control. URL:http://ieeexplore. ieee.org.

5. Subudhi B., Morris A.S. (2003). Fuzzy and neuro-fuzzy approaches to control a flexible single-link manipulator. URL:http://dspace.nitrkl.ac.in.

6. Mohan S., Bhanot S. (2006). Comparative Study of Some Adaptive Fuzzy Algorithms for Manipulator Control. URL:http://www.waset.org.

7. Bicker R., Huand Z., Burn K. (2002). A Self-tuning Fuzzy Robotic Force Controller. URL:http://citeseer.ist.psu.edu.

8. Jantzen J. (1998). Tuning of Fuzzy PID Controllers. URL:http://www.iau.dtu.dk.

9. Yildirim §. (2002). Artificial Neural Network Applications to Control. URL:http://fbe.erciyes.edu.tr.

10. Хаммуд А.Х. Нейросетевая реализация систем управления полетом на основе методов динамической инверсии // Мехатроника, автоматизация, управление. 2003. № 9.

11. Choi Y, M. Lee, Kim S., Kay Y. (2001). Design and Implementation of an Adaptive Neural-Network Compensator for Control Systems. URL:http://ieeexplore. ieee.org.

12. Shuzhi S. Ge; Hang C.C., Woon L.C. (1997). Adaptive neural network control of robot manipulators in task space. URL:http://ieeexplore. ieee.org.

13. Mitrovic D. (2006). Learning Motor Control for Simulated Robot Arms. URL:http://www.inf.ed.ac.uk.

14. Власов К.П. Теория автоматического управления : учеб. пособие. Харьков, 2007.

15. Burns R.S. (2001). Advanced Control Engineering. Butterworth-Heinemann Linacre House, Jordan Hill, Oxford.

16. Reyes F., Kelly R. (2001). Experimental evaluation of model-based controllers on a direct-drive robot arm. URL:http://www.elsevier.com.

20 ноября 2008 г.

Фирас А. Рахим - аспирант кафедры автоматизации производства, робототехники и мехатроники ЮжноРоссийского государственного технического университета (Новочеркасского политехнического института). E-mail: firas_raheem@mail.ru

Firas A.Raheem - post-gaduante student of departament of automatic production, robot-technique and mechatronic of South-Russian State Technical University (Novocherkassk Polytechnic Institute). E-mail: firas_raheem@mail.ru

а

i Надоели баннеры? Вы всегда можете отключить рекламу.