ПОВЫШЕНИЕ ТОЧНОСТЬ РАБОТЫ РОБОТА ЗА СЧЕТ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТИ (НЕЙРОННЫХ КОМПЕНСАТОРОВ И НЕЛИНЕЙНОЙ ДИНАМИКИ)

Чжэнцзе Янь; Клочков Ю.С.; Лин Си

УДК 62-529: 004.032.26

ПОВЫШЕНИЕ ТОЧНОСТЬ РАБОТЫ РОБОТА ЗА СЧЕТ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТИ (НЕЙРОННЫХ КОМПЕНСАТОРОВ И НЕЛИНЕЙНОЙ ДИНАМИКИ)

1 Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия

2 Китайский университет Минцзу, Пекин, Китай

Статья поступила в редакцию 02.08.2022

Предметом данной статьи является программируемая система управления роботом-манипулятором. Рассмотрена сложная нелинейная динамика, связанная с практическим применением систем и манипуляторов. Традиционный метод управления заменяется разработанной системой Е1та и адаптивной радиальной базовой функцией нейронной сети, что повышает стабильность системы и скорость отклика. С помощью программного обеспечения, связанного с МЛТЬЛБ, разработаны соответствующие контроллеры и компенсаторы. Представлены результаты обучения нейросетевого контроллера для программирования траекторий робота. Анализируются динамические ошибки различных типов нейросетевых контроллеров и двух методов управления. Ключевые слова: робот-манипулятор, программируемая система управления, нейронная сеть, нелинейные многомерные компенсаторы, моделирование, динамический анализ, динамические ошибки. Б01: 10.37313/1990-5378-2022-24-4-106-115

1. ВВЕДЕНИЕ

На раннем этапе проектирования управления манипулятором динамическая модель системы и связанные с ней параметры системы должны быть точно описаны при проектировании контроллера [1]. В традиционных методах проектирования управления, таких, как вычислительное управление крутящим моментом и управление обратной динамикой, это работает нормально [2]. Рассчитав крутящий момент манипулятора робота и составив динамическое уравнение, вы можете получить хороший эффект управления [3]. Но данные методы основаны на возможности получить точную модель данных. Однако получить точную математическую модель робота в реальном производстве и использовании сложно [4]. Кроме того, из-за влияния различных полезных нагрузок могут возникнуть трудности с получением соответствующих методов на основе моделей. В последнее время нейросетевые калькуляторы используются для улучшения характеристик систем управления при разработке систем управления роботами-манипуляторами. В системах числового управления (ЧПУ) нейросетевой интерполятор траекторий звеньев робота может использоваться вместо традиционного сплайн-интерполятора [5].

Янь Чжэнцзе, ассистент высшей инженерно-экономической школы СПбПУ. E-mail: yanzhengjie1019@gmail.com Клочков Юрий Сергеевич, доктор технических наук, доцент, проректор по научно-организационной деятельности. E-mail: y.kloch@gmail.com Си Лин, доцент кафедры математики. E-mail: xilin@muc.edu.cn

Это исследование используется для обучения компенсаторов с использованием нейронных сетей в системах числового управления роботами-манипуляторами и при отсутствии точных исходных данных [6]. Адаптивный ней-росетевой компенсатор используется для замены традиционного ПИД-регулятора и других методов компенсации динамической ошибки, вызванной скручивающей нагрузкой в приводе звена робота [7]. Нелинейная динамическая связь привода выбирает двухпрямой робот-манипулятор в угловой системе координат в качестве моделируемого объекта управления [8].

Целью данной работы является синтез и обучение многомерного нейросетевого контроллера для компенсации и коррекции динамической ошибки траектории робота. И контроллер нейронной сети, и моделирование проекта выполняются в МЛТЬЛБ [9].

2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ КОМПЕНСАТОРОВ

Как правило, многомерные компенсаторы динамических ошибок описываются нелинейными выражениями, соответствующими динамической модели робота, представленной в виде уравнений Лагранжа:

Ж?)? +- в{ч, Фч + с(ч) = <и- qL. (1)

где (я, я', я") - N х 1 векторов обобщенных координат положений, скоростей и ускорений звеньев робота; N - количество ссылок робота.

Основными нагрузками приводов робота являются элементы векторов левой части в уравнении (1), где:

0_iner = A (q) q " - N x 1 вектор моментов инерции или сил, вызванных ускоренным движением звеньев; A (q) - матрица кинетической энергии N x N механизма робота;

0_cor = B (q, q ) q ' - вектор N x 1 кориолисовых и центробежных моментов или сил; B (q, q ' ) - матрица N x N;

0_grav = C (q) - N x 1 вектор гравитационных и других потенциальных моментов или сил.

В правой части уравнения (1): 0_d - вектор N x 1 крутящих моментов или сил, создаваемых приводами робота; 0_L - вектор N x 1 дополнительных нагрузок, возникающих в приводах из-за трения в соединениях и действия внешних сил на захват.

Траектории звеньев робота в системах ЧПУ рассчитываются путем решения обратных задач кинематики в базовых точках траектории захвата робота, а затем они интерполируются с использованием полиномов сплайнов. Следовательно, используя программные значения векторов положения, скорости и ускорения звеньев (q_p, (q_p) ', (q_p) ' ' ), можно рассчитать программные значения крутящего момента или силовых нагрузок, которые приводы звена должны преодолеть:

fcmr = Млр)ь ■ Qcor = В{Чр-Чр)Чр. Qgrcv = c(tjp); (2)

Qff = (3)

Выражения (2) и (3) могут быть непосредственно использованы для компенсации динамических ошибок в системах ЧПУ роботов с момент-ными приводами звеньев и ПИД-регуляторами положений звеньев робота (Игнатова и Ростов, 2014). На рисунке 1 показана соответствующая функциональная схема системы с динамическими компенсаторами, включенными в схему прямой связи (FF) системы управления.

Однако, если есть дополнительные нагрузки 0_L, система с контролем крутящего момента FF может иметь большие динамические ошибки, которые могут быть уменьшены с помощью дополнительного линейного компенсатора:

Upid = V +.К, /яИ - S^q + Ксат qp, (4)

где K_com = diag {K_ (com, i)} - матрица коэффициентов линейного компенсатора.

Нелинейные компенсаторы могут быть включены в обратную связь (FB) системы управления вместе с ПИД-регулятором или более сложным нелинейным регулятором. В этом случае компенсаторы FB используют сигналы обратной связи реальных положений и скоростей звеньев робота, измеренных соответствующими датчиками:

Qiaer = A(q)Up[d:QCJT = B(q,q)q. Qg™ = C(q);(5)

Qfb = Qnxr + Qcor +- QSrcv, (6)

где вектор Upid рассматривается как вектор реальных ускорений.

На рисунке 2 показана функциональная схема с нелинейными компенсаторами FB, включенными в замкнутый контур системы.

Многовариантные компенсаторы (5) и (6) выполняют линеаризацию нелинейной динамики робота, описываемой уравнением (1), и тем самым обеспечивают более стабильную работу приводов робота.

3. ОБУЧЕНИЕ НЕЛИНЕЙНЫХ НЕЙРОСЕТЕВЫХ КОМПЕНСАТОРОВ

3.1. Проектирование компенсаторов с помощью нейронных сетей Элмана

Цель исследования заключалась в разработке модели адаптивной нейронной схемы управления нелинейными динамическими системами манипуляционного робота.

В качестве примера рассмотрим промышленный трехзвенный робот-манипулятор, звенья которого соединены между собой приводами вращательного движения. Положение звеньев определяется углами фь ф ф>- Помимо этого, на звенья робота действуют силы веса, которые направлены под некоторым углом а к выбранной системе координат, что демонстрирует возможность устройства работать под любым углом к горизонту.

Основной характеристикой объекта управления является его передаточная функция, записанная в терминах преобразования Лапласа, которая определяет соотношение выхода объекта у(б) к входу х(б) при нулевых начальных условиях.

Математическая модель, описывающая движение робота, имеет следующий вид:

<Р=ЫУ ШУ = + (7)

где <р - угол отклонения от заданной траектории движения;

(и)у - угловая скорость вращения вокруг вертикальной оси;

5 - угол поворота вокруг вертикальной оси;

Г - постоянная времени;

К - постоянный коэффициент с размерностью рад/с.

Уравнение, описывающее объект управления, имеет характер интегрируемого звена с опозданием, и описывается дифференциальным уравнением, поскольку в качестве исходной величины рассматривается не угловая скорость, а угол поворота, который является интегралом от угловой скорости:

Т

da?,

„ » + ^ = kxv dt dt ±

Передаточная функция звена:

(8)

1 dt -tx2

Привод робота имеет характер апериодического звена первого порядка, который можно описать дифференциальным уравнением:

кхг. (10)

Соответственно передаточная функция звена привода имеет следующий вид:

. (11)

Для управления движением робота-манипулятора, представляющего собой нелинейную динамическую систему, целесообразно применять нейроконтроллер, который базируется на искусственной нейронной сети Элмана (рис. 1): а1 Ос) = Ьапгщ (ЛУ^р +■ ¿ИГ11ра1& - 1) 4- й1) •

аг = ритеИп^иг^аЧк) + Ь2\

Преимуществом нейронной сети Элмана является повышенная устойчивость, поскольку в ней обратные связи заведены из выходов внутренних нейронов на промежуточный слой, что делает ее более устойчивой по сравнению с рекуррентной сетью аналогичного типа (например, нейронная сеть Хопфилда, в которой внутренние обратные связи подводятся к первичным входам,

где происходит смешивание сигналов). Кроме того, нейронная сеть Элмана позволяет учитывать предысторию наблюдаемых процессов и накапливать информацию для выбора правильной стратегии управления роботом.

В системе МаНаЬ / Б1тиНпк создана модель искусственной нейронной сети для управления манипуляционным роботом, содержащая входной слой из 15 нейронов и скрытый слой в вариантах от 12 до 19 нейронов, которые имеют локальные обратные связи через линии задержки. Выходной слой содержит 1 нейрон с линейной функцией активации (ригеНп) (см. рис. 2).

Состояние нейронов рекуррентного слоя сети опишем следующими уравнениями:

[пЧО = Ш^УО - 1) + (Да1 (о) = 4

(12)

I1 (jfc) = йиш^п1^)).

Линейный слой нейронной сети является безынерционным, а состояние его нейронов определяется соотношениями:

и2 а> = + ъ2

(13)

а2 [к) = ригеИп(п2

Рекурентный map Линейный ]

Рис. 1. Структура нейронной сети

Л

J

Рис. 2. Структурная модель искусственной нейронной сети управления промышленным трехзвенным манипуляционным роботом

Последовательность значений выходного сигнала, который попадает на линию обратной связи с задержкой, содержащей N-1 блоков опоздания z-1, а выход линии задержки, который состоит из значений входа в момент времени k, k-1,..., k-N-1, опишем следующим выражением: ö(Jt) = 2|t=1w1.a(fe-t + l) + b. (14)

Угол поворота манипулятора представим в виде общей переменной и = (ulru2}r, где и1

- настоящий угол поворота первого звена и и2

- настоящий угол поворота второго звена. Поскольку в этом примере у = (у^уг)1 = (0,0}т, поэтому удовлетворяются равенства

z = (zlrz2)r = и

и

где r1 и r2 - желаемые углы поворота манипулятора; z - управляемая траектория манипулятора, v - дополнительная траектория манипулятора, y - вектор состояния манипулятора.

Для описания изменений желаемых углов поворота манипулятора используем следующие законы: r1(t) = sin(t) и r2(t) = cos(t).

Опишем модель нейронной схемы адаптивного управления манипулятором с помощью такого уравнения состояний с переменной структурой:

!—а — |v|, если и > v;

О, если и = и; а + |г|, если и < v.

(16)

где и ЕЖ" - вектор состояний, а 6 Л" - постоянный параметр,

¡1, если и > V;

О, если и = v, (17) — 1, если и < v.

Для получения решений представленного уравнения численным методом используем соответствующие два разностных уравнения с шагами по времени &t1 = üfc2 = 1.0 X 10_э • Элементы функции |г| в этих уравнениях вычисляют как конечные разности первого порядка (разностные коэффициенты Ньютона). В указанных уравнениях равенство и = г заменяется на неравенство \и — г\ < 0,0 lv.

Обучение сети (корректировку весовых коэффициентов и смещений нейронов до достижения заданной ошибки) будем проводить с использованием метода сопряженных градиентов (Флетчера-Ривса), которому свойственна хорошая сходимость вычислительного процесса: для положительно определенной квадратичной функции от n переменных минимум достигается не более чем через n шагов.

Алгоритм обучения нейронной сети состоит из следующих шагов:

1. В начальный момент времени 1=1 все нейроны скрытого слоя устанавливаются в нулевое положение - исходное значение равно нулю.

2. Входное значение подается на сеть, где происходит его прямое распространение.

3. Согласно выбранному алгоритму Флетче-ра-Ривса, который по сравнению с алгоритмом градиентного спуска, регулирует скорость сходимости не только за счет настройки параметра скорости, но и корректирует размер шага на каждой итерации, достижение установленного значения ошибки выполним за минимальное количество итераций.

4. Установим 1=1+1 и осуществим переход на 2 шаг. Обучение нейронной сети выполняется до тех пор, пока суммарная среднеквадратичная погрешность сети не примет наименьшее значение.

3.2. Проектирование компенсатора с адаптивной радиальной базовой функцией нейронной сети для аппроксимации локальной модели

В этой части разрабатывается компенсатор нелинейной динамической модели на основе нейронной сети RBF на основе литературы (2) и (3), который сравнивается с компенсатором нейронной сети в предыдущей части.

м*Ш + сх{м,ц)± + = Т, (18)

где Мж(д)± — матрица момента инерции порядка п*п, ' — вектор центробежной силы порядка п*п, 6Х (£?)— вектор силы тяжести порядка п*1, q — вектор, представляющий переменную сустава, а т — вектор приложенного крутящего момента в суставе.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Динамическое уравнение манипулятора обладает следующими свойствами

Свойство 1. Матрица инерции Мж ) является симметричной положительно определенной;

Свойство 2. Если определяет-

ся правилом записи Кристоффеля, матрица -^(Ч) — кососимметрична.

Поскольку и 6х (ц) являются просто

функциями q, их можно моделировать с помощью статических нейронных сетей.

3*к(я) = Е] Ри1ы(я) + £кк(.я) = Р^Лч) +

(19)

Среди них вкп,ра ЕЙ— веса нейронной сети; ^к^ХЯ^'ЧиЕИ — радиальная базисная функция, входом которой является вектор q, Екк(ч) е Я — ошибки моделирования тжк}-(я) и дяГк(ч) соответственно и считаются ограниченными.

Для ¿¡} моделирование с помощью динамической нейронной сети с входными данными q и q. Модель нейронной сети (д, 17) имеет вид

(20)

Среди них z = [q'1 q'1]1 Е R27í-,akjí Е R -радиальная базисная функция входного вектора f¡rü(X) t Я - ошибка моделирования элемента cxkj (.Я' Á)> в предположении, что он также ограничен.

Используя нейросетевое моделирование, динамическое уравнение манипулятора в пространстве можно записать в виде

Mx(_q)x + Cx(_q,q)x + Gx(_q) = Fx. (21)

Среди них

= + írfJtjOi):

cXk} (.Я- $ = «íjíjt/ W + ¿ckj GO: (22) ЗхЛя) = PkVk(.4) + £Вк(я)-

Используя матрицы GL и их операции умножения, можно записать с помощью

MKtq) = [{9}т ■ {S(q)}] + EH(q). (23)

где {9} и {S(q)] - матрицы GL, элементами которых являются Of.* и Íí;fa) t RTí>' - матрица, элементами которой являются ошибки моделирования (q).

Аналогично, для C(q, q)n Gx(_q) существуют

= №■№)}] + £c(z);

где {Л}, (Z(z)}, {В}, {В} - матрицы GL и векторы GL, элементами которых являются akr ft; адей"^ and ШЕГ

— элементы, матрицы ошибок моделирования £rt;(z)M соответственно.

Предполагая, что 1 — это идеальная траектория рабочего пространства, тогда 2 и 2 — это идеальная скорость и идеальное ускорение. ¿P(t) = ¿d(t) + Ae(t); r(t) = i,(t)-r(t) = ё(0 +Ae(t) где Л — положительно определенная матрица.

Лемма 1 (лемма Барбала): если функция h:R^R — равномерная непрерывная функция, определенная на [0,+^), lim_(t^^)J_0Ath(5)d существует и конечна, то lim_(t->°°)h(t)=0.

Лемма 2. Let e(t) = h(t) *r(t), где * представляет собой свертку, h(t~) = ff(s) и Н (s) является строго экспоненциально устойчивой передаточной функцией порядка п*п. Если г Е ¿2, то е e¿" nL^i е L^.e непрерывно е -» 0, г -*■ 0,ё 0 при t—

Рассмотрим систему SISO второго порядка, пусть е 0, т 0, ё 0, тогда мы можем получить = + s) и = — r(s~). Чтобы гарантировать, что H(s) является"7строго экспоненциально стабильной передаточной функцией, можно определить, что с>0. Если вышеуказанные условия выполнены и r(t) = 0, можно получить r(t) = 0, ce(t)+e(t)=0, что обеспечивает экспоненциальную замкнутость системы.

Используя i для представления оценочно-

(25)

го значения, зададим СО = (") — (5), затем и [В] представляют собой формулы {8}, {А} и {В } оценки.

Конструктивно контроллер выполнен в виде Рх = [{¿}т ■ + № ■ №)}]хг+

+ [ф]1 ■ {Я(*)}] + Кт + кя 5№(г). (26)

где К е Я"*» >0;кя>НЕ\\;Е = ЕНШ,+Ес(_г)хг+ . Первые три члена регулятора - управление на основе модели, член К_г эквивалентен управлению с пропорциональной производной (РБ), а последний член закона управления является надежным членом, который подавляет ошибку моделирования нейронной сети.

Из выражения регулятора очевидно, что регулятору не нужно решать обратную матрицу Якоби. В реальном управлении проигравший может быть получен с помощью т = /т (q)Fx.

Подставляя уравнения (23) и (24) в уравнения (21), можно получить {[{0}т ■ т)}] + + ■ {ВДЯ + ЕС(Х}}*;

+[{Я}Т ■{*(«?)}]+Я<з(ч) = Г*-

(27)

Подставляя закон управления (26) в приведенную выше формулу, можно получить

{[{0}т ■ №)}] + + ■ {гш + +ЯсС03* + [{В}т ■ {НШ] + = = Шт ■ {ЭДЖ ■+ [{Л}т ■ №)}]*, +

+[{5}т ■ {ЯИ}] + Кг + кв .

Подставляя х=хг-г и х=хг-г в приведенное выше уравнение, мы можем получить ([{0}т РМЯ+ЕиШ*г-*) + аУ}т-{г(г)}] + +яс(У)}аг-г)+[{5}т ■ (ж,)}]+ем= = [{ё}т ■ ««Й*, + [{А? ■ ШШл [(¿г ■ (Я(?))] +Кг + к,58п(г).

(29)

Подставляя уравнения (23) и (24) в приведенные выше уравнения, мы можем получить + Сх{_ц, (От + Кг + ейп(Г) =

= [{5}т ■ <В(ч)}]хг + [{Ау ■ + [(5}т ■ {Я(ч)}] + Е.

(30)

Для замкнутой системы, если К>0,к,>//Е//па-раллелен, а адаптивный закон устроен как

(28)

&к (31)

Рк =

Среди них

Гк=Г?>0;(}к = <г];>0;Пк=^>0 и

6к и ак - векторы 0 *_к и а я_к соответственно, тогда в}р а{ ■ ¡Зк Е Ь ,.„е € Ь*2 Ш*, е непрерывно, и е^О и е '-»О при

В соответствии с интегральной линейной функцией Ляпунова, предложенной в ссылке, ее можно проанализировать на устойчивость следующим образом.

Среди них Гк = Гкт > 0;& = <?£> О; = Л^ > О и и ак— векторы 0 я_к и а я_к соответственно, тогдаяг ■ Дк е £ _.,е Е 1*2 Г\Ь*,е непрерывно,

и е^0 и е при

В соответствии с интегральной линейной функцией Ляпунова, предложенной в ссылке, ее можно проанализировать на устойчивость следующим образом.

^ + Й^ГА- (32)

Среди них Г_к ч ч К_ка являются положительно определенными парно-секундными матрицами. Производная по V, получаем

V = гТМкт + + Е]^! №4 +

+ (33)

Так как матрица Мг(q} — 17) кососим-

метрична, то гг(М, — 2 С,)г= О, можно получить приведенную выше формулу

Подставляя уравнение (30) в приведенное выше уравнение, мы можем получить V = -гтКг- ку^ф) + {вку ■ [ШШл + П--, «I ■ (ШЖг,

(36)

Подставим адаптивный закон (31) в формулу (36) и объединим неравенство кп > II Е Цпарал-лельно, получим

V = -г1 Кг - кхг15£п(г~) + гт£ < 0. (37)

Анализ конвергенции:

(1) Из V — гт Кг 0 , из леммы е Е Щ ПЦ1 ,ё ЕП^,е, ееЬ2 непрерывно, то при I -» со, е —■► О.ё -*■ О

(2) Из V < -гт К получаем 0<У№<У(0),М>0 . Следовательно, когда У^еЬ., существуют ак,рк Е Ь: и 8к,ак,рк Е Ь 0

4. МОДЕЛИРОВАНИЕ

В этом разделе представлены результаты моделирования, показывающие работу предлагаемого адаптивного нейроконтроллера. В этом разделе предложенная схема управления применяется к двухзвенному проекту, математическая модель которого была разработана в пакете БоМшогкз и импортирована в пакет МАТЬАБ вторым поколением БтиНпк [22].

Изначально первое звено перемещается, а второе нет. Показано, что после обучения первого звена отрабатываются внешние возмущения. Затем второе звено начинает двигаться, а первое останавливается. После этого оба звена перемещаются, оказывая динамические возмущения на каждое звено. Его динамическое уравнение

M(q)q + C(_q, q)q + G{q) = т + d:

- \v + ч1 + 2vcos(.fl2) fl1 + ч^а^чЩ.

w L ¿jl + ¿J2COS(¿J2> ql Г

C(q,q)

-ql i;2sin([j2) q2 qlsin(íj2)

-tj2(ql + ij2)sin(t;2) 0

G(_q> = ['

\gcosql + g cos(tjl + tj2)l

g cos(tjl + tj2)

где известное параметров v=12, q1=9, q2=8, g=9.8, внешние помехи системы d = di +d2|H| + d||é|||,dl=2, d2=3, d3=6 .Предположим, что ожидаемые инструкции по отслеживанию угла звеньев и угловой скорости являются следующим уравнением

qld = 1 + 0.2síii(0.5tií);

0.2cos (0.5tií).

Ч2Л = 1

Начальное состояние системы дЗ АТ= [0.6 0.3 0.5 0.5ГТ , предполагаем ДМ = 0.2М, . При моделировании используем формулу закона управления и формулу адаптивного закона: а = 2,у = 20, к = 0,001, В нейронной сети параметры функции Гаусса установлены на с=[-2 -1 0 1 2] и Ь=3 , начальный вес 0,1Т

Параметры моделирования робота-манипулятора следующие:

Ц1):'яНш', [-180 180]*ёе£'т', 0, ...'¡ш', 200е-6, ...'С, -62.6111, ...'Б', 1.48е-3;

Ь(2) :'яИш',[-180 180]'^ ;'ш', 17.4, ...'¡ш', 200е-6, ...'С, 107.815, ...'В', .817е-3.

141 0.4-

0.6

Рис. 3. Механическая модель робота-манипулятора

1) имитационное моделирование нейронных сетей БЬшап

Из рис. 4 видно, что в случае адаптивной компенсации на начальном этапе имеет место некоторая степень возмущения, а угловая скорость и положение имеют тенденцию к сближению.

Рис. 4. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации Эльмана

Рис. 5. Аппроксимация внешнего возмущения и функции ^х) с адаптивной компенсацией Эльмана

Рис. 6. Ошибка между идеальной траекторией и реальной траекторией

Из графиков (рис. 5, 6) видно, что возмущения практически полностью скомпенсированы, а процесс управления роботом вполне удовлетворительный.

Экспериментальные результаты также доказывают, что предложенный подход достаточно устойчив к динамическим возмущениям, вызванным взаимным влиянием динамики звеньев. Предлагаемый метод управления является оригинальным и успешно использует преимущества SMC, нейросетевого и адаптивного управления.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2) Имитационное моделирование нейронных сетей RBF

Для аппроксимации каждого элемента ^(ij) and Gjr((j) входом нейронной сети RBF является q, рассчитанное количество точек скрытого слоя равно 7. Для аппроксимации каждого элемента вход нейронной сети RBF равен (q, q~), a количество точек скрытого слоя дизайна равно 7.

ПараметрывсехфункцийГауссапринимаются как с; = [-1.5 -1.0 —0.5 0 0.5 1.0 1.5] и Ь;= 10 , а начальное значение нейронной сети установлено равным 0 . Закон управления принимает формулу (26), а адаптивный закон принимает формулу (31). Выгода выбирается как К = ^ ,к_5=0,5. Из леммы 2

желательно, чтобы Л = Параметры

адаптивного закона (31) принимаются как \\

Г* = йШ2.01 = садо.ю} и л* = ¿щ&Я}

Результаты моделирования показаны на рис. 7 и рис. 8.

Как видно из рис.8, в начале моделирования значение ошибки относительно велико из-за фазы обучения нейронной сети управляющему входу. Когда нейросетевой компенсатор проходит обучение, ошибки в основном аннулируются, а траектория движения и расчетное значение сходятся.

Рис. 7. Вход управления для каналов 1 и каналов 2

Рис. 8. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации ЯБР

Рис. 9. Аппроксимация для переменных Шд.(с;)II, II С^О?' II и I ^(с?) II

Поскольку траектория слежения не является непрерывным возбуждением, оценочные значения Н40М)И и 140?)И не сходятся к \МХШ1 IIСХСч- II и 16,(4)11 которые часто встречаются в инженерной практике. Из моделирования двух нейронных сетей видно, что, хотя нейронная сеть ЯБР имеет более высокую скорость обучения и обучения при том же планировании траектории, общая точность ошибок меньше, чем у Элмана. Но если есть больше условий помех и неопределенной среды, общие результаты обучения ЯБР лучше.

ЗАКЛЮЧЕНИЕ

Таким образом, подводя итоги исследования, можно сделать следующие выводы. В ходе исследования качество выполнения роботом конкретных задач зависит не только от качества материала, из которого он изготовлен, качества подвижных частей, но и от качества математических моделей, в которых эффективность и точность управления роботом основаны на анализе его динамической модели и уменьшают погрешность между запланированной и фактической траекториями. В данной статье показана нейронная сеть, отличающаяся тем, что разработана модель двух адаптивной нейронной схемы управления нелинейными динамическими системами манипулятивного робота на основе рекуррентной сети Элмана. Обоснован выбор архитектуры сети и предложен алгоритм ее обучения методом сопряженных градиентов. Моделирование адаптивной нейронной сети ЯБР показывает, что хотя она имеет более быстрое время отклика, но при отсутствии непрерывного возбуждения система не сходится и значение ошибки намного больше, чем у сети Элмана.

Модель вращения плоского манипулятора описывается дифференциальным уравнением первого порядка с переменной структурой и выходным уравнением. Модель имеет простую структуру и может быть использована, когда неизвестны внутренняя динамика и параметры управляемой системы. Компьютерное моделирование применения модели оптимального управления слежением за углом поворота манипулятора подтверждает теоретические положения и демонстрирует высокую эффективность ее функционирования.

Этот метод также может быть применен к моделированию манипулятора с несколькими степенями свободы. В то же время модель может быть использована в методе адаптивного управления манипулятором после доработки.

СПИСОК ЛИТЕРАТУРЫ

1. A.-V. Duka, "Neural Network based Inverse Kinematics Solution for Trajectory Tracking of a Robotic Arm," Procedia Technology, vol. 12, pp. 2027, Dec. 2014, doi: 10.1016/j.protcy.2013.12.451.

2. Y. H. Kim and F. L. Lewis, "Neural network output feedback control of robot manipulators," IEEE Transactions on Robotics and Automation, vol. 15, no. 2, pp. 301-309, Apr. 1999, doi: 10.1109/70.760351.

3. S. Islam and P. Liu, "Robust Sliding Mode Control for Robot Manipulators," Industrial Electronics, IEEE Transactions on, vol. 58, pp. 2444-2453, Jul. 2011, doi: 10.1109/TIE.2010.2062472.

4. Yazdanpanah M. J. and Karimian Khosrowshahi G., "Robust control of mobile robots using the computed torque plus H» compensation method," 632249139440000000. https://www.sciencegate.app/ document/10.1109/cdc.2003.1273069 (accessed Jun. 29, 2022).

5. R. E. N, R. N. V, and Y. Zhengjie, "Neural network compensation of dynamic errors in a position control system of a robot manipulator," Computing, Telecommunication and Control, vol. 64, no. 1, pp. 53-64, 2020, doi: 10.18721/JCSTCS.13105.

6. F. W. Lewis, S. Jagannathan, and A. Yesildirak, Neural Network Control Of Robot Manipulators And NonLinear Systems. CRC Press, 2020.

7. K. Kara, T. Missoum, K. Hemsas, and M. Hadjili, "Control of a robotic manipulator using neural network based predictive control," Dec. 2010, pp. 1104-1107. doi: 10.1109/ICECS.2010.5724709.

8. S. Seshagiri and H. Khalil, "Output Feedback Control of Nonlinear Systems Using RBF Neural Networks," Neural Networks, IEEE Transactions on, vol. 11, pp. 69-79, Feb. 2000, doi: 10.1109/72.822511.

9. I. V. Tetko, V. Kúrková, P. Karpov, and F. Theis, Artificial Neural Networks and Machine Learning - ICANN 2019: Theoretical Neural Computation: 28th International Conference on Artificial Neural Networks, Munich, Germany, September 17-19, 2019, Proceedings, Part I. Springer Nature, 2019.

10. M. W. Spong and M. Vidyasagar, Robot dynamics and control. New York: John Wiley & Sons, 1989.

11. Y. Zhengjie, E. Rostova, and N. Rostov, "Neural Network Compensation of Dynamic Errors in a Robot Manipulator Programmed Control System," 2020, pp. 554-563. doi: 10.1007/978-3-030-34983-7_54.

12. L. Y.-J, T. S.-C, W. D, L. T.-S, and C. C.l.p, "Adaptive neural output feedback controller design with reduced-order observer for a class of uncertain nonlinear SISO Systems," UM, vol. 22, no. 8, 2011, doi: 10.1109/TNN.2011.2159865.

13. Z. Liu, G. Lai, Y. Zhang, X. Chen, andC. Chen, "Adaptive Neural Control for a Class of Nonlinear Time-Varying Delay Systems With Unknown Hysteresis," IEEE transactions on neural networks and learning systems, vol. 25, pp. 2129-40, Dec. 2014, doi: 10.1109/ TNNLS.2014.2305717.

14. N. Duan and H.-F. Min, "NN-based output tracking for more general stochastic nonlinear systems with unknown control coefficients," Int. J. Autom. Comput., vol. 14, no. 3, pp. 350-359, Jun. 2017, doi: 10.1007/s11633-015-0936-4.

15. B. Luo, D. Liu, X. Yang, and H. Ma, "H » Control Synthesis for Linear Parabolic PDE Systems with

Model-Free Policy Iteration," in Advances in Neural Networks - ISNN 2015, Cham, 2015, pp. 81-90. doi: 10.1007/978-3-319-25393-0_10.

16. C. Chen, Z. Liu, K. Xie, Y. Zhang, and C. L. Philip Chen, "Adaptive neural control of MIMO stochastic systems with unknown high-frequency gains," Inf. Sci., vol. 418, no. C, pp. 513-530, Dec. 2017, doi: 10.1016/j. ins.2017.08.027.

17. Y. Chen, J. Liu, H. Wang, Z. Pan, and S. Han, "Modelfree based adaptive RBF neural network control for a rehabilitation exoskeleton," Jun. 2019, pp. 42084213. doi: 10.1109/CCDC.2019.8833204.

18. M. Wang and A. Yang, "Dynamic Learning From Adaptive Neural Control of Robot Manipulators With Prescribed Performance," IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 47, no. 8, pp. 2244-2255, 2017, doi: 10.1109/ TSMC.2016.2645942.

19. M.-D. Tran and H.-J. Kang, "Nonsingular Terminal Sliding Mode Control of Uncertain Second-Order

Nonlinear Systems," Mathematical Problems in Engineering, vol. 2015, p. e181737, Oct. 2015, doi: 10.1155/2015/181737.

20. R. Ortega and M. W. Spong, "Adaptive motion control of rigid robots: a tutorial," in Proceedings of the 27th IEEE Conference on Decision and Control, 1988, pp. 1575-1584 vol.2. doi: 10.1109/CDC.1988.194594.

21. S. S. Ge, C. C. Hang, and L. C. Woon, "Adaptive neural network control of robot manipulators in task space," IEEE Transactions on Industrial Electronics, vol. 44, no. 6, pp. 746-752, 1997, doi: 10.1109/41.649934.

22. "Design and implementation of a RoBO-2L MATLAB toolbox for a motion control of a robotic manipulator." https://ieeexplore.ieee.org/document/7473678/ (accessed Jun. 30, 2022).

23. S.Kh. Zabihifar,A.Kh.D.Markazi, andA. S. Yushchenko, "Two link manipulator control using fuzzy sliding mode approach," Herald of the Bauman Moscow State Technical University. Series Instrument Engineering, Dec. 2015, doi: 10.18698/0236-3933-2015-6-30-45.

INCREASING THE ACCURACY OF THE ROBOT BY USING NEURAL NETWORKS (NEURAL COMPENSATORS AND NONLINEAR DYNAMICS)

1 Peter the Great St. Petersburg Polytechnic University, St. Petersburg, Russia

2 Mingzu University of China, Beijing, China

The subject of this article is a programmable control system for a robotic arm. The complex nonlinear dynamics associated with the practical application of systems and manipulators is considered. The traditional control method is replaced by the developed Elma system and the adaptive radial neural network core function, which improves system stability and response speed. With the help of software associated with MATLAB, the corresponding controllers and compensators are developed. The results of training a neural network controller for programming robot trajectories are presented. Dynamic errors of various types of neural network controllers and two control methods are analyzed. Keywords: robotic arm, programmable control system, neural network, nonlinear multidimensional compensators, modeling, dynamic analysis, dynamic errors. DOI: 10.37313/1990-5378-2022-24-4-106-115

Yan Zhengjie, Assistant Lecturer of the Higher School of Engineering and Economics. E-mail: yanzhengjie1019@gmail.com Yury Klochkov, Doctor of Technical Sciences, Associate Professor, Vice-Rector for Scientific and Organizational Activities. E-mail: y.kloch@gmail.com Xi Lin, Associate Professor of the Department of Mathematics. E-mail: xilin@muc.edu.cn

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Чжэнцзе Янь, Клочков Ю.С., Лин Си

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Чжэнцзе Янь, Клочков Ю.С., Лин Си

INCREASING THE ACCURACY OF THE ROBOT BY USING NEURAL NETWORKS (NEURAL COMPENSATORS AND NONLINEAR DYNAMICS)

Текст научной работы на тему «ПОВЫШЕНИЕ ТОЧНОСТЬ РАБОТЫ РОБОТА ЗА СЧЕТ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТИ (НЕЙРОННЫХ КОМПЕНСАТОРОВ И НЕЛИНЕЙНОЙ ДИНАМИКИ)»