Научная статья на тему 'ЭФФЕКТИВНАЯ МЕТОДОЛОГИЯ СБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ ОБРАТНОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ МАНИПУЛЯТОРА НА ОСНОВЕ АНАЛИТИЧЕСКОГО МЕТОДА. I'

ЭФФЕКТИВНАЯ МЕТОДОЛОГИЯ СБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ ОБРАТНОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ МАНИПУЛЯТОРА НА ОСНОВЕ АНАЛИТИЧЕСКОГО МЕТОДА. I Текст научной статьи по специальности «Математика»

CC BY
24
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СБОР ДАННЫХ / ОБРАТНАЯ ДИНАМИКА / ОБУЧЕНИЕ МОДЕЛИ / МЕТОД ДЕНАВИТА ХАРТЕНБЕРГА / МАНИПУЛЯТОР

Аннотация научной статьи по математике, автор научной работы — Ситник Сергей Михайлович, Ту Раин

В последние несколько лет обучение обратных динамических моделей манипуляторов по данным показало значительные успехи и стало прогрессивно развивающейся темой динамического моделирования манипуляторов. В этой статье мы представили эффективную методологию сбора данных для обучения модели обратной динамики. Метод основан на параметрической физической модели манипулятора, полученной из динамики твёрдого тела с использованием аналитического метода. Наша методология состоит из метода Денавита Хартенберга для создания рабочей зоны манипулятора. Полученные наборы данных подтверждены результатами кинематического и динамического моделирования тестируемого манипулятора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN EFFICIENT DATA ACQUISITION METHODOLOGY FOR INVERSE DYNAMICS MODEL LEARNING OF MANIPULATOR BASED ON ANALYTICAL METHOD. I

In the last few years, learning inverse dynamic models of manipulators from data has shown considerable successes and become a progressively developing topic in dynamic modeling of manipulators. In this paper, we presented an efficient data acquisition methodology for inverse dynamics model learning. Our method is based around the parametric physical model of a manipulator that obtained from the rigid body dynamics using the analytical method. Our framework consists of Denavit Hartenberg method for the generation of the manipulator workspace. The received datasets are validated by the results of simulation of kinematic and dynamic modeling of the tested manipulator.

Текст научной работы на тему «ЭФФЕКТИВНАЯ МЕТОДОЛОГИЯ СБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ ОБРАТНОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ МАНИПУЛЯТОРА НА ОСНОВЕ АНАЛИТИЧЕСКОГО МЕТОДА. I»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Челябинский физико-математический журнал. 2023. Т. 8, вып. 1. С. 140-145.

УДК 004.896 Б01: 10.47475/2500-0101-2023-18113

ЭФФЕКТИВНАЯ МЕТОДОЛОГИЯ СБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ ОБРАТНОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ МАНИПУЛЯТОРА НА ОСНОВЕ АНАЛИТИЧЕСКОГО МЕТОДА. I

С. М. Ситник", Ту Раинь

Белгородский государственный национальный исследовательский университет, Белгород, Россия

"[email protected], ь[email protected]

В последние несколько лет обучение обратных динамических моделей манипуляторов по данным показало значительные успехи и стало прогрессивно развивающейся темой динамического моделирования манипуляторов. В этой статье мы представили эффективную методологию сбора данных для обучения модели обратной динамики. Метод основан на параметрической физической модели манипулятора, полученной из динамики твёрдого тела с использованием аналитического метода. Наша методология состоит из метода Денавита — Хартенберга для создания рабочей зоны манипулятора. Полученные наборы данных подтверждены результатами кинематического и динамического моделирования тестируемого манипулятора.

Ключевые слова: сбор данных, обратная динамика, обучение модели, метод Денавита — Хартенберга, манипулятор.

Введение

В последние несколько лет обучение модели обратной динамики стало интересным инструментом для робототехники в таких приложениях, как оценка силы и управление силой манипуляторов и антропоморфных роботов [1; 2]. Основная цель модели обратной динамики состоит в том, чтобы предсказать управляющее воздействие (крутящие моменты сочленений робота) между двумя состояниями. В адаптивном управлении, например, параметры динамики постоянно корректируются, в то время как обратная динамическая модель используется для прогнозирования крутящих моментов, необходимых для достижения желаемой траектории. При обучении модели обратная динамическая модель манипулятора обычно обучается на обучающих наборах данных (т. е. состояниях и действиях), которые собираются, когда манипулятор выполняет свои траектории.

Поскольку эффективность обучающих наборов данных имеет решающее значение для обучения модели в практических приложениях, эффективная методология сбора данных важна для обучения модели обратной динамики. Обучающие данные для модели обратной динамики обычно поступают от выполнения траекторий реальным манипулятором, для которого должна быть изучена модель. Однако предыдущие подходы обычно выполняли такой сбор данных неэффективным образом. Несмотря на многообещающие результаты, индивидуальные диапазоны выбор-

ки требуют значительных человеческих усилий. Поэтому существующие методы не подходят для решения задач обратной динамики для манипуляторов.

Чтобы решить вышеуказанные проблемы, в этой статье мы предлагаем простой и эффективный метод сбора данных, основанный на аналитическом методе. В предлагаемом методе мы получаем данные, необходимые для обучения нашей модели обратной динамики путём записи совместных состояний манипулятора во все моменты его движения. Работа разделена на две части. В первой части подробно описываются методология и алгоритмы предлагаемого метода сбора данных. В следующей части будут представлены полученные численные результаты и проведена проверка модели на адекватность.

Математическая модель

В этом разделе представлена методология сбора данных для обучения обратной динамической модели манипулятора на основе аналитического метода. В данной работе в качестве объекта исследования для экспериментов используется манипулятор с пятью степенями свободы, см. [3; 4].

В процедуре предлагаемого метода сбора данных для обучения манипулятора обратной динамике существуют четыре этапа:

1) создание модели рабочей зоны манипулятора;

2) обратная задача кинематики манипулятора;

3) генерация траектории;

4) обратная задача динамики манипулятора.

План сбора данных представляет собой перемещение манипулятора из исходной точки в другую точку рабочей зоны по определённой траектории. Следует отметить, что рабочая зона, которую мы берём, должна находиться вдали от сингулярностей, поэтому граница нашего рабочей зоны должна оставаться на некотором пороговом расстоянии от границ фактической рабочей зоны. Мы принимаем полиномиальные функции для генерации нашей траектории. Полиномиальная функция 3-й степени используется для генерации траектории. Из граничных условий вычисляем все коэффициенты полинома. Затем мы используем их для создания траектории между точкой исходного положения и любыми точками в рабочей зоне. Затем на каждом шаге значения углов, скорости и желаемого ускорения сочленений передаются в аналитическую модель обратной динамики для расчёта необходимых крутящих моментов. Впоследствии эти процедуры повторяются на каждом временном шаге до тех пор, пока схват манипулятора не достигнет желаемого положения в рабочей зоне. Тем временем записываются данные о состоянии сочленений, поступающие от манипулятора, вместе с данными о приложенном крутящем

Рис. 1. Параметры Денавита — Хартенберга (Д-Х) и системы координат экспериментального

манипулятора

моменте на каждом временном шаге. Точно так же выполняются многие такие траектории и собираются данные. Повторив описанную выше процедуру, мы собрали около 1800000 обучающих выборок.

Экспериментальный манипулятор обладает пятью подвижными звеньями и вращательными кинематическими парами. Базовая система координат и системы координат прикреплены к звеньям манипулятора (см. рис. 1). В качестве вектора

обобщённых координат выбирается следующий: 9 = (9^ 92, 93, 94)т. Параметры Де-навита —Хартенберга (Д-Х) манипулятора на основе систем координат показаны в таблице.

Параметры Денавита — Хартенберга (Д-Х) манипулятора

звено а(м) а(радиан) а(м) 0(радиан)

1 0 п/2 0,104 О1

2 0,246 0 0 О2 + п/2

3 0,163 0 0 0з

4 0 —п/2 0 04 + п/2

5 0 0 0,165 05

В прямой кинематике манипулятора формулируются положение и ориентация схвата манипулятора для заданному вектору обобщённых координат 9 = (91? 92,93, 94)т сочленений. Положение и ориентацию схвата будем искать в форме матрицы однородного

преобразования Т =

, где Я — матрица поворота 3 х 3, задающая ори-

Я р 000 1

ентацию схвата; р — вектор 3 х 1, задающий положение схвата.

Матрицы однородного преобразования оцениваются на основе правила преобразования координат с помощью параметров Д-Х. Согласно правилам Денавита — Хартенберга, однородная матрица

Л

задаёт переход от системы координат г-го звена к его новой системе координат. Возьмём а1 = п/2, а2 = 0, а3 = 0, а4 = —п/2, а5 = 0, матрицы Л1, А2, А3, А4, Л5 представляются в виде

( с9г — 89гсаг 89г8аг агс9г \

89г с9гс9г —с89гаг аг89г

0 8аг аг ¿г

0 0 0 1

А1

( с91 0 в91 0 \

э91 0 —с91 0

А3

0 1 0 0 0 0

( с9з —з9з в9з с9з 00 00

Ля

¿1 1

0 а2с9з \

0 а2в93 10

01

Л2

( с92 —892 892 с92 00 00

0 а2с92 0 а2892 10 1

0

Л,

4=

/ с94 0 894 0 \

894 0 —с94 0

0 1 0 0

V 0 0 0 1 /

с95 — 895 0 0

895 с95 0 0

0 0 1 ¿5

0 0 0 1 )

Тогда матрица однородного преобразования Т5 принимает вид

( Пх Ох ах рх ^

Т5 = Л1Л2Л3 Л4Л5 = ПУ Оу ау РУ

П Ог ах рг 0001

Выполняя необходимые вычисления, получим ориентацию схвата:

Пх П

= 8185 — с5[с4(с1828з — с^сз) + 84(с1с28з + ^382)], у с185 с5 [с4 (818283 — с2сз81) + 84(с2818з + сз8^)],

П

с5 (с4823 + 84с23) ,

Ох = + [С^С^ЗЗ - С1С2С3) + 34(^33 + С^з^}], Оу = -С1С5 + З5[С4(З1З2З3 - С203^1) + 34^3^3 + С33^)], Ог = -35[С4(С233 + 03^2) + £4^3 - 3233)],

ах — С4 (С1С233 + С1С332) — 34(с13233 — С1С2С3) , ау = С4(С23133 + С33132) - 34(313233 - С10231), аг = 34(0233 + 03^2) - 04(0203 - 3233).

Также находим координаты положения схвата:

Рх = 4^(^3233 + 010332) - 34(013233 - 010203)] + а2^2 + а3010203 - а3013233, Ру = ^5 [04(023133 + 033132) - 34(313233 - 020331)] + а20231 + а3020331 - а3313233, Рг = + а232 - 4 ^4^3 - 3233) - 34^3 + 3302)] + а30233 + а30332.

Учитывая ограничения углов относительно поворота сочленений звеньев (-п/2 ^ ,6^,6^,6^,6^ ^ п/2) с интервалом 0.02 рад, можно определить рабочую зону манипулятора, как показано на рис. 2.

0.6 0.6

Рис. 2. Рабочая зона манипулятора при ограничении углов относительно поворота звеньев (-п/2 ^ в\, в2, 03, в4, в5 ^ п/2)

Заключение

В этой статье мы представили эффективную методологию сбора данных для обучения модели обратной динамики манипулятора. Метод основан на моделировании манипулятора с использованием аналитического метода. С помощью предложенного алгоритма набор обучающих данных для обучения модели обратной динамики был собран автономно. Преимущества метода действительны во всём пространстве состояний при низкой вычислительной сложности при создании обучающих наборов данных для обучения модели. Другими преимуществами являются производительность труда и экономичность, поскольку нет необходимости выполнять траектории реальным манипулятором, для которого должна быть изучена

модель. Предлагаемый метод может быть использован для любого манипулятора, динамические параметры которого известны.

Список литературы

1. NairA., ChenD., AgrawalP., IsolaP., AbbeelP., MalikJ., LevineS. Combining selfsupervised learning and imitation for vision-based rope manipulation // Proceedings of IEEE Internatinal Conference on Robotics and Automation (ICRA). 2017. P. 2146-2153.

2. Nguyen-TuongD., Peters J. Model learning for robot control: A survey // Cognitive Processing. 2011. Vol. 12, no. 4. P. 319-340.

3. Ту Раин, Ян Найнг Со. Моделирование динамики манипулятора с использованием адаптивной нейро-нечёткой системы вывода // Моделирование, оптимизация и информационные технологии. 2019. Т. 7, № 4. С. 362-377.

4. Ту Раин, Довгаль В. М., Ян Найнг Со. Моделирование кинематического управления роботом-манипулятором «Intelbot» на основе адаптивной нейро-нечеткой системы вывода (ANFIS) // Науч. ведомости БелГУ. Сер. Экономика. Информатика. 2018. Т. 45, № 3. С. 497-509.

Поступила в 'редакцию 30.12.2022. После переработки 08.02.2023.

Сведения об авторах

Ситник Сергей Михайлович, доктор физико-математических наук, профессор кафедры прикладной математики и компьютерного моделирования, Белгородский государственный национальный исследовательский университет, Белгород, Россия; e-mail: [email protected].

Ту Раин, научный соискатель кафедры математического и программного обеспечения информационных систем, Белгородский государственный национальный исследовательский университет, Белгород, Россия; e-mail: [email protected].

Chelyabinsk Physical and Mathematical Journal. 2023. Vol. 8, iss. 1. P. 140-145.

DOI: 10.47475/2500-0101-2023-18113

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

AN EFFICIENT DATA ACQUISITION METHODOLOGY FOR INVERSE DYNAMICS MODEL LEARNING OF MANIPULATOR BASED ON ANALYTICAL METHOD. I

S.M. Sitnik", Thu Rainb

Belgorod State University, Belgorod, Russia [email protected], [email protected]

In the last few years, learning inverse dynamic models of manipulators from data has shown considerable successes and become a progressively developing topic in dynamic modeling of manipulators. In this paper, we presented an efficient data acquisition methodology for inverse dynamics model learning. Our method is based around the parametric physical model of a manipulator that obtained from the rigid body dynamics using the analytical method. Our framework consists of Denavit — Hartenberg method for the generation of the manipulator workspace. The received datasets are validated by the results of simulation of kinematic and dynamic modeling of the tested manipulator.

Keywords: data acquisition, inverse dynamics, model learning, Denavit — Hartenberg method, manipulator.

References

1. Nair A., ChenD., AgrawalP., IsolaP., AbbeelP., Malik J., LevineS. Combining selfsupervised learning and imitation for vision-based rope manipulation. In Proc. Int. Conf. Robotics and Automation (ICRA), 2017, pp. 2146-2153.

2. Nguyen-TuongD., Peters J. Model learning for robot control: A survey. Cognitive processing, 2011, vol. 12, no. 4, pp. 319-340.

3. Thu Rain, YanNaingSoe. Dynamic modelling of manipulator using adaptive neuro fuzzy inference system. Modeling, Optimization And Information Technology (MOIT), 2019, vol. 7, no. 4, pp. 362-377.

4. Thu Rain, DovgalV.M., YanNaingSoe. Modelling of the adaptive neuro-fuzzy inference system based control of 5-dof robotic manipulator "Intelbot". Belgorod State University Scientific Bulletin. (Economics. Information Technologies), 2018, vol. 45, no. 3, pp. 497-509.

Article received 30.12.2022. Corrections received 08.02.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.