Алгоритм управления движением группы мобильных роботов в условиях неопределенности
А.Р. Гайдук1 С.Г. Капустян2, И.О. Шаповалов3
1Южный федеральный университет, Таганрог,
2Южный научный центр Российской академии наук, Ростов-на-Дону,
3Институт робототехники и процессов управления ЮФУ, Таганрог,
Аннотация: В статье предлагается алгоритм функционирования адаптивных систем управления движением группы транспортных мобильных роботов в условиях неопределенности. Алгоритм разработан на основе марковского метода идентификации и метода аналитического синтеза систем с управлением по выходу и воздействиям. Адаптивная система управления, в которой используется данный алгоритм, обладает прямыми показателями качества не хуже заданных. Предложенный алгоритм может использоваться для создания систем управления техническими объектами различных типов, при заранее неизвестных математических моделях.
Ключевые слова: мобильный робот, группа, неопределенность, идентификация, марковский параметр, управление по выходу и воздействиям, система.
Введение
Как известно, возможности отдельного мобильного робота, в общем случае, ограниченны, поэтому для решения различных задач, в том числе для перевозки различных грузов, гораздо чаще применяются группы мобильных, безэкипажных роботов [1 - 4]. Такие группы транспортных роботов могут быть однородными или гетерогенными. Одной из существенных особенностей транспортных задач является априорная неопределенность как перевозимых грузов, так и условий транспортировки. В тоже время эти неопределенные факторы имеют важное значение для функционирования системы управления движением мобильных роботов [5, 6]. Транспортируемые грузы могут быть весьма разнообразными как по габаритам, по массе, так и по пути движения. Поэтому наиболее эффективной в данном случае представляется адаптивная система с идентификацией [7].
Основной целью данной работы является решение задачи синтеза локальных систем управления (ЛСУ) движением транспортных мобильных роботов в условиях неопределённости. Для этого необходимы, очевидно, алго-
ритмы идентификации и синтеза систем управления, которые могли бы быть реализованы в автоматическом режиме, без участия операторов, которые ставят задачи по транспортировке грузов группам мобильных роботов [5, 6].
В настоящее время известно достаточно много методов идентификации и синтеза систем управления, ориентированных чаще всего на обработку информации вручную [7, 8]. Однако в случае мобильных роботов необходимы, очевидно, аналитические методы идентификации и синтеза систем управления. В данной работе в качестве алгоритма идентификации используется более совершенный вариант марковского алгоритма, кратко рассмотренного в работе [6], а синтез адаптивной ЛСУ осуществляется аналитическим методом синтеза систем с управлением по выходу и воздействиям (АССУВВ) [9].
Постановка задачи
Предположим, группа транспортных роботов включает Ыр мобильных, возможно, гетерогенных роботов, каждый из которых описывается системами дифференциальных уравнений
Хр = Архр + Врир, Ур = СрХр+ Брир , р = ГЫр, (1)
где хр е Яп - вектор состояния размерности пр; ир е Я^ - вектор непрерывных управлений; ур е Я1 - вектор отклонений непрерывных выходных переменных р-го робота, обусловленных управлениями ир; Ар, Вр, Ср, Эр - числовые матрицы соответствующих размерностей. Порядки пр роботов (1) и большая часть или все параметры роботов являются априори неизвестными. В процессе движения роботов (1) они претерпевают скачкообразные изменения, оставаясь затем неизменными в течение достаточно длительного интервала времени; при этом порядок каждого робота не превышает заранее известного значения пртах, а системы уравнений (1) являются полными [5, 6].
Рассматриваемая группа роботов предназначена для транспортировки некоторых грузов по равнинной поверхности: как по шоссейным дорогам,
1
так и по пересеченной местности. Маршруты движения отдельных роботов или группы в целом задаются в правой системе координат, ось ОХ которой направлена на север. Имея это ввиду, примем, что с[ = 1Р = 2, причем у рР= Vр -
это скорость движения, а у2 = фр е [-п -^п] - это курсовой угол. Значения фр от-считываются от оси ОХ, а положительные значения фр соответствуют поворотам против часовой стрелки [3, 4].
Обычно каналы управления скоростью транспортных мобильных роботов и направлением их движения можно считать независимыми [3, 6]. Поэтому рассматриваемая задача синтеза адаптивных ЛСУ сводится, во-первых, к задаче идентификации каналов управления ир ^ ур, I = 1,2, т.е. к определе-
нию только ПФ жр (р), I = 1,2, р = 1, N. Во-вторых, к задаче определения
уравнений адаптивных формирующих устройств (АдФУ), в соответствии с требованиями к качеству ЛСУ.
Задача идентификации
Эта задача решается здесь с применением марковского алгоритма идентификации, в основе которого лежат марковские параметры специальных дискретно-подобных систем (ДПС), каждая их которых соответствует одному роботу группы. Подчеркнем, что при условии корректности р-й ДПС одна из динамических систем этой ДПС эквивалентна непрерывной модели (1) р-го робота. Марковские параметры являются системными инвариантами динамических систем, что обеспечивает высокую эффективность данного метода идентификации [5].
Указанные выше ДПС образуются в результате представления в виде последовательности прямоугольных импульсов, длительность которых равна периоду дискретизации Тди, пробных воздействий ир (г) = ир01(г) и и 2(г) = ир,01(г),
где uP0 = const - постоянные допустимые управления для каналов ир ^ yp, i = 1,2. Это приводит к уравнениям ДПС следующего вида
хр+ = Aрxp + ВX, yр = Ср xp + DX, р = 1, ^ . (2)
Здесь хре ЯУр - вектор переменных состояния, ур = 1, птах; йрк = [й[к й2р,к]Т и уР = [уРк у2к ]т - соответственно векторы дискретных управлений и выходных величин р-х систем (2) при г = кТди, к = 0,1,2,...; Ар, Вр, Ср, £)р - числовые матрицы соответствующих размерностей.
Пусть, при йр (г) = йр01(г), I = 1,2, всех г = кТди и нулевых начальных условиях хр0 = 0, хр 0 = 0 выполняются условия
ар
К = ир (кТдИ), ук = ур (кТдИ), р = 1, ^, к = 0,1,2,... (3)
Определение 1. Система (2) называется «дискретно-подобной системой», соответствующей непрерывной системе (1), если выполняются условия (3).
При цифровой обработке идентификационных данных важное значение имеет следующий момент.
Определение 2. Если уравнения (2) соответствуют такому периоду дискретизации Тт, при котором выполняется условие
>АХ, I = й, (4)
то р-я ДПС (2) является «корректной» по отношению к р-й системе (1). В противном случае эта ДПС является «некорректной».
В неравенстве (4) ар„- это свободный коэффициент полинома
Ар(г,Тт) = ,Р +арур_1гу 1 _ +......+ ард^ + ар0, который является знаменателем ПФ
Шри (г, Тди); А1- допустимое по условиям точности значение
Перейдем к изложению марковского алгоритма идентификации (МАИ). Его исходные данные: допустимые пробные воздействия ир (г) = ир01(г), I = 1,2;
грт - длительность интервала фиксации реакции р-го робота на пробное воздей-
ар
ствие; величины: n^ n„«е[2■5]; NJ = 2<aX +Птах; ТРИ = [0,7■0,8]С/NJ;
A1 = 0,01; целое число Z e [5 ■ 10]. При этом значение tm должно превышать на
25-30% длительность затухающего переходного процесса, вызванного допустимым пробным воздействием.
МАИ включает следующие пункты:
П.1,ид. На вход /-го канала р-го робота (i =1), находящегося в установившемся режиме, подается пробное воздействие uf(t) = uf01(t) и фиксируется
N +1 отсчетов отклонений выходной переменной уРк = уР(кТ0), к = 0, ^ .
П.2,ид. Вычисляются значения марковских параметров Дгри ДПО по формулам
уР уР и-1
ДРРо = , ДР,и= ^Г-ЕДР,, и = 1, 2, ... Щ.
Ы1,0 иг,00 ?=0
П.3,ид. Вычисляется степень пр знаменателя ПФ Жри (г,Ти) по формулам:
-1, п=0
где МрV - уху -матрица, определяемая выражением
Imax . . ..
df V = (nmax )-1 mac det м™\, nf = v P = {max v| <v },
m,P:n =
Д P ,n+1 PP,n+2 " " PP,n+v JP ,n+2 JP ,n+3 " ' JP,n+v+1
ДP,n+v Jpn+v+1 " • JP,n+2v—1
, n = 0, nmax — 1. (5)
П.4,ид. Вычисляются значения коэффициентов а р? знаменателей передаточных функций WWyp (z, Тди) по формуле
n р —1 _
Imax -
Й?,s = «max)-1 s,n ; ? = 0, nP — 1.
n=0
Здесь коэффициенты aP определяются решением системы
ар = 1, п м р,пр!- тр'Лр+.; п 1 ,ц +1 = 0, пр , ' 1тах 5
где матрица М^, определяется выражением (5) при
т р,пр имеют вид 1, щ +1
" йР 1,0, п Др р," 1 ,п+п[ +1
ар = 1, п йр 1,1, п ар р 1 1, п\ -1,п т р,п = 5 • р . 1 ' 1 ,п +1 Д 1 ,п+п,р + 2 Д 1,п+2 Пр , п = 0, пРах - !.
■Щ
а
Если при полученном значении ар0 выполняется условие (4), т.е. р-я ДПС (2) при данном ТДи является корректной, то имеется возможность идентифицировать 1-й канал р-го робота (1) при этом значении Тди, путем перехода к п. П.5,ид. В противном случае, путем повторения пп. 1,ид ^ 4,ид находится такое значение Тт = тди / С, при котором выполняется (4).
П.5,ид. Вычисляются значения коэффициентов ¡зр? полиномов числителей ПФ ¿-го канала р-й ДПС по формуле
пр -1 _
1тах
вР,?= (Птах)-1 I , ? = 0, Пр
п=0
где
пр--1-?
врсп = Др р + I Дрп
,?,Л г 1,ир-с+п ¿—I г 1,п
ПГ^ ' Лп+и1 ,?+и ' и=0
п = 0 пр -1
I ' 1тах
П.6,ид. Формируется ПФ
в Р,0 +в РдГ + ... + в РпР
К* (^ Тди ) = -
а р0 + а+ ... + ар р -1 +
1,0 1,1 1, щ -1
(6)
П.7,ид. К ПФ ]¥ри (г, Тди) (6) применяется обратное 2т-преобразование
Ки (Р) = Кри, (г, ТДИ )} = вр (р) / Ар (р) . (7)
Отметим, что преобразование (7), в частности, может быть реализовано
п
в МЛТЬЛВ функцией <^2с» с расширением «^о^» [7, 9].
П.8,ид. Пункты П.1,ид - П.7,ид выполняются при 1 = 2.
П.9,ид. Выход из алгоритма идентификации.
Полученные ПФ Жри (р), 1 = 1,2 (7) представляют собой результат идентификации р-го робота марковским методом.
Задача синтеза
Для решения этой задачи используется алгоритм, реализующий метод аналитического синтеза систем с управлением по выходу и воздействиям (АССУВВ). Преимуществом этого метода, по сравнению, например, с методом АКОР, является возможность синтеза систем управления со значениями прямых показателей качества не хуже заданных [8].
Приведем алгоритм синтеза, применительно к уравнениям «вход-выход» мобильных роботов вида
Др (р)уР = вр (р)<, 1 = 1,2; р = 1, ^, (8)
где Ар (р) и вр (р) - некоторые полиномы с известными степенями и коэффициентами, вытекающие непосредственно из ПФ (7). При этом полином Ар (р) нормирован по старшей степени переменной р. Причем, если тр = deg вр (р), а
пр = deg Ар (р), то тр < пр.
Предполагается, что также в памяти контроллера ЛСУ р-го робота содержатся таблицы стандартных нормированных передаточных функций (СНПФ), приведенные, например, в [8, с. 344-346]. Здесь же хранится следующая информация о ЛСУ каждым его каналом ир ^ уР: порядок астатизма Vр* к задающему воздействию gP = gP (г); время регулирования не более гр '* с; перерегулирование не более а р'* %; степень устойчивости не менее п Р,'Сис; т0-малая величина необходимая для обеспечения некоторого запаса по времени
регулирования. АдФУ физически реализуемо, если его относительный порядок Дфу > ДфуС, где ДфуС > 1 - заданное значение [7, 8].
С целью простоты изложения будем считать, что корни полиномов вр (р) из (8) при всех значениях порядка и параметров р-го робота удовлетворяют условию
^рв/ <-<! , У = . (9)
Если модель канала робота не удовлетворяет условию (9), то можно использовать несколько более сложный, но также аналитический алгоритм синтеза ЛСУ [8, с. 177-181].
Алгоритм синтеза АдФУ включает следующие пункты: П. 1,ас. Определяется величина Vр = max{vр*-пРА',0}, где пА' - число
корней полинома Ар (р), равных нулю.
П. 2,ас. Множители полинома Ар(р) модели (8) соответствующие таким Тj„ что Тр} <гр,С/(50-И00), исключаются из полинома Ар(р) [10]. Затем полиномы Ар (р) и вр (р) представляются в виде Ар (р) = Ара (р) Арй (р),
вр(р) = в рвро(р), где Ара(р) и вро(р)- полиномы, корни которых совпадают
т' ' ' '
с корнями полиномов Ар(р) и вр(р), которые удовлетворяют условию (9), соответственно; полином Арй (р) включает остальные корни полинома Ар (р). Вводятся обозначения: пр = degАр(р), пра= degАра(р), прй= degАрй(р). П. 3,ас. Вычисляются степени:
г~Р= пР + ДфуС-тр-1, /> <й+^-1, ^Р= np + vp + дфyc+ п?,й-тр -1.
П. 4,ас. По значениям V£,*, птаб = & р и а р,С % из памяти контроллера вы-
бираются соответствующие коэффициенты Ау, у = 0, -& р СНПФ и величина гр таб = гтаб с, а затем вычисляются величина шр0 и коэффициенты 5р,у по формулам:
<о = Сб /(С*-То), 5?, j = А у (ш^)»
)»--j, j = о, » р. П. 5,ас. Вычисляются коэффициенты полинома
Aр(р) = /рАрй(р) = аР,о+ардр + ... + арпррпр, (10)
где а рп р = 1, и формируется следующая система алгебраических уравнений:
(11)
"р я 0 • • а0 0 ••• 0 " ^0 "50 "
0 р я ■ . а1 а0 '■. 0 51
0 0 а1 '■. 0 52
0 0 • ап : а0 =
0 0 0 ап а1 р0
0 0 0 0 ■■. ; 5S-1
0 0 0 0 - ап _ .5» _
Здесь введены упрощенные обозначения: вт = втр, ау = ару, Л,у = ^ру, ру = рру, 5} = 5р}, г = гр, /= 11 р, /г = /г р, & = р. Матрица системы (11) имеет 11 р +1 столбцов, составленных из коэффициента вт =в р, и гр +1 столбцов, которые сот
ставлены из коэффициентов полинома (10).
П. 6,ас. По результатам решения системы (11) формируются полиномы
я р ( р) = рр,о +р рдр+•••+р р?р рг р, ь р (р) = ^р,о+...+^р Рр,
1,Г I 1,1 г
а затем - полиномы
я р ( р ) = р 7 ря р ( р) ^ р,п( р), ьр (р) = Ар, 0 (р) ь р (р),
ер (Р) = вт1 Ар а (Р)(5ру р^ + ... + 5р,1 Р + 5 р,о), i =1, 2 .
П. 7,ас. Вычисляются корни рру, у = 0, -&р полинома £> р (р) = 5 р,0 +
+5р1 р + ... + 5Р рар, i =1, 2; а затем - период дискретизации управления р-го
i i
робота:
Тр = П/4Шр
-'упр ^ -,max>
ш
р _
maх {ррj'| ,|lm р£*|, - = 1,2} ,
где рр J и рр J - вещественные и комплексные корни полинома D р (р). Затем
ПФ We (р) = 0р (р)/ Яр (р) и WL (р) = Ц (р)/ Яр (р) подвергаются при Т = Турп
упР
1
преобразованию
Кя (г) = — 2т ^^^^ \, ЦГЬ (г) = — 7т ^^^ \, ' = 1,2. (12)
г - и (р) 1 г - и №(р)
Здесь 7Т {}- преобразование, которое каждому изображению по Лапласу ставит в соответствие z-изображение [9, с. 211]. В целом преобразование (12) удобно выполнять с помощью функции «c2d» пакета МЛТЬЛВ. В результате получаются ПФ Щрд (г) = 0р (г)/Щ (г) и (г) = Ц (г)/Щ (г).
П. 8,ас. Если полином яр(р) имеет множитель ру, т.е. яр(р) = рvЩ1(р), то коэффициенты полинома яр(г) округляются таким образом, чтобы он имел вид яр(г) = (г -1/яр1(г). При этом уравнения АдФУ представляются так
(г -1/ ир (г) = <(г), Щл(г)™р(г) = &Ш(г) - ьр (г )у (г) , ' = 1,2, (13)
где w р(г) - z-изображение вспомогательной переменной w рк. Искомый алгоритм АдФУ находится путем перехода в уравнениях (13) к оригиналам.
П. 9^. Выход из алгоритма синтеза.
Коэффициенты полученных в П. 8,ас алгоритмов АдФУ при ' = 1 и ' = 2 записываются в соответствующие ячейки памяти контроллера р-го робота, после чего его адаптивная ЛСУ переходит в режим формирования управляющих воздействий.
Заключение. Таким образом, последовательное применение алгоритмов марковской идентификации и аналитического синтеза в адаптивном регуляторе позволяет автоматически сформировать алгоритмы вычисления управляющих воздействий, соответствующих текущим значениям порядка и параметров каждого р-го робота. Эти алгоритмы запускаются каждый раз в начале движения и при существенном изменении условий функционирования каждого р-го робота группы. Признаком необходимости запуска этих алгоритмов является возникновение больших значений отклонений в процессе функционирования роботов.
Авторы благодарят Президиум РАН и РФФИ, поскольку публикация подготовлена в рамках реализации в ЮФУ и ЮНЦ РАН работ по ПФИ Президиума РАН № I.29 «Актуальные проблемы робототехнических систем» (ГЗ ЮНЦ РАН на 2018 г., № гр. проекта AAAA-A18-118020190041-1) и грантов РФФИ № 16-29-04194; № 17-29-07054.Материалы доложены на международной конференции САУ и ОИ, Дивноморское, Россия; статья опубликована при финансовой поддержке РФФИ, грант № 18-07-20056 Г.
Литература
1. Cheng T.M., Savkin A.V. Decentralized Control of Multi-robot Systems for Rectangular Aggregation. Preprints of the 18th IFAC World Congress Milano (Italy). 2011. pp. 11574-11579.
2. Wang P. Navigation strategies for multiple autonomous mobile robots moving in formation // Journal of Robotic Systems. 1991. No 8(2). pp. 177-195.
3. Каляев И. А., Гайдук А.Р., Капустян С.Г. Модели и алгоритмы коллективного управления в группах роботов. М.: Физматлит, 2009. 280 с.
4. Погорелов В. А. Перспективы применения беспилотных летательных аппаратов в строительстве // Инженерный вестник Дона, 2016, №1 URL: ivdon.ru/ru/magazine/archive/n1y2016/3571
5. Сиротенко М.Ю., Пшихопов В.Х.Принципы построения нейросетевых планировщиков перемещений мобильных роботов для априори неформализованных сред // Изв. ЮФУ. Технические науки. Таганрог, 2008, № 1(78). С. 196-198.
6. Капустян С.Г., Медведев М.Ю., Гайдук А.Р., Дьяченко А.А., Шаповалов И.О. Интеллектуальное управление мобильными роботами в условиях неопределенности. Материалы 10-й Всероссийской мультиконференции (с. Дивноморское, Геленджик, Россия). Том 2. Изд-во ЮФУ, 2017. C. 253-255.
7. Александров А.Г. Оптимальные и адаптивные системы. Москва: Высшая школа, 1976. 263 с.
8. Гуренко Б.В., Назаркин А. С. Реализация и идентификация параметров автономного необитаемого подводного аппарата типа глайдер // Инженерный вестник Дона, 2015, №4 URL: ivdon.ru/ru/magazine/archive/n4y2015/3288
9. Гайдук А.Р. Анализ и аналитический синтез цифровых систем управления. СПб.: ЛАНЬ, 2018. 199 с.
10. Гайдук А. Р. Теория и методы аналитического синтеза систем автоматического управления (Полиномиальный подход). М.: Физматлит, 2012. 415 с.
11. Ким Д.П. Теория автоматического управления. Т. 1. Линейные системы. 2-е изд., испр. и доп. М.: Физматлит, 2007. 288 с.
12. Гайдук А.Р., Плаксиенко Е.А. Робастность редуцированных динамических систем автоматизации // Мехатроника, автоматизация, управление. 2016. Т. 17, № 5. С. 308-315.
References
1. Cheng T.M., Savkin A.V. Decentralized Control of Multi-robot Systems for Rectangular Aggregation. Preprints of the 18th IFAC World Congress Milano (Italy). 2011. pp. 11574-11579.
2. Wang P. Journal of Robotic Systems. 1991. № 8(2). pp. 177-195.
3. Kaliaev I.A., Gaiduk A.R., Kapustyan S.G. Modeli i algoritmy kollektivno-go upravleniya v gruppakh robotov [Models and algorithms of collective control in groups of robots]. M.: Phizmatlit, 2009. 280 p.
4. Pogorelov V.A. Inzenernyj vestnik Dona (Rus), № 1, 2016. URL: iv-don.ru/ru/magazine/archive/n1y2016/3571.
5. Sirotenko M.Ju., Pshikhopov V.Kh. Izvestija JuFU. Tehnicheskie nauki. 2008, № 1(78). pp. 196-198.
6. Kapustyan S.G., Medvedev M.Yu, Gaiduk A.R., Dyachenko A.A., Shapova-lov I.O. Intellektual'noe upravleniye mobil'nymi robotami v usloviyakh neoprede-
lennosti [Intellectual control of mobile robots in conditions of uncertainty], [Materials of 10-th All-Russia multiconference (vil. Divnomorskoe, Gelendzhik, Russia), Vol, 2], Izd-vo SFedU, 2017, pp. 253-255,
7, Aleksandrov A,G, Optimal'nye i adaptivnye sistemy [Optimal and adaptive systems], M,: Vysshaya shkola, 1976, 263 p,
8, Gurenko B,V,, Nazarkin A,S, Inzenernyj vestnik Dona (Rus), 2015, №4, URL: ivdon,ru/ru/magazine/archive/n4y2015/3288,
9, Gaiduk A,R, Analiz i analiticheskiy cintez tsyfrovykh system upravleniya [Analysis and analytical synthesis of digital control systems], SPb,: LAN', 2018, 199 p,
10, Gaiduk A,R, Teoriya i metody analiticheskogo sinteza system avtomati-cheskogo upravleniya (Polinomial'nyiy podkhod) [Theory and methods of analytical design of automatic control systems (Polynomial approach)], M,: Phizmatlit, 2012, 415 p,
11, Kim D,P, Teoriya avtomaticheskogo upravleniya, T, 1, Lineynye sistemy, 2-e izd,, ispr, i dop, [Theory of automatic control, Vol, 1, Linear systems, 2 edit, corr, and add,], M,: Phizmatlit, 2007, 288 p,
12, Gaiduk A,R,, Plaksienko E,A, Mekhatronika, avtomatizatsiya, upravleniye, 2016, Vol, 17, № 5, pp, 308-315,