Научная статья на тему 'СИММЕТРИЧНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ'

СИММЕТРИЧНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
65
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ФАЗОВЫЕ ОГРАНИЧЕНИЯ / УНИМОДАЛЬНОСТЬ / УПРАВЛЕНИЕ ГРУППОЙ РОБОТОВ / ЭВОЛЮЦИОННЫЙ АЛГОРИТМ

Аннотация научной статьи по математике, автор научной работы — Дивеев А.И., Софронова Е.А.

Рассмотрены свойства симметричных систем управления, отличительная особенность которых заключается в том, что решение задачи оптимального управления для объекта, математическая модель которого относится к классу симметричных систем управления, приводит к решению двух задач. Первая задача оптимального управления --- исходная, результатом ее решения является функция, обеспечивающая оптимальное перемещение объекта из начального состояния в терминальное. Во второй задаче терминальное состояние является начальным, а начальное --- терминальным. Сложность решаемой задачи обусловлена увеличением размерности при включении в математическую модель объекта моделей всех объектов группы, а также возникающими динамическими фазовыми ограничениями. Наличие фазовых ограничений в некоторых случаях приводит к тому, что целевой функционал имеет несколько локальных экстремумов. Доказана теорема о том, что при управлении группой объектов, относящихся к классу симметричных систем, при определенных условиях функционал не является унимодальным. Приведен численный пример решения задачи оптимального управления с фазовыми ограничениями градиентным методом Adam и эволюционным методом роя частиц. В примере в качестве объекта управления использована группа из двух симметричных объектов

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Дивеев А.И., Софронова Е.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SYMMETRIC CONTROL SYSTEMS

The paper focuses on the properties of symmetric control systems, whose distinctive feature is that the solution of the optimal control problem for an object, the mathematical model of which belongs to the class of symmetric control systems, leads to the solution of two problems. The first optimal control problem is the initial one; the result of its solution is a function that ensures the optimal movement of the object from the initial state to the terminal one. In the second problem, the terminal state is the initial state, and the initial state is the terminal state. The complexity of the problem being solved is due to the increase in dimension when the models of all objects of the group are included in the mathematical model of the object, as well as the emerging dynamic phase constraints. The presence of phase constraints in some cases leads to the target functional having several local extrema. A theorem is proved that under certain conditions the functional is not unimodal when controlling a group of objects belonging to the class of symmetric systems. A numerical example of solving the optimal control problem with phase constraints by the Adam gradient method and the evolutionary particle swarm method is given. In the example, a group of two symmetrical objects is used as a control object

Текст научной работы на тему «СИММЕТРИЧНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ»

УДК 517.977.5:519.6:62.5

DOI: 10.18698/0236-3933-2021-2-37-51

СИММЕТРИЧНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

А.И. Дивеев Е.А. Софронова

ФИЦ ИУ РАН, Москва, Российская Федерация

aidiveev@mail.ru sofronova_ea@mail.ru

Аннотация

Рассмотрены свойства симметричных систем управления, отличительная особенность которых заключается в том, что решение задачи оптимального управления для объекта, математическая модель которого относится к классу симметричных систем управления, приводит к решению двух задач. Первая задача оптимального управления — исходная, результатом ее решения является функция, обеспечивающая оптимальное перемещение объекта из начального состояния в терминальное. Во второй задаче терминальное состояние является начальным, а начальное — терминальным. Сложность решаемой задачи обусловлена увеличением размерности при включении в математическую модель объекта моделей всех объектов группы, а также возникающими динамическими фазовыми ограничениями. Наличие фазовых ограничений в некоторых случаях приводит к тому, что целевой функционал имеет несколько локальных экстремумов. Доказана теорема о том, что при управлении группой объектов, относящихся к классу симметричных систем, при определенных условиях функционал не является унимодальным. Приведен численный пример решения задачи оптимального управления с фазовыми ограничениями градиентным методом Adam и эволюционным методом роя частиц. В примере в качестве объекта управления использована группа из двух симметричных объектов

Ключевые слова

Оптимальное управление, фазовые ограничения, унимодальность, управление группой роботов, эволюционный алгоритм

Поступила 09.05.2020 Принята 06.07.2020 © Автор(ы), 2021

Работа выполнена при частичной поддержке РНФ по проекту № 19-11-00258 ФИЦ ИУ РАН; раздел «Алгоритмы поиска» выполнен в соответствии с грантом РФФИ № 19-08-01047-а

Введение. Задача оптимального управления группой роботов в настоящее время актуальна и активно подвергается исследованию в целях получения эффективных алгоритмов ее решения [1-5]. Задача является сложной по двум причинам. Во-первых, размерность задачи увеличивается из-за

включения в математическую модель объекта моделей всех роботов, участвующих в управлении, даже если они одинаковые. Во-вторых, возникают динамические фазовые ограничения, так как каждый робот при групповом управлении определяет фазовые ограничения для других роботов, причем эти ограничения меняются во времени из-за перемещения роботов. Наличие таких фазовых ограничений в некоторых случаях приводит к тому, что целевой функционал имеет несколько локальных экстремумов, для каждого из которых выполняются необходимые условия оптимальности. Формально наличие нескольких экстремумов не позволяет применять для решения таких задач градиентные методы.

В настоящей работе рассмотрен специальный вид объектов управления, называемых симметричными. Приведены некоторые определения и исследованы свойства таких систем. Доказана теорема о том, что при управлении группой объектов, относящихся к классу симметричных систем, при определенных условиях функционал не является унимодальным. В экспериментальной части рассмотрена задача оптимального управления группой мобильных роботов, математические модели которых относятся к классу симметричных систем. При решении задачи использованы для сравнения градиентный и эволюционный алгоритмы. Изложено состояние рассматриваемого вопроса, постановка цели и задач исследования.

Симметричные системы. Рассмотрим симметричные системы в контексте задачи оптимального управления [6, 7] и приведем общую постановку.

Пусть задана система обыкновенных дифференциальных уравнений

x = f (x, u), (1)

где x e Rn, u e U e Rm, U — компактное ограниченное множество.

Для системы заданы начальные и терминальные условия

x(0) = x0; (2)

x(tf) = xf, (3)

а также функционал качества

tf

J f0 (x, u) dt ^ min. (4)

о u

Необходимо найти управление u как функцию времени, удовлетворяющую ограничениям и обеспечивающую в момент tf достижение терминального состояния с оптимальным значением функционала.

Пусть и(-) — функция управления, которая удовлетворяет ограничениям и обеспечивает достижение объектом управления терминального состояния. Решение системы дифференциальных уравнений (1) с функцией управления и (•) в правых частях обозначим как х (•).

Определение 1. Если система дифференциальных уравнений х = f (х, и (£)) имеет частное решение х ^), которое удовлетворяет краевым

условиям х (0) = х0, х ) = ху, а система дифференциальных уравнений х = £(х, и-1)) при начальных х(0) = и терминальных х ) = х0 условиях имеет частное решение х -1), то такая система дифференциальных уравнений называется симметричной.

Утверждение 1. Система дифференциальных уравнений х = и является симметричной.

Из утверждения 1 следует, что система дифференциальных уравнений х = В (х )и, где В (х) — симметричная функциональная матрица размера п х т.

Доказательство утверждения 1. Пусть и (•) — управление, которое обеспечивает достижение терминальных условий. Рассмотрим систему х = и (^). Проинтегрировав эту систему, получаем х (^) = V ^) + с. При t = 0

вектор констант с определяет равенство с = х0 - v(0), поэтому частное решение системы равно х ^) = V (t) + х0 - v(0). Из этого решения получаем, что в момент t = tf справедливо равенство ху = v(tf) + х0 - v(0).

Теперь рассмотрим систему х = -11 ^ —t).

Решения этой системы обозначим как г = tf — t. Таким образом, имеем

-1 и -1) ^ = | и (г) йг или х (г) = V (г) + с, х (t) = V -1) + с.

По определению при t = 0 справедливо равенство х (0) = ху, поэтому получаем с = х(0) - V= -+ х0 - v(0) = х0 - V(0) и х (t) = = V -1) + х0 - V (0) или х ^) = х -1). Что и требовалось доказать.

Лемма 1. Значение определенного интеграла не изменится, если его подынтегральная функция будет вычисляться в обратном направлении

от верхнего значения аргумента к нижнему:

^ tf

I уь(х а)) ^ = | уь(х ^ -1)) ^.

0 0

На практике траектория х (tf - t) является такой же траекторией в М", как и х (£) в М", но с движением в обратном направлении.

Доказательство леммы 1. Рассмотрим интеграл | ^(х (tf - £)) ^.

о

Введем замену переменных: г = tf - £, йг = , го = tf, Zf = 0. Получаем

tf Ч

I /о(х^ -1))Л = -{ /о(х(г))йг.

0 го

Отсюда следует, что

zf о tf

- I /о(х(г))йг = -{ fо(X (г))йг = { fо(X (г))йг.

го tf о

Что и требовалось доказать.

Теорема 1. Если й ^) — решение задачи оптимального управления (1)-(4), где х = {(х, й) — симметричная система дифференциальных уравнений, то -й (tf -1) является решением задачи оптимального управления для той же системы дифференциальных уравнений (1) с тем же функционалом (4), но в которой начальные условия совпадают с терминальными, а терминальные — с начальными:

х (о) = хf; (5)

х = хо. (6)

Теорема объясняет, почему данные системы называются симметричными. Для этих систем оптимальная траектория движения из точки А в точку В совпадает с оптимальной траекторией движения из точки В в точку А.

Доказательство теоремы 1. Из утверждения 1 следует, что если х ^) — решение системы с краевыми условиями (2) и (3), то х (tf -1) — решение системы с краевыми условиями (5) и (6), и наоборот. Из леммы 1 следует, что значения функционалов в обеих задачах одинаковы. Если бы для задачи с краевыми условиями (5) и (6) существовало управление й ^), которое приводит к получению решения х ^) с меньшим значением функционала, то существовало бы и решение х (tf -1) с меньшим значением функционала для задачи с краевыми условиями (2) и (3). Тогда управление й ^)

не было бы решением задачи оптимального управления. Следовательно, такого решения нет, поэтому -й (tf -1) — решение задачи оптимального управления с краевыми условиями (5) и (6). Теорема доказана.

Теорема 2. В задаче оптимального управления двумя объектами

хг = {(хг, й); (7)

хг (о) = х0, г'; (8)

х ^) = xf, г, (9)

й е и с М т , г = 1, 2,

tf

J f0(x1, x2) dt ^ min

о

при краевых условиях

х/,1 = хо,2 и х/ ,2 = хо,1 (1о)

и симметричными одинаковыми моделями объектов (7) существует как минимум два оптимальных управления, которые являются решениями задачи.

В задаче оптимального управления двумя объектами необходимо добавить условие отсутствия сближения объектов между собой в форме фазового ограничения

( у1(£) - У? (t)) < о, е [о; tf ], (11)

где уг (t) = Схг (t), г = 1, 2; С — матрица размера к х п.

Доказательство теоремы 2. Пусть й ^) — решение задачи оптимального управления. Тогда согласно теореме 1 управление -й (tf - t) также является оптимальным управлением для задачи с краевыми условиями ход = х /г ,1 и х = х /г ,2. Из (1о) получаем

х^ = хf,1 = хо, 2; хо,2 = хf,2 = хо,1.

Поскольку объекты одинаковы, то получаем ту же задачу оптимального управления. Следовательно, управление -й(tf - t) является решением этой задачи оптимального управления. Теорема доказана.

Пример. Рассмотрим задачу оптимального управления двумя мобильными роботами. Математические модели роботов описываются системами дифференциальных уравнений [8, 9]:

х1 = 0,5(^1 + и2 )ео8 Х3;

х 2 = 0,5(и1 + и2 Ыи х3; (12)

х3 = 0,5(и1 - и2),

где I — номер робота в группе, I = 1, 2; х1, х2 — координаты центра масс робота ц х3 — угол между осью симметрии робота I и одной координатной осью на плоскости; и1, и2 — элементы вектора управления. На управление наложены ограничения:

и" < и) < иI, I = 1, 2; ) = 1, 2. (13)

Заданы начальные и терминальные состояния каждого робота:

х)(0) = х)'0, I = 1,2; ) = 1,2,3; (14)

х)(tf) = х) у, I = 1,2; ) = 1,2, 3, (15)

где

tf =

t, если t < t+ и

t+, иначе;

Д i (xj(t) - xjf )2 <s;

= 1 j = 1V '

£ — заданная малая положительная величина; ^ — максимально возможное время управления. Задан функционал

2 3 2

X Х(xj(tf)-xjf) ^min, (16)

i=1j=1V ' u

где Г0 — заданная положительная величина, имеющая смысл минимального расстояния между объектами; &(А) — функция Хевисайда,

Г1, если Л > 0; д(А) = \

[0, иначе.

Если фазовые ограничения не нарушаются и время достижения цели меньше заданного, т. е. если tf < t+, то функционал определяется соотношением / = tf +8.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+

В противном случае J = tн

i

I I (х) ^ ) - х) f ) .

г = 1) = Л '

Необходимо найти значение оптимального управления каждым роботом и(•), г = 1,2; ) = 1,2, которое минимизирует функционал (16).

Для численного решения бесконечномерной задачи оптимального управления трансформируем ее к конечномерной задаче нелинейного программирования. Выберем интервал времени А t и разобьем время

А t

На каждом интервале аппроксимируем управление функциями, зависящими от конечного числа параметров. Если управление нарушает ограничения, то оно принимает значения ограничений

управления на L интервалов, L =

+ 1.

uj (t) =

и+, если и' (£) > и+;

и], если и) (t) < иу; г = 1, 2, ) = 1, 2,

и'(t), иначе,

где и) (£) — аппроксимирующая функция управления.

Для аппроксимации управления используем кривые Безье [1о]:

и)Ц) = q4((i -1)2 +)+41)+1(1 - (£ -1Д£)3) + +з -1)2+)+41)+2(1 - (t - ш )2)(t - т)+

+ 3q4((i-1)2+ )+41 )+з(1 -(£-1А£))(£-1А£)2 + ?4((«-1)2+ )+4/)+4(£- 1А£)3,

где г = 1,2, ) = 1,2; £ е [IА£, (I +1)А£); I = о, ..., I-1.

В экспериментах установлены следующие значения: А£ = 1,25,

£ + = 2,5,I = 2. Для каждого интервала, для каждого робота и каждого управления необходимо найти четыре параметра кривой Безье. Поскольку имеются два интервала (I = 2 ), два робота и два управления для каждого робота, то необходимо найти 4 • 2 • 2 • 2 = 32 оптимальных значений параметров. Значения параметров ограничиваем как q~< qk < q+, де q- =-8, q+ = 8, к = 1, ..., 32.

Алгоритмы поиска. Для решения задачи используем два современных алгоритма — эволюционный метод роя частиц [11-14] и алгоритм стохастического градиента Аёаш [11, 13, 15].

Метод роя частиц (Particle Swarm Optimization, PSO) сегодня является наиболее популярным эволюционным алгоритмом. По утверждению авторов метода, он основан на имитации социально-поведенческих моделей организованных групп [14]. Авторы метода предложили идею канонического метода роя частиц в 1995 г.

Эволюция множества возможных решений выполняется с учетом наилучших найденных к этому моменту возможных решений во всем множестве и в некотором подмножестве, которое называется подмножеством информаторов.

На подготовительном этапе задаем размер множества возможных решений H, размер подмножества информаторов M, максимальное число итераций W.

Генерируем начальное множество векторов параметров

qj =

q/> —, qp

где

4 = £, (ъ+- ъ -) + ъ -; (17)

здесь ) = 1,..., Н; г = 1,..., р; — случайная величина, равномерно распределенная в диапазоне (0; 1).

Задаем начальный вектор V) =

vi,..., Vp

т

направления изменения

векторов параметров у{ = 0; г = 1,..., р; ) = 1, ..., Н.

Эволюционный процесс поиска оптимального решения продолжаем до достижения максимального числа итераций Ш. На каждой итерации вычисляем вектор qb, доставляющий лучшее значение функционала

/) = шт{/(q)'): ) = 1, ..., Н}, и вычисление опорного вектора q)г, являющегося лучшим среди М случайно отобранных векторов

qjl, ..., :

/(q!) = ш1п{/^)к): к = 1,...,М},

к

где )1, ..., )М — случайные целые числа в диапазоне от 1 до Н.

С учетом найденных лучшего qь и опорного q)г векторов строим новый вектор V) для каждого вектора параметров q):

у) =ау{ - ъ!- ), г =1,р; ) = I...,Н,

где а, Р, у — заданные параметры, значения которых подбирают в зависимости от решаемой задачи; ^р е [0; Р] и е [0; у] — случайные величины.

где г = 1,..., p; j = 1,..., H; а — заданный параметр. Если J(qj) > J(qj),

Завершаем вычисления при выполнении W итераций. Решением считаем вектор с наилучшим значением целевой функции в итоговом множестве возможных решений.

При выполнении вычислительного эксперимента установлены следующие значения параметров: p = 32, H = 50, W = 3000, M = 4, а = 0,7298, р = 0,85, у = 0,1, а = 0,9.

Новый градиентный метод Adam (Adaptive Moment Estimation) относится к методам первого порядка. Он был предложен в 2015 г. для решения задачи обучения больших искусственных нейронных сетей [15]. Концепция метода требует знания только градиента функции, что положительно сказывается на скорости работы алгоритма и используемой памяти.

На начальном этапе генерируем случайный вектор параметров q по формуле (17), а также задаем векторы m = 0 и v = 0 размерностью p.

Устанавливаем малые величины 81 и 82, максимальное число итераций Wa , константы a a ~ 0,001, Р1 « 0,9, Р2 « 0,999, счетчик итераций w = 1.

Вычисляем градиент целевой функции VJ (q) по формуле

то qj = qj; j = 1, ..., H.

J(q + Ai) - f

8q

J(q + Ap) - f 8q

т

VJ (q)

(18)

где

т

А,- = 0 ... 0 8 q 0 ... 0

"V

Рассчитываем значения векторов m и v:

dJ (qt)

mi = pm + (i -ßi)-

д qi

Vi = ß2Vi + (i -ß2)

'd J (qi) д qi

i = l,• ••, p;

i = l,

Формируем вектор s с компонентами:

Ami

Si =

i = l,• ••, p,

(19)

(20)

(21)

(22)

ei +4Vi

где A = aA ф - pw /(1 - Pf); w — номер текущей итерации.

Вычисляем значение нового вектора параметров

qn = q - s.

Проверяем выполнение условий || q - qn || <82 и w = Wa. Если условие || q - qn || <82 выполнено, то достигнута заданная точность. Если условие w = Wa выполнено, то достигнуто максимальное число итераций. При выполнении любого этого условия завершаем вычисления. Если оба условия не выполнены, то полагаем, что q = qn, w = w + 1, определяем новое значение градиента целевой функции VJ (q) по формуле (18) и повторяем вычисления по формулам (19)-(22).

При поиске оптимальных значений параметров рассматриваемой задачи алгоритм Adam запускали Ha раз. Результатом вычислений считали наилучшее решение, найденное в H A запусках. В каждом запуске начальную точку выбирали из Ka случайно сгенерированных точек. Параметры алгоритма Ha , Ka и Wa устанавливали так, чтобы общее число вычислений целевого функционала было приблизительно равно числу его вычислений методом роя частиц. В данном случае HA = 12, KA = = 5000, WA = 250.

Вычислительный эксперимент. В эксперименте выполнено по 10 запусков каждого алгоритма. Подсчитывали наилучшее по значению функционала решение, среднее значение функционала по десяти запускам и среднеквадратическое отклонение значений функционала в десяти запусках. Начальные и терминальные значения объектов были выбраны так, чтобы начальное состояние одного робота было конечным состоянием второго, и наоборот:

1,0 „ 1,0 _ 1,0 1, f 1, f 1, f x1 = 0, x2 = 0, x3 = 0, = 10, x2 = 10, x3 = 0,

2,0 1Г. 2,0 1Г. 2,0 „ 2,f _ 2,f _ 2, f _ x1 = 10, x2 = 10, x3 = 0, x^ = 0, x2 = 0, x3 = 0.

Точность попадания в терминальные условия составляла s = 0,01.

Результаты вычислительных экспериментов приведены в таблице. Из данных таблицы следует, что метод роя частиц справился с решением рассматриваемой задачи лучше алгоритма Adam, при этом интересно, что метод роя частиц во всех экспериментах находил решения, которые давали одинаковые значения функционала, хотя найденные функции управления были различны.

Результаты вычислительного эксперимента

6 4

2

0

Рис. 1. Траектории движения первого (сплошная кривая) и второго (штриховая) роботов на плоскости для управления, найденного алгоритмом Р80

8 6 4 2 О

0 2 4 6 8 хг

Рис. 2. Траектории движения первого (сплошная кривая) и второго (штриховая) роботов на плоскости для управления, найденного алгоритмом Adam

Алгоритм Лучшее значение функционала Среднее значение функционала Средне-квадратическое отклонение Число вычислений функционала

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

PSO 2,51 2,51 0 1 500 511

Adam 2,52 2,86 0,37 1 590 261

На рис. 1, 2 приведены траектории движения двух роботов на плоскости для наилучших найденных управлений алгоритмами PSO (рис. 1) и Adam (рис. 2).

х2

Заключение. Приведены свойства симметричных систем управления. Показано, что при определенных условиях решение задачи оптимального управления для симметричной системы приводит к решению двух задач

оптимального управления. Доказано существование как минимум двух оптимальных решений в задаче оптимального управления группой симметричных объектов при определенных начальных и терминальных состояниях. Рассмотрен числовой пример решения задачи оптимального управления двумя симметричными объектами. По результатам решения выявлена эффективность использования эволюционного алгоритма роя частиц.

ЛИТЕРАТУРА

[1] Каляев И.А., Гайдук А.Р., Капустян С.Г. Модели и алгоритмы коллективного управления в группах роботов. М., ФИЗМАТЛИТ, 2009.

[2] Пшихопов В.Х., ред. Групповое управление подвижными объектами в неопределенных средах. М., ФИЗМАТЛИТ, 2015.

[3] Пшихопов В.Х., Медведев М.Ю., Гайдук А.Р. Алгоритмы управления неоднородными группами подвижных объектов в двумерных средах с препятствиями. Мехатроника, автоматизация, управление, 2016, т. 17, № 8, с. 515-524.

DOI: https://doi.org/10.17587/mau.17.515-524

[4] Karamzin D., Pereira F.L. On a few questions regarding the study of state-constrained problems in optimal control. J. Optim. Theory Appl., 2019, vol. 180, no. 1, pp. 235-255. DOI: https://doi.org/10.1007/s10957-018-1394-2

[5] Diep Q., Zelinka I., Senkerik R. An algorithm for swarm robot to avoid multiple dynamic obstacles and to catch the moving target. Int. Conf. "Artificial Intelligence and Soft Computing", 2019, pp. 666-675.

[6] Ли Э.Б., Маркус Л. Основы теории оптимального управления. М., Наука, 1972.

[7] Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. Теория. Примеры. Задачи. М., ФИЗМАТЛИТ, 2005.

[8] Leena N., Saju K.K. Modelling and trajectory tracking of wheeled mobile robots. Proc. Technol., 2016, vol. 24, pp. 538-545. DOI: https://doi.org/10.1016/j.protcy.2016.05.094

[9] Suster P., Jadlovska A. Tracking trajectory of the mobile robot Khepera II using approaches of artificial intelligence. AEI, 2011, vol. 11, no. 1, pp. 38-43.

DOI: https://doi.org/10.2478/v10198-011-0006-y

[10] Дивеев А.И., Шмалько Е.Ю. Метод аппроксимации кривыми Безье для решения задачи оптимального управления посадкой космического аппарата. Труды ИСА РАН. Динамика неоднородных систем, 2007, т. 31, № 1, c. 8-13.

[11] Дивеев А.И., Константинов С.В. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом. Известия РАН. Теория и системы управления, 2018, № 4, c. 80-106. DOI: https://doi.org/10.31857/S000233880002513-3

[12] Konstantinov S.V., Diveev A.I., Balandina G.I., et al. Comparative research of random search algorithms and evolutionary algorithms for the optimal control problem of the mobile robot. Procedia Comput. Sc., 2019, vol. 150, pp. 462-470.

DOI: https://doi.org/10.1016/jj.procs.2019.02.080

[13] Diveev A.I., Konstantinov S.V., Sofronova E.A. A comparison of evolutionary algorithms and gradient-based methods for the optimal control problem. Proc. CoDIT'18, 2018, pp. 259-264. DOI: https://doi.org/10.1109/CoDIT.2018.8394805

[14] Kennedy J., Eberhart R. Particle swarm optimization. Proc. ICNN IV, 1995, pp. 1942-1948. DOI: https://doi.org/10.1109/ICNN.1995.488968

[15] Kingma D.P., Ba J. Adam: a method for stochastic optimization. Proc. 3rd ICLR. URL: https://arxiv.org/pdf/1412.6980v8.pdf (дата обращения: 15.01.2021).

Дивеев Асхат Ибрагимович — д-р техн. наук, профессор, главный научный сотрудник, начальник отдела «Управление робототехническими устройствами» ФИЦ ИУ РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).

Софронова Елена Анатольевна — канд. техн. наук, старший научный сотрудник отдела «Управление робототехническими устройствами» ФИЦ ИУ РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).

Просьба ссылаться на эту статью следующим образом:

Дивеев А.И., Софронова Е.А. Симметричные системы управления. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2021, № 2 (135), с. 37-51. DOI: https://doi.org/10.18698/0236-3933-2021-2-37-51

SYMMETRIC CONTROL SYSTEMS

A.I. Diveev E.A. Sofronova

FRC CSC RAS, Moscow, Russian Federation Abstract

The paper focuses on the properties of symmetric control systems, whose distinctive feature is that the solution of the optimal control problem for an object, the mathematical model of which belongs to the class of symmetric control systems, leads to the solution of two problems. The first optimal control problem is the initial one; the result of its solution is a function that ensures the optimal movement of the object from the initial state to the terminal one. In the second problem, the terminal state is the initial state, and the initial state is the terminal state. The complexity of the problem being solved is due to the increase in dimension when the models of all objects of the group are included in the mathematical model of the object, as well as the emerg-

aidiveev@mail.ru sofronova ea@mail.ru

Keywords

Optimal control, phase constraints, unimodality, control of group of robots, evolutionary algorithms

ing dynamic phase constraints. The presence of phase

constraints in some cases leads to the target functional

having several local extrema. A theorem is proved that

under certain conditions the functional is not unimodal

when controlling a group of objects belonging to the class

of symmetric systems. A numerical example of solving

the optimal control problem with phase constraints by

the Adam gradient method and the evolutionary particle Received 09.05.2020

swarm method is given. In the example, a group of two Accepted 06.07.2020

symmetrical objects is used as a control object © Author(s), 2021

This work was partially supported by the RSF under the project no. 19-11-00258 the FRC CSC RAS; the chapter "Search algorithms" was supported by the RFBR grant no. 19-08-01047-a

REFERENCES

[1] Kalyaev I.A., Gayduk A.R., Kapustyan S.G. Modeli i algoritmy kollektivnogo uprav-leniya v gruppakh robotov [Models and algorithms of collective control in groups of robots]. Moscow, FIZMATLIT Publ., 2009.

[2] Pshikhopov V.Kh., ed. Gruppovoe upravlenie podvizhnymi ob'ektami v neopre-delennykh sredakh [Group control on moving objects in uncertain environments]. Moscow, FIZMATLIT Publ., 2015.

[3] Pshikhopov V.Kh., Medvedev M.Yu., Gayduk A.R. Control algorithms for the heterogeneous groups of vehicles in the two-dimensional environments with obstacles. Mekhatronika, avtomatizatsiya, upravlenie, 2016, vol. 17, no. 8, pp. 515-524 (in Russ.). DOI: https://doi.org/10.17587/mau.17.515-524

[4] Karamzin D., Pereira F.L. On a few questions regarding the study of state-constrained problems in optimal control. J. Optim. Theory Appl., 2019, vol. 180, no. 1, pp. 235-255. DOI: https://doi.org/10.1007/s10957-018-1394-2

[5] Diep Q., Zelinka I., Senkerik R. An algorithm for swarm robot to avoid multiple dynamic obstacles and to catch the moving target. Int. Conf. "Artificial Intelligence and Soft Computing", 2019, pp. 666-675.

[6] Lee E.B., Markus L. Foundations of optimal control theory. New York, Wiley, 1967.

[7] Alekseev V.M., Tikhomirov V.M., Fomin S.V. Optimal'noe upravlenie. Teoriya. Primery. Zadachi [Optimal control. Theory. Examples. Problems]. Moscow, FIZMATLIT Publ., 2005.

[8] Leena N., Saju K.K. Modelling and trajectory tracking of wheeled mobile robots. Proc. Technol., 2016, vol. 24, pp. 538-545.

DOI: https://doi.org/10.1016Zj.protcy.2016.05.094

[9] Suster P., Jadlovska A. Tracking trajectory of the mobile robot Khepera II using approaches of artificial intelligence. AEI, 2011, vol. 11, no. 1, pp. 38-43.

DOI: https://doi.org/10.2478/v10198-011-0006-y

[10] Diveev A.I., Shmal'ko E.Yu. Bezier approximation method by curves for solving optimal control problem of landing spacecraft. Trudy ISA RAN. Dinamika neodnorod-nykh sistem, 2007, vol. 31, no. 1, pp. 8-13 (in Russ.).

[11] Diveev A.I., Konstanstinov S.V. Study of the practical convergence of evolutionary algorithms for the optimal program control of a wheeled robot. J. Comput. Syst. Sc. Int., 2018, vol. 57, no. 4, pp. 561-580. DOI: https://doi.org/10.1134/S106423071804007X

[12] Konstantinov S.V., Diveev A.I., Balandina G.I., et al. Comparative research of random search algorithms and evolutionary algorithms for the optimal control problem of the mobile robot. Procedia Comput. Sc., 2019, vol. 150, pp. 462-470.

DOI: https://doi.org/10.1016/j.procs.2019.02.080

[13] Diveev A.I., Konstantinov S.V., Sofronova E.A. A comparison of evolutionary algorithms and gradient-based methods for the optimal control problem. Proc. CoDIT'18, 2018, pp. 259-264. DOI: https://doi.org/10.1109/CoDIT.2018.8394805

[14] Kennedy J., Eberhart R. Particle swarm optimization. Proc. ICNN IV, 1995, pp. 1942-1948. DOI: https://doi.org/10.1109/ICNN.1995.488968

[15] Kingma D.P., Ba J. Adam: a method for stochastic optimization. Proc. 3rd ICLR. Available at: https://arxiv.org/pdf/1412.6980v8.pdf (accessed: 15.01.2021).

Diveev A.I. — Dr. Sc. (Eng.), Professor, Chief Research Fellow, Head of the Department of Robotics Control, FRC CSC RAS (Vavilova ul. 44, korp. 2, Moscow, 119333 Russian Federation).

Sofronova E.A. — Cand. Sc. (Eng.), Senior Research Fellow, Department of Robotics Control, FRC CSC RAS (Vavilova ul. 44, korp. 2, Moscow, 119333 Russian Federation).

Please cite this article in English as:

Diveev A.I., Sofronova E.A. Symmetric control systems. Herald of the Bauman Moscow State Technical University, Series Instrument Engineering, 2021, no. 2 (135), pp. 37-51 (in Russ.). DOI: https://doi.org/10.18698/0236-3933-2021-2-37-51

i Надоели баннеры? Вы всегда можете отключить рекламу.