Cloud of Science. 2018. T. 5. № 4 http:/ / cloudofscience.ru
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов1
А. И. Дивеев***, Е. Ю. Шмалько**
Российский университет дружбы народов 117198, Москва, ул. Миклухо-Маклая, 6
Федеральный исследовательский центр «Информатика и управление» РАН 119333, Москва, ул. Вавилова, 44, корп. 2
e-mail: [email protected], [email protected]
Аннотация. Рассматривается задача оптимального мониторинга местности с помощью группы мобильных роботов. В задаче заданы местность с препятствиями и случайно расположенные метки на территории. Объекты управления имеют области просмотра. Необходимо найти оптимальное управление, которое позволит покрыть областями просмотра роботов наибольшее количество меток за заданное время или покрыть все метки за минимальное время. Дополнительно в контролируемой области находятся препятствия, которые не позволяют обеспечить движение роботов по пути минимальной длины. Для решения задачи использован эволюционный алгоритм серого волка. Предложены два подхода к поиску оптимального управления на основе эволюционного алгоритма: прямой поиск и двухэтапный поиск так называемого синтезированного оптимального управления. Представлены результаты решения задачи с помощью обоих подходов.
Ключевые слова: мониторинг местности, оптимальное управление, эволюционный алгоритм, группа мобильных роботов.
1. Введение
Задача оптимального мониторинга местности с помощью мобильных роботов на практике встречается часто при различных видах контроля окружающей среды [15]. Возможны разные интерпретации этой задачи. В общем случае объекты, осуществляющие мониторинг, имеют область просмотра заданного размера и конфигурации. Необходимо за заданное время покрыть областью просмотра наибольшую площадь в заданном регионе или всю площадь контролируемого региона областями просмотра роботов за минимальное время. В другой постановке считаем, что на контролируемой области расположены метки. Необходимо покрыть областями просмотра роботов наибольшее количество меток за заданное время или все метки
1 Работа выполнена при поддержке Российского фонда фундаментальных исследований (№ 16-29-04224-офи_м, № 17-08-01203-а, № 18-29-03061-мк).
за минимальное время. В работе [5] рассматривается задача мониторинга местности группой квадрокоптеров. Там заданы точки в пространстве, через которые обязательно должны пройти квадрокоптеры для проведения мониторинга. На первом этапе в работе решается задача группы коммивояжеров для определения точек, по которым должен пройти каждый квадрокоптер, чтобы суммарная длина пути всех квадрокоптеров была минимальной. На втором этапе осуществляется движение квадрокоптеров по выбранным точкам с учетом отсутствия столкновения квадро-коптеров между собой. В нашей задаче не ставится требование прохождения роботов по определенным точкам. Роботы должны просмотреть установленные метки. При плотном расположении меток один робот может покрыть областью просмотра несколько меток. В контролируемой области находятся препятствия, которые не позволяют обеспечить движение роботов по пути минимальной длины.
В работе мы сравниваем два подхода к численному решению задачи оптимального мониторинга группой объектов. Первый подход — это прямое решение задачи оптимального управления. Мы трансформируем задачу к задаче нелинейного программирования [6, 7] с помощью дискретизации управления роботами по времени. Из-за фазовых ограничений и требований к отсутствию столкновений между роботами задача не является унимодальной [8]. Для решения задачи мы используем эволюционный алгоритм «серого волка» [9-12]. Второй подход — это решение задачи синтезированного оптимального управления. Мы первоначально решаем задачу стабилизации робота относительно точки в пространстве состояний. Затем управляем роботами с помощью подбора точек стабилизации. Для поиска точек стабилизации используем один из методов символьной регрессии [3, 4] и эволюционный алгоритм «серого волка».
2. Задача оптимального мониторинга группой роботов
Заданы математические модели объектов управления
х3 =:ПУУ), (1)
где х3 — вектор состояния объекта управления ]; и3 — вектор управления объекта 3, х1 е Я", и1 е Я™, т < п, 3 = 1,..., Ы, N — количество объектов управления.
Заданы ограничения на управление
и < и3 < и+.
Для всех объектов управления заданы начальные условия
х3 (0) = х0,3, х3 (0) = х°,3, х3 (0) = х°,3 и терминальные состояния
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов
X7 ) = X7X7 ) = X7. Х7 ) = X7,7,
где ^ — время попадания всех объектов в терминальное состояние не может превышать заданной величины X+.
Задана область мониторинга в подпространстве Як
V с Як, к < п. Заданы метки в области мониторинга
У = {у1,..., ум} с V,
где уг = [у ... ук ]Т, I = 1,..., М.
Задана область просмотра объекта управления
ф(у - Сх') < 0, (2)
где С — к х п -матрица; у — точка пространства Як, если для объекта ] выполняются условия (2), то это означает, что в область просмотра объекта ] попала точка у.
Заданы фазовые ограничения
а(х') < о, г = 1,..., г, '=1,..., N.
Заданы условия отсутствия столкновения объектов или динамические фазовые ограничения
Р(х',хг)<0, 7= 1,..., N-1, г = 7 +1,..., N. Задан критерий качества
I N п '/ г N
= \ЕЕ (х' (7) - х7,7')2 + /ЕЕ^(а (х7'(£ ш +
V 7=1 г=1 0 ¿=1 7=1
(3)
к
+ ........ ■
0 г=1 J =г+1 г=1
1 N-1 N к
" / Е Е ^(Рг (хг (£), ^ (£ Ш + ^ (1 - г,),
где
X, если X < X+ и ЕЕ(хС/) -х{7)2 < е,
= 1 V 7=1 '=1
(1, если А > 0,
*(А) = Г ,
[0 — иначе.
_ |1, если ф(у' -Сх7(X)) < 0, 7 = 1,..., N, X е [0;^], 10 — иначе.
X — иначе
8 — заданная точность попадания в терминальные условия; 5 — заданный коэффициент штрафа за необнаруженную метку; Л+ — заданное время процесса управления.
3. Дискретизация управления по времени
Для решения задачи поиска оптимального управления численным эволюционным алгоритмом дискретизируем управление по времени. Зададим интервал времени
ДЛ. Получим Ь =
г+
интервалов управления и Ь +1 границ интервалов. На каж-
Д
дом интервале Л е ^ДЛ; + 1)ДЛ], w = 0,..., Ь, управление определяем по формуле
4 (Л) =
ы,+, если й] > и;+, V
щ , если и- < щ , (4)
й' — иначе,
где
Щ (0 =-—--(t-wAt + 1)^(Мнт(;Ч1+,Ч1+и,, (5)
Чь — компоненты искомого вектора параметров ц = Ч ... ч(£+1)идт]1; Ч- — Чъ — Чъ';
Ч-, Ч+ — заданные ограничения значений параметров; Ъ = 1,..., (Ь + 1)шМ.
Решением задачи является оптимальный вектор параметров (¡, который обеспечивает получение управления (4), (5) для решения задачи с оптимальным значением критерия качества (3).
4. Оптимальное синтезированное управление
Для каждого робота (1) решаем задачу стабилизации относительно точки в пространстве состояний и находим управление в виде функции от координат пространства состояний
и = Ь(х - х),
где х* — точка стабилизации в пространстве состояний.
Для решения задачи стабилизации используем один из методов символьной регрессии, метод бинарного вариационного генетического программирования [13, 14].
После решения задачи стабилизации находим для каждого робота значения точек стабилизации х 3,1,..., х 3,н, которые также должны переключаться через неко-
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов
торый, другой интервал времени Дх . Решением задачи в данном случае являются иЫН значений координат точек стабилизации, которые обеспечивают перемещения роботов из начальных состояний в терминальные с оптимальным значением критерия качества (10).
5. Эволюционный алгоритм «серого волка»
В алгоритме «серого волка» [15-17] при каждой эволюции выделяем три лучших решения и модифицируем каждое решение на основе трех лучших. В процессе эволюции находим случайно в окрестности каждого из трех лучших решений новое решение. Размер окрестности поиска зависит от расстояния между текущим решением, которое должно быть улучшено, и одним из трех лучших решений. Новое возможное решение вычисляем как среднее решение из трех новых решений, полученных в окрестности трех лучших решений.
Генерируем случайно начальное множество векторов параметров
Я = (я1,..., Яя), Я7 = [д/ ... др]Т, ] = 1.....Н.
Вычисляем значения целевой функции для каждого возможного решения
F = 01 = J (Я1),..., ¡3 (яН)).
Находим три лучших возможных решения
яа = й... дp ]Т, яв = [дв... д\ ]Т, я8 = [д8 ... др ]Т, 3(яа) = Ш1п{3(я7): 7 = 1,..., н},
3 (яв) = Ш1П{3 (я7): 7 = 1,..., н, 7 Ф а}, 3(я8) = Ш1П{3(я7): 7 = 1,..., н, 7 Ф а, ] Ф в}
Вычисляем новые значения для всех остальных возможных решений из множества
ах = да - 2(1 - к/к №-1)|2^дга - д/|, вх = дв - 2(1 - к/кХ2£-1)|2§дв - д/|, 5х = дг8 - 2(1 -кК)(2^ -1) | 2^д8 - д/|, д/ =1/3(а, +рх +5Д 7=1,..., Н, 1=1,..., р,
Если получаем значение целевой функции ./(я') для нового возможного решения я' лучше ■/(я') < ^(я^), то заменяем возможное решение (\] на новое я.
Повторяем цикл с поиском трех лучших решений и вычислением новых возможных решений заданное число раз. Лучшее найденное возможное решение считаем решением задачи.
6. Вычислительный эксперимент
Рассмотрим задачу оптимального мониторинга местности группой из N = 2 мобильных роботов.
Математические модели объектов управления имеют следующий вид:
хi — Ы| COS х^ ?
xi = и{ sin X¡ ,
Xj — И2 2
где j = 1,2.
Заданы начальные условия:
^ (0) = 0, x1 (0) = 0, x1 (0) = 0, x2 (0) = 0, x2 (0) = 10, x32 (0) = 0. Задано ограничение на управление:
-10 < uj < 10, i = 1,2, j = 1,2. Заданы терминальные состояния:
x\(tf ) = 10, x\(tf ) = 10, x\(tf ) = 0, x*(tf) = 0, x\(tf) = 10, x2(tf) = 0,
где
11, если t < t+ и y/Ax(t) < 0.01,
tf = I +
[t — иначе,
Ax(t) = (x1(t) -10)2 + (x1(t) -10)2 + (x2(t))2 + (x2(t ))2 + (x2(t) -10)2 + (x2(t)). Заданы фазовые ограничения
^(x/ -7.5)2 + (xj -7.5)2 -1.5 < 0,
,J(x( -2.5)2 + (xj -2.5)2 -1.5 < 0,
xj - 2)2 + (xj - 8)2 -1.75 < 0,
7(x/ - 8)2 + (xj - 2)2 - 2 < 0,
где j = 1,2.
Определены динамические фазовые ограничения:
д/(x¡ -x2)2 + (x\ -x2)2 -0.5 < 0. Область просмотра объекта управления
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов
X -X2)2 + (х2 -х22)2 -0.5 < 0,
где х1, х2 — координаты точки на плоскости в области мониторинга.
Мониторингу подвергалась площадь на плоскости {х, X } 10 х10.
В первом эксперименте при дискретизации управления во времени было задано максимальное время процесса управления ? + = 5 с. Интервал дискретизации А? = 0.25 с. На плоскости {х, X} случайно генерировались 25 меток. Штраф за пропущенную метку 5 = 50.
Результаты моделирования с наилучшим найденным решением, которое дало значение функционала У = 6.6697, приведены на рис. 1.
Рисунок 1. Результаты решения задачи оптимального мониторинга методом дискретизации управления
Во втором эксперименте первоначально была решена задача стабилизации робота относительно точки в пространстве состояний. Была получена следующая система стабилизации:
щ = 5ёп(5ёп(/1)(ехр I АI -1)) 1п(| ехр|Л|-1 +1), щ = В + С,
А = sgn(ln | ^ («?2 - д2 ) | +41 + ехр(<?з) ) х (exp | 1П | ^ (^ - д32) | +>/1 + ехр(дз) | -1) х х sgn( Ах - sgn( А у)(ехр | А у | -1) sgn А0)) х 1п(| Ах - sgn( Ау )(ехр | Ау | -1) sgn( А0) | +1,
В = 8§п(Яз А0)(ехр | д3 А01 -1) +
ц(А0)+
1 - ехр(Ау/ Ах) 1 + ехр(Ау/ Ах)
С = sgn(q23Ay(Ax + Ау))^| q2Ay(Ax + Ау | + sgn(sgn(Ae)(exp | А91 -1)^ - )) х х(1п | exp | Ае | -1)^3 - ) | +1) + ц(ДхАу),
Ах = х* - х, Ау = х* - х, Ае = х* - х, ^ = 0.84180, ^ = 0.65527, ^ = 2.45020. Далее надо было найти 5 точек стабилизации для каждого робота. Точки переключались с интервалом А = 0.7 с. Во втором эксперименте предельное время управления = 3.5 с. Штраф за пропуск метки составлял 5 = 35.
В результате было получено управление, которое дало меньшее значение функционала J = 4.8098. Результаты моделирования приведены на рис. 2.
0123456789 10 11
Рисунок 2. Результаты решения задачи оптимального мониторинга методом синтезированного управления
7. Заключение
В заключение отметим, что основная трудность решаемой задачи в том, что она не является унимодальной, поэтому для ее решения мы применяем эволюционные методы. Как видно из результатов вычислительного эксперимента, оба метода успешно справились с поставленной задачей, а среди двух представленных подходов к решению задачи алгоритмом «серых волков» лучшее значение функционала показал двухэтапный подход синтезированного оптимального управления.
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов
Литература
[1] Кремлев А. С., Колюбин С. А., Вражевский С. А. Автономная мультиагентная система для решения задач мониторинга местности // Приборостроение. 2013. № 56(4). С. 6165.
[2] Иванов Д. С. Порядок применения мобильных роботов для обследования и мониторинга аварийных зданий в условиях чрезвычайных ситуаций // Технологии гражданской безопасности. 2013. № 1 (35). С. 80-82.
[3] Даринцев О. В., Мигранов А. Б. Области применения приближенных и интеллектуальных методов планирования траекторий для групп мобильных роботов // Современные проблемы науки и образования. 2014. № 6. URL: https://science-education.ru/ru/article/ view?id=16542
[4] Лушников Б. В., Политов Е. Н., Тарасова Е. С., Казарян К. Г. Бионический плавающий робот для мониторинга природных и техногенных объектов в гидросфере // Cloud of Science. 2014. T. 1. № 1. С. 61-77
[5] Diveev A. I., Ibadulla S. I., Konyrbaev N. B., Shmalko E. Yu. Synthesis of Control for Group of Quadrotors in Task of Area Monitoring // Proceedings The 11th IEEE International Conference on Application of Information and Communication Technologies (AICT 2017), 20-22 September 2017, Moscow. Vol. 1. P. 365-370.
[6] ХиммельблауД. Прикладное нелинейное программирование. — М. : Мир, 1975.
[7] Фан-Лянь-Цэнь, Ван, Чу-Сен Дискретный принцип максимума. — М. : Мир, 1967.
[8] Дивеев А. И. Условия отсутствия свойств унимодальности функционала в задаче оптимального управления с фазовыми ограничениями // Cloud of Science. 2018. Т. 5. № 2. С. 268-285.
[9] Mirjalili S. A., Mirjalili S. M., Lewis A. Grey Wolf Optimizer // Advances in Engineering Software. 2014. Vol. 69. P. 46-61.
[10]MalikM., Mohideen E., Ali L. Weighted distance grey wolf optimizer for global optimization problems. 2015 IEEE International Conference on Computational Intelligence and Computing Research (ICCIC). 2016. P. 1-6.
[11] Mittal N., Singh U., Sohi B. Modified grey wolf optimizer for global engineering optimization. Appl. Comput. Intell. Soft Comput. Vol. 2016. Apr. 2016, Art. no. 7950348.
[12] Wen Long, Songjin Xu. A novel grey wolf optimizer for global optimization problems. 2016 IEEE Advanced Information Management, Communicates, Electronic and Automation Control Conference (IMCEC), 2016.
[13] Diveev A. I., Shmalko E. Yu. Complete Binary Variational Analytic Programming for Synthesis of Control at Dynamic Constraints // ITM Web Conf. 2017. Vol. 10. P. 02004 1051/itmconf/20171002004.
[14] Дивеев А. И., Шмалько Е. Ю. Метод бинарного генетического программирования для автоматизации поиска решения задачи синтеза управления // Вопросы теории безопасности и устойчивости систем. 2017. № 19. С. 23-39.
[15] Частикова В. А., Жерлицын С. А. Исследование алгоритма серых волков // Научные труды КубГТУ. 2016. № 16. С. 136-142
[16] Дивеев А. И., Константинов С. В. Задача оптимального управления и ее решение эволюционным алгоритмом «серого волка» // Вестник Российского университета дружбы народов. Серия: Инженерные исследования. 2018. Т. 19. № 1. С. 67-79.
[17] Карпенко А. П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой: учеб. пособие. — М. : Изд-во МГТУ им. Н. Э. Баумана, 2014.
Авторы:
Асхат Ибрагимович Дивеев — доктор технических наук, профессор, главный научный сотрудник, Федеральный исследовательский центр «Информатика и управление» РАН, Российский университет дружбы народов
Елизавета Юрьевна Шмалько — кандидат технических наук, старший научный сотрудник, отдел Нелинейного анализа и проблем безопасности, Федеральный исследовательский центр «Информатика и управление» РАН
Application of the Evolutionary Algorithm of "Gray Wolf" to Solve the Problem of Optimal Area Monitoring by a Group of Robots
A. I. Diveev*,**, E. Yu. Shmalko"
*People's Friendship University of Russia, Miklouho-Maclay str., 6, Moscow, Russia, 117198 **Federal Research Center "Computer Science and Control" of Russian Academy of Sciences Vavilova str., 44, Moscow, Russia, 119333 e-mail: [email protected], [email protected]
Abstract. The optimal area monitoring by a group of mobile robots is considered. In the task, an area with obstacles is specified and randomly placed marks are set on the area. We assume that control objects have viewing fields. It is necessary to find such optimal control that will allow covering for a given time the greatest number of the placed marks by the robots viewing fields or covering all marks in the minimum time. In addition, in the controlled area there are obstacles that prevent robots from moving along the path of minimum length. To solve the problem, the evolutionary algorithm of the "gray wolf" is used. Two approach-es of using of the "gray wolf" algorithm are proposed: direct search and two-stage search for the so-called synthesized optimal control. The results of solving the problem using both approaches are presented.
Keywords: area monitoring, optimal control, evolutionary algorithm, group of mobile robots.
References
[1] Kremlev A. S., Kolyubin S. A., Vrazhevskiy S. A. (2013) Priborostroyeniye. 56(4):61-65. [In Rus]
[2] Ivanov D. S. (2013) Tekhnologii grazhdanskoy bezopasnosti. 1(35):80-82. [In Rus]
[3] https://science-education.ru/ru/article/view?id=16542 [In Rus]
[4] Lushnikov B. V., Politov Ye. N. et al. (2014) Cloud of Science. 1(1):61-77 [In Rus]
[5] Diveev A. I., Ibadulla S. I., Konyrbaev N. B., Shmalko E. Yu. (2017) Synthesis of Control for Group of Quadrotors in Task of Area Monitoring. In Proc. of The 11th IEEE International Conference on Application of Information and Communication Technologies (AICT 2017), 2017. Vol. 1, pp. 365-370.
Применение эволюционного алгоритма «серого волка» для решения задачи оптимального мониторинга местности группой роботов
[6] Khimmel'blau D. (1975) Prikladnoye nelineynoye programmirovaniye. Moscow, Mir [In Rus]
[7] FanLyan'-Tsen', Van Chu-Sen (1967) Diskretnyy printsip maksimuma. Moscow, Mir [In Rus]
[8] Diveyev A. I. (2018) Cloud of Science. 5(2):268-285. [In Rus]
[9] Mirjalili S. A., Mirjalili S. M., Lewis A. (2014) Advances in Engineering Software. 69:46-61.
[10] Malik M., Mohideen E., Ali L. (2016) Weighted distance grey wolf optimizer for global optimization problems. 2015 IEEE International Conference on Computational Intelligence and Computing Research (ICCIC), pp. 1-6.
[11] Mittal N, Singh U, Sohi B. (2016) Appl. Comput. Intell. Soft Comput. 2016:7950348.
[12] Wen Long, Songjin Xu. (2016) A novel grey wolf optimizer for global optimization problems. In 2016 IEEE Advanced Information Management, Communicates, Electronic and Automation Control Conference (IMCEC)/
[13] Diveev A. I., Shmalko E. Yu. (2017) ITM Web Conf. 10:02004.
[14] Diveev A. I., Shmal'ko E. Yu. (2017) Voprosy teorii bezopasnosti i ustoychivosti system. 19:23-39. [In Rus]
[15] Chastikova V. A., Zherlitsyn S. A. (2016) Nauchnyye trudy KubGTU, 16:136-142 [In Rus]
[16] Diveev A. I., Konstantinov S. V. (2018) Vestnik Rossiyskogo universiteta druzhby narodov. Seriya: In-zhenernyye issledovaniya. 19(1):67-79 [In Rus]
[17] Karpenko A. P. (2014) Sovremennyye algoritmy poiskovoy optimizatsii. Algoritmy, vdokhnovlennyye prirodoy. Moscow, Izd-vo MGTU im. N. E. Baumana [In Rus]