Systems of Control, Communication and Security
ISSN 2410-9916
УДК 004.896, 004.021
Синтез нейросетевой системы планирования траекторий для группы мобильных роботов
Юдинцев Б. С.
Постановка задачи: при функционировании группы мобильных роботов в недостаточно известной обстановке возникает ряд проблем управления, одна из которых - это планирование безопасных траекторий, позволяющих строить гладкие безаварийные маршруты перемещения при наличии динамических и вновь выявляемых (бортовыми сенсорами ближней локации) препятствий. Анализ различных алгоритмов планирования показал, что существующие подходы не учитывают специфику бортовых систем мобильных роботов (вычислительные возможности, скорость реакции на внешние возмущения), что накладывает ряд ограничений для применения данных методов в условиях работы группы роботов в единой рабочей зоне и опасности столкновения с другими агентами группы. Целью работы является модификация метода расчета траекторий, базирующегося на нейронной сети Хопфилда, и синтез системы планирования с учетом специфики управления группой роботов. Используемые методы: решение задачи планирования безопасных траекторий движения основано на использовании метода планирования траектории с помощью нейронной сети Хопфилда. Особая конфигурация сети позволяет формировать на выходе матрицу состояния нейронов (нейронную карту), оперируя значениями данной матрицы, корректировать траекторию в процессе движения робота с учетом заданных правил взаимодействия агентов в группе. Правила взаимодействия агентов определяются архитектурой системы планирования, которая (в зависимости от выбранного метода группового управления) может быть: централизованной, децентрализованной, гибридной. Новизна: элементами новизны представленного решения является модифицированная математическая модель нейронной сети Хопфилда, которая использует новую передаточную функцию (функцию активации) нейронов и новое условие сходимости. Также к элементам новизны относятся алгоритмы корректировки траектории и информационного обмена между агентами в группе. Результат: модификации математической модели НС Хопфилда позволили сократить время формирования нейронной карты в 1,5-2,5 раза (в зависимости от размерности и конфигурации рабочего пространства). Использование представленных алгоритмов корректировки траектории позволяет системе планирования сохранять высокую эффективность при работе в условиях информационной недостаточности и при наличии динамических препятствий в рабочей зоне. Достоверность результатов подтверждена в ходе программного моделирования, а также экспериментальной проверки на специализированном экспериментальном стенде. Практическая значимость: представленные алгоритмы реализованы в виде специализированного программного обеспечения на базе языка Python 3, которое может быть использовано при синтезе и отладке алгоритмов работы бортовых систем планирования траекторий для агентов коллектива мобильных роботов. Также практической значимостью обладает разработанный программно-аппаратный комплекс экспериментального стенда, позволивший автоматизировать проводившиеся натурные/полунатурные эксперименты с различными типами систем планирования и использующийся для экспериментального исследования перспективных моделей группового управления и алгоритмов распределения задач в гетерогенной группе роботов.
Ключевые слова: планирование траекторий, нейронные сети Хопфилда, мультиагентные системы, мобильные роботы.
Библиографическая ссылка на статью:
Юдинцев Б. С. Синтез нейросетевой системы планирования траекторий для группы мобильных роботов // Системы управления, связи и безопасности. 2019. № 4. С. 163-186. DOI: 10.24411/24109916-2019-10406.
Reference for citation:
Yudintsev B.S. Synthesis of a neural network path planning system for a group of mobile robots. Systems of Control, Communication and Security, 2019, no. 4, pp. 163-186. DOI: 10.24411/2410-9916-2019-10406 (in Russian).
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
Актуальность
В настоящее время роботы и робототехнические системы (РТС) получили широкое распространение в различных сферах человеческой деятельности, это обусловлено тем, что данные системы позволяют автоматизировать ряд трудоемких задач: сборка, строительство, грузоперевозка, исследование местности и т.д. При этом возникает вопрос эффективности применения РТС в задачах, предполагающих автономное функционирование в течении продолжительного времени (например, исследование больших территорий) или выполнение работ в агрессивных средах (под водой, в космосе, в зонах радиационного загрязнения). В таких условиях становится актуальным применение нескольких роботов совместно, т.е. в группе. При такой модели управления РТС будет отличаться повышенной надежностью и устойчивостью к внешним возмущениям, а также легкостью масштабирования. Тем не менее, для обеспечения данных преимуществ к роботам-агентам подобной РТС предъявляется ряд особых требований: наличие развитых средств коммуникации, высокая степень автономности, что, в свою очередь, приводит к появлению ряда специфических проблем управления.
Исходя из анализа исследовательских работ [1-5], можно сделать вывод, что одной из ключевых проблем, возникающих при функционировании группы мобильных роботов (МР) в недостаточно известной обстановке, является планирование безопасных траекторий движения, позволяющих строить безаварийные маршруты, близкие к оптимальным (кратчайшим).
Применяемые подходы для решения задачи планирования можно условно разделить на 2 основные группы [5]:
1) классические алгоритмы поиска - алгоритм Дейкстры, «поиск в глубину», А* и т.п. методы поиска по графу [1, 6];
2) интеллектуальные алгоритмы - нейронные сети (НС), нечеткие и генетические алгоритмы, основным преимуществом которых является скорость расчета при умеренной нагрузке на бортовые вычислительные комплексы [7-9].
В ходе анализа выявлено, что существующие решения и исследования в области группового управления в большинстве своем нацелены на решение проблем коммуникации и распределения задач в группе [1, 10, 11]. При этом данные подходы не учитывают специфику бортовых систем МР (вычислительные возможности, скорость реакции на внешние возмущения), что накладывает ряд ограничений для применения данных методов при наличии динамических препятствий в рабочей зоне и опасности столкновения с другими агентами группы (в недетерминированной среде). Очевидным решением данной проблемы является применение централизованного подхода при синтезе системы управления. Примерами подобного решения являются РТС для автоматизации процессов перемещения и сортировки грузов (посылок) в складских помещениях, применяемые крупнейшими интернет-магазинами в США (Amazon) и Китае (Alibaba) [12, 13]. РТС включает несколько десятков МР, способных перемещать грузы весом до 600 кг. Роботы управляются с помощью беспроводной связи (Wi-Fi) через централизованную систему управления (Robotic
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
Management System - RMS), которая, в соответствии с заданными приоритетами (по времени упаковки и отправки товара), распределяет запросы на доставку груза от операторов к МР. Каждый МР способен автономно избегать столкновения с другими агентами и людьми на складе, а также отправляться на станции подзарядки. Роботы могут двигаться только в 4-х направлениях, а движение по траектории осуществляется с помощью сканирования встроенных в пол маркеров. Таким образом, система имеет полную информацию о рабочей зоне, что позволяет планировать безаварийные маршруты для агентов группы.
В работе [11] рассматривается вопрос коммуникации и перемещения группы в недетерминированной среде. Агенты также управляются из единого центра, при этом для планирования траекторий предлагается использовать «волновой алгоритм» (алгоритм Ли) или A*. Также, как и в системе управления складскими МР, данное решение имеет ряд известных ограничений, связанных с централизованным принципом организации [14]: низкая живучесть, сложность масштабирования, ограниченный радиус действия. Использование децентрализованного или мультиагентного подходов является наиболее эффективным способом для преодоления данных ограничений [14].
В статье [1] рассматриваются вопросы управления децентрализованным коллективом МР. Большое внимание уделено проблемам распределения задач и коммуникации между агентами, тем не менее, вопрос планирования безаварийных траекторий для МР и их оптимальность подробно не затрагиваются. Предлагается использовать алгоритм A*, основным недостатком которого является сильная зависимость от функции эвристического приближения, что может негативно влиять на оптимальность (близость к кратчайшей) расчетной траектории особенно в условиях недетерминированной среды. Также не учитывается специфика применения данного алгоритма на бортовых вычислительных системах МР. При этом объем вычислений напрямую зависит от размера рабочей зоны МР и ее дискретизации, и расчет траектории (или ее перерасчет при обнаружении препятствий на траектории) может требовать обработки тысячи ячеек в списках Open (открытые узлы) и Closed (закрытые узлы).
Более подробно проблема планирования безаварийных траекторий для группы МР рассмотрена в работе [15]. В статье предлагается решение данной проблемы с помощью применения алгоритма «потенциальных полей» [16]. Алгоритм позволяет гарантированно избежать столкновения между агентами (в т.ч. и в недетерминированной среде), если хотя бы один из агентов может определить расстояние до другого. Тем не менее, как указывают сами авторы алгоритма, данный способ не гарантирует оптимальность построенной траектории. Также возможны ситуации, когда алгоритм не способен решить задачу планирования, например, при нахождении вблизи агента большого количества препятствий (или других агентов). В этом случае вокруг агента будет генерироваться «отталкивающее поле» и таким образом создается локальный минимум, в окрестностях которого расчет траектории будет невозможен.
Исходя из анализа существующих решений, можно сделать вывод, что разработка системы планирования с учетом специфики группового управления
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
и аппаратных возможностей МР представляется актуальной и своевременной задачей.
Предлагается воспользоваться методом планирования траекторий с помощью «нейронных карт» с использованием НС Хопфилда [7, 17], а также на основе данного метода произвести синтез системы планирования траекторий для группы МР, действующей в двумерном (плоском) дискретном рабочем пространстве с препятствиями (далее «рабочее пространство»).
Постановка задачи
Для формальной постановки и решения задачи в работе введены обозначения, представленные в таблице 1.
Таблица 1 - Обозначения
Обозначение Физический смысл обозначения
a Индекс агента группы
Cmn Индекс дискретной ячейки рабочего пространства
Ca (t) Индекс дискретной ячейки рабочего пространства, занятой агентом а в момент времени 1
Cg a Индекс целевой ячейки для агента а
C = (coo ... cmn) Матрица индексов дискретного рабочего пространства размерностью ЫУ-Ы
O(t) = {Cmn} Множество индексов ячеек, занятых препятствиями, в момент времени 1
R-a (t) = {Cmn} Множество индексов ячеек, занятых или пересекаемых в момент времени 1, агентами, индекс которых не равен а
Ta {Cmn} Множество индексов ячеек, составляющих траекторию агента а
L(Ta) Количество значений во множестве Та («длина» траектории)
Va Скорость агента а
Pa Значение приоритета агента а
Ein_a = (eoo ... емм) Матрица входных сигналов е нейронной сети агента а размерностью ЫУЫ
Eout_a = (eoo ... емм) Матрица выходных сигналов е нейронной сети агента а размерностью ЫуЫ
Ei Сигнал нейрона с индексом г
Ui Взвешенная сумма сигналов нейронов сети, связанных с г-м нейроном
Ф(и) Функция активации г-го нейрона сети
S Операция формирования входных сигналов нейронной сети Хопфилда
H Операция формирования выходных сигналов нейронной сети Хопфилда
P(E) Операция расчета траектории по выходным данным нейронной сети
Дано: двумерное рабочее пространство, разделенное на равные (по форме и размеру) участки - дискретные ячейки. Каждая дискретная ячейка имеет свой порядковый номер (индекс) с, из которых формируется матрица индексов С. В данном рабочем пространстве находится группа агентов {а1, «2,..., ап}, для которых используется общая матрица С. Агенты имеют габаритные размеры, не превышающие размер дискретной ячейки. Матрица Еп_а формируется в зависимости от С, 0(?), сё_а и зависит от особенностей сенсорной системы участника группы и структуры системы управления группой.
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
Для агента группы с индексом a решение задачи планирования траектории может быть формально описано следующим образом: S: C, O(t), Og a^Ein a,
H. Eout_a ^H(Ein_a), Ta P(Eout_a)-
При расчете Ta должны быть выполнены следующие условия:
jca (t) g O(t), (t) ^ (t)'
L(Ta ) ^ min.
Метод планирования траекторий с помощью НС Хопфилда и его модификация
Для расчета траектории (Та) используется рекуррентная НС Хопфилда с особой топологией: нейроны соединяются только с подмножеством ближайших соседей, а весовые коэффициенты связей будут определяться функцией расстояния. В случае ортогональной дискретизации рабочего пространства нейрон I в такой сети будет иметь 8 связей (4 прямых - ws и 4 диагональных - wd, рис. 1).
Y 2
w
й/
} ' 1
0 ! 1 ; 2 I х
Рис. 1. Структура домена НС Хопфилда
Таким образом, весовые коэффициенты будут определяться следующим отношением:
¿{иЛ) = - х] )2 + (У1 - У] )2 =д/(1 - 2)2 + (1 - 2)2 = л/2 *
* 1,4142 ^ wd ws = 0,11011\у8 .
Нейроны данной сети «виртуально» распределяются по рабочему пространству, располагаясь в центрах дискретных ячеек. Таким образом, нейронная сеть будет являться топологическим упорядоченным представлением заданного пространства.
Входной сигнал сети также будет формироваться в зависимости от конфигурации рабочего пространства: нейрон, находящийся в целевой ячейке будет иметь максимальный входной сигнал - 1, нейроны, расположенные в ячей-
1
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
ках, занятых препятствиями, минимальный - 0. Сигналы остальных нейронов будут формироваться, исходя из особенностей энергетического взаимодействия в рекуррентной НС (активация), до тех пор, пока не примут постоянные значения, т.е. пока сеть не войдет в состояние равновесия [17, 18]. Наличие обратных связей в НС Хопфилда (в цифровой реализации) обуславливает итерационный характер протекания процесса активации, таким образом, сеть проходит несколько этапов активации до входа в равновесие. Результатом данного процесса является матрица выходных значений всех нейронов сети - нейронная карта (ЕоиГ), размерность которой равна размерности рабочего пространства. Сформированная нейронная карта будет являться взвешенным отображением дискретного рабочего пространства, т.е. каждое значение матрицы - это «вес» соответствующей дискретной ячейки в диапазоне [0, 1], где целевая ячейка будет иметь максимальное значение - 1. По данной нейронной карте можно построить траекторию от любой ячейки с весом больше 0 до целевой точки, при этом построенная траектория будет близка к кратчайшей (Ь(Та)^тт). Расчет траектории производится путем выбора максимального значения «стоимости перехода» на каждую из соседних ячеек.
Если г и у две смежных ячейки, то «стоимость перехода» (градиент О) по направлению от г до у будет приближенно определяться по формуле: 0(1, ]) = (Е] - Е, ,
где Ег - значение сигнала г-го нейрона (в текущей ячейке); Еу - значение сигнала у-го нейрона; Wij - весовой коэффициент связи между г и у.
После проведения программного моделирования данного метода планирования было установлено, что возможно ускорить процесс формирования карты и таким образом адаптировать алгоритм расчета траектории для применения на малогабаритных мобильных платформах с ограниченными вычислительными ресурсами.
Для ускорения процедуры планирования были сделаны следующие модификации метода:
1. Заменена функция активации нейронов НС Хопфилда.
2. Изменено условие сходимости сети, т.е. условие, при котором нейронная карта считается сформированной.
3. Упрощена весовая функция сети.
Первая модификация была сделана путем замены используемой ранее передаточной функции Ф(и) гиперболического тангенса на линейную с насыщением:
0, если и < 0,
2м,- 1
e — 1
Ф(И; ) = th(Ui ) = -2— ^ Ф(Ы; ) e 1 +1
I
и,, если 0 < и < 1, 1, если и > 1.
где иI - взвешенная сумма сигналов нейронов сети, связанных с г-м нейроном.
Новая функция активации требует меньших затрат машинного времени и удовлетворяет основным требованиям для построения нейронной карты: равна
<
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
нулю для нулевого сигнала и монотонно возрастает при положительном входном сигнале, насыщаясь к единице [7, 17].
Данная модификация позволила сократить время входа НС в состояние равновесия в 2,5 раза, а также снизить возникновения локальных максимумов при сложной конфигурации препятствий и значительном количестве итераций, необходимых для построения карты. Результаты моделирования метода с использованием новой передаточной функции нейронов и их анализ более подробно представлены в статье [19].
Второй этап модификации метода планирования позволил минимизировать количество итераций активации НС, необходимых для формирования нейронной карты n^min. Суть состоит в том, что нейронная карта считается сформированной, если сигнал нейрона (Ei), находящегося в ячейке, от которой необходимо построить траекторию, больше нуля:
'Ein (0) = 0, если n = 0 л Et = 0, Ein = | En (n) = H(En (n -1)), если n > 0 л Et = 0,
Ein (n) = Eout, если n > 0 Л Ei >
Данное изменение позволило сократить время формирования нейронной карты от 1,3 до 3-х раз в зависимости от расположения стартовой и целевой ячеек, что подтверждается также результатами программного моделирования с помощью пакета прикладных программ (ППП) Matlab в рабочем пространстве 20x20 (рис. 2, 3):
- Цель В - Препятствие
Рис. 2. Полная активация (42 итерации)
Рис. 3. Частичная активация (15 итераций)
Третья модификация была сделана для упрощения операции взвешивания при вычислении выходных сигналов. В общем случае для НС Хопфилда - это вычисление функции нормированного векторного произведения, выполняемой для каждого нейрона сети:
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
_ рЩ + р2Щ + рЩ + ... + рЩ
иг — ,
Щ + Щ + К +... +
где / - количество нейронов в сети, м? - весовой коэффициент связи, о - входной сигнала связанного нейрона.
Исходя из условия, что каждый нейрон сети взаимодействует лишь с 8-ю соседними нейронами и отношение весовых коэффициентов в пределах каждого «домена» одинаково (рис. 1), функция взвешивания для нейрона, находящегося в п-ом столбце и т-ой строке может быть упрощена:
1
и —-X
п,т
Щ + Щ + Щ + Щ + Щ + Щ + Щ + Щ
Х(Рп-1,тЛ + Рп-1,тЩ, + Рп-1,т+1Щ + Рп,т-1Щ, +
+Рп,т+1Щ, + Рп+1,т-1^ + Рп+1,тЩ, + Рп+1,т+1^ ) .
Данное упрощение позволило использовать для вычисления сигналов нейронов только множество из 8-ми значений и не загружать в оперативную память общую матрицу весовых коэффициентов, размерность которой равна I 2
Методика планирования траекторий для группы МР
Рассмотрим далее структуру системы планирования, использующую для построения траекторий метод нейронных карт (рис. 4). Данная система была представлена в статье [17] и успешно испытана на одном МР в условиях статичной конфигурации препятствий в рабочем пространстве.
Информация о конфигурации пространства
Сенсорная-система _ МР
—►
Цель (нейрон № 56)
1
Нейронная
сеть Хопфилда
Текущая позиция"""^ МР (нейрон №1)
------»
-►
Конструктор пути (КП)
Траектория
Нейронная карта
{матрица значений нейронов)
Исполни тельный уровень МР
нейронов)
Рис. 4. Система планирования траекторий на базе НС Хопфилда
для одиночного МР
Как видно на рисунке, система планирования состоит из 2-х основных блоков:
1) НС Хопфилда - формирует нейронную карту;
2) конструктор пути (КП) - выполняет расчет траектории, определяя максимальное значение градиента по возможным направлениям на каждом шаге.
В ходе выполнения исследовательской работы данная система планирования была адаптирована для расчета траекторий группы МР. Исходя из суще-
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
ствующих подходов к построению систем управления группами роботов [ 14], было предложено 3 варианта реализации:
1) централизованный - вычислительные операции блоков НС Хопфилда и КП осуществляются в параллельных потоках (или системных процессах) на общей вычислительной машине (ВМ). Обмен информацией (опорными точками рассчитанных траекторий) для разрешения конфликтных ситуаций (возможных столкновений) между агентами происходит через общую область памяти ВМ;
2) гибридный - каждый агент самостоятельно формирует собственную нейронную карту на основе данных с сенсоров, а разрешение конфликтных ситуаций и расчет траекторий производится на общей ВМ;
3) децентрализованный (или мультиагентный) - каждый агент самостоятельно (на бортовой ВМ) рассчитывает и корректирует траекторию в процессе движения. Разрешение конфликтов осуществляется с помощью выделенного агента-координатора или с помощью взаимного обмена информацией каждого агента с ближайшим окружением (рис. 5).
Информация о рабочем
' N
пространстве
ai -
АГЕНТ 1
ai
I
НС 1 - бортовая НС Хопфилда агента 1
НС 1
КП 1
a4
V
a3
an i i
Рис. 5. Децентрализованный вариант реализации системы планирования
Вне зависимости от выбранного варианта реализации системы планирования функция разрешения конфликтных ситуаций возлагается на блок КП. Идея состоит в том, что КП каждого агента имеет доступ к массиву данных D, который содержит следующую информацию об агентах группы:
Ра 0 Va 0 Ta0 Pal Va1 Ta1
D =
Pa
V1
где ра - значение приоритета агента а; Уа - скорость агента а; Та - множество индексов расчетных позиций траектории агента а. При этом множество Та = {стп} содержит только часть расчетной траектории, начиная от текущей позиции, например, для двух следующих переходов агента: Та = {стп0,стп1,стп2}.
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
На основании этих данных КП проверяет каждый следующий (от текущей позиции стпо) переход агента на неконфликтность (рис. 6).
Смещение значения Смещение значения (успешная проверка на (агент завершил переход) неконфликтность)
Новая расчетная позиция
I
Текущая позиция агента 1 (Cm„o) Следующий шаг агента 1 (Cmnl) Следующий шаг агента 1 (Cmn2)
T a2 Cmn0 Cmn1 Cmn2
T an Cmn0 Cmn1 Cmn2
КП агента 1
Проверка неконфликт. вероятного перехода с —>0
тп\ тп2
Агент 2
Ра2' Va2
Агент a
Р ' V
* an ' an
Рис. 6. Обработка конфликтных ситуаций в КП агента 1
В зависимости от выбранного варианта реализации системы планирования массив индексов траекторий агентов может иметь разный размер.
Если система реализуется по централизованному принципу, то программные сущности КП и НС Хопфилда для каждого агента будут инкапсулированы в отдельных вычислительных потоках или процессах. В таком случае в оперативную память центральной ВМ загружается массив данных (О) по всем агентам в группе, и эти данные будут доступны всем вычислительным потокам для планирования безаварийных маршрутов.
Если система реализуется по децентрализованному принципу, то в бортовую оперативную память агента могут загружаться только данные о ближайших агентах группы для снижения вычислительной нагрузки на бортовую ВМ и оперативного разрешения конфликтных ситуаций.
Ввиду ортогональной дискретизации рабочего пространства возможно возникновение следующих типовых конфликтных ситуаций между двумя агентами (рис. 7).
Пересечение траекторий
Встречное движение
Совпадение позиций
✓ I
Пересечение устойчивой позиции
/ ✓ ✓
Рис. 7. Виды конфликтных ситуаций
При возникновении первых трех ситуаций необходима корректировка траектории, при этом корректировать траекторию будет только МР, чей приоритет р имеет меньшее значение.
В последнем случае под устойчивой позицией агента понимается состояние робота, когда он находится на своей начальной позиции и еще не начинал движение, или, когда робот уже достиг конечной точки траектории. Если рас-
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
четная траектория движения одного из агентов проходит через устойчивую позицию другого робота, то необходима корректировка траектории вне зависимости от приоритета.
Для программной реализации предлагаемой методики планирования траекторий было разработано специализированное ПО на языке программирования Python 3 с дополнительным модулем multiprocessing, что позволило организовать вычислительные процессы планирования каждого агента в отдельных потоках.
При моделировании были приняты следующие условия: размерность рабочего пространства - 20*20; максимальное количество элементов множества Ta не превышало 3; скорость V- виртуальная величина, при V = 1 агент делает 1 переход между ячейками в прямом направлении за 1 с. Результаты моделирования проставлены на рис. 8, 9 и в таблице 2.
Рис. 8. Задача 1 - пересечение траекторий
Рис. 9. Задача 2 - встречное движение двух групп
Таблица 2 - Результаты моделирования
№ задачи Агент Скорость (V) Приоритет Конфликтный переход
1 1 2 1 270—251
2 1 3 45—46
3 2 2
2 1 0,2 5
2 0,5 2
3 0,8 1,25
4 1 1 156—^157
5 1 1 191^192
6 1 1 230—231
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
Стоит отметить, что приоритеты для агентов при решении задачи 1 были выставлены произвольно, а в задаче 2 - обратно пропорционально скоростям агентов. Таким образом, используя различные функции распределения приоритетов (или даже алгоритмы), можно определять правила взаимодействия агентов для различных задач. Алгоритм разрешения конфликтных ситуаций на основе приоритетов, а также их программное моделирование в рамках централизованного и гибридного способов реализации более подробно рассмотрены в работах [5, 20, 21].
Планирование траекторий в недетерминированном рабочем пространстве
Как видно из рис. 5 при децентрализованном способе реализации каждый агент оснащается полноценной системой планирования (с сетью Хопфилда и КП). Такая бортовая система должна выполнять расчет траекторий при недостаточности информации о рабочем пространстве. Также стоит учитывать, что бортовая система планирования МР может получать некорректную (или вообще не получать) информацию о других агентах, необходимую для разрешения конфликтных ситуаций с учетом скоростей и приоритетов. Подобные ситуации возможны при работе группы в условиях радиопомех или отказа бортовых средств связи. В таком случае появление других агентов на заданной траектории движения будет восприниматься МР как динамическое препятствие, следовательно, необходимо оперативное реагирование бортовой системы планирования, чтобы избежать столкновения. Для решения данной задачи были разработаны алгоритмы коррекции нейронной карты во время движения МР [19]:
1) формирование новой нейронной карты;
2) частичная коррекция нейронной карты.
Первый способ коррекции рекомендуется использовать при высоком вычислительном быстродействии МР и при высокоэффективной работе сенсорной системы, которая способна идентифицировать препятствия на расстоянии как минимум втрое превышающем размер дискреты (габаритный размер МР) (рис. 10).
Рис. 10. Работа системы планирования в режиме формирования новой нейронной карты
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
При использовании данного способа коррекции алгоритм работы системы будет следующим:
1. Формируется нейронная карта (Eout) с учетом известной на текущий момент конфигурации рабочего пространства.
2. Рассчитывается траектория и начинается движение МР к цели.
3. Если целевая позиция достигнута - вход.
4. Если обнаружено новое препятствие (FO = true), индексы соответствующих этим позициям нейронов записываются в список в отдельный массив O{}.
5. Если текущая траектория пересекает препятствие, то происходит формирование новой нейронной карты (Eout) с обнулением сигналов нейронов по индексам из массива O{}.
6. Переход в п. 2.
Данный способ корректировки траектории позволяет получить «плавный» обход препятствия по траектории, близкой к кратчайшей, что подтверждается результатами моделирования в ППП Matlab (рис. 11, 12).
20
18
16
14
12
10
-1-1-+-444 -1-1- L 4 4 4 -1- L U 4- 4 4 —I-LL444 1 LL-LJ.-J -4-1-+- +44- Iluti"^ —LLL4 44— 1 l_ J__1__L _l -1-4-4- 4 4 H--I-J-4-44-I--LL4-44-I-— Li-X 4 4—1— LLIJJ 1
_I_LL±J J 1 1 1 1 1 1 1 1 1 1 1 1 1 LL1JJ LLilJ 1
1 1 1 1 1 1 1 1 1 T 1 1 1 1 1 1 1 1 1 I 1 1 1 1
1 ГГТТП ~ГГГТ"Г~1 ГГТТ1 -rrrt-f-1 -i-1- t- + ï -i 1- +- 4 4 H -1- и- +- 4 4 4 —1— L L 4 4 4 —1— LLX-1J _LLL1JJ 1 LL1JJ 1 ГГТ11 "ГГГТ11" pwwm* -hl-ft-ti-—1— I— +- 4 4 4 — -1—1-4-4 4 4 — —LLL4 44— —LLL44—1— _L_ LLi J J_ 1 LL1JJ LLLLLllJJJJ ....... M 1 1
-LLL1JJ 1 1 1 ! 1 1 _LLL±_1J_ 1 1 1 |o6tirt -LLI J J_l_ 1 I l 1 1 l
10
15
20
Рис. 11. Конфигурация рабочего пространства
10 15 20
Рис. 12. Обход препятствия
Как видно из рис. 11, 12 моделирование проводилось в рабочем пространстве 20x20, т.е. использовалась НС Хопфилда из 400 нейронов. Для выполнения маневра обхода препятствия сети понадобилось около 15 этапов активации (п = 15) для формирования новой карты, при этом значение п будет расти при увеличении размеров карты.
Второй способ коррекции актуален при невысоком вычислительном быстродействии МР, а также при низкой чувствительности бортовых сенсоров (помехи, малый радиус действия) (рис. 13).
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
В режиме частичной коррекции нейронной карты система работает по следующему алгоритму:
1. Формируется начальная карта (Еои1) при известной на данный момент конфигурации рабочего пространства.
Цель
♦
НС Хопфилда
Измененная матрица
о
■ true
35
out
и
Память для хранения матрицы НС
Сохранение инф-ии о новых препятствиях из списка 0{}
Ï
Текущая позиция + скорость MP
Инструкции движения по траектории
Конструктор пути (КП)
Траектория до цели
Прерыв-е
Исполнитель ный ур-нь MP
V
иденти
I Прерывание КП I (F0 = true)
-t-
Блок идентификации препятствий на траектории F0 = true / false
S
Сенсорная система
{УЗ, ИР, ЛИДАР)
Рис. 13. Работа системы планирования в режиме частичной коррекции нейронной карты
2. Карта сохраняется в памяти (Em = Eout).
3. Рассчитывается траектория по Em и начинается движение МР к цели.
4. Если целевая позиция достигнута - вход.
5. Если обнаружено новое препятствие на траектории (Fo = true), в Em обнуляются значения сигналов соответствующих нейронов по индексам из массива O{}.
6. Коррекция нейронной карты с помощью подачи измененной матрицы состояний (Em) на вход нейронной сети (Eout = H(Em)) n количество раз.
7. Переход в п. 2.
Количество итераций n зависит только от того, какую «плавность» обхода препятствия необходимо получить и не зависит от размерности карты. Для проверки данного алгоритма было проведено программное моделирование ППП Matlab при конфигурации рабочей зоны, аналогичной рис. 11 (рис. 14, 15).
Исходя из полученных результатов, можно сделать вывод, что корректировка траектории вторым способом значительно быстрее, но уменьшает плавность обхода препятствия. Также недостатком данной методики является качество построенной траектории при обходе препятствий сложной формы в связи с повышением рисков возникновения локальных максимумов.
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
5 10
Рис. 14. Корректировка траектории при n = 1
Рис. 15. Корректировка траектории при n = 5
Экспериментальная проверка результатов
Для проверки алгоритмов коллективного взаимодействия между агентами в гетерогенной группе роботов в рамках исследовательской работы по гранту РФФИ № 16-29-04165 офи-м [22-25] было создано несколько мобильных платформ с интегрированной системой планирования траекторий на базе НС Хоп-филда.
В качестве средства реализации аппаратной поддержки МР на стратегическом уровне используется платформа Raspberry Pi 3. Для аппаратной поддержки агента на тактическом (исполнительном) уровне используется платформа STM32F407. Взаимодействие между исполнительным и стратегическим уровнями управления осуществляется с помощью системы прерываний и порта UART (рис. 16).
Рис. 16. Взаимодействие исполнительного и стратегического уровней мобильной платформы
Платформа STM32F407 отвечает за управление исполнительными устройствами: двигатели, система питания, инфракрасные и ультразвуковые сенсоры.
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
Поддержка информационного взаимодействия агента с другими агентами и оператором реализуется на базе платформы Raspberry по беспроводному каналу связи Wi-Fi. На прикладном уровне информационное взаимодействие осуществляется с помощью разработанного для данной платформы на языке Python 3 специализированного ПО с использованием WEB-сервера (Flask). Данный сервер позволяет обслуживать многократные HTTP-запросы от других агентов в асинхронном режиме. Обмен данными осуществляется в рамках REST-модели взаимодействия, т.е. с использованием особых (для группы МР) форматов HTTP-адресов (рис. 17).
—Обмен данными по протоколу HTTP в формате JSON по беспроводному каналу связи (Wi-Fi)
Рис. 17. Информационное взаимодействие между агентами в группе
Для передачи данных используются стандартные операции протокола HTTP: GET - для получения статусной информации от агента и POST - для передачи команд управления или загрузки информации.
Как показано на рис. 17, данные передаются в структурированном виде в формате JSON, при этом структура пакета имеет следующий вид:
{ "id": integer, "creator_MAC": string, "sender_MAC": string, "type": string, "data": string, "err": integer }, где:
id - идентификатор агента;
creator_MAC - МАС-адрес агента, которым данное сообщение создано;
sender_MAC - МАС-адрес агента, которым данное сообщение передано (ретранслировано);
type - тип пакета данных: запрос, ответ, задача или команда (RESPONSE/REQUEST/TASK/CMD);
data - данные (информация или команда);
status - код ошибки (значения < 0 описывают различные типы ошибок, 0 >= определяют приоритет команды или задачи).
DOI: 10.24411/2410-9916-2019-10406
Systems of Control, Communication and Security
ISSN 2410-9916
Также из рисунка видно, что обмен данными между группой и оператором осуществляется с помощью выделенного агента-координатора (мультиа-гентная схема управления). В качестве координатора может быть использован любой МР в группе. Когда агенту назначается роль координатора, Wi-Fi модуль Raspberry Pi данного агента переключается в режим точки доступа с особым именем SSID беспроводной сети, а остальные агенты, в свою очередь, автоматически переключаются в режим клиентов данной беспроводной сети и перестраивают сетевые маршруты, образуя таким образом собственную локальную сеть. Оператор может управлять группой, подключившись к беспроводной сети, созданной координатором.
Для автоматизации ввода начальных данных (расположение и ориентация МР в рабочем пространстве) на языке Python 3 с использованием библиотеки OpenCV был разработан специальный программный модуль для видеоидентификации агентов по светодиодной подсветке. Данный модуль был установлен на отдельную платформу Raspberry Pi, выполняющую роль координатора (рис. 18).
Оператор
Потоковое видео в формате MJPG
-
17 ^nqle: 35 location: base: 69
26 27
Агент 1
ZX
I-1
Агент 2
RPc - Raspberry Pi-координатор с СТЗ
-Беспроводная связь между оператором и координатором
- Возможный канал связи между агентами
- Оптический канал обратной связи (светодиодная подсветка)
- Связь Wi-Fi
I-1
Агент 3 —а-
О
Рис. 18. Структурная схема испытательного стенда
Как видно из рис. 18 для идентификации агента используются три опорные точки (светодиода), по которым можно построить треугольник с определенным отношением сторон.
На данном испытательном стенде была успешно проверена методика планирования траекторий для группы МР с использованием НС Хопфилда.
Выводы
Рассмотренная методика позволяет планировать неконфликтные траектории движения для группы МР при недостаточности информации о конфигурации препятствий в рабочем пространстве.
Элементами новизны являются:
1) модель НС Хопфилда, которая использует новую передаточную функцию (функцию активации) нейронов и новое условие сходимости;
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
2) универсальная программная архитектура и методика разработки системы планирования траекторий для группы МР, базирующаяся на правилах неконфликтного взаимодействия агентов с учетом различных методов группового управления;
3) архитектура и алгоритмическое обеспечение системы планирования, учитывающие особенности перемещения агента группы МР в условиях динамически меняющегося рабочего пространства и информационной недостаточности.
Работа основана на исследованиях Glasius R., Komoda A., Giel-en S. C. A. M. [7]. По результатам данных исследований была предложена система позиционирования [17], но ее разработка и испытания проводились только с учетом специфики перемещения одиночного МР в статичной конфигурации рабочего пространства.
На основе разработанного испытательного стенда планируется отработка различных алгоритмов распределения задач с учетом возможных траекторий движения участников группы до установленных целей. Также используемый алгоритм планирования будет тестироваться в совместной работе с классическими алгоритмами обхода препятствий (например, трассировка), для прохождения ячеек рабочего пространства частично занятых препятствиями по кратчайшей траектории.
В дальнейшем в алгоритм планирования будет внесен ряд модификаций, с помощью которых будет возможен расчет траектории с учетом разной проходимости участков дискретного рабочего пространства, т.е. с учетом рельефа местности. Дополнительно планируется доработка представленной методики планирования для возможности применения в трехмерном рабочем пространстве.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-29-04165-офи_м.
Литература
1. Ющенко А. С., Михайлов Б. Б., Назарова А. В. Автономные мобильные роботы - навигация и управление // Известия Южного федерального университета. 2016. № 2 (175). С. 48-65.
2. Васильев С. Н., Браништов С. А., Бузиков М. Э., Морозов Н. Ю. Групповое управление автономными мобильными аппаратами // Материалы 10-й Всероссийской мультиконференции по проблемам управления (МКПУ-2017). - Дивноморское, 2017. - С. 251-252.
3. Гайдук А. Р., Капустян С. Г., Шаповалов И. О. Алгоритм управления движением группы мобильных роботов в условиях неопределенности // Инженерный вестник Дона. 2018. № 3 (50). С. 1-13. - URL: http://ivdon.ru/uploads/article/pdf/IVD_166_Gajduk_N2.pdf_f14371d14a.pdf (дата обращения: 10.11.2019).
4. Градецкий В. Г., Ермолов И. Л., Князьков М. М., Семёнов Е. А., Собольников С. А., Суханов А. Н. Вопросы взаимодействия роботов в группе при выполнении единой транспортной задачи // Материалы 10-й Всероссийской
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
мультиконференции по проблемам управления (МКПУ-2017). - Дивноморское, 2017. - С. 265-267.
5. Юдинцев Б. С., Даринцев О. В. Интеллектуальная система планирования траекторий мобильных роботов, построенная на сети Хопфилда // Современные проблемы науки и образования. 2014. № 4. С. 1-11. -URL: https://elibrary.ru/item.asp?id=22285526 (дата обращения: 29.10.2019).
6. Ter-Feng Wu1, Pu-Sheng Tsai, Nien-Tsu Hu, Jen-Yang Chen Combining turning point detection and Dijkstra's algorithm to search the shortest path // Advances in Mechanical Engineering. 2017. Т. 9 (2). С. 1-12. doi: 10.1177/1687814016683353.
7. Glasius R., Komoda A., Gielen S. C. A. M. Neural network dynamics for path planning and obstacle avoidance // Neural Networks. 1995. С. 125-133. doi: 10.1016/0893-6080(94)E0045-M.
8. Даринцев О. В. Планирование траекторий движения микроробота на базе нечетких правил // Искусственный интеллект. Интеллектуальные системы. 2011. С. 228-232.
9. Ramakrishna R. S., Chang Wook Ahn A Genetic Algorithm for Shortest Path Routing Problem and the Sizing of Populations // Evolutionary Computation. 2002. Т. 6. С. 566-579. doi: 10.1109/TEVC.2002.804323
10. Kim J., Banks C. J., Shah J. A. Collaborative Planning with Encoding of Users' High-level Strategies // Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence. - San Francisco, 2017. - С. 955-961.
11. Sergiyenko O. Yu., Ivanov M. V., Tyrsa V. V., Kartashov V. M., RivasLopez M., Hernandez-Balbuena D., Flores-Fuentes W., Rodríguez-Quiñonez J. C., Nieto-Hipolito J. I., Hernandez W., Tchernykh A. Data transferring model determination in robotic group // Robotics and Autonomous Systems. 2016. Т. 83. С. 251-260. doi: 10.1016/j.robot.2016.04.003
12. Three Ways Amazon, Alibaba, and Ocado Benefit from Warehouse Robots // Innovecs [Электронный ресурс]. 10.11.2019. - URL: https://www.innovecs.com/ideas-portfolio/amazon-alibaba-ocado-use-warehouse-robots/ (дата обращения: 10/11/2019).
13. New Robotic Solutions for the Warehouse // Forbes [Электронный ресурс]. 10.11.2019. - URL: https://www.forbes.com/sites/stevebanker/2017/03/07/new-robotic-solutions-for-the-warehouse/#d5562816506e (дата обращения: 10/11/2019).
14. Гайдук А. Р., Капустян С. Г., Каляев И. А. Модели и алгоритмы коллективного управления в группах роботов. - М.: ФИЗМАТЛИТ, 2009. -280 с.
15. Matoui F., Boussaid B., Metoui B., Frej G. B., Abdelkrim M. N. Path planning of a group of robots with potential field approach: decentralized architecture // IFAC-PapersOnLine. 2017. Т. 50. С. 11473-11478. doi: 10.1016/j.ifacol.2017.08.1822.
16. Johan Hagelback, Stefan J. Johansson Using multi-agent potential fields in real-time strategy games // Proceedings of the 7th international joint conference on Autonomous agents and multiagent systems. - Estoril, 2008. - С. 631-638.
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
17. Michail G. Lagoudakis Mobile Robot Local Navigation with a Polar Neural Map. - The Center for Advanced Computer Studies University of Southwestern Louisiana, 1998. - 135 с.
18. Рычагов М. Н. Нейронные сети: многослойный перцептрон и сети Хопфилда // EXPonenta Pro. Математика в приложениях. 2003. № 1. С. 29-37.
19. Юдинцев Б. С., Даринцев О. В. Модификация нейросетевой системы планирования траектории: методики и результаты // Фундаментальные исследования. 2014. № 11-12. С. 2630-2635. - URL: https://elibrary.ru/item.asp?id=23286817 (дата обращения: 29.10.2019).
20. Юдинцев Б. С. Интеллектуальная система построения неконфликтных траекторий для коллектива мобильных роботов // Управление большими системами. 2013. Т. 3. С. 326-329.
21. Юдинцев Б. С., Даринцев О. В. Экспериментальные исследования эффективности нейросетевой системы планирования траекторий для коллектива мини (микро) роботов // Proceedings of the 2nd International Conference "Information Technologies for Intelligent Decision Making Support" and the Intended International Workshop "Robots and Robotic Systems". - Ufa, 2014. -С. 274-278.
22. Юдинцев Б. С., Алексеев А. Ю., Даринцев О. В. Архитектура системы управления коллективом роботов на базе облачных технологий // Материалы 10-й Всероссийской мультиконференции по проблемам управления (МКПУ-2017). - Дивноморское, 2017. - С. 169-171.
23. Алексеев А. Ю., Юдинцев Б. С. Синтез распределенной системы управления группой мобильных роботов // Труды Института механики им. Р.Р. Мавлютова Уфимского научного центра РАН. 2017. С. 199-205.
24. Мигранов А. Б., Богданов Д. Р., Юдинцев Б. С. Даринцев О. В. Аппаратно-программное обеспечение распределенной системы управления мобильными робототехническими платформами коллективного использования // Материалы международной научно-практической конференции «Прогресс транспортных средств и систем - 2018». - Волгоград, 2018. - С. 18-19.
25. Yudintsev B. S., Alekseev A. Yu., Bogdanov D. R., Migranov A. B., Darintsev O. V. Methods of a Heterogeneous Multi-agent Robotic System Group Control // Proceedings of the 13th International Symposium "Intelligent Systems 2018" (INTELS'18). - St. Petersburg, 2019. - С. 687-694. doi: 10.1016/j.procs.2019.02.032.
References
1. Yushchenko A. S., Mihajlov B. B., Nazarova A. V. Avtonomnye mobilnye roboty navigatsiya i upravlenie [Autonomous mobile robots - navigation and control]. Izvestiya SFedU. Engineering Sciences, 2016, no. 2, pp. 48-65 (in Russian).
2. Vasil'ev S. N., Branishtov S. A., Buzikov M. E., Morozov N. Yu. Gruppovoe upravlenie avtonomnymi mobilnymi apparatami [Control of autonomous mobile robot groups]. Materialy 10 Vserossijskoj mul'tikonferencii po problemam
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
upravleniya (MKPU-2017) [Proceedings of the 10th All-Russian Multiconference on Control Problems (MMP-2017)]. Divnomorskoe, 2017, pp. 251-252 (in Russian).
3. Gajduk A. R., Kapustyan S. G., Shapovalov I. O. Motion control algorithm for a group of mobile robots under conditions of uncertainty. Engineering journal of Don, 2018, vol. 3, pp. 1-13. Available at: http://ivdon.ru/uploads/article/pdf/IVD_166_Gajduk_N2.pdf_f14371d14a.pdf (accessed 10 November 2019) (in Russian).
4. Gradeckij V. G., Ermolov I. L., Knyaz'kov M. M., Semyonov E. A., Sobol'nikov S. A., Suhanov A. N. Voprosy vzaimodejstviya robotov v gruppe pri vypolnenii edinoj transportnoj zadachi [Issues of interaction of robots in a group when performing a transport task]. Materialy 10 Vserossijskoj mul'tikonferencii po problemam upravleniya (MKPU-2017) [Proceedings of the 10th All-Russian Multiconference on Control Problems (MMP-2017)]. Divnomorskoe, 2017, pp. 265267 (in Russian).
5. Yudintsev B. S., Darincev O. V. Intelligent system of trajectory planning for mobile robots based on Hopfield network. Modern problems of science and education, 2014, vol. 4, pp. 1-11. Available at: https://elibrary.ru/item.asp?id=22285526 (accessed 29 October 2019) (in Russian).
6. Ter-Feng Wu1, Pu-Sheng Tsai, Nien-Tsu Hu, Jen-Yang Chen Combining turning point detection and Dijkstra's algorithm to search the shortest path. Advances in Mechanical Engineering, 2017, vol. 9, no. 2, pp. 1-12. doi: 10.1177/1687814016683353.
7. Glasius R., Komoda A., Gielen S. C. A. M. Neural network dynamics for path planning and obstacle avoidance. Neural Networks, 1995, pp. 125-133. doi: 10.1016/0893-6080(94)E0045-M.
8. Darintsev O. V. Planirovanie traektorij dvizheniya mikrorobota na baze nechetkih pravil [Trajectory planning for microrobot based on fuzzy rules]. Artificial intelligence, 2011, pp. 228-232 (in Russian).
9. Ramakrishna R. S., Chang Wook Ahn A Genetic Algorithm for Shortest Path Routing Problem and the Sizing of Populations. Evolutionary Computation, 2002, vol. 6, pp. 566-579. doi: 10.1109/TEVC.2002.804323.
10. Kim J., Banks C. J., Shah J. A. Collaborative Planning with Encoding of Users' High-level Strategies. Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence. San Francisco, 2017, pp. 955-961.
11. Sergiyenko O. Yu., Ivanov M. V., Tyrsa V. V., Kartashov V. M., RivasLopez M., Hernandez-Balbuena D., Flores-Fuentes W., Rodríguez-Quiñonez J. C., Nieto-Hipolito J. I., Hernandez W., Tchernykh A. Data transferring model determination in robotic group. Robotics and Autonomous Systems, 2016, vol. 83, pp. 251-260. doi: 10.1016/j.robot.2016.04.003.
12. Three Ways Amazon, Alibaba, and Ocado Benefit from Warehouse Robots. innovecs, 10 November 2019. Available at: https://www.innovecs.com/ideas-portfolio/amazon-alibaba-ocado-use-warehouse-robots (accessed 10 November 2019).
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
13. New Robotic Solutions for the Warehouse. Forbes. 10 November 2019, Available at: https://www.forbes.com/sites/stevebanker/2017/03/07/new-robotic-solutions-for-the-warehouse/#d5562816506e (accessed 10 November 2019).
14. Gajduk A. R., Kapustyan S. G., Kalyaev I. A. Modeli i algoritmy kollektivnogo upravleniya v gruppah robotov [Models and algorithms of collective control in groups of robots]. Moscow, 2019. 280 p. (in Russian).
15. Matoui F., Boussaid B., Metoui B., Frej G. B., Abdelkrim M. N. Path planning of a group of robots with potential field approach: decentralized architecture. IFAC-PapersOnLine, 2017, vol. 50, pp. 11473-11478. doi: 10.1016/j.ifacol.2017.08.1822.
16. Johan Hagelback, Stefan J. Johansson Using multi-agent potential fields in real-time strategy games. Proceedings of the 7th international joint conference on Autonomous agents and multiagent systems. Estoril, 2008, pp. 631-638.
17. Michail G. Lagoudakis Mobile Robot Local Navigation with a Polar Neural Map. The Center for Advanced Computer Studies University of Southwestern Louisiana. 1998. 135 p.
18. Rychagov M. N. Nejronnye seti mnogoslojnyj pertseptron i seti Hopfilda [Neural Networks: Multilayer Perceptron and Hopfield Networks]. EXPonenta Pro. Matematika v prilozheniyah, 2003, no. 1, pp. 29-37. (in Russian).
19. Yudintsev B. S., Darintsev O. V. Modifikatsiya nejrosetevoj sistemy planirovaniya traektorii: metodiki i rezultaty [Modification of neural network trajectory planning system: methods and results]. Fundamental Research, 2014, vol. 11-12. Available at: https://elibrary.ru/item.asp?id=23286817 (accessed 29 October 2019) (in Russian).
20. Yudintsev B. S. Intellektualnaya sistema postroeniya nekonfliktnyh traektorij dlya kollektiva mobilnyh robotov [Intelligent system for building non-conflict trajectories for a group of mobile robots]. Large-scale Systems Control, 2013, vol. 3, pp. 326-329 (in Russian).
21. Yudintsev B. S., Darintsev O. V. Eksperimentalnye issledovaniya effektivnosti nejrosetevoj sistemy planirovaniya traektorij dlya kollektiva mini mikro robotov [Experimental research of effectiveness of neural network system for planning trajectories for a group of mini (micro) robots]. Proceedings of the 2nd International Conference "Information Technologies for Intelligent Decision Making Support" and the Intended International Workshop "Robots and Robotic Systems" Ufa, 2014, pp. 274-278 (in Russian).
22. Yudintsev B. S., Alekseev A. Yu., Darintsev O. V. Arhitektura sistemy upravleniya kollektivom robotov na baze oblachnyh tekhnologij [Architecture of cloud-based control system for a group of robots]. Materialy 10 Vserossijskoj mul'tikonferencii po problemam upravleniya (MKPU-2017) [Proceedings of the 10th All-Russian Multiconference on Control Problems (MMP-2017)]. Divnomorskoe, 2017, pp. 169-171 (in Russian).
23. Yudintsev B. S., Alekseev A. Yu. Sintez raspredelennoj sistemy upravleniya gruppoj mobilnyh robotov [Synthesis of distributed control system for a group of mobile robots]. Trudy Instituta mekhaniki im. R.R. Mavlyutova Ufimskogo nauchnogo centra RAN, 2017, pp. 199-205 (in Russian).
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
24. Migranov A. B., Bogdanov D. R., Yudintsev B. S. Darintsev O. V. Apparatno-programmnoe obespechenie raspredelennoj sistemy upravleniya mobilnymi robototekhnicheskimi platformami kollektivnogo ispolzovaniya [Hardware and software of distributed group control system for mobile robotic platforms]. Materialy mezhdunarodnoj nauchno-prakticheskoj konferencii "Progress transportnyh sredstv i sistem - 2018 " [Proceedings of the International Scientific and Practical Conference "Progress of vehicles and systems-2018"], Volgograd, 2018, pp. 18-19 (in Russian).
25. Yudintsev B. S., Alekseev A. Yu., Bogdanov D. R., Migranov A. B., Darintsev O. V. Methods of a Heterogeneous Multi-agent Robotic System Group Control. Proceedings of the 13th International Symposium "Intelligent Systems 2018" (INTELS'18). St. Petersburg, 2019, pp. 687-694. doi: 10.1016/j.procs.2019.02.032.
Статья поступила 1 ноября 2019 г.
Информация об авторе
Юдинцев Богдан Сергеевич - соискатель ученой степени кандидата технических наук. Инженер лаборатории «Робототехника и управление в технических системах». Институт механики им. Р.Р. Мавлютова Уфимского федерального исследовательского центра Российской академии наук (ИМех УФИЦ РАН). Область научных интересов: робототехника; интеллектуальные алгоритмы; передача и обработка информации. E-mail: [email protected]
Адрес: 450054, Россия, г. Уфа, пр. Октября, д. 71.
A path planning system synthesis for a group of mobile robots
based on neural network
B. S. Yudintsev
Purpose. When a group of mobile robots is functioning in an insufficiently known environment, several control problems arise. One of these problems is the planning of safe trajectories, which allow to build smooth trouble-free travel routes in the presence of dynamic and newly detected (by on-board sensors of near location) obstacles. An analysis of various planning algorithms showed that the existing approaches do not take into account the specifics of the on-board systems of mobile robots (computational capabilities, reaction speed to external disturbances), which imposes a number of limitations on the application of these methods if a group of mobile robots works in a single working area and if there is a risk of collisions with other agent groups. The purpose of the paper is to modify the trajectories computing method which based on the Hopfield neural network and to synthesize a planning system taking into account the specifics of a group of robots controlling. Methods. The solution ofplanning safe motion trajectories problem is based on the use of the trajectory planning technique by means of the Hopfield neural network. The special network configuration allows to form the output matrix of the neurons states (neural map). It is possible to adjust the robot moving trajectory, taking into account the specified rules of the agents interaction in the group, using the values of the matrix. The rules of the agent interactions are determined by the architecture of the planning system, which (depending on the chosen group management method) can be centralized, decentralized or hybrid. The novelty of the presented solution is the modified mathematical model of the Hopfield neural network, which uses a new transfer function (activation function) of neurons and a new condition for convergence. Also, the elements of novelty are: trajectory correction algorithms, information exchange algo-
DOI: 10.24411/2410-9916-2019-10406
Системы управления,связи и безопасности №4. 2019
Systems of Control, Communication and Security ISSN 2410-9916
rithms between agents in a group. Results. Modifications of the Hopfield neural network mathematical model allow to reduce the neural map formation time by 1.5-2.5 times (depending on the dimension and configuration of the workspace). The use of the presented trajectory correction algorithms allows planning system to maintain high efficiency when it works in conditions of information deficiency and when the dynamic obstacles are presented in the work area. The reliability of the results is confirmed in the software modeling course, as well as during the experimental verification at the specialized experimental stand. Practical relevance. The presented algorithms are implemented in the form of specialized software, based on the Python 3 language. The software can be used during the synthesis and debugging processes of the onboard trajectory planning systems operation algorithms for the mobile robot team agents. The developed experimental stand hardware-software application program has the practical importance too. The program makes it possible to automate ongoing full-scale / semi-natural experiments with various planning systems types. Also the program can be used for promising group control models experimentally study and task distribution algorithms research in heterogeneous robots group.
Keywords: path planning, Hopfield neural network, multi-robot systems, mobile robots.
Information about Author
Bogdan Sergeevich Yudintsev - Doctoral Student. Research Officer of Research Laboratory of the Robotics and Control in Technical Systems. Mavlyutov Institute of Mechanics of Ufa Branch RAS. Field of research: robotics, intelligent algorithms; data acquisition. E-mail: [email protected]
Address: Russia, 450054, Ufa, prospect Oktyabrya, 71.
DOI: 10.24411/2410-9916-2019-10406