Научная статья на тему 'Гибридный алгоритм ситуационного планирования траектории на плоскости в условиях частичной неопределенности'

Гибридный алгоритм ситуационного планирования траектории на плоскости в условиях частичной неопределенности Текст научной статьи по специальности «Математика»

CC BY
221
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЛАНИРОВАНИЕ ТРАЕКТОРИИ / ЧАСТИЧНАЯ НЕОПРЕДЕЛЕННОСТЬ / ДВУМЕРНОЕ ПРОСТРАНСТВО / ВОЛНОВОЙ АЛГОРИТМ / МУРАВЬИНЫЙ АЛГОРИТМ / ГИБРИДИЗАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Лебедев Б.К., Лебедев О.Б., Лебедева Е.М.

Описан гибридный алгоритм ситуационного планирования траектории в условиях частичной неопределенности для двумерного пространства, основанный на интеграции волнового и муравьиного алгоритмов, позволяющий строить в реальном масштабе времени траектории минимальной длины с одновременной оптимизацией других критериев качества построенного пути. Процесс прокладки траектории осуществлен пошагово. Выявление ограничений на карте местности, препятствующих прокладке траектории из текущей позиции, осуществлено после достижения траекторией этой позиции. Последовательно на каждом шаге относительно текущей позиции подвижного объекта сформирована зона, в пределах которой с помощью радара выполнена локализация всех препятствий, затем построен участок траектории, являющийся продолжением ранее полученного участка. Вся траектория представляет собой совокупность указанных участков, связывающих исходную позицию подвижного объекта с целевой позицией.Временная сложность этого алгоритма зависит от времени жизни колонии l (число итераций), числа вершин графа n и числа муравьев m и определяется как O (ln2m)

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Hybrid Algorithm of Situational Trajectory Planning under Partial Uncertainty

The paper describes a hybrid algorithm of situational trajectory planning under partial uncertainty for the two-dimensional space. The algorithm is based on integration of the wave algorithm and ant colony optimization and makes it possible to build a real-time trajectory of minimal length with simultaneous optimization of a number of other constructed path quality criteria. The trajectory laying process is carried out step by step. The constraints on the area map which make it impossible to lay the trajectory from the current position are identified after the trajectory reaching this position. Successively at each step relatively to the current position of a mobile object (MO), a zone is formed within which, by means of radar, all obstacles are localized, and then a trajectory section is built being a continuation of the previously obtained section. The whole trajectory is a set of sections linking the original position of the mobile object to the target position. The time complexity of the hybrid algorithm depends on the lifetime of colonies l (number of iterations), the number n of the graph vertices and the number of ants m, and is defined as O (ln2m)

Текст научной работы на тему «Гибридный алгоритм ситуационного планирования траектории на плоскости в условиях частичной неопределенности»

УДК 007.52+004.896:656.052.48:519.876.5

DOI: 10.18698/0236-3933-2018-1-76-93

ГИБРИДНЫЙ АЛГОРИТМ СИТУАЦИОННОГО ПЛАНИРОВАНИЯ ТРАЕКТОРИИ НА ПЛОСКОСТИ В УСЛОВИЯХ ЧАСТИЧНОЙ НЕОПРЕДЕЛЕННОСТИ

Б.К. Лебедев lebedev.b.k@gmail.com

О.Б. Лебедев lebedev.ob@mail.ru

Е.М. Лебедева

Инженерно-технологическая академия, Южный федеральный университет, Таганрог, Ростовская обл., Российская Федерация

Аннотация

Ключевые слова

Описан гибридный алгоритм ситуационного планирования траектории в условиях частичной неопределенности для двумерного пространства, основанный на интеграции волнового и муравьиного алгоритмов, позволяющий строить в реальном масштабе времени траектории минимальной длины с одновременной оптимизацией других критериев качества построенного пути. Процесс прокладки траектории осуществлен пошагово. Выявление ограничений на карте местности, препятствующих прокладке траектории из текущей позиции, осуществлено после достижения траекторией этой позиции. Последовательно на каждом шаге относительно текущей позиции подвижного объекта сформирована зона, в пределах которой с помощью радара выполнена локализация всех препятствий, затем построен участок траектории, являющийся продолжением ранее полученного участка. Вся траектория представляет собой совокупность указанных участков, связывающих исходную позицию подвижного объекта с целевой позицией. Временная сложность этого алгоритма зависит от времени жизни колонии l (число итераций), числа вершин графа n и числа муравьев m и определяется как O (ln2m)

Планирование траектории, частичная неопределенность, двумерное пространство, волновой алгоритм, муравьиный алгоритм, гибридизация

Поступила в редакцию 29.06.2017 © МГТУ им. Н.Э. Баумана, 2018

Работа выполнена при финансовой поддержке РФФИ (грант № 17-07-00997)

Введение. Задача проектирования траекторий (трасс) имеет достаточно широкое применение — это и проектирование соединений интегральных схем, автомобильных дорог, коммуникационных сетей, различных траекторий. К настоящему времени разработано достаточно большое число алгоритмов для решения задач построения траекторий в различных постановках с учетом различных ограничений. Траектории формируются (прокладываются) на некоторой карте местности последовательно, часто в условиях неполной определенности, от начальной точки к целевой точке. Существует много классификаций, постановок и методов решения задач проектирования траекторий [1, 2]. Однако в лю-

бом случае можно выделить два класса задач. В задачах первого класса предусматривается использование проекта (траектории) после того, как он будет полностью спроектирован. В задачах второго класса процессы синтеза (прокладки) траектории и передвижения по ней подвижного объекта (ПО) связаны, причем перемещение по траектории происходит одновременно с ее формированием (прокладкой), т. е. проектирование проводят в режиме online. Этот режим связан с неопределенностью ограничений на карте местности, препятствующих прокладке траекторий. Наличие неопределенности обусловлено тем, что применительно к ПО такие препятствия не локализованы, т. е. система управления предварительно не имеет никакой информации ни об их форме, ни о размере, ни тем более о положении. Выявление ограничений, препятствующих прокладке траектории из текущей позиции, осуществляется после достижения траекторией этой позиции. Далее траектория строится с учетом этих ограничений. В связи с этим процесс прокладки траектории осуществляется пошагово следующим образом. Последовательно на каждом шаге относительно текущей позиции ПО формируется локальная зона видимости (ЛЗВ) ПО. В пределах ЛЗВ с помощью радара ПО осуществляется определение координат (локализация) всех препятствий [3]. Затем ПО перемещается в пределах ЛЗВ по кратчайшему пути от текущей позиции к новой позиции, которая объявляется текущей.

Общий подход к решению задачи о кратчайшем пути был развит математиком Р. Беллманом (1920-1984), который предложил для этого вида задач название динамическое программирование [4]. Основные постулаты динамического программирования лежат в основе нескольких алгоритмов: алгоритм Дейкстры (требует O(n2) времени для работы); Флойда (требует O(n3) времени для работы); алгоритм Ли — волновой алгоритм поиска пути [5].

Наибольшее распространение для построения маршрута на плоскости получили волновые алгоритмы. Карту местности при волновой трассировке разбивают на квадраты (ячейки) (рис. 1), размер которых определяют на основе соотношения размеров подвижного объекта, препятствий, местности и требуемой точности. Таким образом, используется рецепторная модель. Ячейки с размещенными в них препятствиями помечаются. Траектории могут проходить только через свободные ячейки перпендикулярно граням ячейки. Трассой между точками Xi, Xj называют совокупность соседних ячеек (т. е. квадратов с общей стороной), соединяющих ячейки Xi, Xj. Классический алгоритм волновой трассировки включает в себя два этапа. На первом этапе путем распространения волны осуществляют анализ возможности прокладки трассы до цели. На втором этапе выбирают маршрут трассы, удовлетворяющий условиям поставленной задачи, путем построения обратного следа.

В процессе распространения волны от источника к цели ячейкам дискретного рабочего поля (ДРП) присваиваются весовые оценки, связанные с принятым критерием оптимальности (рис. 1, а). На втором этапе алгоритма осуществляется построение пути. Для этого следует, начиная от ячейки — цели, двигаться в направлении, противоположном направлению распространения волны, переходя от

□ □ □ □ □ □ □ □ □

□ 3 2 1 0 □

□ 2 1 А 0 □

□ 3 0 0 0 0 □

□ 4 5 6 0 14 15 В □

□ 5 6 7 0 13 0 15 □

□ 6 7 0 0 12 0 14 □

□ 7 8 9 10 11 12 13 □

□ 8 9 10 и 12 13 14 □

□ 9 10 11 12 13 14 15 □

□ □ □ □ □ □ □ □ □

□ □ □ □ □ □ □ □ □

□ 0 □

□ 2 1 А 0 □

□ 3 0 0 0 0 □

□ 4 0 В □

□ 5 0 0 15 □

□ 6 7 0 0 0 14 □

□ 8 9 10 11 12 13 □

□ □

□ □

□ □ □ □ □ □ □ □ □

а б

Рис. 1. Карта местности, разбитая при волновой трассировке на квадраты:

□ — граница поля; ® — занятые ячейки; A — источник распространения волны; B — приемник

ячейки с большим весом к смежной ячейке с меньшим весом до тех пор, пока не будет достигнута ячейка — источник (рис. 1, б). Ячейки ДРП, выбранные в ходе указанного процесса, и определяют искомое оптимальное соединение минимальной длины.

Волновой алгоритм обеспечивает построение пути минимальной длины. Отличительная особенность алгоритма — наличие альтернатив при построении обратного следа минимальной длины. Другими словами, при планировании траектории существует возможность выбора среди множества альтернатив варианта пути со значениями ряда параметров (например, число поворотов), напрямую или косвенно оптимизирующих значения других критериев. В связи с этим актуальна разработка методов, позволяющих осуществлять выбор лучшего варианта минимального пути при построении обратного следа.

В последнее время для решения различных «сложных» задач все чаще используют способы, основанные на применении методов случайного направленного поиска. В основе большинства этих алгоритмов лежат метаэвристики, заимствованные в природе, а также базовые постулаты универсальности и фундаментальности, присущие самоорганизации природных систем [7, 8]. К таким методам относятся метод моделирования отжига, методы генетического поиска (эволюционная адаптация), методы роевого интеллекта, методы альтернативной поисковой адаптации на основе вероятностных обучающихся автоматов [8]. Являясь, по сути, итерационными, алгоритмы на основе моделирования естественных процессов отличаются от обычных итерационных процедур «слепого поиска». Подходы на основе различных эвристических методов к решению указанной задачи, которые пока не показали хороших результатов, описаны в работах [9-14]. Исследование возможностей применения для решения задач планирования траекторий подходов на основе механизмов генетического наследования и эволюционного совершенствования популяций проведено в работе [11]. Однако постановка задачи настоящей работы предусматривает построение маршрута в среде с фиксированными препятствиями либо с их полным отсутствием, что сужает сферу применения исследуемых алгоритмов.

Анализ методов решения сложных прикладных задач показывает, что применение любого одного алгоритма оптимизации (как классического, так и популяционного) далеко не всегда приводит к успеху. В гибридных (комбинированных) алгоритмах, объединяющих различные либо одинаковые алгоритмы, но с различными значениями свободных параметров, преимущества одного алгоритма могут компенсировать недостатки другого. Поэтому одним из основных путей повышения эффективности решения оптимизационных задач в настоящее время является разработка гибридных популяционных алгоритмов [15].

В работе описан гибридный алгоритм планирования траектории в условиях частичной неопределенности для двумерного пространства, основанный на интеграции волнового и муравьиного алгоритмов, позволяющий строить в реальном масштабе времени траектории минимальной длины с одновременной оптимизацией других показателей качества построенного пути.

Постановка задачи и схема базового алгоритма. Карта местности первоначально разбивается на множество ячеек с заданным шагом дискретизации (рис. 2, а) и представляется в виде ДРП. Такую модель называют рецепторной. Рецепторную модель карты можно представить в виде графа (рис. 2, б), вершины которого соответствуют ячейкам. Если две ячейки смежные, то соответствующие этим ячейкам вершины графа связаны ребром. Вершины Рис. 2. Представления (а, б) карты графа представляют все возможные раз- местнос™

мещения ПО в пространстве поиска.

Данные о препятствиях поступают от сенсорной системы ПО. Координаты препятствий совмещают с вершинами графа. Вершины помечаются как препятствия, и происходит удаление ребер вокруг каждой вершины. В пространстве сформированного графа происходит поиск оптимального пути.

Основными показателями качества при планировании траектории [6] являются:

- длина всей траектории PL, пройденной ПО от начальной точки до цели, весовой коэффициент 20 %;

- минимальное расстояние Sm между любым датчиком ПО и любым препятствием вдоль всей траектории, показатель определяет максимальный риск в течение всего движения, весовой коэффициент его значимости равен 20 %;

- время tm, необходимое для завершения движения, весовой коэффициент 20 %.

- число V успешных миссий в недетерминированных средах со сложными препятствиями, весовой коэффициент 40 %.

В общем случае планирование траектории проводится в соответствии с алгоритмом, приведенным ниже.

О 1 > с г—9

о с 3 с з о

а б

Алгоритм планирования траектории

1. t = 0.

2. Поместить ПО в текущую позицию (ТП) p(t).

3. Сгенерировать локальную зону видимости z(t) относительно точки p(t).

4. Зафиксировать неподвижные объекты в пределах ЛЗВ z(t).

5. Объединить все сгенерированные ЛЗВ в одну объединенную ЛЗВ (ОЛЗВ) Oz(t). Принять, что за пределами ОЛЗВ Oz(t) на поле нет препятствий.

6. Построить на поле траекторию между точками p(t) и целью.

7. Если цель входит в ОЛЗВ, то траектория сформирована полностью и осуществляется переход к п. 10, иначе — переход к п. 8.

8. На участке построенной траектории, входящем в ЛЗВ z(t), выбирается текущая позиция p(t +1), в которую перемещается ПО.

Процесс последовательного планирования траектории приведен на рис. 3.

Показатели Pl, Sm и tm, по сути, являются интегральными, и их значения формируются последовательно по мере пошагового построения траектории. Построение математической оптимизационной модели для этих показателей весьма затруднительно, поэтому все алгоритмы позиционно-траекторного управления ПО в условиях неопределенности построены на эвристиках, способствующих минимизации значений этих показателей.

Интегральная оценка качества траектории имеет вид

W = kp + k2Sm + k3tm + ^4 / V. (1)

Планирование траектории в условиях частичной неопределенности на основе интеграции волнового и муравьиного алгоритмов. В общем случае интеграция основана на сращивании механизмов волнового и муравьиного алгоритмов и реализована в два основных этапа. На первом этапе путем распространения на ДРП волны от источника к цели формируется пространство поиска R, представляющее совокупность связных ячеек ДРП, достигнутых волной, с присвоенными им весами. На втором этапе муравьиным алгоритмом на базе сформированного пространства поиска R прокладывается маршрут.

Изначально выполняется формирование рецепторной и графовой моделей карты местности. Формируется множество ячеек E = {e\i = 1, 2,..., ne}, входящих в рецепторную модель. Каждая ячейка имеет координаты (xi, y). Задается ячейка еи, помечаемая как исходная позиция (ИП), в которую помещается ПО, далее —

9. t = t + 1. Переход к п. 2.

10. Конец работы алгоритма.

Рис. 3. Процесс планирования траектории

ячейка вц, которая помечается как целевая позиция (цель). Изначально все ячейки полагаются свободными.

Процесс планирования траектории итерационный и включает в себя пять этапов, выполняемых на каждой итерации t. На каждой итерации строится участок траектории, являющийся продолжением ранее построенного участка. Вся траектория — совокупность участков, связывающих исходную позицию ПО с целевой позицией. Структурная схема гибридного алгоритма приведена на рис. 4.

Рис. 4. Структурная схема гибридного алгоритма

На первом этапе по данным радара, размещенного на итерации t в точке (ячейке) Tn(t) (текущая позиция), формируется ЛЗВ: определяются ее границы на модели карты местности и выявляются содержащиеся в ней препятствия.

Ячейки с препятствиями помечаются. Координаты точки ТП(£) определяются на предыдущей итерации t - 1. Данные радара, полученные на итерации t, объединяются с данными, полученными на предыдущих t - 1 итерациях.

На втором этапе путем распространения на ДРП волны от источника (точка ТП(0) к цели формируется пространство поиска траектории (ППТ) ППТ(£), представляющее совокупность связных ячеек ДРП, достигнутых волной, с присвоенными им весами.

На третьем этапе муравьиным алгоритмом на сформированной области ППТ(0 прокладывается траектория M(t) от цели к точке ТП(0. Отметим, что траектория M(t) состоит из двух частей. Вторая часть траектории M2(t) проходит через зону, свободную от препятствий, первая часть M1(t) — через зону видимости с содержащимися в ней препятствиями.

На четвертом этапе на первой части траектории M1(t) выбирается входящая в ее состав ячейка ек с максимальным весом, являющаяся концевой в составе M1(t). Следующая в траектории M(t) за ячейкой ек ячейка е„ лежит уже во второй части траектории M2(t).

На пятом этапе в M1(t) выбирается ячейка ер с весом, меньшим по сравнению с весом ячейки ек на величину 5. Параметр 5 является управляющим. Подвижный объект перемещается по траектории M1(t) из точки ТП(0 в ячейку ер. Участок M1(t) траектории между точками ТП(0 и ер включает в себя планируемую траекторию. Далее ячейка ер рассматривается как новая текущая позиция ПО на следующей итерации t + 1. Участок M2(t) удаляется.

Сформированная карта местности с размещенными на ней двумя точками — исходной позицией ПО и целью — показана на рис. 5, а. На рисунке также отражены следующие результаты: первый этап — сформирована ЛЗВ и выявлены содержащиеся в ней препятствия; второй этап — путем распространения на ДРП волны от источника (точка ТП(^) к цели сформировано ППТ(^) с присвоением весов свободным ячейкам; третий этап — муравьиным алгоритмом на сформированной области ППТ(0 проложена траектория M(t) от цели к точке ТП(0, разбиение M(t) на две части M1(t) = (еи, ек) и M2(t) = (ея, ец); четвертый этап — фиксация в M1(t) концевой вершины ек (ячейка с координатами (5; 4); пятый этап — выбрана новая текущая позиция (ячейка ер с координатами (5; 3)) на участке M1(t), в которую перемещается ПО, еи = (1, 1), ец = (10, 7), ек = (5, 4), еп = (5, 5), ер = (5, 3).

Результаты выполнения первого этапа на второй итерации показаны на рис. 5, б: сформирована ЛЗВ, выявлены препятствия, отражен маршрут, спроектированный на предыдущей итерации. Точка ТП(0 помещена в ячейку с координатами (5; 3).

Результаты выполнения второго — пятого этапов приведены на рис. 5, в: второй этап — путем распространения на ДРП волны от источника (точка ТП(0) к цели сформировано ППТ(0 с присвоением весов свободным ячейкам; третий этап — муравьиным алгоритмом на сформированной области ППТ(0

проложена траектория M(t) от цели к точке ТП(£), разбиение M(t) на две части M1(t) и M2(t); четвертый этап — фиксация концевой вершины вк (ячейка с координатами (8; 6) в M1(t); пятый этап — выбрана новая текущая позиция (ячейка с координатами (8; 5)) на участке M1(t), в которую перемещается ПО.

Результаты выполнения первого этапа на третьей итерации отражены на рис. 5, г: сформирована ЛЗВ, выявлены содержащиеся в ней препятствия, а также маршрут, спроектированный на предыдущих итерациях.

Цель

У 6 7 8 9 10 11 12 13 14 □ У □

5 6 7 8 0

У 1U 11 12 и 14

4 5 6 7 8 9 10 и 12 13

3 4 5 6 © 8 9 10 11 12 2 0

2 0 № 7 8 9 10 11 0 ■ 1 1 i

1 1

1 2 3 0 5 6 7 8 9 10 1 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

□ _э 3 4 5 6 7 8 9

а б

У 9 8 7 6 5 6 7 8 9 да □ [Ь Цех

8 7 6 5 4 5 6 7 -8- -9 У .

7 6 5 4 3 0 5 6 7 8 0 0

6 5 4 3 ? -А- -А- 5 6 7 3 Г 1 0

5 4 3 2 1 2 3 4 0 6 2 0

6 0 1 □ 1 2 3 4 5 0 О

5 4 3 0 1 2 3 4 5 6 1 0

□ 5 4 3 2 3 4 5 6 7

X ~1

в г

Рис. 5. Результаты выполнения пяти этапов работы алгоритма на первой итерации (я), первого этапа на второй итерации (б), второго — пятого этапов второй итерации (в),

первого этапа на третьей итерации (г)

Точка Tn(t) помещена в ячейку с координатами (8; 5). Поскольку цель лежит в зоне видимости, на четвертом этапе третьей итерации муравьиным алгоритмом прокладывается участок планируемой траектории M(t) от цели к точке Tn(t) (ячейка с координатами (8; 5)).

Муравьиный алгоритм прокладки маршрута. В соответствии со структурной схемой гибридного алгоритма (см. рис. 4) после распространения волны на ДРП от источника (точка Tn(t)) к цели и присвоения веса ячейкам ДРП муравьиным алгоритмом на ДРП из цели в ТП(0 строится маршрут M(t).

Метаэвристика муравьиного алгоритма основывается на комбинации двух техник: общая схема, в которую включается встроенная процедура, строится на базовом методе. Встроенная процедура — самостоятельный алгоритм решения

той же задачи, что и метаэвристический метод. Базовый метод заключается в реализации итерационной процедуры поиска лучшего решения на основе механизмов адаптивного поведения муравьиной колонии. Встроенная процедура — конструктивный алгоритм построения муравьем некоторой конкретной интерпретации решения [16-18].

Поиск решения осуществляется популяцией муравьев на некоторой графовой модели пространства поиска.

Каждая итерация l базового метода включает в себя три этапа. На первом этапе каждый муравей популяции находит решение, на втором этапе каждый муравей откладывает феромон на некоторой графовой модели пространства поиска, на третьем этапе осуществляется испарение феромона. В работе использован циклический (ant-cycle) метод муравьиных систем [16, 17]. В этом случае феромон откладывается каждым муравьем на ребрах графа после полного формирования решения.

Основная идея интеграции, используемая в гибридном алгоритме, заключается в том, что муравьиный алгоритм построения траектории базируется на использовании отдельных процедур волнового алгоритма. Построение муравьем траектории осуществляется на базе сформированного ППТ(0 после распространения на ДРП волны от источника к цели с присвоением весов свободным ячейкам. Подобно волновому алгоритму муравей строит на ППТ(0 маршрут, представляющий собой совокупность ячеек с последовательно уменьшающимся весом. Всеми муравьями будут построены маршруты одной минимальной длины, но разной конфигурации. В этом случае оценкой маршрута Мк, построенного агентом ak, служит оценка его конфигурации: Fk = afrk +fifgk, где а, р — управляющие параметры, которые подбираются экспериментально; frk — число поворотов маршрута Мк; fgk — число содержащих препятствия ячеек, смежных c ячейками маршрута Мк. Чем меньше frk, тем меньше время выполнения задания — время, необходимое для завершения движения. Чем меньше fgk, тем выше показатель безопасности — число позиций ПО на минимальном расстоянии от ПО до любого препятствия вдоль всей траектории.

Цель оптимизации — минимизация значения Fk.

Отметим, что показатели PL, Sm, tm, V не являются объектами оптимизации. Объект оптимизации — показатель Fk =ufrk +Pfgk, минимизация которого на базе эвристик гибридного алгоритма планирования косвенно способствует минимизации интегральной оценки качества траектории (1).

Процедура построения гибридного алгоритма представлена двумя алгоритмами.

Алгоритм поведения муравьиной колонии

0. На основе выполнения начального, первого — пятого этапов построения траектории сформированы исходные данные, необходимые для работы муравьиного алгоритма:

- сформирована ЛЗВ: определены ее границы на модели карты местности и выявлены содержащиеся в ней препятствия;

- определены ячейка-цель вц и ячейка-источник ви;

- в процессе распространения волны на модели местности от ячейки-источника ви к ячейке-цели вц сформирована область трассировки R;

- всем ячейкам ei области трассировки R присвоен вес p(e;), определенный в процессе распространения волны от ячейки-источника ви к ячейке-цели вц —

р(ви) = 0, р(вц) = Вц.

1. Построен граф поиска решений G = (E, U). Вершины множества E соответствуют ячейкам области трассировки R. Две вершины ei е E и ej е E связаны ребром uk, если соответствующие им ячейки на модели местности в виде ДРП смежные и возможен переход траектории из одной ячейки в другую.

2. На начальном этапе на всех вершинах графа G = (E, U) отложено одинаковое (небольшое) количество феромона, равное Q / Пи, где Пи = |U|. Задано число итераций п.

3. l = 1, l — номер итерации.

4. Задано число муравьев, формирующих независимо друг от друга решения на одной итерации NR.

5. к = 1, к — номер текущего решения.

6. Агент ак размещается в вершине вц графа поиска решений G = (E, U).

7. Выполнение алгоритма 2 поведения муравья. Муравей ак строит на графе G маршрут Mk из вершины вц в вершину ви.

8. Расчет оценки Fk(l) k-го решения, полученного муравьем ak на l-й итерации.

9. Если получены все NR решений, то осуществляется переход к п. 10, иначе — k = k+1 и переход к п. 7.

10. Каждым муравьем ak на вершинах маршрута, построенного на графе G, откладывается феромон количеством Tk(l) = 5 / Fk(l), 5 — общее количество феромона, откладываемое k-м муравьем на вершинах графа G.

11. После того как каждый агент отложил на вершинах графа G феромон, происходит общее испарение феромона hj = hj(1-a), где с — коэффициент обновления; hj — суммарное количество феромона, отложенного муравьями на вершине е X.

12. Выбор лучшего решения, полученного на протяжении всех выполненных итераций.

13. Если все итерации выполнены, то конец работы алгоритма, в противном случае, l = l+1 и переход к п. 4.

Алгоритм 2 поведения муравья

1. Агент ak для построения маршрута в графе G помещается в начальную вершину Vo = вц.

2. t = 1, Mk (t) = вц, p(vo) = р(Хц) = Бц, t — номер шага.

3. Агент ak определяет множество вершин Ek(t + 1) с E кандидатов для включения в маршрут Mk (t + 1). В Ek (t + 1) входят вершины e; е E, смежные с вершиной V0, вес которых меньше веса V0 на единицу, р(в;) = p(v0)-1.

4. Для каждой вершины e; е Ek (t + 1) рассчитывают степень свободы ю; — число ячеек с препятствиями на модели местности, смежных с вершиной e; е Ek (t + 1). Определяется значение параметра %;:

К; = 1, если маршрут меняет направление при переходе от V0 к в;;

%; = 0, если направление маршрута не меняется.

5. Рассчитывается стоимость C; каждой вершины в; е Ek (t + 1):

при мультипликативной свертке C; = h“tf;

при аддитивной свертке С; =<хк; +fit;.

Здесь hi — количество феромона, отложенного на вершине ej; tj = = 1/(wiQ; + w2%{ +1) — функция полезности перехода от V0 к e; w, W2 — коэффициенты значимости; а и р — управляющие параметры, подбираемые экспериментально.

6. Для каждой вершины в; е Ek (t + 1) рассчитывается вероятность P; ее включения в формируемый маршрут Mk (t + 1): P; = С^^ С , i | e; е Ek(t +1).

7. Случайным образом в соответствии с рассчитанными вероятностями выбирается вершина e* е Ek (t +1), которая включается в маршрут Mk (t + 1).

8. Если p(e;*) = 1, то вершина e* смежна c конечной вершиной en. В маршрут Mk (t + 1) включается вершина en. Маршрут построен, и осуществляется переход к п. 9, иначе — v0 = e*, t = t +1 и переход к п. 3.

9. Конец работы алгоритма.

Временная сложность приведенного алгоритма зависит от времени жизни колонии l (числа итераций), числа вершин графа n и числа муравьев m.

Экспериментальные исследования. Как было отмечено выше, в состав интегральной оценки качества траектории W входят показатели, значения которых формируются последовательно в процессе пошагового построения траектории. С одной стороны, значения показателей зависят от эвристик, заложенных в общую структуру алгоритма и остающихся постоянными. С другой, на каждом шаге построения части траектории используется оптимизационная процедура на основе гибридного алгоритма. В связи с этим основу экспериментальных исследований составили исследования указанной процедуры.

Для проведения экспериментов была использована процедура синтеза контрольных примеров с известным оптимумом по аналогии с известным методом PEKU (Placement Examples with Known Upper Bounds on Wirelength) [13-18].

Для задачи планирования траектории создано четыре набора примеров с известным оптимумом по длине траектории и оптимальным значением Еопт оценки качества конфигурации траектории Fk. Для генерации примеров исполь-

зован следующий метод. На вход подается модель ЛЗВ, содержащая препятствия и координаты двух связываемых точек, размещенных на ЛЗВ. Затем генерируется пример трассировки в ЛЗВ, который имеет заранее известное оптимальное значение Лопт. Оптимизацию проводят по критериям минимальной длины траектории и оптимального значения оценки качества конфигурации, опираясь на методику, изложенную в работе [1].

Эксперименты показали, что начальное количество феромонов Q должно быть в 10-12 раз больше среднего значения количества феромонов Xk (l), откладываемых муравьями на каждой итерации. Для нахождения наилучшего сочетания таких параметров, как объем популяции N и число итераций I, экспериментальные исследования проводились следующим образом.

Для каждого примера сначала фиксировался объем популяции N и анализировалось число итераций I. Проводилась серия из 10 экспериментов для каждого фиксированного набора параметров.

При проведении испытаний для каждого эксперимента фиксировалось число итераций, при которых алгоритм получал какое-либо решение. В каждой серии из 10 экспериментов фиксировались минимальное, максимальное и среднее числа итераций, при которых сходился алгоритм. На основе обработки результатов эксперимента была построена зависимость среднего качества решений от числа итераций (рис. 6, а). Оценкой качества является величина Fk / Лопт, где F — оценка качества полученного решения. Исследования показали, что число итераций, при которых алгоритм находил лучшее решение, лежит в пределах 68-80. В среднем на 76-й итерации решение близко к оптимальному.

Рк'Р,опт Рк/Рош

Рис. 6. Зависимости среднего качества решений от числа итераций (а) и объема популяции (б)

Зависимость среднего качества решений от объема популяции приведена на рис. 6, б. Возрастание объема популяции более 50 не приводит к получению лучших результатов, а только увеличивает время сходимости алгоритма и время его работы.

Эксперименты показали, что наилучшим является следующее сочетание управляющих параметров: объем популяции N = 50, число итераций I = 80. Были проведены эксперименты, характеризующие зависимость времени выполнения алгоритма от размера задачи. Выполнена серия измерений продолжитель-

ности работы алгоритма от числа цепей. Общая оценка временной сложности алгоритма при любом подходе к гибридизации лежит в пределах О(п2)-О(п3).

Сравнение значений критерия, полученных гибридным алгоритмом на тестовых примерах, с оптимумом показало, что у 60 % примеров полученное решение было оптимальным, у 15 % примеров — на 5 % хуже оптимального, а у 25 % примеров — хуже оптимального не более чем на 2 %.

Сравнительный анализ выполнен на тестовом наборе сцен, приведенном в работе [1]. Сравнение разработанного гибридного алгоритма с существующими алгоритмами [9-14] по интегральной оценке качества траектории W показало, что при меньшем времени работы у определенных с помощью разработанного алгоритма решений значения F меньше в среднем на 6 %.

Примеры сцен с проложенными траекториями приведены на рис. 7.

У

16 .•If**

• /

12

8 / •

/• •

4

0 4 8 12 16 х

а

У ~t

16

• у-'И • • • •

12

• \ •

8

* /** •

4 »**** 1 1 1 1

0 4 8 12 16 х

в

б

Рис. 7. Примеры (а-в) сцен с проложенными траекториями

Заключение. Несмотря на достаточно большое число разработанных моделей и алгоритмов управления подвижными объектами в условиях неопределенности, при решении задач планирования траекторий в среде с препятствиями в условиях неопределенности исследователи часто сталкиваются с проблемами, к числу которых относятся трудность обоснования качества результатов анализа, учитывающего специфику конкретной задачи, а также проблема поиска глобального экстремума у критерия качества планирования траекторий.

Следовательно, можно сделать вывод о целесообразности дальнейшего развития методов планирования траекторий в среде с препятствиями в условиях неопределенности, позволяющих решать указанные проблемы. К числу перспективных тенденций относятся разработка гибридных методов управления

подвижными объектами в условиях неопределенности. В гибридных (комбинированных) алгоритмах, объединяющих различные или одинаковые алгоритмы, но с различными значениями свободных параметров, преимущества одного алгоритма могут компенсировать недостатки другого. Рассмотрен гибридный алгоритм планирования траектории в условиях частичной неопределенности для двумерного пространства, основанный на интеграции волнового и муравьиного алгоритмов, позволяющий строить в реальном масштабе времени траектории минимальной длины с одновременной оптимизацией других критериев качества построенной траектории.

Разработана архитектура поисковой системы синтеза (прокладки) траектории и передвижения ПО по ней. Отличительная особенность заключается в том, что перемещение по траектории происходит одновременно с ее формированием (прокладкой), т. е. проектирование траектории осуществляется в режиме online. Ключевая проблема, решенная в настоящей работе, — разработана методика сращивания механизмов муравьиного и волнового алгоритмов. Источником усовершенствования может быть более детальная проработка вопросов, связанных с формированием зоны видимости и выбором (сменой) текущих исходных позиций, что ускорит процесс достижения ПО целевого состояния.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛИТЕРАТУРА

1. Пшихопов В.Х., ред. Интеллектуальное планирование траекторий подвижных объектов в средах с препятствиями. М.: Физматлит, 2014. 295 с.

2. Пшихопов В.Х., Медведев М.Ю. Управление подвижными объектами в определенных и неопределенных средах. М.: Наука, 2011. 215 с.

3. Гузик В.Ф., Переверзев В.А., Пьявченко А.О., Сапрыкин Р.В. Принципы построения экстраполирующего многомерного нейросетевого планировщика интеллектуальной системы по-зиционно-траекторного управления подвижными объектами // Известия ЮФУ. Технические науки. 2016. № 2 (175). С. 67-80.

4. Горбатов В.А. Основы дискретной математики. М.: УРСС, 1994. 340 с.

5. Ахо А., Хопкрофт Дж., Ульман Дж. Построение и анализ вычислительных алгоритмов: пер. с англ. М.: Мир, 1979. 536 с.

6. Пшихопов В.Х., Медведев М.Ю., Гуренко Б.В. Алгоритмы адаптивных позиционно-траекторных систем управления подвижными объектами // Проблемы управления. 2015. № 4. С. 66-74.

7. МакКоннелл Дж. Основы современных алгоритмов. М.: Техносфера, 2004. 368 с.

8. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой. М.: Изд-во МГТУ им. Н.Э. Баумана, 2014. 446 с.

9. Caro G.Di, Ducatelle F., Gambardella L.M. AntHocNet: An adaptive nature inspired algorithm for routing in mobile ad hoc networks // Transactions on Emerging Telecommunications Technologies. 2005. Vol. 16. Iss. 5. Р. 443-455. DOI: 10.1002/ett.1062

10. Hoefler T., Snir M. Generic topology mapping strategies for large-scale parallel architectures // ICS'11. Proc. of the Int. Conf. on Supercomputing, ACM, 2011. Р. 75-85.

11. Нейдорф Р.А., Полях В.В., Черногоров И.В., Ярахмедов О.Т. Исследование эвристических алгоритмов в задачах прокладки и оптимизация маршрутов в среде с препятствиями // Известия ЮФУ. Технические науки. 2016. № 3 (176). С. 127-143.

12. Fatemeh K.P., Fardad F., Reza S.N. Comparing the performance of genetic algorithm and ant colony optimization algorithm for mobile robot path planning in the dynamic environments with different complexities // Journal of Academic and Applied Studies. 2013. Vol. 3. No. 2. Р. 29-44.

13. Dutta S. Obstacle avoidance of mobile robot using PSO-based neuro fuzzy technique // International Journal on Computer Science and Engineering. 2010. Vol. 2. No. 2. P. 301-304.

14. Chen S, Eshaghian M.M. A fast recursive mapping algorithm. Department of computer and information science. New Jersey Institute of Technology, 2013. P. 219-227.

15. Raidl G.R. A unified view on hybrid metaheuristics // International Workshop on Hybrid Metaheuristics. Springer, 2006. P. 1-12.

16. Dorigo M., Caro G.Di, Gambardella L.M. Ant algorithms for discrete optimization // Artificial Life. 1999. Vol. 5. No. 2. P. 137-172.

17. Лебедев О.Б. Модели адаптивного поведения муравьиной колонии в задачах проектирования. Таганрог: Изд-во ЮФУ, 2013. 199 с.

18. Лебедев Б.К., Лебедев О.Б. Моделирование адаптивного поведения муравьиной колонии при поиске решений, интерпретируемых деревьями // Известия ЮФУ. Технические науки. 2012. № 7. С. 27-34.

Лебедев Борис Константинович — д-р техн. наук, профессор кафедры систем автоматизированного проектирования Инженерно-технологической академии Южного федерального университета (Российская Федерация, 347900, Ростовская обл., Таганрог, Некрасовский переулок, д. 44).

Лебедев Олег Борисович — канд. техн. наук, доцент кафедры систем автоматизированного проектирования Инженерно-технологической академии Южного федерального университета (Российская Федерация, 347900, Ростовская обл., Таганрог, Некрасовский переулок, д. 44).

Лебедева Елена Михайловна — аспирантка кафедры систем автоматизированного проектирования Инженерно-технологической академии Южного федерального университета (Российская Федерация, 347900, Ростовская обл., Таганрог, Некрасовский переулок, д. 44).

Просьба ссылаться на эту статью следующим образом:

Лебедев Б.К., Лебедев О.Б., Лебедева Е.М. Гибридный алгоритм ситуационного планирования траектории на плоскости в условиях частичной неопределенности // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2018. № 1. C. 76-93.

DOI: 10.18698/0236-3933-2018-1-76-93

HYBRID ALGORITHM OF SITUATIONAL TRAJECTORY PLANNING UNDER PARTIAL UNCERTAINTY

B.K. Lebedev lebedev.b.k@gmail.com

O.B. Lebedev lebedev.ob@mail.ru

E.M. Lebedeva

Academy for Engineering and Technologies, Southern Federal University, Taganrog, Rostov Region, Russian Federation

Abstract

The paper describes a hybrid algorithm of situational trajectory planning under partial uncertainty for the twodimensional space. The algorithm is based on integration of the wave algorithm and ant colony optimization and makes it possible to build a real-time trajectory of minimal length with simultaneous optimization of a number of other constructed path quality criteria. The trajectory laying process is carried out step by step. The constraints on the area map which make it impossible to lay the trajectory from the current position are identified after the trajectory reaching this position. Successively at each step relatively to the current position of a mobile object (MO), a zone is formed within which, by means of radar, all obstacles are localized, and then a trajectory section is built being a continuation of the previously obtained section. The whole trajectory is a set of sections linking the original position of the mobile object to the target position. The time complexity of the hybrid algorithm depends on the lifetime of colonies l (number of iterations), the number n of the graph vertices and the number of ants m, and is defined as O (ln* 1 2 3 4m)

Keywords

Trajectory planning, partial uncertainty, two-dimensional space, wave algorithm, ant colony optimization, hybridization

Received 29.06.2017 © BMSTU, 2018

This work was supported by the Russian Foundation for Basic Research (grant no. 17-07-00997)

REFERENCES

[1] Pshikhopov V.Kh., ed. Intellektual'noe planirovanie traektoriy podvizhnykh ob'ektov v sredakh s prepyatstviyami [Intelligent planning of moving objects trajectory in environment with obstacles]. Moscow, Fizmatlit Publ., 2014. 295 p.

[2] Pshikhopov V.Kh., Medvedev M.Yu. Upravlenie podvizhnymi ob'ektami v opredelennykh i neopredelennykh sredakh [Control on moving objects in certain and uncertain environment]. Moscow, Nauka Publ., 2011. 215 p.

[3] Guzik V.F., Pereverzev V.A., Pyavchenko A.O., Saprykin R.V. Design principles for extrapolating multidimensional neural-network planner for intellectual position-trajectory control system of moving objects. Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2016, no. 2 (175), pp. 67-80 (in Russ.).

[4] Gorbatov V.A. Osnovy diskretnoy matematiki [Fundamentals of discrete mathematics]. Moscow, URSS Publ., 1994. 340 p.

[5] Aho A., Ullman J., Hopcroft J. The design and analysis of computer algorithms. Addison-Wesley, 1974. 70 p.

[6] Pshikhopov V.Kh., Medvedev M.Yu., Gurenko B.V. The basic algorithms of adaptive position-trajectory control system of mobile objects. Problemy upravleniya [Control Sciences], 2015, no. 4. pp. 66-74 (in Russ.).

[7] McConnell J.J. Analysis of algorithms. Jones & Bartlett Learning, 2001. 297 p.

[8] Karpenko A.P. Sovremennye algoritmy poiskovoy optimizatsii. Algoritmy, vdokhnovlen-nye prirodoy [Modern search optimization algorithms. Algorithms inspired by nature]. Moscow, Bauman MSTU Publ., 2014. 446 p.

[9] Caro G.Di, Ducatelle F., Gambardella L.M. AntHocNet: An adaptive nature inspired algorithm for routing in mobile ad hoc networks. Transactions on Emerging Telecommunications Technologies, 2005, vol. 16, iss. 5, pp. 443-455. DOI: 10.1002/ett.1062

[10] Hoefler T., Snir M. Generic topology mapping strategies for large-scale parallel architectures. ICS'11. Proc. of the Int. Conf. on Supercomputing, ACM, 2011, pp. 75-85.

[11] Neydorf R.A., Polyakh V.V., Chernogorov I.V., Yarakhmedov O.T. Study of heuristic algorithms in planning and optimization of routes problem in the environment with obstacles. Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2016, no. 3 (176). pp. 127-143 (in Russ.).

[12] Fatemeh K.P., Fardad F., Reza S.N. Comparing the performance of genetic algorithm and ant colony optimization algorithm for mobile robot path planning in the dynamic environments with different complexities. Journal of Academic and Applied Studies, 2013, vol. 3, no. 2, pp. 29-44.

[13] Dutta S. Obstacle avoidance of mobile robot using PSO-based neuro fuzzy technique. International Journal on Computer Science and Engineering, 2010, vol. 2, no. 2, pp. 301-304.

[14] Chen S., Eshaghian M.M. A fast recursive mapping algorithm. Department of computer and information science. New Jersey Institute of Technology, 2013, pp. 219-227.

[15] Raidl G.R. A unified view on hybrid metaheuristics. International Workshop on Hybrid Metaheuristics, Springer, 2006, pp. 1-12.

[16] Dorigo M., Caro G.Di, Gambardella L.M. Ant algorithms for discrete optimization. Artificial Life, 1999, vol. 5, no. 2, pp. 137-172.

[17] Lebedev O.B. Modeli adaptivnogo povedeniya murav'inoy kolonii v zadachakh proek-tirovaniya [Adaptive behavior model for ant colony in design problems]. Taganrog, YuFU Publ., 2013. 199 p.

[18] Lebedev B.K., Lebedev O.B. Modelling of an ant colony adaptive behavior by search of the decisions interpreted by trees. Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2012, no. 7, pp. 27-34 (in Russ.).

Lebedev B.K. — Dr. Sc. (Eng.), Professor, Department of Computer Aided Design Systems, Academy for Engineering and Technologies, Southern Federal University (Nekrasovsky per. 44, Taganrog, Rostov Region, 347900 Russian Federation).

Lebedev O.B. — Cand. Sc. (Eng.), Assoc. Professor, Department of Computer Aided Design Systems, Academy for Engineering and Technologies, Southern Federal University (Nekrasovsky per. 44, Taganrog, Rostov Region, 347900 Russian Federation).

Lebedeva E.M. — post-graduate student, Department of Computer Aided Design Systems, Academy for Engineering and Technologies, Southern Federal University (Nekrasovsky per. 44, Taganrog, Rostov Region, 347900 Russian Federation).

Please cite this article in English as:

Lebedev B.K., Lebedev O.B., Lebedeva E.M. Hybrid Algorithm of Situational Trajectory Planning under Partial Uncertainty. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2018, no. 1, pp. 76-93 (in Russ.). DOI: 10.18698/0236-3933-2018-1-76-93

В Издательстве МГТУ им. Н.Э. Баумана вышла в свет монография (2-е издание) авторов В.В. Кузенова, А.И. Лебо,

И.Г. Лебо, С.В. Рыжкова

«Физико-математические модели и методы расчета воздействия мощных лазерных и плазменных импульсов на конденсированные и газовые среды»

Изучены физические процессы в веществе при взаимодействии с мощными источниками импульсного нагрева. Дан краткий исторический очерк, описана физика лазерного термоядерного синтеза. Основное внимание уделено построению математических моделей и численным исследованиям физических явлений в высокотемпературной плазме для инерционного и магнитно-инерциального термоядерного синтеза. Приведены различные методы численных решений уравнений магнитно-радиационной плазмодинамики. Для аспирантов физико-технических специальностей университетов, а также научных сотрудников и инженеров, работающих в области астрофизики, систем управляемого термоядерного синтеза и физики газовых разрядов.

По вопросам приобретения обращайтесь:

105005, Москва, 2-я Бауманская ул., д. 5, стр. 1 +7 (499) 263-60-45 press@bmstu.ru www.baumanpress.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.