Научная статья на тему 'Синтез нейросетевого планировщика перемещений автономного роботизированного комплекса на базе дирижабля, функционирующего в априори неформализованной среде'

Синтез нейросетевого планировщика перемещений автономного роботизированного комплекса на базе дирижабля, функционирующего в априори неформализованной среде Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
208
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЛАНИРОВАНИЕ ПЕРЕМЕЩЕНИЙ / НЕЙРОННЫЕ СЕТИ / РОБОТОТЕХНИКА / ДИРИЖАБЛИ / MOTION PLANNING / NEURAL NETWORKS / ROBOTICS / AIRSHIPS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сиротенко М. Ю.

В данной работе представлен новый метод синтеза планировщика перемещений автономного роботизированного комплекса на базе дирижабля, функционирующего в априори неформализованной среде. Особенностью предлагаемого подхода является интеграция системы планирования с системой технического зрения, а также совместное использование классических методов планирования траекторий с нейросетевым подходом. На основе предложенного метода был разработан и обучен нейросетевой планировщик. Используя виртуальную среду, были смоделированы движения дирижабля в пространстве с препятствиями. Результаты моделирования подтвердили обоснованность предложенных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сиротенко М. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Neural Network Motin Planner Synthesis the Autonomous Robotic Complex Based on Airship Operating in a Priori Nonformilized Environment

This paper presents a novel method of the synthesis of a neural network motion planner for the autonomous aerostatic robotic complex based on airship, operating in a priory non-formalized environment. Features of a proposed approach are an integration of a planning system with a computer vision system and a simultaneous use of both classical planning methods with neural network approach. A neural network planner was developed and trained on a basis of proposed method. Airship motion through the area with obstacles was modeled using a virtual environment. Modeling results approved a validity of a proposed method.

Текст научной работы на тему «Синтез нейросетевого планировщика перемещений автономного роботизированного комплекса на базе дирижабля, функционирующего в априори неформализованной среде»

5. . . -

мических характеристик самолета из летных испытаний / ЮТ. Живов, А.В. Каргополь-цев, АС. Фадеев // Техника воздушного флота. 2007. Т.81. №3/4(686/687). - С.4-15.

6. Williams-Hayes P.S. Selected flight tests results for online learning neural network-based flight control system. - NASA/ TM-2004-212857, 2004.

7. Бондарец А.Я. Процедура уточнения математической модели динамики полета по результатам летных испытаний // Сборник докладов 3-й научной конференции «Гидроавиасалон-2000». - М., 2000.

8. Бондарец А.Я., Оголев Ю.А. Результаты уточнения математической модели динамики

- -200 // -

дов 4-й научной конференции «Гидроавиасалон-2002». - М., 2002.

УДК 681.511.4

М.Ю. Сиротенко

СИНТЕЗ НЕЙРОСЕТЕВОГО ПЛАНИРОВЩИКА ПЕРЕМЕЩЕНИЙ АВТОНОМНОГО РОБОТИЗИРОВАННОГО КОМПЛЕКСА НА БАЗЕ ДИРИЖАБЛЯ, ФУНКЦИОНИРУЮЩЕГО В АПРИОРИ НЕФОРМАЛИЗОВАННОЙ СРЕДЕ

Введение

Планирование перемещений мобильных роботов является высшей иерархической ступенью в структуре системы управления, получая на входе задание и выдавая на выходе траектории движения, при отработке которых робот достигает цели. Передвижение робота в априори неформализуемой среде означает необходимость решения трудноформализуемых задач, таких как формирование пути обхода препятствий по неполным или зашумленным сенсорным данным. В данной работе для решения этой задачи предлагается использовать аппарат нейронных сетей и классические методы планирования траекторий. С учетом этого сформулируем постановку задачи.

Постановка задачи

Для синтеза планировщика перемещений необходимо на основе особенностей объекта управления определить следующие основные начальные условия: тип , ,

, , , требования к учету формы объекта, интеллектуальные функциональные возможности, критерии функционирования.

Особенности робототехнического комплекса на базе дирижабля заключаются в следующем [1]:

1. как правило, большие габариты, сферическая форма;

2. малая динамика, большая инерционность, как следствие малая маневрен-

;

3. движение в трехмерном пространстве;

4. возможные препятствия - другие летательные объекты, а также объекты рельефа и сооружения;

5. , , ,

Первая и вторая особенности определяют необходимость раннего обнаружения препятствий и построения траекторий их обхода. Учитывая это целесообразно формировать траектории движения не в виде отрезков прямых, а в виде квадратич-, , -, , . тип конфигурационного пространства. Четвертая особенность наряду с первой и второй позволяют принять объект управления и препятствия сферами и эллипсами, так как при большой инерционности, присущей дирижаблю, обход препятствий со сложной внешней конфигурацией невозможен. Неформализуемость внешней среды определяет необходимость оперативного («онлайн») планирования траекторий .

системы технического зрения на базе телекамер в качестве источника входных .

планировщика перемещений роботизированного комплекса на базе дирижабля представлены в таблице 1.

1

Исходные данные для решения задачи синтеза нейросетевого планировщика

перемещений

Входные данные Видеоизображение от системы технического зрения

Выходные данные Траектория движения мобильного робота в виде коэффициентов , ,

Размерность конфигурационного пространства 3

Тип конфигурационного пространства Декартовы координаты

Требования к режиму работы Функционирование в реальном режиме времени

Обнаружение столкновений Допускается рассматривать все объекты как сферы конечного радиуса

Обход препятствий Способность формирования траекторий обхода статических и динамических препятствий

Интеллектуальные функциональные возможности Способность к обучению и адаптации, устойчивость к шумам во входных данных и изменениям внешней среды

Критерии Осуществимость прохода по траектории

Синтез планировщика Структурно-алгоритническая организация планировщика

На основе поставленной задачи была синтезирована функциональная схема нейросетевого планировщика, представленная на рисунке 1.

Рассмотрим более подробно функциональную схему нейросетевого плани. -жение от системы технического зрения, цель и карта. Изображение содержит данные о внешней среде в трудноформализуемом виде, из которого планировщик должен извлечь информацию о наличии препятствий на пути движения и скоррек-.

некоторую точку в пространстве, к которой необходимо осуществить движение,

так и траекторию по которой необходимо двигаться. В зависимости от типа цели изменяется режим работы планировщика. Карта может представлять собой априори известные сведения о внешней среде, если таковые имеются. Это может быть карта рельефа местности, или известных препятствий. В предельном случае карта может быть пустой, что будет означать полное отсутствие каких-либо данных о .

Классические алгоритмь

Блоь

формирования Блок выборки

глобальной текущей тракеторик

траектории

Рис. 1. Функциональная схема нейросетевого планировщика перемещений

Различные входные данные подаются на различные блоки планировщика. Видеоизображение после предварительной обработки поступает на вход сверточной нейронной сети (более подробно рассматривается в пп. 2. 3), которая формирует карты признаков, соответствующие внешней обстановке дирижабля. Цель и

( ).

зависимости от типа цели, данный блок может функционировать в двух режимах.

, , , -ды поиска пути, формирует траекторию движения в виде полетного задания от текущей точки к целевой, используя в качестве элементарных траекторий квадратич-. , от текущего положения к траектории и формирует полетное задание аналогично . -, -вию, чем к остальным блокам системы.

На основе данных о глобальной траектории и текущем положении, поступающих от навигационной системы роботизированного комплекса, блок выборки текущей траектории (БВТТ) определяет траекторию в полетном задании, которую необходимо отрабатывать в данный момент времени.

Используя данные о текущей траектории движения и карты признаков, содержащие информацию о препятствии на пути следования дирижабля, полносвязная нейронная сеть (ПНС) формирует скорректированную траекторию движения в виде коэффициентов квадратичной формы. В случае отсутствия препятствий на пути движения выход ПНС будет эквивалентен выходу БВТТ. Данные коэффици-

енты после прохождения блока постобработки выходных данных поступают на , .

Алгоритм формирования глобальной траектории

Как было отмечено ранее, среда функционирования дирижабля не предполагает его движения среди множества объектов сложной формы, а является движением по большей части в свободном пространстве с заданным рельефом и единич-, . условиях наиболее подходит один из классических алгоритмов формирования гло-.

алгоритм вероятностного планирования траектории [2, 3].

Работа алгоритма основывается на двух фазах: фаза построения путевой карты и фаза уточнения. Пусть А - робототехнический комплекс на базе дирижабля, а Ь - локальный планировщик. В данном алгоритме Ь представляет собой функцию, на вход которой поступают две точки в конфигурационном пространстве, а ее выходом является осуществимый путь, соединяющий эти точки в отсутствие препятствий. Для случая, когда конфигурационное пространство является Декартовым, Ь , .

Также для Декартовых конфигурационных пространств локальный планировщик Ь всегда будет симметричным, т.е. для любых заданных конфигураций а и Ь Ь(а,Ь)=Ь(Ь,а). В фазе построения путевой карты строится вероятностная карта и записывается в ненаправленный граф 0=(У,Е), где вершины графа V- вероятностно сформированные свободные точки конфигурационного пространства, а ребра Е - , . -

строение путевой карты происходит итерационно с использованием вероятностных методов. В каждой итерации произвольным образом выбирается некоторая свободная конфигурация с и добавляется к V. Для выбора большего числа узлов в «сложных» местах конфигурационного пространства могут использоваться эври-. -с Ь , -

, Е.

В фазе уточнения для произвольно заданных точки старта 5 и целевой точки g

ищутся осуществимые пути Р5 и Рш такие, что Р5 соединяет 5 с вершиной графа , а

Pg соединяет g с вершиной графа § такими, что 5 и g граф-связаны. Если такие пути успешно найдены, производится поиск по дереву графа с целью найти путь Ро в графе О, соединяющий 5 и g.

Синтез нейронной сети

Для решения трудноформализуемой задачи определения препятствия на пути движения робота по видеоинформации в данной работе предлагается использовать комбинацию сверточной нейронной сети (СНС) и классической многосвязной нейронной сети [4]. Сверточная нейронная сеть представляет собой особый класс НС, наилучшим образом подходящий для интеллектуальной обработки визуальных и . 3 -

вариантности к сдвигу и искажению исходного изображения: локальные поля восприятия, разделяемые веса и пространственная субдискретизация [5]. СНС состоит из чередующихся слоев свертки и субдискретизации. Поступающее на вход изображение подвергается свертке с некоторым ядром свертки в соответствии с вы:

С№, J) = F

ks ls

ХХК №, l) • S (i - k, J -1)+B(n)

k=1 l=1

(1)

где C - результат свертки (карта признаков), n - номер слоя, i, J - индексы, определяющие положение элемента в карте признаков, F - функция насыщения, обычно

, k, l - -

, ks, ls - ,

К - , S - , B - .

Ядро свертки является набором разделяемых весовых коэффициентов. Результатом данной операции является также некоторое изображение, которое называется картой признаков. В зависимости от выбранного ядра свертки, карта признаков будет выделять те или иные характеристики входного изображения. Для

наиболее полного выделения характеристик входного изображения используется несколько различных ядер свертки так, что на выходе сверточного слоя получается несколько карт признаков.

За сверточным слоем следует слой усреднения и субдискретизации, который понижает размерность карты признаков, тем самым понижая чувствительность выходов к сдвигам и поворотам.

Такое чередование сверточных и субдискретизирующих слоев приводит к постепенному увеличению количества карт признаков при уменьшении их размерности от слоя к слою.

Выходы сверточной нейронной сети, совместно с данными о текущей траектории подаются на входы классической многосвязной нейронной сети для формирования коэффициентов квадратичной формы.

Выбор количества слоев и нейронов в слоях. Для корректной работы нейро-сетевого планировщика необходимо правильно выбрать количество слоев и нейронов в слоях для сверточной и классической полносвязной нейронных сетей.

Выбор количества слоев для сверточной сети определяется размерностью входных данных и сложностью искомых характеристик изображения. Так как при субдискретизации изображение уменьшается в два раза по вертикали и по горизон-, .

Для подбора количества нейронов классической полносвязной нейронной сети предлагается использовать алгоритм OBD (optimal brain damage), который ите-

рационно удаляет нейроны, которые слабо задействованы в вычислительных про.

Формирование обучающей выборки. Для обучения нейронной сети в составе планировщика требуется сформировать максимально репрезентативную . -

, , может оказаться РВК.

Входными данными для нейронной сети являются два типа информации: изображение от системы технического зрения, представляющее собой матрицу интенсивностей, и коэффициенты квадратичной формы, описывающей желаемую траек-. -

Среди возможных ситуаций, можно выделить следующие:

Ситуация Выходные значения

Отсутствие препятствий Соответствует входным значениям

Наличие одного препятствия малого размера Корректировка траектории в дугу, огибающую препятствие

Наличие большого количества препятствий делающих невозможным огибание препятствия Корректировка траектории со сменой направления движения

Обучение сети. Для обучения сверточных сетей наилучшим образом подходит стохастическое обучение, методом градиентного спуска. Такой тип обучения имеет ряд преимуществ по сравнению с пакетным обучением. Во-первых стохастическое обучение гораздо быстрее, поскольку не требует вычисления Гессиана для всех обучающих образцов. Во-вторых стохастическое обучение менее подвержено попаданию в локальные минимумы и поэтому зачастую дает лучшие результаты чем пакетное обучение. В третьих стохастическое обучение может использоваться для отслеживания изменений в процессе обучения без необходимости ожидания конца обучения.

Пусть имеется обучающая выборка из т элементов. Пусть также все настраиваемые параметры сети включая веса и смещения представлены в виде вектора №=[п’1...п’„]. Общее количество весов и смещений соответственно равно п. Количество выходов сети равно к. Выходы обозначим как ог.к Пусть Б = [ёг...ёк] - требуемые значения выборки. Тогда вектор ошибки е = [еь..ек], где ei = ё- о. Для среднеквадратичной целевой функции, заданной как:

К

верхний индекс обозначает номер обучающей выборки. Введем также для удобства вектор

е = [е% ...

Учитывая введенные обозначения, Якобиан будет равен

ди'.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^4

Эи',

О е? Эи',

Эе* ЗIV,,

*

тогда градиент можно вычислить как

,1

3=1-е

+

4 +

1 02 +-

+

откуда следует, что градиент это вектор-столбец, каждый элемент которого определяет суммарное влияние каждого веса на значение целевой функции.

Моделирование

Для моделирования работы нейросетевого планировщика был синтезирован планировщик, структура которого показана на рисунке 2.

Рис. 2. Структура нейросетевого планировщика перемещений

Данная структура была реализована в среде Матлаб с использованием инструментария создания, обучения и моделирования нейросетевых планировщиков [6]. В качестве обучающей выборки с помощью программного обеспечения по созданию псевдореалистичной трехмерной графики были сформированы видеоизображения ландшафта и препятствий на их фоне.

Задачей планировщика являлось формирование коэффициентов траектории движения к цели находящейся прямо по направлению камеры в обход препятствия. Всего было сформировано 1500 изображений с различным расположением препятствий и элементов ландшафта. Обучающая выборка была построена, используя точные данные о положении объектов и их размеров. Из 1500 элемен-, 1000 500 . -

торий, сформированных планировщиком и не отличающихся более чем на 5% по СКО от сформированных на этапе геренации обучающей выборки для тестовой выборки составил 89.3%. Пример тестового изображения и траектория, построенная по сформированным планировщиком коэффициентам, представлены на рисунке 3 (а), (б). На рисунке 3 (б) черный круг представляет собой целевую точку, пунктирная линия - траекторию, сформированную глобальным планировщиком и сплошная линия - траекторию сформированную локальным нейро-

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Пшихопое В.Х. Дирижабли: перспективы использования в робототехнике./^., «Меха-троника, автоматизация, управление», №5, 2004 г., с. 15-20.

2. J.P. Laumond. Robot Motion Planning and Control. Springer-Verlag Telos. 1998, 343 pages

3. Steven M. LaValle. Planning Algorithms. Cambridge: Cambridge University Press, 2006.

- 1007 pages.

4. . ., . .

перемещений мобильных роботов для априори неформализуемых сред. Известия ЮФУ. Технические науки. Специальный выпуск. Материалы LIII научно-технической конфе-- ,

ЮФУ. Таганрог: Изд-во ТТИ ЮФУ, 2008. № 1 (78). 277 с. 196-198.

5. Y. Le Cun and Yoshua Bengio. Convolutional networks for images, speech, and time series. In Michael A.Arbib, editor, The Handbook of Brain Theory and Neural Networks, pages 255-258. MITPress, Cambridge, Massachusetts, 1995.

6. . . -екторий движения мобильных роботов. Мобильные роботы и мехатронные системы: Материалы научной школы-конференции (Москва, 23-27 октября 2006 г.). Части 1,2 / Под редакцией академика РАН В А. Садовничего. - М.: Изд-во Моск. ун-та, 2006.

- С. 174-181.

i Надоели баннеры? Вы всегда можете отключить рекламу.