Научная статья на тему 'Программно-аппаратный комплекс для моделирования задач обучения, потоковой обработки сенсорной информации и адаптивного группового управления мобильными роботами'

Программно-аппаратный комплекс для моделирования задач обучения, потоковой обработки сенсорной информации и адаптивного группового управления мобильными роботами Текст научной статьи по специальности «Кибернетика»

CC BY
130
39
Поделиться
Ключевые слова
ГРУППА МОБИЛЬНЫХ РОБОТОВ / МОДЕЛИРОВАНИЕ / АДАПТИВНОЕ УПРАВЛЕНИЕ / СПАЙКОВЫЙ НЕЙРОН

Аннотация научной статьи по кибернетике, автор научной работы — Кобрин А. И., Александров В. А., Синявский О. Ю.

Работа посвящена созданию аппаратно-программного комплекса для разработки и исследования новых алгоритмов коллективного поведения в группе роботов, а также адаптации известных алгоритмов к решению задач с минимальной априорной информацией о внешней среде. Описываемый в работе программно-аппаратный комплекс снабжен активным испытательным полигоном с набором препятствий, зарядными станциями и целевыми точками с инфракрасными метками, а также оснащен дублированной системой коммуникации между мобильными роботами. Приведены результаты моделирования управляющего спайкового нейросетевого контроллера и решения задачи поиска целевых точек на тестовом полигоне с применением индивидуального алгоритма случайного блуждания и алгоритма коллективного управления, реализованного с применением многоагентного подхода.

SOFTWARE AND HARDWARE SYSTEM FOR PROCESSING SENSOR DATA AND ADAPTIVE CONTROL OF MOBILE ROBOT GROUP

The work is dedicated to the creation of hardware and software system for the research and development of new algorithms for collective behavior in a group of robots, as well as adapting known algorithms for solving problems with minimal a priori information about the external environment. The software and hardware system is equipped with an active test polygon, a set of obstacles, charging stations, target points with infrared markers, and communication systems between the mobile robots. The results of modelling spike neural controller for mobile robot and solving the problem of searching target points on the test polygon with the use of individual random search and collective algorithm with multiagent approach is given.

Текст научной работы на тему «Программно-аппаратный комплекс для моделирования задач обучения, потоковой обработки сенсорной информации и адаптивного группового управления мобильными роботами»

2238

Фундаментальные проблемы теоретической и прикладной механики Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 4 (5), с. 2238-2240

УДК 681.5

ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС ДЛЯ МОДЕЛИРОВАНИЯ ЗАДАЧ ОБУЧЕНИЯ, ПОТОКОВОЙ ОБРАБОТКИ СЕНСОРНОЙ ИНФОРМАЦИИ И АДАПТИВНОГО ГРУППОВОГО УПРАВЛЕНИЯ МОБИЛЬНЫМИ РОБОТАМИ

© 2011 г. А.И. Кобрин, В.А. Александров, О.Ю. Синявский

Московский энергетический институт (технический университет)

kobrinAI@yandex.ru

Поступила в редакцию 24.08.2011

Работа посвящена созданию аппаратно-программного комплекса для разработки и исследования новых алгоритмов коллективного поведения в группе роботов, а также адаптации известных алгоритмов к решению задач с минимальной априорной информацией о внешней среде. Описываемый в работе программноаппаратный комплекс снабжен активным испытательным полигоном с набором препятствий, зарядными станциями и целевыми точками с инфракрасными метками, а также оснащен дублированной системой коммуникации между мобильными роботами. Приведены результаты моделирования управляющего спайкового ней-росетевого контроллера и решения задачи поиска целевых точек на тестовом полигоне с применением индивидуального алгоритма случайного блуждания и алгоритма коллективного управления, реализованного с применением многоагентного подхода.

Ключевые слова: группа мобильных роботов, моделирование, адаптивное управление, спайковый нейрон.

Программно-аппаратный комплекс [1] состоит из системы имитационного моделирования и тестового полигона, снабженного набором препятствий, зарядными станциями, и целевыми точ -ками с инфракрасными (ИК) метками. Г абаритные размеры испытательного полигона 1.5x2 м. Исследовательские роботы (рис. 1), используемые для тестирования алгоритмов на реальном полигоне, представляют собой однотипные автономные мобильные платформы с дифференциальным приводом.

дальности, одометрических датчиков, двух двигателей постоянного тока, системы индикации и звукового оповещения.

Для оценки возможностей исследования процессов обучения с применением спайковой нейронной сети решались задачи имитационного и физического моделирования колесных роботов-футболистов [2]. При анализе динамики роботов использовалась модель неголономных связей и учитывались столкновения объектов в среде моделирования. Нейронная сеть робота имела: сенсорные и модулирующие входы и одну группу входов для управляющих сигналов (рис. 2).

Активаторы

Рис. 1

Мобильный робот оснащен набором бортового оборудования, состоящим из: восьми даль-номерных модулей, радиомодуля двухсторонней связи, двух инфракрасных (ИК)-локаторов, способных детектировать специальные ИК-метки, ИК-приемопередающего канала ограниченной

Управляющие нейроны Первый слой

Второй слой

Сенсоры скорости колес робота

Детекторы стен

Сенсоры направления на мяч Сенсоры угла робота Модулирующие выходы среды

Рис. 2

Сенсоры робота позволяли получить в виде спайков информацию о текущих скоростях колес,

угле поворота робота, о направлении на мяч, а также спайки от детекторов столкновений со стенками. Сенсорные потоки были представлены в виде многомерных потоков точечных событий — спайков. Непрерывные величины углов и скоростей дискретизировались соответствующими ансамблями сенсоров. Для тестирования алгоритмов обучения с подкреплением была выбрана задача удара робота по мячу. Процесс обучения был разбит на итерации. В начале итерации робот и мяч инициализировались случайными положениями и углами. После этого запускалась симуляция робота как неголономного объекта, а также процессы его соударения со стенками. Если робот дотрагивался до мяча, то сеть получала положительное подкрепление. На рис. 3 представлен график суммарной награды в процессе обучения (верхняя линия) в зависимости от такта обучения.

| Роботы | Целевые точки |Препятствия Зарядные станции

Рис. 4

Базовый индивидуальный алгоритм управления представлялся в виде конечного автомата, реализующего псевдослучайное блуждание и объезд препятствий. Алгоритм реализован без изменений в системах управления всеми роботами, входящими в группу. С использованием многоагентного подхода разработана коллективная система управления, результаты работы которой сравнивались с базовым индивидуальным алгоритмом. «Доска объявлений», локальную копию которой содержит каждый мобильный агент, заполнялась мобильными агентами информацией об их текущей активности (поиск или ожидание) и текущей политике объезда препятствий (слева или справа). Система управления каждого робота конфигурировалась с учетом информации, получаемой от модуля локальной доски объявлений. На рис. 5 показаны результаты испытаний: а — для алгоритма случайного блуждания, б — для много -агентного алгоритма коллективного управления.

500

400

300

200

100

Для сравнения также построен (нижняя линия) график течения суммарной награды при отсутствии обучения. Видно, что количество получаемой награды при включенном обучении нарастает.

Моделирование распределенной адаптивной системы управления в задаче поиска проводилось при помощи программно-аппаратного комплекса [3]. Анализировалось поведение группы из 6 роботов. Ограничивающие параметры для модели были получены из испытаний реальных прототипов роботов. Целью задачи было отыскание четырех объектов (целевых точек), расположенных на тестовом полигоне (рис. 4).

ЛІ

■ 1 точка

■ 2 точка

□ 3 точка

□ 4 точка

ОД ДК ОК

а)

500

400

300

200

100

■ 1 точка

■ 2 точка о 3 точка

■ 4 точка

ОД ДК ОК

б)

Рис. 5

Испытания проводились для трех различных типов начальных условий. Вначале шестерка роботов располагалась в линию вдоль одной длинной стороны полигона (столбцы «ОД» на рис. 5). Затем по три робота вдоль левой и правой коротких сторон полигона (столбцы «ДК»). И, наконец, вдоль одной короткой стороны (столбцы «ОК»). Целевые точки пронумерованы в порядке их об-

наружения группой роботов. По вертикальной оси гистограммы отложено время достижения целевых точек в секундах.

Применение многоагентного алгоритма кол -лективного управления повышает, по сравнению с базовым алгоритмом, эффективность решения задачи поиска целевых точек, а также снижает зависимость времени решения задачи от начального расположения мобильных роботов.

Список литературы

1. Александров В.А., Кобрин А.И. Программноаппаратный комплекс для моделирования задач груп-

пового управления мобильными роботами // Вестник МЭИ. 2010. №3.

2. Sinyavskiy O.Y., Kobrin A.I. Construction of adaptive robot control system and robot sensor information processing using spiking neural networks // Proceedings Tai-wan-Russian Bilateral Symposium on Problems in Advanced Mechanics. M.: Moscow State University, 2010. P. 218-227.

3. Александров В.А., Кобрин А.И. Система имитационного моделирования для разработки алгоритмов коллективного управления группой роботов // Инновационные подходы к развитию вооружения, военной и специальной техники: Матер. I Всерос. научно-практич. конф. молодых ученых, Москва, 9-10 дек. 2010.

SOFTWARE AND HARDWARE SYSTEM FOR PROCESSING SENSOR DATA AND ADAPTIVE CONTROL OF MOBILE ROBOT GROUP

A.I. Kobrin, V.A. Aleksandrov, O. Yu. Sinyavskiy

The work is dedicated to the creation of hardware and software system for the research and development of new algorithms for collective behavior in a group of robots, as well as adapting known algorithms for solving problems with minimal a priori information about the external environment. The software and hardware system is equipped with an active test polygon, a set of obstacles, charging stations, target points with infrared markers, and communication systems between the mobile robots. The results of modelling spike neural controller for mobile robot and solving the problem of searching target points on the test polygon with the use of individual random search and collective algorithm with multiagent approach is given.

Keywords: mobile robot group, modelling, adaptive control, spike neuron.