Подходы к реализации нейросетевых систем управления интеллектуальными мобильными роботами

Чернухин Юрий Викторович; Сапрыкин Роман Владимирович; Бутов Павел Александрович

Раздел V. Интеллектуальные системы, автоматика

УДК 004.896

Ю.В. Чернухин, Р.В. Сапрыкин, П.А. Бутов ПОДХОДЫ К РЕАЛИЗАЦИИ НЕЙРОСЕТЕВЫХ СИСТЕМ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ МОБИЛЬНЫМИ РОБОТАМИ

Рассматриваются аппаратный, программный, аппаратно-программный и аппаратно-программно-аппаратный подходы к построению нейросетевых систем управления интеллектуальными мобильными роботами. Сделан вывод о перспективности аппаратно-программно-аппаратного подхода. В качестве примера этого подхода рассмотрена аппаратная реализация нейросетевого акселератора ЭВМ на базе перeпрограммируемой пользователем вентильной матрицы Altera EP3C16F484C6N семейства Cyclone III.

Бионический метод управления; нейросеть; мобильный робот.

U.V. Chernukhin, R.V. Saprykin, P.A. Butov INTELLECTUAL MOBILE ROBOTS NEURAL NETWORK CONTROL SYSTEMS APPROACH IMPLEMENTATION

Questions under examination are the following: hardware, software, hardware-software and hardware-software-hardware approaches to build intellectual mobile robots neural network control systems. Hardware-software-hardware approach was considered to be perspective. As an example, we described a hardware implementation of neural network accelerator based on FPGA Altera EP3C16F484C6N of Cyclone IIIfamily.

Bionical control method; neural network; mobile robot.

Построение интеллектуальных систем управления мобильными роботами является актуальным направлением исследований в современной науке, так как существующие в настоящее время подобные системы решают далеко не все функции естественного интеллекта высших животных и человека.

Интеллектуальные системы управления строятся на основе методов нечеткой логики, теории автоматического управления, нейронных сетей и т.п. Каждый из этих методов имеет свои преимущества и недостатки в зависимости от конкретного применения. Наиболее перспективным из них является нейросетевой подход, поскольку нейронные сети используют методы параллельной обработки информации и пытаются воспроизводить процессы, происходящие в нервной системе человека и животных.

В данной статье рассматриваются подходы к построению нейросетевых систем, реализующих бионический метод адаптивного управления мобильными роботами, теоретические основы которого изложены в монографии [1]. Этот метод позволяет строить эффективные системы интеллектуального управления и решать проблемы автоматической генерации оптимальных траекторий движения мобильных роботов к целевым объектам в априори неформализованной и динамически изменяющейся внешней среде.

Первые экспериментальные исследования бионического метода были проведены в 70-х годах XX века. Они проводились на специализированных аппаратных

системах нейросетевого типа. Использование аппаратной реализации позволяло таким системам принимать решения о направлениях будущего движения не только в реальном времени, но и со значительным его опережением. Проведенные эксперименты показали, что реализуемый ими бионический метод вполне работоспособен и может эффективно использоваться для решения задач управления движением автономных мобильных роботов. Однако специализированная аппаратная реализация не позволяла проводить экспериментальные исследования различных нейросетевых конфигураций при различных типах сенсорных устройств, поскольку в этом случае возникала необходимость больших финансовых и организационных затрат.

Для устранения отмеченных трудностей было принято решение о создании программных нейросетевых систем управления, реализующих те же принципы на базе современных компьютерных технологий с использованием так называемой агентной технологии, что позволило перейти к построению виртуальных моделирующих сред (ВМС). Удобство использования ВМС состоит в том, что они позволяют достаточно легко изменять параметры как нейросетевых систем управления роботов, так и условия их функционирования. Причем роботы в данном случае рассматриваются как интеллектуальные агенты (ИА), способные воспринимать окружающую среду при помощи бортовых датчиков, образующих их сенсорную систему, и планировать перемещение к цели на единичном шаге при помощи ней-росетевого модуля.

Примером такой ВМС может служить система виртуального моделирования поведения интеллектуальных агентов NAME [2], реализующая нейросетевое управление ими. Структура этой системы представлена на рис. І.

Рис. 1. Структурная схема ВМС NAME

Благодаря модульной архитектуре, ВМС NAME может поддерживать расширение функций системы за счет подключения дополнительных модулей.

Одна из задач, решаемая при помощи данной моделирующей среды, может быть описана следующим образом. На виртуальный полигон, представляющий собой площадку с определенным образом размещенными препятствиями и целевым объектом, помещается ИА. Функционирование агента состоит в перемещении к целевому объекту по автоматически генерируемой им оптимальной траектории на основании информации о проходимости локальных участков среды, попадающих в поле зрения его сенсорной системы.

Проведенные при помощи системы NAME экспериментальные исследования показали, что программная реализация бионического метода адаптивного управления эффективно решает задачу построения оптимальной траектории движения робота на каждом шаге функционирования. Однако у этой системы моделирования имеется недостаток, заключающийся в том, что помимо эмуляции самого ал-

горитма поведения ИА в ней необходимо воспроизводить свойства как внешней среды, так и находящихся в ней объектов, а также эмулировать работу сенсорных подсистем различных типов, что существенно влияет на точность моделирования.

Метод устранения этого недостатка состоит в применении аппаратнопрограммного моделирования, позволяющего исследовать алгоритмы интеллектуального управления в естественной среде [3]. Его суть состоит в том, что модуль нейросетевого планирования (МНП), как и в случае ВМС, реализуется программным способом на стационарной ЭВМ общего назначения, а в качестве аппаратной части используется мобильный робот, представляющий собой подвижную платформу с установленными на ней: бортовым контроллером, интерфейсом для связи со стационарной ЭВМ и сенсорной подсистемой. Структурная схема данного аппаратно-программного комплекса, построенного на базе робота Hemisson, приведена на рис. 2.

5* Сенсорная подсистема (видеокамера)

Робототехнический комплект Hemisson

Эффекторная подсистема (двигатели)

Радиоканал

Bluetooth

Подсистема формирования модели внешней среды

Блок оцифровки изображения

Ж

Блок фильтрации изображения

Ж

Блок выделения препятствий и целей

Блок формирования команд робота

Программная

часть

комплекса

%>

Программный

модуль

нейросетевого

планирования

Рис. 2. Структурная схема аппаратно-программного комплекса

Алгоритм функционирования такого аппаратно-программного комплекса может быть описан следующим образом. Информация о внешней среде фиксируется видеокамерой и передается на ЭВМ по радиоканалу. Далее она преобразуется в карту среды путем выделения препятствий и целевых участков по критерию светимости: темные участки классифицируются как препятствия, яркие - как цели, а остальные участки считаются проходимыми. После этого на карте средствами программного МНП выделяется оптимальное направление перемещения к цели. Завершающим этапом работы алгоритма является преобразование полученного направления движения в команды бортового контроллера мобильного робота, передача его кода по радиоканалу подвижной платформе и выполнение ею единичного перемещения в данном направлении. Далее цикл повторяется вплоть до достижения цели.

В процессе натурного моделирования был проведен ряд экспериментов, суть которых состояла в следующем. Был воссоздан реализованный в среде NAME полигон, представляющий собой светлую поверхность размерами 2х1,5 метра. На полигоне произвольным образом располагались препятствия в виде прямоугольников из черной бумаги и целевой объект - светящаяся лампа. Наряду с успешным решением задач планирования траекторий, результаты проведенных экспериментов выявили ряд недостатков программной реализации МНП и, прежде всего, ее низкое быстродействие.

Данное обстоятельство привело к необходимости проведения исследований, касающихся возможности применения более производительных аппаратных МНП,

реализующих акселерацию нейровычислений. С этой целью был разработан аппаратно-программно-аппаратный комплекс управления мобильными роботами. Структурная схема такого комплекса повторяет схему, изображенную на рис. 2, за исключением того, что нейровычисления в нем проводятся при помощи подключенного к ЭВМ аппаратного акселератора.

Аппаратная реализация такого акселератора основана на технологии ПЛИС и была выполнена на базе перепрограммируемой пользователем вентильной матрицы Altera EP3C16F484C6N семейства Cyclone III. В основе этой аппаратной реализации лежит использование алгоритма генерации волн возбуждения на нейропро-цессорной сети, отображающей план среды [1]. Структурная схема разработанного модуля представлена на рис. 3.

Рис. З. Структурная схема аппаратного акселератора нейровычислений

Интерфейсный блок акселератора служит для связи со стационарной ЭВМ. В силу особенностей использовавшейся для его реализации отладочной платы (Terasic DEO), в качестве интерфейса обмена данными использовался RS-232. Алгоритм, реализуемый генератором адреса, позволяет без дополнительной буферизации проецировать информацию о внешней среде, поступающую из интерфейсного блока, в распределенную память нейросети. Последовательность процессов, происходящих в нейроэлементах управляющей нейросети, задается блоком управления. Сама нейронная сеть представляет собой квадратную матрицу 30х30 нейроэлементов, реализующих функцию формальных нейронов, структурная схема каждого из которых приведена на рис. 4.

Информация о функции нейрона из сенсорной подсистемы

Разрешение записи О Сброс памяти О Тактирующий сигнал О

Выходы соседних нейронов

Регистр хранения информации о нейроне

Функция препятствия

Функция цели

Устройство

задержки

Выход нейрона

Разрешение работы нейросети

Информация о коэффициенте задержки из сенсорной подсистемы

Рис. 4. Структурная схема реализации нейроэлемента акселератора

Приведенная на рис. 4 схема нейроэлемента позволяет автоматически воспроизводить необходимые свойства целевых (генерация волны возбуждения), запрещенных (непроводимость элемента) и свободных участков среды (проводимость элемента). Для свободных участков при этом реализован механизм задержек. Численно определяемые задержки моделируют такие свойства участков внешней среды, которые требуют дополнительных, энергетических и временных затрат при их прохождении (трава, песок, лужи и т.п. ) мобильным роботом.

Входящие в состав схемы нейроэлемента компоненты памяти позволяют сохранять информацию о реализуемой функции нейроэлемента на каждом временном шаге работы устройства. Совокупность этих компонент в аппаратно реализованной нейросети образует ее распределенную память.

Определение оптимального направления движения в данном акселераторе выполняется блоком многостабильного триггера. Алгоритм функционирования данного блока заключается в определении и фиксации направления градиента фронта волны, распространяющейся в нейронной сети [1].

Реализованная па ПЛИС архитектура акселератора нейровычислений, благодаря параметризируемости входящих в ее состав блоков, легко масштабируется. Максимально возможный размер нейросети напрямую зависит от количества логических ячеек, входящих в состав используемой программируемой вентильной матрицы и может быть рассчитан по формуле

n=

к • l

N

(1)

где l - количество логических ячеек в вентильной матрице, N - количество логических ячеек, задействованных в схеме одного нейроэлемента, а коэффициент k определяет процент тех ячеек, которые могут быть использованы на реализацию нейросети, если на реализацию обслуживающих нейросеть блоков требуется (100-^) % ячеек ПЛИС. Для данной реализации акселератора формула (1) принимает вид

n =

0,85 — 14

= ]0,06 • I [ = 910, (2)

поскольку для выбранного варианта построения обслуживающей части нейросети потребовалось 15 % ячеек ПЛИС.

Оценить максимальное время вычислений в акселераторе оптимального направления движения на одном шаге c учетом затрат на обмен данными с ЭВМ можно при помощи следующей формулы:

8(n +1) 0,625 • n • Z

t = —------ + —----------max, (3)

S F

где n - количество нейроэлементов в сети, S - скорость передачи данных (бит/с), F - частота работы акселератора, Zmax - максимальный коэффициент задержки нейроэлемента.

Исследование работоспособности и эффективности разработанного акселератора нейровычислений было выполнено сначала на виртуальной моделирующей среде NAME, а затем и в составе описанного аппаратно-программно-аппаратного комплекса. В ходе экспериментов акселератор работал на частоте 50 МГц, скорость обмена данными с ЭВМ составляла 115 200 бит/с, максимальный коэффициент задержки был равен 4. При таких параметрах максимальное время работы акселератора на каждом шаге алгоритма, в соответствии с приведенной выше формулой, составляло 62,5 мс, что в 2,4 раза меньше, чем в случае программной реализации (150 мс). При этом, в отличие от программной реализации, аппаратный акселератор нейровычислений обладает значительным потенциалом для увеличения быстродействия за счет повышения тактовой частоты его работы и использования более быстрого интерфейса передачи данных. Так, например, использование для обмена данными с ЭВМ интерфейса USB 2.0 в режиме Full-speed (12 Мбит/с) сокращает время работы акселератора до 0,65 мс на каждом шаге алгоритма, что уже в 230 раз быстрее результатов программной реализации нейросети.

Такой прирост быстродействия нейровычислений позволит уже в ближайшее время строить системы, способные оптимизировать не только траектории, но и скорости перемещения робота к целевому объекту. Базироваться такие системы могут на алгоритмах прогнозирования поведения робота, предполагающих многократное обращение к нейровычислителю на каждом шаге работы алгоритма [1]. Последнее обстоятельство является весьма актуальным в случае работы роботов в трехмерном пространстве (космос, воздушная и подводная среды).

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Чернухин Ю.В. Нейропроцессорные сети. - М.: Изд-во ТРТУ, 1999. - 439 с.

2. Чернухин Ю.В., Сапрыкин Р.В. Система виртуального моделирования поведения интеллектуальных агентов при исследовании ими естественной среды функционирования // Известия ЮФУ. Технические науки. - 2008. - № 11 (88). - C. 19-24.

3. Чернухин Ю.В., Сапрыкин Р.В., Романчак Е.И., Доленко Ю.С. Программно-аппаратное моделирование внешней среды функционирования мобильных роботов с нейросетевым управлением на базе робототехнического комплекта Hemisson: Материалы XV Международной конференции по нейрокибернетике. Т. 2. - Ростов-на-Дону: Изд-во ЮФУ, 2009. - C. 212-215.

Статью рекомендовал к опубликованию к.т.н. С.Н. Писаренко.

Чернухин Юрий Викторович

Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.

E-mail: chemukhin@dce.tsure.ru.

347928, г. Таганрог, пер. Некрасовский, 44.

Тел.: 88634371656.

Кафедра вычислительной техники; профессор.

Сапрыкин Роман Владимирович

E-mail: rsaprykin@gmail.com

Кафедра вычислительной техники; ведущий инженер.

Бутов Павел Александрович

E-mail: pbootoff@gmail.com

Кафедра вычислительной техники; студент.

Chernukhin Yuri Victorovich

Taganrog Institute of Technology - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”.

E-mail: chernukhin@dce.tsure.ru.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

44, Nekrasovskiy, Taganrog, 347928, Russia.

Phone: +78634371656.

Department of Computer Engineering; Professor.

Saprykin Roman Vladimirovich

E-mail: rsaprykin@gmail.com

Department of Computer Engineering; Engineer.

Butov Pavel Alexandrovich

E-mail: pbootoff@gmail.com

Department of Computer Engineering; Student.

INTELLECTUAL MOBILE ROBOTS NEURAL NETWORK CONTROL SYSTEMS APPROACH IMPLEMENTATION

Текст научной работы на тему «Подходы к реализации нейросетевых систем управления интеллектуальными мобильными роботами»