Научная статья на тему 'Нейросетевой алгоритм самообучения интеллектуальных агентов, изучающих свойства среды функционирования'

Нейросетевой алгоритм самообучения интеллектуальных агентов, изучающих свойства среды функционирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
229
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Чернухин Ю. В., Сапрыкин Р. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нейросетевой алгоритм самообучения интеллектуальных агентов, изучающих свойства среды функционирования»

Рис.3. Результаты эксперимента: а) ошибка вычисления; б) результат эксперимента при накоплении остатка

Отметим, что изменение функции происходит в виде пилообразной прямой (новое значение не изменяется, пока сумма остатков не помещается в мантиссе), что косвенно подтверждает правильность работы метода.

Ю.В. Чернухин, Р.В. Сапрыкин НЕЙРОСЕТЕВОЙ АЛГОРИТМ САМООБУЧЕНИЯ

,

СРЕДЫ ФУНКЦИОНИРОВАНИЯ

На сегодняшний день построение управляющих систем для мобильных роботов, способных самостоятельно функционировать в условиях постоянно меняющейся внешней среды, остается актуальной проблемой. Суть этой проблемы состоит в том, что для эффективного взаимодействия робота со средой ему необходимо строить собственную внутреннюю модель внешнего мира. Для построения данной модели роботу необходимо иметь как можно больше информации о среде и

о свойствах отдельных объектов этой среды. Также робот должен обладать некоторым уровнем интеллекта, чтобы адекватно реагировать на ситуации в среде. От-

( ).

роботы являются довольно сложными системами и количество их типов велико (шагающие, колесные, летающие, манипуляторы и т.д.), то в последнее время при изучении таких систем широкое распространение получил агентный подход [1]. В соответствии с этим подходом, при представлении ИМР в качестве интеллекту-( ),

, .

агентный подход не препятствует распространению теоретических результатов на реальные робототехнические системы, снабженные физически реализованными сенсорными и эффекторными устройствами.

Со второй половины 80-х годов в области искусственного интеллекта появился принципиально новый метод построения систем искусственного интеллекта, существенно отличающийся от предыдущих. Данный метод заключается в том, чтобы имитировать те способы принятия решений, которые предположительно используются животными в их естественной среде обитания. В работах [2,3] пока-

, , , как исследование поверхности планет в условиях, когда время и ресурсы ограни, , , цель исследования сформулирована нечетко. Способность к адаптации позволяет агенту приспосабливаться к изменяющимся условиям внешней среды. Основой адаптации является самообучение. Агент, подобно животному, должен сам учиться на своих ошибках и в дальнейшем не совершать их в процессе функционирования.

При построении адаптивных систем необходимо разрабатывать алгоритмы исследования свойств внешней среды, а также свойств объектов среды. Такие системы опираются на знания, накопленные в процессе функционирования, и должны иметь способность к выводу новых знаний из имеющихся. Однако эффективных методов, полностью решающих подобные проблемы, пока не существует.

Поэтому в рамках данной работы предпринята попытка частичного решения .

подход, т.к., в отличие от классических, он обеспечивает: обучаемость системы и способность решать плохо формализованные задачи. За основу взяты нейропроцес-сорные управляющие сети с самообучением и самоорганизацией, описанные в [4].

Суть работы состоит в разработке нейросетевых алгоритмов управления, с помощью которых агент, помещенный в некоторую незнакомую среду, мог бы исследовать ее и изучать свойства ее элементов. Под исследованием понимается восприятие информации о внешнем мире с помощью тактильных датчиков. А под изучением свойств - выявление закономерностей, обобщение и, в конечном итоге, извлечение знаний из полученной с помощью датчиков информации для дальнейшего применения в процессе функционирования.

Рассмотрим задачу перемещения автономного агента, выполняющего функцию автономного интеллектуального робота, по поверхности малоизученной планеты. Его нейросетевая система управления может быть, конечно, обучена в земных условиях на специальных полигонах, построенных на основе данных, полученных при удаленном исследовании планеты. Но в процессе функционирования агента непосредственно на планете характеристики некоторых участков поверхно-( , ) , -ставления о них в земных условиях. Поэтому нейросетевая система управления такого агента должна уметь дообучаться в реальных условиях. Дообучение позволит избегать в будущем использование нерациональных стратегий поведения.

В ходе работы необходимо разработать и протестировать алгоритмы, позволяющие интеллектуальному агенту распознавать характеристики участков среды для дальнейшего рационального использования этих данных в процессе функционирования. Предполагается, что у агента есть подсистема, эмулирующая бортовую , , находящегося перед агентом. У различных участков среды есть свои характери.

,

на изменение скорости перемещения агента. Причем зависимость коэффициента проходимости от типа участка, а так же количество типов участков заранее не из.

В [4] предложена общая структура нейросетевой системы управления (НСУ) , : , -дели внешней среды, системы афферентного синтеза, системы принятия решений и

.

структурную схему системы можно представить в следующем виде (рис.1).

Рис.1. Структурная схема системы управления ИА с блоком самообучения

На рисунке (см. рис.1) жирными стрелками показаны потоки данных, а тонкими - управляющие сигналы. Блок самообучения включается в работу в двух случаях: если тактильная подсистема наткнулась на неизвестный объект, либо кластеризующая нейросеть не может четко определить текущий участок среды.

Для второго случая используется следующий алгоритм. Полученное с помощью подсистемы эмуляции камеры изображение частично обрабатывается и подается на обучаемую нейросеть. Далее нейросеть ставит в соответствие данному изображению коэффициент проходимости. Для упрощения принято, что каждый участок среды имеет свой цвет. Если нейросеть не может определить проходимость среды по поданному на нее изображению, то агент определяет ее по изменению .

коэффициента проходимости происходит дообучение нейросети. Таким образом, по прошествии некоторого времени функционирования, агент уже будет знать о характеристиках различных участков поверхности. Блок-схема алгоритма работы блока самообучения представлена на рис.2.

Рис. 2. Блок-схема алгоритма блока обучения

Для реализации данного алгоритма необходимо решить проблему кластеризации изображений участков среды. Именно в задачах такого типа хорошо зарекомендовала себя искусственная нейронная сеть Кохонена, которая и была использована в работе.

Общий алгоритм функционирования агента с учетом самообучения показан на рис.3.

Рис.3. Общий алгоритм функционирования агента

Так же в процессе изучения среды агентом предполагается динамически строить семантическую сеть, представляющую собой базу знаний, в которой участки поверхности классифицируются в зависимости от коэффициента проходимости. Примером такой базы знаний могут служить, например, данные следующего вида:

♦ непроходи мые участки: камни;

♦ частично-проходимые участки: песок, глина;

♦ проходим ые участки: плотный грунт.

Так как радиус действия сенсорной подсистемы агента в общем случае меньше области функционирования и среда априори не известна, то агенту необходимо строить карту местности в процессе изучения среды.

Вся эта информация поможет агенту более эффективно выполнять поставленные перед ним задачи, используя более рациональные стратегии поведения для достижения поставленных целей.

Описанные выше алгоритмы были реализованы в программной оболочке, позволяющей производить моделирование интеллектуальных агентов. Внешний вид программной оболочки представлен ниже на рис.4.

Рис.4. Внешний вид программной оболочки

Она состоит из основного поля программы и меню управления.

На рисунке (см. рис.4) цифрами показаны следующие элементы: 1 - часть поверхности, покрытая камнями; 2 - часть поверхности, покрытая водой; 3 - часть поверхности, покрытая песком; 4 - часть поверхности, покрытая глиной; 5 - интеллектуальный агент (робот); 6 - подсистема, эмулирующая видеокамеру; 7 -подсистема, эмулирующая сенсорную подсистему; 8 - целевой объект.

Программная оболочка позволяет создавать, редактировать, сохранять и загружать различные сцены. После добавления объекта в сцену задается тип объекта и коэффициент его проходимости. Для упрощения имеется четыре типа объекта (вода, песок, глина и камни). Коэффициент проходимости - это целое число (от 0 до 100), показывающее проходимость объекта в процентах.

С помощью меню управления можно проводить следующие действия:

1. Запуск/останов режима исследования методом случайного блуждания.

2. Запуск/останов режима исследования методом обхода всего доступного

.

3. / .

4. .

5. ( . .).

6. , -.

Рассмотрим данные действия подробнее:

1. -

ждание, т.е. случайная смена движений прямо и поворотов, часто приме-

, , .

2. -

ство на квадраты и последовательно объезжает каждый такой участок;

1 2 - . ,

- , , из видов в семантической базе знаний, а так же наносит его на карту.

1. . -

обходимо достичь цели, огибая препятствия. При этом используются зна-

, 1 2;

2. , ;

3. ( -

димости агента). Внешний вид данного окна представлен на рис.5.

2Si

Semantic Network: Enviroment

B Semantic Network Passable Objects | L water

B Partly passable Objects j dirt sand

&• Not passable Objects :•••• stone

OK I j Cancel I

Рис.5. Окно параметров агента

.6. -

.

Рис. 6. Карта, построенная агентом

Предложенные алгоритмы были протестированы на различных наборах входных данных и показали хорошие результаты, что позволяет эффективно решать некоторые частные случаи описанных выше проблем.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Смирнов А.В., Шерематов Л.Б. Многоагентная технология проектирования сложных систем // Автоматизация проектирования, № 3, 1998.

2. Непомнящих В.А. Поведение "аниматов" как модель поведения животных // Институт биологии внутренних вод РАН, Борок.

3. . . , .

4. Чернухин Ю.В. Нейропроцессорные сети: Монография. - Таганрог: Изд-во ТРТУ, 1999. - 439 с.

Robot Parameters

i60

i Надоели баннеры? Вы всегда можете отключить рекламу.