УДК: 004.75
ОРГАНИЗАЦИЯ ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ ДЛЯ АВТОНОМНЫХ БЕСПИЛОТНЫХ МАШИН
Е.А. Семенчев, Е.В. Тимошина
Рассматривается один из подходов к организации процесса целесообразного поведения интеллектуальных систем - метод декомпозиции по двойственным парам. Данный подход способен осуществлять анализ и контроль потребностей объекта, в том числе формирование вектора целей, слежение за границами параметров двойственных пар объекта, накопление нереализованных потребностей.
Ключевые слова: двойственная пара, декомпозиция по двойственным парам, автономные беспилотные машины, целесообразное поведение.
Технологии искусственного интеллекта (ИИ) всегда были тесно связаны с робототехникой. Создание роботов - машин, способных самостоятельно действовать как человек, является актуальной задачей. Здесь нужно упомянуть космических роботов для изучения поверхности небесных тел Солнечной системы, роботов для подводных исследований. В ходе борьбы с терроризмом возникла острая необходимость в роботах, предназначенных для разминирования подозрительных предметов в местах скопления людей. Нужны «умные» роботы, которые могут без помощи оператора тушить пожары, самостоятельно передвигаться по заранее неизвестной пересеченной местности, выполнять спасательные операции во время стихийных бедствий, технологических аварий и т.п. Для создания машины с целесообразным поведением исследуются и предлагаются механизмы адаптивного управления. Так, например, направление исследования «Адаптивное поведение» использует феноменологический подход к исследованиям систем управления адаптивным поведением. Поведение анимата считается адаптивным, если система управления поддерживает жизненно важные переменные анимата в допустимых пределах [1]. Однако адаптивное поведение имеет более узкий смысл по отношению к целенаправленному поведению.
Как показано в [2], метод декомпозиции по двойственным парам является одним из универсальных подходов к изучению и построению процесса целесообразного поведения интеллектуальных машин. В данной работе предложена модель целесообразного поведения безлюдного автономного объекта, основанная на методе декомпозиции объектов по двойственным парам (ДП).
Объект как целое обладает изначальной внутренней мультидвойст-венностью, которую по закону сохранения и эволюции двойственных отношений (см. например, [2]) можно разложить на двойственные пары
взаимодополняющих друг друга крайностей. В дальнейшем для организации целесообразного поведения объекта используется двойственное понятие «потребность - цель».
В данной работе в качестве объекта исследования был выбран активный беспилотный модельный объект, обладающий аккумуляторами с солнечными батареями в качестве источника питания, механизмами движения и электронными термометрами, контролирующими температуру окружающей среды и внутренних агрегатов. Также внешние термометры используются для определения направления движения объекта.
Предметом исследования являлись его возможности для самоподдержания условий функционирования в автономном режиме существования. Образ окружающей среды формируется путем перемещения по поверхности и исследования ее для определения координат тени от внешних объектов. Беспилотная платформа имеет внутренние потребности в заряде аккумулятора от солнечной энергии и приемлемой температуре внутри платформы при продолжительном пребывании на солнце. При перегреве платформа перемещается на плоскости, пытаясь понизить температуру, или ищет тень во внешней среде.
На рис. 1 представлено окружающее пространство, в котором действует активный объект и приведена схема расположения электронных
термометров: в центре размещен внутренний термометр, а по сторонам -внешние. Солнечные элементы расположены по полусферической поверхности для поддержания напряжения на них в течение наибольшего време-
Рис. 1. Схема окружающего пространства планирования и расположения термометров на активном объекте
Внешняя среда представлена следующими объектами:
- объект Солнце, который движется с постоянной скоростью по заданной траектории и излучает энергию.
- объект навес, который создает тень от объекта Солнце.
В структуре платформы присутствуют подсистемы самообеспечения энергией, самосохранения и самоуправления. Система самоуправления способствует их взаимодействию, определению внутренних потребностей активного объекта в энергии и температурном режиме, поддержанию их на достаточном уровне и сохранению от излишних внешних воздействий.
Анализ и управление потребностями активного объекта являются частью подсистемы самоуправления (СС), которая является одной из основных подсистем активного объекта.
Анализ и управление потребностями включает решение следующих
задач:
- формирование вектора целей;
- накопление нереализованных потребностей;
- анализ потребностей;
- слежение за границами текущих параметров состояния ДП объекта.
Функционирование на уровне ДП - это постоянное колебание состояния от одной границе к другой. Гармоничный баланс отношений между крайностями - это эталон, с которым сравнивается текущее состояние Х для принятия решения к последующим действиям.
Сформирован следующий универсальный алгоритм реализации потребностей в системе самоуправления.
1. Вычисление потребности П каждой i-й из N двойственной пары: n(t) = - (X(t) - 0,618), (min ni < ni(t) < max ni), (i=1,2...N).
2. Инвертирование потребности и сохранение результата в памяти системы самоуправления
\\Пг (t)|| ®-||Пг (t)|| = П (t).
3. Построение виртуальной ДП (ВДП) в памяти СС на основе закона двойственных отношений
(П£))-(П ¡(t)).
4. Поиск в памяти активного объекта дополнительной информации о внешнем ресурсе, способном удовлетворить потребность, для расширения информационного содержания инвертированного полюса ВДП за счет найденных в памяти и инвертированных (пространственно-временных {x0,y0} —^ {x?,y?}) измеряемых характеристик активного объекта.
5. Формирование информационного содержания целевого поискового образа, как конъюнкции необходимых для поиска параметров
Ц г = (П г) а (хг, y) А....
6. Формирование в памяти СС из целевых поисковых образов «пространства желаний» О. В нем цели упорядочены по приоритетам, определяемым близостью текущего состояния к тому или иному полюсу соответствующей шкалы чувства. Чем ближе к граничному значению того или другого полюса ДП, тем сильнее «мотив» М для реализации цели:
М(1) = Хг (г), если Хг (г) < 01,
М(2) = 1 - X (г), если Х1 (г) > 0
2 -
где ©ь ©2 - нижний и верхний пороги, отделяющие зону жизненно необходимых потребностей от рабочего диапазона ДП,
("М € М^)(ДП1((М) € О),("М е Мг(2))(ЦП,(М) € а),к = 1К,
где К - общее количество целей в области О.
Первой начинает обрабатываться цель, для которой выполняется условие
Ц
к
П (М)
М = шт(М(1),М(2)).
Для выделенного поискового образа осуществляется динамическое планирование действий. Подготавливается первичный план, выделяются необходимые сенсорно-эффекторные ресурсы. В оперативную память загружается первичный сценарий образа действий, который может корректироваться в реальном времени в зависимости от результатов реализации цели.
Осуществляются реализация плана и оценка результата достижения цели. При наличии существенной разницы
П г (г) - П К\<6,
где Щ - реальный найденный ресурс, 5 - приемлемая ошибка в достижении цели (степень удовлетворения), весь цикл управления достижением цели повторяется, если к этому времени не активизируются более насущные потребности.
Поведение активного объекта реализуется приведенными системами, которые формируют целевые поисковые образы. Если создается определенная мотивация, возникшая в результате конкуренции потребностей, то поведение объекта меняется с тем, чтобы удовлетворить соответствующую потребность. Таким образом, можно говорить о целесообразном поведении.
Примерный алгоритм управления потребностями активного объекта представлен на рис. 2.
Входными параметрами для подсистемы анализа потребностей для данного объекта являются:
- температура объекта внутреннего электронного термометра;
- энергетический уровень.
Рис. 2. Алгоритм управления потребностями активного объекта
226
Данные показатели нормируются и находится оптимальное значение по золотому сечению между граничными значениями - т.н. эталон.
Исходными данными для активного объекта являются:
- температура объекта и окружающей среды;
- положение объекта на жизненном пространстве;
- энергетический уровень;
- мощность на солнечных батареях.
Выходными данными будут являться целевые поисковые образы «пространства желаний» и цель с высоким приоритетом, которая требует планирования действий.
Для подсистемы анализа и управления потребностями объекта разработана следующая база данных (рис. 3).
Now value
Resource Value
Рис. 3. Схема данных для подсистемы анализа потребностей
В данной схеме для хранения данных об активных объектах используется таблица Activ Objects (активные объекты), которая на данный момент содержит только одно поле - имя объекта. Данное поле является ключевым. Имена объектов используются в таблице Device (устройство). Таблица устройств в настоящее время хранит только названия устройств, которыми обладают объекты. Таблица Limiting value (предельные значения) содержит информацию о минимальных и максимальных значениях для ресурса, которым обладают устройства объектов. Для хранения информации с внешних термометров используется таблица Now Tempereture.
Для системы анализа и управления потребностями объекта была разработана таблица для хранения промежуточных данных о текущих характеристиках объекта (таблица Now value (текущее значение)). Такими характеристиками являются:
- энергетический ресурс объекта;
- температура внутреннего датчика.
Приведенные таблицы заполнены необходимыми данными для расчета и управления потребностями объекта. Записи в таблицах представлены на рис. 4.
Now Temperature 1 1 Limiting values
Resotrce Resotrce
Value Max
DO Min
Device
Device / *
1 S Aktiv Objects
MameDevice — с» 1
ObjectKey 1 NameObject
1
Рис. 4. Схема данных для подсистемы анализа потребностей
При указанных входных данных были рассчитаны значения потребностей, инвертированные значения потребностей, значения мотивов и цель. На рис. 5 представлены результат расчета потребностей и нахождение первоначальной цели объекта.
В верхней части представлены значения входных данных, а в нижней - промежуточные значения и значение конечной цели, а также действие, которое необходимо выполнить для удовлетворения потребности.
Произведем расчет значений для конечной цели (для ресурса энергии).
Введем граничные значения входной информации: максимальное значение (maxx) = 10000 Ач, минимальное (min x )= 0 Ач.
Минимальные и максимальные значения потребностей Maxni = 0,236 и Minni = -0,236. Текущее значение энергии (x(t)) 1000 Ач.
Рассмотрим более подробно работу алгоритма. Изначально входная информация о состоянии объекта нормируется по формуле
X (t) = (x(t) - min x) . (max x - min x)
Тогда R(t)=X1(t)=(1000-0)/(10000-0)=0,1.
Вычисление потребности двойственной пары: n1(t) = - (X1(t)- 0,618)=0,518, (min П1 < n1(t) < max П1), (0 < 0,518< 0,236).
В данном случае ограничения не выполняются для потребности. Следовательно, запас энергии на исходе.
Инвертирование потребностей и сохранение результата в памяти системы самоуправления:
\\т)|| ® U1(t)|| = Ü1(t); ||0,518|| ® -0,518| = ^(t).
Построение виртуальной ДП в памяти СС на основе закона двойственных отношений:
№(1))--(П!(!));
||0,518||--110,518||.
Формирование информационного содержания целевого поискового образа как конъюнкции необходимых для поиска параметров:
Ц1 = - 0,518
Рассчитаем «мотив» М для упорядочивания целей по приоритетам: М 1(1) = X^),если X^) <0Ь
М 1(1) = 0,1,если 0,1 < 0,16,
где ©ь ©2 - нижний и верхний пороги, отделяющие зону жизненно необходимых потребностей от рабочего диапазона ДП; ©1 = 0,16; ©2 = 0,84.
Первой начинает обрабатываться цель, для которой выполняется условие
к
ЦП / (M)
M = min (mPm(2)) Г /el, N 1
Ц П 1( M) = min(0,1).
Calculation
Исходные донные
И &
Координать объекта <Г~ IF
Координать та™ 'I® Iй
Координать ■Солнца ifi F
Мощность на батареях Г1М
¡Value
Температура
Энергия
О 1000
Площадь действий
Выход
Resource Value Down 1 Value Up 1 lvalue Down 2 |Value Up 2 j
Температура 1 10 15 20 25
Температура 2 20 25 10 15
Температура 3 20 25 10 15
Температура 4 10 15 20 25
Размер тени
Закрыть
для потребностей -0.236; 0.236
ДЛЯ ЛЛОТИЗОЭ <0.16 >0.84
Расчет
|Инв. потребность [значение мотива {максимальное значе\минимальное значе*[~
¡Текущеезначение [Потребность 0,5000 0.11ВО
2 Энергия 0,1000 0,5130 ■0,5180 0,1000 10000,0000 0,0000
Цель Энергия 0,1000 0,5130 ■0,5 ISO 0,1000 10000,0000 0,0000
1 ¡Температура 1 Температура 2 Температура 3 Температура 4 1
Верхняя 25,0000 15,0000 25,0000 15,0000
Нижняя 20,0000 10,0000 20,0000 10,0000
Экерта Заряд аккумулятора Солнечная батарея
Рис. 5. Результат реализации алгоритма анализа и управления потребностями
Таким образом, построен алгоритм целесообразного поведения объекта, основанный на законе сохранения двойственных отношений. Принятие решений для достижения целей осуществляется путем анализа внутренних и внешних потребностей автономной платформы, формирования виртуальных двойственных пар и преобразования их инвертированных полюсов в целевые поисковые образы.
Список литературы
1. Бурцев М.С., Гусарев Р.В., Редько В.Г. Исследование механизмов целенаправленного адаптивного управления // Изв. РАН. Теория и системы управления. 2002. №6. С.55-62.
2. Семенчев Е.А. Системный анализ и синтез искусственных живых машин: двойственный аспект. Тула: Изд-во ТулГУ, 2013. 252 с.
Тимошина Елена Васильевна, бакалавр, [email protected], Россия, Тула, Тульский государственный университет,
Семенчев Евгений Александрович, канд. техн. наук, доц., [email protected], Россия, Тула, Тульский государственный университет
ORGANIZATION EXPEDIENT BEHA VIOR FOR A UTONOMOUS UNMANNED
VEHICLE
E.A. Semenchev, E. V. Timoshina
One of the approaches to the process of purposeful behavior of intelligent systems -decomposition method for dual pairs is considered. This approach is capable of analysis and control requirements of the object, including the formation of the vector targets tracking outside the parameters of dual pairs of objects accumulated unrealized needs.
Key words: dual vapor decomposition by dual pairs, autonomous unmanned machines, expedient behavior.
Timoshina Elena, bachelor, antan 72@mail. ru, Russia, Tula, Tula State University,
Semenchev Evgeniy Aleksandrovich, candidate of technical sciences, docent, [email protected], Russia, Tula, Tula State University