УДК 621.398 Р336 DOI: 10.17586/0021-3454-2015-58-8-600-605
ПОВЕДЕНИЕ АГЕНТА, ЗАДАННОЕ ЛОГИСТИЧЕСКИМ ОТОБРАЖЕНИЕМ
А. Б. Бушуев1, В. С. Воробьев1, С. П. Томашевич1, О. К. Мансурова2, А. А. Кульчицкий2
1Университет ИТМО, 197101, Санкт-Петербург, Россия E-mail: [email protected]
2Национальный минерально-сырьевой университет „Горный", 197101, Санкт-Петербург, Россия
Рассматривается поисковый алгоритм в системе трехмерного пространственного слежения, основанный на биологических подходах. В качестве системы слежения выступает поисковый агент в поле некоторой пространственной функции. Задача агента — нахождение области экстремума этой функции. Поведение агента задается логистическим отображением. Проводится моделирование поведения поискового агента, действующего согласно предложенному алгоритму поиска. Для оценки качества движения агента используется норма вектора координат отклонения агента от объекта поиска.
Ключевые слова: случайный поиск, пространство, интеллектуальный агент, гомеостат, логистическое отображение.
Введение. Поиск в плоскости. Известны различные алгоритмы пространственного поиска, применяемые в технических системах [1—4], характеризующиеся четкими правилами выбора действий, планированием и построением модели поиска. Недостатком таких алгоритмов является необходимость анализа больших объемов информации об объекте и окружающей среде. Для устранения этого недостатка в технических системах используются так называемые „природные вычисления" [5, 6] — алгоритмы, основанные на функционировании биологических систем. Такие технические системы относятся к интеллектуальным, они способны, подобно живым организмам, принимать решения о собственном поведении в условиях неопределенности и неполноты информации, основываясь на отказе от планирования и моделирования в пользу простых правил поведения [7, 8].
В настоящей работе рассматриваются действия интеллектуальных агентов в режиме поиска. Пошаговый алгоритм поиска воспроизводится динамической моделью простейших биологических систем. Для описания систем используется логистическое отображение. Двумерная модель поиска на плоскости описана в работе [9]:
R(i +1) = (i)R(i)[l - R(i)],j
L(i +1) = Xl (i)L(i)[l - L(i)], J ( )
координаты R и L моделируют намерение о выполнении поворота агента вправо и влево на i-м шаге. Система (l) включает уравнения развития популяций [10, 11]. Здесь произведения координат в правых частях определяют воспроизводство новых намерений о выполнении поворотов вправо или влево, а координаты в первой степени задают отмену предыдущих намерений, коэффициенты X в системе (l) обозначают шумы, описывающие случайный характер поиска, а также перекрестные связи между каналами, и управляющие воздействия, которые зависят от функции поиска S=S(i).
Функция поиска задает свойства искомого агентом объекта. По аналогии с биологическими системами, в которых ищется источник запаха — пища, будем называть эту функцию функцией запаха. Эта функция принимает максимальное значение для места расположения искомого объекта.
Система уравнений (1) описывает так называемый компенсационный гомеостат [12, 13], в котором реализуется закон единства и борьбы противоположных намерений о выполнении поворотов агента вправо и влево. В силу случайного характера поиска гомеостат обладает избыточностью движений, что свойственно биологическим системам.
Трехмерный поиск. Будем считать, что гомеостат (1) задает движение агента в горизонтальной плоскости. Для перехода к пространственному поиску введем систему уравнений, задающую движение агента в вертикальной плоскости. Тогда поисковая модель будет иметь две пары логистических отображений, вырабатывающих намерения о выполнении поворотов в вертикальной (поворот вверх и и вниз В) и горизонтальной (вправо Я и влево Ь ) плоскостях:
Я(1 +1) = А,я (0Я(/)[1 - Я(0], ^ Ь(г +1) = Ь ь (I) Ь(/)[1 - Ь(/)], и(I +1) = ^и И)и(I )[1 - и(/)],
Б(г +1) = А, в (•) В(1)[1 - В(/)].] Чтобы система (2) была устойчивой, вводятся ограничения [14] X к, X ь, Хи, X в параметры Xк, Xь, Хи, Хв определяются следующим образом:
ХЯ (I) = д + а£ я (I) - Ь (I) + (I), X ь (I) = д + а£ь (I) - Я(0 + (I), Xu (I) = д + а£и (I) - Б(1) + К^ (I), Xв (I) = д + а£в (I) - и(I) + К^(I), где д — константа; £ я , £ ь , £и, £ в — белые шумы, ранжированные в области [-1;1]; а — амплитуда шума; К — коэффициенты влияния приращения функции запаха; (I) — относительное приращение функции запаха на последующей итерации:
£(I) - £(I -1)
(2)
[°д];
(3)
dS (i) = ■
S (i)
(4)
(5)
Результирующие углы поворотов в вертикальной 9 и горизонтальной плоскостях ф определяются соответствующими намерениями
9(i +1) = 9(i) + [U (i) - D(i)], ф(/ +1) = ф(/) + [L (i) - R(i)].
Система (5) представляет собой компенсационный гомеостат, антагонистами в котором являются повороты агента в горизонтальной и вертикальной плоскостях. Для определения движения агента в трехмерном пространстве с координатами x, y, z необходимо в уравнения (5) ввести перекрестные связи. Для этого построим проекцию вектора положения агента в трехмерном пространстве на оси x, y, z с помощью синусов и косинусов углов поворота в горизонтальной и вертикальной плоскостях
x(i) = r sin 9(i) cos ф(/), y(i) = r sin 9(i) sin ф(/), z (i) = r cos 9(i),
(6)
где г — длина шага поискового агента в каждой итерации.
Функция запаха вводится в трехмерном пространстве £= £(х, у, 2) . Фактически она является выигрышем в двойной гомеостатической игре, которая впервые рассматривалась Ю. М. Горским [15]. Цель игры — нахождение экстремума £= £(х, у, г) . Ходами двусторонней игры во внутренних гомеостатах для горизонтальной плоскости являются, с одной стороны,
повороты агента влево, с другой — повороты вправо, для вертикальной плоскости ходами, с одной стороны, являются повороты агента вверх, с другой — повороты вниз.
Результаты моделирования. Для моделирования использовались следующие параметры: а = 2,8; К = 20; | = 1,5; Ь0 = 0,2; Е = 0,5; Щ = 0,1;В0 = 0,6; Ф() = 0,3; 0о = 0,7. Тем самым задаются начальные углы и результирующие тенденции. Пространственный шаг г = 0,005 мм, а начальное положение: (х^,X 20) = 10,20,10) . Функция запаха задается следующим образом:
(х,У,2) = ехР("х2 "У2 " 22). (7)
Очевидно, что в таком случае функция запаха имеет максимум в точке (0,0,0) .
Результат моделирования движения агента в трехмерном пространстве представлен на
рис. 1.
г, мм 10 5 0
-5 -15
Рис. 1
Как видно, агент начинает движение из точки с заданными координатами и движется в направлении начала координат. Несмотря на то что изначально движения были направлены не к началу координат (х0, У0,20), система выходит на почти детерминированную траекторию, иногда изменяя направление вследствие шума. При достижении начала координат агент вращается около максимума функции запаха, „проскакивая" положение максимума и к нему возвращаясь. Устойчивая область установившегося движения составляет „сферу" радиусом 5 мм.
На рис. 2 представлен график изменения управляющего воздействия, т.е. величины .
Кс18-.-.-.-.-.---
4 2 0 -2 -4 -6
0 2000 4000 6000 Г, с
Рис. 2
Из рис. 2 видно, что сначала наблюдается активная фаза, на которой приращение управления велико, агент быстро движется к максимуму функции запаха. После попадания в область установившегося движения диапазон значений, имеющих разные знаки, огра-
ничен.
Рассмотрим движения при изменении коэффициента в диапазоне K = 0—150. Для
»11 I 2 2 2 Г = > x + у + 7 вектора положения
агента. Чем значение ||г|| меньше, тем быстрее или ближе к максимуму движется агент. Результат моделирования представлен на рис. 3.
Рис. 3
Из рис. 3 видно, что наибольшая область сходимости (наихудшая характеристика) при K = 0, когда нет обратной связи и агент управляется только шумом. При увеличении K качество процесса улучшается, однако повышение коэффициента обратной связи в два или три раза (от 50 до 100 или 150) не дает существенного улучшения. Таким образом, использование большого усиления шума бесполезно, а в технических системах и сложно реализуемо.
Заключение. Предложенный алгоритм может быть использован в системах управления легкими беспилотными летательными аппаратами (БПЛА). Общность моделей, описывающих пространственное движение БПЛА, и биологических систем заключается в разделении движений на продольное и поперечное и управлении углами тангажа и рысканья. Детерминированная траектория движения центра масс БПЛА определяется биологическими уравнениями развития популяций в ареале, заданном целевой функцией.
Случайный характер поиска задается шумовым сигналом, накладываемым на детерминированную составляющую. Существует некоторое оптимальное отношение сигнал/шум, которое определяется выбором коэффициентов обратной связи в законе управления.
СПИСОК ЛИТЕРАТУРЫ
1. Jianhua Lu, Ming L., Lion A. Simple and efficient search algorithm for block-matching motion estimation // IEEE Transact. on circuits and systems for video technology. 1997. Vol. 7, N 2. P. 429—433.
2. Каладзе В. А. Адаптация случайного поиска методом направляющего конуса // Вестн. ВГТУ. 2012. Т. 8, № 1. С. 31—37.
3. Горбунов Ю. Н., Лобанов Б. С., Куликов Г. В. Введение в стохастическую радиолокацию. М.: Горячая линия-Телеком, 2015. 376 с.
4. Жиглявский А. А., Жилинскас А. Г. Методы поиска глобального экстремума. М.: Наука, 1991. 248 с.
5. Редько В. Г. Эволюционная кибернетика // Кибернетика: неограниченные возможности и возможные ограничения. М.: Наука, 2001. 156 с.
6. Штовба С. Д. Муравьиные алгоритмы // Exponenta Pro. Математика в приложениях. 2003. № 4. С. 70—75.
7. Непомнящих В. А. Модели автономного поискового поведения // От моделей поведения к искусственному интеллекту / Под общ. ред. В. Г. Редько. М.: УРСС, 2006. С. 200—242.
8. Непомнящих В. А. Как животные решают плохо формализуемые задачи поиска // Синергетика и психология. Вып. 3. Когнитивные процессы. М.: Когито-Центр, 2004. С. 197—209.
9. Непомнящих В. А., Подгорный К. А. Порождение правил поискового поведения динамической системой // IV Всерос. науч.-техн. конф. „Нейроинформатика—2002". Ч. 1. М.: Изд-во МИФИ, 2012. С. 110—116.
10. Марри Дж. Нелинейные дифференциальные уравнения в биологии. Лекции о моделях. М.: Мир, 1983. 400 с.
11. Бушуев А. Б. Применение методов технического творчества в инновационной деятельности. СПб: СПбГУ ИТМО, 2010. С. 49—60.
12. Горский Ю. М. Основы гомеостатики. Гармония и дисгармония живых, природных, социальных и искусственных систем. Иркутск: Изд-во ИГЭА, 1998. 337 с.
13. Бушуев А. Б. Математическое моделирование процессов технического творчества. СПб: СПбГУ ИТМО, 2010. 181с.
14. May R. M. Simple mathematical models with very complicated dynamics // Nature. 1976. Vol. 261. P. 459—467.
15. Горский Ю. М. Системно-информационный анализ процессов управления. Новосибирск: Наука, 1988. 327 с.
Сведения об авторах
Александр Борисович Бушуев — канд. техн. наук, доцент; Университет ИТМО, кафедра систем
управления и информатики; E-mail: [email protected] Владимир Сергеевич Воробьев — магистрант; Университет ИТМО, кафедра систем управления и
информатики; E-mail: [email protected] Станислав Игоревич Томашевич — магистрант; Университет ИТМО, кафедра систем управления и
информатики; E-mail: [email protected] Ольга Карибековна Мансурова — канд. техн. наук, доцент; Национальный минерально-сырьевой
университет „Горный", кафедра автоматизации технологических процессов и производств Александр Александрович Кульчицкий — канд. техн. наук, доцент; Национальный минерально-сырьевой
университет „Горный", кафедра автоматизации технологических процессов и производств
Рекомендована кафедрой Поступила в редакцию
систем управления и информатики 10.04.15 г.
Ссылка для цитирования: Бушуев А. Б., Воробьев В. С., Томашевич С. П., Мансурова О. К., Кульчицкий А. А. Поведение агента, заданное логистическим отображением // Изв. вузов. Приборостроение. 2015. Т. 58, № 8. С. 600—605.
AGENT BEHAVIOR DEFINED BY LOGISTIC MAPPING
A. B. Bushuev1, V. S. Vorobiev1, S. I. Tomashevich1, O. K. Mansurova2, A. A. Kulchitsky2
1ITMO University, 197101, Saint Petersburg, Russia E-mail: [email protected] 2National Mineral Resource University, 197101, Saint Petersburg, Russia
A search algorithm based on biological approach in 3D space system is considered. A search agent in the field of a spatial function serves as the tracing system. Tthe agent purpose is to determine the function ex-tremum domain, and the agent behavior is defined by logistics mapping. the system represents search model in three-dimensional space. Modeling of the agent behavior operating in accordance with a proposed algorithm is carried out. The agent movement quality is characterized by the norm of coordinate vector of deviation of the agent from the search object.
Keywords: random search, space, intellectual agent, homeostat, logistic mapping.
Data on authors
— PhD, Associate Professor; ITMO University, Department of Control Systems and Informatics; E-mail: [email protected]
— Graduate Student; ITMO University, Department of Control Systems and Informatics; E-mail: [email protected]
— Graduate Student; ITMO University, Department of Control Systems and Informatics; E-mail: [email protected]
— PhD, Associate Professor; National Mineral Resource University, Department of Technological Process Automation and Production
Alexander B. Bushuev Vladimir S. Vorobiev Stanislav I. Tomashevich Olga K. Mansurova
Alexander A. Kulchitsky — PhD, Associate Professor; National Mineral Resource University,
Department of Technological Process Automation and Production
Reference for citation: Bushuev A. B., Vorobiev V. S, Tomashevich S. I., Mansurova O. K., Kulchitsky A. A. Agent behavior defined by logistic mapping // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2015. Vol. 58, N 8. P. 600—605 (in Russian).
DOI: 10.17586/0021-3454-2015-58-8-600-605