Известия Кабардино-Балкарского научного центра РАН № 6 (92) 2019
ИНФОРМАТИКА. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА. УПРАВЛЕНИЕ
УДК 004.5
DOI: 10.35330/1991-6639-2019-6-92-21-26
КОМПЬЮТЕРНАЯ МОДЕЛЬ ВОЗНИКНОВЕНИЯ КОЛЛЕКТИВНОГО ПОВЕДЕНИЯ РОБОТОВ*
М.И. АНЧЕКОВ1, М.П. КРИВЕНКО2
1 Институт информатики и проблем регионального управления -филиал ФГБНУ «Федеральный научный центр «Кабардино-Балкарский научный центр Российской академии наук» 360000, КБР, г. Нальчик, ул. И. Арманд, 37-а E-mail: [email protected] 2 Институт компьютерных технологий и информационной безопасности Южный федеральный университет 347928, Ростовская обл., г. Таганрог, пер. Некрасовский, 44 E-mail: ictis.sfedu.ru
Объектом исследования является коллективное поведение роботов. Предметом исследования является процесс возникновения коллективного поведения роботов на основе обмена сообщениями.
В работе представлено описание компьютерной модели, в которой коллективы роботов могут решать задачу поискового поведения, используя при этом возможности коммуникации между собой. Роботы решают задачу поиска источников энергии в двумерном плоском мире с целочисленными координатами. Компьютерный эксперимент предполагает наличие двух популяций роботов. Первая популяция роботов имеет возможность коммуницировать между собой, у второй такой возможности нет. В процессе функционирования роботы должны научиться формировать текстовые сообщения, которые будут описывать местоположение источников энергии. Так как роботы функционируют в частично наблюдаемой среде, информация о местоположении источников энергии, получаемая от других роботов, позволит более эффективно решать задачу поискового поведения. Успешность решения задачи будет оцениваться по объему энергии, которой обладает каждая из популяций.
Ключевые слова: мультиагентная нейронная сеть, мультиагентная система, робототехниче-ские системы, коллективное поведение.
Введение
К современным тенденциям развития робототехники можно отнести растущее количество робототехнических проектов, которые направлены на решение бытовых задач. Так, рынок бытовой робототехники в 2019 году составил 3,3 млрд долл. и, по прогнозам маркетингового агентства Tractica, к 2024 году вырастет до 9,1 млрд долл. Кроме таких роботов, как роботы-пылесосы и роботы-газонокосильщики, к бытовым роботам относят роботов-сиделок, роботов-компаньонов и т.д. Такие роботы нацелены не только на функционирование в антропоцентричной среде, но и на непосредственное взаимодействие с человеком. Таким образом, человек окружает себя большим количеством роботов, которым необходимо ставить цели и контролировать результат.
Для успешного выполнения поставленных задач роботы должны уметь взаимодействовать не только с человеком, но и между собой. Для целей унификации предлагается не разграничивать протоколы взаимодействия робот-человек и робот-робот. С нашей точки зрения, для эффективного решения совместных задач роботы должны иметь представление о физическом мире, в котором функционируют.
* Работа выполнена при поддержке грантов РФФИ №№ 18-01-00658, 19-01-00648
Одна из основных задач, которые необходимо решить для того, чтобы роботы могли взаимодействовать как с человеком, так и друг с другом, - это задача понимания. По способу разработки системы искусственного интеллекта, способные к пониманию естественного языка или его ограниченного подмножества, можно разделить на две большие группы: первая - обучение системы на основе общения с человеком, вторая - эволюционное появление возможности понимания.
Так, в [2, 3, 6] разрабатывается мультиагентная рекурсивная когнитивная архитектура, которая посредством общения с пользователем формирует «представление» об элементах внешнего мира и их взаимоотношениях. Отличительной особенностью данного направления является то, что элементы когнитивной архитектуры общаются между собой на подмножестве естественного языка.
В [4] робот обучается социальному взаимодействию с использованием обучения с подкреплением. Взаимодействуя с человеком в реальной среде, робот научился элементам невербального общения, оценивая человека по положению тела, траектории движения и т.д.
В [1] роботы используют невербальное общение для коммуникации между собой. За основу был взят принцип обмена информацией, которым пользуются пчелы, - танец пчелы. Такое средство коммуникации позволяет обмениваться информацией, когда другие способы недоступны.
В качестве модельной задачи была выбрана задача реализации поискового поведения группой роботов. Цель поискового поведения - максимизация энергии, полученной из внешней среды. Эффективность решения задачи определяется максимальным количеством энергии, которой обладает группа роботов по завершению времени моделирования.
Описание компьютерной модели
Мир компьютерной симуляции состоит из двумерного замкнутого лабиринта с целочисленными координатами (рис. 1). Непроходимые участки, такие как преграды и границы, обозначены серым цветом. Белое пространство является свободным для перемещения роботов. В некоторых местах свободного пространства находятся источники энергии Е. Источник энергии может быть поглощён одним или несколькими роботами, координаты которых совпадают с координатами источника энергии. Величина энергии источника энергии уменьшается на одну единицу каждый такт. Время моделирования является дискретным. После исчезновения или поглощения источника энергии в случайном месте свободного пространства появляется новый источник энергии. За источники энергии конкурируют два типа роботов: тип А и тип В (рис. 1). Роботы одного типа могут взаимодействовать друг с другом на радиусах, не превышающих значения га и гв соответственно. Взаимодействие осуществляется посредством обмена сообщениями - лексемами длины Ьп, которые состоят из элементов множества {а, ...,г]. Для осуществления взаимодействия робот оснащен (рис. 2):
- сенсором препятствия 8оЬя1ас1е;
- сенсором сообщений Smessage;
- эффектором движения Efengine;
- эффектором сообщений Smessage.
Рис. 1. Графическое представление мира симуляции
агент-нейрон А
Рис. 2. Структурная схема робота Мультиагентная нейронная сеть (рис. 3) представлена кортежем:
M = {X,Y,Ain,Amediator ,A0Ut ,D),
где:
X- вектор входных сигналов;
Y - вектор выходных сигналов;
Ain - множество входных агентов-нейронов;
A mediator - множество внутренних агентов-нейронов;
Aout - множество выходных агентов-нейронов;
D - множество дуг, определяющих способ соединения агентов-нейронов.
Рис. 3. Структурная схема мультиагентной нейронной сети
Агент-нейрон (рис. 4) представляет собой конечный автомат:
А = (X,Y,S,fy,fs,S0PP,Pos,D,E),
X- вектор входных сигналов; Y - вектор выходных сигналов; S - множество состояний; fy - функция выходов;
fs - функция переходов между состояниями;
So - начальное состояние;
PP - программа позиционирования;
Pos - координаты агента-нейрона;
D - программа роста дендритов;
E - энергия агентов.
Е D К.
L fy
Уэ-J
у я 5
РР pos
Рис. 4. Структурная схема агента-нейрона
Состояние агента в момент времени I, где 1=0,1,2, ... , описывается следующим образом:
5^ + 1) =/5(Х(0,5(0)
уа + 1) = /у(х(о,5(о)
Постановка задачи аппроксимации функции Пусть мультиагентная нейронная сеть реализует следующую функцию:
Y = M(AvA2.....Ап),
y=A(X,S,fy,fs,So,PP,Pos,D,E). Неизвестная функция F задана с помощью двух таблиц: (yi=F(xLj), y2=F(xL 2),—, yn=F(xL n)} - обучающая выборка, {yi=F (xci), y2=F(xC2),—, yk=F(xCk)} - контрольная выборка. Необходимо найти такие значения Ai,A2,—,An, чтобы значение функции
п
^ (f(x[) - М(х[)) ^ min i=l
^^(х^-М^))2 ^min.
(2 2\ 2 ZU (F(x') - M(xty - Zf=! (F(xf) - M(xfj) ) < a,
где s - достаточно малое наперед заданное значение.
Описание компьютерного эксперимента Как уже говорилось выше, за источники энергии конкурируют две популяции роботов, которые созданы на основе роботов типа A и типа B. Задача роботов - максимизация энергии популяции. Роботы пополняют запасы энергии из источников энергии, расположенных случайным образом. Роботы имеют возможность обмениваться сообщениями с другими роботами из своей популяции. В процессе обучения на основе генетического алгоритма роботы должны научиться не только поисковому поведению, но и интерпретировать сообщения от других роботов. Уменьшив величину радиуса взаимодействия r до минимального значения, можно получить «асоциальных» роботов, которые не будут взаимодействовать с другими роботами, это бытовые роботы на современном этапе развития. Увеличив радиус взаимодействия r до максимального значения, мы получим роботов, которые смогут решать задачи на качественно новом уровне. Создавая популяции роботов с разными радиусами взаимодействия, планируется продемонстрировать, что роботы, имея принципиальную возможность коммуникации, будут ее использовать для повышения конкурентных качеств.
Заключение
В работе предложена компьютерная модель, позволяющая продемонстрировать процесс возникновения группового поведения роботов на основе обмена сообщениями.
ЛИТЕРАТУРА
1. Das B., CouceiroM.S., Vargas P.A. MRoCS: A new multi-robot communication system based on passive action recognition // Robotics and Autonomous Systems. 2016. Vol. 82. Pp. 46-60.
2. Nagoev Z.V., Nagoeva O.V., Pshenokova I.A., Gurtueva I.A. Multi-agent Model of Semantics of Simple Extended Sentences Describing Static Scenes Springer International Publishing, 2019. 245-259 p.
3. Nagoev Z.V., Pshenokova I.A., Gurtueva I.A., Bzhikhatlov K.Ch. A Simulation Model for the Cognitive Function of Static Objects Recognition Based on Machine-Learning Multi-agent Architectures // Advances in Intelligent Systems and Computing. 2020. Vol. 948. Pp. 370-378.
4. Qureshi A.H. and othe. Intrinsically motivated reinforcement learning for human-robot interaction in the real-world // Neural Networks. 2018. Vol. 107. Pp. 23-33.
5. Анчёков М.И. Эволюционное обучение мультиагентных нейронных сетей // Известия КБНЦ РАН. 2012. № 2-2 (46).
6. Нагоев З.В., Нагоева О.В., Пшенокова И.А. Мультиагентные нейрокогнитивные модели семантики пространственной локализации событий // Известия КБНЦ РАН. 2018. № 6.
REFERENCES
1. Das B., Couceiro M.S., Vargas P.A. MRoCS: A new multi-robot communication system based on passive action recognition // Robotics and Autonomous Systems. 2016. Vol. 82. Pp. 46-60.
2. Nagoev Z.V., Nagoeva O.V., Pshenokova I.A., Gurtueva I.A. Multi-agent Model of Semantics of Simple Extended Sentences Describing Static Scenes Springer International Publishing, 2019. Pp. 245-259.
3. Nagoev Z.V., Pshenokova I.A., Gurtueva I.A., Bzhikhatlov K.Ch. A Simulation Model for the Cognitive Function of Static Objects Recognition Based on Machine-Learning Multi-agent Architectures// Advances in Intelligent Systems and Computing. 2020. Vol. 948. Pp. 370-378.
4. Qureshi A.H. and othe. Intrinsically motivated reinforcement learning for human-robot interaction in the real-world // Neural Networks. 2018. Vol. 107. Pp. 23-33.
5. Anchokov M.I. Evolyutsionnoye obucheniye mul'tiagentnykh neyronnykh setey [Evolutionary training of multi-agent neural networks] // Izvestiya KBNTSRAN [News of the KBSC RAS]. 2012. No. 2-2 (46).
6. Nagoev Z.V., Nagoeva O.V., Pshenokova I.A. Mul'tiagentnyye neyrokognitivnyye modeli semantiki prostranstvennoy lokalizatsii sobytiy [Multiagent neurocognitive models of the semantics of spatial localization of events] // Izvestiya KBNTS RAN [News of the KBSC RAS]. 2018. No. 6.
COMPUTER MODEL OF THE EMERGENCE OF COLLECTIVE ROBOT BEHAVIOR
M.I. ANCHEKOV1, M.P. KRIVENKO2
1 Institute of Computer Science and Problems of Regional Management -branch of Federal public budgetary scientific establishment "Federal scientific center
"Kabardin-Balkar Scientific Center of the Russian Academy of Sciences" 360000, KBR, Nalchik, 37-a, I. Armand St. E-mail: [email protected] 2 Institute of Computer Technology and Information Security, South Federal University 347928, Rostov Region, Taganrog, per. Nekrasovsky, 44 E-mail: ictis.sfedu.ru
The object of research is the collective behavior of robots. The subject of the research is the process of the emergence of collective behavior of robots based on messaging.
The paper presents a description of a computer model in which teams of robots can solve the problem of search behavior, using the possibilities of communication among themselves. Robots solve the problem of finding energy sources in a two-dimensional flat world with integer coordinates. A computer experiment suggests two populations of robots. The first population of robots has the ability to communicate with each other, the second one does not. In the process of functioning, robots must learn to form text messages that will describe the location of energy sources. Since robots operate in a partially observable environment, information about the location of energy sources received from other robots will allow more efficient solution of the problem of search behavior. The success of solving the problem will be evaluated by the amount of energy that each of the populations possesses.
Keywords: multiagent neural network, multiagent system, robotic systems, collective behavior.
Работа поступила 10.12.2019 г.