Научная статья на тему 'Адаптивное управление роботами с произвольно заданной модульной конструкцией'

Адаптивное управление роботами с произвольно заданной модульной конструкцией Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
155
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
модульные роботы / адаптивное управление / логико-вероятностный метод извлечения знаний / modular robots / adaptive control / logical-probabilistic knowledge dis- covery method

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Александр Викторович Демин

Разработка систем управления модульными роботами сталкивается с серьезными трудностями, связанными с возможностью изменения конструкции у роботов данного типа и наличием большого количества степеней свободы. Целью данной работы является разработка универсальной системы управления модульными гиперизбыточными системами, способной самостоятельно находить способы управления роботами с произвольной конструкцией из некоторого заданного класса. Для решения задачи была предложена модель системы управления, использующая логико-вероятностные методы извлечения знаний из данных, адаптированные для задач управления. В соответствии с предложенным подходом задача обучения системы управления была сведена к задаче поиска закономерностей в массиве статистических данных о взаимодействии системы с окружающей средой. Для решения проблемы независимости системы управления от выбранной конструкции робота было предложено включить в обучающую информацию данные о конструкции, заданные в виде дерева элементов, описывающего пространственное соединение модулей друг с другом. Использование данной информации в процессе обучения позволяет системе управления самостоятельно настраиваться на управление роботом независимо от его конструкции. Для проверки работоспособности и эффективности предложенной модели были проведены эксперименты по обучению класса роботов с различными конструкциями способам передвижения вперед. Проведенные эксперименты подтвердили высокую скорость обучения и качество управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Adaptive Control of Modular Robots with Arbitrarily Specified Design

Development of modular robot control systems poses serious challenges associated with the robot’s construction subject to changes and the presence of a large number of degrees of freedom. The goal of this work was developing a versatile control system for modular hyper-redundant systems, able of independently finding ways to control robots with an arbitrary design from a certain given class. For solving the problem, a model of a control system was proposed, using logical-probabilistic knowledge discovery methods, adapted for control tasks. In accordance with the proposed approach, the task of control system training was reduced to finding patterns in an array of system’s environment interaction statistical data. For making the system independent on the chosen robot design, including modules’ spatial connection data specified in a data tree was proposed. Using this information during the training process allows the control system to independently tune in to control the robot, regardless of its design. For testing the proposed model’s performance and effectiveness, experiments in training a class of robots with different designs to move forward, which have confirmed both the learning rate and control quality being high.

Текст научной работы на тему «Адаптивное управление роботами с произвольно заданной модульной конструкцией»

Серия «Математика» 2019. Т. 29. С. 10-21

Онлайн-доступ к журналу: http: / / mathizv.isu.ru

ИЗВЕСТИЯ

Иркутского государственного ■университета

УДК 004.85 MSG 22Е05

DOI https://doi.org/10.26516/1997-7670.2019.29.10

Адаптивное управление роботами с произвольно заданной модульной конструкцией *

А. В. Демин

Институт систем информатики им. А. П. Ершова СО РАН, Институт математики им. С. Л. Соболева СО РАН, Новосибирск, Российская Федерация

Аннотация. Разработка систем управления модульными роботами сталкивается с серьезными трудностями, связанными с возможностью изменения конструкции у роботов данного типа и наличием большого количества степеней свободы. Целью данной работы является разработка универсальной системы управления модульными гиперизбыточными системами, способной самостоятельно находить способы управления роботами с произвольной конструкцией из некоторого заданного класса. Для решения задачи была предложена модель системы управления, использующая логико-вероятностные методы извлечения знаний из данных, адаптированные для задач управления. В соответствии с предложенным подходом задача обучения системы управления была сведена к задаче поиска закономерностей в массиве статистических данных о взаимодействии системы с окружающей средой. Для решения проблемы независимости системы управления от выбранной конструкции робота было предложено включить в обучающую информацию данные о конструкции, заданные в виде дерева элементов, описывающего пространственное соединение модулей друг с другом. Использование данной информации в процессе обучения позволяет системе управления самостоятельно настраиваться на управление роботом независимо от его конструкции. Для проверки работоспособности и эффективности предложенной модели были проведены эксперименты по обучению класса роботов с различными конструкциями способам передвижения вперед. Проведенные эксперименты подтвердили высокую скорость обучения и качество управления.

Ключевые слова: модульные роботы, адаптивное управление, логико-вероятностный метод извлечения знаний.

* Работа выполнена за счет гранта Российского научного фонда (проект № 17-1101176).

1. Введение

В настоящее время стремительный прогресс робототехники отражается в тенденции к постоянному увеличению сложности конструкций мобильных роботов. В частности, в последнее время активно развивается направление «модульные роботы» [5; 12; 14], которое подразумевает создание сложных конструкций из простых однотипных элементов -«модулей». Это перспективное направление несет в себе много преимуществ, включая быструю сборку роботов под нужды конкретной задачи, а также возможность создания роботов-трансформеров.

Серьезной проблемой практического использования модульных роботов является необходимость создания системы управления для каждой конфигурации робота. Одним из возможных путей решения данной проблемы является автоматическая генерация системы управления на основе различных моделей обучения [6; 9—11; 13]. Однако наличие большого количества степеней свободы у роботов данного типа вызывает существенные трудности в применении традиционных методов машинного обучения. В предыдущих работах [4; 7; 8] нами был предложен альтернативный подход к созданию обучающихся систем управления для модульных роботов, основанный на использовании свойств функциональной схожести элементов конструкции роботов и логико-вероятностных методов извлечения знаний из данных. Предложенные методы были успешно апробированы в экспериментах по обучению типичных представителей модульных роботов: змеевидного робота, многоногого робота и хоботовидного манипулятора [2]. Полученные результаты продемонстрировали основные преимущества подхода: обучение и адаптацию в режиме реальной работы, высокую скорость обучения и хорошую масштабируемость относительно увеличения сложности системы.

Предложенный метод лишь частично снимал проблему автоматической генерации системы управления для модульных роботов. Несмотря на то, что система сама автоматически находила правила управления, применение метода все равно требовало участие человека, чтобы выполнить изначальную настройку параметров системы, поскольку необходимо, как минимум, задать множество базовых логических предикатов, которые используются для построения правил. В упомянутых работах множество базовых предикатов задавалось индивидуально для каждой конкретной конструкции, что не позволяло полностью исключить участие человека. Но если формализовать описания конструкций роботов и включить эту информацию в процесс обучения, то можно сделать процедуру генерации системы управления полностью автоматической, независимо от выбранной конструкции.

Целью данной работы является разработка обобщенной системы управления модульными роботами, способной самостоятельно находить

Рис. 1. Способы стыковки модулей друг с другом

способы управления роботами с произвольной конструкцией из некоторого заданного класса. Для этого предлагается включить в обучающую информацию данные о конструкции робота и соответствующим образом модифицировать вид логических правил управления и метод их обнаружения. Экспериментальная часть работы включает проведение компьютерных экспериментов по обучению способам передвижения виртуальных моделей роботов в программной среде, моделирующей законы механики реального мира.

2. Конструкция модульных роботов

Предполагаем, что конструкция роботов состоит из однотипных модулей, имеющих одинаковую форму прямоугольного параллелепипеда. У каждого модуля на одной грани расположен стыковочный элемент, содержащий угловые двигатели, а на остальных гранях - разъемы для стыковки (рис. 1). Таким образом, каждый модуль при помощи стыковочного элемента может быть подключен к одному разъему любого другого модуля, а угловые двигатели позволяют вращать подключенные модули относительно точки соединения. Также считаем, что все модули имеют одинаковый набор сенсоров и команд действий, позволяющих управлять угловыми двигателями стыковочного элемента. Примеры подобных конструкций модулей можно найти в работах [12; 14].

Ограничим класс рассматриваемых конструкций модульных роботов такими, которые могут быть представлена в виде дерева элементов, в котором каждая вершина представляет собой отдельный модуль, а ребра — соединения между модулями. Каждое ребро содержит инфор-

мацию о том, к какой грани родительского модуля подключен дочерний элемент. При этом к одной вершине не может вести два ребра с одинаковой гранью подключения. Таким образом, с помощью дерева элементов можно описывать достаточно разнообразные конструкции, включая змееподобных роботов, многоногих роботов, роботов с различными, в том числе разветвленными, конечностями и т. д.

3. Модель системы управления

Предлагаемая модель системы управления функционирует в дискретном времени £ = 1 ,п. Предполагаем, что статистические данные о взаимодействии системы с окружающей средой хранятся в массиве данных, где для каждого момента времени £ записана вся необходимая сенсоро-моторная информация системы (показания сенсоров каждого модуля и выбранные действия), а также величина награды, которая зависит от цели работы системы. Также считаем, что система управления имеет доступ к дереву элементов, описывающему конструкцию управляемого ею робота.

Таким образом, задачу обучения системы управления можно свести к задаче обнаружения на массиве статистических данных закономерностей, которые максимизируют вероятность получения награды при выполнении тех или иных действий в определенных ситуациях.

Одна из особенностей предлагаемого подхода состоит в том, что для обучения системы, помимо использования данных о ее взаимодействии со средой, предлагается также использовать дополнительную информацию о конструктивных особенностях самого робота, заданную деревом элементов. Использование данной информации, во-первых, делает систему управления более универсальной, не привязанной к какой-либо конкретной конструкции робота. А во-вторых, позволяет использовать свойства функционального подобия некоторых модулей. Что, в свою очередь, позволяет существенно сократить пространство поиска управляющих правил за счет использования одних и тех же правил для схожих по своим функциям модулей. К примеру, можно использовать один и тот же способ управления для левых и правых конечностей многоногого робота, а также для четных и нечетных ног.

Для обнаружения закономерностей, описывающих работу системы, предлагается использовать логико-вероятностные методы извлечения знаний из данных, основанные на идеях семантического вероятностного вывода и адаптированные для задач управления [3]. Для этого вся сенсоро-моторная информация, а также информация о конструкции робота, представляется в виде логических предикатов, в терминах которых осуществляется поиск управляющих правил.

Введем наборы базовых логических предикатов следующего типа:

^ 6 8 - модульные сенсорные предикаты из заданного набора предикатов Б, описывающие состояние сенсоров модулей. Запись Б^п) означает, что состояние сенсоров модуля с номером п = удовлетворяет условию предиката Si.

Аг € А — модульные активирующие предикаты из заданного набора предикатов А, описывающие действия модулей. Запись А^п) означает, что действия модуля с номером п = 1,А удовлетворяет условию предиката А^.

Мг € М — модульные предикаты из заданного набора предикатов М, определенные на дереве элементов конструкции робота и определяющие набор модулей с некоторыми общими свойствами. Запись Мг(п) означает, что положение модуля с номером п = 1, N в дереве элементов удовлетворяет условию предиката М^.

На основе заданного набора базовых предикатов Б, А и М сформируем следующие наборы комплексных предикатов:

(Мг5г) = Уп(Мг(п) —> Sí(n)) — комплексные предикаты, определяющие одинаковое состояние сенсоров Si для всех модулей п = заданных предикатом М^.

(М^) = Уп(Мг(п) —> А^п)) — комплексные предикаты, определяющие одинаковые действия А^ для всех модулей п = заданных предикатом М^.

Наборы предикатов (М^) и (М^) будем называть набором комплексных предикатов и обозначать Р = {(М^)} и {(М^)}.

В терминах заданных предикатов будем искать логические правила следующего вида:

(ЛЗД),..., (МтЗт), (МгАг),(МпАп) -»■ г (3.1)

Данные закономерности предсказывают, что если для модулей, определенных предикатами М\ из пар (М^), показания их сенсоров удовлетворяют предикатам и если модули, заданные предикатами М\ из пар (МгАг), отдадут команды А^, то математическое ожидание награды в результате этих действий будет равно г.

Для нахождения закономерностей вида (1.1) предлагается использовать алгоритм, основанный на идеях семантического вероятностного вывода, описанного в работах [1]. При помощи данного алгоритма анализируется множества данных, хранящих статистику работы системы, и извлекаются все статистически значимые закономерности вида (1.1).

Рассмотрим алгоритм поиска закономерностей подробнее.

Для удобства изложения перепишем правило (1.1) в упрощенном виде:

Ръ...,Рт^г (3.2)

где Pí обозначают комплексные предикаты из множества Р.

Введем ряд формальных определений.

Определение 1. Подправилом правила

Кг = Ръ ..., Рт -»■ г, {Ръ ..., Рт} ф 0

будем называть любое правило В.2 = Р^,..., Ргк —> г, для которого выполнено условие {Р^,..., Р^} С {Р\,..., Рт}-

Определение 2. Закономерностью будем называть правило вида (1.2), удовлетворяющее следующим условиям:

— Математическое ожидание награды г для правила определено.

— Математическое ожидание награды г правила строго больше математических ожиданий награды каждого из его подправил.

Определение 3. Правило К\ = Р\,..., Рт, Рт+1 —> г будем называть уточнением правила К\ = Р\,... ,Рт —> г, если оно получено добавлением в посылку правила К\ любого предиката Рт+1 € Р, не содержащегося в правиле К\.

Таким образом, суть операции уточнения состоит в конкретизации области применения правила путем добавления нового комплексного предиката, который, по сути, либо добавляет новое условие на показания сенсоров робота, либо добавляет новые команды.

Будем обозначать через Зрес(КиЬ) — множество всех возможных уточнений всех правил из Ш1Ь, где Ш7Ь — произвольное множество правил вида (2).

Суть алгоритма обнаружения закономерностей заключается в последовательном уточнении правил, начиная с правил единичной длины, путем добавления в посылку правил новых предикатов с последующей проверкой уточненных правил на принадлежность к закономерностям. По существу реализуется направленный перебор правил, позволяющий существенно сократить пространство поиска. Сокращение перебора достигается за счет использования эвристики, которая заключается в том, что, начиная с момента, когда длина посылки правил достигает некоторой заданной величины, называемой глубиной базового перебора, начинается последовательное уточнение только тех правил, которые являются закономерностями.

Перейдем к описанию алгоритма, реализующего поиск множества закономерностей. Входным параметром алгоритма, помимо набора комплексных предикатов Р, также является глубина базового перебора (1, где (1 > 1 - натуральное число.

На первом шаге генерируем множество ВНР \ всех правил единичной длины, имеющих следующий вид Р —> г, Р € Р. Все правила ВНР\ проходят проверку на выполнение условий принадлежности к закономерностям. Правила, прошедшие проверку, будут являться закономерностями. Обозначим через НЕС\ множество всех таких закономерностей, обнаруженных на первом шаге.

На шаге к < d генерируется множество RULk = Spec(RULk-i) всех уточнений правил, сгенерированных на предыдущем шаге. Все правила из RULk проходят проверку на выполнение условий принадлежности к закономерностям. Обозначим через REG к полученное множество закономерностей.

На шаге I > d генерируется множество RlJLi = Spec(REGi_ 1) уточнений всех закономерностей, обнаруженных на предыдущем шаге. Все правила из RULi проходят проверку на выполнение условий принадлежности к закономерностям. Обозначим REGi — множество всех закономерностей, обнаруженных на данном шаге.

Алгоритм останавливается на шаге т > d, когда не обнаружено новых закономерностей REGm = 0.

Результирующее множеством закономерностей является объединение всех множеств обнаруженных закономерностей REG = IJ REGi.

г

Шаги алгоритма к < d соответствуют базовому перебору, а шаги к > d - дополнительному перебору.

Оценка математического ожидания награды для правил осуществляется по множеству данных, хранящих статистику работы системы (показания сенсоров, команды действий и полученная награда), следующим образом: г = Yl,ri 1Л> гДе I ~ множество событий, когда

Ш /

правило может быть применено, Гг — награда нейрона для г-го события, г € / .

Преимущество использования семантического вероятностного вывода и правил вида (1.1) состоит в организации поиска правил таким образом, что сначала алгоритм будет обнаруживать более простые стратегии управления, которые задаются простыми правилами, описывающими одинаковые действия для одиночных групп модулей, а только затем — более сложные, включающие действия других групп модулей. При этом усложнение правил за счет добавления новых групп модулей будет происходить ровно до тех пор, пока возрастает эффективность управления, дальнейшее усложнение уже не имеет смысла. В результате в задачах управления модульными роботами, предложенный подход позволяет существенно сократить время поиска решения.

Функционирование системы управления происходит следующим образом. В каждый момент времени на вход системы поступает сенсорная информация от всех модулей. В процессе принятия решения система среди всех правил, применимых к текущей ситуации, выбирает одно правило, имеющее максимальное значение математического ожидания награды. После чего отправляются на выполнение команды действий, указанные в условии этого правила. В начальной стадии работы, когда еще нет правил, действия осуществляются случайным образом. После выполнения действий обновляются статистические данные, и запуска-

ется процесс обучения, в ходе которого ищутся новые и корректируются текущие правила.

4. Эксперименты по обучению моделей роботов

Для оценки эффективности предложенной модели системы управления были проведены эксперименты по обучению виртуальных моделей роботов способам передвижения вперед. Целью экспериментальных исследований являлась проверка универсальности модели, т. е. что система способна самостоятельно, без участия человека, настроиться и научиться управлять любой заданной конструкцией, используя только информацию о взаимодействии системы с окружающей средой и описание конструкции в виде дерева элементов. Суть эксперимента заключается в том, чтобы сгенерировать всевозможные конструкции роботов из заданного количества модулей и для каждой конструкции проверить, сможет ли система управления в результате самообучения выработать для нее эффективный способ передвижения вперед.

На конструкции роботов, участвовавших в экспериментах, был наложен ряд ограничений:

1) рассматривались только плоские конструкции, у которых все модули состыкованы только в одной горизонтальной плоскости;

2) конструкции обязательно должны были содержать ряд соединенных друг за другом модулей, играющих роль позвоночника, от которого могли отходить конечности;

3) конструкции должны были быть симметричны относительно позвоночника;

4) длина конечностей не должна превышать длину позвоночника;

5) общее количество модулей во всех конструкциях было равно 10.

Таким образом, с учетом наложенных ограничений, в эксперименте участвовало 23 робота с различными конструкциями. Некоторые примеры роботов приведены на рис. 2.

Эксперименты проводились в программной среде, моделирующей трехмерное пространство и законы механики реального мира. Программа обладает возможностями автоматически генерировать виртуальные модели роботов, основываясь на описании их конструкции в виде дерева элементов, и проводить эксперименты по обучению созданных моделей.

Набор базовых логических предикатов системы управления в экспериментах был задан следующим образом. Модульные сенсорные предикаты € в описывали горизонтальные и вертикальные углы поворотов

Рис. 2. Примеры конструкций роботов

модулей относительно их точки соединения. Модульные активирующие предикаты А^ € А описывали команды угловым двигателям, вращающие модули относительно точки соединения на заданный угол в вертикальной и горизонтальной плоскостях. Модульные предикаты М^ € М были заданы на дереве элементов таким образом, чтобы определять точки ветвления дерева, которые, по сути, являются суставами конечностей. В качестве функции награды для системы управления выступала скорость передвижения, которую разовьет робот: чем выше скорость, тем выше награда.

Результаты экспериментов показали, что система управления для каждой конструкции робота успешно обучается эффективным способам передвижения вперед. Время обучения различных конструкций варьируется от 1000 до 5000 тактов работы.

5. Заключение

В данной работе предложен логико-вероятностный подход к адаптивному управлению модульными роботами с произвольной конструкцией в рамках заданного класса. Основным преимуществом подхода является возможность обучения системы управления с учетом информации о конструкции робота, что позволяет автоматически настраиваться на управление роботами с различными конструкциями. Конечно, предложенная модель все равно требует некоторой изначальной настройки

— человеку, как минимум, необходимо задать набор базовых логических предикатов. При этом типы походок, которые сможет обнаружить система, будут напрямую зависеть от заданного набора, особенно от набора модульных предикатов, поскольку именно они определяют, какие группы модулей могут быть задействованы в процессе поиска. Но существенное отличие предложенного подхода заключается в том, что изначальную настройку нужно производить не для каждой отдельной конструкции робота, а сразу для всего класса конструкций, что существенно уменьшает необходимость участия человека в процессе. При этом на практике появляется возможность заранее подготавливать наборы предикатов для целых классов роботов.

Список литературы

1. Витяев Е. Е. Извлечение знаний из данных. Компьютерное познание. Модели когнитивных процессов. Новосибирск : НГУ, 2006. 293 с.

2. Демин А. В. Адаптивное управление роботами с модульной конструкцией // Системы управления, связи и безопасности. 2015. № 4. С. 180-197.

3. Демин А. В., Витяев Е. Е. Логическая модель адаптивной системы управления // Нейроинформатика. 2008. Т. 3, № 1. С. 79-107.

4. Демин А. В. Логико-вероятностный метод управления модульными роботами // Системная информатика. 2017. № 11. С. 61-79. https://doi.org/10.31144/si.2307-6410.2017.nll.p61-80

5. Brunete A., Ranganath A., Segovia S., de Frutos J.P., Hernando M., Gambao E. Current trends in reconfigurable modular robots design // International Journal of Advanced Robotic Systems. 2017. Vol. 14 (3). R 1-21. https://doi.org/10.1177/1729881417710457

6. Christensen D. J., Bordignon M., Schultz U. P., Shaikh D., Stoy K. Morphology independent learning in modular robots // Proceedings of International Symposium on Distributed Autonomous Robotic Systems 8 (DARS 2008). 2008. P. 379-391. https://doi.org/10.1007/978-3-642-00644-9_34

7. Demin A. V., Vityaev E. E. Adaptive Control of Modular Robots // Biologically Inspired Cognitive Architectures (BICA) for Young Scientists, Advances in Intelligent Systems and Computing 636 / A. V. Samsonovich, V. V. Klimov (eds.). Springer, 2018. P. 204-212. https://doi.org/10.1007/978-3-319-63940-6_29

8. Demin A. V., Vityaev E. E. Learning in a virtual model of the C. Elegans nematode for locomotion and chemotaxis // Biologically Inspired Cognitive Architectures (2014). Elsevier, 2014. Vol. 7. P. 9-14. https://doi.Org/10.1016/j.bica.2013.ll.005

9. Ito K., Matsuno F. Control of hyper-redundant robot using QDSEGA // Proceedings of the 41st SICE Annual Conference (2002). 2002. Vol. 3. P. 1499-1504.

10. Kamimura A., Kurokawa H., Yoshida E., Tomita K., Murata S., Kokaji S. Automatic locomotion pattern generation for modular robots // Proceedings of 2003 IEEE International Conference on Robotics and Automation. 2003. P. 714-720.

11. Marbach D., Ijspeert A. J. Co-evolution of configuration and control for homogenous modular robots // Proceedings of the eighth conference on Intelligent Autonomous Systems (IAS8). IOS Press, 2004. P. 712-719.

12. Stoy K., Brandt D., Christensen D. J. Self-Reconfigurable robots: an introduction // Intellegent robotics and autonomous agents series. MIT Press, 2010. 216 p.

13. Valsalam V. К. Miikkulainen R. Modular neuroevolution for multilegged locomotion // In Proceedings of GECCO. 2008. P. 265-272. https://doi.org/10.1145/1389095.1389136

14. Yim M. H., Duff D. G., Roufas K. D. Modular reconfigurable robots, an approach to urban search and rescue // 1st International Workshop on Human Welfare Robotics Systems (HWRS-2000). 2000. P. 19-20.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Александр Викторович Демин, кандидат физико-математических наук, Институт математики им. С. JI. Соболева, Институт систем информатики им. А. П. Ершова, Российская Федерация, 630090, г. Новосибирск, пр. Лаврентьева, 6 тел.: (383)3306660 (e-mail: alexandredemin@yaiidex.ru)

Поступила в редакцию 11.05.19

Adaptive Control of Modular Robots with Arbitrarily Specified Design

A. V. Demin

Ershov Institute of Informatics Systems, Sobolev Institute of Mathematics, Novosibirsk, Russian Federation

Abstract. Development of modular robot control systems poses serious challenges associated with the robot's construction subject to changes and the presence of a large number of degrees of freedom. The goal of this work was developing a versatile control system for modular hyper-redundant systems, able of independently finding ways to control robots with an arbitrary design from a certain given class. For solving the problem, a model of a control system was proposed, using logical-probabilistic knowledge discovery methods, adapted for control tasks. In accordance with the proposed approach, the task of control system training was reduced to finding patterns in an array of system's environment interaction statistical data. For making the system independent on the chosen robot design, including modules' spatial connection data specified in a data tree was proposed. Using this information during the training process allows the control system to independently tune in to control the robot, regardless of its design. For testing the proposed model's performance and effectiveness, experiments in training a class of robots with different designs to move forward, which have confirmed both the learning rate and control quality being high.

Keywords: modular robots, adaptive control, logical-probabilistic knowledge discovery method.

References

1. Vityaev E.E. Extracting Knowledge from Data. Computer Cognition. Models of Cognitive Processes. Novosibirsk, Novosibirsk State University Publ., 2006, 293 p. (in Russian)

2. Demin A.V. Adaptive Control of Robotw with Modular Design. Systemy Upravlenia, svyazi i bezopasnosti, 2015, no. 4, pp. 180-197 (in Russian).

3. Demin A.V., Vityaev E.E. A Logical Model of an Adaptive Control System. Neiroinformatika, 2008, vol. 3, no. 1, pp. 79-107. (in Russian).

4. Demin A.V. Logical-Probabilistic Method for Modular Robots Control. Sistemnaya informatika, 2017, no. 11, pp. 61-79. (in Russian). https://doi.org/10.31144/si.2307-6410.2017.nll.p61-80

5. Brunete A., Ranganath A., Segovia S., de Frutos J.P., Hernando M., Gambao E. Current trends in reconfigurable modular robots design. International Journal of Advanced Robotic Systems, 2017, vol. 14 (3), pp. 1-21. https://doi.org/10.1177/1729881417710457

6. Christensen D.J., Bordignon M., Schultz U.P., Shaikh D., Stoy K. Morphology independent learning in modular robots. Proceedings of International Symposium on Distributed Autonomous Robotic Systems 8 (DARS 2008), 2008, pp. 379-391. https://doi.org/10.1007/978-3-642-00644-9_34

7. Demin A.V., Vityaev E.E. Adaptive Control of Modular Robots. In: A.V. Samsonovich and V.V. Klimov (eds.), Biologically Inspired Cognitive Architectures (BICA) for Young Scientists, Advances in Intelligent Systems and Computing 636, Springer, 2018, pp. 204-212. https://doi.org/10.1007/978-3-319-63940-6_29

8. Demin A.V., Vityaev E.E. Learning in a virtual model of the C. Elegans nematode for locomotion and chemotaxis. In: Biologically Inspired Cognitive Architectures (2014), Elsevier, 2014, vol. 7, pp. 9-14. https://doi.Org/10.1016/j.bica.2013.ll.005

9. Ito K., Matsuno F. Control of hyper-redundant robot using QDSEGA. Proceedings of the 41st SICE Annual Conference (2002), 2002, vol. 3, pp. 1499-1504.

10. Kamimura A., Kurokawa H., Yoshida E., Tomita K., Murata S., Kokaji S. Automatic locomotion pattern generation for modular robots. Proceedings of 2003 IEEE International Conference on Robotics and Automation, 2003, pp. 714-720.

11. Marbach D., Ijspeert A.J. Co-evolution of configuration and control for homogenous modular robots. Proceedings of the eighth conference on Intelligent Autonomous Systems (IAS8), IOS Press, 2004, pp. 712-719.

12. Stoy K., Brandt D., Christensen D.J. Self-Reconfigurable Robots: an Introduction. Intellegent robotics and autonomous agents series, MIT Press, 2010, 216 p.

13. Valsalam V.K. Miikkulainen R. Modular neuroevolution for multilegged locomotion. In Proceedings of GECCO, 2008, pp. 265-272. https://doi.org/10.1145/1389095.1389136

14. Yim M.H., Duff D.G., Roufas K.D. Modular reconfigurable robots, an approach to urban search and rescue. 1st International Workshop on Human Welfare Robotics Systems (HWRS-2000), 2000, pp. 19-20.

Alexander Demin, PhD, Sobolev Institute of Mathematics, Ershov Institute of Informatics Systems 6, Lavrentyev pr., Novosibirsk, 630090, Russian Federation, tel.: +7 (383) 3306660 (e-mail: alexandredemin@yaiidex.ru)

Received 11.05.19

i Надоели баннеры? Вы всегда можете отключить рекламу.