Научная статья на тему 'ОБ ОДНОМ БИОИНСПИРИРОВАННОМ ПОДХОДЕ К ОРИЕНТАЦИИ РОБОТОВ, ИЛИ НАСТОЯЩИЙ «МУРАВЬИНЫЙ» АЛГОРИТМ'

ОБ ОДНОМ БИОИНСПИРИРОВАННОМ ПОДХОДЕ К ОРИЕНТАЦИИ РОБОТОВ, ИЛИ НАСТОЯЩИЙ «МУРАВЬИНЫЙ» АЛГОРИТМ Текст научной статьи по специальности «Математика»

CC BY
165
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОНОМНЫЙ МОБИЛЬНЫЙ РОБОТ / ГРУППОВАЯ РОБОТОТЕХНИКА / НАВИГАЦИЯ МУРАВЬЕВ / РАСПОЗНАВАНИЕ СЦЕН / ПРОСТРАНСТВЕННО-ВРЕМЕННАЯ ОРИЕНТАЦИЯ / ЗАДАЧИ ФУРАЖИРОВКИ И ПАТРУЛИРОВАНИЯ

Аннотация научной статьи по математике, автор научной работы — Карпова Ирина Петровна

Описывается биоинспирированный механизм навигации мобильных роботов, подобный тому, который используют общественные насекомые. Модельным видом является Formica rufa - рыжий лесной муравей. Муравей-разведчик этого вида не только запоминает маршрут до пищи, но умеет передавать муравьям-фуражирам сведения о местонахождении пищи, и те самостоятельно могут до нее дойти и вернуться домой. Рассмотрены основные аспекты навигации муравьев, которые ориентируются по поляризации освещенного неба, данным одометрии и визуальным ориентирам. В основу предлагаемого метода положено запоминание пути по визуальным ориентирам с учетом показаний компаса и временной составляющей. Путь рассматривается как последовательность сцен, образуемых ориентирами. При этом важно, что маршруты как агента-разведчика, так и фуражира определяются как переходы от ориентира к ориентиру. Создана модель поведения агента (робота), которая оперирует исключительно относительными категориями, без привязки к абсолютным физическим величинам. Управление роботами реализовано с помощью конечных автоматов, образующих трехуровневую архитектуру. Приведены результаты имитационного моделирования для решения задачи фуражировки, подтверждающие работоспособность предложенного метода. Реализация метода проверена на реальных роботах. Показано, что благодаря специфическим архитектурным и техническим решениям возможен переход от имитационных моделей к управлению техническими объектами (роботами), минуя стадию физического моделирования. Метод не требует от робота больших вычислительных мощностей и развитых сенсорных возможностей и может также применяться в задачах разведки и патрулирования в групповой робототехнике.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Карпова Ирина Петровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A BIOINSPIRED APPROACH TO ROBOT ORIENTATION OR A REAL «ANT» ALGORITHM

The paper describes a bioinspired method of mobile robots navigation, similar to the navigation mechanism of social insects. The model species is the red forest ant Formica rufa. The scout red forest ant remembers the route to food and can transmit information about the food location to foraging ants. Foragers can on their own walk to the food and return home. These ants are guided by the skylight compass, odometry data and visual landmarks. The proposed method is based on memorizing the path by visual landmarks, compass data and time component. A path is defined as a sequence of scenes consisting of landmarks. The scout route and forager route are defined as transitions from one landmark to another. The created behavior model of an animate (robot) operates only with relative categories. The results of simulation modeling for solving the foraging problem are presented. The method has been tested on real robots. Due to specific architectural and technical solutions, the transition from simulation models to the management of technical objects (robots) is carried out without the stage of physical modeling. The method can also be used in reconnaissance and patrol tasks in group robotics.

Текст научной работы на тему «ОБ ОДНОМ БИОИНСПИРИРОВАННОМ ПОДХОДЕ К ОРИЕНТАЦИИ РОБОТОВ, ИЛИ НАСТОЯЩИЙ «МУРАВЬИНЫЙ» АЛГОРИТМ»

ОБ ОДНОМ БИОИНСПИРИРОВАННОМ ПОДХОДЕ

К ОРИЕНТАЦИИ РОБОТОВ, ИЛИ НАСТОЯЩИЙ «МУРАВЬИНЫЙ» АЛГОРИТМ

Карпова И. П.1

(Национальный исследовательский университет «Высшая школа экономики», Москва)

Описывается биоинспирированный механизм навигации мобильных роботов, подобный тому, который используют общественные насекомые. Модельным видом является Formica rufa - рыжий лесной муравей. Муравей-разведчик этого вида не только запоминает маршрут до пищи, но умеет передавать муравьям-фуражирам сведения о местонахождении пищи, и те самостоятельно могут до нее дойти и вернуться домой. Рассмотрены основные аспекты навигации муравьев, которые ориентируются по поляризации освещенного неба, данным одометрии и визуальным ориентирам. В основу предлагаемого метода положено запоминание пути по визуальным ориентирам с учетом показаний компаса и временной составляющей. Путь рассматривается как последовательность сцен, образуемых ориентирами. При этом важно, что маршруты как агента-разведчика, так и фуражира определяются как переходы от ориентира к ориентиру. Создана модель поведения агента (робота), которая оперирует исключительно относительными категориями, без привязки к абсолютным физическим величинам. Управление роботами реализовано с помощью конечных автоматов, образующих трехуровневую архитектуру. Приведены результаты имитационного моделирования для решения задачи фуражировки, подтверждающие работоспособность предложенного метода. Реализация метода проверена на реальных роботах. Показано, что благодаря специфическим архитектурным и техническим решениям возможен переход от имитационных моделей к управлению техническими объектами (роботами), минуя стадию физического моделирования. Метод не требует от робота больших вычислительных мощностей и развитых сенсорных возможностей и может также применяться в задачах разведки и патрулирования в групповой робототехнике.

Ключевые слова: автономный мобильный робот, групповая робототехника, навигация муравьев, распознавание сцен, пространственно-временная ориентация, задачи фуражировки и патрулирования.

1 Ирина Петровна Карпова, к.т.н., доцент (karpova_ip@mail.ru).

Управление большими системами. Выпуск 96 1. Введение

Ориентация в пространстве, способность к реализации эффективных поисковых стратегий, запоминание и дальнейшая отработка маршрута - все это относится к важнейшим базовым механизмам мобильной робототехники. Среди множества методов решения этих задач особое место занимают так называемые биологически инспирированные методы ориентации и навигации в целом. За основу берутся некоторые механизмы ориентации, присущие тем или иным животным, чаще всего - насекомым. И тогда появляются различного рода пчелиные алгоритмы, алгоритмы стаи волков, методы косяка рыб и, разумеется, «муравьиные» алгоритмы (ant colony optimization algorithms). Как методы поисковой оптимизации, эти модели вполне успешно решают широкий спектр задач. Проблема лишь в том, что обычно они имеют слабое отношение к реальным биологическим или поведенческим механизмам, наблюдаемым в животном мире. Тот же муравьиный алгоритм подразумевает, что муравей или его аналог оставляет некий феромонный след; на этом, собственно, и строятся все дальнейшие рассуждения [17]. Однако, во-первых, далеко не все муравьи метят дорогу феромонами. Во-вторых, даже при использовании феромонов должна осуществляться разведка, во время которой особи должны ориентироваться в пространстве [10]. Кроме того, механизмы ориентации насекомых, использующих зрительное восприятие и реализующих пространственные и временные оценки (если не рассуждения) оказываются гораздо глубже и важнее для развития методов навигации искусственных агентов - мобильных роботов.

В этой работе рассматривается метод ориентации и навигации роботов (аниматов), который имитирует навигационное поведение муравьев Formica rufa в ходе коллективной фуражировки. Решается задача моделирования поискового поведения, которая является базовым компонентом задач поиска, транспортировки, разведки, патрулирования и т.д.

Важно, что модельный объект (муравей) в данном случае рассматривается с внешней, феноменологической точки зрения, но биологическая, а точнее, этологическая основа играет реша-

ющую роль. Этот подход относится к направлению развития групповой робототехники, связанному с моделированием социального поведения [5].

Дадим некоторые пояснения по используемой терминологии. Объектом исследования является искусственный автономный агент, действующий в виртуальной или реальной среде и имитирующий поведение живого организма [37], поэтому в тексте чаще используется термин анимат. Если же речь идет о роботах, то это касается проведения натурных экспериментов и возможностей дальнейшего применения метода для решения реальных задач.

Структура работы такова. В следующем разделе содержится краткий обзор биоинспирированных систем навигации роботов с указанием их отличий от рассматриваемого подхода. В разделе 3 описываются основные особенности механизмов ориентации муравьев, на которых базируется предлагаемый метод. Затем приводятся разработанные алгоритмы действий ани-матов, имитирующих поведение разведчика и фуражира при решении задачи фуражировки. Раздел 5 содержит описание возможностей анимата и условий его функционирования, а также переход к относительным величинам для формирования модели поведения анимата (робота). Далее приводится собственно предлагаемый метод ориентации аниматов по визуальным ориентирам, в основе которого лежит распознавание сцен и выделение в них опорного ориентира. В разделе 7 описывается архитектура системы управления анимата. Далее приводятся результаты имитационного и натурного моделирования, описываются изменения, которые потребовалось вносить в управляющую программу при переходе от виртуальной модели к управлению реальным роботом. Также раздел 8 включает обсуждение полученных результатов и их сравнение с данными по модельному виду Formica rufa. Заключение содержит общие выводы по работе и описание возможных изменений, которые позволят перейти от задачи фуражировки к решению других схожих задач.

2. Краткий обзор природоподобных систем ориентации и навигации роботов

Многие исследователи в области автономных мобильных роботов (АМР) изучают принципы навигации муравьев для их использования в качестве основы при разработке методов навигации и ориентации АМР. Например, в работе [16] предлагается метод ориентации на основе искусственной нейронной сети, использующей визуальные ориентиры и реализующей систему интеграции пути, аналогичную той, которая есть у муравьев. Имитационное моделирование подтверждает, что подобная система позволяет искусственному агенту хорошо ориентироваться, и это поведение можно объяснить без предположения о существовании когнитивной карты как общего представления о поисковом пространстве.

Если же говорить об исследованиях, в которых навигационный механизм муравьев используется для организации перемещения автономных роботов, то одной из первых в этой области можно считать работу [22]. Там авторы описывают робота, оснащенного компасом, имеющего систему интеграции пути и использующего данные энкодеров. Специальный компас позволял роботу ориентироваться по поляризации солнечного света, аналогично муравью, и робот мог вернуться в точку отправления после прохождения маршрута, состоящего из нескольких отрезков.

В статье [20] описывается модель векторной навигации искусственных агентов на основе искусственной нейронной сети. Модель состоит из механизма интеграции путей, глобального обучения с модуляцией вознаграждения, случайного поиска и выбора действий. Механизм интеграции путей объединяет данные компаса и одометрии для вычисления векторного представления текущего местоположения агента в виде паттернов нейронной активности. В этой работе исследователи опираются на данные об активности нейронов центральной нервной системы муравьев, т.е. учитывают их морфологические особенности. Предложенный метод был проверен с помощью имитационного моделирования на задаче случайного блуждания и возвращения домой.

Вообще задача произвольного перемещения по полигону с возможностью возвращения домой (англ. homing) разработана достаточно подробно (например, [32, 40]). Уделяется большое внимание и решению задачи организации памяти (представлению маршрута в памяти). Например, в [31] предложен механизм хранения маршрута в виде дерева, позволяющий не учитывать метрические размеры отрезков, а только топологию расположения ориентиров.

Другой способ представления маршрута в памяти робота и правила его интерпретации для повторного прохождения по маршруту описаны в [9]. Предложенный механизм вычислительно прост, однако имеет ограничения в виде необходимости использования цвета ориентира как его уникального идентификатора и необходимости видеть хотя бы один ориентир из любой точки полигона. Вследствие этого полигон должен быть оснащен ориентирами разных цветов, а робот должен уметь их все различать. Это само по себе является технически достаточно сложной задачей и требует использования высокоточных сенсоров, что ограничивает применение этого метода. Аналогичным образом, в работе [13] предлагаемый метод требует наличия ориентиров с уникальными идентификаторами.

Цель данной работы - создать метод, позволяющий роботам ориентироваться на реальном полигоне без построения карты и использования средств глобальной навигации. Этот метод имитирует навигационное поведение муравьев и предполагает обмен данными о маршруте между роботами. Метод должен включать механизм запоминания и интерпретации описания маршрута, который позволит роботу ориентироваться на реальном полигоне в рамках решения различных задач. Модель поведения анимата (робота) должна оперировать исключительно относительными категориями, без привязки к абсолютным физическим величинам. Механизм должен быть вычислительно простым, а описание маршрута должно быть максимально компактным, чтобы роботы могли обмениваться им между собою по низкоскоростным каналам связи. Он не должен требовать однозначной идентификации объектов (ориентиров) и должен работать в условиях, когда на полигоне есть точки, из которых ориентиры не видны.

Для достижения этой цели необходимо изучить механизм ориентации муравьев Formica rufa и создать его модель (на поведенческом уровне, но как можно ближе к оригиналу).

3. Ориентация муравьев: основные аспекты

Многие животные, в том числе насекомые, используют для ориентации в пространстве комбинацию различных стратегий. Считается, что муравьи не строят карту местности [16], а для определения направления движения в основном используют солнечный свет (точнее, поляризацию освещенного неба) и визуальные ориентиры [23, 35]. Некоторые виды муравьев используют также феромонный след [36], но в данной работе этот аспект не затрагивается, так как имитация феромонов, во-первых, требует специально оборудованного полигона, а во-вторых, фе-ромонная навигация не отвечает на основной вопрос - как ориентируются в пространстве животные и как может воспринимать мир робот.

Во многих работах, посвященных применению навигационных механизмов муравьев в робототехнике, модельным объектом является пустынный муравей - desert ant (например, [22]). Пустынные муравьи занимаются одиночной фуражировкой. Нас же интересует не только поиск еды (или ресурсов в общем случае) и возвращение особи домой (в гнездо), но и возможность передачи сведений о маршруте от одной особи к другой - пассивному фуражиру. Пассивный фуражир не занимается поиском еды, но может быть мобилизован для переноса еды активным фуражиром - разведчиком. Единственным видом, у которого к настоящему времени обнаружен такой вариант фуражировки, является Formica rufa - рыжий лесной муравей [28]. Муравьи-разведчики Formica rufa под действием голода периодически отправляются на поиски еды. Найдя еду и запомнив дорогу к ней, они возвращаются в гнездо и могут повести пассивных фуражиров за собой, чтобы перенести еду в гнездо. Но возможен также и другой вариант: разведчик передает фуражиру сведения о маршруте до еды, и тот самостоятельно идет за ней ([2] - натурные наблюдения, [30] - лабораторные опыты).

Последняя возможность имеет исключительно важное значение для применения навигационных механизмов муравьев в групповой робототехнике. Если муравей-разведчик ведет фуражиров за собой, то он может повести 2-3 особи [1], которые видят его непосредственно и могут следовать за ним, не теряя его из виду. Если же роботы-фуражиры будут следовать за лидером, то придется решать задачу передвижения группы роботов, используя, например, искусственный прием типа маяка на роботе-разведчике или имитируя контагиозное поведение. Но при передаче описания маршрута от разведчика фуражирам таких сложностей и серьезных ограничений нет: все фуражиры, находящиеся в зоне устойчивого приема сигнала, могут принять это описание (и обмениваться им), а дальше действовать самостоятельно. Передача данных между роботами может осуществляться по локальному каналу связи, например, через bluetooth или ИК-канал [10].

Для реализации подобного подхода предлагаемый метод должен описывать маршрут в краткой форме. В экспериментальных исследованиях [27, 30] было показано, что усложнение маршрута ведет к увеличению времени на его передачу от разведчика фуражиру, а также к увеличению количества неудач при прохождении маршрута фуражиром. Маршрут в этих опытах задавался последовательностью поворотов в лабиринте. Такая форма задания маршрута вполне допустима, так как в природе рыжие лесные муравьи перемещаются по так называемым дорогам (рис. 1) - протоптанным муравьями тропам с ветвистой структурой, и их маршрут может быть представлен как последовательность поворотов.

Конечно, имитируя природоподобные механизмы на робо-тотехнических устройствах, мы могли бы отказаться от жестких ограничений по объему памяти и скорости передачи данных. Но чем дальше мы будем отходить от первоисточника, тем меньше у нас будет прав ссылаться на работы биологов и относить наш подход к природоподобным технологиям. Более того, в этом исследовании во время проведения экспериментов выяснилось, что исключение некоторых элементов механизма ориентации муравьев или применение более простых технических решений приводят к неустойчивой работе метода. И только в случае реа-

лизации, максимально близкой к тому, что наблюдается у муравьев, метод работает устойчиво даже в сложных условиях - при малом или, наоборот, очень большом количестве ориентиров.

Рис. 1. Муравейник с четырями колоннами и дорогами, по А. Захарову [3]

Опишем основные аспекты навигационного поведения муравьев, опираясь на наблюдения за поведением муравьев в ходе перемещения на местности и фуражировки:

1. При перемещении на местности муравьи используют внутренний компас, включающий Солнце (поляризацию освещенного неба или рассеянного солнечного света), одометриче-скую информацию (шагомер) и систему интеграции пути (path integration) [16, 23]. Под одометрией (odometer information) здесь понимается использование данных о движении муравья для оценки его перемещения. А система интеграции пути во время движения постоянно обновляет вектор, который указывает фактическое направление обратно на муравейник (гнездо).

2. Компас и шагомер подвержены кумулятивным ошибкам [33], поэтому для навигации муравьи также используют визуальные ориентиры (камни, отдельные растения и другие ориентиры, которые выделяются на местности). Более того, для опытных фуражиров информация, предоставляемая визуальными ориентирами, доминирует над информацией от системы интеграции пути в случае их конфликта [24, 39].

3. Считается, что муравьи ведут себя так, как будто они запоминают образы сцен с ориентирами, видимых с определенных

точек обзора, и сохраняют эти образы в памяти. Затем при повторном приближении к ориентиру они сравнивают сохраненные «снимки» с текущими, пытаясь занять ту же самую позицию [34]. Судя по поведению муравья при запоминании сцены, он осматривает составляющие ее ориентиры, выбирает один (опорный), а затем обходит его справа или слева. Это предположение подтверждается тем, что при повторном прохождении этого маршрута муравей стремится обойти знакомый ориентир с той же стороны, даже если ориентир переместили левее или правее начального положения [38].

4. Вероятно, муравьи различают два типа ориентиров, которые можно назвать локальными и путевыми. Первые расположены вблизи гнезда и около постоянных кормовых участков, вторые - на пути к кормовому участку или обратно. Обнаружение путевого ориентира заставляет муравья поворачивать под нужным углом и продолжать движение. Также распознавание путевого ориентира подавляет влияние локального вектора движения, заданного предыдущим ориентиром [16]. Обнаружение локального ориентира запускает процедуру систематического поиска: муравей знает, что гнездо (или еда) находятся рядом, и начинает методично кружить вокруг этого места, пока не найдет искомое.

5. При обнаружении во время прохождения маршрута искомого объекта (еды или другого ресурса) пассивный фуражир прекращает движение по маршруту и идет в сторону объекта, чтобы взять его и перенести в гнездо. Таким образом, маршрут может оказаться пройденным не до конца, но это нормально, так как цель прохождения маршрута - обнаружение ресурса, а не повторение маршрута.

6. Правила, по которым муравей из множества ориентиров выбирает «опорный», в литературе не описаны. Но у рыжих лесных муравьев все поисковые участки около гнезда распределены между колоннами (кланами) этого гнезда (рис. 1 ), и муравей-разведчик в процессе поиска старается оставаться в пределах «своего» сектора, т.е. придерживается некоего общего направления поиска. Кроме того, резкие повороты в пути чаще приводят к неудачному поиску, что показано как для пустынных муравьев [15], так и для лесных [28]. Поэтому мы будем счи-

тать, что муравей выбирает ориентиры, расположенные прямо перед ним, а если их нет, то ориентиры правее или левее. В отсутствие ориентиров он идет прямо.

Очевидно, что правило выбора ориентира для конкретной технической системы можно поменять и выбирать, например, поочередно левый и правый объекты. Главное, чтобы последователь использовал бы те же правила и совершал аналогичные разведчику действия при поиске потерянного ориентира.

Далее рассмотрим, как в целом должны действовать разведчики и фуражиры в процессе фуражировки. Под фуражировкой здесь понимается поиск на полигоне некоторого ресурса, местоположение которого изначально неизвестно, и перенос его на базу (по частям, т.е. порциями, с которыми может справиться один робот). Более подробно особенности фуражировки описаны в [10].

4. Настоящий муравьиный алгоритм

Начнем с объяснения подзаголовка данной статьи. В отечественной литературе за ранее упомянутым термином «ant colony optimization algorithm» при переводе на руский язык закрепился перевод «муравьиный алгоритм». Возможно, это связано с тем, что развитие этой группы методов началось с работы «Ant system: Optimization by a colony of cooperating agents» [18]. Но для оптимизационных алгоритмов, учитывающий единственный эффект феромонного следа, такое название является слишком общим и не отражает сути данных методов. С другой стороны, представленные ниже алгоритмы более целостным образом имитируют поведение муравьев, которое разведчики и фуражиры демонстрируют во время фуражировки. Таким образом, эти алгоритмы с большим основанием можно называть муравьиными алгоритмами, чем те, которые принято так называть сейчас.

Итак, задача фуражировки разбивается на три этапа: найти искомый объект, перенести его «домой» (вернувшись в точку отправления) и при необходимости повторить этот путь. В процессе поиска пищи у муравьев рода Формика [2] разведчик запоминает свое положение относительно солнца, визуальные ориентиры, мимо которых он проходит, и примерное расстояние

до них. Это позволяет ему вернуться обратно в гнездо и передавать фуражирам сведения о маршруте так, чтобы они могли дойти до этой пищи [3]. Исходя из этого и опираясь на особенности навигации муравьев, общий алгоритм действий разведчика представляется таким (рис. 2):

1. Анимат-разведчик начинает путь от «дома». Если он не видит ни одного ориентира, он идет вперед, пока не увидит хотя бы один ориентир.

2. Если в процессе перемещения анимат видит искомый объект, он запоминает текущую сцену как элемент описания маршрута и идет к искомому объекту.

3. Из видимых ориентиров он выбирает опорный ориентир, направление его обхода (слева или справа) и запоминает его как элемент описания маршрута.

4. Анимат совершает обход опорного ориентира.

5. Если после завершения обхода опорного ориентира он видит хотя бы один новый ориентир, он переходит к п. 3. Если не видит ни одного, совершает поворот до тех пор, пока не увидит подходящий ориентир. (Он поворачивает налево, если обходил ориентир слева, и направо в противном случае).

6. После нахождения пищи анимат возвращается домой, используя данные компаса, и передает описание маршрута второму анимату (фуражиру).

Анимат-фуражир действует по похожему алгоритму (рис 3), но не ищет новый ориентир, а сопоставляет сцены из маршрута с тем, что видит вокруг себя. (На рис. 3 изменения по сравнению с алгоритмом действий разведчика выделены серым). При успешном сопоставлении сцен фуражир обходит опорный ориентир и переходит к следующей сцене. При неудаче запускает процедуру поиска опорного ориентира в текущей или следующей сцене, аналогично муравью, потерявшему ориентир. Если текущая сцена является последней, фуражир запускает процедуру систематического поиска.

Рис. 2. Общий алгоритм действий анимата-разведчика

Рис. 3. Общий алгоритм действий анимата-фуражира

Сопоставление со следующей сценой анимат начинает выполнять, если поиск в текущей сцене неудачен и истекло не менее половины времени (числа тактов), которое анимат должен был провести на данном отрезке пути. При этом видимая сцена сопоставляется как с текущей, так и со следующей сценой маршрута. В качестве обоснования выбора именно половины длины отрезка как реперной точки использовались данные о поведении Ме1ор^гш bagoti. В отсутствие знакомых ориентиров они прибегают к интеграции пути и начинают двигаться в сторону, где предположительно находится гнездо, осматривая окружающую местность. Но поиск М. bagoti начинается не там, где должно находиться гнездо, а примерно на полпути между источником пищи и местом расположения гнезда [25]. Предполагается, что муравьи при этом ищут знакомые визуальные сигналы вдоль маршрута, а не само гнездо.

Таким образом, в данном методе не используется одомет-рическая информация. Вместо этого запоминается примерное время прохождения каждого отрезка пути. Но и эта информация используется только в том случае, если не видны знакомые ориентиры. Это возможно благодаря тому, что нет необходимости повторять маршрут с высокой точностью, и описание маршрута определяет визуальный коридор, а не узкую дорогу [14].

При поиске фуражир соблюдает общее направление движения на текущем отрезке пути в соответствии с данными компаса. Механизм реализации компаса в данном случае несущественен. В реальных условиях это может быть как информация, полученная извне, так и некий «внутренний» датчик, который имитирует компас насекомых (например, как в [19]). Заметим, что в данной работе для имитации компаса при моделировании использовалась информация от полигона, а реальный робот был оснащен электронным компасом с погрешностью 2-4°.

5. Мир анимата

Определим, как можно представить мир анимата и какими возможностями он должен обладать для реализации такого поведения. При этом необходимо учитывать, что создаваемая мо-

дель должна оперировать исключительно относительными категориями, без привязки к абсолютным физическим величинам.

На полигоне, по которому перемещаются аниматы, расположена «база», неподвижные объекты (ориентиры) и некоторые целевые объекты («пища», которую нужно перенести на «базу»). Путь - это последовательность перемещений, приводящая анимата от одного целевого объекта к другому, при этом в качестве целевых объектов могут выступать «база» или «пища». Изначально аниматы находятся около «базы», что полностью соответствует ситуации у муравьев: и разведчики, и пассивные фуражиры начинают движение от гнезда.

Анимат может двигаться вперед и назад, поворачивать направо и налево, останавливаться. У него есть локатор, с помощью которого он «видит» окружающие объекты внутри некоторой области видимости. Этот локатор с функциональной точки зрения реализует «зрение» анимата. В проведенных исследованиях угол зрения варьировался в пределах от 60 до 120°. Влияние угла обзора на поведение анимата будет обсуждено ниже. Анимат распознает цвет объектов и умеет определять расстояние до них (приблизительно) и направление (относительно себя) (рис. 4).

Рис. 4. Область видимости анимата, направление и расстояние

При этом мир анимата разбивается на клетки, размер которых определяется характерным линейным размером робота (модельным или реальным). Такие условные единицы являются удобными для описания поведения анимата, определения расстояний, скоростей и т.п., и позволяют абстрагироваться от реальных физических размеров.

Для работы с понятиями «расстояние» и «направление» были введены соответствующие порядковые шкалы. Таблица 1 содержит шкалу пересчета расстояний для радиуса видимости 20 условных единиц («клеток»), таблица 2 - шкалу пересчета направлений для области видимости в 120° (рис. 5). Естественно, конкретные диапазоны значений этих шкал могут быть заменены другими при необходимости, как и количество значений на шкале.

Таблица 1. Шкала расстояний

Расстояние (усл. ед.) Название диапазона Обозначение Значение

0-2 Очень близко NEAR 1

3-5 Близко CLOSE 2

6-10 Недалеко NOTCLOSE 3

11-15 Далеко FAR 4

16-20 Очень далеко VERYFAR 5

Таблица 2. Шкала направлений

Значение в градусах Названиедиапазона Обозначение Значение

0-23 Справа D R 1

24-47 Впереди справа D FR 2

48-71 Впереди D F 3

72-95 Впереди слева D FL 4

96-119 Слева D L 5

Пусть в мире анимата существует множество О из N распознаваемых им объектов: О = {х„}, п = 1, ..., N.

Под ориентиром будем понимать один или несколько объектов, образующих компактную группу, т.е. расположенных близко друг к другу (рис. 6). Ориентир Q образуется объектами {хп}, для которых:

(1) Q = {хг-} ({хг-} е О): Ухк е Q 3 хт- хт е Q, р(Хк, Хт) < А.

Здесь р - расстояние между объектами (например, евклидово), а А - верхняя граница диапазона «очень близко». Если необходимо учитывать наблюдаемые линейные размеры объектов, то речь пойдет о минимальном расстоянии между объектами.

Рис. 5. Диапазоны направлений для области видимости 120°

ориентиры

6. Описание метода ориентации

Принцип формирования описания пути основывается на том, что муравей-разведчик запоминает путь приблизительно и муравей-фуражир повторяет этот путь в общих чертах. Поэтому при формировании описания маршрута запоминаются сцены и ориентиры, которые анимат выбирает в качестве опорных, а также количество тактов, которые ему требуются для того, чтобы обойти этот ориентир и выбрать следующий. Таким образом в модель вводится понятие времени, которое привязано не столько к тактам (шагам анимата), сколько к изменению его состояния относительно окружающей среды (завершение одного отрезка пути и переход к следующему). Это согласуется, в частности, с идеями, изложенными в [29], что подсчет заметных визуальных изменений является основным механизмом восприятия времени.

Объекты и ориентир в целом имеют атрибуты, которые делятся на постоянные и переменные. К постоянным атрибутам можно отнести форму объектов, их линейные размеры, цвет, расстояние между объектами. Переменными являются положение объектов друг относительно друга с точки зрения анимата, расстояние от анимата до объекта и направление на него по компасу.

Для использования визуальных ориентиров в качестве своеобразных «маяков» при прохождении маршрута анимату необходимо уметь их отличать друг от друга. Наличие ориентиров с одинаковым набором постоянных атрибутов делает невозможным использование набора этих атрибутов для их идентификации. Поэтому, естественно, необходимо решать более общую задачу по распознаванию сцены [6, 11]. Сцена образуется набором видимых ориентиров и отношений между ними (на рис. 6 сцена состоит из трех ориентиров). Исходя из зрительных возможностей анимата, отношения между ориентирами могут быть такими: слева или справа, ближе или дальше. При этом возникает ряд проблем с распознаванием как сцен, так и ориентиров. Например, могут быть видны не все объекты, входящие в ориентир, при изменении ракурса одни объекты могут перекрывать другие и т.д.

Маршрут описывается как последовательность сцен Q = {Sj}, j = 1, ..., Lp, где Lp - длина маршрута. Каждая сцена Sj состоит из множества ориентиров {О/}, один из которых находится в фокусе внимания и является опорным (относительно него совершаются все действия). Каждый ориентир Oj, в свою очередь, состоит из множества наблюдаемых объектов с их характеристиками (контекстом) V: Oi = { Vk} :

Vk ={Id, X, {(dirt, disti)}, Compas, Timer}, где Id - идентификатор объекта (например, цвет); X - признак опорного ориентира (равен направлению обхода); {(dirt, distt)} -множество пар, хранящих направление и расстояние до левой границы, центра объекта и правой границы соответственно; Compas - значение датчика «компас»; Timer - номера тактов в начале и в конце отрезка пути.

Отношения «слева» и «справа» зависят от выбранного ракурса и могут меняться во время движения, расстояние также изменяется. В связи с этим можно применить подход на основе одной из разновидностей псевдофизической логики (ПФЛ) -пространственной логики. Она включает, в частности, нечеткие бинарные пространственные отношения для направлений и отношения для взаимного расположения объектов [4]. Примером применения ПФЛ для построения динамической модели окружающего мира служит работа [7], в которой начало системы координат связано с роботом и введен набор правил определения отношений между объектами окружающей среды и роботом. Аналогичным образом введем правила, определяющие возможное изменение положения объектов при выполнении аниматом элементарных действий.

Все действия анимат совершает относительно опорного ориентира (ОО). И таких действий, вообще говоря, всего три: обойти ориентир слева, справа или двигаться к нему (если речь идет об искомом объекте). В любой ситуации анимат фактически выбирает точку, принадлежащую определенному объекту, входящему в ориентир. Если анимат обходит ОО слева, то такой точкой является левая граница крайнего левого объекта ОО; если обходит справа - то правая граница крайнего правого объекта. Для искомого объекта может быть выбрана, например, точка в центре объекта. Таким образом, после выбора необходимой

точки ОО анимату не требуется на каждом шаге сложным образом сопоставлять предыдущий вид этого ориентира с наблюдаемым, учитывать смещение отдельных частей ориентира или его частичный уход из поля зрения. Достаточно сравнивать текущее и предыдущее положение границы (или другой точки) выбранного объекта.

Обозначим точку, относительно которой анимат совершает движение, как a(Id, dir, dist). Здесь Id - это цвет точки (или, в общем случае, идентификатор объекта, которому она принадлежит); dir и dist - соответственно направление на эту точку и расстояние от анимата до точки а в момент времени t. Направление и расстояние представлены здесь значениями порядковых шкал (таблица 1 и таблица 2). При движении анимата направление и расстояние могут меняться. И в следующий момент времени анимат должен определить, продолжает ли он видеть выбранную точку, и уточнить ее положение (dir и dist). Пусть a\Id, dir', dist) - точка с таким же цветом (идентификатором), видимая в момент времени (t + 1). Причем таких точек анимат может видеть несколько (к примеру, на рис. 6 анимат видит два объекта с Id = 3). Допустимость отображения а ^ а' определяется следующим образом:

(2) а ^ а':f1(dir, act) = dir' Лf2(dist, act) = dist',

где act - действие, которое производит анимат в момент времени t; f1, f - отображения направления dir в dir' и расстояния dist в dist в соответствии с действием act. Функцию отображения f для направления можно реализовать с помощью матрицы переходов:

(3) fi: M(dir, act) = dir' V dir = dir'.

Таблица 3 содержит матрицу M переходов с возможными изменениями направления на точку а в зависимости от действий анимата. (D_NOT означает уход ориентира из поля зрения, его отсутствие). Например, если ориентир был впереди (dir = 3), а анимат поворачивает налево (act = 1), то ориентир может переместиться в положение справа-впереди или останется впереди, что в форме правила можно записать так:

Если dir = «впереди» и act = «налево»,

то dir' = dir или dir' = «справа-впереди»

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 3. М - матрица переходов для правил ПФЛ

Назад Налево Вперед Направо Стоп

(0) (1) (2) (3) (4)

Отсутствует Б дат Б МОТ Б МОТ Б МОТ Б МОТ

(0)

Слева (1) Б БЬ Б БЬ Б МОТ Б МОТ Б Ь

Слева- Б б Б Б Б Ь Б Ь Б БЬ

впереди (2)

Впереди (3) Б Б Б БЯ Б Б Б БЬ Б Б

Справа- Б_Б Б_Я Б_Я Б_Б

впереди (4)

Справа (5) Б БЯ Б МОТ Б МОТ Б БЯ Б Я

С расстоянием все обстоит не так однозначно. Если для движения анимата вперед и назад возможные изменения расстояния до точки а очевидны, то с поворотами все сложнее. В модельном мире расстояние при поворотах не меняется, а для реального робота оно может увеличиться или уменьшиться. Это зависит от габаритов робота, от способа выполнения поворота (танковый поворот или обычный) и т.д. Но в любом случае это изменение должно быть монотонным, т.е. может изменяться за один шаг не более чем на 1: например, было «близко», стало «очень близко». Исходя из этого функция отображения для расстояния может быть определена следующим образом: (4) /2: \dist - disf| < 1.

Конечно, такие правила сопоставления а и а' не гарантируют отсутствие ошибок. Зато они не требуют сложных вычислений и, что важнее, соответствуют приблизительному характеру сенсорики как робота, так и муравья.

Итак, при прохождении маршрута фуражир сопоставляет видимую сцену и сцену Si из описания маршрута (} - номер сцены в описании). Сцены сравниваются как наборы ориентиров с учетом размеров, направлений и отношений между ними. Если сцены & и Si признаются похожими, то анимат разворачивается к опорному ориентиру так, чтобы видеть его с того же ракурса, что и разведчик при первом проходе. Добившись таким образом максимального соответствия сцен, он запускает процедуру обхода опорного ориентира.

В процессе сопоставления сцен приходится учитывать множество параметров, в том числе разные варианты несоответствия видимой сцены и запомненной. Неизвестно, как именно муравей воспринимает визуальные ориентиры, открытым остается множество вопросов. Если несколько объектов расположены близко друг к другу, воспринимает ли он их как один ориентир или различает по отдельности? Когда изменение ориентира проводит к тому, что муравей перестает его узнавать? Использует ли он в своей деятельности все одновременно видимые ориентиры или какую-то их часть? Возможно, это зависит, например, от сложности окружающего мира: в пустыне количество ориентиров исчезающе мало, а в лесу их слишком много. Но для практических целей оказалось, что достаточно учитывать опорный ориентир и его контекст - ориентиры слева и справа от опорного. Такой упрощенный подход может быть также обоснован сложностью среды, в которой способен функционировать анимат, исходя из его физических размеров и сенсорных способностей.

Была разработана система подсчета степени сходства для триплетов ориентиров: © = [Оь, Ос, Од}, где Ос - опорный ориентир, Оь, Ок - ориентиры слева и справа от опорного (если они есть). Выделение триплетов ©у в видимой сцене происходит так, как показано, например, на рис. 7: в первом триплете отсутствует ориентир слева от опорного (Оь), в последнем отсутствует ориентир справа от опорного (Од). Таким образом, с триплетом ©т (©т е 5м), который содержит опорный ориентир запомненной сцены и может содержать левый и правый ориентиры, будут сопоставляться такие триплеты ©у: (0, 1, 2), (1, 2, 3) и (2, 3, 0).

Для сравнения триплетов предлагается использовать ранжирование, основанное на линейной свертке критериев [12], которыми являются оценки степени сходства элементов триплетов по отдельным атрибутам. Каждый ориентир имеет множество атрибутов {Р} (0<7<N, N - общее количество атрибутов); значения атрибутов дискретны. Все атрибуты можно разделить на постоянные {Рс}} и переменные {РУн}.

^---^ \

/ / / ^ ^ \ ' ' / Ч_/ 4 X \

/ ' сС1* \ 4 I

! \ \ !

* \ А /' V у

Рис. 7. Выделение фрагментов сцены (триплетов)

Степень близости (сходства) ориентиров можно рассматривать как величину, обратную расстоянию г между ними в некотором метрическом пространстве: (5) 6 = 1/г.

Обратим внимание на то, что в мире аниматов нулевых расстояний не бывает. Даже если объекты находятся рядом, они занимают разные клетки, и минимальное расстояние между ними равно 1. Аналогично, камера робота (или дальномер) не может вернуть нулевое расстояние до объекта.

Значения ряда атрибутов имеют естественный порядок (например, расстояние до ориентира). Но нас интересует более общий случай, когда все или часть атрибутов такого порядка не имеют (например, цвет). Тогда для оценки расстояния г можно каждый атрибут представить набором шкал и ввести метрическое пространство, включающее для каждого значения каждого атрибута свою биполярную шкалу, например, (-1, 0, 1):

1 - данное значение параметра установлено для данного ориентира;

0 - значение этого параметра неизвестно для данного ориентира;

-1 - данное значение параметра не установлено для данного ориентира.

Степень сходства пары ориентиров ОУ и От (ОУ е ©У, От е ©т), занимающих одинаковое положение в триплете, может быть подсчитана следующим образом:

(6) 8х(0",0т) = ТУ=1к1С([р)]),

где к - коэффициент важности ^го атрибута (цвет, направление и т.д.); 0({р}1}) - функция, определяющая в соответствии с (5) степень близости значений по шкалам ^го атрибута (1 <] < N N - количество значений ^го атрибута). Тогда общая степень сходства триплетов:

(7) 3(в*,вт)=?11=1Сх8х(010™),

где Сх - коэффициент важности ориентира (может быть разным для опорного ориентира, левого и правого); Зх(Ох, Охт) - оценка степени сходства ориентиров (6).

Исследование метрики данного пространства признаков выходит за границы данной работы. Отметим лишь, что при моделировании неплохие результаты были получены с коэффициентами к(цвет) = 0,5, к(направление) = 0,3 и к(расстояние) = 0,2.

Сопоставлять ориентиры имеет смысл тогда, когда значения постоянных параметров позволяют предположить, что это один и тот же ориентир. Для этого вводится некоторая пороговая величина £ - граница, при достижении которой ориентир из Sv может быть сопоставлен ориентиру из Sm. Значение пороговой величины £, при котором ориентиры из сцен Sv и У сопоставляются, было определено экспертным путем и уточнено в процессе моделирования (£ = 0,5).

Общие правила распознавания сцен следующие. Если существует триплет ©У: ¿(©У, ©т) > £ и ©У - единственный в текущей сцене, то сцена считается распознанной. Если таких триплетов несколько, то в качестве базового выбирается тот, у которого степень сходства выше. Если существуют ¿(©1У, ©т) > £ и ¿(@2У, ©т) > £ и ¿(©2У, ©т) = ¿(©2У, ©т), то выбирается любой из них: это не имеет принципиального значения с учетом равной близости ориентиров маршруту и приблизительности повторного прохождения пути.

7. Организация системы управления анимата

Управление поведением анимата осуществляется на основе конечных автоматов с выходом - автоматов Мили. Архитектура системы управления является трехуровневой. Это позволяет соблюдать дисциплину иерархического управления и явным образом определять уровень управления. Автоматы нижнего уровня реализуют базовые поведенческие процедуры, на выходе этих автоматов - элементарные команды, управляющие движением анимата, и некоторые служебные действия. Мета-автоматы отвечают за последовательности действий анимата: у этологов это принято называть фиксированными комплексами действий (ФКД). Выходом мета-автоматов является запуск автоматов нижнего уровня. Мета-мета-автомат управляет поведением в целом, его задача - запускать мета-автоматы. Такая архитектура позволяет относительно просто изменять поведение анима-та без изменения его структуры, базовых возможностей и самой моделирующей программы. Таблица 4 содержит перечень всех созданных автоматов.

Таблица 4. Перечень управляющих автоматов

№ Имя автомата Назначение

1. meta_meta_fsm_Foraging Мета-мета-автомат, реализующий фуражировку.

Мета-автоматы:

2. meta_fsm_Sleep Мета-автомат, отвечающий за режим сна (отдыха).

3. meta_fsm_Search Обеспечивает поисковое поведение разведчика.

4. meta_fsm_ComeBack Имитирует возвращение разведчика на базу (в исходную точку).

5. meta_fsm_RepeatPath Реализует повторное прохождение пути фуражиром.

Автоматы:

6. fsm_FindBO Поиск базового ориентира текущей или следующей сцены. Запускается фуражиром при потере опорного ориентира.

Таблица 5 (продолжение)

7. fsm NextScene Переход к следующей сцене.

8. fsm_Choose Выбор следующего опорного ориентира.

9. fsm Forward Движение вперед.

10. fsm_Around Поворот вокруг себя: запускается при прохождении последнего отрезка пути, если искомый объект не виден. (Имитация систематического поиска).

11. fsm_Turn Поворот налево или направо (в зависимости от направления обхода предыдущего ориентира). Запускается после завершения обхода ориентира.

12. fsm_Acompas Разворот по компасу: запускается в начале прохождения каждого отрезка пути.

13. fsm BypassLeft Обход ориентира слева.

14. fsm BypassRight Обход ориентира справа.

15. fsm MoveTo Движение к ориентиру.

Привести структуру всех автоматов не представляется целесообразным, но некоторые примеры автоматов разных уровней приведены на рис. 8-10. Пометки у дуг имеют вид Condition / Action, где Condition - условие, при выполнении которого происходит переход автомата из одного состояния в другое, а Action - действие или действия, которые при этом осуществляются.

В ходе данного исследования предлагаемый метод ориентации аниматов применялся к решению задачи фуражировки. Поэтому поисковое поведение анимата-разведчика инициировалось безусловно (при запуске мета-мета-автомата, рис. 8), а инициация действий анимата-фуражира связана с получением им сведений о местоположении искомого ресурса и связанном с этим переходе из состояния «Отдых» (AgentRest) в состояние «Повтор пути» (Repeat).

Признаки и действия: Мета-автоматы:

IsActiveForaiger - это разведчик ше1а_81еер - «сон» анимата-фуражира

ОЬ)Бои^ - искомый объект найден meta_Search - поиск объекта

AgentRest - анимат «спит» meta_Comeback - возвращение в «дом»

Ьоа^Х) - загрузка автомата Х meta_Repeat - повтор пути до объекта

Рис. 8. Мета-мета-автомат «Фуражировка»

Как видно из рис. 8, мета-мета-автомат проверяет тип и состояние анимата, и для разведчика выполняется сначала поисковое поведение, затем - возвращение домой с передачей фуражиру описания маршрута. А фуражир сначала находится в состоянии сна, а после получения описания маршрута повторяет его, и работа системы в целом завершается.

Автомат поиска «пищи» на рис. 9 фактически реализует алгоритм действий разведчика, описанный выше.

На рис. 10 приведен автомат поиска потерянного ориентира, который запускается после разворота фуражира по компасу в нужном направлении и только в том случае, если опорный ориентир текущей сцены не виден. Фуражир сначала идет вперед, пока не увидит искомый объект или опорный ориентир текущей сцены. Если же истекает не менее половины времени, которое было затрачено разведчиком на прохождение данного отрезка пути, то фуражир начинает проверять соответствие видимой сцены и текущей или следующей сцены в поисках опорного ориентира или искомого объекта.

ObjFound/

tifa

ж/1

г

else /

¿¡у

'Load(Forward) j

-W N

1r\v

f \\s.

- 4 *

,¥/ f

D

X V

3/

Finished & \not ObjFound/

Load(Turn)

else /

IsGoodtOr /

Признаки:

IsGoodOr - есть подходязий ориентир Finished - завершена работа автомата SeeFindObj - вижу искомый объект ObjFound - искомый объект найден

BO - базовый ориентир

<D

Finished & not IsGoodOr /

fLoad(Turn)}

Load(Choose) Автоматы:

Forward - движение вперед Turn - поворот

Choose - выбор следующего ориентира MoveTo - движение к объекту

Load(X) - загрузка автомата Х MyLoad(BO) - загрузка автомата обхода ВО

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 9. Мета-автомат поиска «пищи» meta_fsm_Search

goStop ЬоокБО(О) goStop, ToScene(0)

Действия:

goStop - остановиться goFwd - идти вперед SetTime - установить интервал времени ResetTime - начать отсчет интервала времени ToScene(0/1) - перейти к текущей(О) или следующей(1) сцене

Признаки:

SeeFindObj - вижу искомый объект ^сскТта - интервал времени не закончился LookBO(0/1) - вижу базовый объект текущей(О) или следующей(1) сцены

Рис. 10. Автомат поиска потерянного ориентира fsm_FindBO

M

S

C

8. Результаты экспериментов

4.1. ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ

Имитационное моделирование проводилось на упрощенной задаче фуражировки: не рассматривался этап возвращения разведчика в «дом» (при наличии компаса этот процесс является довольно простым). В ходе эксперимента сначала анимат-разведчик перемещался по полигону в поисках объекта заданного цвета («пищи»), не имея данных о его местоположении. После нахождения объекта сформированный маршрут передавался фуражиру, который его повторял. Эксперименты проводились в системе многоагентного моделирования Куогит, созданной в НИЦ «Курчатовский институт» [8]. Полигон - область 100^100 клеток, время моделирования - 10 000 тактов для каждого эксперимента.

тст 'О

а) ' О

Рис. 11. Примеры маршрутов: а) маршрут средней длины без резких повоторов; б) маршрут средней длины с резким повотором; в) длинный маршрут (последователю не хватило времени для прохождения маршрута целиком)

Любой маршрут начинался от «дома» (круг на рис. 11), начальная ориентация аниматов - произвольная. Ориентиры генерировались случайным образом и включали 1, 2 или 3 объ-

екта, количество цветов - 6, количество ориентиров - 48, 60, 72 или 84. Целевой объект («пища») - шестиугольник на рис. 11, количество целевых объектов - 5. Линии от «дома» к «пище» -это визуализация путей разведчика и фуражира. Иногда они идут параллельными путями (рис. 11а), но часто эти пути почти сливаются в одну линию (рис. 11б-в).

Талица 5 содержит статистику по экспериментам. В зависимости от количества тактов моделирования Т, которые потребовались для прохождения маршрута, данные разделены на три примерно равные части: короткие (до 1000 тактов), средние (от 1000 до 2000) и длинные (более 2000 тактов). На всех маршрутах наблюдается незначительное увеличение времени (примерно на 100-200 тактов), которое требуется последователю для прохождения маршрута. Это обусловлено необходимостью разворотов для более точного сопоставления сцен.

Таблица 6. Результаты моделирования

Маршруты Количество Причины неудач Ecp,

неудач, % нашел другой ничего не хватило %

(абсолют. объект ближе / не нашел времени

/относит.) дальше

короткие 2,6 / 1,4 5 / 4 - - 100

средние 16,3 / 9,4 14 / 19 7 - 70

длинные 27.8 / 12,7 24 / 20 9 13 43

Неудачным признается эксперимент, в котором последователь или вовсе не нашел искомый объект, или нашел не тот объект, до которого проложил маршрут разведчик. В среднем примерно в 50% случаев неудач последователь находил другой искомый объект раньше, чем проходил весь маршрут, и поэтому уходил с него: эти эксперименты являются относительно неудачными (данные выделены полужирным шрифтом).

Значение Еср показывает, какой процент пути последователь прошел по маршруту, прежде чем сбиться с него. Для коротких маршрутов Еср равен 100%, и это соответствует одной из двух ситуаций: (1 ) в начальной позиции аниматы располагались так, что каждый из них видел свой искомый объект, и они сразу шли каждый к своему объекту; (2) идя параллельными путями, раз-

ведчик и фуражир на последнем отрезке видели разные целевые объекты, расположенные близко друг к другу, и шли каждый к своему объекту.

По результатам экспериментов была проведена оценка некоторых количественных показателей. На рис. 12-13 приведены зависимости объема памяти и времени прохождения маршрута от сложности ориентира и степени заполненности полигона ориентирами. М - это объем памяти (количество объектов), которые запоминает анимат в процессе поиска. N - количество объектов в одном ориентире (1, 2 или 3). Естественно, объем памяти почти линейно зависит от количества объектов, входящих в ориентир (рис. 12а), и растет при увеличении длины маршрута.

М 70 60 50 40 30 20 10 0

Маршруты:

- длинные

- средние

- короткие

3 N

а)

левая граница: правая граница:

цвет направление расстояние направление | расстояние

0 | 1 | 2 | 3 4 | 5 | 6 | 7 | 8 | 9 10 | 11 | 12 | 13 | 14 | 15

1-й байт | 2-й байт

б)

Рис. 12. а) зависимость объема памяти М от длины маршрута Т и количества объектов Ые в ориентире (1, 2, 3); б) объем памяти для запоминания одного объекта

Оценим объем памяти, необходимый для запоминания маршрута. Сведения об одном объекте занимают 2 байта

1

2

(рис. 12б): идентификатор (цвет) - 4 бита, направление и расстояние (по 5 значений на шкалах) - по 3 бита каждое. Если принять, что в среднем одна сцена содержит 3 ориентира, а ориентир состоит из двух объектов, то на запоминание одной сцены анимату потребуется примерно 20 байт: для каждого ориентира нужно хранить направление обхода (1 байт), а для каждой сцены еще направление по компасу и количество тактов на отрезке (по 2 байта). В экспериментах длина маршрута Ьр = 2, ..., 12; таким образом, требуемый объем памяти - 40-240 байт.

Т

Рис. 13. Зависимость средней длины маршрута Т от количества ориентиров на полигоне (48, 60, 72, 84) и количества объектов Ые в ориентире (1, 2, 3)

Среднее время Т (точнее, среднее количество тактов) растет при увеличении количества ориентиров на полигоне (рис. 13): анимат тратит время на обход ориентиров. Также время поиска растет при увеличении количества объектов в ориентире: это объясняется тем, что ориентиры перекрывают искомые объекты. Исключением является ситуация с малым количеством ориентиров (48): здесь отсутствие видимых объектов заставляет анимата часто поворачивать в поисках ориентира. Таким образом, нехватка ориентиров, как и их переизбыток, приводят к увеличению времени поиска.

4.2. ЭКСПЕРИМЕНТЫ С РЕАЛЬНЫМИ РОБОТАМИ

Важным аспектом выполненных исследований стало проведение натурных экспериментов. Отметим, что несмотря на большое разнообразие предложенных исследователями моделей в этой области, лишь немногие из них были реализованы на реальных роботах (например, [22, 32]) Отчасти это объясняется тем, что переход от имитационной модели к управлению физическим роботом обычно является очень трудоемким.

Стандартный процесс разработки подобного рода систем заключается в том, что от абстрактных моделей и алгоритмов сначала происходит переход к упрощенным имитационным моделям; затем строится модель для физического моделирования (например, используется система Gazebo, при этом строятся как модели робота, так и среды его обитания). В конце от «почти настоящей» модели типа Gazebo переходят к экспериментам уже на реальных робототехнических системах. Этот достаточно стандартный путь обычно усложняется тем, что построение физической модели - сам по себе очень трудоемкий процесс. Во-вторых, физическое моделирование работы системы занимает много времени. В системе Gazebo отношение модельного к физическому времени (RTF - Real Time Factor) для задач подобного класса сложности может опускаться до величин порядка 0,01-0,05 (около четырёх часов моделирования). В то же время в системе Kvorum RTF достигал величины порядка 10.

В настоящем исследовании удалось избежать этапа физического моделирования, используя лишь систему поведенческого моделирования. Дело в том, что модель поведения анимата (робота) оперировала исключительно относительными категориями, без привязки к абсолютным физическим величинам типа времени, расстояния, угла поворота и т.п.

Эксперименты проводились на мобильных платформах -мини-роботах серии YARP. Мини-робот - это платформа с дифференциальным приводом, оснащенная дальномерами, электронным компасом, камерой, а в качестве бортового вычислителя используется Raspberry Pi 4. Экспериментальный комплекс представляет собой мобильную платформу, удаленный управляющий компьютер и полигон, на котором расположены ArUco-маркеры. Архитектура комплекса представлена на рис. 14.

Комплекс работает под управлением ROS (Robot Operating System). На бортовом вычислителе развернуты компоненты ROS, отвечающие за выполнение двигательных функций и обработку информации с камеры. Камера - основной источник данных о наблюдаемых роботом объектах, представленных на полигоне множеством ориентиров с нанесенными ArUco-маркерами. Вычислительных возможностей Raspberry Pi хватает для того, чтобы распознавать их в режиме реального времени.

Рис. 14. Общая архитектура комплекса

ROS предоставляет возможность множеству работающих прикладных программ («узлы», или «node» в терминологии ROS) взаимодействовать друг с другом посредством унифици-

рованной системы сообщений. При этом с точки зрения прикладной программы отправка и прием сообщений выглядит как обращение к некоторому ресурсу - так называемому «топику» (topic). Это, в частности, позволяет абстрагировать прикладные программы от характера источника или приемника данных. Благодаря такому механизму основная прикладная программа работает либо со средой моделирования Kvorum, либо взаимодействует с реальным робототехническим устройством. На рис. 15 показана программная архитектура системы.

Рис. 15. Программная архитектура комплекса. Узел USR означает основное пользовательское приложение. Часть схемы («Robot») отображает структуру ПО, работающего на борту подвижной платформы. Часть «Ctl» - ПО, развернутое на удаленном компьютере. Часть «Kvorum» - компоненты системы моделирования

На подвижной платформе развернуты узлы, обеспечивающие реализацию двигательных функций и формирование потока сенсорных данных, обслуживание видеокамеры (cameranode), а также обработку изображения, т.е. распознавание идентификатора и местоположения ArUco-маркеров (aruco_server). Узел kvorum bridge осуществляет унификацию потока данных и управляющих команд с форматом, воспринимаемым системой моделирования. Основным источником данных управляющей программы является топик ardans topic, а двигательные команды отправляются в топик actions topic. Как видно из схемы, эти топики используются либо реальным роботом, либо системой Kvorum. Все это позволило сделать работу основной программы независимой от реализации робота - модельной или реальной (естественное следствие идеологии ROS).

Естественно, при переносе моделирующей программы на реального робота требуется некоторая предварительная настройка и написание специального модуля, обеспечивающего необходимый интерфейс. В данном случае настройка заключалась в калибровке камеры и установлении скоростей движения и поворота. Специальный интерфейсный модуль переводит данные камеры в формат, соответствующий формату суперлокатора, реализованного в системе Kvorum.

На начальной стадии проведения экспериментов с реальными роботами выяснилось, что угол развертки камеры оказывает определенное влияние на реализацию метода. Допустим, робот выбрал опорный ориентир (рис. 16) и обходит его справа.

Для этого он сначала разворачивается таким образом, чтобы крайняя правая точка опорного ориентира располагалась примерно на границе между направлениями «впереди» и «впереди-слева». Далее робот движется вперед, и опорный ориентир смещается в левую часть зоны видимости, пока не пропадет из поля зрения робота. Но это происходит в тот момент, когда ArUco-маркер уходит из зоны видимости хотя бы частично, как показано на рис. 16.

Таким образом, ориентир фактически все еще остается перед роботом и обход не завершен, но робот его уже не видит. При развертке, например, в 120° или более такой проблемы не возникает. Более того, если робот затем будет продолжать дви-

гаться вперед к следующему ориентиру, то он может столкнуться с предыдущим ориентиром и начнет отрабатывать процедуру объезда препятствия.

Для того чтобы корректно выполнять обход ориентиров, в автоматы обхода был введен учет расстояния до опорного ориентира (ОО). Ранее автоматы обхода просто в течение T тактов подавали на анимата команду «вперед», чтобы анимат «прошел чуть дальше» и оставил ОО в стороне. Значение T было константой (10 тактов модельного времени). Теперь анимат (робот) запоминает текущее расстояние, на котором располагается опорный ориентир (точка а). В тот момент, когда робот перестает видеть точку а, это расстояние переводится в значение

на соответствующей шкале (например, «далеко» - это 4, см. таблицу 1), и Т рассчитывается так:

(8) Т = сИ8Ы,

где Z - параметр, который определяет, сколько примерно тактов должно пройти, чтобы робот (анимат) преодолел расстояние, соответствующее 1 в модельном мире. Естественно, значение параметра Z зависит от скорости робота и соотношения между размером «клетки» в модельном мире и расстояниями на реальном полигоне.

После введения этого уточнения в автоматы обхода ориентиров была повторно проведена серия экспериментов по имитационному моделированию для углов развертки в 60°, 90° и 120°. Они подтвердили, что модель осталась работоспособной, а уменьшение угла развертки приводит к заметному изменению характера траекторий, но не влечет за собой существенное снижение эффективности.

Очень важным результатом проведенных натурных экспериментов является тот факт, что никаких дополнительных изменений в управляющую программу вносить не потребовалось. Таким образом, та же самая программа, на которой проводились имитационные эксперименты и сбор статистики, использовалась для управления роботом на реальном полигоне.

Натурные эксперименты проводились на разных полигонах, оборудованных ArUco-маркерами: в помещении, на асфальтированном участке и на газоне (рис. 17). Каждый эксперимент проводился на одном роботе. Сначала робот сначала помещался в некую условную точку, соответствующую «базе». Затем он как разведчик осуществлял поиск целевого объекта (ArUco-маркера с идентификатором 1), воспринимая другие маркеры как ориентиры и запоминая маршрут. После нахождения целевого объекта робот вручную переносился на исходную точку и повторял путь как фуражир.

Целями натурных экспериментов были: 1) проверка возможности использования данного метода для ориентации реальных роботов; 2) сравнение результатов работы реальных роботов и имитационного моделирования. Расположение ArUco-маркеров на полигоне повторяло различные конфигурации расположения ориентиров на модельном полигоне. Обе цели были

достигнуты. При этом анимат и робот на одинаковых конфигурациях ориентиров на полигоне демонстрировали одинаковое поведение, но наблюдалось некоторое снижение процента успешных попыток у робота по сравнению с аниматом (до 90% относительно анимата на открытых полигонах и 95% в помещении). Это можно объяснить погрешностью реальных датчиков (на роботе) по сравнению с виртуальными (на анимате).

Рис. 17. Полигоны для натурных экспериментов

В экспериментах участвовали роботы на трех платформах серии YARP -YARP-131, YARP-132 и YARP-133 (рис. 18).

Одинаковые по архитектуре системы управления, используемые платформы отличались конструктивно - по габаритам и скоростям движения. Несмотря на это, итоговые результаты их работы по запоминанию и отработке маршрутов были идентичными. Это - крайне важное обстоятельство, свидетельствующее

о независимости разработанной поведенческой модели от физической реализации.

Рис. 18. Роботы: а) платформа YARP-131, б) платформа YARP-132, в) платформа YARP-133

Таким образом, можно сделать вывод о том, что предлагаемая модель является адекватной реальным условиям. Кроме того, эти результаты подтверждают, что архитектура системы Kvorum и мобильных роботов серии YARP является достаточно удачным решением. За счет предварительной апробации разрабатываемых методов и моделей с помощью имитационного моделирования этот подход позволяет существенно ускорить, удешевить и упростить процесс разработки систем управления мобильными роботами для задач групповой робототехники.

4.3. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

При сравнении полученных результатов с аналогичными работами возникли определенные сложности. Во-первых, не удалось найти работ с похожей постановкой задачи: передача описания маршрута от одного робота другому как основной элемент коллективного решения задачи нигде не рассматривается. Во-вторых, условия проведения экспериментов (как имитационных, так и с реальными роботами) сильно отличаются, поэтому сравнение статистических показателей (там, где они приводятся), было бы некорректным. В-третьих, в большинстве работ по данной тематике основным показателем качества решения задачи ориентации и навигации является точность прохож-

а) 6) в)

дения маршрута [22]; в данном же исследовании точность не играет существенной роли. В-четвертых, в других работах реальные роботы оснащались панорамными камерами [13, 21-22, 40], а в нашем случае угол развертки камеры не превышал 80°. Поэтому сравнивать с аналогами можно только по качественным показателям.

По сравнению с работами, в которых предлагаемые методы исследовались только на уровне имитационного моделирования, предложенный здесь метод имеет явные преимущества, потому что его работоспособность проверена на различных робототех-нических платформах и в реальных условиях. По отношению к тем работам [11, 18], в которых роботы действуют в реальной среде, данный метод несколько проигрывает, так как для него необходимы определенного типа ориентиры, которые он умеет распознавать. Переход к произвольным ориентирам повлечет усложнение процедуры распознавания, увеличение объема памяти для хранения описания маршрута и потребует увеличения пропускной способности каналов связи. Но принципиальных сложностей при этом возникнуть не должно. Если же говорить о методе в целом, то его несомненными достоинствами по сравнению с другими методами (например, [35]), являются невысокие требования к точности позиционирования; отсутствие требования уникальности идентификации ориентиров (в отличие от [13]); работа при наличии камеры с узким углом развертки.

Также было бы интересно провести сравнение эффективности навигации у полученного анимата и у модельного вида Formica rufa, но и здесь возникают некоторые проблемы. В натурных наблюдениях подобная статистика не подсчитыва-ется, так как это чрезвычайно трудоемкий процесс. Муравьи-разведчики чаще ведут фуражиров за собой, чем передают им сведения о местоположении пищи. В естественных условиях сложной задачей является выделение таких актов и наблюдение за фуражиром, который отправился на поиски пищи после контакта с разведчиком: это единичные наблюдения, а сравнивать показатели можно только при наличии статистически достоверных данных.

Если же говорить о лабораторных опытах, то условия их проведения существенно отличаются от тех, которые есть

в природе и которые моделировались в данной работе. Здесь -свободный поиск (рис. 19а), в лабораторных опытах с муравьями - набор дорожек, образующих структуру типа «дерево», с возможностью перемещаться только по дорожкам (рис. 19б). Поэтому сравнивать результаты по эффективности навигации было бы некорректно.

а) б)

Рис. 19. Условия проведения экспериментов: а) вид полигона в системе Kvorum; б) схема установки в опытах с муравьями

Но можно сопоставить эффективность на основе продолжительности пути анимата и муравья-разведчика по количеству сцен (развилок пути). В работе [27] количество развилок варьировалось от двух до шести. При этом утверждается, что эффективность подобного вида фуражировки у самих муравьев очень невелика. В случае двух развилок все активные разведчики и их группы (до 15 на колонию) были успешными, тогда как в случае шести развилок только один или два справились с задачей. В то же время результаты моделирования показали (таблица 6), что предложенный метод с этой точки зрения является более эффективным, чем ориентация муравьев в лабораторных условиях.

Таблица 6. Успешность прохождения маршрута

Количество сцен в маршруте Количество успешных экспериментов, %

1-3 91

4-6 75

7-9 60

Зато сравнение временных показателей демонстрирует обратную картину. Муравей-фуражир, которому разведчик передал сведения о дороге до пищи, не тратит время на обход дерева. Он сразу направляется на нужную развилку, и временные затраты снижаются примерно на порядок [27]. Анимат-фуражир фактически повторяет маршрут, которым прошел разведчик. Поэтому на маршруте фуражир проводит примерно столько же времени, сколько и разведчик.

9. Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В данном исследовании механизм навигации муравьев рассматривался несколько упрощенно и с внешней, феноменологической точки зрения. Здесь не ставилась задача выявить причины возникновения именно такого способа ориентации или предложить имитационную модель, которая бы учитывала морфологические особенности муравьев. Тем более что у разных видов муравьев разная среда обитания и разная морфология, оказывающая существенное влияние на восприятие, в том числе зрительной информации - визуальных ориентиров.

Даже вопрос организации памяти здесь не рассматривался, в отличие, например, от работы [16]. Память о маршруте - это просто последовательность сцен, состоящих из запомненных ориентиров, и некоторой временной информацией. Но, тем не менее, полученные результаты дают основания полагать, что такое представление возможно, и позволяет решить поставленную задачу. Насколько ассоциативная или любая другая организация памяти повлияла бы на эффективность или объем данных - этот вопрос требует дальнейшего исследования.

В данной работе создан и реализован механизм, имитирующий поведение муравьев, которое они демонстрируют в ходе коллективной фуражировки, и показано, что это можно сделать

достаточно ограниченными средствами. Механизм не требует однозначной идентификации визуальных ориентиров и работает как в условиях перегруженности полигона ориентирами, так и при малом их количестве, когда на полигоне есть области, из которых ориентиры не видны.

Также данный метод можно применять в рамках решения других задач, например, задачи патрулирования. Под патрулированием понимается деятельность по обходу периметра или прохождению по району через регулярные промежутки времени в целях обеспечения безопасности [26]. В ситуации, когда патрулирование территории подразумевает прохождение по определенному маршруту (например, по периметру области наблюдения), задача может быть сведена к тому, что робот получает сведения о маршруте и проходит по нему с некоторой периодичностью. Само описание маршрута может быть получено разными способами. Самым очевидным является предварительное расположение ориентиров таким образом, чтобы разведчик прошел необходимым маршрутом и запомнил его, а затем передал другим роботам.

Метод апробирован на перемещении на плоскости, поэтому можно сказать, что средой возможного применения является земная поверхность. Вопросы распространения области применения на водную и воздушную среду не рассматривались, так как это потребует перехода от двумерного случая к трехмерному и изменения представления маршрута и управляющих автоматов.

Благодарности. Автор выражает благодарность сотрудникам лаборатории робототехники Научно-исследовательского центра «Курчатовский институт», на базе которого проводились натурные эксперименты, и в первую очередь, руководителю лаборатории В.Э. Карпову.

Литература

1. БОГАТЫРЕВА О.А., БОГАТЫРЕВ Н.Р. Муравьи и роботы в мире, полном неопределенности: природа адаптивности группы // Муравьи и защита леса. Материалы XIV Всерос-

сийского мирмекологического симпозиума, Москва, 19-23 августа 2013 г. - М.: Товарищество научных изданий КМК, 2013. - С. 14-20.

2. ДЛУССКИЙ Г.М. Муравьи рода Формика. - М.: Наука, 1967. - 233 с.

3. ЗАХАРОВ А.А., ДЛУССКИЙ Г.М., ГОРЮНОВ Д.Н. и др.

Мониторинг муравьев Формика. М.: КМК, 2013. - 99 с.

4. КАЛУЦКАЯ А.П., ТАРАСОВ В.Б. Моделирование взаимодействия робота с внешней средой на основе пространственных логик и распространения ограничений // Программные продукты и системы. - 2010. - №2. - С. 111-115.

5. КАРПОВ В.Э., КАРПОВА И.П., КУЛИНИЧ А.А. Социальные сообщества роботов. - Серия «Науки об искусственном», №19. - УРСС, 2019. - 352 с.

6. КАРПОВ В.Э. Об одном механизме реконструкции схем // VI Международная научно-практическая конференция «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Сб. науч. трудов. В 2-т. Т.1. - М.: Физмат-лит, 2011. - С. 407-415.

7. КАРПОВ В.Э. Частные механизмы лидерства и самосознания в групповой робототехнике // XIII национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (16-20 октября 2012 г., Белгород): Труды конференции. Белгород: Изд-во БГТУ. - 2012. - С. 275-283.

8. КАРПОВ В.Э., РОВБО М.А., ОВСЯННИКОВА Е Е. Система моделирования поведения групп робототехнических агентов с элементами социальной организации Кворум // Программные продукты и системы. - 2018. - Т. 31, №3. -С. 581-590.

9. КАРПОВА И.П. К вопросу о представлении маршрута мобильного робота на основе визуальных ориентиров // Ме-хатроника. Автоматизация. Управление. - 2017. - Т.18, №2. - С. 81-89.

10. МАЛЫШЕВ А.А., БУРГОВ Е В. К вопросу о параметрах биоинспирированных моделей поведения при моделировании групповой фуражировки // Труды СПИИРАН. - 2020. -Вып. 19(1). - С. 79-103.

11. МОСКОВСКИМ А.Д. Метод распознавания сцен для задачи навигации мобильных роботов // II Всероссийский научно-практический семинар «Беспилотные транспортные средства с элементами искусственного интеллекта (БТС-ИИ-2015)» (9 октября 2015г., г. Санкт-Петербург, Россия): Труды семинара. - СПб.: Политехника-сервис, 2015.

12. НОГИН В.Д. Линейная свертка критериев в многокритериальной оптимизации // Искусственный интеллект и принятие решений. - 2014. - № 4. - С. 73-82.

13. AUGUSTINE M., ORTMEIER F., MAIR E., BURSCHKA D., STELZER A., SUPPA M. Landmark-Tree map: A biologically inspired topological map for long-distance robot navigation // IEEE Int. Conf. on Robotics and Biomimetics, ROBIO 2012 -Conference Digest. - P. 128-135.

14. BADDELEY B. et al. A model of ant route navigation driven by scene familiarity // PLoS Comput. Biol. - 2012. - Vol. 8, No.1.

15. COLLET M., COLLETT T.S. The learning and maintenance of local vectors in desert ant navigation // J. Exp. Biol. - 2009. -Vol. 212. - P. 895-900.

16. CRUSE H., WEHNER R. No need for a cognitive map: Decentralized memory for insect navigation // PLoS Comput. Biol. -2011. - Vol. 7. No. 3.

17. DORIGO M., BLUM C. Ant colony optimization theory: A survey // Theor. Comput. Sci. - 2005. -Vol. 344. No.2-3. -P. 243-278.

18. DORIGO M., MANIEZZO V., COLORNI A. Ant System: Optimization by a Colony of Cooperating Agents // IEEE Trans. Syst. Man, Cybern. Part B. - 1996. - Vol. 26, No.1. - P. 29-41.

19. DUPEYROUX J., VIOLLET S., SERRES J R. An ant-inspired celestial compass applied to autonomous outdoor robot navigation // Rob. Auton. Syst. - 2019. - Vol. 117. - P. 40-56.

20. GOLDSCHMIDT D., MANOONPONG P., DASGUPTA S. A neurocomputational model of goal-directed navigation in insect-inspired artificial agents // Frontiers in Neurorobotics. -2017. - Vol. 11(APR). - P. 1-17.

21. KNIGHT J.C., SAKHAPOV D., DOMCSEK N., DEWAR A.D.M., GRAHAM P., NOWOTNY T., PHILIPPIDES A. Insect-inspired visual navigation on-board an autonomous robot: Real-world

routes encoded in a single layer network // Proc. of the 2019 Conf. on Artificial Life: How Can Artificial Life Help Solve Societal Challenges, ALIFE 2019, September. - P. 60-67.

22. LAMBRINOS D. MÖLLER R., LABHART T., PFEIFER R., WEHNER R. A mobile robot employing insect strategies for navigation // Rob. Auton. Syst. - 2000. - Vol. 30, No. 1. -P. 39-64.

23. MÜLLER M., WEHNER R. Path integration in desert ants, Cataglyphis fortis // Proc. of the National Academy of Sciences of the United States of America. - 1988. - P. 5287-5290.

24. NARENDRA A. Homing strategies of the Australian desert ant Melophorus bagoti I. Proportional path-integration takes the ant half-way home // J. Exp. Biol. - 2007a. - Vol. 210, No. 10. -P. 1798-1803.

25. NARENDRA A. Homing strategies of the Australian desert ant Melophorus bagoti II. Interaction of the path integrator with visual cue information // J. Exp. Biol. - 2007b. - Vol. 210, No. 10. - P. 1804-1812.

26. PORTUGAL D., ROCHA R.P. A survey on multi-robot patrolling algorithms // IFIP Advances in Information and Communication Technology, 349 AICT, 2011. - P. 139-146.

27. REZNIKOVA Z. Experimental paradigms for studying cognition and communication in ants (Hymenoptera: Formicidae) // Myrmecological News. - 2008. - Vol. 11. - P. 201-214.

28. REZNIKOVA Z. Spatial cognition in the context of foraging styles and information transfer in ants // Anim. Cogn. - 2020. -Vol. 23, No. 6. - P. 1143-1159.

29. ROSEBOOM W., FOUNTAS Z., NIKIFOROU K. et al. Activity in perceptual classification networks as a basis for human subjective time perception // Nat. Commun. - 2019. - Vol. 10, No. 1. - P. 1-10.

30. RYABKO B., REZNIKOVA Z. The Use of Ideas of Information Theory for Studying «Language » and Intelligence in Ants // Entropy. - 2009. - No. 11. - P. 839-853.

31. STELZER A., MAIR E., SUPPA M. Trail-Map: A scalable landmark data structure for biologically inspired range-free navigation // IEEE Int. Conf. Robot. Biomimetics, IEEE ROBIO 2014.- P. 2138-2145.

32. VARDY A. Long-range visual homing // IEEE Int. Conf. Robot. Biomimetics, ROBIO 2006. - P. 220-226.

33. VICKERSTAFF R.J., CHEUNG A. Which coordinate system for modelling path integration? // J. Theor. Biol. - 2010. -Vol. 263. - P. 242-261.

34. WEHNER R. The architecture of the desert ant's navigational toolkit (Hymenoptera: Formicidae) // Myrmecol News 12. -2009. - P. 85-96.

35. WEHNER R., MICHEL B., ANTONSEN P. Visual navigation in insects: Coupling of egocentric and geocentric information // J. Exp. Biol. - 1996. - Vol. 199, No. 1. - P. 129-140.

36. WILSON E.O. Chemical communication among workers of the fire ant Solenopsis saevissima. 1. The organization of mass foraging // Anim. Behav. - 1962. - Vol. 10. - P. 134-147.

37. WILSON S.W. Classifier Systems and the Animat Problem // Mach. Learn. - 1987. - Vol. 2, No. 3. - P. 199-228.

38. WYSTRACH A., SCHWARZ S., SCHULTHEISS P. Views, landmarks, and routes: How do desert ants negotiate an obstacle course? // J. Comp. Physiol. A Neuroethol. Sensory, Neural, Behav. Physiol. - 2011. - Vol. 197, No. 2. - P. 167-179.

39. WYSTRACH A., GRAHAM P. What can we learn from studies of insect navigation? // Anim. Behav. - 2012. - Vol. 84, No. 1. -P. 13-20.

40. YU S.E., KIM D. Image-based homing navigation with landmark arrangement matching // Inf. Sci. (Ny). - 2011. -Vol. 181, No. 16. - P. 3427-3442.

A BIOINSPIRED APPROACH TO ROBOT ORIENTATION OR A REAL «ANT» ALGORITHM

Irina Karpova, National Research University Higher School of Economics, Moscow, assistant professor (karpova_ip@mail.ru).

Abstract: The paper describes a bioinspired method of mobile robots navigation, similar to the navigation mechanism of social insects. The model species is the red forest ant Formica rufa. The scout red forest ant remembers the route to food and can transmit information about the food location to foraging ants. Foragers can on their own walk to the food and return home. These ants are guided by the skylight compass, odometry data and visual landmarks. The proposed method is based on

memorizing the path by visual landmarks, compass data and time component. A path is defined as a sequence of scenes consisting of landmarks. The scout route and forager route are defined as transitions from one landmark to another. The created behavior model of an animate (robot) operates only with relative categories. The results of simulation modeling for solving the foraging problem are presented. The method has been tested on real robots. Due to specific architectural and technical solutions, the transition from simulation models to the management of technical objects (robots) is carried out without the stage of physical modeling. The method can also be used in reconnaissance and patrol tasks in group robotics.

Keywords: autonomous mobile robot, group robotics, ant navigation, scene recognition, space-time orientation, foraging and reconnaissance tasks.

УДК 004.896+007.52 ББК 32.816

DOI: 10.25728/ubs.2022.96.5

Статья представлена к публикации членом редакционной коллегии В.Г. Лебедевым.

Поступила в редакцию 28.10.2021.

Опубликована 31.03.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.