Построение карт местности робототехническими системами

Шварц Д.; Куприянов Д.В.

УДК 004.9

DOI: 10.17586/0021-3454-2016-59-8-695-698

ПОСТРОЕНИЕ КАРТ МЕСТНОСТИ РОБОТОТЕХНИЧЕСКИМИ СИСТЕМАМИ

1 2 Д. Шварц1, Д. В. Куприянов2

1 Таллинский технологический университет, 19086, Таллин, Эстония

2Университет ИТМО, 197101, Санкт-Петербург, Россия E-mail: [email protected]

Рассматривается возможность применения глобальных дескрипторов изображений при построении карты местности мультиагентной робототехнической SLAM-системой. Описываются уровни и этапы построения глобальных карт местности.

Ключевые слова: мультиагентные системы, техническое зрение

В наши дни приобретают популярность системы SLAM (Simultaneous Localization and Mapping — одновременное определение текущего местоположения и построение карты). Область применения роботов, оснащенных подобными системами, достаточно широка — от социальных роботов (гидов по различным учреждениям и квартирных помощников) до систем исследования труднодоступных областей (автономных подводных аппаратов) и комплексов для предотвращения природных катаклизмов (беспилотных летательных аппаратов для выявления лесных пожаров).

В качестве перспективного направления в SLAM можно назвать создание глобальных карт местности, которые формируются посредством совмещения карт, построенных группой роботов. Подобный подход позволяет ускорить процесс сбора данных об окружающей обстановке и получить больше информации о текущем состоянии подконтрольного участка.

При создании глобальной карты местности работу мультиагентной робототехнической системы можно представить последовательностью трех шагов:

1) построение локальных карт;

2) обнаружение зон, уже существующих на карте, построенной роботом;

3) объединение нескольких локальных карт в одну глобальную.

Первый шаг — создание локальной карты — является задачей индивидуальной SLAM-системы. Так как построение SLAM-систем возможно на основе различных сенсоров (ультразвуковых, инфракрасных, определения уровня радиосигнала), следует отметить, что визуальные SLAM-системы обладают целым рядом преимуществ, поэтому рассматриваться будет поведение роботов с камерами.

На втором шаге часть задач совпадает с алгоритмом объединения нескольких локальных карт. Закрытие петель — устранение неизбежной ошибки позиционирования, при которой уже исследованные области несколько смещаются относительно своих первоначальных координат на построенной роботом карте, — например, во многом сопоставимо с поиском уже существующих на карте зон. В SLAM-системах проблема закрытия петель традиционно решается средствами локального структурного анализа. Каждое изображение соответствует частоте появления локальных признаков. Этот метод также известен как метод „набора слов" (bag-of-words). Однако стратегия поиска изображений, основанная на этом методе, имеет два недостатка: она сложна и использует большое количество памяти. Поиск изображений при помощи метода набора слов показывает хорошие результаты, но проблема с использованием памяти до сих пор не решена.

Методы описания изображений (дескрипторы) можно грубо разделить на локальные и глобальные. Локальные дескрипторы выделяют определенные области на изображении и строят его описание исходя из обнаруженных объектов, такие дескрипторы могут применяться при распознавании лиц. Глобальные дескрипторы используют низкоуровневые операции при анализе изображения и могут предоставлять информацию о цвете, движении и текстуре.

Процесс поиска изображения в большой базе данных — интересная и сложная задача. Принципы работы известных систем по поиску изображений во многом похожи. При поиске проводится сравнение признаков изображения или группы изображений в базе данных. Степень схожести определяется свойствами системы и ее задачами. Очевидно, что при воссоздании сцены трехмерного пространства или определении местоположения робота в пространстве схожесть изображений должна быть максимальной. В работе [1] рассматриваются три уровня описания изображения. Такое деление определяет необходимый уровень детализации и применяемого математического аппарата.

Первый, подчиненный, уровень содержит подробное описание локальной области на изображении. Чад Карсон предложил метод „мира капель" ("В1оЬ'^гЫ") [2]. Такое представление изображения включает три шага (см. рис. 1):

1) выделение цвета, текстуры и позиции для каждого пиксела;

2) группировка пикселов в области;

3) описание распределения цветов и текстур каждой области для дальнейшего использования при обработке запросов.

Рис. 1

Современные методы анализа изображений используют более простые алгоритмы. Распространенный способ обработки изображения при помощи локальных дескрипторов показан на рис. 2.

Изображение

Детектор свойств

Свойства Г 1 Извлечение

пикселов дескрипторов

Набор

дескрипторов

Рис. 2

При подаче изображения на вход поисковая система возвращает изображение, отобранное по текстуре, цвету или схожести пространственной структуры.

На втором, базовом, уровне происходит общее описание сцены. На этом уровне изображения могут быть подразделены на искусственную обстановку и пейзажи. Для отнесения изображения к определенной группе необходимо наличие на нем определенных похожих объектов.

На третьем, старшем, уровне сцена характеризуется с максимальной степенью абстракции. Изображения разделяются на категории (в здании, вне здания, городской ландшафт, дикая природа, горы и лес). Более общий набор категорий предложен в работе [3].

Во многих БЬЛМ-системах описание изображения остается на первом уровне и обрабатывается с использованием низкоуровневых свойств изображения. Анализ локальных структур необходим для определения ранее посещенных роботом областей (сцен), точного определения местоположения робота или реконструкции трехмерной сцены. На этом уровне изображения представляются в виде многомерных векторов, что делает их обработку, хранение и извлечение сложной задачей.

Глобальные дескрипторы изображений часто используются в системах компьютерного зрения для классификации сцен как альтернатива локальным [1, 3]. Основное их преимущество в решении таких задач заключается в том, что эти дескрипторы показывают аналогич-

ную производительность при значительно меньшей сложности [4]. К ним можно отнести большинство дескрипторов формы и текстур. Особенность этих дескрипторов объясняется тем, что каждое изображение в представлении дескриптора соответствует точке в многомерном пространстве свойств. В настоящей статье рассматривается популярный дескриптор GIST [5].

Глобальное описание изображения отражает общую структуру сцены, в то же время локальные структуры не принимаются во внимание. С точки зрения классификации, минимальное евклидово расстояние „пролегает" между изображениями, которые можно отнести к одной группе на основном или старшем уровне представления.

Замыкание и совмещение построенных карт местности требует не столько определения принадлежности изображений к конкретной категории, сколько „узнавания" ранее посещенных сцен. Исходя из вышеизложенного может показаться, что глобальные дескрипторы абсолютно не подходят для совмещения карт. Однако в последних исследованиях предлагается использовать глобальные дескрипторы в робототехнике. Например, в работе [6] рассматривается SLAM-система, основанная на многочастичных фильтрах для определения ранее посещенных сцен, описанных с помощью GIST-дескриптора. Система с использованием GIST-дес-криптора для панорамных изображений представлена в работе [7]. GIST-дескриптор также использовался для поиска изображений в базе данных с миллионами записей [4].

Как видно на рис. 3, используя GIST-дескриптор, можно с наибольшей вероятностью определить совпадение сцен, особенно если съемка производится приблизительно с одной и той же точки. После получения исходного изображения системой сформирована выборка изображений из своей базы. Видно, что при изменении угла обзора евклидово расстояние (р) между изображениями 1 и 2 (одного и того же стола) становится сопоставимым с изображениями 4, 5, полученными в абсолютно других условиях. Изображение 3 — это снимок, сделанный с того же ракурса, но с другими предметами на столе. С одной стороны, это подтверждает недостаток глобальных средств описания изображений, показывая их нечувствительность к афинным преобразованиям, но, с другой стороны, позволяет лучше понять свойства глобальных дескрипторов. Даже при изменении деталей сцены ее глобальная структура остается неизменной. Это позволяет определить место как ранее посещенное.

Исходное изображение

Изображение 1

р = 0,33

Изображение 2 р = 0,6456

Изображение 5 р = 0,7362

Изображение 3 Изображение 4

р = 0,4040 р = 0,6699

Рис. 3

В заключение следует отметить, что несмотря на очевидные недостатки глобальных дескрипторов их применение при построении карты местности с использованием мультиагент-ной робототехнической БЬЛМ-системы может быть оправданным.

список литературы

1. Hindreus T., Reedik V. Synergy-based approach to quality assurance // Estonian Journal of Engineering. 2009. P. 87—98.

2. Carson Ch., Belongie S., Greenspan H., Malik J. Blobworld: image segmentation using expectation-maximization and its application to image querying // IEEE Transact. on Pattern Analysis and Machine Intelligence. 2002. Vol. 24, N 8. Art. 19. P.1026—1038.

3. Aditya V., Anil J., Zhang Hong Jiang. On image classification: city images vs. landscapes. // Pattern Recognition. 1998. Vol. 31. P. 1921—1935.

4. Douze M., Jegou H., Sandhawalia H., Amsaleg L., Schmid C. Evaluation of GIST descriptors for web-scale image search. // Proc. of the ACM Intern. Conf. on Image and Video Retrieval. 2009. Art. 19.

5. Oliva A., Torralba A. Modeling the Shape of the Scene: A Holistic Representation of the Spatial Envelope. // Intern. J. Comput. Vision. 2001. Vol. 42, N 3. P.145—175.

6. Liu Yang, Zhang Hong. Visual loop closure detection with a compact image descriptor // Proc. of the Intern. Conf. on Intelligent Robots and Systems (IROS). 2012. P.1051—1056.

7. Murillo A. C., Singh G. Localization in urban environments using a panoramic gist descriptor // IEEE Transact. on Robotics. 2013. Vol. 29, N 1. P. 146—160.

Сведения об авторах

Дмитрий Шварц — Таллинский технологический университет, кафедра мехатроники;

научный сотрудник; E-mail: [email protected] Дмитрий Владимирович Куприянов — аспирант; Университет ИТМО, кафедра мехатроники;

E-mail: [email protected]

Рекомендована кафедрой Поступила в редакцию

мехатроники Университета ИТМО 05.04.16 г.

Ссылка для цитирования: Шварц Д., Куприянов Д. В. Построение карт местности робототехническими системами // Изв. вузов. Приборостроение. 2016. Т. 59, № 8. С. 695—698.

MAP CREATION WITH ROBOTIC SYSTEMS D. Shvarts1, D. V. Kupriyanov2

1 Tallinn University of Technology, 19086, Tallinn, Estonia

2ITMO University, 197101, St. Petersburg, Russia E-mail: [email protected]

Development of computer vision system for group SLAM is considered. The main objective of the robots is to create a 3D map of an environment. Possibility of application of global image description approach is discussed.

Keywords: multi-agent system, technical vision

Data on authors

Dmitry Shvarts — Tallinn University of Technology, Department of Mechatronics;

Scientist; E-mail: [email protected] Dmitry V. Kupriyanov — Post-Graduate Student; ITMO University, Department of Mechatronics;

E-mail: [email protected]

For citation: Shvarts D., Kupriyanov D. V. Map creation with robotic systems // Izv. vuzov. Priborostroenie. 2016. Vol. 59, N 8. P. 695—698 (in Russian).

DOI: 10.17586/0021-3454-2016-59-8-695-698

Построение карт местности робототехническими системами Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шварц Д., Куприянов Д. В.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шварц Д., Куприянов Д. В.

Map creation with robotic systems

Текст научной работы на тему «Построение карт местности робототехническими системами»