Научная статья на тему 'Система интеллектуального управления мобильным информационно-справочным роботом'

Система интеллектуального управления мобильным информационно-справочным роботом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
715
187
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБОТОТЕХНИКА / СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОГО УПРАВЛЕНИЯ / ЧЕЛОВЕКОМАШИННОЕ ВЗАИМОДЕЙСТВИЕ / МОБИЛЬНЫЕ ПОДВИЖНЫЕ СИСТЕМЫ / ROBOTICS / INTELLIGENT CONTROL SYSTEMS / HUMAN-MACHINE INTERACTION / MOBILE MOVING SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Прищепа Мария Викторовна, Будков Виктор Юрьевич, Ронжин Андрей Леонидович

Проанализирован круг проблем, возникающих при разработке обслуживающих информационных роботов. Предложена модель интеллектуального управления мобильной информационной системой на базе многомодального интерфейса, обеспечивающего естественное человекомашинное взаимодействие

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Прищепа Мария Викторовна, Будков Виктор Юрьевич, Ронжин Андрей Леонидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An intelligent control model for the mobile information-inquiry robot

Problems of developing service information robots are discussed in this article. A model of intelligent control of mobile information system based on multimodal interface, providing natural human-robot interaction, is proposed.

Текст научной работы на тему «Система интеллектуального управления мобильным информационно-справочным роботом»

ИНФОРМАЦИОННО-УПРАВЛЯЮЩИЕ СИСТЕМЫ X

УДК 004.896

система интеллектуального управления мобильным информационно-справочным роботом

М. В. Прищепа,

аспирантка В. Ю. Будков, аспирант А. Л. Ронжин,

доктор техн. наук, доцент

Санкт-Петербургский институт информатики и автоматизации РАН

Проанализирован круг проблем, возникающих при разработке обслуживающих информационных роботов. Предложена модель интеллектуального управления мобильной информационной системой на базе многомодального интерфейса, обеспечивающего естественное человекомашинное взаимодействие.

Ключевые слова — робототехника, системы интеллектуального управления, человекомашинное взаимодействие, мобильные подвижные системы.

Введение

В настоящее время наибольшее распространение получили промышленные роботы, которые применяются на заводах, фабриках и иных производствах. Также разрабатываются различные военные роботы, большинство из которых представляют собой беспилотные летательные, подводные и наземные аппараты. Кроме того, особое внимание ученых и инженеров направлено на развитие обслуживающих роботов, предоставляющих ассистивные, информационные, обучающие и развлекательные услуги, например роботы-няньки, роботы-уборщики и др. [1]. В данной статье описаны результаты исследования по разработке информационно-справочного мобильного робота с интеллектуальным управлением на основе многомодального пользовательского интерфейса, который обеспечивает естественное взаимодействие клиентов с информационной системой.

Данный класс роботов предназначен для использования в музеях, выставочных и торгово-развлекательных комплексах в качестве гида и для предоставления посетителям различной полезной информации, например о тематике выставки, ее участниках, плане помещений, а также оказывает помощь в поиске нужного места или объекта. Современные обслуживающие роботы должны обеспечивать пользователю возможность интуитивного управления, их функ-

ции должны быть простыми и очевидными настолько, чтобы человек мог управлять ими без знания специальных команд или принципа работы, кроме того, система должна быть робастна к ошибкам в действиях пользователя. Изучение различных комбинаций многомодальных интерфейсов помогает разрешить фундаментальные вопросы человекомашинного взаимодействия и способствует созданию новых прикладных моделей в области безопасности, медицины, робототехники, логистики и других научных направлений.

Анализ требований к мобильному информационному роботу

Несмотря на то что концепция «робота-по-мощника» сформировалась уже несколько десятилетий назад, широкого распространения на рынке обслуживающие роботы пока не получили [1]. Основными сдерживающими причинами являются высокая стоимость, сложность интеграции, минимизации и совмещения всех компонентов в одном мобильном комплексе. Существуют проблемы в организации самостоятельной работы таких систем и в увеличении срока их работоспособности в автономном режиме.

Также имеется ряд недостатков в способах взаимодействия между человеком и системой, системой и окружающей средой. В последнее деся-

тилетие за рубежом активно проводятся исследования и разработки принципиально нового поколения обслуживающих информационных роботов с многомодальным пользовательским интерфейсом [2]. Это системы массового обслуживания, которые могут автоматически определять присутствие пользователя-клиента и общаться с ним естественным образом. Ввод информации может осуществляться как путем нажатия кнопок или сенсорного экрана, так и голосом или даже жестами. Такая система, как правило, обладает знанием о своем пространственном положении, а также планировке здания и использует эти данные при указании пользователю интересующего направления.

При разработке мобильного «робота-помощ-ника» должен быть учтен ряд важных аспектов [1]. Во-первых, следует учитывать реальные потребности пользователей. Во-вторых, разработки должны вестись сразу на трех уровнях: технологии, необходимые для базовой конфигурации системы и использующиеся во всех приложениях; контекстно-зависимые технологии, которые могут быть адаптированы к большинству потребностей пользователей; персонифицированные технологии, разработанные в соответствии с требованиями конкретных пользователей. В-третьих, предложенные решения должны отличаться гибкостью, простотой пользования, надежностью и способностью к самовосстановлению, равно как функциональностью и адаптивностью.

При сопоставлении различных функциональных возможностей предлагаемых сегодня решений следует различать развлекательные системы, системы-помощники для людей с ограниченными возможностями и информационные системы, предназначенные для оповещения населения и предоставления различного рода услуг [3, 4]. Развлекательные системы, такие как японский гуманоидный миниробот ^ОВОТ, имеют минимальный набор функций и простейший интерфейс, основанный на управлении с компьютера или дистанционного пульта. Голосовое управление такими системами заключается в стандартном наборе команд, заранее включенных производителем. Системы-помощники имеют более широкий набор функций и выполняются в различных вариантах в зависимости от прикладной области. Широкое распространение получили роботы-животные; одним из наиболее популярных является японский робот Раго, предназначенный для лечения умственно и физически неполноценных пациентов. Он оснащен различными датчиками, реагирующими на прикосновения, освещенность, температуру и положение человека. Раго различает голосовые команды, узнает хозяина и выражает свои эмоции посредством движе-

ний и различных звуков. Также существуют роботы гуманоидного типа (такие как REEM-B, R100, Domo, STAIR, Twendy-One и др.), предназначенные для выполнения роли сиделки для пожилых людей, способные переносить предметы, передвигаться по помещению, следовать за хозяином, а в случае надобности помогать хозяину подняться с кресла. Такие системы обладают достаточно развитым голосовым интерфейсом, что позволяет пользователям общаться с роботами и управлять ими вербально.

Информационно-справочные системы (такие как SuperDroid RP2W) в основном предназначены для предоставления сведений об услугах и товарах различного вида. Подобные системы обладают минимальным набором функций, главный упор в их конструктивной части сделан на визуализацию предоставляемой информации. Они оснащены мультимедийным оборудованием и способны выполнять базовый набор команд, предусмотренных производителем. Иногда они имеют голосовой интерфейс с ограниченным словарем, могут автономно передвигаться по помещению, составляя карту местности, а также обладают стандартным набором датчиков для передвижения или обнаружения пользователей. Существующие информационные роботы различаются не только функциональными возможностями, но и уровнем коммуникации, связи с внешним миром, осведомленности о предпочтениях посетителей и способности к самообучению. От простейших систем, оснащенных механизмами включения/выключения, делается переход к сложным комплексным системам, способным интерпретировать поведение людей и отвечать их запросам.

Программно-аппаратные средства информационного робота

Наличие многомодального пользовательского интерфейса является отличительной характеристикой разрабатываемого мобильного информационно-справочного робота. Разработанные ранее технологии обработки аудио- и видеосигналов были адаптированы для применения на подвижной платформе в условиях, приближенных к реальной эксплуатации. Следует отметить, что системы распознавания речи, а также слежения за объектами по аудиовизуальной активности должны быть робастны по отношению к фоновым помехам и нестационарным шумам. Наиболее важные технологии, которые применены в мобильном роботе, это: локализация источников звука, автоматическое распознавание речи, идентификация диктора по речи, определение положения и слежение за подвижным объектом и лицом человека, аудиовизуальный синтез русской

речи «виртуальная говорящая голова» [5, 6]. Интеграция указанных технологий в рамках единого программно-аппаратного комплекса, оснащенного подвижной платформой с сенсорными датчиками препятствий, позволяет роботу перемещаться в пространстве и вести вербальный диалог с посетителями.

Аппаратная часть информационного робота состоит из двух основных компонентов: подвижной платформы и информационной сенсорной стойки. Общий вид мобильного информационного робота представлен на рис. 1. Компоновочная схема шасси платформы состоит из двух ведущих и двух флюгерных колес, что позволяет роботу двигаться в двух направлениях (вперед-назад), а также разворачиваться вокруг своей оси. Ультразвуковые и инфракрасные датчики, расположенные по внешней окружности платформы, служат для предотвращения столкновений с препятствиями при передвижении робота. Система управления приводами колес и обработки показаний датчиков установлена на бортовом компьютере информационной стойки, которая также оснащена встроенным Wi-Fi адаптером, двумя сенсорными мониторами, двумя массивами микрофонов, четырьмя веб-камерами, динамиками. Бортовой компьютер и остальные устройства подключены через источник бесперебойного питания к собственному аккумулятору.

■ Рис. 1. Общий вид информационного мобильного робота

С помощью видеокамер робот может следить за движущимися объектами и находить лица людей. Массивы микрофонов используются для локализации источников звука, распознавания речи, а также для идентификации посетителей. Обрабатывая поступающие потоки данных от гетерогенных сенсоров, система управления вырабатывает команды исполнительным устройствам и приложениям, обеспечивающим информационную поддержку пользователей.

Особенности системы управления роботом в торговом центре

Одной из наиболее актуальных областей применения информационных роботов считаются торговые комплексы (ТК) [7]. Покупателям с каждым годом становится все сложнее ориентироваться в новых все расширяющихся комплексах, а непривычная новизна робота привлекает посетителей, поэтому его применение в рекламных целях весьма эффективно. Способность вести естественный диалог, перемещаться вместе с посетителем и учитывать его предпочтения является основным достоинством мобильного информационного робота.

Для формализации задачи интеллектуального управления информационным роботом была предложена концептуальная модель, включающая следующие основные сущности: зону обслуживания, объект, робота, посетителя, запрос, архив, режим работы, алгоритмическую базу (рис. 2). Предложенная модель служит основой для навигации робота в ТК, а также обработки голосовых запросов посетителей, интересующихся определенным товаром или магазином.

Основная информация, необходимая роботу о зоне обслуживания ТК, содержит карту допустимых маршрутов, место парковки, часы работы и список объектов: магазины, кинотеатры, кафе и другие точки интереса (points-of-interest — POI), в описании которых задаются их названия, расположение в комплексе, список предлагаемых услуг или товаров, рекламные ролики, параметры соединения с представителем объекта.

Множество режимов работы информационного робота включает: диалог с посетителем; сопровождение посетителя; движение с выводом рекламы; движение на парковку (рис. 3). В каждом из режимов рассчитывается свой маршрут передвижения и способ взаимодействия с посетителями. Также на выбор режима и изменение маршрута влияет возникновение динамических препятствий и состояние аккумуляторных батарей робота. При появлении посетителя в зоне речевого диалога производится аудиовизуальный синтез приветствия и запрашивается название инте-

№ Б, 2010

■ Рис. 2. Концептуальная модель системы управления информационным роботом

Г

Низкий заряд ■аккумулятора

с п(5етителем 1— РОІ выбран

Ґ Движение на парковку I и остановка

ТК начал работу Л Движение >

^ * —N с выводом^— Р01

I рекламы )

Сопровождение посетителя I

^_______________у Посетитель

в зоне диалога

достигнут -

■ Рис. 3. Логическая модель выбора режимов работы информационного робота

ресующего РО1, после чего робот сопровождает посетителя до нужного места и вновь переходит в режим рекламирования. При составлении маршрутов и модели диалога была проанализирована выложенная в Интернет карта торгового комплекса «МЕГА» в Санкт-Петербурге.

В ходе взаимодействия с посетителем формируется его профиль, включающий основные

внешние данные и предпочтения в выборе товаров и магазинов. В разработанной модели диалога с посетителем основной целью является определение наименования РО1 или названия товара, поэтому структура допустимых фраз была составлена в виде грамматики, представленной на рис. 4. Фраза может содержать только название РО1 (элементы множеств $shop_list, $саГе_^^

О

$шИеге_Ьиу

Где купить

Где продается

Где приобрести

$шИеге_:Н^

Где найти

Мне нужно

Где находится

Магазин

$goods_list

Аксессуары

Белье

Косметика

$8Иор_1Ів1

Бюстье

Оби

Медиамаркт

О

Кафе

$са£е_1ів1

Макдоналдс

Сабвей

Сбарро

$єегуісе___Ііє!

Кинотеатр

Банк

Банкомат

■ Рис. 4. Схема распознавания ключевых фраз пользователей информационного робота

$seгvice_list), название товара (элементы множества $goods_list) или название с дополнительными словами «магазин», «кафе», а также вступительными оборотами с глаголами «купить», «приобрести», «найти» и другими (элементы множеств $wheгe_buy, $wheгe_find).

Если пользователь во фразе указал название РО1, то производится определение его местоположения, расчет маршрута и последующее движение робота к месту входа в интересующую РО1. Если пользователь указал некоторый товар/услугу, то происходит поиск объектов, в которых продается данный товар, после чего список всех удовлетворяющих поиску объектов выводится на экран, где посетителю предлагается выбрать один. После выбора пользователем робот переходит в режим его сопровождения. Собранная в ходе движения и взаимодействия робота с посетителями информация о проделанных маршрутах, выполненных заданиях, предпочтениях пользователей архивируется для дальнейшей оптимизации системы управления роботом.

Заключение

Проектирование мобильных систем-помощников является новой научной парадигмой в области информационных технологий и актуальной научно-практической задачей. Разрабатываемый

Литература

1. Breazeal C. et al. Humanoid robots as cooperative partners for people // Intern. J. of Humanoid Robots. 2004. Vol. 1. N 2. P. 1-34.

2. Fritsch J. et al. Multi-modal anchoring for human-robot-interaction // Robotics and Autonomous Systems. 2003. Vol. 43. P. 133-147.

3. Fong T., Nourbakhsh I., Dautenhahn K. A survey of socially interactive robots // Robotics and Autonomous Systems. 2003. Vol. 42. P. 143-166.

4. Green S., Billinghurst X., Chen M., Chase G. Human-robot collaboration: A literature review and augmented reality approach in design // Intern. J. of Advanced Robotic Systems. 2008. Vol. 5. N 1. P. 1-18.

информационно-справочный робот представляет собой мобильную подвижную систему, которая содержит сеть интеллектуальных аппаратно-программных модулей, активационных устройств, мультимедийных средств и аудиовизуальных сенсоров. Основная задача робота — обеспечение пользователей необходимой справочной информацией и сервисами на основе автоматического анализа окружающей обстановки. Осведомленность системы о предпочтениях пользователя помогает более точно предсказать намерения и потребности человека. Наличие пользовательского многомодального интерфейса позволяет перевести взаимодействие человека с машиной на новый уровень и обеспечить понятный и доступный интерфейс любой категории пользователей.

Анализ реальных диалогов, способов взаимодействия с роботом и учет персонифицированных данных позволят выявить шаблоны поведения и предпочтений основных групп пользователей, сценариев человекомашинных взаимодействий и наиболее актуальные команды, которые следует генерировать и выполнять автоматически, что будет способствовать повышению эффективности взаимодействия человека с мобильным роботом.

Работа выполнена в рамках ФЦП «Научные и научно-педагогические кадры инновационной России» (ГК N° П876), а также поддержана КНВШ Администрации Санкт-Петербурга.

5. Ронжин А. Л., Карпов А. А., Кагиров И. А. Особенности дистанционной записи и обработки речи в автоматах самообслуживания // Информацион-но-управляющие системы. 2009. № 5. С. 32-38.

6. Карпов А. А., Ронжин А. Л. Многомодальные интерфейсы в автоматизированных системах управления // Изв. вузов. Приборостроение. 2005. Т. 48. № 7. С. 9-14.

7. Kanda T. et al. An Affective Guide Robot in a Shopping Mall // Human-Robot Interaction 2009: Proc. of 4th ACM/IEEE Intern. Conf., Mar. 11-13, 2009, San Diego, USA. P. 173-180.

i Надоели баннеры? Вы всегда можете отключить рекламу.