УДК 004.5 Ф.Д. Михальков
Применение технологии дополненной реальности в пользовательских интерфейсах
Предлагаются основные подходы к созданию пользовательских интерфейсов, использующих технологию дополненной реальности, а также описываются алгоритмы определения изменения положения наблюдающей камеры.
Ключевые слова: дополненная реальность, пространственный трекинг, пользовательский интерфейс.
В настоящее время информационные технологии стремительно развиваются, растут объемы обрабатываемой информации и программные системы становятся сложнее с каждым годом, следовательно, взаимодействие с программными системами становится нетривиальной задачей. Пользовательские интерфейсы должны обеспечить пользователю комфортную работу с программной системой, но иногда при решении определенного круга задач (например - трехмерное моделирование объектов) возникает проблема недостаточной наглядности, вызванная сложностью выполняемых работ. Существующие пользовательские интерфейсы недостаточно полно решают эту задачу. Одним из путей решения проблемы человеко-машинного взаимодействия является использование технологии дополненной реальности.
Технология дополненной реальности является перспективным средством для создания пользовательских интерфейсов мобильных приложений, т.к. эта технология позволяет воспринимать информацию о положении и ориентации объектов на интуитивном уровне [1]. За счет наложения дополнительной информации на изображение реального мира технология дополненной реальности реализует принципиально новый тип пользовательского интерфейса, который может реагировать на окружающую среду.
В начале 2000-х годов велись разработки мобильных систем дополненной реальности - Mobile Augmented Reality System (MARS). Такая система состояла из аккумуляторной батареи, носимой ЭВМ, модуля геолокации, камеры и очков стереовидения [2]. Предполагалось, что MARS-системы будут определять местонахождение пользователя с помощью модуля геолокации и на основе этого получать актуальную для пользователя информацию, например о расположенных вблизи зданиях.
В настоящее время технологии достигли такого уровня развития, что большинство современных смартфонов оснащены GPS/ГЛОНАСС-модулями геолокации и камерами достаточной разрешающей способности, чтобы использовать их для построения пользовательских интерфейсов с технологией дополненной реальности - Augmented Reality User Interface (ARUI). Использование смартфонов как аппаратной платформы для ARUI-систем позволит существенно сократить стоимость разработки подобных систем, так как не придется разрабатывать уже существующую аппаратную часть.
В MARS/ARUI-системах можно выделить два основных источника данных об окружающей среде:
- подсистема геолокации, получающая информацию о положении и ориентации пользователя в пространстве на основе GPS/ГЛОНАСС-приемников;
- подсистема распознавания образов, использующая камеру мобильного устройства.
В свою очередь, технология дополненной реальности, использующая подсистему распознавания образов, делится на категории:
- маркерная технология дополненной реальности - распознавание графических примитивов и их комбинаций;
- безмаркерная технология дополненной реальности - распознавание текстур;
- пространственный трекинг - нахождение в окружающем пространстве особых «реперных» точек и определение по ним относительного положения пользователя в пространстве.
136
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
В МЛЯЗ/ЛЯШ-системах с использованием геолокации, где пользователю необходимо получать информацию об окружающих объектах, может использоваться мобильная информационная система. Такая система может быть построена по следующему принципу. Система состоит из двух частей:
- удаленный сервер с базой данных о реальных объектах и их местоположении;
- мобильная часть, включающая в себя модуль геолокации (смартфон с ОРБ/ГЛОНАСС-приемником).
Мобильная часть получает данные о своем местоположении и ориентации и отсылает эти данные на удаленный сервер, где они используются как условие выборки из базы данных. Затем удаленный сервер отсылает на мобильную часть информацию о реальных объектах, которые попадают в поле зрения пользователя. Такой подход может быть применен в навигаторах или геоинформационных системах.
МЛЯЗ/ЛЯШ-системы с использованием распознавания образов обычно используются в программных системах, где осуществляется непосредственное взаимодействие с окружающим миром. Такой системой может быть программно-аппаратный комплекс, установленный в автомобиле и сигнализирующий водителю, например, о пересечении двойной сплошной горизонтальной линии разметки. Рассматриваемая система должна иметь видеокамеру для считывания информации о дорожной разметке и подсистему распознавания образов для выявления ситуации недопустимого пересечения дорожной разметки.
Еще одним вариантом МАКБ/АШЛ-систем являются приложения, которые определяют в поле зрения камеры наличие, положение и ориентацию особого маркерного изображения и выводят на его месте заранее заданную трехмерную модель. Такие приложения могут использоваться в области электронных презентаций для более наглядной демонстрации описываемых продуктов.
В настоящее время для МАЯБ/АЯШ-систем ведется разработка подсистемы распознавания образов, основанной на технологии пространственного трекинга. В основе данной подсистемы лежит принцип определения и отслеживания отдельных «реперных» участков (сегментов) изображения окружающего мира, которые имеют определенную характеристику. После выделения реперных точек необходимо сравнить их с выделенными ранее точками, чтобы отследить изменение положения точек на изображении окружающего мира. Далее на основе этой информации определяется изменение положения наблюдателя в пространстве. На рис. 1 приведена блок-схема основного алгоритма разрабатываемой подсистемы.
Под характеристикой сегмента изображения понимается функция Е(Г), где У - растр сегмента изображения. Сегменты изображения
Рис. 1. Основной алгоритм разрабатываемой подсистемы
с характеристикой выше порогового значения Е) считаются особыми «реперными» точками. Следовательно, условие отбора особых точек на изображении можно записать так:
Е (?) > Е). (1)
Для описания характеристики сегмента изображения удобно использовать градиент яркости сегмента. Для дискретных изображений вычисление градиента яркости сводится к вычислению перепадов яркости между соседними пикселями. Например, для описания характеристики сегмента размером 2x2 пикселя удобно использовать фильтр Робертса [3]. В общем виде фильтр Робертса записывается как
F ( x, y ) = | f '( x, y) - f "( x+1, y + 1) + | f '( x, y +1) - f '( x+1, y ), где f '(x,y) - яркость пикселя с координатами (x,y) Тогда для сегмента размером 2x2 пикселя уравнение (1) примет вид
f '(S0,0 ) - f "(S1,1 )| +1 f '(so,1 ) - f '(S1,0 ) > Fo, где sx,y - пиксель растра сегмента с координатами (x,y). Пороговое значение перепада яркости
определяется на основе гистограммы яркости изображения.
Для определения изменения положения опорной точки в пространстве используется алгоритм Tomasi-Kanade [4]. В этом алгоритме движение опорных точек описывается смещением вида
AX=X + D,
где D - изменение положения опорной точки, X - последнее известное положение опорной точки. Задача алгоритма заключается в поиске такого D, при котором минимизируется разность характеристик реперных точек на изображении:
AF = Y}F(X + D) - F(X)2,
w
где W - количество опорных точек [5].
После расчета изменений положения особых точек на изображении необходимо рассчитать изменение положения наблюдателя в пространстве. В настоящее время ведется разработка алгоритма, который позволит реализовать эту задачу.
Применение технологии дополненной реальности при разработке программных систем позволяет создавать принципиально новые пользовательские интерфейсы, которые могут взаимодействовать с окружающим миром, а доступность и повсеместное использование необходимого аппаратного обеспечения позволяют использовать технологии дополненной реальности практически каждым человеком.
Литература
1. Schmalstieg D. The World as a User Interface: Augmented Reality for Ubiquitous Computing // Location Based Services and TeleCartography. - 2007. - Vol. 4. - Р. 369-391.
2. Hollerer Т. User Interface Management Techniques for Collaborative Mobile Augmented Reality // Computers & Graphics. - 2001. - Vol. 5, № 26. - Р. 799-810.
3. Ерош И. Л. Обработка и распознавание изображений в системах превентивной безопасности: учеб. пособие / И.Л. Ерош, М.Б. Сергеев, Н.В. Соловьев. - СПб: ГУАП, 2012. - 154 с.
4. Kanade T. Detection and tracking of point features [Электронный ресурс]. - Режим доступа: http://www.lira.dist.unige.it/teaching/SINA/slides-current/tomasi-kanade-techreport-1991.pdf, свободный (дата обращения: 23.01.14).
5. Козырева А.В. Определение координат мобильного устройства в пространстве на основе изображений, получаемых от его видеокамеры [Электронный ресурс]. - Режим доступа: http://www.iis.nsk.su/files/articles/sbor_kas_13_kozyreva_1.pdf, свободный (дата обращения: 23.01.14).
Михальков Федор Дмитриевич
Аспирант каф. телевидения и управления ТУСУРа
Тел.: 8(951)185-37-95
Эл. почта: fixed.fred@gmail.com
Mikhalkov F.D.
Using of augmented reality technology in user interfaces
The article describes the main approaches to building user interfaces using augmented reality technology, and describes algorithms for determining changes in the position of the observing camera. Keywords: augmented reality, environment tracking, user interface.