Научная статья на тему 'Системы технического зрения с невизуальным представлением пространственной информации'

Системы технического зрения с невизуальным представлением пространственной информации Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
269
62
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Ершов С.О., Майер П.

Рассматриваются системы, позволяющие человеку воспринимать пространственную информацию посредством слуха или осязания и применяющиеся в технических средствах ориентирования для слепых и работников аварийноспасательных служб.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Системы технического зрения с невизуальным представлением пространственной информации»

ЭЛЕКТРОННЫЕ И ЭЛЕКТРОМАГНИТНЫЕ

УСТРОЙСТВА

УДК 621.034.4-8:362.41

С. О. Ершов

Балтийский государственный технический университет „Военмех" им. Д. Ф. Устинова

Санкт-Петербург

П. МАЙЕР

Эйндховен, Нидерланды

СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ С НЕВИЗУАЛЬНЫМ ПРЕДСТАВЛЕНИЕМ ПРОСТРАНСТВЕННОЙ ИНФОРМАЦИИ

Рассматриваются системы, позволяющие человеку воспринимать пространственную информацию посредством слуха или осязания и применяющиеся в технических средствах ориентирования для слепых и работников аварийно-спасательных служб.

Историческая справка. Исторически одним из основных стимулов развития систем технического зрения являлись проблемы слепых, и наибольшее число разработок предпринимались именно для их нужд. В этой связи в настоящей статье речь пойдет преимущественно о приборах для слепых.

Предпосылкой возникновения рассматриваемых устройств можно считать открытие в 1817 г. химического элемента селена, обладающего светочувствительными свойствами. Появление непосредственно технических средств ориентирования (ТСО) для инвалидов по зрению относится к 1897 г., когда Нойжевский изобрел устройство „Е1ес1;гойа1ш", в котором с помощью селеновой пластинки регулировалась громкость звукового сигнала, что позволяло слепому определять степень освещенности находящихся перед ним крупных объектов.

В 50—60-х гг. ХХ в. началось использование ультразвуковой локации в целях обнаружения препятствий на пути слепого и измерения расстояний до них. Наиболее весомый вклад в это направление внес Л. Кэй [1]. Несколько позже в качестве источника информации об окружающей среде стали использовать лазерные дальномеры, работающие в инфракрасном (ИК) диапазоне частот. Обычные (немонохроматические) ИК-светодиоды также нашли применение в примитивных детекторах препятствий. С конца 60-х гг. в связи с развитием телевидения появились новые направления в решении проблемы пространственного ориентирования слепых. Например, Бах-и-Рита использовал матрицу тактильных стимуляторов, располагаемую на спине пользователя для передачи ему информации о фронтальном образе среды, получаемом от телевизионной камеры. Бриндли и Добелле использовали для тех же целей матрицу нейростимуляторов, имплантированных в зрительный отдел головного мозга.

В 90-х гг. П. Майер изобрел систему, названную „VOICE" [2], позволяющую преобразовывать информацию от видеокамеры в звуковые образы. Тогда же начались работы по использованию систем объемного звучания для синтезирования трехмерных звуковых образов среды (Гонсалес-Мора, Каваи). В настоящее время в нескольких университетах западных стран ведутся работы по созданию матриц, стимулирующих различные участки зрительного нерва слепого. Информацию о среде поставляют также телевизионные камеры. Среди ведущих специалистов этого направления можно отметить Хумаюна, Риццо и Зреннера.

Быстрое развитие вычислительной техники привело в начале XXI в. к возможности создания миниатюрных устройств, способных реализовать процесс распознавания сложных телевизионных образов в реальном времени. В таких системах предпочтительным способом представления информации являются синтезированные речевые сообщения. Одним из последних (2004 г.) достижений в данном направлении является разработка японского ученого Шиоямы, условно названная „electronic eye" (электронный глаз).

В это же время в Санкт-Петербургском ЦНИИ робототехники и технической кибернетики начались разработки системы с речевым представлением информации, полученной от стереоскопической видеосистемы (руководитель О. А. Мельников).

Достижения в области спутниковой связи также используются при создании навигационных средств для слепых. Информация, получаемая через систему глобального позиционирования (GPS), поставляется слепому посредством речевых сообщений. Впрочем, здесь речь идет не об обнаружении препятствий, а лишь о сообщении пользователю его координат и ориентации по сторонам света.

Классификация ТСО. По способу получения пространственной информации известные на сегодня системы технического зрения можно разделить на три группы:

— системы со световой локацией в инфракрасном диапазоне частот;

— системы с ультразвуковой локацией;

— телевизионные системы.

Для невизуального представления информации в ТСО применяются:

— звуковые излучатели;

— тактильные датчики;

— матрицы нейростимуляторов.

Способы замещения зрительного восприятия. В соответствии с названными каналами передачи информации слепому разработка высокоинформативных приборов осуществляется по следующим направлениям:

— максимальное использование слуха;

— „кожное зрение";

— сложное (матричное) стимулирование глазного нерва или зрительного отдела головного мозга.

Среди реализованных и серийно выпускаемых устройств замещения зрения в настоящее время наиболее широко представлены приборы, предназначенные для максимального использования слуха, что связано с высокой информативностью соответствующих ТСО, технологичностью их изготовления и отсутствием факторов, опасных для здоровья пользователя.

„Кожное зрение" реализуется обычно посредством тактильных (электрических, тепловых или вибрационных) матриц, накладываемых на достаточно большие площади кожного покрова и стимулирующих участки кожи в соответствии с распределением яркости в телевизионном кадре, полученном от видеокамеры. Этот способ обладает невысокой разрешающей способностью, впрочем, следует отметить, что сейчас в Москве работает научная группа общественного фонда „Вереск" под руководством А. Брызгалова, которая занимается проектом „Тактильное виденье", и полученные ими результаты дают надежду на частичное решение данной проблемы. Последние достижения упомянутого выше Бах-и-Риты связаны с использованием языка в

качестве чувствительного органа для восприятия сигналов тактильной матрицы. Однако, по некоторым отзывам, такой способ неудобен для повседневного применения.

Эксперименты по имплантации матриц в головной мозг, выполненные, например, До-белле, показали работоспособность соответствующих ТСО, но опасность для здоровья нейрохирургических операций и их высокая стоимость делают этот путь малопривлекательным для слепых.

На основании приведенных рассуждений устройства, ориентированные на максимальное использование слухового канала восприятия, представляются наиболее перспективными.

ТСО, максимально использующие слух. Рассмотрим принципы действия двух наиболее информативных ТСО этого типа: ультразвукового прибора „Kaspa" (Л. Кэй) и телевизионной системы „VOICE" (П. Майер).

„Kaspa". Конструктивно этот прибор представляет собой модифицированные очки [3], в оправе которых размещаются ультразвуковой (УЗ) излучатель, направленный прямо вперед и три УЗ-приемника: ось центрального приемника направлена прямо вперед, оси боковых отклонены от центрального направления влево и вправо на угол около 10°. В дужки очков вмонтированы стереофонические микротелефоны, звуковые сигналы от которых подводятся к ушам пользователя при помощи пластиковых трубочек. Блок электроники размещается в отдельном корпусе, носимом в кармане и соединенном с „очками" кабелем.

Частота излучаемого сигнала синусоидальной формы периодически меняется по линейно убывающему закону:

/ (Л = dФизл (t) =

/изл ^ 2п dt f ^, где физл(0 — фаза напряжения на входе излучателя, рад; / — верхняя граница частоты излучения (в начале цикла), Гц; ц — скорость изменения частоты в излучаемом ЛЧМ-сигнале, с ; ts — время, исчисляемое от начала n-го периода ЛЧМ, с; при этом t = tn + ts, где tn — момент начала n-го периода, с.

Диапазон изменения излучаемой частоты в „очках" Кэя 40—80 кГц.

В случае отражения излучаемого сигнала от препятствия, расположенного на расстоянии L от локатора, эхо-сигнал приходит на приемник с задержкой т = 2Ыс, где с — скорость распространения УЗ-волны в воздухе. Тогда дистанция до отражающего объекта представляется разностной частотой, получаемой путем перемножения сигналов с приемника и передатчика. Разностная частота изменяется по закону

fp (t) = /изл (t)- /пр (t) = )

d x(t) dt

dT(tVh )

dt

где /пр — частота сигнала, снимаемого на выходе УЗ-приемника.

При т = 2L^ = const (т.е. при нулевой относительной скорости объекта)

fp (t) = ^L = HL , F с

здесь H = 2д/с — код расстояния, Гц/м.

Таким образом, частота разностного сигнала пропорциональна дальности, именно она несет информацию пользователю о расстоянии до объекта. Направление на объект определяется пользователем на слух по разности амплитуд сигналов в левом и правом каналах стерео-телефонов. Центральный УЗ-приемник, имеющий более узкую диаграмму направленности, позволяет более точно определить это направление. Таким образом, устройство формирует двухмерную модель пространства (указываются угол азимута и дальность).

Опытные пользователи прибором „Kaspa" способны не только избегать столкновений, но даже участвовать в подвижных играх.

Система „VOICE". Конструктивно данное ТСО также представляет собой модифицированные очки. В оправе размещается скрытая миниатюрная видеокамера, ось которой направлена прямо вперед. В дужки очков вмонтированы стереофонические микротелефоны и микрофон для подачи голосовых команд управления системой. Обработка сигналов производится в миниатюрном ноутбуке, расположенном обычно в рюкзачке за спиной пользователя и соединенном с „очками" кабелем.

Изображение от видеокамеры оцифровывается, обрабатывается и преобразуется в „звуковые кадры", передаваемые пользователю через телефоны. Принцип преобразования следующий: видеокадр разбивается на вертикальные столбцы. Каждый столбец преобразуется в сочетание (сумму) звуковых сигналов, частота каждого из которых тем выше, чем выше расположен соответствующий сегмент (пиксел) видеоизображения, а амплитуда зависит от яркости соответствующего пиксела. Иными словами, угол возвышения кодируется частотой, а яркость — громкостью сигнала, причем одномоментно „озвучивается" только один столбец. Происходит сканирование видеокадра (с периодом около 1 с) слева направо. При этом звуковые образы, соответствующие столбцам, составляющим кадр, генерируются последовательно, один за другим. В начале каждого кадра формируется короткий звуковой импульс начального отсчета (щелчок), кроме того, стереофонический сигнал формируется так, чтобы кажущееся направление на источник звука совпадало с действительным направлением на соответствующий участок поля обзора. На рис. 1 приведено упрощенное изображение некоторого видеокадра, разбитого на 8 столбцов и 8 строк и имеющего 3 градации яркости; здесь же представлена диаграмма, поясняющая, как формируется звуковой сигнал для первого столбца видеокадра.

Рис. 1

По мнению многих экспертов, „VOICE" на сегодня является одной из наиболее перспективных систем с точки зрения заложенного в ней потенциала по повышению информативности и реализации так называемого „видения с помощью звука". Однако обеспечение надежного обнаружения препятствий и оценки расстояния до них остается проблематичным.

В настоящее времени продолжаются работы по усовершенствованию системы „VOICE". В результате научного сотрудничества авторов настоящей статьи разработана и частично реализована концепция построения комбинированного ТСО на базе „VOICE". Новая система дополнена импульсным УЗ-локатором (сонаром) для измерения дальности до ближайших объектов. Информация видеокадра предоставляется пользователю в звуковой форме через стандартные головные телефоны. Чтобы информационные сигналы сонара не влияли на

Рис. 2

качество восприятия пользователем „звуковых кадров" системы „VOICE", сведения о дальности предполагается выдавать через вибрационный датчик.

Дополнительную информацию по данной разработке см. на сайте www.seeingwithsound.com

в разделе „Sonar extension".

Внешний вид действующего макета специальных очков с вмонтированной скрытой видеокамерой и ультразвуковыми преобразователями, установленными на дужках, показан на рис. 2.

Практическое внедрение ТСО. Несмотря на полувековой опыт разработок различных ТСО для слепых лишь немногие из них доходят до стадии промышленного выпуска и получают широкое признание пользователей. Основными причинами являются либо недостаточно высокие потребительские качества, либо высокая цена. Последняя причина ограничивает скорость внедрения наиболее высокоинформативных ТСО. Среди эффективных, но дорогих ТСО можно назвать, например, рассмотренный выше прибор „Kaspa" стоимостью более 3 000 долл. и лазерную трость „Lasercane" (фирма „Nurion Industries", США) стоимостью около 2 500 долл. Кроме того, существенной проблемой является процесс обучения пользователя. Поэтому на мировом рынке востребованы более простые приборы, такие как, например, трость „'K' Sonar Cane" („Bay Advanced Technologies Ltd", Новая Зеландия) по цене около 600 долл. и ультразвуковой ручной детектор препятствий „Miniguide" („GDP Research Adelaide", Австралия), стоящий 400—500 долл.

В России опыта серийного внедрения подобных изделий до последнего времени не было. Однако в 2004—2005 гг. в БГТУ „Военмех" им. Д. Ф. Устинова (Санкт-Петербург) проведен ряд работ, базирующихся на 15-летнем опыте научных исследований в области приборов для слепых, и начат выпуск ультразвуковой трости „Сонар-1" для инвалидов по зрению (внешний вид трости представлен на рис. 3, а), а также ультразвукового фонаря „Поиск-01" для служб МЧС.

Рис. 3

При поддержке БГТУ „Военмех" и Фонда содействия развитию малых форм предприятий в научно-технической сфере в 2005 г. в Петербурге создано НПО „Сонар", специализирующееся на разработке и усовершенствовании ТСО для слепых. Одна из наиболее успешных разработок этого предприятия — ультразвуковой фонарик-кулон „Сонар-5УФ" (см. рис. 3, б), в котором информация о препятствиях представляется в виде тональных или вибрационных сигналов, по выбору пользователя (подробнее — см. на сайте www.tiflocomp.ru в разделе „Бытовая техника"). В настоящее время НПО „Сонар" приступает к разработке электронного компаса для инвалидов по зрению.

Расчет аксиального градиентного модуля магниторезонансного томографа 47

При разработке приборов для слепых, ввиду специфики российского рынка, уделялось внимание снижению их стоимости: на конец 2GG7 г. цена трости „Сонар-1" составила б 5GG руб., фонарика „Сонар-5УФ" — 4 25G руб.

Заключение. Наиболее перспективными устройствами для слепых на ближайшие 5—1G лет представляются телевизионные ТСО, предназначенные для максимального использования слуха. Однако необходимо учитывать и присущие этим приборам ограничения. Одна из основных особенностей их применения — необходимость значительных временных затрат на обучение пользователя интерпретации звуковых сигналов, при этом конечная эффективность данных устройств зависит от пользователя не в меньшей мере, чем от качества реализации ТСО. Следует отметить, что помимо технических проблем возникает также вопрос преодоления психологического барьера. По результатам натурных испытаний различных ТСО (с участием слепых экспертов) приходится признать, что при определении оптимального способа представления информации весьма существенным остается субъективный фактор, поэтому ни одно из рассмотренных направлений развития ТСО не может претендовать на абсолютное превосходство по отношению к остальным. В этой связи с практической точки зрения представляется целесообразной организация для слепых специальных учебных групп, оснащенных ассортиментом ТСО различной сложности, где пользователь имел бы возможность осваивать навыки обращения с данными приборами, начиная с наиболее простых.

СПИСОК ЛИТЕРАТУРЫ

1. Kay L. A sоnar aid to enhance spatial perception of the blind: engineering design and evaluation // The Radio and Electronic Engineer. 1974. Vol. 44. P. 6G5—627.

2. Meijer P. B. L. An experimental system for auditory image representation // IEEE Trans. Biomedical Engineering. 1992. Vol. 39, N 2. P. 112—121.

3. Yonesawa Y. Binaural sensitivity to direction cue in an acoustic spatial sensor // Acoustica. 198б. Vol. 72. P. 14G—144.

Рекомендована кафедрой Поступила в редакцию

систем обработки информации 22.11.06 г.

и управления БГТУ „Военмех"

УДК 621.17.34

П. А. Галайдин

Балтийский государственный технический университет „Военмех" им. Д. Ф. Устинова

Санкт-Петербург

РАСЧЕТ АКСИАЛЬНОГО ГРАДИЕНТНОГО МОДУЛЯ МАГНИТОРЕЗОНАНСНОГО ТОМОГРАФА

Рассмотрен метод расчета аксиального градиентного модуля магниторезонанс-ного томографа, состоящего из трех градиентных систем, генерирующих линейно изменяющиеся по трем осям декартовой системы координат магнитные поля. Приведены результаты расчета и схемы градиентных систем.

Аксиальный градиентный модуль предназначен для введения в рабочем объеме томографа прямоугольной системы магнитных координат, при этом основной магнит представляет собой набор круговых обмоток. Так как частота ядерного магнитного резонанса в исследуемом образце прямо пропорциональна значению приложенного магнитного поля [1], то

i Надоели баннеры? Вы всегда можете отключить рекламу.