Научная статья на тему 'Информационная значимость компонента U-преобразования при решении задачи ориентации в пространстве для систем технического зрения'

Информационная значимость компонента U-преобразования при решении задачи ориентации в пространстве для систем технического зрения Текст научной статьи по специальности «Математика»

CC BY
55
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗРИТЕЛЬНОЕ ВОСПРИЯТИЕ / VISUAL PERCEPTION / ФИЗИКО-МАТЕМАТИЧЕСКИЕ ИНТЕРПРЕТАЦИИ / PHYSICAL-MATHEMATICAL INTERPRETATION / ПРОСТРАНСТВЕННЫЕ МОДЕЛИ / SPATIAL MODELS

Аннотация научной статьи по математике, автор научной работы — Утробин В. А.

Рассматриваются проблемы построения перцептивного пространства для систем технического зрения с позиций теории активного восприятия по результатам анализа произвольного изображения на системе пространственных градиентов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SIGNIFICANCE OF INFORMATION OF U-TRANSFORM COMPONENTS IN SOLVING THE PROBLEM OF ORIENTATION IN SPACE FOR VISION SYSTEMS

Purpose: Building a perceptual (internal observer) space as an external model based on video surveillance. Method: From the perspective of the theory of active perception, involving the physical-mathematical apparatus investigated the spectral decomposition of the newsworthiness of a priori uncertain picture for description and understanding of the observed images. The result / area of application: Using of physical and mathematical interpretations of supervised classifications, to prove the existence of change inherent in a system of visual perception of human acceptance of patimernomu space. The result is the ability to assess the depth of tencial'naa even from the vision of one eye (monoste-riovospriatia). Therefore, the system of visual perception uses, with positions on the observed image nimania-physical concepts of scalar and vector capacities. Research results would have important applications in machine vision systems. Conclusions: The studies proved theoretically informational value low-frequency spatial components of the expansion for the task orientation in the environment, assess the position of the observer in this environment, and in-depth assessments of perceptual space.

Текст научной работы на тему «Информационная значимость компонента U-преобразования при решении задачи ориентации в пространстве для систем технического зрения»

где k, r = 1,3 , к + r = 6, j = 1,6 (обозначение потенциальной функции опущено).

Рис. 1. Система предобработки изображения М

Производные в составе системы (2) - это функции чувствительности, входящие в состав ряда Тейлора при решении задачи активной идентификации (по этой причине соответствующая теории обработки изображений в условиях априорной неопределенности называется теорией активного восприятия).

Ряд Тейлора (относительно центра области определения А0) имеет следующий вид:

1 , 1 .3,

ф(X) - ф(А0) = ф +—d2ф +—d ф +

2!

3!

где drф - полный дифференциал:

dr ф = х C

дr

dxr-k dyr, Ck =

k=o dxr-kdyk ' ' r k!(r -k)!

При разложении произвольного изображения по функциональной схеме рис.1 все компоненты вектора ц = равнозначны (с точки зрения информационной значимости). При наличии шумов на изображении, либо при анализе относительно сложно организованных сцен компоненты вектора «шумят», т.е. исчезают явные локальные экстремумы в линейчатом спектре разложения. Возникает вопрос, а нельзя ли теоретически обосновать информационную значимость компонент разложения изображения. Результаты теоретических исследований, направленные на решение поставленной проблемы, излагаются в данной работе.

Взвешенное ^-преобразование

Множество масок Fi, в соответствии с ТАВ, упорядочены на двумерной решетке V(x, y) (рис. 2, [2, 3]), а по диагональным срезам на системе преобразований (4) принадлежат шести первым полным дифференциалам: d1 - d6.

r!

(5)

(6)

У

Q

F10 F5

F,

о

Fo

О

V(x,y) Q-Q

F12 F7

F3

Q-

F1

o-

F14 Fi

-0

-Q

-O

а)

Fs F13 -0

F6 F1

-Q

f4 f9 x -o-*

\y V(xy)

d1 d2 d3

б)

Рис. 2. Двумерная решетка У(х, упорядочения масок (а) и срезы ^ на решетке (б)

x

Три первых полных дифференциала полностью представлены на решетке и реализуются девятью масками - Г1, Р2, Р4, Р3, Р5, Р7, ^ю (нумерация масок по работе [2]):

.1 U , U . ,2 U ,2 U 72

d =— ох н--dy; d =—- ох + 2-dxdy н--- dy ;

Ux Uy Ux2 UxUy Uy2

5 , 5 , ,2 52 , 2 о 52 . . а2

+ 2-ахау

дхду

53 53 53 53

а3 =—- ах3 + 3—-— ах2 ау+3—^ ахау2 +—- ау3.

5х 5х 5у 5х5у 5у

Три последних полных дифференциала представлены частично и реализуются масками

^8, Рц, ^12, ^13, Fl4, ^15!

54 54 54

а4« 6—т—у ах2 ау2 + 4—-— ах ъау+4—- ахау3;

5х 5х 5у 5х5у

55 55 56

а5« 10——- ахъау2 +10 , ах2ау3; а6« 20 , ахъау3. 5х 5у2 5х25у 5х ду

Подставляя выражения полных дифференциалов в (5) с учетом (6), получаем следующий вид ряда Тейлора для потенциальной функции ф(х, у) в произвольной точке X области определения относительно центра этой области:

3 1 7 1 1 12 1 14 1

ф(Х) -ф(Ло) = + +7^8 + 7^^ + 77^15 + 0(£) . (7)

1 2 4 4 6 9 12 13 36

Отсюда следует распределение долевого участия компонент разложения на основе и-преобразования (табл. 1).

Таблица 1

Долевое участие

F, 1-3 4-7 8 9-12 13-14 15

Кластер 1 2 3 4 5 6

% 49,32 24,66 12,33 8,22 4,11 1,37

При расчете долевых участий компонент вектора разложения принято условие - сумма всех коэффициентов в ряде (7) составляет 100%: ^а = 2,027(7) ~ 100% .

Рис. 3. Кластеры равных долевых участий Рис. 4. Максимальный вклад

Таким образом, из анализа ряда Тейлора для и-преобразования на множестве из 15-ти масок (и соответствующих им преобразований из (4)) следует:

1. Существуют подмножества (кластеры), имеющие равный долевой вклад по результатам описания произвольного изображения (табл. 1, рис. 3):

- кластер 1 - 5ф(х, у)/5х, 5ф(х, у)/5у; 52ф(х, у)/дхду;

- кластер 2 - 52ф(х, у)/5х2; 52ф(х, у)/5у2; 53ф(х, y)/дx2дy; 53ф(х, y)/дxдy2;

- кластер 3 - д4ф(х, у)/дх2ду2;

- кластер 4 - д3ф(х, у)/дх3; д3ф(х, у)/ду3; д4ф(х, у)/дх3ду; д4ф(х, у)/дхду3;

- кластер 5 - д5ф(х, у)/дх3ду2; д5ф(х, у)/дх2ду3;

- кластер 6 - д6ф(х, у)/дх3ду3.

2. Из табл. 1 видно, что кластер 1 обеспечивает почти 50%-ный вклад, т.е. долевое участие масок данного кластера (а это низкочастотные пространственные компоненты в анализируемом изображении) максимально.

3. Если учесть следующие два кластера, то эти три кластера обеспечивают более 85% информации в общем результате анализа изображения (рис. 4).

4. Оставшиеся три кластера (4, 5, 6), маски которых реализуют относительно высокочастотные преобразования, обеспечивают получение не более 14% информации, относящейся к «малогабаритным» пространственным объектам изображения.

1/8

1/24

1/3

Г >

1/24

— \

—С )—

Ао -

-О-

1/4

1/36

У

1/24 1/8

О-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г(ху)

<?-О

1/24

1/8

1/24 1/36 1/4 1/24

1/3 1/3 1/8 1/24

<?-о--О

1/3

1/8 1/24

х

1

1

а) б)

Рис. 5. Поэлементное распределение весовых коэффициентов масок:

а - внешний вид масок и их веса; б - распределение весов на решетке У(ху)

Каждое преобразование, реализуемое пространственными масками (применяемыми после ^-преобразования), является базисным, т.е. независимым, и одновременно два произвольных преобразования несовместны, т.е. в составе изображения одновременно не может быть образ, соответствующий полному покрытию двух масок, они всегда перекрываются. Поэтому их участие в описании (имеется в виду вероятностная мера) равновероятно и это верно также для масок, входящих в состав кластеров. В результате, учитывая распределения по (7), получаем поэлементное распределение вероятностных долей участия масок, представленное на рис. 5.

На рис. 6 показано изменение вклада масок в зависимости от их принадлежности соответствующим кластерам. На маске реализующей преобразование д4ф(х, у)/дх2ду2, наблюдается «всплеск активности».

1/2 1/3

1/8

вклад

кластер —►

0

1

2

3

4

Рис. 6. Изменение вклада масок по их принадлежности

1

Физико-математические интерпретации

В соответствии с ТАВ, каждой маске Fi соответствует бинарный оператор Vi, аналогично представленный на решетке V(x, y). Для выявления внутренней геометрии многообразия используется касательная в точке A0 к многообразию, евклидова плоскость, «кусок» которой с центром Ao называется планигоном (рис. 5, а).

1. Если маски Fi, F2, реализующие преобразования дф(к, y)/dx, Зф(х, y)/dy, выявляют градиентные изменения по направлениям осей х, y декартовой системы координат (и по этой причине максимально значимы при решении задач ориентации в пространстве), то им равнозначна по вкладу маска F3, которой соответствует преобразование 52ф(х, y)/dxdy, более «специфична».

Каждый фильтр из множества {Fi}, решая соответствующее дифференциальное уравнение, выявляет интегральную кривую для векторного поля в окрестности точки A0. Поэтому F3 в декартовой системе координат можно поставить в соответствие интегральную кривую вида (рис. 7, а):

a a

v = х--y—

dy дх

(8)

»- x

, У

-xy

► x

\ / x

к я +

1 1

/ Г \

6)

Рис. 7. Интерпретация элементов кластера 1:

а - циркуляция для маски ¥3; б - направления изменения потенциала для ¥1 и ¥3

д

Вектору (8) соответствует вектор Киллинга ez = — в сферической системе координат,

дф

где ф - угол поворота вокруг оси г. Следовательно, фильтру ¥3 с его преобразованием -

дхду

соответствует потенциальное течение циркуляции с особенностью в точке А0. В этой точке вдоль оси г существует изолированный вихрь конечной интенсивности с бесконечной угловой скоростью ю.

С другой стороны, если рассматривать направление градиента относительно линии раздела подобластей, например, маски ¥1, то изменение потенциала происходит из подобласти -1 координаты х в +1 подобласть. Для ¥3 аналогичные изменения наблюдаются для подобластей координат -ху и ху, т.е. подобласти значимости данного фильтра принадлежат диагональной системе координат (рис. 7, б). Следовательно, данная маска (и оператор) отражает преобразование градиента в новой системе координат - ху, -ху, и ему соответствует преобра-

зование

д

-, где направление zw есть направление xy, точнее, x = y.

Таким образом, кластер 1, состоящий из элементов ¥1, ¥2, ¥3, (и им соответствующих операторов У1, У2, Уз), - это кластер «градиентных изменений». При этом оператор У3 (маска ¥3) двойственен:

2

• в декартовой системе координат ему соответствует потенциальное течение циркуляции с особенностью в центре планигона;

• в новой (диагональной) системе координат линейное потенциальное течение обеспеченно градиентом. С позиций проективной геометрии - это направление в несобственную точку проективной плоскости (планигон, как картинного пространство), ( рис. 8).

0

i ' У x1

x

V(xy)

V(xy)

Pn

P,

а) б) в)

Рис. 8. Координатные направления перцептивного пространства Б3:

а - на планигоне; б - решетке; в - двуслойном планигоне (1, 2 - слои)

Изложенное обосновывает информационную значимость элементов кластера 1, которые образуют тройку операторов (V1,V2,V3), являющуюся алгебраической группой (в ТАВ такие группы называются полными). Из вершин графа группы (на рис. 8, б кластер выделен) по направлениям x, y, x1 «растут» три орграфа соответствующих полных групп.

2. Рассмотрим тройку (V4,V5,V8), образующую полную группу. Если первая полная группа (V1,V2,V3) на решетке принадлежит первому срезу (слою) в глубину zw перцептивного пространства по направлению x1 (рис. 8, или xy по рис. 7), то вторая - (V4, V5, V8) принадлежит следующему слою по направлению глубины (рис. 8, в).

Если первая группа на системе преобразований - группа градиента, то вторая - группа дивергенции. Действительно.

Уравнение Лапласа для скалярной функции

a2ф a2ф a2ф

У2ф = —f + —+

дх2 ду2 дг

Если первым двум компонентам в этом уравнении соответствуют операторы У4, У5, то третьей компоненте - оператор У8 с преобразованием

2

2

a4

a2 .a

(тт) -

a2

ax2ay2 az2 az2 az2

у w w

в системе координат внешнего наблюдателя (рис. 9).

V(xy)

У с i 3

z

й*

А

/

Рис. 9. Интерпретации компонент второго дифференциала и оператора V8

2

z

w

у

z

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

w

z

5

4

3

8

Поскольку в пространстве определены преобразования градиента и дивергенции, то перцептивное пространство внешнего наблюдателя, представленное на планигоне (рис. 8, а), или представленное через преобразования на решетке ¥(х, у), - это пространство скалярного потенциала.

Для определения векторного поля полем скалярного потенциала в трехмерном (внешнем) пространстве достаточно существования первого полного дифференциала

. дф . дф . дф .

аф = — ах н--ау н--ж,

дх ду дг

где компоненты соответствуют преобразованиям, реализуемыми масками ¥1, ¥2, ¥3. Отсюда (снова) следует информационная значимость элементов кластера 1.

3. В состав третьего полного дифференциала входят операторы ^6,^7,^9,^0 с преобразованиями. Компоненты этого дифференциала входят в состав уравнения Пуассона вектора угловой скорости ш как функции векторного потенциала а: ш = У го1хо1 а или

V2 ax =-2ш x; V2 ay = -2ю y; V 2 az = -2ю z.

С другой стороны, для кругового потенциального течения с изолированным вихрем данные уравнения следует рассматривать независимо друг от друга, т.е. как три варианта ориентированных плоскостей со своими изолированными вихрями (рис. 10). В этом случае допустима следующая система уравнений:

а3

дх

+ -

д3

.2

+ -

д 3

дхду' д3 д3 + —;— +

дxдz

2 = -2®х;

ду3 дх 2ду дyдz

д3

д3

д3

дz дzдx дzдy

2=-2ю у;

2 =-2®z.

3

д

k с i 3

д

дх ду

ю а

дхду

л

ю

г

Рис. 10. Три вида изолированных вихрей

дхду

Уравнение Пуассона выполняется при условиях, что поле является вихревым, а градиент и дивергенция поля равны нулю, т.е. в системе декартовых координат в разложении отсутствуют компоненты, соответствующие операторам (К1,К2), (^4,^5,^). В этом случае имеем следующее соответствие между компонентами уравнения Пуассона и операторами:

3

д

3 Л

дх дхду2

^ (V9;V7);

д

3

д3

ду 3 дх 2 ду

^ (Vio;V6).

ю

x

z

3

2

д

д

Итак, третьему полному дифференциалу с операторами ^6^-7^9,^0) соответствует уравнение Пуассона. Поэтому это пространство, представленное через соответствующие преобразования на решетке операторов, разделяют пространства скалярного и векторного потенциалом. Первому соответствует пространство внешнего наблюдателя, второму - внутреннего.

Так как гойОа = §гаё&уа - V2 а, то операторы У9, допускают следующие две интерпретации (двойственность):

• компоненты §гаёё1уу поля скалярного потенциала ф, где V = §гаёф;

• компоненты гойОа поля векторного потенциала а (при дополнительном условии).

В этом случае операторы У9, У10 в составе полных групп ^^^ш) внешнего

наблюдателя «выполняют» роль в составе поля скалярного потенциала, а в составе полной группы - поля векторного потенциала.

Таковы физико-математические интерпретации для задачи понимания масок (операторов), наделенных свойством максимального вклада в анализ произвольного изображения при построении модели «внутреннего мира» - перцептивного пространства внешнего относительно планигона наблюдателя.

Заключение

В работе с позиций анализа ряда Тейлора в полных дифференциалах, используемого при активной идентификации объекта управления, доказывается возможность информационного обоснования компонент ^-преобразования.

Показано следующее:

1. Компоненты ^-преобразования, упорядоченные на двумерной решетке реализуемых преобразований, входят в состав шести полных дифференциалов.

2. Компоненты ^-преобразования по значимости (весовому коэффициенту) образуют кластеры равных весовых значений и упорядочиваются по значимости.

3. Три первых кластера, упорядоченных по значимости, обеспечивают максимальный вклад в результаты анализа, три последних - высокочастотных менее значимы.

4. Кластеру с максимальным весовым коэффициентом соответствуют три низкочастотные составляющие преобразования, отвечающие за ориентацию в пространстве - построение внутренней системы координат перцептивного пространства.

5. Преобразования, соответствующие второму полному дифференциалу и восьмой компоненте ^-преобразования, обеспечивают формирование направления глубины в перцептивном пространстве.

6. Восьмая компонента ^-преобразования - единственный элемент своего компакта -по значимости (за исключением элементов первого кластера) максимальна (рис. 6) и отвечает за связь внутренней системы координат с внешней, позволяя тем самым определить место наблюдателя во внешней среде.

7. Преобразования, входящие в состав третьего полного дифференциала, принадлежат уравнению Пуассона и выступают в роли «пространства, разделяющего внешний и внутренний мир» наблюдателя. С позиций физики - разделение сред скалярного и векторного потенциалов.

Библиографический список

1. Утробин, В.А. Компьютерная обработка изображений: Информационные модели этапа понимания / В.А. Утробин. - Н. Новгород: НГТУ, 2006. - 247 с.

2. Утробин, В.А. Компьютерная обработка изображений. Анализ и синтез / В.А. Утробин. - Н. Новгород: НГТУ, 2013. - 246 с.

3. Утробин, В.А. Физические интерпретации элементов алгебры изображения // УФН. 2004. Т.174. №10. С. 1089-1104.

Дата поступления в редакцию 15.07.2013

V.A. Utrobin

SIGNIFICANCE OF INFORMATION OF ^-TRANSFORM COMPONENTS IN SOLVING THE PROBLEM OF ORIENTATION IN SPACE FOR VISION SYSTEMS

Nyzhny Novgorod state technical university n.a. R.E. Alexeev

Purpose: Building a perceptual (internal observer) space as an external model based on video surveillance. Method: From the perspective of the theory of active perception, involving the physical-mathematical apparatus investigated the spectral decomposition of the newsworthiness of a priori uncertain picture for description and understanding of the observed images.

The result / area of application: Using of physical and mathematical interpretations of supervised classifications, to prove the existence of change inherent in a system of visual perception of human acceptance of patimernomu space. The result is the ability to assess the depth of tencial'naa even from the vision of one eye (monoste-riovospriatia). Therefore, the system of visual perception uses, with positions on the observed image nimania-physical concepts of scalar and vector capacities. Research results would have important applications in machine vision systems. Conclusions: The studies proved theoretically informational value low-frequency spatial components of the expansion for the task orientation in the environment, assess the position of the observer in this environment, and in-depth assessments of perceptual space.

Key words: visual perception, physical-mathematical interpretation, spatial models.

УДК 007.51

Н. В. Марочкин

МЕТОД ВЫДЕЛЕНИЯ РАБОТ ДЛЯ АНАЛИЗА ДВИГАТЕЛЬНОЙ АКТИВНОСТИ ЧЕЛОВЕКА В ИНДИВИДУАЛЬНОЙ ЧЕЛОВЕКО-МАШИННОЙ СИСТЕМЕ

Нижегородский государственный технический университет им. Р.Е. Алексеева

Приводятся результаты экспериментального исследования двигательной активности человека в условиях нерегламентированной деятельности. Для анализа предлагается метод выделения работ. Выявлены закономерности изменения характеристик работ. Даются рекомендации по использованию результатов исследования при создании индивидуальных человеко-машинных систем

Ключевые слова: индивидуальная человеко-машинная система, репродуктивно-преобразующая машина, продуктивно-преобразующая машина, интерфейс взаимодействия, двигательная активность, субъективная оценка трудности деятельности, информационное взаимодействие, производительность работ, скорость роста и спада двигательной активности человека.

Введение

В условиях повышенного внимания к созданию систем с элементами искусственного интеллекта и самого искусственного интеллекта важным представляется сохранить главенствующую роль естественного интеллекта на основе его эффективного взаимодействия с техническими средствами. Индивидуальные человеко-машинные системы, постоянно присутствующие в жизни каждого человека, - один из возможных способов решения проблемы. Метод выделения работ позволяет за счет их разделения и измерения параметров определить субъективную оценку трудности разнообразной деятельности человека.

Индивидуальные человеко-машинные системы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Индивидуальная человеко-машинная система включает человека, индивидуальные технические средства, физическую и социальную среду, взаимодействующие для повышения качества жизни человека. Качество жизни - степень удовлетворенности человека своим физическим, психическим и социальным состоянием [1]. Индивидуальные человеко-машинные системы следует отнести к гуманистическим системам, системам с участием человека. Цель человека в индивидуальной человеко-машинной системе - получение информации, поэтому такую систему следует назвать эргатической (для получения продукта труда в виде информации [2]). Эргатические системы по критерию распределения функций подразделяют на системы с простыми орудиями труда (инструментами) и с орудиями труда в виде машин (часть переработки информации отчуждается от человека) [3]. В индивидуальной человеко-машинной системе инструменты - это датчики, измеряющие параметры среды, уровень радиации, уровень освещенности, уровень шума, наличие вредных примесей в воде и воздухе, это технические средства контактного и бесконтактного контроля функционирования различных систем организма человека. С помощью инструментов человек точно и своевременно оценивает свое состояние и состояние среды для принятия решения, реализуемого через деятельность (рис. 1). Индивидуальная человеко-машинная система с репродуктивно-преобразующей машиной (рис. 2), содержит вычислительную машину с заданным алгоритмом функционирования.

Вычислительная машина собирает данные с датчиков состояния человека и среды, (Д). Результаты оценки текущего и прогнозируемого состояния в необходимом объеме и виде предоставляются через интерфейс общения. Человек точно и своевременно оценивает свое состояние и состояние среды для принятия решения, реализуемого через деятельность.

© Марочкин Н. В., 2013.

i Надоели баннеры? Вы всегда можете отключить рекламу.