Научная статья на тему 'Факторный анализ в задачах моделирования многомерных систем'

Факторный анализ в задачах моделирования многомерных систем Текст научной статьи по специальности «Математика»

CC BY
146
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Пащенко Ф. Ф., Дургарян И. С., Голяк И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Факторный анализ в задачах моделирования многомерных систем»

чались участники эксперимента с низким уровнем опыта (чтобы элиминировать влияние этого фактора). В результате получена следующая модель: MT0'2=2,8+0,166*IDe+0,009*T. (6)

При этом значение коэффициента детерминации в регрессии R2=0,764, а анализ остатков показал отсутствие постоянства дисперсии и автокорреляции.

Наконец, была предложена регрессионная модель для вычисления производительности TP, учитывающая факторы возраста ^ пола G и наличия низкого опыта LE (0 - для нормального уровня опыта участника, 1 - для низкого). Фактор пола оказался незначимым ф=0,481), что подтверждается результатами дисперсионного анализа, и на предварительном этапе был исключен из модели. Значимость двух других факторов оказалась высокой ф<0,001). В результате оценивания параметров по всей выборке получена модель

TP=7,27-0,998*LE-0,053*T. (7)

Данная модель показала достаточно высокий коэффициент детерминации, R2=0,924, следовательно, она может использоваться для прогнозирования производительности, достигаемой при совершении движений компьютерной мышью, с учетом возраста и опыта пользователя.

Результаты исследования взаимодействия различных групп пользователей с компьютерами позволяют предположить применимость предлагаемого метода для решения данной задачи. При выполнении заданий по движению с использованием мыши различия в возрастной группе были значимы с точки зрения как времени движения, так и уровня ошибок. В среднем пожилые участники затратили почти в два раза больше времени на выполнение заданий, но показали при этом почти в два раза более высокую точность, чем их молодые коллеги. Подобные выводы о более низкой скоро-

сти выполнения движений пожилыми людьми подтверждаются, например, в [3]. Влияние фактора пола в эксперименте может быть признано существенно менее выраженным.

Для времени движения как для пожилых, так и для молодых людей были предложены расширенная регрессионная модель (5) и ее усовершенствованный вариант (6) с использованием степенного преобразования зависимой переменной. Модель свидетельствует о негативном влиянии возраста на скорость выполнения быстрых прицельных движений. Средняя производительность движения TP, равная в данном эксперименте 4,58, согласуется с диапазоном 3,7-4,9, обычно отмечаемым в исследованиях по методологии ISO 9241-9. Однако для пожилых участников производительность составила лишь 3,29. Для выявления производительности была предложена регрессионная модель (7), в ней наблюдается негативное влияние возраста и низкого уровня опыта. Значимое влияние возраста на производительность также было отмечено, например в [3].

Проектировщикам интерфейсов при построении динамических интерфейсов, выборе пороговых значений времени реакции системы и прочего необходимо учитывать исследуемые факторы с целью увеличения производительности при ЧКВ.

Литература

1. Fitts P.M. The information capacity of the human motor system in controlling the amplitude of movement // Journal of Experimental Psychology. 1954, Vol. 47(6), pp. 381-391.

2. Soukoreff R.W. & MacKenzie I.S. Towards a standard for pointing device evaluation, perspectives on 27 years of Fitts' law research // International Journal of Human-Computer Studies. 2004, Vol. 61, pp. 751-789.

3. Bohan M. & Chaparro A. Age-Related Differences in Performance Using a Mouse and Trackball // In Proc. Human Factors and Ergonomics Society 42nd Annual Meeting. 1998, pp. 152-155.

УДК 681.3

ФАКТОРНЫЙ АНАЛИЗ В ЗАДАЧАХ МОДЕЛИРОВАНИЯ МНОГОМЕРНЫХ СИСТЕМ

Ф.Ф. Пащенко, д.т.н.; И.С. Дургарян, к.т.н.; И.В. Голяк

(Институт проблем управления им.. В.А. Трапезникова РАН, г. Москва, feodor@ipu.ru, durgoft@ipu.ru, ivgo@pk.ru)

Рассматриваются вопросы идентификации многомерных стохастических систем и прогнозирования выходных сигналов. Для снижения размерности задачи предлагается использовать методы факторного анализа и фильтр Кал-мана. Построены алгоритмы идентификации и получены уравнения для параметров объектов.

Ключевые слова: многомерный объект, динамический объект, идентификация, прогноз, факторы, факторный анализ, модель, корреляция.

В процессе создания АСУ нередко некоторые параметры, характеризующие объект и входные процессы, недоступны для наблюдения или не мо-

гут быть автоматически измерены из-за отсутствия требуемых датчиков. В таких случаях приходится измерять не искомую величину, а ее кос-

венные показатели, которые можно контролировать автоматически. Подобные задачи возникают, например, при идентификации иерархических систем, когда взаимосвязи между элементами одного и того же или разных уровней фактически недоступны для наблюдения. Аналогичные ситуации складываются во многих областях промышленности, в экономике, социологии, медицине. Возникает задача построения многоступенчатого алгоритма прогнозирования, что при большой размерности вызывает значительные трудности. Эти трудности и размерность задачи можно существенно уменьшить, используя методы факторного анализа и дисперсионной идентификации.

Пусть X(t) - входной сигнал, Y(t) - выходной сигнал идентифицируемого объекта, V(t) - выходной сигнал объекта с известным оператором B, A - оператор идентифицируемого объекта. Предположим, что оператор B имеет ограниченный обратный оператор В-1, тогда ненаблюдаемый входной сигнал можно представить в виде X(t)= =B-1V(t). Уравнение для оценки оператора идентифицируемого объекта при этом можно записать следующим образом: Y(t)=CV(t), где C=AxB-1.

Пусть операторы A и B являются линейными нестационарными интегральными операторами. Тогда оценку весовой функции идентифицируемого объекта можно найти из системы интегральных уравнений

I

Y (г) = / g (г,т)Х(т) ат,

г

V (г ) = | w (г, т) х (т) dт.

Решая данную систему известными методами, получим оценки как для весовой функции, так и для сигнала на входе объекта.

При рассмотрении объектов, на входе и выходе которых действуют случайные процессы, решение поставленной задачи можно получить из системы уравнений

ку (м) = / / g (г,т)8 (а,х) Кх (т,х) Дтая.,

г г

К (г,а)= / / w(г,т)w (а,X)Кх (т,X)атах,

где Ky(t, s), К,,^, s) - известные корреляционные функции сигналов Y(t) и V(t) соответственно; Кх(т, X) - неизвестная корреляционная функция входного сигнала; т) - известная весовая функция, а g(t, т) - неизвестная.

При идентификации нелинейных объектов, а также линейных объектов, на входе которых действуют случайные процессы с нелинейной внутренней структурой, целесообразно применять дисперсионные методы. При этом оценку весовой функции линейного в среднем приближения идентифицируемого объекта можно получить из системы уравнений

V (м) = 1/8 (г, т)в (а, х)еш (т, х) атах,

е™ (м) = 1 Ь (t, т>у (^ х)ехххх (т х) атах,

В данной системе уравнений предполагается, что входные и выходные процессы являются стационарными и стационарно связанными в дисперсионном смысле [1].

В факторном анализе основным предположением является равенство

X=LF+E, (1)

где X - вектор-столбец наблюдаемых переменных размерности рх1; ^рхк - матрица факторных нагрузок; F-kx1 - вектор-столбец факторов (к<р); Е-рх1 - вектор-столбец остатков, которые предполагаются не зависящими как друг от друга, так и от факторов. Дисперсии остатков (или остаточные дисперсии) образуют матрицу V.

Уравнение (1) постулирует основные предположения факторного анализа о том, что множество наблюдаемых коррелированных переменных X, которые подчиняются многомерному нормальному распределению с корреляционной матрицей С размерности рхр, можно описать меньшим числом гипотетических переменных или факторов F и множеством независимых остатков Е.

Рассмотрим модель объекта с выходом Y и входом Х=(Х15 ..., Хр). Если р велико, возникает желание сократить размерность модели, выразив ее входы через меньшее количество к<р некоторых переменных F. Таким образом, получаем схему факторного анализа. Построение модели Y непосредственно по переменным F невозможно, так как они являются гипотетическими (ненаблюдаемыми). Однако эти переменные могут быть выражены через наблюдаемые переменные X следующим образом [2]:

для некоррелированных факторов

Р = ЬТС-1Х, (2)

для коррелированных факторов Р = РЬТС-1Х, (3)

где Р - оцененная корреляционная матрица факторов, а матрица L определяется согласно [2]. Модель объекта будем искать по формуле Y = Р ТВ, (4)

где В - вектор-столбец неизвестных коэффициентов размерности кх1. Коэффициенты вектора определим из условия минимума функционала

= М{( * - ¥)2}.

Подставляя (4) в (5) и дифференцируя полученное выражение по В, придем к уравнению

м{р(* - РТв)} = 0.

Решая (6) с учетом (2), получим

3-

(5)

(6)

в = (окххдТ )-1ок

(7)

где Q=LTC 1 - матрица размерности kxp, а матрицы Kxx и Кху определяются соответственно формулами Кхх = М{ХХТ }; К^ = М{ХУ}. (8)

Для коррелированных факторов получим

В = (РОКххОТРТ)"1РОКху. (9)

Следует отметить, что (7) и (9) получены при условии линейной связи между факторами и входными переменными. Если эта связь нелинейна, то в (7) и (9) вместо (8) будут входить матрицы, элементы которых - дисперсионные функции.

Рассмотрим представление ненаблюдаемых входов при помощи модели пространства состояний [3]. Предположим, что некоторый дискретный векторный процесс У(1) описывается разностным линейным уравнением, которое представимо в форме

У1=ЛУ1_1+Ги_1, 1=0, 1, ..., (10)

где У,—пх1 - вектор-столбец состояния системы в момент 1,; и1-1 - векторный гауссовский белый шум; А и Г - постоянные матрицы. Предполагается, что У, - стационарный гауссовский процесс с заданным начальным состоянием У0.

Пусть процесс У(1) является входом определенного динамического объекта, для которого требуется построить модель в виде

^ = уТР, (11)

где - выход модели в момент 1,; Р - вектор искомых коэффициентов модели.

Предположим, что в те же дискретные моменты 1, вместо вектора У, измеряется вектор г, размерности гх1 (г<п), линейно связанный с вектором состояния У,:

г, = ну + V, (12)

где Н - постоянная матрица размерности гхп; V, -векторный гауссовский белый шум. Вместо вектора У, в (11) подставим его оценку, оптимальную в смысле некоторого критерия, полученную по наблюдаемому вектору г,. Наилучшая среднеквадра-тическая оценка У1=M{У1/z1, ..., z1} может быть получена при помощи дискретного фильтра Кал-мана:

у = лу^+в (г - нлу_!),

(13)

где неизвестная матрица В, определяется из условия минимума среднеквадратической ошибки [1].

Применяя рекуррентную процедуру оценивания, выразим у через оценку начального состояния у = М|у | и значения наблюдаемых векторов г*, ..., г

уу =

у+

¡=1

П( I - в1гн) л П (I - в,-гн) л

(14)

в г,

где I - единичная матрица размерности пхп, а матрицы В15 ..., В, определяются согласно [1].

Без ограничения общности предположим, что математические ожидания векторов У, и г, равны нулю для любого момента У0 = М{У0} = 0. Тогда

справедливы равенства м{у } = 0 и м{\у} = 0

для любого ,.

Подставляя в (11) вместо вектора У, его оценку "У. = М^у/г,—,г} и применяя аналогично

предыдущему случаю среднеквадратический критерий для оценки вектора коэффициентов Р, получим

р=е \ -е

(15)

где г - набор векторов (г,, ..., г1); элементами матрицы е , являются множественные дисперсионные функции, а элементами матрицы е , - множественные обобщенные дисперсионные функции.

Учитывая (14), формулу (15) можно выразить через корреляционные матрицы процессов г, и W1 и процессов г, и ]=1, ..., I

Поскольку применение рекуррентной процедуры и определение матриц В15 ..., В, в (14) являются достаточно трудоемкими, используем в (11) другую оценку ненаблюдаемого вектора У, по наблюдаемым векторам г15 ..., г,.

Проведем следующее преобразование переменных:

х=г -м{г/г-1}, (16)

ц = у -м{у/г'-1}. (17)

Здесь ^ означает набор векторов (г1, ..., г,).

Полученные переменные X, и F1 связаны соотношением Х,=НТ,+^, которое по форме аналогично соотношению (11) и в то же время полностью укладывается в рамки модели классического факторного анализа.

Используя формулу связи между наблюдаемыми переменными и факторными нагрузками (2),

можно получить следующую оценку у :

у = нТс-1 [г -м{г/г'-1}]+м{у/г'-1}. (18)

Применяя теорию псевдообратных матриц, учитывая (11) и то обстоятельство, что в качестве критерия минимизации применяется квадратичный функционал, (18) можно записать в виде

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у ¡= нТс_1 [г -м{г,/г'~ 1}]+

+н+м {г /г'-1}+(I - н+н)

(19)

где Н+ - псевдообратная матрица; V - произвольный вектор; I - единичная матрица.

В частном случае при у=0 формула (19) принимает вид

Y = HT C"1 [Z - M {zJZ i- 1}] +

+H+ M{ZJZ"1}.

Таким образом, модель (15) может быть запи

(20)

сана в виде

л^ =^нтс-1 (г,-м{г,/г-1})+н+м^/г-1}^. (21)

Матрица коэффициентов Р, найденная из условия минимума среднеквадратичного отклонения \¥ от имеет вид

р = [нтс-1к (с-1 )т н - нтс-1е 21_,8т -

-80г,г- (с-1 )Тн+]-1 х (22)

х[нтС-1К - 80 1,], где 8 = нтС-1-Н+.

I г 1№1 г1№1г I

Положим, как и выше, математические ожидания Zi и равными нулю. Тогда К. будет являться автокорреляционной матрицей векторного процесса Zi; - взаимной корреляционной

матрицей векторных процессов Zi и '¡; 0 1-1 со-

стоит из множества дисперсионных функций векторного процесса Z1 относительно Z1-1; 0^ ^ -

из множественных обобщенных дисперсионных функций векторных процессов Z1 и W1 относительно Z1-1; 0' ,". - из множественных дисперси-

ZjZ

онных функций векторных процессов Z1 и Z1-1.

Из вышесказанного следует, что, используя методы факторного анализа и рекуррентного фильтра Калмана, можно существенно сократить размерность прогнозирующих моделей без ощутимой потери точности.

Литература

1. Дисперсионная идентификация; [под ред. Н.С. Райб-мана]. М.: Наука, 1981.

2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2000.

3. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. М.: Наука, 1975.

4. Дургарян И.С., Пащенко Ф.Ф. Метод двухступенчатой идентификации в задаче оценки экономической эффективности АСУ // Автоматика и телемеханика. 1977. № 5.

5. Функциональный анализ; [под ред. С.Г. Крейна]. М.: Наука, 1972.

УДК 004.4

ОСНОВНЫЕ ОПЕРАЦИИ НАД СОРИЕНТИРОВАННЫМИ ГИПЕРГРАФАМИ В РЕЛЯЦИОННОЙ БАЗЕ ДАННЫХ

(Работа выполнена в рамках ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг., направление «Информатика», проект НК-421 (2))

В.Г. Мокрозуб, к.т.н.

(Тамбовский государственный технический университет, mokr@mail.gaps.tstu.ru, mokrozubv@yandex.ru)

Введено понятие Сориентированного гиперграфа. Описаны операции добавления и удаления вершин и ребер в К-ориентированных гиперграфах, представленных в реляционной базе данных.

Ключевые слова: гиперграф, реляционная база данных, операции добавления и удаления.

Гиперграфы применяются в автоматизированных системах для процедур анализа и синтеза технических объектов. В работе [1] подробно описаны методы декомпозиции гиперграфовых структур, в [2] - операции над ультра- и гиперграфами, представленными в аналитическом виде. Данные публикации описывают операции над гиперграфами, не привязываясь к программным продуктам, в среде которых предполагается реализация автоматизированной системы. Между тем выбранная программная среда оказывает большое влияние на последовательность действий при выполнении операций над гиперграфами.

Целью настоящей работы является представление ^-ориентированных гиперграфов и операций добавления и удаления вершин и ребер в ре-

ляционной БД. Эти операции описываются как с помощью теории множеств, так и непосредственно операторами языка структурированных запросов, в качестве которого выбран Ттатас^ОЬ.

Определение ориентированного гиперграфа

Обозначим ориентированный гиперграф 08о(Х, и), где Х={х1}, 1 = 1,1 - множество вершин гиперграфа, х1 - 1-я вершина; и={ит(Х1т)}, т = 1,М - множество ребер гиперграфа, ит(Х1т) - т-е ребро гиперграфа, Х1т - множество вершин, инцидентных т-му ребру Х1тсХ, Х1т = {хк}, V кеКт, Кт с 1,1, 1 - номер верши-

i Надоели баннеры? Вы всегда можете отключить рекламу.