чались участники эксперимента с низким уровнем опыта (чтобы элиминировать влияние этого фактора). В результате получена следующая модель: MT0'2=2,8+0,166*IDe+0,009*T. (6)
При этом значение коэффициента детерминации в регрессии R2=0,764, а анализ остатков показал отсутствие постоянства дисперсии и автокорреляции.
Наконец, была предложена регрессионная модель для вычисления производительности TP, учитывающая факторы возраста ^ пола G и наличия низкого опыта LE (0 - для нормального уровня опыта участника, 1 - для низкого). Фактор пола оказался незначимым ф=0,481), что подтверждается результатами дисперсионного анализа, и на предварительном этапе был исключен из модели. Значимость двух других факторов оказалась высокой ф<0,001). В результате оценивания параметров по всей выборке получена модель
TP=7,27-0,998*LE-0,053*T. (7)
Данная модель показала достаточно высокий коэффициент детерминации, R2=0,924, следовательно, она может использоваться для прогнозирования производительности, достигаемой при совершении движений компьютерной мышью, с учетом возраста и опыта пользователя.
Результаты исследования взаимодействия различных групп пользователей с компьютерами позволяют предположить применимость предлагаемого метода для решения данной задачи. При выполнении заданий по движению с использованием мыши различия в возрастной группе были значимы с точки зрения как времени движения, так и уровня ошибок. В среднем пожилые участники затратили почти в два раза больше времени на выполнение заданий, но показали при этом почти в два раза более высокую точность, чем их молодые коллеги. Подобные выводы о более низкой скоро-
сти выполнения движений пожилыми людьми подтверждаются, например, в [3]. Влияние фактора пола в эксперименте может быть признано существенно менее выраженным.
Для времени движения как для пожилых, так и для молодых людей были предложены расширенная регрессионная модель (5) и ее усовершенствованный вариант (6) с использованием степенного преобразования зависимой переменной. Модель свидетельствует о негативном влиянии возраста на скорость выполнения быстрых прицельных движений. Средняя производительность движения TP, равная в данном эксперименте 4,58, согласуется с диапазоном 3,7-4,9, обычно отмечаемым в исследованиях по методологии ISO 9241-9. Однако для пожилых участников производительность составила лишь 3,29. Для выявления производительности была предложена регрессионная модель (7), в ней наблюдается негативное влияние возраста и низкого уровня опыта. Значимое влияние возраста на производительность также было отмечено, например в [3].
Проектировщикам интерфейсов при построении динамических интерфейсов, выборе пороговых значений времени реакции системы и прочего необходимо учитывать исследуемые факторы с целью увеличения производительности при ЧКВ.
Литература
1. Fitts P.M. The information capacity of the human motor system in controlling the amplitude of movement // Journal of Experimental Psychology. 1954, Vol. 47(6), pp. 381-391.
2. Soukoreff R.W. & MacKenzie I.S. Towards a standard for pointing device evaluation, perspectives on 27 years of Fitts' law research // International Journal of Human-Computer Studies. 2004, Vol. 61, pp. 751-789.
3. Bohan M. & Chaparro A. Age-Related Differences in Performance Using a Mouse and Trackball // In Proc. Human Factors and Ergonomics Society 42nd Annual Meeting. 1998, pp. 152-155.
УДК 681.3
ФАКТОРНЫЙ АНАЛИЗ В ЗАДАЧАХ МОДЕЛИРОВАНИЯ МНОГОМЕРНЫХ СИСТЕМ
Ф.Ф. Пащенко, д.т.н.; И.С. Дургарян, к.т.н.; И.В. Голяк
(Институт проблем управления им.. В.А. Трапезникова РАН, г. Москва, feodor@ipu.ru, durgoft@ipu.ru, ivgo@pk.ru)
Рассматриваются вопросы идентификации многомерных стохастических систем и прогнозирования выходных сигналов. Для снижения размерности задачи предлагается использовать методы факторного анализа и фильтр Кал-мана. Построены алгоритмы идентификации и получены уравнения для параметров объектов.
Ключевые слова: многомерный объект, динамический объект, идентификация, прогноз, факторы, факторный анализ, модель, корреляция.
В процессе создания АСУ нередко некоторые параметры, характеризующие объект и входные процессы, недоступны для наблюдения или не мо-
гут быть автоматически измерены из-за отсутствия требуемых датчиков. В таких случаях приходится измерять не искомую величину, а ее кос-
венные показатели, которые можно контролировать автоматически. Подобные задачи возникают, например, при идентификации иерархических систем, когда взаимосвязи между элементами одного и того же или разных уровней фактически недоступны для наблюдения. Аналогичные ситуации складываются во многих областях промышленности, в экономике, социологии, медицине. Возникает задача построения многоступенчатого алгоритма прогнозирования, что при большой размерности вызывает значительные трудности. Эти трудности и размерность задачи можно существенно уменьшить, используя методы факторного анализа и дисперсионной идентификации.
Пусть X(t) - входной сигнал, Y(t) - выходной сигнал идентифицируемого объекта, V(t) - выходной сигнал объекта с известным оператором B, A - оператор идентифицируемого объекта. Предположим, что оператор B имеет ограниченный обратный оператор В-1, тогда ненаблюдаемый входной сигнал можно представить в виде X(t)= =B-1V(t). Уравнение для оценки оператора идентифицируемого объекта при этом можно записать следующим образом: Y(t)=CV(t), где C=AxB-1.
Пусть операторы A и B являются линейными нестационарными интегральными операторами. Тогда оценку весовой функции идентифицируемого объекта можно найти из системы интегральных уравнений
I
Y (г) = / g (г,т)Х(т) ат,
-ю
г
V (г ) = | w (г, т) х (т) dт.
Решая данную систему известными методами, получим оценки как для весовой функции, так и для сигнала на входе объекта.
При рассмотрении объектов, на входе и выходе которых действуют случайные процессы, решение поставленной задачи можно получить из системы уравнений
ку (м) = / / g (г,т)8 (а,х) Кх (т,х) Дтая.,
г г
К (г,а)= / / w(г,т)w (а,X)Кх (т,X)атах,
где Ky(t, s), К,,^, s) - известные корреляционные функции сигналов Y(t) и V(t) соответственно; Кх(т, X) - неизвестная корреляционная функция входного сигнала; т) - известная весовая функция, а g(t, т) - неизвестная.
При идентификации нелинейных объектов, а также линейных объектов, на входе которых действуют случайные процессы с нелинейной внутренней структурой, целесообразно применять дисперсионные методы. При этом оценку весовой функции линейного в среднем приближения идентифицируемого объекта можно получить из системы уравнений
V (м) = 1/8 (г, т)в (а, х)еш (т, х) атах,
е™ (м) = 1 Ь (t, т>у (^ х)ехххх (т х) атах,
В данной системе уравнений предполагается, что входные и выходные процессы являются стационарными и стационарно связанными в дисперсионном смысле [1].
В факторном анализе основным предположением является равенство
X=LF+E, (1)
где X - вектор-столбец наблюдаемых переменных размерности рх1; ^рхк - матрица факторных нагрузок; F-kx1 - вектор-столбец факторов (к<р); Е-рх1 - вектор-столбец остатков, которые предполагаются не зависящими как друг от друга, так и от факторов. Дисперсии остатков (или остаточные дисперсии) образуют матрицу V.
Уравнение (1) постулирует основные предположения факторного анализа о том, что множество наблюдаемых коррелированных переменных X, которые подчиняются многомерному нормальному распределению с корреляционной матрицей С размерности рхр, можно описать меньшим числом гипотетических переменных или факторов F и множеством независимых остатков Е.
Рассмотрим модель объекта с выходом Y и входом Х=(Х15 ..., Хр). Если р велико, возникает желание сократить размерность модели, выразив ее входы через меньшее количество к<р некоторых переменных F. Таким образом, получаем схему факторного анализа. Построение модели Y непосредственно по переменным F невозможно, так как они являются гипотетическими (ненаблюдаемыми). Однако эти переменные могут быть выражены через наблюдаемые переменные X следующим образом [2]:
для некоррелированных факторов
Р = ЬТС-1Х, (2)
для коррелированных факторов Р = РЬТС-1Х, (3)
где Р - оцененная корреляционная матрица факторов, а матрица L определяется согласно [2]. Модель объекта будем искать по формуле Y = Р ТВ, (4)
где В - вектор-столбец неизвестных коэффициентов размерности кх1. Коэффициенты вектора определим из условия минимума функционала
= М{( * - ¥)2}.
Подставляя (4) в (5) и дифференцируя полученное выражение по В, придем к уравнению
м{р(* - РТв)} = 0.
Решая (6) с учетом (2), получим
3-
(5)
(6)
в = (окххдТ )-1ок
(7)
где Q=LTC 1 - матрица размерности kxp, а матрицы Kxx и Кху определяются соответственно формулами Кхх = М{ХХТ }; К^ = М{ХУ}. (8)
Для коррелированных факторов получим
В = (РОКххОТРТ)"1РОКху. (9)
Следует отметить, что (7) и (9) получены при условии линейной связи между факторами и входными переменными. Если эта связь нелинейна, то в (7) и (9) вместо (8) будут входить матрицы, элементы которых - дисперсионные функции.
Рассмотрим представление ненаблюдаемых входов при помощи модели пространства состояний [3]. Предположим, что некоторый дискретный векторный процесс У(1) описывается разностным линейным уравнением, которое представимо в форме
У1=ЛУ1_1+Ги_1, 1=0, 1, ..., (10)
где У,—пх1 - вектор-столбец состояния системы в момент 1,; и1-1 - векторный гауссовский белый шум; А и Г - постоянные матрицы. Предполагается, что У, - стационарный гауссовский процесс с заданным начальным состоянием У0.
Пусть процесс У(1) является входом определенного динамического объекта, для которого требуется построить модель в виде
^ = уТР, (11)
где - выход модели в момент 1,; Р - вектор искомых коэффициентов модели.
Предположим, что в те же дискретные моменты 1, вместо вектора У, измеряется вектор г, размерности гх1 (г<п), линейно связанный с вектором состояния У,:
г, = ну + V, (12)
где Н - постоянная матрица размерности гхп; V, -векторный гауссовский белый шум. Вместо вектора У, в (11) подставим его оценку, оптимальную в смысле некоторого критерия, полученную по наблюдаемому вектору г,. Наилучшая среднеквадра-тическая оценка У1=M{У1/z1, ..., z1} может быть получена при помощи дискретного фильтра Кал-мана:
у = лу^+в (г - нлу_!),
(13)
где неизвестная матрица В, определяется из условия минимума среднеквадратической ошибки [1].
Применяя рекуррентную процедуру оценивания, выразим у через оценку начального состояния у = М|у | и значения наблюдаемых векторов г*, ..., г
уу =
у+
¡=1
П( I - в1гн) л П (I - в,-гн) л
(14)
в г,
где I - единичная матрица размерности пхп, а матрицы В15 ..., В, определяются согласно [1].
Без ограничения общности предположим, что математические ожидания векторов У, и г, равны нулю для любого момента У0 = М{У0} = 0. Тогда
справедливы равенства м{у } = 0 и м{\у} = 0
для любого ,.
Подставляя в (11) вместо вектора У, его оценку "У. = М^у/г,—,г} и применяя аналогично
предыдущему случаю среднеквадратический критерий для оценки вектора коэффициентов Р, получим
р=е \ -е
(15)
где г - набор векторов (г,, ..., г1); элементами матрицы е , являются множественные дисперсионные функции, а элементами матрицы е , - множественные обобщенные дисперсионные функции.
Учитывая (14), формулу (15) можно выразить через корреляционные матрицы процессов г, и W1 и процессов г, и ]=1, ..., I
Поскольку применение рекуррентной процедуры и определение матриц В15 ..., В, в (14) являются достаточно трудоемкими, используем в (11) другую оценку ненаблюдаемого вектора У, по наблюдаемым векторам г15 ..., г,.
Проведем следующее преобразование переменных:
х=г -м{г/г-1}, (16)
ц = у -м{у/г'-1}. (17)
Здесь ^ означает набор векторов (г1, ..., г,).
Полученные переменные X, и F1 связаны соотношением Х,=НТ,+^, которое по форме аналогично соотношению (11) и в то же время полностью укладывается в рамки модели классического факторного анализа.
Используя формулу связи между наблюдаемыми переменными и факторными нагрузками (2),
можно получить следующую оценку у :
у = нТс-1 [г -м{г/г'-1}]+м{у/г'-1}. (18)
Применяя теорию псевдообратных матриц, учитывая (11) и то обстоятельство, что в качестве критерия минимизации применяется квадратичный функционал, (18) можно записать в виде
у ¡= нТс_1 [г -м{г,/г'~ 1}]+
+н+м {г /г'-1}+(I - н+н)
(19)
где Н+ - псевдообратная матрица; V - произвольный вектор; I - единичная матрица.
В частном случае при у=0 формула (19) принимает вид
Y = HT C"1 [Z - M {zJZ i- 1}] +
+H+ M{ZJZ"1}.
Таким образом, модель (15) может быть запи
(20)
сана в виде
л^ =^нтс-1 (г,-м{г,/г-1})+н+м^/г-1}^. (21)
Матрица коэффициентов Р, найденная из условия минимума среднеквадратичного отклонения \¥ от имеет вид
р = [нтс-1к (с-1 )т н - нтс-1е 21_,8т -
-80г,г- (с-1 )Тн+]-1 х (22)
х[нтС-1К - 80 1,], где 8 = нтС-1-Н+.
I г 1№1 г1№1г I
Положим, как и выше, математические ожидания Zi и равными нулю. Тогда К. будет являться автокорреляционной матрицей векторного процесса Zi; - взаимной корреляционной
матрицей векторных процессов Zi и '¡; 0 1-1 со-
стоит из множества дисперсионных функций векторного процесса Z1 относительно Z1-1; 0^ ^ -
из множественных обобщенных дисперсионных функций векторных процессов Z1 и W1 относительно Z1-1; 0' ,". - из множественных дисперси-
ZjZ
онных функций векторных процессов Z1 и Z1-1.
Из вышесказанного следует, что, используя методы факторного анализа и рекуррентного фильтра Калмана, можно существенно сократить размерность прогнозирующих моделей без ощутимой потери точности.
Литература
1. Дисперсионная идентификация; [под ред. Н.С. Райб-мана]. М.: Наука, 1981.
2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2000.
3. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. М.: Наука, 1975.
4. Дургарян И.С., Пащенко Ф.Ф. Метод двухступенчатой идентификации в задаче оценки экономической эффективности АСУ // Автоматика и телемеханика. 1977. № 5.
5. Функциональный анализ; [под ред. С.Г. Крейна]. М.: Наука, 1972.
УДК 004.4
ОСНОВНЫЕ ОПЕРАЦИИ НАД СОРИЕНТИРОВАННЫМИ ГИПЕРГРАФАМИ В РЕЛЯЦИОННОЙ БАЗЕ ДАННЫХ
(Работа выполнена в рамках ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг., направление «Информатика», проект НК-421 (2))
В.Г. Мокрозуб, к.т.н.
(Тамбовский государственный технический университет, mokr@mail.gaps.tstu.ru, mokrozubv@yandex.ru)
Введено понятие Сориентированного гиперграфа. Описаны операции добавления и удаления вершин и ребер в К-ориентированных гиперграфах, представленных в реляционной базе данных.
Ключевые слова: гиперграф, реляционная база данных, операции добавления и удаления.
Гиперграфы применяются в автоматизированных системах для процедур анализа и синтеза технических объектов. В работе [1] подробно описаны методы декомпозиции гиперграфовых структур, в [2] - операции над ультра- и гиперграфами, представленными в аналитическом виде. Данные публикации описывают операции над гиперграфами, не привязываясь к программным продуктам, в среде которых предполагается реализация автоматизированной системы. Между тем выбранная программная среда оказывает большое влияние на последовательность действий при выполнении операций над гиперграфами.
Целью настоящей работы является представление ^-ориентированных гиперграфов и операций добавления и удаления вершин и ребер в ре-
ляционной БД. Эти операции описываются как с помощью теории множеств, так и непосредственно операторами языка структурированных запросов, в качестве которого выбран Ттатас^ОЬ.
Определение ориентированного гиперграфа
Обозначим ориентированный гиперграф 08о(Х, и), где Х={х1}, 1 = 1,1 - множество вершин гиперграфа, х1 - 1-я вершина; и={ит(Х1т)}, т = 1,М - множество ребер гиперграфа, ит(Х1т) - т-е ребро гиперграфа, Х1т - множество вершин, инцидентных т-му ребру Х1тсХ, Х1т = {хк}, V кеКт, Кт с 1,1, 1 - номер верши-