Выводы
Разработана архитектура прибора, позволяющего организовать регистрацию измерений и передачу данных в режиме реального времени. В качестве полигона использовался мыс Свободный. Приведены данные наблюдений аномально больших волн у оконечности мыса на юго-восточном побережье о. Сахалин. Они получены из анализа долговременных записей уровня моря за октября 2011 по май 2012 года, полученных с помощью донной станции (глубина постановки 16 м). Было зарегистрировано около 200 волн за 70 дней наблюдений в безледный период.
Работа выполнена в рамках реализации ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009 - 2013 годы, при поддержке грантов РФФИ (11-05-00216-а, 11-05-92002-ННС_а), МК-4378.2011.5, а также стипендии Президента Российской Федерации молодым ученым СП-1935.2012.5.
Библиографический список
1. Глуховский, Б.Х. Исследование морского ветрового волнения / Б.Х. Глуховский. - Л.: Гидрометеоиздат, 1966. - 284 с.
2. Зайцев, А.И. Невельское цунами 2 августа 2007 года: инструментальные данные и численное моделирование / А.И. Зайцев [и др.] // Доклады Академии наук. 2008. Т. 421. № 2. С. 1-4.
3. Зайцев, А.И. Аномально большие волны вблизи южного побережья о. Сахалин / А.И. Зайцев [и др.] // Фундаментальная и прикладная гидрофизика. 2011. Т. 4. № 4. С. 35-42.
4. Заславский, М.М. О пересчете данных волнографа с датчиком давления на спектр поверхностных волн / М.М. Заславский [и др.] // Океанология. 2001. Т. 41. № 2. С.195-200.
5. Кабатченко, И.М. Опыт эксплуатации волнографа-мареографа ВМ-04 / И.М. Кабатченко [и др.] // Океанология. 2007. Т. 47. № 1. С.150-155.
6. Куркин, А.А. Волны-убийцы: факты, теория и моделирование / А.А. Куркин [и др.] - Нижний Новгород: ННГУ, 2004. - 157 c.
7. Куркин, А.А. Физика волн-убийц в океане. «Нелинейные волны-2004» / А.А. Куркин [и др.]. -Нижний Новгород: ИПФ РАН, 2005. С. 37-51.
8. Левин, Б.В. Первые результаты регистрации длинных волн в диапазоне периодов цунами в районе Курильской гряды на разнесённой сети станций / Б.В. Левин [и др.] // Доклады Академии наук. 2009. Т. 427. № 2. С. 1-6.
9. Лидбеттер, М. Экстремумы случайных последовательностей и процессов / М. Лидбеттер. -Москва: Мир, 1989. - 391 с.
10. Fessel, D. Wave measurements using upward looking in marginal and polar sea ice regimes / D. Fessel [et al.] // ASL Environmental sciences. 2002
11. Kharif, Ch. Rogue Waves in the Ocean / Ch. Kharif [et al] // Springer, 2009. - 216 p.
12. Kharif , C. Physical mechanisms of the rogue wave phenomenon. European J Mechanics / C. Kharif [et al.] // B - Fluid, 2003, vol. 22, No. 6. Р. 603-634.
13. Kharif, Ch. Freak wave phenomenon: physical mechanisms and modeling. Chapter 3. Waves in Geophysical Fluids (Eds. Grue J. and Trulsen K.). / Ch. Kharif [et al.] //CISM Courses and Lectures, No. 489. Springer, 2006. Р. 107-172.
14. Nikolkina, I. Catalogue of rogue waves reported in media in 2006-2010. / I. Nikolkina [et al.] // Natural Hazards, 2011b, DOI 10.1007/s11069-011-9945-y.
15. Slunyaev A. et al. Rogue waters. Contemporary Physics. 2011
16. http://www.aviso.oceanobs.com/en/data/products/wind-waves-products/index.html
Дата поступления в редакцию 16.10.2012
ИНФОРМАТИКА И СИСТЕМЫ УПРАВЛЕНИЯ
УДК 519.8+ 681.31
А.В. Викулов, А.А. Кочешков
АНАЛИЗ И МОДЕЛИРОВАНИЕ ДИНАМИЧЕСКИХ СВОЙСТВ ИНФОРМАЦИОННЫХ СИСТЕМ
Нижегородский государственный технический университет имени Р.Е. Алексеева, Институт радиоэлектроники и информационных технологий
Представлена модель динамических свойств информационной системы в пространстве состояний. Ставится задача наблюдения за состоянием системы. Предлагается задача оценки параметров модели.
Ключевые слова: управление, наблюдение, информационная система, моделирование, пространство состояний
Введение
Современные информационные системы (ИС), в отличие от простых хранилищ документов, являются динамичными и развивающимися объектами. Наряду с задачами сбора, хранения и поиска данных, большое значение имеют текущие процессы управления и наблюдения за состоянием ИС.
В сетевой среде эффективное управление взаимодействием клиентов и серверов позволяет рационально распределять ресурсы, избежать множества лишних операций по передаче и обработке данных. На стороне серверов характер изменчивости данных влияет на такие процессы, как репликация, резервное копирование, индексация в поисковых системах. На стороне клиентов необходимо решить вопрос о периодичности формирования запросов к наблюдаемым серверам, чтобы соотнести выгоду от новой информации с затратами на ее получение и обработку. Решение задачи наблюдения за информационной системой должно учитывать общую цель обработки информации и минимизировать обобщенный критерий, в котором штраф от задержки получения информации о состоянии информационной системы соотносится с затратами на ее получение.
Формализовать такую оптимизационную задачу и получить необходимые априорные данные для объектов информационного характера сложно, поэтому чаще всего проблема решается простейшим эвристическим способом, что в итоге дает отклонение или в область вероятных существенных потерь информации, или в область неоправданных затрат на повторную обработку одной и той же информации. Построение адекватной математической модели, описывающей динамические процессы в ИС, дает основу для обоснованной и более выгодной стратегии наблюдения и обслуживания.
Для эффективного планирования использования ресурсов ИС клиентами необходимо решение задачи наблюдения за ее динамикой. Процесс наблюдения в динамических системах функционально может быть разбит на два этапа:
• проведение измерений;
• преобразование полученной информации по определенным алгоритмам.
Первый этап реализуется с помощью средств наблюдения и каналов связи, второй -
© Викулов А.В., Кочешков А.А., 2012.
программным путем. Подавляющая часть исследований посвящена оптимизации второго этапа как наиболее легко перестраиваемого и носящего обобщенный характер. При этом модель измерительной системы обычно принимается фиксированной и заданной совместно с моделью наблюдаемого объекта. В то же время полнота и достоверность измерительной информации, получаемой на первом этапе, несомненно, определяют качество функционирования всей системы, поэтому выбор наилучшего варианта структуры измерительной системы и режимов ее работы во времени является важной задачей.
Предлагается решать задачу методом пространства состояний, что позволяет учитывать и многомерность, и нестационарность стохастических процессов.
Грамотно спланированное наблюдение за состоянием ИС лежит в основе рационального распределения ресурсов ИС, управления пользователями, позволяет своевременно решать разнообразные проблемы, возникающие при ее внедрении и эксплуатации.
Теоретический анализ
Практически все информационные системы являются динамическими объектами, где постоянно происходят изменения как в структуре самой системы, так и в содержании ее элементов. Под изменением системы будем считать выполнение хотя бы одной из следующих трех операций: добавление, удаление и внутреннее изменение элемента данных. Данное определение базируется на основе анализа типичных операций в реальных системах и удобно тем, что позволяет задавать количественные характеристики и формально описывать динамику наблюдаемых объектов.
Динамика информационной системы состоит в изменении ее состояния и параметров во времени. Состояние будем характеризовать множеством изменений элементов данных и структурных связей между ними, произошедших внутри системы за указанный временной интервал.
Отличительной особенностью динамических информационных систем является отсутствие явно выраженного физического закона их функционирования. Изменения в таких системах происходят случайным образом, поэтому единственным способом оценить параметры наблюдаемого объекта является наблюдение за его динамикой, накопление и исследование статистики случайных процессов, служащих моделью состояния системы. Свойства этих случайных процессов могут непосредственно использоваться в алгоритмах ковариационного анализа для построения моделей методами теории временных рядов, базирующихся на использовании моделей авторегрессии и скользящего среднего [1, 2].
Классическим методом моделирования динамики систем является метод пространства состояний (МПС), который позволяет учитывать многомерность и нестационарность процессов. Согласно МПС линейная дискретная стохастическая модель объекта имеет вид
х+ = Акхк+Ск^к (!) где хк - и-мерный вектор состояния; = х[(к + 1)Т]; А - матрица состояния объекта размерности п х п, wk - I -мерный вектор шума в объекте с математическим ожиданием
Е{Щ } = 0 .
Состояние ИС характеризует количество элементов данных, классифицированных по типу и местам хранения. Изменение состояния вызывают действия обновления и модификации данных.
Функция состояния системы представляет собой дискретный случайный процесс
Хк = (х1 Х2 ХпУ •
Дискретизация этого процесса с постоянным периодом Т во временной области производится при помощи кусочно-постоянной аппроксимации [3, 4]. В каждый (к + 1)-й момент времени х(к +1) есть число изменений в системе относительно предыдущего к-го шага.
В общем случае имеем и-мерный вектор состояния, определенный в к-й момент вре-
мени. Координаты данного вектора ^ - это множество изменений подсистем, входящих в
состав наблюдаемого информационного объекта.
Состояние объекта в подавляющем большинстве случаев известно не полностью. Вся доступная информация о текущем состоянии хк содержится в векторах измерений (наблюдений), проводимых в дискретные моменты времени 1к < кТ. При постоянном периоде измерений ^ — ^ = Т уравнение измерителя имеет вид
Ук+1 = Нк+1хк+1 + \к+1 (2)
где ук+1 = у[(к + 1)Т ] - да-мерный вектор измерения; Ик+1 - матрица измерителя размерности т х т, цк+1 - да-мерный вектор шума измерений. Дискретный случайный процесс цк+1 физически интерпретируется как погрешность измерений и может быть как белым гауссов-ским шумом с математическим ожиданием Е{цк+= 0 и КФ
Як+1(\к+1) = Е\с\к+1'^1к+1} к = 0, N, так и кореллированным процессом.
В системе с управляемыми измерениями уравнение измерителя записывается в следующем виде, синхронном с дискретностью уравнения объекта (1):
ук+1 =Нк+1 ($к+1) Хк+1 + \к+1 +1), (3)
причем среди векторов ук+1 доступны только те, что соответствуют моментам проведения измерений. Остальные вектора можно характеризовать как фиктивные измерения.
Стратегия наблюдений на ^-шаговом переходном процессе представляет собой последовательность
^ = S2,...,SN},Sl е{0,1} . (4)
Для системы с постоянными измерениями SN является единичной.
В системах с кратными периодами дискретности стратегия вида
sn = {...,1,0д...д1,0д...д...,1,0д...д...} характеризует систему с периодическим режимом съема информации.
Таким образом, дискретная модель системы наблюдения - это уравнение объекта, уравнение измерителя в синхронном с уравнением объекта виде и стратегия наблюдения SN на ^-шаговом переходном процессе.
Оценивание параметров модели
Наблюдаемые координаты состояния ИС представляют собой векторный случайный процесс с дискретным временем. В рамках корреляционной теории по собранной статистике могут быть построены модели временных рядов: авторегрессия и скользящее среднее.
Классическое уравнение авторегрессии с постоянными коэффициентами имеет следующий вид (5):
а
£к+1 =Е Г^—* + (5)
1 = 0
где Е,к е Кр - вектор состояния процесса размерности р ; wk е Кр - вектор белого гауссов-ского шума с КМ ^, некоррелированный с; Г . е Крхр - матрицы коэффициентов размерности р х р, ] = 0, а . Согласно терминологии теории динамических систем, уравнение (5) описывает линейную стохастическую систему с запаздываниями, вектор состояния которой является дискретным марковским процессом порядка а +1.
Достаточной статистикой гауссовского марковского процесса (5) порядка а +1 являются математическое ожидание = Е{^к }, (а +1) отсчетов матричной КФ
ж = Е{рк £—1}, 1 = 0а + 1.
Для определения параметров уравнения (5) предлагается два метода. Рассмотрим метод точечной аппроксимации заданной КФ, предполагающий получение модели (5), при которой КФ формируемого процесса (г) совпадает в (а +1) -й точках по аргументу г с заданной КФ Q(i), г = 0, V •
Согласно работе [5], матричная КФ Q(i), г = 0, а +1, к = 0, N, порождающая положительно определенную блочную матрицу М (а, а)
Q(0) Q(1) ... Q( а)
М (а, а) =
^ (1) Q(0) ... Q(а-1)
QT (а) QT (а) ... Q(0)
(6)
является достаточной статистикой некого гауссовского центрированного марковского процесса порядка а +1, описываемого уравнением (5). Введем в рассмотрение взаимную КМ:
М (1, а) = [0(1), 0(2),..., Q(а +1)] , (7)
причем блоки матриц Я(а, а) и ^(1, р) являются элементами заданной КФ. Блочная матрица выбирается в виде
Г (а) = м(1, а)м (а, а)-1 • (8)
КМ Qw возбуждающего белого шума wk находится из уравнения
Qw = Q(0) - М (1, а)М (а, а)-1М (1, а)Т .
(9)
Таким образом, заданная КФ Q(i), г = 0, а +1 определяет параметры гауссовский плотности вероятности марковского процесса и, соответственно, параметры его модели в виде уравнения авторегрессии с постоянными коэффициентами.
Другой подход, позволяющий учесть при синтезе формирующего фильтра (5)
у > а +1 значений Q(i),г = 0, у, получим, применяя метод наименьших квадратов (МНК).
Сформируем блочную матрицу размерностью у х а +1 блоков, следующего вида:
М (а, а) Q(а +1) Q(а) ... Q(1)
М (у, а) =
Q(у) Q(у-1) . Q(у - а)_
Взаимная КМ запишется:
М (1, у) = Ш), Q(2),..., Q(у +1)] С помощью псевдообратной матрицы
М + (у, а) = М (у, а)ТМ (у, а)]"^_М (у, а)
(10)
(11) (12)
находится оптимальное в смысле минимумов наименьших квадратов решение
Г (а)Т = м+ (у, а)м(1, у)Т . (13)
В качестве приближения КМ возбуждающего шума может быть принято значение
Qw = Q(0) - Г(а)М(а, а)ГТ (а). 14)
Рассчитав параметры модели Г (а) и Q w , вычислим КФ модели. Ковариационная функция модели QM (г) на интервале а < г < у вычисляется по формулам
Ом (0) = ^ Гк дм (г - л)+ о^,
г, л — 0
а _
Ом (г) = 2 Глбм (|г - Л -1), г = 1, у
л—0
Найти решение системы (15) предлагается рекуррентной процедурой
а
°Мк+1(0) = 2 Гг°Мк-шт(г,л) (|* - Л1)Г к,] + ОМКк , г,Л=0
а _
бмк+1(г) = 2 Лмк-ттО-Ч,л) (|* - Л - 1|), * = 1 У
Л=0
(15)
(16)
по шагам к = 0, N до достижения установившегося решения Ом (г). Начальные условия
Ом 0(г) = 0(0.
Отождествив выходную последовательность * к с процессом хк, а шум фильтра wk с шумом в объекте, можно перейти от уравнения авторегрессии к уравнению объекта в пространстве состояний.
Оценка процесса авторегрессии
Рассмотрим случай управляемого наблюдения, когда измеряются все координаты вектора состояния без погрешности, но в определенные моменты дискретного времени к . Модель наблюдателя может быть сформирована зависимостями
|7, при = 1
Н№) — Г р / п , (17)
[0, при 5к — 0
где I - единичная пхп матрица, - вектор белого шума с ковариационной матрицей
|0, при = 1
К №) = Г р * _ , (18)
[да, при 5к — 0
где условная запись К — да воспринимается как неограниченное возрастание диагональных
элементов матрицы К для процедуры предельных переходов.
В случае управляемого наблюдения с полным и точным измерением вектора состояния (с учетом вида Н (£к+^ и К (£к+^ ) получим оптимальную оценку состояния в виде
о \Ук+1, №к+1 =1, , ч
* *+1 Чг * _п (19)
I * к+1|к, 5 к+1 = 0
а
где * к+1|к =2 Гг * к-г .
г—0
Тогда ошибка оценки *к+1 — *к+1 -*
к+1
10, №к+, = 1,
*'+' =1* * 5 - 0 (20)
1*к+1 *к+1, 5к+1 = 0
Для планирования наблюдений и анализа точности необходимо вычислить ковариационную функцию ошибки оценки ()к (г) — Е{*к*т_г}, г - 0, V.
Критерием точности оценок служит дисперсия ошибки оценки. Рекуррентные уравнения для вычисления О, (г) должны учитывать наличие измерения на соответствующей итерации.
а
~ а ~
Qk+i(°) = Z Г& -min(i, j )(| i - j\) Г1 j + Qwk
i,j=0
а
_(21)
бк+х (г) = Е ГМк-т^г-з-х,]) (|г - 7 -1|)> г = 1, У
7=0
Экспериментальная часть
На основе предложенных алгоритмов был реализован программный комплекс, предназначенный для исследования динамики локальных и удаленных информационных систем. Программный комплекс состоит из трех программных средств: монитора изменений информационной системы, обработчика данных и анализатора, предназначенного для построения моделей и стратегий наблюдения. Этап моделирования представляет собой запуск монитора для слежения и сбора статистики выбранного объекта. После требуемого периода наблюдений данные должны быть обработаны программой обработчиком измерений. Эта программа позволяет извлечь необходимые данные из хранилища, просмотреть их, определить координаты состояния и настроить параметры экспорта: отфильтровать данные по времени, выставить фильтр, выбрать формат файла. После того, как экспорт данных был произведен, полученный файл может быть использован для анализа в программе анализаторе или в любой другой совместимой программе. Программа анализатор строит модель динамики объекта, оценивает входящий процесс и выдает результаты в наглядном графическом и табличном видах.
Результаты
Ряд информационных ресурсов сети Интернет имеет ярко выраженный динамический характер. В качестве примера был взят информационный портал РосБизнесКонсалтинг, расположенный на веб-сайте http://www.rbc.ru.
На начальном этапе изучения свойств объекта с постоянным периодом в 1 час собирались данные об обновлениях текстовых блоков и графических элементов. Обозначим процесс изменения текстовых блоков как (хк^ , а графических (хк)2.
Процессы изменения данных на сайте имеют коррелированный характер, что связанно с периодичностью суточной активности. В дневной период интенсивность изменений в несколько раз выше, чем в ночные часы. Это позволяет планировать наблюдения за информацией на сайте и экономить ресурсы.
Имея адекватную модель системы, можно рассмотреть задачу управляемого наблюдения. Чтобы решить эту задачу, необходимо выбрать стратегию наблюдения, рассчитать оценку состояния системы и проанализировать ее точность. В качестве примера, зададим стратегию таким образом, что наблюдение будем производить в моменты времени к, кратные Т :
|1, к кратноТ к [0, к не кратноТ
Вычисленная по формуле (20) оценка ( (Ъ,к )х и ()2 соответственно) позволяет вычислить дисперсию ошибки оценки по формуле (21), которая служит критерием точности. График реализации исходного процесса и его оценки представлен на рис. 1.
Поскольку целью наблюдения является максимально точное оценивание, примем за
критерий качества квадратичную форму ошибки оценки (^ и (<^к )2 соответственно, (&)вз - взаимная ошибка оценки). Дисперсия ошибки оценки представлена на рис. 2.
Рис. 1. Графики реализации исходного процесса хк и его оценки ^ для Т=2
40 (&) 1 (&)2
//* \| [/ \\ Шй аЛч //.'Л\ а. -Ч 1/ 1/ а - ву У-'
20
2:
30
35
40
Рис. 2. График дисперсии ошибки оценки ^ для Т=2
В результате проведения серии экспериментов был получен график зависимости точности оценки от величины интервала между наблюдениями (рис. 3).
Рис. 3. Точность оценки
Задав необходимую точность оценки, можно выбрать интервал между наблюдениями. Это позволит оператору выбрать наиболее подходящую стратегию наблюдения за состоянием ИС.