Оригинальная статья / Original article УДК: 004.94
DOI: 10.21285/1814-3520-2016-12-129-135
МАТЕМАТИЧЕСКИЕ МОДЕЛИ В СИСТЕМАХ ОБРАБОТКИ ЧАСТОТНО-ВРЕМЕННОЙ ИНФОРМАЦИИ
© Ю.П. Хрусталев1, И.А. Серышева2, А.С. Соколова3
Иркутский национальный исследовательский технический университет, 664074, Российская Федерация, г. Иркутск, ул. Лермонтова, 83.
РЕЗЮМЕ. ЦЕЛЬ. Разработка формализованного алгоритма оценивания вектора состояния эталона времени и частоты (В и Ч). МЕТОДЫ. Использованы помехоустойчивые расщепленные оценки, осуществлена идентификация скачков частоты водородных стандартов. Анализ погрешностей алгоритма проведен при опоре на использование динамических стохастических моделей (моделей авторегрессии и скользящего среднего - АРСС). Задача адаптации моделей АРСС решена методами стохастического квазиградиента. Метод идентификации полиномиальных трендов основан на использовании регрессионного анализа и опирается на использование стационарно-разностных временных рядов. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ. Рассмотрены математические модели, применяемые в системах обработки частотно-временной информации. Показано, что использование моделей авторегрессии - проинтегрированного скользящего среднего - позволяет повысить точность оценивания вектора состояния групповых эталонов времени и частоты. Сформулированы проблемы, решение которых позволит создать программный комплекс обработки результатов «внутренних сличений», выполняемых в процессе функционирования эталонов времени и частоты. При этом пользователь - специалист в области частотно-временных измерений - может не обладать глубокими теоретическими познаниями в области анализа временных рядов. ЗАКЛЮЧЕНИЕ. Результаты, полученные в процессе работы над статьей, дают возможность создания полностью формализованного алгоритма оценивания состояния эталонов В и Ч.
Ключевые слова: модели временных рядов, стохастическая аппроксимация, полиномиальные тренды, групповые эталоны.
Формат цитирования: Хрусталёв Ю.П., Серышева И.А., Соколова А.С. Математические модели в системах обработки частотно-временной информации // Вестник Иркутского государственного технического университета. 2016. Т. 20. № 12. С. 129-135. DOI: 10.21285/1814-3520-2016-12-129-135
MATHEMATICAL MODELS IN TIME-AND-FREQUENCY INFORMATION PROCESSING SYSTEMS Yu. P. Khrustalev, I.A. Serysheva, A.S. Sokolova
Irkutsk National Research Technical University,
83, Lermontov St., Irkutsk, 664074, Russian Federation.
ABSTRACT. The PURPOSE of the article is development of a formalized algorithm to estimate the time and frequency reference state vector. METHODS. The article uses noise-proof split (Jackknife procedure) assessments, identifies the frequency jumps of hydrogen standards. Algorithm errors are analyzed on the basis of the use of dynamic stochastic models (autoregression and moving average (ARMA) models). The problem of ARMA model adaptation is solved by the methods of stochastic quasigradient. The method of polynomial trend identification is based on the use of the regression analysis and employs stationary and difference time series. RESULTS AND THEIR DISCUSSION. Mathematical models used in the processing systems of time and frequency information are considered. It is shown that the use of autoregression models - integrated moving average - allows to improve the estimation accuracy of the state vector of time and frequency group standards. The problems whose solution will create a software package for the processing of the results of "internal comparison" performed in time and frequency reference operation are formulated. In this case, deep theoret i-cal knowledge in the field of time series analysis is not a necessary requirement for a user - a specialist in the field of time and frequency measurements. CONCLUSION. The results obtained in the study enable the creation of a fully for-
1
Хрусталёв Юрий Петрович, кандидат технических наук, доцент кафедры вычислительной техники, e-mail: [email protected]
Yuri P. Khrustalev, Candidate of technical sciences, Associate Professor of the Department of Computing Machinery, e-mail: [email protected]
2Серышева Ирина Анатольевна, старший преподаватель кафедры автоматизированных систем, e-mail: [email protected]
Irina A. Serysheva, Senior Lecturer of the Department of Automated Systems, e-mail: [email protected]
3Соколова Анастасия Сергеевна, студентка, e-mail: [email protected] Anastasia S. Sokolova, Student, e-mail: [email protected]
Information Science, Computer Engineering and Management
malized algorithm for time and frequency reference state estimation.
Keywords: time series models, stochastic approximation, polynomial trends, group standards
For citation: Khrustalev Yu.P., Serysheva I.A, Sokolova A.S. Mathematical models in time-and-frequency information processing systems // Proceedings of Irkutsk State Technical University. 2016, vol. 20, no. 12, pp. 129-135. (In Russian) DOI: 10.21285/1814-3520-2016-12-129-135
Введение
Основные единицы физических величин воспроизводятся и хранятся соответствующими эталонами. Самыми точными из них являются эталоны времени и частоты (В и Ч). Для повышения точности и надежности эти эталоны реализованы как групповые, т.е. содержат в своем составе группу мер (меры чаще всего однотипны). В процессе функционирования эталона производятся регулярные измерения разностей частот, периодических сигналов, воспроизводимых элементами эталона. Основная задача обработки данных заключается в нахождении оценок значений часто-
ты каждой из мер, входящей в состав эталона. Поскольку результаты измерений являются случайными величинами, то групповые эталоны можно рассматривать как стохастические системы.
В статье сформулированы основные проблемы, стоящие перед разработчиками программного обеспечения эталонов В и Ч. Предложен подход к решению первоочередной задачи - разработки полностью формализованного алгоритма оценивания вектора состояния эталона, т.е. значения частоты водородных генераторов, входящих в состав групповых эталонов.
Помехоустойчивые оценки в задачах обработки данных
Рассмотрим основные соотношения, описывающие процесс измерений. Будем рассматривать дискретное время, используя индекс к, т.е. привязывая результаты измерений к середине к-го интервала, где к = 1, ..., т, т - количество суток.
Пусть - относительное отклонение частоты /-й меры от приписанного значения (в дальнейшем будем вместо термина «относительное отклонение частоты» писать просто «значение частоты», а индекс к опускать, когда речь будет идти об обработке данных, полученных на одном интервале).
В Российской Федерации мерами времени и частоты являются водородные генераторы. Будем считать опорным водородный генератор с номером 1. Результат измерения, выполненного с участием /-го генератора, можно представить в виде [1] I' = У1 - У'.
Измерительная система эталона описывается векторным уравнением:
Z = F(Y),
(1)
гг=[У - у2;/ - у3- ?];
УТ =[у1 ...уп]; п - количество генераторов,
входящих в эталон В и Ч.
Задача обработки данных заключается в нахождении оценки вектора состояния эталона ?, удовлетворяющих соотношению [2]
Z - Z(Y) = О.
(2)
Векторные уравнения - линейные, т.е. имеют вид:
Z = H ■ Y
(3)
H =
1 -1 О ... О
1 О О
-1
л
Ранг матрицы Н равен п - 1. Следовательно, решение уравнения (3) нельзя искать в виде У = Н-1 • 1, так как обратной матрицы Н-1 не существует.
При различной размерности векторов речь может идти о нахождении некоторой оптимальной оценки вектора состояния эталона. Чаще всего это оценка У*, минимизирующая норму вектора ошибки [3]:
E = (Z - Z(Y ))2,
(4)
т.е. У* - оценка метода наименьших квадратов (МНК-оценка)
МНК-оценка может быть найдена с помощью псевдообратной матрицы Н+ или обобщенной обратной матрицы Пенроуза, которая может быть найдена с помощью скелетного разложения матрицы Н [3].
В нашем случае матрица Н+ имеет
вид
H + =
1
1 1
(n-1 ) 1 1
1
1 1 ... (n-1)
Оценка величины у1, вычисленная на текущем такте обработки измерительной информации с помощью матрицы Н+, равна:
Л 1 n-1
Y 1 =1 S Z,
n i=1
(6)
Поскольку при обработке данных, полученных на суточных интервалах, шумами измерений можно пренебречь ввиду их малости [1], достаточно найти оценку одной составляющей вектора У (например, у!) [4]. Оценки остальных составляющих находятся из соотношения
Л
-1 = У1" У,-
Погрешность МНК-оценки у[, вычисленной по формуле (6) на одном такте обработки данных, равна:
Л 1 m
E = У1 - У1 = - s yt.
m
(7)
7=1
При большом числе мер, входящих в состав группового эталона, этой погрешностью можно пренебречь. Число водородных стандартов, входящих в групповые эталоны, невелико [4]. Поэтому для уменьшения погрешности оценок вектора состояния Ук следует применять математические модели, основанные на использовании динамических свойств объекта [1].
Анализ погрешностей алгоритмов оценивания
Л
В задачах оценивания состояния динамических объектов принято различать два режима обработки данных:
- режим статической обработки (режим с накоплением данных);
- режим динамической обработки (режим реального времени, или режим фильтрации [2]).
Режим статической обработки применяется на начальной стадии, когда данные накоплены в течение достаточно длительного времени. При этом находятся оценки вектора состояния эталона В и Ч: Ук,к = 1, по которым строятся ди-
намические стохастические модели - мо-
дели авторегрессии - скользящего среднего (АРСС [1]). Построенные модели используются затем в режиме фильтрации. При этом оценки вектора состояния вычисляются с учетом прогнозов этого вектора [1].
Задача выбора оптимальных весов, с которыми в результирующую оценку вектора состояния входят прогнозы этой оценки, решена Калманом [5]. Можно построить субоптимальный фильтр Калмана, используя методы декомпозиции фильтра и понижения его размерности. При этом оценка частоты опорного генератора вычисляется по формуле
Information Science, Computer Engineering and Management
У1 =
n-1
E -+E у (1)
j=1 _
i=1
■ gn
(8)
где д1 - вес результата измерения г£; у, (1) - прогноз значения частоты генератора с номером у, вычисленный на предыдущем такте обработки данных.
Прогнозы вычисляются на основе моделей АРСС, т.е. алгоритмы обработки данных, опирающиеся на применение моделей АРСС, относятся к классу алгоритмов Калмановской фильтрации4.
Погрешность полученных оценок
равна:
Л п
ЛУ = У1 - У1 = Е8 (у - у (1)). (9)
'=1
Очевидно, что увеличение точности
прогнозов приводит к повышению точности группового эталона В и Ч.
Методика обработки результатов «внутренних сличений», выполняемых в эталонах В и Ч, детально разработана.
Процедура построения моделей АРСС (методика Бокса - Дженкинса [6]) реализована в ППП «БТАПЭТЮА» [7].
Результаты моделирования процессов обработки данных, полученных в подсистемах «внутренних сличений» эталонов, показали, что точность групповых эталонов может быть повышена за счет применения более совершенных математических моделей примерно на 30-40%5. Моделирование проводилось независимо, с использованием различных методик (и в разных организациях и городах), полученные результаты хорошо согласуются.
Обработка данных при наличии нестационарностей в процессах измерения частоты
Активному внедрению разработанных алгоритмов в практическую деятельность служб времени препятствуют следующие факторы:
1. В процессе функционирования эталонов имеют место косвенные измерения, по результатам которых необходимо предварительно находить оценки значений частоты ?к. Непосредственное использование МНК-оценок (8) невозможно, так как ряды из г1к могут содержать аномальные измерения (выбросы).
2. Частоты водородных стандартов могут изменяться скачками, амплитуды и моменты возникновения которых являются случайными величинами.
3. Параметры математических (прогнозирующих) моделей могут претерпевать
изменения с течением времени.
4. Процессы изменения частоты у(ь), помимо стационарной составляющей у(1), для которой строятся прогнозирующие модели, могут содержать степенные тренды 1-го и 2-го порядков [4].
5. Для построения моделей АРСС по эмпирическим данным исследователь должен иметь достаточную теоретическую подготовку и опыт в построении таких моделей.
Ниже кратко рассмотрены подходы к решению перечисленных проблем.
Первым шагом при построении прогнозирующих моделей является формирование рядов оценок у1к, которые на каждом такте к находятся с помощью псевдообратной матрицы Н+, однако являются смещен-
4Ипполитов А.А. Динамические стохастические модели в системах оценивания вектора состояния групповых эталонов: дис. ... канд. техн. Наук: номер спец.: 051318. защищена 15.10.15 Иркутск. 2014. 204 с. Ippolitov A.A. Dynamic stochastic models in the estimation systems of the group standard state vector: Candidate's dissertation in technical sciences: number of specialty: 051318. Defended: 15 October 2015. Irkutsk, 2015, 204 p.
5Подогова С.Д. Разработка алгоритмов формирования выходного сигнала группового эталона единиц времени и частоты: автореф. дис. ... канд. техн. наук: номер спец.:05.11.15 Нижний Новгород, 2016, 173 с. Podogova S.D. Development of the algorithms of time and frequency unit group standard output signal formation: Candidate's dissertation in technical sciences: number of specialty:05.11.15, Defended: 21 April 2016. Nizhnii Novgorod, 2016, 173 p.
ными. Величина смещения определяется по формуле (7). Уменьшить смещение можно, используя расщепленные (джекнайф) оценки [8]. Модификация этих оценок (альфа-усеченные джекнайф оценки [8]) позволяет при этом успешно бороться с «выбросами».
Задача построения ступенчатой функции, т.е. обнаружение скачков частоты, решается весьма просто, если известно среднеквадратическое отклонение (СКО) рядов первой разности (Др). Оценку СКО следует определять с помощью формул помехоустойчивого оценивания [8]. Результаты моделирования показывают, что скачки частоты уверенно идентифицируются при выходе значения рядов первой разности (ДУк > к1 • а), за границы (5-8) а, где оценка а вычисляется в статическом режиме.
Задача подстройки параметров прогнозирующих моделей (адаптация моделей АРСС) успешно решается методами стохастического квазиградиента [9].
Порядок степенных полиномов, которые могут содержаться в рядах Р, как правило, не превышает двух [4]. Для построения прогнозирующих моделей таких временных рядов существует два подхода:
- подход, основанный на применении аппарата стационарно-разностных процессов [6];
- подход, базирующийся на идентификации детерминированных трендов и устранении их влияния.
Первый подход требует взятия б-х разностей с последующим анализом стационарности полученных рядов (где б - порядок разностей моделей авторегрессии проинтегрированного скользящего среднего). Анализ стационарности требует рассмотрения автокорреляционной функции (ЛОР) ряда. ЛОР стационарного процесса спадает достаточно быстро (по экспоненциальному закону). ЛОР нестационарного ряда спадает гораздо медленнее.
Методика, основывающаяся на таком подходе, требует участия исследователя. Для ее формализации нужно сформулировать данную задачу в рамках теории
проверки статических гипотез:
- Но: ЛОР описывается линейной функцией;
- Н1: ЛОР затухает по экспоненте.
Для принятия той или иной гипотезы
необходима предварительная подгонка параметров ЛОР функции.
Нам представляется более предпочтительным второй подход, когда одновременно находятся оценки параметров линейной и квадратичной функций и затем на основе анализа остатков проверяются гипотезы:
- Но: В значениях временного ряда ук содержится линейный тренд;
- Н1: В значениях временного ряда ук содержится квадратичный тренд.
Такой подход не требует вычисления ЛОР, а процедура проверки гипотез совмещена с процессом подгонки параметров.
После удаления из рядов Р детерминированных трендов, ряды Р1 будут содержать только стационарные составляющие, для которых нужно построить модели АРСС.
Предлагаемый подход иллюстрируется следующим машинным экспериментом:
1. Был сгенерирован процесс авторегрессии первого порядка с параметрами аа = 0,01 и ср1 = 0,2. Временной ряд содержит 100 точек.
2. По сгенерированному ряду с помощью ППП ЭТЛИЭТЮЛ была построена оценка параметра фъ которая оказалась равной (р1 = 0,16759.
3. На сгенерированный временной ряд был наложен детерминированный тренд у = Ь0 + к, с коэффициентами Ь1 = 0,1 и Ь0 = 0.
4. С помощью регрессионного анализа была найдена оценка коэффициента р = 0,00995, и из суммарного временного ряда было удалено влияние тренда.
5. Для полученного ряда остатков была построена модель авторегрессии первого порядка, оценка коэффициента <р1 оказалась равной 0,17598, т.е. относитель-
Information Science, Computer Engineering and Management
ная погрешность этой оценки « 5%;
Результаты машинного эксперимента, моделирующего процесс идентификации линейного тренда и устранение влияния, приведены на рисунке.
Результаты эксперимента носят исключительно иллюстративный характер. Погрешность оценивания параметра авторегрессии (АР) первого порядка стационарной составляющей временного ряда после выполнения указанных процедур весьма
незначительна (не превышает 5% от исходного значения параметра АР).
Задача формализации процедуры построения моделей АРСС при небольших значениях р и q может быть найдена с помощью простого перебора возможных структур моделей (при порядках АР р < 3 и скользящего среднего (СС) ц<2 таких наборов всего 9).
a b
Выделение стационарной составляющей из временного ряда, содержащего полиномиальный линейный тренд: a - суммарный ряд (на АР наложен линейный тренд); b - ряд остатков, который соответствует процессу АР первого порядка с параметром = 0,17598 Fig. 1. Identification of the stationary component of the time series containing a polynomial linear trend: a - a cumulative series (a linear trend is imposed on autoregression (AR)); b - a series of residuals which corresponds to the first order AR with the parameter ip{ = 0.17598
Заключение
В статье рассмотрена возможность использования помехоустойчивых расщепленных оценок для уменьшения смещения оценок метода наименьших квадратов и отбраковки «выбросов». Приведен анализ погрешностей алгоритма оценивания состояния эталона, опирающийся на использование динамических стохастических моделей (моделей АРПСС). Показано, что алгоритмическая погрешность может быть значительно снижена за счет использования прогнозирующих моделей.
Модели АРСС могут применяться (и строиться) только для стационарной составляющей временных рядов. В статье предлагается использовать метод идентификации скачков частоты водородных стандартов и устранение их влияния за счет вычитания из исходных рядов ступен-
"134
чатой функции, в которой моменты возникновения скачков и их амплитуды - случайные величины.
Предложен способ идентификации полиномиальных трендов (и последующего их удаления из временного ряда), основанный на использовании регрессионного анализа и, в отличие от методологии Бокса -Дженкинса, опирающийся на использование стационарно-разностных временных рядов, хорошо формализуемый.
После выполнения перечисленных выше процедур оставшаяся составляющая временного ряда (значения частоты водородных стандартов) представляет собой стационарный процесс, модели авторегрессии - скользящего среднего, которую можно при небольших порядках АР и СС построить методом простого перебора раз-
^ЭЫ 1814-3520
ВЕСТНИК ИрГТУ Т. 20, № 12 2016 / PROCEEDINGS of ISTU Vol. 20, № 12 2016
личных комбинаций моделей. здания полностью формализованного ал-
Результаты, полученные в процессе горитма оценивания состояния эталонов работы над статьей, дают возможность со- В и Ч.
Библиографический список
1. Хрусталёв Ю.П. Статическая и динамическая обработка данных, получаемых в процессе ведения эталонов времени частоты // Измерительная техника. 2004. № 6. С. 20-23.
2. Гамм А.З. Статистические методы оценивания состояния электроэнергетических систем. М.: Наука, 1976. 220 с.
3. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966. 576 с.
4. Хрусталёв Ю.П.,. Акулов В.М., Ипполитов А.А., Курышева Л.Н. Обработка данных, полученных по результатам взаимных измерений вторичного эталона времени и частоты // Вестник ИрГТУ. 2012. № 7. С. 22-28.
5. Эльясберг П.Е. Определение движения по результатам измерения. 2-е изд. М.: Либроком, 2011.
416 с.
6. Бокс Дж., Дженкинс Г. Анализ временных рядов, прогноз и управление: пер. с англ.; под ред.
B.Ф. Писаренко. М.: Мир, 1974. 406 с.
7. Боровиков В.П. Популярное введение в современный анализ данных в системе ЭТАТ1ЭТ1СА. М.: Горячая линия. Телеком, 2013. 267 с.
8. Хрусталев Ю.П., Серышева И.А. Повышение устойчивости оценок состояния эталонов времени и частоты // Измерительная техника. 2014. № 5.
C. 29-34.
9. Серышева И.А., Хрусталев Ю.П. Метод стохастического квазиградиента в задаче адаптации прогнозирующих моделей // Вестник ИрГТУ. 2013. № 12. С. 25-30.
References
1. Khrustalev Yu.P. Staticheskaya i dinamicheskaya obrabotka dannykh, poluchaemykh v pro-tsesse vedeniya etalonov vremeni chastoty [Static and dynamic processing of data obtained in time and frequency standards operation]. Izmeritel'naya tekhnika [Measurement equipment]. 2004, no. 6, pp. 20-23. (In Russian)
2. Gamm A.Z. Statisticheskie metody otsenivaniya sostoyaniya elektroenergeticheskikh si-stem [Statistical methods for electric power system condition estimation]. Moscow, Nauka Publ., 1976, 220 p. (In Russian)
3. Gantmakher F.R. Teoriya matrits [The theory of matrices]. Moscow, Nauka Publ., 1966, 576 p. (In Russian)
4. Khrustalev Yu.P., Akulov V.M, Ippolitov A.A., Kurysheva L.N. Obrabotka dannykh, poluchennykh po rezul'tatam vzaimnykh izmerenii vtorichnogo etalona vremeni i chastoty [Processing data obtained as a result of reciprocal measuring of secondary standard of time and frequency]. Vestnik IrGTU [Proceedings of Irkutsk State Technical University]. 2012, no. 7, pp. 22-28.
5. El'yasberg P.E. Opredelenie dvizheniya po rezul'tatam izmereniya [Determining movement by measuring
Критерии авторства
Хрусталёв Ю.П., Серышева И.А., Соколова А.С. имеют на статью равные авторские права и несут равную ответственность за плагиат
Конфликт интересов
Авторы заявляют об отсутствии конфликта интересов.
Статья поступила 19.10.2016 г.
results]. Moscow, Librokom Publ., 2011, 416 p. (In Russian)
6. Boks Dzh., Dzhenkins G. Analiz vremennykh rya-dov, prognoz i upravlenie [Time series analysis, forecasting and control]. Moscow, Mir Publ., 1974, 406 p. (In Russian)
7. Borovikov V.P. Populyarnoe vvedenie v sovremen-nyi analiz dannykh v sisteme STA-TISTICA [Popular introduction to modern data analysis in STATISTICA system]. Moscow, Goryachaya liniya. Telekom Publ., 2013, 267 p. (In Russian)
8. Khrustalev Yu.P., Serysheva I.A. Povyshenie ustoichivosti otsenok sostoyaniya etalonov vremeni i chastoty [Improving sustainability of time and frequency standards state estimates]. Izmeritel'naya tekhnika [Measurement equipment]. 2014, no. 5, pp. 29-34.
9. Serysheva I.A., Khrustalev Yu.P. Metod sto-khasticheskogo kvazigradienta v zadache adaptatsii prognoziruyushchikh modelei [Method of stochastic quasigradient in the problem of predictive model adaptation]. Vestnik IrGTU [Proceedings of Irkutsk State Technical University]. 2013, no. 12, pp. 25-30.
Authorhip criteria
Khrustalev Yu.P., Serysheva I.A, Sokolova A.S. have equal author's rights and bear equal responsibility for plagiarism.
Conflict of interests
The authors declare that there is no conflict of interests regarding the publication of this article.
The article was received 19 October 2016