Научная статья на тему 'Метод сопряженных градиентов в системе автоматического построения прогнозирующих моделей'

Метод сопряженных градиентов в системе автоматического построения прогнозирующих моделей Текст научной статьи по специальности «Математика»

CC BY
141
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук
Ключевые слова
PREDICTIVE MODELS OF TIME SERIES / SEARCH FOR UNCONDITIONAL EXTREMUM / METHOD OF CONJUGATE GRADIENTS / ADEQUACY OF PREDICTING MODELS / GROUP TIME AND FREQUENCY STANDARDS

Аннотация научной статьи по математике, автор научной работы — Серышева Ирина Анатольевна, Чекан Михаил Андреевич, Бархатова Людмила Викторовна, Крупенев Егор Анатольевич

PURPOSE. The paper deals with the increase in reproduction accuracy of time and frequency units through the use of predictive autoregressive-moving average models (ARMA)). The methodology of ARMA model creation existing now is based on interactive procedures. This requires highly qualified specialists and prevents the algorithms of optimum filtration from the introduction in the practical activities of time services. METHODS. The study employs the methods of time series analysis, ARMA model construction and the conjugate gradients method. RESULTS. An approach allowing a complete formalization of the procedure of model construction is introduced. A program module implementing the automatic construction of the predicting models that describe the processes of hydrogen standards frequency variation is developed. It is tested experimentally and the results of the work confirming the adequacy of the obtained models are presented. CONCLUSIONS. The formalized methodology of ARMA models construction proposed by the authors will allow to solve the problem of full automation of time series model construction by empirical data and to lower the reproduction error of time and frequency units by group standards up to 30%.The conducted study provides all the reasons to suppose that the developed software module can serve as a basis for creating a standard software for the subsystem of internal comparisons of time and frequency standards in order to be introduced into the experimental operation mode.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Серышева Ирина Анатольевна, Чекан Михаил Андреевич, Бархатова Людмила Викторовна, Крупенев Егор Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод сопряженных градиентов в системе автоматического построения прогнозирующих моделей»

Оригинальная статья / Original article УДК 004.94

DOI: http://dx.d0i.0rg/l0.21285/1814-3520-2018-8-72-82

МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ В СИСТЕМЕ АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ ПРОГНОЗИРУЮЩИХ МОДЕЛЕЙ

© И.А. Серышева1, М.А. Чекан2, Л.В. Бархатова3, Е.А. Крупенев4

Иркутский национальный исследовательский технический университет, 664074, Российская Федерация, г. Иркутск, ул. Лермонтова, 83.

РЕЗЮМЕ. ЦЕЛЬ. Работа направлена на повышение точности воспроизведения единиц времени и частоты за счет использования прогнозирующих моделей авторегрессии-скользящего среднего. Существующая в настоящее время методика построения моделей авторегрессии-скользящего среднего основана на интерактивных процедурах, что требует участия высококвалифицированных специалистов и препятствует внедрению алгоритмов оптимальной фильтрации в практическую деятельность служб времени. МЕТОДЫ. Использованы методы анализа временных рядов, построения моделей авторегрессии-скользящего среднего, метод сопряженных градиентов. РЕЗУЛЬТАТЫ. Предложен подход, позволяющий полностью формализовать процедуру построения моделей. Разработан программный модуль, реализующий автоматическое построение прогнозирующих моделей, описывающих процессы изменения частоты водородных стандартов. Проведена его экспериментальная проверка и приведены результаты работы, подтверждающие адекватность получаемых моделей. ВЫВОДЫ. Формализованная методика построения моделей авторегрессии-скользящего среднего, предложенная авторами, позволит решить проблему полной автоматизации процесса построения моделей временных рядов по эмпирическим данным и снизить погрешность воспроизведения единиц времени и частоты групповыми эталонами до 30%. В результате выполненных работ имеются все основания полагать, что разработанный программный модуль может служить основой для создания типового программного обеспечения подсистемы внутренних сличений эталонов времени и частоты с целью введения последующего в режим опытной эксплуатации.

Ключевые слова: прогнозирующие модели временных рядов, поиск безусловного экстремума, метод сопряженных градиентов, адекватность прогнозирующих моделей, групповые эталоны времени и частоты.

Информация о статье. Дата поступления 18 июня 2018 г.; дата принятия к печати 19 июля 2018 г.; дата онлайн-размещения 31 августа 2018 г.

Формат цитирования. Серышева И.А., Чекан М.А., Бархатова Л.В., Крупенев Е.А. Метод сопряженных градиентов в системе автоматического построения динамических стохастических моделей // Вестник Иркутского государственного технического университета. 2018. Т. 22. № 8. С. 72-82. DOI: 10.21285/1814-3520-2018-8-72-82

CONJUGATE GRADIENT METHOD IN THE SYSTEM OF PREDICTING MODEL AUTOMATIC CREATION

I.A. Serysheva, M.A. Chekan, L.V. Barkhatova, E.A. Krupenev

Irkutsk National Research Technical University, 83, Lermontov St., Irkutsk, 664074, Russian Federation

ABSTRACT. PURPOSE. The paper deals with the increase in reproduction accuracy of time and frequency units through the use of predictive autoregressive-moving average models (ARMA)). The methodology of ARMA model creation existing now is based on interactive procedures. This requires highly qualified specialists and prevents the algorithms of optimum filtration from the introduction in the practical activities of time services. METHODS. The study employs the methods of

1Серышева Ирина Анатольевна, старший преподаватель кафедры автоматизированных систем, e-mail: [email protected]

Irina A. Serysheva, Senior Lecturer of the Department of Automated Systems, e-mail: [email protected]

2Чекан Михаил Андреевич, студент, e-mail: [email protected]

Mikhail A. Chekan, Student, e-mail: [email protected]

3Бархатова Людмила Викторовна, студентка, e-mail: [email protected]

Lyudmila V. Barkhatova, Student, e-mail: [email protected]

4Крупенев Егор Анатольевич, студент, e-mail: [email protected]

Egor A. Krupenev, Student, e-mail: [email protected]

time series analysis, ARMA model construction and the conjugate gradients method. RESULTS. An approach allowing a complete formalization of the procedure of model construction is introduced. A program module implementing the automatic construction of the predicting models that describe the processes of hydrogen standards frequency variation is developed. It is tested experimentally and the results of the work confirming the adequacy of the obtained models are presented. CONCLUSIONS. The formalized methodology of ARMA models construction proposed by the authors will allow to solve the problem of full automation of time series model construction by empirical data and to lower the reproduction error of time and frequency units by group standards up to 30%.The conducted study provides all the reasons to suppose that the developed software module can serve as a basis for creating a standard software for the subsystem of internal comparisons of time and frequency standards in order to be introduced into the experimental operation mode. Keywords: predictive models of time series, search for unconditional extremum, method of conjugate gradients, adequacy of predicting models, group time and frequency standards

Information about the article. Received June 18, 2018; accepted for publication July 19, 2018; available online August 31, 2018.

For citation. Serysheva I.A., Chekan M.A., Barhatova L.V., Krupenev E.A. Conjugate gradient method in the system of predicting model automatic creation. Vestnik Irkutskogo gosudarstvennogo tehnicheskogo universiteta = Proceedings of Irkutsk State Technical University. 2018, vol. 22, no. 8, pp. 72-82. DOI: 10.21285/1814-3520-2018-8-72-82 (In Russian).

Введение

Групповые эталоны единиц времени и частоты (ВиЧ) предназначены для воспроизведения, хранения и передачи единиц времени и частоты в соответствии с их определением в системе СИ, а также для формирования, хранения и передачи координированных шкал времени. Точность воспроизведения и хранения единиц ВиЧ определяется как аппаратурной базой, так и методами обработки измерительной информации, получаемой в процессе ведения эталонов. В настоящее время существует большое количество алгоритмов для вычисления шкал времени, характеризующих состояние эталона. Наиболее часто используемые методы расчета являются различными модификациями базовых уравнений шкалы времени [1-4], либо используют фильтрацию Калмана [4-9].

Алгоритмы, основанные на фильтре Калмана, в том числе, и субоптимальной фильтрации, позволяют достаточно точно оценить состояние группового эталона, и, как правило, дают лучшие результаты по сравнению с методами, основанными на модификации базового уравнения шкалы времени. Однако для их работы требуется априорная информация о параметрах стандартов, входящих в групповой эталон ВиЧ.

В частности, предлагаемый в [8, 9] алгоритм субоптимальной фильтрации, позволяющий находить оценку вектора состоя-

ния группового эталона единиц ВиЧ по результатам «внутренних сличений», опирается на использование прогнозирующих моделей, описывающих процессы изменения частоты водородных стандартов, составляющих техническую основу отечественных эталонов единиц ВиЧ. Процедура построения таких моделей по эмпирическим данным реализована в ряде пакетов прикладных программ, в частности в «ППП STATIS-TICA» [10]. Одним из основных недостатков упомянутой методики [11] является использование интерактивной процедуры идентификации структуры процессов авторегрес-сии-скользящего среднего по виду автокорреляционной и частной автокорреляционной функции, требующей участия квалифицированного специалиста в области анализа временных рядов, и не поддающейся полной формализации.

Альтернативный, предлагаемый в [12], подход к построению прогнозирующих моделей заключается в использовании метода простого перебора всех возможных структур моделей с последующей подгонкой параметров авторегрессии и скользящего среднего к рядам оценок yki процессов изменения частоты каждого из стандартов с номером i(i = 1,...,n), где n - число водородных генераторов (стандартов частоты), входящих в состав группового эталона;

к = 1,...,N - номер такта обработки данных; N - длина временного ряда. В работах [8, 9] показано, что для водородных генераторов, эксплуатируемых в настоящее время в подразделениях Государственной службы времени, частоты и определения параметров вращения Земли, порядки авторегрессии (АР) - р и скользящего среднего (СС) -д в моделях, описывающих процессы изменения частоты, не превышают трех и двух соответственно. Это обстоятельство позволяет реализовать метод простого перебора всех возможных структур прогнозирующих моделей (всего таких структур одиннадцать, начиная с р = 1, д = о и заканчивая р = з,д = 2). Однако применение метода простого перебора требует многократного решения оптимизационной задачи, что потребовало искать способы повышения эффективности применяемых методов оптимизации.

В работе [12] было показано, что задачу оптимизации при подгонке параметров прогнозирующих моделей можно рассматривать как задачу поиска безусловного экстремума функции нескольких переменных.

Следующим шагом в данном направлении является применение алгоритмов оптимизации, обладающих высокой скоростью сходимости.

Самой высокой сходимостью обладают алгоритмы метода Ньютона. Однако они требуют вычисления матрицы Гессе (матрицы вторых производных), что существенно снижает реальное их быстродействие. Из алгоритмов первого порядка, имеющих быстродействие, близкое к быстродействию метода Ньютона, и не требующих вычисления матрицы Гессе, предлагается использовать алгоритм, реализующий метод сопряженных градиентов [13, 14].

Применение метода сопряженных градиентов для подгонки параметров моделей

Предлагаемый для решения оптимизационных задач подгонки параметров моделей метод сопряженных градиентов подробно описан во многих источниках [13, 14]. Приведем краткое описание алгоритма построения прогнозирующих моделей методом перебора с использованием метода сопряженных градиентов. Поскольку модели строятся отдельно для каждого из временных рядов, описывающих процессы изменения частоты в водородных генераторах, индекс i (номер генератора) в дальнейшем изложении опущен.

Перебор производится по моделям авторегрессии-скользящего среднего (АРСС) (p, q) с порядком авторегрессии

p = 0 (1) 3 и скользящего среднего q = 0 (1) 2

(очевидно, модель (0, 0) не рассматривается). Для каждой модели производится подбор параметров по критерию минимальной остаточной дисперсии

S = f (ß ) =

N -,

Z (л - A (l))2

k=l

N - (p+ q)

,(1)

где ук (1) - прогноз значения временного

ряда, вычисленный на предыдущем такте, основанный на соответствующей модели АРСС:

У (1) = Рг • х,

где рт =\_ф1,ф2,...,фр,в1,в2,...,в9~\ - вектор

параметров модели АРСС /-го элемента (генератора);

вектор состояния прогнозируемого процесса для /-го элемента; р, в - коэффициенты АР и СС; а = у -ук(1) - ошибка к-го

прогноза.

Подбор параметров осуществляется методом сопряженных градиентов Флет-чера и Ривса для целевой функции (1) (р + д) переменных.

Начальный этап. Задаются а = 10-5 - для остановки алгоритма, начальная точка в=( 0,-.,0) и начальные значения: у1 = р1; ^ =-У/(рх); I = ] = 1 - после

этого начинается основной этап алгоритма.

Основной этап. Шаг 1. Проверяется базовый критерий останова, если ||У/ (в )|| <£, то остановится. Частные производные вычисляются числено, как отношение приращения функции к очень малому приращению соответствующего аргумента ( А0 = 10-7). В случае несоблюдения базового критерия останова вычисляется Л,- как оптимальное решение задачи минимизации функции / (у ] +М 3), при Л> 0,

У3+1 = у3 . Одномерная оптимизация,

ввиду неограниченности интервала неопределенности справа выполняется методом прямого перебора с переменным шагом (начальное значение шага равно 4).

Если 3 < п то переходим к шагу 2, в противном случае - к шагу 3.

Шаг 2. Задаем ^ = -V/(у7+1 ) + ар},

где

a] =■

IV/ ( y ]+i )

IV/ ( y ] )

- отношение квадра-

тов норм градиента на текущем и предыдущем шагах. Заменяем j на j+1 и переходим к шагу 1.

Шаг 3. Задаем

У1 = Р/+1 = Уп+Р 4 = -V/ (У1); 3=1;1=1+1-Производится проверка дополнительного критерия останова ||р/+1 - в| 10-7 (произошло ли изменение точки экстремума). Если дополнительный критерий останова не удовлетворен, переходим к шагу 1.

По завершении подбора параметров для каждой модели исследуемого временного ряда производится сортировка полученного спектра моделей по возрастанию остаточной дисперсии и их группировка по критерию Фишера.

2

2

Моделирование процесса автоматического построения моделей

Предлагаемый выше алгоритм был реализован на языке Python 3.6. При отработке формализованной методики построения прогнозирующих моделей широко использовались методы статистического моделирования. В частности, временной ряд y формировался путем пропускания белого шума ак с нулевым математическим

ожиданием и средним квадратическим отклонением &к через формирующий фильтр,

представляющий собой динамическую стохастическую модель (уравнение АРСС). Вполне естественным является желание сопоставить параметры прогнозирующей модели, построенной по имитируемым данным, с параметрами исходной модели. Такой подход может быть использован на стадии отработки методики и может являться первым шагом в процедуре контроля адекватности моделей. Этот подход был использован в процессе выполнения работы и показал в целом хорошие результаты.

С этой целью были сгенерированы временные ряды, соответствующие трем классам процессов:

- процесс скользящего среднего второго порядка (д = 2);

- процесс авторегрессии третьего порядка (р = 3);

- смешанный процесс авторегрес-сии-скользящего среднего (р = 1, д = 1).

Начальные значения временного ряда для моделей АРСС полагались равными 0,5. Начальные значения ошибок прогнозов й0 полагались равными нулю. Длина временных рядов - 1000 точек.

Процессы подгонки параметров АР и СС (коэффициенты ф1, ф2, ф3 и вх, в2 как функции от номера итерации у) приведены на рис. 1. Истинные значения коэффициентов, т.е. значения, при которых генерировались временные ряды, равнялись, соответственно: а) АРСС (0, 2) при в1 = о.3,02 =-0.1; Ь) АРСС (1, 1) при^= 0.5,3= 0 2; с) АРСС (3, 0) при ( = 0.5, ( = 0.3, ( = -0.2 .

Результаты экспериментов показывают, что за 2-4 такта находятся оптимальные значения параметров моделей,

abc

Рис. 1. Процесс подгонки параметров методом сопряженных градиентов: a - модель СС второго порядка; b - модель АРСС (1,1); c - модель АР третьего порядка Fig. 1. Process of parameter adjustment by the conjugate gradient method: a - moving average model of the second order MA(2); b - ARMA(1,1); c - autoregression model of the third order AR(3)

что согласуется с общепринятыми положениями о скорости сходимости метода сопряженных градиентов [13, 14].

При генерации временных рядов на основании моделей и последующего построения моделей способом перебора всех возможных структур в диапазоне р < 3, д < 2 были получены различные модели (по одиннадцать моделей для каждого временного ряда). Результаты работы программы автоматического построения моделей приведены в табл. 1, где указаны структура и параметры базовой модели, а также список прогнозирующих моделей с соответствующими показателями и оценками их параметров. Полученный спектр моделей, соответствующий каждой из базовых моделей, упорядочен по возрастанию значений остаточной дисперсии.

Как видно из табл. 1, параметры моделей, полученные методом простого перебора, со структурой, соответствующей структуре моделей, на основе которых генерировались временные ряды, практически совпадают. Например, полученная модель -модель СС второго порядка с коэффициентами [0.2973, -0.1332] - совпадает с исходной моделью СС [0.3, -0.1]. Необходимо все же иметь ввиду, что одному и тому же временному ряду могут соответствовать различные динамические стохастические модели. Особенно, если временные ряды являются реализациями смешанных процессов (т.е. процессов АРСС). Поэтому при моделировании процессов обработки данных можно столкнуться с ситуацией, когда вре-

менные ряды генерировались на основе одной модели (т.е. при одних значениях коэффициентов АРСС), а в процессе автоматического построения моделей получены оценки этих параметров, несколько отличающиеся от исходных. По существу, никакого противоречия в такой ситуации не существует, так как такие модели являются равнозначными с точки зрения их прогнозирующей способности (параметры этих моделей лежат на одной и той же линии уровня, т.е. имеют одну и ту же сумму квадратов ошибок прогнозов [11]). Попадание в ту или иную точку линий равного уровня зависит от выбора начальных значений вектора параметров (р0). В приведенных экспериментах

процесс начинался из нулевой точки, поскольку она относится к области допустимых значений, то есть удовлетворяет требованиям стационарности и обратимости моделей [11].

Таким образом, после формирования временного ряда на основе «базовой» модели, построении моделей и упорядочивании полученных моделей по критерию возрастания остаточной дисперсии оказывается, что наилучшей следует считать модель другой структуры. Как видно из результатов, приведенных в табл. 1, расхождение оценок остаточных дисперсий для различных моделей крайне незначительно. Использование Р-критерия Фишера показало, что различие ряда моделей АРСС в смысле прогнозирующей способности, характеризуемой остаточной дисперсией, статистически незначимо (гипотеза о равенстве дисперсий при уровне значимости 0.05 не отвергается).

Таблица 1

Результаты автоматического построения моделей

Table 1

Results of automatic modeling_

Класс моделей Оценки коэффициентов Оценки остаточной дисперсии F- расчетное F- критическое

ARMA(1,1 ), N = l000, y0 = 0.5, o = l, [ft = 0.5, в = 0.2]

(2, 2) [-0.3737, 0.5496, -0.6555, 0.2532] 0.9300 1.0000 1.1099

(3, 2) [-0.3013, 0.5848, -0.0262, -0.5844, 0.3120] 0.9309 1.0010 1.1099

(2, 0) [0.2803, 0.1152] 0.9325 1.0027 1.1099

(1, 1) [0.6075, 0.3253] 0.9328 1.0030 1.1099

(2, 1) [0.4308, 0.0671, 0.1524] 0.9333 1.0035 1.1099

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(1, 2) [0.5552, 0.2766, -0.0293] 0.9334 1.0036 1.1099

(3, 0) [0.2791, 0.1124, 0.0101] 0.9334 1.0036 1.1099

(3, 1) [0.6374, 0.0102, -0.0256, 0.3591] 0.9341 1.0045 1.1099

(0, 2) [-0.2759, -0.1592] 0.9407 1.0116 1.1099

(1, 0) [0.3168] 0.9441 1.0152 1.1098

(0, 1) [-0.2487] 0.9678 1.0406 1.1098

ARMA(3,0), N = l000, y = 0.5, o = l, [ft = 0.5, ft = 0.3, ft = -0.2]

(3, 0) [0.5150, 0.2939, -0.1456] 1.0034 1.0000 1.1099

(2, 2) [0.3048, 0.2398, -0.2085, -0.1667] 1.0042 1.0003 1.1099

(3, 1) [0.5860, 0.2597, -0.1617, 0.0725] 1.0048 1.0008 1.1099

(3, 2) [0.4222, 0.2271, -0.0557, -0.0911, -0.1206] 1.0052 1.0012 1.1099

(1, 2) [0.5979, 0.0802, -0.2425] 1.0065 1.0025 1.1099

(2, 1) [0.1265, 0.4522, -0.3723] 1.0109 1.0069 1.1099

(2, 0) [0.4824, 0.2237] 1.0247 1.0206 1.1098

(1, 1) [0.7648, 0.2318] 1.0432 1.0390 1.1098

(0, 2) [-0.4794, -0.4320] 1.0753 1.0711 1.1098

(1, 0) [0.6214] 1.0776 1.0733 1.1098

(0, 1) [-0.4035] 1.3368 1.3315 1.1098

ARMA(0,2), N = l000, y = 0.5, o = l, [в = 0.з,в2 =-0.l]

(3, 1) [-0.8726, -0.13496, 0.08286, -0.58046] 1.049 1.0000 1.1099

(3, 2) [-0.8196, -0.0750, 0.0973, -0.5271, 0.0439] 1.050 1.0010 1.1099

(3, 0) [-0.2971, 0.0359, 0.0767] 1.0507 1.0016 1.1099

(0, 2) [0.2973, -0.1332] 1.0515 1.0024 1.1099

(2, 2) [-0.1978, -0.1595, 0.0984, -0.2283] 1.0523 1.0031 1.1099

(1, 2) [0.0248, 0.3214, -0.1396] 1.0525 1.0034 1.1099

(1, 0) [-0.3000] 1.0550 1.0057 1.1098

(2, 1) [0.3959, 0.2351, 0.6883] 1.0554 1.0061 1.1099

(2, 0) [-0.2960, 0.0132] 1.0558 1.0065 1.1099

(1, 1) [-0.3263, -0.0288] 1.0559 1.0066 1.1099

(0, 1) [0.2633] 1.0675 1.0177 1.1098

Что подтверждает вывод: одному и тому же эмпирическому временному ряду может соответствовать группа математических моделей, эквивалентных с точки зрения их прогнозирующей способности. В случае если для некоторой группы моделей остаточные дисперсии отличаются незна-

Проверка адекватно

Заключительной процедурой при построении прогнозирующих моделей является диагностическая проверка адекватности. Практически все подходы, связанные с контролем адекватности прогнозирующих моделей, основаны на анализе временных рядов, представляющих собой ошибки прогнозов. При этом к рядам остаточных членов предъявляются следующие требования [10, 11, 16, 17]:

- ошибки прогнозов должны подчиняться нормальному закону распределения вероятностей с нулевым средним значением;

- остатки (ошибки прогнозов) должны быть не коррелированы.

Поскольку при метрологическом анализе данных предполагается, что погрешности измерений подчиняются нормальному распределению, первым шагом при обработке результатов измерений, в соответствии с рекомендациями существующих методик является проверка гипотезы о принадлежности случайной величины нормальному распределению.

Качественные методы проверки этой гипотезы основаны на сравнении статистической функции распределения с теоретической кривой. Для этой же цели применяются оценки моментов высших порядков:

- коэффициента асимметрии;

- коэффициента эксцесса;

- сравнивается логарифм статистической функции распределения с прямой линией.

Для проверки гипотезы о нормальности распределения существует достаточно много количественных тестов, наиболее часто используемыми из которых являются критерии: Пирсона, Колмогорова-Смирнова,

чимо, предпочтение отдается наиболее простой модели. К простейшим моделям относятся модели АР и СС, имеющие минимальный порядок, из которых предпочтительнее модели АР [15].

Исходя из вышеизложенного, для всех рядов можно использовать модель авторегрессии первого порядка.

полученных моделей

Лиллифорс, Шапиро-Уилка [10, 17].

Проверка адекватности полученных прогнозирующих моделей выполнялась с помощью ППП БТАПБПСД. На рис. 2 представлены автокорреляционная (АКФ) и частная автокорреляционная функция (ЧАКФ) исходного сгенерированного ряда из 1000 точек для модели скользящего среднего второго порядка с параметрами 3 = 0.3, 32=-0.1, средним квадратиче-

ским отклонением псевдослучайного шума, равным 1.

Как можно увидеть из визуального анализа автокореллограмм исходного ряда, процесс структурной идентификации во многом носит субъективный характер - как и вся методика Бокса-Дженкинса в целом, поскольку в приведенном примере структура может быть идентифицирована неоднозначно (можно предположить структуры с р = 1; д = 0, либо р = 0; д = 2).

Построение моделей АРСС для исследуемого ряда с помощью ППП 8ТАТ1Б-Т1СА и сравнение результатов с моделями, полученными с помощью программного модуля построения прогнозирующих моделей методом перебора, доказывает работоспособность предлагаемой методики. Полученные в результате регрессионного анализа в БТАТ^ТЮА параметры прогнозирующих моделей и оценки остаточных дисперсий абсолютно совпадают с соответствующими характеристиками, полученными в программном модуле, что подтверждает достоверность моделей, полученных с помощью разработанного модуля автоматического построения прогнозирующих моделей. Результаты построения моделей обоими методами приведены в табл. 2.

Autocorrelation Function (0,2)0.3-0.1 (Standard errors are white-noise estimates)

Partial Autocorrelation Function (0,2)0.3-0.1 (Standard errors assume AR order of k-1)

-,301 , +,102 r +,035 , -,062 , +,052 , —,07Û , +,065 , +,030 , -,005 , -,040 , -,046 , +,091 , —,053 , +,052 , ",044 ,

0316 101,

Ш ■

: J

:

i:

0315 не.

0314

—!

!l

:

0314

г

У

,000 ,000

bao Core- 3-Е'

1 r301 ,031«

2 ,012 ,031«

3 ,07« ,031«

4 ,036 ,031«

5 ,oie ,031«

6 r 052 ,031«

1 ,036 ,031«

a , 068 ,031«

s r 026 ,031«

10 ,060 ,031«

11 ,0S£ ,031«

12 ,071 ,0316

13 ,015 ,031«

14 r 035 ,031«

15 ,042 ,031«

1 с п

II 1 ■

1 G : п

и 1 ] [ f]

1

« о п

a b

Рис. 2. Выборочные АКФ и ЧАКФ процесса СС 2 порядка Fig. 2. Sample autocorrelation and partial autocorrelation functions of the MA (2) process

Таблица 2

Результаты регрессионного анализа в ППП STATISTICA

Table 2

Results of the regression analysis in STATISTICA_

Характеристика АРСС(0, 2) / АРСС(1, 0)

Результаты автоматического построения моделей

Полученные коэффициенты АР методом сопряженных - ф1 = -0.3000

градиентов

Полученные коэффициенты СС методом сопряженных градиентов 01 = 0.2973 02 = -0.1332 —

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оценка остаточной дисперсии для моделей, полученных 1.0515 1.0550

методом сопряженных градиентов

Результаты из ППП STATISTICA

Полученные коэффициенты АР - ф1 = -0.3

Полученные коэффициенты СС 01 = 0.2973 02 = -0.1332 —

Оценка остаточной дисперсии 1.0515 1.0550

Коэффициент асимметрии -0.0465 -0.0647

Коэффициент эксцесса -0.0173 -0.0077

Стандартная ошибка асимметрии 0.0773 0.0773

Стандартная ошибка эксцесса -0.1545 -0.1545

Значение р^а!ие, по критерию Шапиро-Уилка 0.9091 0.9091

Проверка гипотезы о нормальном распределении рядов ошибок прогнозов не отвергается ни по одному из выполненных в ППП БТАЛБТЮА тестов ни для моделей АРСС (1, 0), ни АРСС (0, 2). В частности, поскольку коэффициенты асимметрии и эксцесса в обоих случаях близки к нулю, а стандартные ошибки асимметрии и эксцесса не превышают более чем в три раза значения соответствующих показателей, то гипотеза о нормальном распределении остатков прогнозов не отвергается. По

форме гистограмм для рядов ошибок прогнозов, приведенных на рис. 3 видно, что они хорошо соответствуют нормальной теоретической кривой. Это заключение, основанное на визуальном анализе распределения, имеет и более строгое подтверждение в виде результатов теста Х2-квадрата, проверяющего нулевую гипотезу о том, что наблюдаемое распределение признака не отличается от теоретически ожидаемого нормального распределения. Поскольку вероятность справедливости этой гипотезы в

обоих случаях оказалась больше 0.05, принимаем, что они действительно верные. Что подтверждается и результатами теста Колмогорова-Смирнова и Шапиро-Уилка (р>0.05).

Приведенные на рис. 4 АКФ рядов ошибок прогнозов моделей АРСС (1, 0) и АРСС (0, 2) подтверждают некоррелированность значений рядов в обоих случаях. Проверка гипотез об адекватности полученных моделей может быть выполнена и с помощью совокупного критерия согласия [11], позволяющего оценить адекватность модели по К первым автокорреляциям г (а)

процесса АРСС(р, д), рассматриваемым как единое целое. Если подгоняемая модель

к

удовлетворительна, то Q = N ^ г2 (а) распределено приближенно как %2 (К - р - д),

где К = N/3, N - длина временного ряда. В ППП БТАТ^ТЮА были получены значения для первых 30 автокорреляций г (а) остаточных ошибок для процессов АРСС(0, 2) и АРСС(1, 0), подгонявшихся к исходному ряду АРСС (0, 2). Сравнение полученных значений совокупного критерия согласия со

значениями х с 29 и 28 степенями свободы, соответственно, при уровне значимости 0.05, показывает, что нет оснований для сомнения в адекватности обеих моделей (40.493<42.557 и 40.493<41.337).

Аналогичным образом проверялись все исходные модели, в том числе и результаты построения прогнозирующих моделей которых приведены в табл. 1. В каждом из случаев параметры моделей (значения коэффициентов АР и СС, значения остаточной дисперсии), полученные с помощью

variable: RcíOJOüO.:. Distribution: Normal Kolmogorov-Smlmov d - 0,01035, ChhSqtiare test = 4.43310. df = 9 (adjusted), p = 0,88067

-4.5 -4,0 -3,5-3.0 -2,5 -2,0 -1,5 -1,0 -0.5 0,0 0,5 1,0 1,5 2,0 2,5 3.0 3,5 4,0 4,5

Category (upper limits) Q

Variable: R«I.0000.2, Distribution: Normal Kolmogorov-Smimav d = 0,00797, Chi-square test = 4.97709. di = 9 (adjusted), p - 0.83630

ilk

> : Q.39W. у » 104.66® ^Ê Ûtjcct Srqutniiil

•3.5 -3.0 -2.5 -2,0 -1,5 -1.0 -0,5 0.0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4.0 4,5 Category {upper limits)

Рис. 3. Гистограммы остатков для моделей: a - АРСС(0, 2); b - АРСС(1, 0) Fig. 3. Histograms of remainders for models: a - ARMA(0, 2); b - ARMA(1, 0)

Corr. 003

034

055 046 019 045 065

056 010 oes

03B 077 016 031 033

001 ООО

035 008 063 022 01B 029 007

019 04Б 006

020 009

002

Autocorrelation Function (0,2)0.3-0.1: ARIMA (1,0,0) residuals; (Standard errors are white-noise estimates)

0316 0316

0315 0315 0315 0315 ■ --

0315 0315 0314 0314 0314 I :

0314 0314 0314 0314 ■i

0313 0313 0313 0313 0313 0312 — z

0312 0312 0312 0312 0312

0311 0311 0311 0 -1 0 -0 5 0 0 0 5 1

6, 34 6, 69 3,77 13, 06 16,20

16.29

20, 50

21, 97 27, 93 28,19 29,17 30,26 30,26 30,26 31,49 31,55 35,59 36, 09 36, 43

37.30 37,34 37,70 40, 11 40, 15 40,57 40, 65 40, 65

,9254 ,5549 ,2373 ,1755 ,2449 ,1368 ,0708 ,0397 ,0610 ,0249 ,0246 ,0057 ,0085 ,0099 ,0111 ,0167 ,0246 ,0253 ,0351 ,0172 ,0214 ,0273 ,0303 ,0405 ,0496 ,0381 ,0498 ,0589 ,0740 ,0930

b

b

a

Рис. 4. АКФ рядов остатков для моделей: a - АРСС(0, 2); b - АРСС(1, 0) Fig. 4. Autocorrelation functions of remainder series for the models: a - ARMA(0, 2); b - ARMA(1, 0)

программного модуля построения моделей, совпадают с параметрами аналогичных моделей, построенных в ППП БТАТ^ТЮА. Кроме того, во всех приведенных случаях

ряды ошибок прогнозов подчиняются нормальному закону распределения и не корре-лированы, что подтверждает адекватность полученных моделей.

Заключение

В статье рассматривается формализованная методика построения прогнозирующих моделей процессов изменения частоты водородных стандартов, исключающая интерактивные процедуры, требующие участия высококвалифицированных специалистов в области анализа временных рядов. Предложенная методика построения прогнозирующих моделей основана на методе перебора всех возможных структур моделей АРСС. Учитывая невысокие максимальные значения порядков АР и СС, всего возможно 11 различных структур, для которых требуется решение оптимизационных задач, связанных с поиском экстремумов функции многих переменных.

Для решения оптимизационных задач предлагается использовать метод сопряженных градиентов, обладающий высоким быстродействием из градиентных методов первого порядка. Процедура подгонки параметров моделей АРСС основана на минимизации остаточной дисперсии. Результаты моделирования показали, что вектор параметров моделей находится методом

1. Panfilo G., Harmegnies A., Tisserand L.A new prediction algorithm for the generation of International Atomic Time // Metrologia. 2012. Vol. 49. P. 49-56. DOI: 10.1088/0026-1394/49/1/008

2. Percival D.B., Senior K.L. A wavelet-based multiscale ensemble time-scale algorithm // Conference: IEEE Transactions on Ultrasonics, Ferroelectrics, and Frequency. 2012. V. 59. No. 3. P. 510-522.

3. Подогова С.Д., Мишагин К.Г., Медведев С.Ю., Блинов И.Ю. Алгоритм групповой шкалы времени с использованием скользящего среднего на нескольких временных масштабах // Измерительная техника. 2015. № 5. С. 40-44. DOI: 10.1007/s11018-015-0749-4

4. Levine J. The statistical modeling of atomic clocks and the design of timescales // Review of scientific instruments. 2012. Vol. 83, 021101. P. 1-28. DOI: 10.1063/1.36814

5. Greenhall C.A. Reduced Kalman filters for clock ensembles // Conference: IEEE International Frequency Control Symposium. 2011. P. 1-5.

сопряженных градиентов за несколько итераций, что полностью согласуется с теоретическими положениями о скорости сходимости метода сопряженных градиентов. Модели, полученные в результате работы разработанного программного обеспечения, совпадают с моделями, полученными с помощью ППП STATISTICA, что подтверждает работоспособность разработанного По.

В результате выполненных работ имеются все основания полагать, что разработанный программный модуль может служить основой для создания типового программного обеспечения подсистемы внутренних сличений эталонов ВиЧ с целью введения последующего в режим опытной эксплуатации.

Предлагаемая авторами формализованная методика обработки измерительной информации, получаемой в процессе функционирования эталонов ВиЧ, позволяет решить проблему повышения точностных характеристик эталонов ВиЧ за счет полной автоматизации процесса построения моделей временных рядов по эмпирическим данным.

кий список

6. Рощин Д.А. Модернизация программно-математического обеспечения эталонного комплекса частоты и времени // Прикладная информатика. 2015. Т. 10. № 6 (60). С. 60-69.

7. Suess M., Greenhall C.A. Combined covariance reductions for Kalman filter composite clocks // Metrologia. 2012. Vol. 49. P. 588-596.

8. Хрусталев Ю.П. Статическая и динамическая обработка данных, получаемых в процессе ведения эталонов времени частоты // Измерительная техника. 2004. № 6. С. 20-23. DOI: 10.1023/B:METE.0000039759.46192.16

9. Хрусталев Ю.П., Акулов В.М., Ипполитов А.А., Ку-рышева Л.Н. Обработка данных, полученных по результатам взаимных измерений вторичного эталона времени и частоты // Вестник ИрГТУ. 2012. № 7 (66). C. 22-28.

10. Боровиков В.П. Популярное введение в совре-

менный анализ данных в системе STATISTICA. M.: Горячая линия-Телеком, 2015. 288 с.

11. Бокс Дж., Дженкинс Г. Анализ временных рядов, прогноз и управление; в 2 кн. / пер. с англ.; под ред. В.Ф. Писаренко. М.: Мир, 1974. Кн. 1. 406 с.

12. Хрусталев Ю.П., Серышева И.А. Автоматизация процесса построения динамических стохастических моделей // Вестник ИрГТУ. 2017. № 9 (119). С. 95103. http://dx.doi.org: 10.21285/1814-3520-2017-9-95103

13. Базара М., Шетти К. Нелинейное программирова-

ние. Теория и алгоритмы / пер. с англ. М.: Мир, 1982. 583 с.

14. Моисеев Н.Н., Иванилов Ю.П., Столярова Е.М. Методы оптимизации. М.: Наука, 1978. 352 с.

15. Эйкхофф П. Основы идентификации систем управления. Оценивание параметров и состояния. М.: Мир, 1975. 680 с.

16. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Вильямс, 2016. 912 c.

17. Wilcox R.R. Introduction to Robust Estimation and Hypothesis Testing. Amsterdam: Elsevier, 2012. 690 p.

References

1. Panfilo G., Harmegnies A., Tisserand L.A new prediction algorithm for the generation of International Atomic Time. Metrologia, 2012, vol. 49, рр. 49-56. DOI:10.1088/0026-1394/49/1/008

2. Percival D.B., Senior K.L. A wavelet-based multiscale ensemble time-scale algorithm. Conference: IEEE Transactions on Ultrasonics, Ferroelectrics, and Frequency, 2012, vol. 59, no. 3, рр. 510-522.

3. Podogova S.D., Mishagin K.G., Medvedev S.Yu., Bli-nov I.Yu. An algorithm for a group time scale using a moving average over multiple time scales. Izmeritel'naya tehnika [Measurements Techniques], 2015, no. 5, рр. 40-44. DOI: 10.1007/s11018-015-0749-4. (In Russian).

4. Levine J. The statistical modeling of atomic clocks and the design of timescales. Review of scientific instruments, 2012, vol. 83, 021101, рр. 1-28. DOI: 10.1063/1.36814

5. Greenhall C.A. Reduced Kalman filters for clock ensembles. Conference: IEEE International Frequency Control Symposium, 2011, рр. 1-5.

6. Roshchin D.A. Software modernization of the standards complex of time and frequency. Prikladnaya in-formatika [Applied Informatics], 2015, vol. 10, no. 6 (60), рр. 60-69. (In Russian).

7. Suess M., Greenhall C.A. Combined covariance reductions for Kalman filter composite clocks. Metrologia, 2012, vol. 49, рр. 588-596.

8. Hrustalev Yu.P. Statistical and dynamic processing of data obtained when handling time and frequency standards. Izmeritel'naya tehnika [Measurement Techniques], 2004, no. 6, рр. 20-23. DOI: 10.1023/B:METE.0000039759.46192.16. (In Russian).

9. Hrustalev Yu.P., Akulov V.M., Ippolitov A.A., Kurysheva L.N. Processing data obtained as a result of reciprocal measuring of secondary standard of time and

Критерии авторства

Серышева И.А., Чекан М.А., Бархатова Л.В., Крупе-нев Е.А. заявляют о равном участии в получении и оформлении научных результатов и в равной мере несут ответственность за плагиат.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

frequency. Vestnik Irkutskogo gosudarstvennogo tehnicheskogo universiteta [Proceedings of Irkutsk State Technical University], 2012, no. 7 (66), рр. 22-28. (In Russian).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Borovikov V.P. Populyarnoe vvedenie vsovremennyj analiz dannyh v sisteme STATISTICA [Popular introduction to modern data analysis in the STATISTICA system]. Moscow: Goryachaya liniya-Telekom Publ., 2015, 288 р. (In Russian).

11. Boks Dzh., Dzhenkins G. Analysis of time series, forecast and control. 1974. 406 р. (Russ. ed.: Analiz vremennyh ryadov, prognoz i upravlenie. Moscow: Mir Publ., 1974, 406 р.).

12. Hrustalev Yu.P., Serysheva I.A. Automation of dynamic stochastic model creation process. Vestnik Ir-kutskogo gosudarstvennogo tehnicheskogo universiteta [Proceedings of Irkutsk State Technical University], 2017, no. 9 (119), рр. 95-103. http://dx.doi.org: 10.21285/1814-3520-2017-9-95-103. (In Russian).

13. Bazara M., Shetti K. Nonlinear Programming. Theory and algorithms, 1982. 583 р. (Russ. ed.: Nelinejnoe pro-grammirovanie. Teoriya i algoritmy. Moscow: Mir Publ., 1982, 583 р.).

14. Moiseev N.N., Ivanilov Yu.P., Stolyarova E.M. Metody optimizacii [Optimization methods]. Moscow: Nauka Publ., 1978, 352 р. (In Russian).

15. Ejkhoff P. Osnovy identifikacii sistem upravleniya. Ocenivanie parametrov i sostoyaniya [Fundamentals of control system identification. Parameter and status evaluation]. Moscow: Mir Publ., 1975, 680 р. (In Russian).

16. Drejper N., Smit G. Prikladnoj regressionnyj analiz [Applied regression analysis]. Moscow: Vil'yams Publ., 2016, 912 c. (In Russian).

17. Wilcox R.R. Introduction to Robust Estimation and Hypothesis Testing. Amsterdam: Elsevier, 2012. 690 p.

Authorship criteria

Serysheva I.A., Chekan M.A., Barkhatova L.V., Krupe-nev E.A. declare equal participation in obtaining and formalization of scientific results and bear equal responsibility for plagiarism.

Conflict of interests

The authors declare that there is no conflict of interests regarding the publication of this article.

i Надоели баннеры? Вы всегда можете отключить рекламу.