Научная статья на тему 'О дисперсиях статистик критерия round-trip фостера-стюарта'

О дисперсиях статистик критерия round-trip фостера-стюарта Текст научной статьи по специальности «Математика»

CC BY
393
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННОЙ РЯД / СЛУЧАЙНОСТЬ / ТРЕНД / НИЖНИЙ РЕКОРД / ВЕРХНИЙ РЕКОРД / ПОРЯДКОВАЯ СТАТИСТИКА / БЕТА-ФУНКЦИЯ / ПОСТОЯННАЯ ЭЙЛЕРА / ПОПРАВКА НА НЕПРЕРЫВНОСТЬ / TIME SERIES / RANDOMNESS / TREND / LOWER RECORD / UPPER RECORD / ORDER STATISTICS / BETA FUNCTION / EULER'S CONSTANT / THE AMENDMENT CONTINUITY

Аннотация научной статьи по математике, автор научной работы — Чепурко Валерий Анатольевич

При анализе временных рядов на предмет наличия трендов часто применяется критерий Фостера-Стюарта. Критерий основан на подсчете числа нижних и верхних рекордов временного ряда x1,...,xn. В отличие от других тестов случайности, тесты, основанные на рекордах, не инвариантны относительно изменения направления переменной времени на противоположное. Для построения инвариантных тестов round-trip необходимо подсчитывать рекорды в прямом и обратном направлениях переменной времени. До сих пор построение таких тестов было невозможным, поскольку была неизвестна дисперсия статистик критерия при верной нулевой гипотезе случайности. В статье найдены дисперсии статистик D и S критерия round-trip Фостера-Стюарта, предназначенного для обнаружения как положительного, так и отрицательного тренда в средних и дисперсиях временного ряда x1,...,xn. Для дисперсий получены асимптотические приближения. Это позволило построить полноценный инвариантный тест для двусторонних альтернатив. Разобран пример применения критерия round-trip Фостера-Стюарта. Библиогр. 8 назв. Табл. 3.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DISPERSION OF THE TEST STATISTIC OF CRITERIA ROUND-TRIP FOSTER-STUART

The criterion Foster-Stuart in the analysis of time series to determine trends is often used. The criterion is based on the calculation of the lower and upper time series records x1,...,xn. Unlike other tests of randomness, tests based on records are not invariant under a reversal of the direction of the time variable. To construct invariant round-trip tests is necessary to count the records in both forward and backward time variable. Thus far the construction of such test was impossible. When the hypothesis is true the variances of test statistics were not known. Foster-Stewart round-trip criteria D and S dispersion statistics has been found in this article. This criteria was designed for x1,...,xn time series mean and dispersion positive and negative trend receiving. Assuming H0 randomness -hypothesis criteria variances statistics S and D was found. Asymptotic approximations was obtained for dispersions. This is possible to construct an invariant test for two-sided alternatives. Foster-Stewart round-trip criteria application example is reviewed. Refs 8. Tables 3.

Текст научной работы на тему «О дисперсиях статистик критерия round-trip фостера-стюарта»

УДК 519.234

Вестник СПбГУ. Сер. 1. Т. 3(61). 2016. Вып. 2

О ДИСПЕРСИЯХ СТАТИСТИК

КРИТЕРИЯ ROUND-TRIP ФОСТЕРА—СТЮАРТА

В. А. Чепурко

Обнинский институт атомной энергетики (ИАТЭ)

Национального исследовательского ядерного университета «МИФИ» (НИЯУ МИФИ), Российская Федерация, 249040, Калужская обл., Обнинск, Студгородок, 1

При анализе временных рядов на предмет наличия трендов часто применяется критерий Фостера—Стюарта. Критерий основан на подсчете числа нижних и верхних рекордов временного ряда xi, ...,xn. В отличие от других тестов случайности, тесты, основанные на рекордах, не инвариантны относительно изменения направления переменной времени на противоположное. Для построения инвариантных тестов round-trip необходимо подсчитывать рекорды в прямом и обратном направлениях переменной времени. До сих пор построение таких тестов было невозможным, поскольку была неизвестна дисперсия статистик критерия при верной нулевой гипотезе случайности. В статье найдены дисперсии статистик D и S критерия round-trip Фостера—Стюарта, предназначенного для обнаружения как положительного, так и отрицательного тренда в средних и дисперсиях временного ряда xi,...,xn. Для дисперсий получены асимптотические приближения. Это позволило построить полноценный инвариантный тест для двусторонних альтернатив. Разобран пример применения критерия round-trip Фостера— Стюарта. Библиогр. 8 назв. Табл. 3.

Ключевые слова: временной ряд, случайность, тренд, нижний рекорд, верхний рекорд, порядковая статистика, бета-функция, постоянная Эйлера, поправка на непрерывность.

Введение. В данной статье найдены дисперсии статистик критерия round-trip Фостера—Стюарта [1], предназначенного для проверки наличия линейного тренда в математических ожиданиях (средних) или дисперсиях временного ряда xi, Х2,..., xn. Под нулевой гипотезой будем понимать утверждение

Ho : Fx(t) = F (ti) ...F(tn), x = (xi ,...,xn), t = (ti,...,tn), (1)

где F(t) —некоторая функция распределения. Такую гипотезу называют гипотезой случайности. Таким образом, при Ho рассматриваются независимые и одинаково распределенные случайные величины (с.в.) xi,x2,...,xn с функцией распределения F(t).

Рассмотрим следующий класс альтернатив. Пусть F(x) —непрерывная функция распределения с.в. с нулевым средним и единичной дисперсией. Предположим, что F j (<Xj > 0) — функция распределения с.в. Xi, i = 1, п. В этом случае их среднее

и дисперсия будут равны соответственно Exi = mi, Varxi = а2. Введем следующие параметры тренда:

n n

Am = J^sgn (mi - m-i), Aa = J^sgn (а2 - а2_ J , (2)

i=2 i=2

Г 1,x> 0,

где sgn(x) = < 0,x = 0, [ -1,x < 0.

© Санкт-Петербургский государственный университет, 2016 DOI: 10.21638/11701/spbu01.2016.209 253

Альтернативы о тренде в математических ожиданиях могут быть следующими:

:Дт = n - 1, H— :Дт = -(n - 1), Hm : |Дт| = n - 1. (3)

Монотонный тренд в дисперсиях постулируется альтернативами вида

H^ :Дст = n - 1, H— :Да = -(n - 1), Ha : Д| = n - 1. (4)

Из двухпараметрических альтернатив рассмотрим альтернативу о наличии тренда хотя бы в одном из параметров. Выглядит она следующим образом:

Hm^ : |Дт| = n - 1 ЧД| = n - 1. (5)

Статистики классического критерия Фостера—Стюарта [2] представляют собой следующие суммы:

n n

s = ^2 si, d =^2 di, где Si = щ + li, di = щ - li, (6)

i=2 i=2

щ = I {xi > Xi-i,... ,xi} , k = I {xH < Xi-i,..., xi} Vi = 2, n, (7)

при этом I {A} — индикатор события A.

Статистики s и d предназначены для обнаружения тренда в дисперсиях и средних соответственно. Критерий Фостера—Стюарта еще называют критерием, основанным на «рекордных значениях». «Наблюдение будем называть верхним (нижним) рекордным значением (рекордом) в том случае, когда оно больше (меньше) всех предыдущих наблюдений этого ряда. Число рекордов, появляющихся в процессе наблюдения значений временного ряда, дает нам статистику, которую можно сравнивать с соответствующей характеристикой случайного ряда» [3].

Необходимо отметить, что математической теории рекордов уже более шестидесяти лет. Первой серьезной работой на эту тему, по существу, была работа [4], в которой, в частности, табулированы процентные точки рекордных значений для некоторых распределений. Затем последовало достаточно бурное развитие этой теории, появилось немало публикаций на эту тему, обнаружилась тесная связь теории рекордов с теорией порядковых статистик. В отечественной литературе необходимо отметить работу [5], в которой, по сути, впервые приведено сравнительно подробное описание имевшихся на тот момент времени результатов (без доказательств) по теории рекордов с обширным библиографическим списком. В 2000 г. появилась монография [6]. Она содержит не просто обзор имеющихся публикаций, в том числе и авторских, а фактически курс из тридцати лекций по математической теории рекордов.

В современной статистике рекорды и связанные с ними величины определяются с помощью рекуррентных соотношений [5]. Пусть x\,...,xn —последовательность с.в. Определим последовательности {L(k), k = 1,... } и {X(k), k = 1,... } следующим образом:

L(1) = 1, L(k +1) = min{ j : j e{1,...,n}, xj > xL{k)} , (8)

X (k)= xL(k), k = 1,.... (9)

С.в. L(k), X(k) называются, соответственно, верхними рекордными моментами и верхними рекордными величинами. Если знак неравенства в (8) заменить на <,

получим нижние рекордные моменты и величины. С.в. L(k) и X(k) определяются ре-куррентно до тех пор, пока множество {j : xj > xL(k)} не окажется пустым. Подобное же ограничение действует и для нижних рекордных моментов.

Пусть m — число элементов последовательности {L(k), k = 1,... }. Очевидно, что m € {1, 2,... ,n} и u = m - 1. Соответственно определяется и число нижних рекордов. Основные научные достижения в математической теории рекордов связаны с нахождением различных вероятностных свойств рекордных моментов и величин (см. [5, 6]).

Критерий, построенный только на статистиках s и d, сконструирован для обнаружения положительных трендов как в средних, так и в дисперсиях. В оригинальной работе [1] приведены обе таблицы (для d и s) для правосторонних критических значений. Авторы [1] пишут, что, в отличие от остальных критериев случайности, тесты, основанные на рекордах, не инвариантны относительно изменения направления переменной времени. Для различения двусторонних альтернатив предлагается применять тесты round-trip (вперед-назад), полученные путем подсчета рекордов в прямом и обратном направлениях временного ряда. «Теория распределения этих статистик не так проста, как в одностороннем случае. Однако статистики будут также распределены асимптотически нормально...» [1]. При этом в той же работе отмечается, что такой подсчет рекордов в прямом и обратном направлениях заметно увеличивает мощность критерия.

«При вычислении статистики d мы наблюдаем члены последовательности в серии из n наблюдений, начиная с первого. Мы могли бы вычислить подобную статистику, если бы мы изменили порядок членов, т. е. если бы мы начали наблюдать последовательность с последнего члена. Понятно, что число рекордов в одном направлении не обязательно определяет число рекордов в другом. Обозначим через s' и d' статистики, полученные путем подсчета в обратном направлении...» [1]. Таким образом, в качестве статистики критерия проверки гипотезы Ho против альтернативы Hm мы можем использовать статистику

D = d - d'.

Для статистики критерия проверки гипотезы Ho против Ha будем использовать статистику

S = s - s'.

Авторы [1] показали, что распределение этих статистик при верной Ho симметрично относительно нуля. С помощью двумерной кумулянтной функции в четвертом параграфе работы [1] доказывается асимптотическая нормальность и независимость статистик s и d. В седьмом и восьмом параграфах исследуется состоятельность теста проверки гипотезы случайности против альтернативы тренда в среднем и его мощность.

Методом статистических испытаний при некоторых n Фостер и Стюарт рассчитали дисперсию статистики D. Таким образом, они предлагают использовать тесты round-trip, статистики которых подсчитывают рекорды в обоих направлениях переменной времени, как наиболее мощные критерии, основанные на рекордах. Однако при этом встает вопрос применимости таких тестов, поскольку таблицы стандартных отклонений статистики D приведены только для некоторых объемов выборки n, а для статистики S вообще отсутствуют.

В настоящей статье получены аналитические выражения для дисперсии не только статистики D, но и статистики S, позволяющие полноценно использовать критерии round-trip обнаружения тренда как в средних, так и в дисперсиях.

Свойства статистик Фостера—Стюарта. Найдем дисперсии статистик D и S при условии верной нулевой гипотезы. Вначале еще раз определим эти статистики.

Определение 1. Статистиками критерия round-trip Фостера—Стюарта являются статистики S и D:

nn

S = s - s' = YJ(si - si), D = d - d' = Y,(di - d'i), (10)

i=i i=i

где Sj = Uj + lj, sj = uj + lj, dj = Uj - lj, dj = uj - lj, (11)

щ = I {th > Xi-i,... ,xi} , k = I {xH < Xi-i,..., xi} Vi = 2, n, (12)

и* = I [х* >Хг+1,...,Хп} , ¡* = I [х* < Хг+1,...,Хп} Уг = 1, (п - 1). (13) При этом и1 = ¡1 = и'п = ¡'п = 0.

Как указано выше, статистики Б и Б предназначены для обнаружения тренда в дисперсиях и средних соответственно.

Приведем без доказательства некоторые очевидные свойства вновь введенных статистик, основная часть которых получена в работе [1].

Свойство 1. Если г = ], каждая из пар с.в. [щ,щ}, {и'*,и]}, [¡г,^}, {¡'*, [и*,1]}, С является парой независимых с.в. Если г < ], каждая из пар с.в. {щ,и]}, {и,1,1]}, {¡I,и]}, {¡¿,¡¿1 является парой независимых с.в.

Свойство 2. Распределения следующих статистик при верной Н0 будут одинаковы и асимптотически нормальны:

и = 1, и = ?; (14)

п п п п

Е (и* + ¡¿) = Е (и* + ¡'*) ^ Е (и* - ¡г) = Е (и - ¡'г) . (15)

¿=1 г=1 г=1 г=1

Приступим к нахождению дисперсий УагБ и УагБ. Так как, по предположению, Г(х) непрерывна, вероятность того, что х* = Х] при г = ] равна 0.

Несложно определяются моменты к-х порядков с.в. и*, ¡¿, и'*, ¡*, необходимые для расчета числовых характеристик статистик Б и Б:

Ем\ = Е 1\ = у, %= Тп] Еи\ = Е1к = 0, ке Ы; (16)

Щь')к = Е(Ой = —г=1,(п-1); Е(и'п)к = Е(1'п)к = 0, к € N. (17) п +1 — г

Наибольшую трудность вызывает нахождение смешанных моментов второго порядка. При этом некоторые из них находятся достаточно несложно.

Вначале найдем средние произведения произвольных пар статистик в случае совпадающих индексов.

Е щЬ = Е иЩ = 0, г = 1~п; (18)

Е Щ1[ = Е Щи[ = ЕУ • = = 0, г = (19)

Р (х1; . 1 < < х1+1 Хп)

Е/гиг Р (х1; . .. хг-1 > хг > х1+1 ; ... хп

(г - 1 )!(п-г)! п!

(г - 1)!(п — г)! п! 1

, г = 2, (п - 1); (20)

, г = 2, (п - 1); (21)

Еу. = Р(хг < жь ... ,Хг-!,Хг+1,... ,хп) = -, г = 2, (гг — 1); (22)

п

Еигиг Р (хг > х1;... 1, х1+1, . хп

г = 2, (п - 1).

(23)

Из свойства 1 следует, что моменты Еиг/у, Е/'и3 при ] = г и моменты Ещ/3, ЕщЩ, Е/г/3, Е/ги'^ при ]> г будут равны произведению соответствующих математических ожиданий.

Рассмотрим наиболее сложный и интересный случай: ] < г, когда при подсчете числа рекордов щ и /3 (или и и /у) участвуют одни и те же наблюдения. Математическое ожидание произведения щ и /3 равно

Ещ/3 = Р(Аг,з ),

где = (ху < Ху+1,.. .,Хп} П {хг > хл,.. .,х—1}.

Для временного ряда х1,...,хп построим соответствующий вариационный ряд:

х(1) < х(2) < ••• < х(п).

Введем события

Вр

Очевидно, что Аг з П Вр

{хд = х(р)} ; рл е{1,...,п}.

= 0 при р > ^, П Вгч = 0 при д < г. Тогда получим

Р(Аг,у) = ЕЕР (А,3Вр,уВ^) =

р=1 ч=г

3 п

= ЕЕ Р ({ху = х(р) < ху+1, .. .,хп} П (хг = х(ч) >х1,.. .,х—1}) .

р=1 ч=г

Для расчета суммируемых вероятностей (при верной Но) проведем некоторые вспомогательные рассуждения. Будем случайным образом размещать на п свободных позициях числа последовательности х1,...,хп. При этом ]-е и г-е места займем элементами хр и х(ч) соответственно. Свободные места будем занимать оставшимися п — 2 элементами последовательности, подсчитывая число благоприятных исходов.

Каждый элемент подпоследовательности, окруженной квадратными скобками, должен быть меньше х(ч), а каждый элемент подпоследовательности, окруженной круглыми скобками, должен быть больше х(р):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

, х(р) < 3-1 з

(

\з+1

г-1

< х,

(ч),

г+1

1

п

Числа слева от хр назовем левыми, а справа от х(ч) — правыми.

Только среди «левых» чисел могут оказаться числа х, удовлетворяющие условию X X(р) • Таких чисел будет р — 1. Число способов расположения их на з — 1 месте будет определяться числом размещений

Только среди «правых» чисел могут оказаться числа х, удовлетворяющие условию х > х(д) и их будет п — д. Число вариантов их расположения равно АТП_1.

Остается п — (р — 1) — (п — д) — 2 = д — р — 1 чисел и столько же мест. Расставляем эти числа А^_р_\ = (д — р — 1)! способами.

После определения вероятностей по классической схеме получаем необходимый смешанный момент второго порядка

^^А^АГЛд-р-!)! ...

Е = --, 3<Ь г = 2, п. (24)

р=1 д=г

Рассуждая аналогично, определяем тот же результат для другой разновидности ненулевых смешанных моментов второго порядка:

О п АР-}Ап~<1(а _„ _ 1)1

= з-1 р-±, з<г, г = ~2~п. (25)

р=1 д=г

В силу несовместности событий следующие математические ожидания в случае г > з будут нулевыми:

ЕпцпЗ = ЕЦ = 0, (26)

где г = 2,п, з = 1, (г - 1).

После подстановки найденных моментов в выражения для дисперсий, несложных операций с суммами и применения свойств биномиальных коэффициентов, определяем дисперсии статистик Б и Б при верной нулевой гипотезе (1). При этом математические ожидания ЕБ, ЕБ равны нулю. Кроме этого, еоу(Б,Б) = 0 (см. [1]).

Теорема 1. При верной нулевой гипотезе случайности (1) статистики Б и Б центрированы, некоррелированы, а их дисперсии определяются следующими выражениями:

Уаг5< = 4]ГА-12]Г4+8]ГА ]Г ± - 4 ]Г п + 1 - г), (27)

1=1 1=1 1=1 ^=п+1_1 1=1

п п п

УагБ = + ''—— В(г, п + 1 - г), (28)

г ^ г2 Л г

-1 г=1 г=1

1

где В(х,у) = / Ьх_1(1 — 1)У_1А — бета-функция.

о

Асимптотика дисперсий статистик Фостера—Стюарта. Для упрощения практических расчетов полученных дисперсий определим их асимптотическое поведение, оценив вклад каждого из слагаемых.

Первое слагаемое в дисперсиях (27), (28) с точностью до умножения на константу будет определяться суммой

п 1 / 1 \

У-=7 + 1пп + 0 - , (29)

гп

г=1 4 у

где 7 = lim (l + i + • • • + -— In m) = 0.57721... — постоянная Эйлера. Второе сла-

т^ж 2 т '

гаемое (с той же точностью) определяется суммой элементов сходящегося ряда

±hT+°(ii- <30>

i=1 4

В третьем слагаемом дисперсии (27) содержится двойная сумма

п п п п n

' 1 ' 1 /"1 /"1 /"1 Е- Е J~j~ J - = y-(Inn-In(n+l-x))dr.

Последний интеграл не выражается через конечную комбинацию элементарных функций (см. [7, стр.219, формула 2.728.2]). Там же предлагается воспользоваться разложением логарифма в ряд Тейлора:

п

In--— In [ 1--- ] ] dx = In n In ■

J x \ n +1 \ n + 1)) n + 1

1

к

ж Г <-1)к+1 ( x \к n ж 1 пк _ 1

> /------dx = Innin--1-> -гг-

^J kx V n +1/ n +1 ^ k2 (n + 1)k

к=И v 7 k=1 v '

Предел последней суммы (n ^ ж) будет определяться дзета-функцией Римана [7]:

V^ 1 пк -I 7Г2

Lfc2f„ , 1U = 2) = -7Г-

Получаем оценку

п^ж k2 (n + 1) k=1 V '

t\ t ™

i=1 j=n+1-iJ 4 7

Осталось оценить последние слагаемые в (27) и (28).

Еп i — 1 г.,- -ч 1 (i — 1)!(n — i)!(i — 1) 1 v^,. ...

-—n + 1 - г) = - E "-—-¿ < -г £(» " !)!(" " *)! =

i n! i n!

i=1 i=1

ж oo

iE//еГх-ух}-хуп-\1хл}у

n!

i=1

x = tv y = v

1 — tn

-dt.

0 0 0

(1 —1)(1 +1)^1

Обозначим последний интеграл 1п. Разбивая интеграл на сумму двух интегралов по отрезкам [0,1], [1, то] и делая в последнем интеграле последовательно замену переменных Ь = х, х = получим равенство

сю 1

Г 1 — ^ г 1 — гп

Л = 2 --—-^-тdt.

п J (1 — t)(1+ t^1 J (1 — t)(1+ t)n+1 00

Очевидно, что In > 0 и In > In+1 для любого n G N. Далее

i i

Г1 +1 + ••• + tn-1 [1 + (n - 1)t /1

In =2 , ^-dt < 2 / , V N ' dt = О -

J (1 +t)™+1 " J (1 +t)™+1 V" 0 0

Учитывая полученные результаты (29), (30), (31), (32), сформулируем теорему.

Теорема 2. При верной Н0 и при п дисперсии статистик Б и Б определяются

следующими выражениями:

X ln n\ ln n ^

VarS* = 4 In n + 4 ( 7- — j +0 i — j = 41nn - 4.27087 ... + О i — ) , (33)

Var_D = 4Inn + 4 ( 7 - 2 + у\ +0 f^) = 41nn + 0.88860 ... +О Q

(34)

Для практического применения полученных дисперсий предлагаются следующие варианты их расчета:

Var5 = 4 ln n - 4.271 +

0.383 ln n + 0.373

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(35)

Var D = 4ln n + 0.889 +

-0.351 ln n + 3.416

(36)

Коэффициенты убывающих к нулю дробей в (35), (36) были рассчитаны методом наименьших квадратов с целью улучшения качества аппроксимации дисперсий (27) и (28). При этом величина абсолютной ошибки приближения не превышает 0.01 для УагБ уже при п ^ 10, а для УагБ — при п ^ 22.

В табл. 1 приведены значения дисперсий статистик Б и Б и их аппроксимации при п от 4 до 15.

Таблица 1. Дисперсии статистик D и S и их аппроксимации

n

n

п VarS1 (33) VarS1 (35) VarD (34) VarD (36)

4 1.500 1.499 7.167 7.167

5 2.300 2.365 7.967 7.897

6 3.011 3.073 8.589 8.521

7 3.630 3.672 9.113 9.063

8 4.169 4.193 9.573 9.543

9 4.644 4.653 9.998 9.972

10 5.065 5.065 10.367 10.360

11 5.444 5.438 10.715 10.715

12 5.789 5.779 11.037 11.041

13 6.105 6.093 11.336 11.342

14 6.397 6.384 11.616 11.623

15 6.668 6.655 11.878 11.886

Приближенные критерии round-trip Фостера—Стюарта. При построении приближенных критериев будем учитывать доказанный факт асимптотической нормальности распределения статистик D и S при верной нулевой гипотезе (1), а также

известную поправку на непрерывность [8, стр.78]. Таким образом, асимптотические функции распределения статистик Б и Б при верной Но будут иметь следующий вид:

Х ь2

ф(

х) — Iе 2 функция распределения стандартного нормального закона.

Приведем критерии для всех предложенных выше альтернатив вида (3)—(5). Сначала сформулируем критерий проверки нулевой гипотезы против однопара-метрических альтернатив (3) и (4). В табл. 2 для каждой из шести возможных альтернатив в ячейке справа приведено соответствующее р-значение.

Таблица 2. Достигаемые уровни значимости (р-значения) для однопараметрических альтернатив наличия тренда

Альтернатива (3) Р Альтернатива (4) р

Пт ф / D+0.5 \ V War D 1 н!г> ф ( s+0-5 ) V VVarS J

Я( + ) JJm ч^т) я<+> НШ)

Нт яст

Для построения критерия проверки Ho против двухпараметрической альтернативы вида (5) воспользуемся тем, что сумма квадратов с.в., распределенных по стандартному нормальному закону, имеет распределение хи-квадрат с двумя степенями свободы. Доверительной областью (областью принятия Ho) в этом случае будет эллипс, и граница критической области будет определяться соответствующим квантилем. Отсюда следует, что р-значение будет определяться следующим образом:

( (Д + 0.5)2 (Б + 0.5)2 ^

Р = еХР("1Уа^---2VarS~ J (38)

Критерий, с помощью которого принимается решение, прост. Если р-значение больше выбранного уровня значимости а0, нулевая гипотеза принимается в качестве верной, в противном случае она отвергается. Точнее говоря, за верную принимается соответствующая альтернатива. В том случае, когда р ^ а0 для нескольких альтернатив, по наименьшему р-значению можно выбрать наиболее значимую альтернативу, противоречащую нулевой гипотезе.

Далее разберем пример проверки гипотезы случайности приближенным критерием round-trip Фостера—Стюарта.

Пример. Пусть имеется следующий массив данных (первая строка табл. 3). Проверим нулевую гипотезу об отсутствии трендов. Вспомогательные расчеты приведены во второй строке той же таблицы.

Таблица 3. Начальный набор данных и вспомогательные расчеты

1 2 3 6 7 4 8 5 9 10

U2,l'2 из, Ig «4 иъ ¡'в ит 1'* ид, 1'д и10,и'10,1'10

В этой строке для каждого элемента массива приводятся статистики, которые равны единице. Если во второй строке ячейка не пуста, соответствующий элемент

массива является рекордом. Так, элементу l соответствует l', поскольку он меньше всех чисел, следующих за ним; элементу 2 — две статистики u и l', поскольку он больше предыдущего элемента и меньше всех остальных и т. д. Статистики критериев будут равны следующим значениям:

d = 7, d' = -6, s = 7, s' = 6, D = 13, S = 1.

Выберем уровень значимости ao = G.G5. Приведем результаты по наиболее значимым альтернативам, т. е. тем, для которых рассчитанное p-значение оказалось меньше ao. Так, для двусторонней альтернативы тренда в средних Hm достигаемый уровень значимости равен p =l.0E-04, для односторонней альтернативы нП) — p =5.2E-05. Значимых альтернатив тренда в дисперсиях не обнаружено. Для двухпараметриче-ской альтернативы вида (5) имеем p =0.000l2.

Для данного примера можно сделать основной вывод. С выбранным уровнем значимости 5% можно утверждать наличие положительного линейного тренда в средних и отсутствие линейного тренда у дисперсий исследуемой последовательности чисел.

В дальнейшем планируется исследование состоятельности и мощности критериев round-trip проверки Ho против некоторых двухпараметрических альтернатив.

В заключение хотелось бы выразить благодарность рецензентам журнала «Вестник Санкт-Петербургского университета. Серия l. Математика. Механика. Астрономия» В. Б. Невзорову и В. Н. Солеву за очень полезные замечания, способствующие исправлению достаточно большого количества погрешностей в первоначальном варианте статьи. Также хотелось бы поблагодарить ответственного секретаря редколлегии А. Л. Смирнова за терпение и поддержку.

Литература

1. Foster F. G., Stuart A. Distribution-free tests in timeseries dated on the breaking of records // J. Roy. Stat. Soc. 1954. Vol.B16, N1. P. 1-22.

2. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. M.: ФИЗMАТЛИТ, 2006. 816 с.

3. Кендалл М., Стьюарт А. Статистические выводы и связи. M.: Наука, 1973. 900 с.

4. Chandler K. N. The distribution and frequency of record values // J. Roy. Statist. Soc., ser. B. 1952. Vol. 14. P. 220-228.

5. Невзоров В. Б. Рекорды j j Теория вероятностей и ее применения. 1987. Т. 32, №2. С. 219-251.

6. Невзоров В. Б. Рекорды: Mатематическая теория. M.: ФАЗИС, 2000. 244 с. (Стохастика; Вып. 4).

7. Градштейн И. С., Рыжик И. М. Таблицы интегралов, сумм, рядов и произведений. M.: Физ-матгиз, 1963. 1100 с.

8. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. M.: Наука, 1983. 416 с. Статья поступила в редакцию 18 июля 2015 г.

Сведения об авторе

Чепурко Валерий Анатольевич — кандидат физико-математических наук, доцент; v.a.chepurko@mail.ru, chepurko@iate.obninsk.ru

DISPERSION OF THE TEST STATISTIC OF CRITERIA ROUND-TRIP FOSTER—STUART

Valery A. Chepurko

Obninsk Institute for Nuclear Power Engineering, department of ACS, Studgorodok, 1, Obninsk, Kaluzhskaya obl., 249040, Russian Federation; v.a.chepurko@mail.ru, chepurko@iate.obninsk.ru

The criterion Foster—Stuart in the analysis of time series to determine trends is often used. The criterion is based on the calculation of the lower and upper time series records xi,...,xn. Unlike other tests of randomness, tests based on records are not invariant under a reversal of the direction of the time variable. To construct invariant round-trip tests is necessary to count the records in both forward and backward time variable. Thus far the construction of such test was impossible. When the null hypothesis is true the variances of test statistics were not known. Foster—Stewart round-trip criteria D and S dispersion statistics has been found in this article. This criteria was designed for xi,...,xn time series mean and dispersion positive and negative trend receiving. Assuming Ho randomness null-hypothesis criteria variances statistics S and D was found. Asymptotic approximations was obtained for dispersions. This is possible to construct an invariant test for two-sided alternatives. Foster—Stewart round-trip criteria application example is reviewed. Refs 8. Tables 3.

Keywords: time series, randomness, trend, lower record, upper record, order statistics, beta function, Euler's constant, the amendment continuity.

References

1. Foster F. G., Stuart A., "Distribution-free tests in timeseries dated on the breaking of records", J. Roy. Stat. Soc. B16(1), 1-22 (1954).

2. Kobzar A. I., Applied Mathematical Statistics. For engineers and scientists (FIZMATLIT, Moscow, 2006, 816 p.) [In Russian].

3. Kendall M., Stuart A., Statistical inference and connections (Nauka, Moscow, 1973, 900 p.) [In Russian].

4. Chandler K. N., "The distribution and frequency of record values", J. Roy. Statist. Soc., ser. B 14, 220-228 (1952).

5. Nevzorov V.B., "Rekords", Theory Probab. Appl. 32(2), 201-228 (1987).

6. Nevzorov V. B., Rekords: Mathematical theory (FAZIS, Moscow, 2000, 244 p., Stohastika; Iss. 4) [In Russian].

7. Gradshtein I. S., Ryzhik I. M., Tables of integrals, sums, series and products (Fizmatgiz, Moscow, 1963, 1100 p.) [In Russian].

8. Bol'shev L. N., Smirnov N. V., Tables of mathematical statistiks (Nauka, Moscow, 1983, 416 p.) [In Russian].

i Надоели баннеры? Вы всегда можете отключить рекламу.