+6400£>{? }- 9600 соу^'*» , 5 <*>}
-14Д, -|/)с = 2880я{$,<*))+
+4800£>{?<*)}- 7440 соу^** , } Разрешаем эту систему относительно £>а, йь и Д. и подставляем в формулу для средней интегральной погрешности
усредняя уравнение (1), имеем = ак_х +Ьк_х +с4_,. В стационарном случае все эти величины не должны зависеть от номера к. Тогда из последнего уравнения следует, что + ск = 0, а величина сГк может
быть произвольной. Записывая (1) в виде ак --ак_х =Ьк_, возводя его в квадрат и усред-
няя, получим (ак -ак_,)2 =(Ьк_, +ск_,)2. Если обозначить (ак -ак_,)2 через V, то в силу стационарности сплайна эта величина не зависит от к. Заме-
которая для стационарного режима
тим, что это тот же самый параметр (хк - хк_1)2, что и для линейных сплайнов первого порядка [3].
Так как M
принимает вид
Щ
1
1
ХТ (\Т)2 (AT)3
то при
или
IJVJL 9 ' 12 ь 20 cj
_ . .Г 1 1Г107 77 23 г— 53 "7 , ,1
D = Л/<{ — U-Ь:+—ькск+-с: +3ст2 .
{N JLi40 * «4 * * 31S J
Отметим, что если считать исходный тренд стационарным случайным процессом, то Щ, Ькск и с2к не являются независимыми величинами. Действительно,
ЯТ» 1 окончательно имеем £> = —[о,16ИЧЗа21.
Из полученной формулы имеем, что средняя интегральная погрешность выделения тренда отлична от куля прй отсутствии Помех измерений. Это обусловлено тем, что моменты измерений являются случайными величинами и вносят дополнительную погрешность в измеренные значения временного ряда.
ЛИТЕРАТУРА
1. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976. 755 с.
2. Кендалл МД„ Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. 736 с.
3. Тривоженко Б.Е. Выделение трендов временных рядов и потоков событий. Томск: Изд-во ТГУ, 1989. 285 с.
Статья представлена кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 14 марта 2000 г.
УДК 519.2
Б.Е. Тривоженко
АСИМПТОТИЧЕСКИЕ СВОЙСТВА МНК-ОЦЕНОК ПАРАМЕТРОВ ГИПЕРБОЛИЧЕСКОГО ТРЕНДА ИНТЕНСИВНОСТИ ПУАССОНОВСКОГО ПОТОКА
Получены уравнения для МНК-оценок параметров гиперболического тренда пуассоновского потока. Исследованы их статистические свойства. Показано, что эти оценки являются несмещенными. Получены выражения для подтверждения эффективности МНК-оценок параметров и эффективности МНК-оценки гиперболического тренда.
Пуассоновский поток событий является простейшим дня изучения, поскольку его свойства полностью описываются единственной функцией - его интенсивностью Л(1) [1]. В нестационарном потоке сохраняются основные свойства, делающие его изучение лёгким, - независимость событий и ординарность, г
Обозначим j\(u)du через А(/). Тогда вероятность о
того, что на интервале наступит / событий, будет
(1)
а вероятность того, что на бесконечно малом интервале + наступит одно событие, равна X{t)dt.
Будем предполагать, что интенсивность пуассоновского потока описывается функцией
А(0- 1
Такой вид зависимости интенсивности от / соответствует линейному тренду средней длительности интервалов между двумя последующими событиями в нестационарном пуассоновском потоке.
По наблюдениям моментов наступления событий I, <г2 <...<<ЛГ необходимо оценить неизвестные параметры а и Ь, т.е. выделить тренд интенсивности. Число событий N, по которым оцениваются параметры, фиксировано, и мы в данном случае имеем дело с Л^-планами эксперимента. Поскольку N фиксировано, то для того, чтобы можно было применять асимптотические методы, представим А(Г) в виде
1
х0(0-я.
'Г
a+bt/N
(3)
a + bt
(2)
Если - момент наступления 1-го события, то в [2] было показано, что асимптотически при N <»
м
(4)
Для функции вида (2) Т(х) = — (еЪх -1).
6
Оценки неизвестных параметров будем находшъ методом наименьших квадратов (МНК), т.е. из критерия:
1 "
N 6
' Ш1П .
а,Ь
¿Л ¿Г } Nh{ %'
як NN
(6)
Найти отсюда оценки Л я В в явном виде не представляется возможным. Однако исследуем асимптотические при N —► оо свойства оценок Ли В. Для этого представим й и В в виде й = а + Ай, 6 = Ь + АВ, где а и Ъ - истинные значения параметров, а величины
I. / N —— = 7] — I + — . Разлагая левые и правые ' N {N1 N ^
части (6) в ряд по АЛ и Аб и ограничиваясь линейными слагаемыми относительно Ай и ДЙ, получим
1 1 " ь-bNt{
Аа +
о N м N ъ N /=1
N^1 N
А 6 =
» г »1
-—У — е""(е"»-\) Ь N м N
а 1 Л. / ь1 »!
Д а +
' 1 Л / Д/ АЬ = ±У±е (7)
При достаточно больших N суммы, стоящие в левых частях (7), можно заменить интегралами. Тогда коэффициенты при АН и АЁ можно вычислить:
1 1 V/- 14* «11 =--> (е -1) —V-►
е2*-4е'+26 + 3 262
а 1 Д I
Л 1 * *-
б2 N^1 '
ЛГ-мо
I
® 0 ¿ 0
= ¿г [(26 - 3)е2' - 4(6 - 3)е* - 46 - 9],
д — .,! у1.! ^ ^^ ^
21 Ь N м N 1 •
1 Г__Ьх / ЛЬх
ЛГ-*о
(5)
1_ 463
= "77т[(26—1)е24 -4(6—1)е4 -3],
Приравнивая нулю производные от 0 по а и 6, получим систему уравнений для определения оценок й и В:
22
Ь N Тц N й ^
_ ° ¡^в«г(в*_1)Л « [(6_1)е»+1]». (8) о 0 2о
Разрешая (7) относительно Ай я АВ, имеем 1
ДЛ = -
апан-а12а21
-а
12 N И N N
А В =
1
°иа12 ~ а12а21
1 Л .
ДЛ
1 Л / Ь±- Д/ • • 11 '
(9)
Так как Д/, = 0, то оценки й и В - несмещённые.
Для вычисления дисперсий оценок й и В возведём равенства (9) в квадрат и усредним по ti, а для получения ковариации оценок перемножим равенства (9) и усредним по . В результате получим:
1 1
М){а} =
(а11а22 -{Х12а21)2 ***
}
N
хЕ
, Ь± ъ1 / и
а\2(е » -1)(е * -1)-2а12аи(е *» +
N
, / / + а?2 —е » ^-е * 12 Л #
М){6} = •
N соу
£ О
И' N > 1
АГ '.7=1
(а11а22 ~а12а21)2 , и »1 /
а2,(е » -1)(е » -1)-2аиа21(е » -1)^-е * +
, / *- / А—
+ а2 -е * -¿в * " Л^ ¿V
ТУ соу(а, 6) =
N004 |Ч 'Л
1
1
-а21аи(в *-1Хв "-!) +
N
'.7=4
+ (апа22+а12а21Хв * -1)т-в * -
N
- а, ,а12 — е^ — е* liV covf^-Д), " nN N J {N NJ
(10)
где соу
' t, t^
Vn'N)
NcoS—,— KN'NJ
определяется формулой
min(/,y)
ттш
Для рассматриваемого случая
N cov
—1 = тш(/,j).
IN N) J
ND{6}~
g2,/?, -la^a^R^ + a2t_ 2
= "ft •
N соу(а, 8) ~ (-ОлО^Л, + + + «„«и)/^ - а,1«12Лз) >
/((ап«22 "«и«*)2) = а2/«»» 01)
где а,,, аг|2, а2,, ам определяются формулами (8), а
' 26' к
46-3 a4i 66-7,3» , е--е +
8
24>
а2 f 1662-206 + 9 „ ^ = 16 *
1862-30Ь + 13 з» 66-1 й b 53
--е--е +е--
9 4 144
^ 86
f326э - 5662 + 446 -11 4t
-е -
16
-С26-.У-А).
а + Ь— N
Для нахождения эффективности найдём информационную матрицу Фишера. Так как элементы информационной матрицы 1 „ = -М < ^-^Г 1,1аЪ = =
да
вычисляя COOT-
--"И'Нй -
ветствующие производные от функции правдоподобия, получим
_1_/ + _1_I
Ь/(а+Ы„/^2\ а2Ь
(а + bt, / Ny
При больших значениях N в формулах (10) суммы можно заменить интегралами, которые нетрудно вычислить, и окончательно получим
(апа22 -аЧац)
I
1аЬ - -
М-
ts'N
b2 \a + btN / NI 6 \(a + btN / N)
+ -
N
-z
tJN
ab1 fxMa + bt,! NY
2 N
m
\ VN flO*
N
a+b — |( -2-^r
tH!N
6 /a+btN /N\ 6
N
l(a+btN/N)2\ 6J tt/ia+btJN)2
,(14)
где угловые скобки означают усреднение по моментам наступления событий. Найдём средние значения величин в (14). Так как
0-0!
X*)]" ч-чда-
то
(в
+ bt, / N)2 j \ KNJ/ (/-1)! J
I |</и.
А3(») Л(и)
х ехр< N
jb Л(и)-Л(и)
(15)
Для вычисления интеграла используем метод перевала [3], по которому для унимодальной функции /(г) с максимумом в точке £ е(а,Ь) интеграл асимптотически при /л-*<я равен
Найдём эффективность МНК-оценок параметров неизвестной интенсивности а и 6. Для /У-планов наг блюдений запишем совместную плотность вероятностей моментов появления событий:
/=1
1
где для гиперболического тренда Я(Г() =
F(M) = )<р{2)е^ск ~ (рфе14™
k'(z)
(16)
Для интеграла в (15) ф) = , /(г) = —1п Л(г) -
Л(г) Ту
-Л(г),а стационарная точка определяемая из
условия /'(г) = 0, является решением уравнения
Л(£) = -Ц. Тогда по формуле (16)
.ЛГ
Л(Гд,) = -1па + 1п^а + 6^^. функция правдоподобия для оценок неизвестных параметров а и 6 имеет вид Да,6) = 1пр(1,;2,...,(„) = -у 1п(а + 6^) +
+ + (13)
' \ = Л2(4±)) = ±е^. (17)
+ Ы,/Л0/ I ^ЛгЛ/ а
гично можно показать, что а + б^/ЛГ)2/ ^ I \N)J
.-[. (.8,
1
= -(е"-1)2е
(19)
N 1 -е"24 "г
"а2 26 а2
N (1 а -е-4)2 262 " — р аЬ > а
-71 -е"4 1 -+ - 6 -2Ь ' -е 26
где
= ь2
(21)
Находя матрицу, обратную информационной, получаем, что для дисперсий Уа, Уь и ковариации справедливы формулы
1 ьь
г г .г
гааЬЬ аЪ
2 »
а». _
Г /Г _ /Г2 гаагЬЬ аЪ
(22)
Приступим теперь к нахождению основной характеристики выделения тренда - интегральной погрешности. Интегральную погрешность Э для N -планов будем определять по формуле
о = лЛ-!Л
1
—Т4
Ы/М) |
, (23)
\а + ЫШ в+бг/ЛГ,
Представляя оценки й и В в виде й = а + Да, В = Ь + АЬ, где а и 6 - истинные значения параметров, можем записать
1 _1_=
Л + &/ЛГ а + Ы / N + (Да + ДА/ / N)~ 1 Л Аа + АЫ/Ы| > а + 6//лЛ а + ЫШ Ограничиваясь в полученном соотношении линейными слагаемыми относительно Да и АЪ, имеем
1 1
\а + ЫШ а+Ы1 N ^ А а2 + 2ДаД6*/ЛГ + Дб2/2 / ЛГ2
М\
Оа + ЫШ)А 1 1
^й + ВИ N а + Ы!Ы) |
= Р{й} + 2 соу(й,В)1 / N + Р{В}12 / 7/2 (а + Ы!Ы)*
При N-+00 величину в пределе интеграла можно заменить её математическим ожиданием
М{1„} = N^:(eb-1). Поэтому 6
[у 1 1 у |_
"!<'4-,> + 2СОУ(й,В) — + Р{В}{2 / ЛГ2
Подставляя (17)—(19) в формулы (14), заменяя суммы интегралами и приводя подобные, получим
- /
■Л.
(а + Ы!И)А
Делая замену переменных в интеграле и обозначая
а а
получим, что интегральная погрешность
(24)
1 6
Иа1 е" -1 и ¿и
г йи 1 (1 + и)4
А'
Ь (1 + и)
г иаи В г~г и2 ¿и ! (1+и)4 „^ ?Гн
о (1 + и)* Ь1 1 (1 + и) Вычисляя входящие в (25) интегралы, получим: 6
(25)
Ыа21) =
е -1
Л-е'и
А-+
3 6
Ь2 3 б3
(26)
Эта формула для интегральной погрешности позволяет сравнивать между собой различные методы оценок параметров а и 6 гиперболического тренда пуас ооновского потока.
Минимальную интегральную погрешность выделения тренда дают оценки по методу максимального правдоподобия (МП-оценки). Запишем (25) для МП-оценок:
АаЪ«, =
1
мп
1-е-3* 3 6
Рьь~
1-Зе-и+2е-м (1-е-*)3
— Н--гг;-
ъь1
3 б3
(27)
где РаЬ, Ри определяются выражениями (21). Для МНК-оценок формула интегральной погрешности
М»Ч>мис=—Г е — I
1-е
■и
36
1 - Зе'24 + 2е~34 (1-е-4)3 ' + --■> 1<л+ ,13 Л
362 " З63 " ' (28)
где функции fa, , /4 определяются формулами (11). Выражения для интегральной погрешности позволяют записать наряду с эффективностями МНК-оценок параметров а и Ь
1 ьь
ей» =
(29)
(30)
/ь^аа^ЬЬ ~ РаЬ ]
эффективность МНК-оценок гиперболического тренда 1
Б
г г _г2
аа ЬЬ аЬ
(62(1-е-34)^и-(1-Зе-24 +
Мнж
+ 2е"34)^ +(1-е-4)3^)/(62(1-е-34)/а +
+ 6(1 - Зе'2Ь +2е-гь)/аЬ + (1 - <Г')3Л). (31) Из приведённых на рис. 1 графиков зависимости ейд, , ей1 от Ь следует, что эффективность МНК-оценки параметра а достаточно высока. При -0,9 < 6 < 1,5 эффективность не менее 0,9. Эффективность параметра Ь несколько ниже, чем эффективность параметра а. Так, значения 0,9 она достигает при 0,6 < 6 < 1,7, а при увеличении или уменьшении 6 эффективность МНК-оценки параметра 6, как и параметра а, убывает. Эффективность МНК-оценки тренда достигает своего наибольшего значения 0,91 при 6 = 1,4, а с уменьшением или увеличением Ь она убывает.
Рис. 1
ЛИТЕРАТУРА
1. Кокс Д., Льюис П. Статистический анализ последовательностей событий. М.: Мир, 1969. 312 с.
2. Тривоженко Б.Е. Асимптотические свойства моментов наступления событий нестационарного пуассоновского потока // Математи-
ческое моделирование. Кибернетика. Информатика. Томск: Изд-во Том. ун-та, 1999. С. 140-150.
3. Свешников А.Г., Тихонов А Н. Теория функций комплексной переменной. М.: Наука, 1979.319 с.
Статья представлена кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государстеемногоуниверситетв, соступила в научную редакцию 14 марта 2000 R.
УДК 519.24
С. С. Тарима
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ВЕРОЯТНОСТЕЙ С ПРИВЛЕЧЕНИЕМ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ
Рассматривается способ учета дополнительной информации о вероятностях одних событий для улучшения эмпирических оценок вероятностей других. Приведен пример такого учета.
1. Пусть Х\, -Д, - последовательность независимых одинаково распределенных случайных величин, принимающих значения из измеримого пространства (Х,Б) с неизвестным распределением Р. Рассмотрим события A, Bi "t В„ принадлежащие ст-алгебре В. Предположим, что P(B,)=bh где 6, известны (М,—, s). Рассмотрим задачу статистического оценивания Р(А) с учетом данной информации. Результаты наблюдений представим в виде протокола;
А Вх В,.. в,
Хх m ЫХ) ых,)... ЫХ)
хг m ЫХ2) ш... ЫХг)
Xi Ia(X,) ЫХ,) ЫХ)- ЫХ,)
... ...
Х„ ЦХг) 1вШ ЫХ)- ЫХ„)
В клетках протокола наблюдений ¡¡ЛХ) - индикатор некоторого события В из ст-алгебры В.
Рассмотрим события Л1=и1пи2г>—пи,, где и, либо 2?(, либо его дополнение, М,—, 5. Их совокупность, с возможным количеством до 2' событий, является разбиением пространства X. В этом случае имеют место равенства
I />(Л,)=6,, _/ = 1, --,5. (1)
2. Для случая известных значений ДА,) в [3] была предложена оценка
= />я(А()>0,(2)
м Р„{А,)
1 я
где о-^гда
П1-1
В протоколе наблюдений часто реализуются не все события Л,, Предположим, что реализовалось только к из 2* событий Ai, для которых Р£А)>0. Остальные события в формуле (2) при рассмотрении отношения дают неопределенность типа 0/0 (если Р^АЦгО, то и PMAÍT =0). Аналогично, из событий Вк --, В, также реализуются не все, а только часть, допустим m<,k. Для этой ситуации рассмотрим следующую оценку
' i р^ШМ
-(3)
I ДА)
Суммирование ведется только по тем индексам, для которых эмпирическая оценка события А, не равна нолю. Эта оценка в отличие от (2) определена при любых РДЛД
3. В нашем случае значения P{A¡) неизвестны, но удовлетворяют условиям (1). Осталось оценить к вероятностей Р(А,). Если оценивать Р(А,) распределением P„(A¡), то из (3) мы получаем Р"Л(А)=Р„(А).
Найдем проекцию [ближайшую в смысле информационного расхождения (4)] P"¿A) в класс, удовлетворя-