П. В. Шпилев
L-ОПТИМАЛЬНЫЕ ПЛАНЫ
В ТРИГОНОМЕТРИЧЕСКОЙ РЕГРЕССИОННОЙ МОДЕЛИ НА ПОЛНОМ ИНТЕРВАЛЕ ПЛАНИРОВАНИЯ
1. Введение
Регрессионные модели Фурье широко используются для описания периодических явлений в различных областях. Традиционными сферами применения являются машиностроение, медицина, сельское хозяйство и биология.
Хорошо известно, что использование подходящего плана позволяет существенно повысить точность оценок параметров регрессионной модели. Для оценки параметров тригонометрической регрессии обычно используется метод наименьших квадратов (см. [1-3]). В большинстве случаев исследователи оценивают сразу все параметры модели, используя при этом Киферовский критерий фр-оптимальности для нахождения невырожденного оптимального плана (см., например, [4]). Однако во многих биологических задачах большое значение играют отдельные параметры, которые необходимо оценить с наибольшей точностью. Недавно была решена задача нахождения оптимальных планов для оценки индивидуальных коэффициентов на полном интервале планирования (см. [5] и [6]). Кроме того, в работе [6] была решена задача нахождения фр-оптимального плана для набора параметров ({въ в^, {в3, вА}, ■ ■ ■, {Р2i—1, вг®}), i G {1, ■ ■ ■, m}. Однако в некоторых случаях важно оценить пары коэффициентов {вг®, вгj}, i, j G {0, ■ ■ ■, m} или {р2г—1, p2j—i}, i,j G {1, ■ ■ ■, m}; это связано с их конкретной биологической интерпретацией.
Данная статья посвящена вопросу нахождения L-оптимальных планов, минимизирующих сумму дисперсий пар оценок коэффициентов {вг®, вгj} и {вг®_1, вгj—1}. Во вто-
ром разделе мы сформулируем несколько основных понятий теории оптимального планирования, в частности, теорему эквивалентности для вырожденных L-оптимальных планов. Данная теорема является важным инструментом для нахождения вырожденных оптимальных планов. Основные результаты получены в третьем разделе. Мы рассмотрим случаи, когда оптимальный план удается найти в явном виде. В общем случае нахождение плана связано с решением нелинейных систем больших размерностей. В заключение мы приведем несколько примеров.
2. Постановка задачи
Рассмотрим тригонометрическую регрессионную модель
m m
У = во + 53Pj—i sm(jt)+£вгj cos(jt) + e, t G [-п,'к]■ (21)
j=i j=i
Определим в = (во, Pi, ■■■вгт^ и
f (t) = (1, sint, cost, ■ ■ ■, sin(mt), cos(mt))T = (f0(t), ■ ■ ■, /2m(t))T © П. В. Шпилев, 2007
как вектор регрессионных функций. Под планом эксперимента мы будем понимать вероятностную меру £ с конечным носителем на интервале планирования [—п, п]. Мера £ определяется таблицей
£ = (^ , ¿і Є [—п, п], і =1, 2, . .., п.
Носитель плана £ состоит из точек, в которых проводятся наблюдения, а веса Wi удовлетворяют условиям Wj > 0, 5^Г=1 w* = 1. Как известно (см., например, [7]), информационная матрица Фишера для этого плана имеет вид
M(£) = (У f (t)fT(t)d£(t)^ е ß2m+1x2m+1. (2.2)
Отметим, что для симметричного плана £ после соответствующей перестановки регрессионных функций, информационная матрица (2.2) будет блочно-диагональной
M(£)= PM(£)P = (Mc0(£) M0(£^ , P е R2m+1x2m+1 (2.3)
с диагональными блоками
/ /* п \ m /г. п
Mc(£) = (/ cos(it) cos(jt)d£(t) j и Ms(£) = (/ sin(it) sin(jt)d£(t)
\J—п ) i,j=0 \J— п J i,j=1
Далее под информационной матрицей плана £ будем подразумевать матрицу M(£). Как обычно, вырожденным планом будем называть план, информационная матрица которого вырожденная. Будем говорить, что план £ принадлежит классу Sa, если для неотрицательно определенной матрицы A = 2=0 aiaT, ai е Д2т+1, оцениваемы все
параметрические функции aTв, * = 0,..., 2m. Такие планы будем называть допустимыми. Допустимый план £* будем называть L-оптимальным, если
2m
£* = arg min trLM—(£), L = 'S''' lilT, li е Д2т+1.
i=0
Теперь для L-оптимальных планов сформулируем теорему, которая является модификацией известного результата для невырожденных планов (см. [2], с. 108).
Теорема 2.1. Пусть множество информационных матриц компактно и существует L-оптимальный план, не являющийся крайней точкой множества допустимых планов. Матрица L имеет вид L = 2=0 lilT, li е Д2т+1. Тогда
1) план £ допустим, если и только если для всех векторов li выполнено
lT M—(£)M (£) = lT (£), * = 0,..., 2m;
2) допустимый план £* L-оптимальный, если и только если выполнено
max y>(t,£*) = trLM +(£*), где y>(t, £) = fT(t)M+(£)LM+(£)f (t).
iGX
При этом в точках ti е supp(£*) имеет место равенство
^(ti,£*)= trLM + (£*).
Доказательство этой теоремы для невырожденного случая может быть найдено в [2] (с. 108). В общем случае доказательство проводится аналогично. Данная теорема является важным инструментом для проверки планов на L-оптимальность. Нахождение L-оптимальных планов сложная с вычислительной точки зрения задача. Однако в определенных случаях оптимальные планы могут быть найдены в явном виде. В следующем разделе мы сформулируем несколько теорем, которые предоставляют в явном виде L-оптимальные планы для тригонометрических моделей произвольного порядка.
3. L-оптимальные планы в тригонометрической модели произвольного порядка. Примеры
В данном разделе мы построим L-оптимальные планы, минимизирующие сумму дисперсий оценок различных пар коэффициентов отдельно при синусах и косинусах. Для проверки оптимальности мы будем пользоваться теоремой, сформулированной в предыдущем разделе.
Теорема 3.1. Рассмотрим тригонометрическую модель (2.1), m > 3.
1. План
tn tn— 1 . . .
I tn tn-1 ... tl tl ... tn \
(2|_fJ-i, 4fJ-i) ^ ujn Ujn_1 ... Wl UJ1 ... ujn J
где
n_2 m , ti _ 2 i п
— — —
L 2 J 2 n
i-1) 1 2arctg(v/5)
>X, UJi = —, X = -------------------,
2n n
является Ь-оптимальным планом, минимизирующим сумму дисперсий оценок параметров /32[^]-1 и /?4|_^_|-1-Причем
■ч/б 3
]_11 4^_1}) = — + - « 2.618034 ....
2. Для любого а € [0, ш„] план
tn-1 ... t1 0 t1 ... tn-1 п
> V шn ~ a шn—1 ■ ■ ■ ш1 ш0 u1 ■ ■ ■ un—1 a
где
n_2
TO (i — 1)7Г Г- a/5 — 1
— , ti =------------------, LO0 = V5wi, w 1 = —----------------, = * = 2, ...,n,
L 2 J n 4n
является Ь-оптимальным планом, минимизирующим сумму дисперсий оценок параметров /32[т] и /34^т]. Кроме того, план £*о минимизирующий сумму дисперсий оценок параметров /?о и совпадает с планом 4^т^-
Причем
л/5 3
“М41?.И..[?])» = “м+(«<-0. П? Л>-Т + 2- М""‘~ •
Доказательство .
Докажем первый пункт теоремы. Второй доказывается аналогично. Для удобства обозначений будем считать, что то — четное. В этом случае [у] = Щ- и первый пункт теоремы можно переписать так:
__ I ^т ^т—1 • • • ^1 ^1 • • • ^т
т) - I _1_ _±_ _±_ _±_ _±_
\ 2т 2т ' ' ' 2т 2т ' ' ' 2т
?7Г - 9
-----b ( — х=—arctg(%/5).
то то
ti =
Идея доказательства состоит в следующем. Мы покажем, что
г^т] = О, І = 1, 2, .. ., то, I TOs[f if] = sin (f ж)
ms[j,m] = 0, j = 1, 2, ...,m - 1 |ms[m,m] = sin (гаг)
где —элемент матрицы Мя Є Дтхт, стоящий на пересечении *-ой строки и ^’-го
столбца. В результате мы получим функцию ) в явном виде:
ф, е) = ітт+(оьм+(оі(і) =
вт (-ух) эт (тх)
После этого, решая уравнение дір^ ^ \і=х = 0, найдем нужное значение ж, а затем
^ U. . =Х
выведем, что
tr ьм+(П = <p(u, П = ^ +1-
sin (yx) sm (тх)
Итак, нужно лишь доказать, что
ms[j,m] = 0, j = 1, 2, . .., m - 1 ’ |ms[m,m] = sin2(mx)
С учетом вышесказанного получаем
m 1 m
TOs^m] = 2^sin(jtfc)sin (yífc) SÍI1 (ytfc) •
fc=1 fc=1
Отметим, что sin(?rífc) = ( — 1)L 2 J sin(yx). Следовательно, получаем
mm
sin(yx)
sin(^fc)-
m
k=1
Докажем, что Y^k=i(~ 1)^ 2 ^ sinÜ¿fc) = 0 ПРИ j Ф у- В этом случае
V(-1)L—J sin(jtfc) = sin(jx) + sin (—- ) cos(jx) — eos (—- ) sin(jx) +
\m ) \m )
+ ( — 1) ( sin ( —- ) cos(jx) + cos ( —- ) sin(jx) ) + . . . ml у my
+ (sin ((y - :) cos(jx) +cos ((y - l) sin(jx)^ +
sin(jx) = sin(jx) I 2 ( — l)fc cos ^+ ( —1 y+^ — 1 J .
Как несложно видеть, при j ф Щ- справедливо равенство
т _1
\к f2nk^ 1 ^ , ___/^3jn
2 S ("1)kc“ (^)=di> (cos (™)+“* (i)+■ -+
+(-!)*-■ («. (4!^:) +«. = i + i-iF+f-v
Следовательно, искомая сумма имеет вид
m
^(-1)L~J sin(jife) = 2sin(jx) (l + (-1)^_1+J + (-1)J+^ - l) = 0. k=1
Аналогичным образом посчитаем, чему равен элемент ms[j m] при j _ m:
mm
1 х—^ • / • \ • / \ sin(mx) х—■''/ \k • / • \
ms[jM = — } sm{jtk)sm{mtk) =-/.I“1) smU^) =
mm
k=1 k=1
= sin(jx) ^2 cos ^+ ( — 1)"' — 1 | = sin(jx) (l — ( — I)-' + (—1У — l) = 0. Из вышесказанного следует, что
[?,?] = sin2(f ж)+- =sin2(fx)
[m,m] = sin2(mx)+-E“=1(-l)2fc = sin2(mx)
Теорема доказана.
□
Замечание 3.1. Отметим, что теорема 3.1 верна для тригонометрических моделей порядка т > 3. При т = 2 оптимальный план £*! ^ имеет вид
Со.3,= (“Ж,+ І Т ї ’Г7І'),х = аГс.8(^), 1.гіАС'(П = ^ +§.
V 4 4 4 4 / //
Для любого а Є
П 5-^5 и’ 8
оптимальный план £*0 2) равен
Г -( -f 0 I М + 5
40,2) - I 5-V5 _а л/5-1 5-^5 л/5-1 ^ ) > trbMc (С ) - ^ ^
\ 8 8 8 8 /
m
£(0,2) =
—П + X —х
г г
X
г
п — х
г
а £
О,--г
где г « 0.151950668 ..., х « 0.9329288036 ..., 1гЬМ-1(£*) « 2.770045647 ... . Численные значения г и х найдены путем непосредственного решения, соответствующих систем уравнений.
Замечание 3.2. Отметим, что в условиях теоремы 3.1 сумма дисперсий оценок соответствующих коэффициентов равна -^+§- При _0-оптимальном планировании сумма дисперсий — равна 4. Таким образом, сумма дисперсий при Ь-оптимальном планировании в данном случае будет меньше суммы дисперсий, полученной при ^-оптимальном планировании примерно в 1.5 раза.
Пример 3.1. Ь-оптимальный план, минимизирующий сумму дисперсий оценок параметров вз и вг (т. е. коэффициентов при вш(2£) и вш(4£)) в тригонометрической регрессионной модели четвертого порядка (т = 4).
В этом случае, согласно теореме 3.1, оптимальный план имеет вид
7) =
— 7Г — X —ту — X —ту ~\~ X —X
77 + X 7Г — X
х = — arctg ~ 0.49068 ....
Информационная матрица М8 и дисперсионная матрица Мя 1 этого плана имеют вид
Мв(&г)
0.5
0
0.190983
0
0
0.690983
0
0
0.190983
0
0.5
0
0
0
0
0.854102
М-ЧЯ г) =
2.34164 0
0 1.447214
—0.894427 0
00
В данном случае, как не сложно видеть,
—0.894427 0
00 2.34164 0
0 1.17082
Легко убедиться, что матрица М +(£*)ЬМ +(£*) имеет вид
М+«*>ЬМ+«*> = (2 М,-(Г)Ь°,М-1(Г)}’
где —соответсвующий блок матрицы Ь.
Теперь можно найти экстремальный полином у>(£, £*) = /т(¿)М + (£*)ЬМ+(£*)/(£):
(1 + л/б')2 .
¥>(^; С*) = -------------8Ш2(2£) +
0
— П
Рис. 1.
На рис. 1 изображены точки носителя оптимального плана, минимизирующего сумму дисперсий оценок параметров вз и вг (т. е. коэффициентов при вт(2£) и вт(4£)) в тригонометрической регрессионной модели четвертого порядка (т = 4).
Сформулируем еще две теоремы о Ь-оптимальных планах. Доказательства этих теорем аналогичны доказательству теоремы 3.1.
Теорема 3.2. Рассмотрим тригонометрическую регрессионную модель (2.1). Пусть т _ 3к, к _ 1, 2, 3, . .. (т —порядок регрессионной модели). Тогда план вида
| 1т ^т-1 . . . ^1 ^1 ... 1т
у ^т ^т-1 . . . ^1 ^1 . . . ^т
где
П X П П X П .
~Ьл = —~ ¿9 = —ї“і = —Г ~\~ Ті = Я ~\~ Ті £ = 4, 5 . . . , 771.
2 к к 2к 2к к к' ’ ’ ’
г 1 — 4г г
^1 = 7, <^2 = ——, ^з = т, Ші = Ші-з, г = 4, 5...,т,
к 2к к
является Ь-оптимальным для параметров {в2й-1, Аій-1}> {в2й-1, вбй-1}>
|в4й—1, вбй—1}. План вида
П ^т-1 . . . ^1 0 ^1 ... ^т-1 П А Гп 1
£ Л , а є [0, от],
\ ^т — а ^т-1 ... ^1 ^0 ^1 ... Шт-1 а )
где
X П — X П
І0 = 0, ¿1 = ¿2 = —;—, и = и~з + 7, * = 3, 4 . . ., то - 1,
к к к
1 — 4г г г -ох
С^п = -----, а^і = —, а^2 = —, сл = сЛ-з, * = 3, 4 . . ., то,
и 2к к к ’ ’ ’ ’
является Ь-оптимальным для параметров {во,в2й}, {во, Дій}, {во,вбй}, {в2й,в4А:}, {в2^,в6^}; {в4^,в6^}.
В каждом случае соответствующие х и г могут быть найдены из систем
{ дітЬМ-\С) _ 0 (дііЬМ-\і*) = о
Эх и ) дх _
диьм-1^*) _п )диьм^(е)
дг
I ~с ч" у = 0 -----------„я = О
V дг V
Численные значения х и г приведены в таблице 1.1 и 1.2. 86
Теорема 3.3. Рассмотрим тригонометрическую регрессионную модель (2.1). Пусть т = 4к, к = 1, 2, 3, . .. (т-порядок регрессионной модели). Тогда план вида
где
Ші
С* _
1т ^т-1 Шт Шт—і
-1і 1і
Ші Ші
Жі Ж2
*1 = ~Г, І2 = ІЗ
к к
П - Ж2
П — Ж і
21 /г :
1 -4гі
1 -4гі
Ш2
Шз
Ш4
£1 /г ’
Їі—4 Н , г = 5, 6 . .., то,
к
4, і = 5, 6 . .., т,
является Ь-оптимальным для параметров {в2й-і, Аій-і}> Ів2й—і, вбй—і},
{в2й-і, ввй-і}, {вій-і, ввй-і}, {в4й-і, ввй-і}, {ввй-і, ввй-і}- План вида
с* _
—П —їп-і
— а Шп—1
—їі 0 їі
Ші Шо Ші
^п-1 П
Шп — і а
а Є [0, Шп],
гдеп=Ц±,
Ж і Ж2
І0 = 0, ¿1 = —, ¿2 = -р, ІЗ кк
П — Ж2
, Ї4
П — Жі
1 — 4^і — 4^2 г і
^0 = ¥к , Ш1=Ш4 = Т,
Ш2 = Шз
£-2 к ’
и~5 + у, і = 5, 6 . . . ,п - 1, к
Ші = Ші_5, і = 5, 6 . .., п
является Ь-оптимальным для параметров {во,в4й}, {во,вбй}, {во,в8й}, {в2й,в4А:}, |в2й,ввй}, |в2й,в8й}, |в4й,ввй}, |в4й,в8й}, |ввй,в8й}. В каждом случае соответствующие XI, Х2, £1 и ^2 могут быть найдены из систем:
дігЬМ-
дх\
дінЬМ-1 (П
дх2
дігЬМ-1 (Г)
дх\
дінЬМ-1 (Г)
дг2
¿Нг ьм-'іС) = о
дх\
дыьм-\Є) = о
дх2
діг ьмг\Є) = о
дг\
Численные значения Х1, Х2, £1 и £2 приведены в таблицах 2.1 и 2.2.
Замечание 3.3. Отметим, что для любого I, такого что т/2 <1 < т, и любого в £ [0, щ\, план
* , -7Г -7Г+Т ... -7ГН----р- 7Г 7Г
4о,2г - І і _ а і 1_ о
ч 2; ^ 2; • • • 2; ^
является Ь-оптимальным. То есть минимизирует сумму дисперсий оценок параметров {во, в2г}. Более того, в этом случае 1гЬМ—1(£д 2;) = 2. Доказательство этого утверждения может быть найдено в [5].
В заключение приведем еще один пример.
Пример 3.2. Ь-оптимальный план, минимизирующий сумму дисперсий оценок параметров в4 и вб (т.е. коэффициентов при еов(2£) и еов(3£)) в тригонометрической регрессионной модели четвертого порядка (т=4).
т
Ш
т
и
О 1.02 I 2.13 7г
2
вид
£4,6-1 0 175 - а 0.09 0.145 0.09 0.175 0.09 0.145 0.09 а
Покажем информационную матрицу Мс и дисперсионную матрицу М-1 этого плана:
—п 0.175 а
-2.13 -§ -1.02
0.1425
Мс(£4,б) =
Мс-1(£4,б) =
Отсюда получаем,
М + =
1 0 —0.1041 0 0.4027
0 0.4479 0 0.1493 0
—0.1041 0 .70137 0 0.16132 ,
0 0.1493 0 0.71338 0
0.4027 0 0.16132 0 0.76404
1.3622 0 0.38615 0 —0.7996
0 2.3999 0 —0.5023 0
0.38615 0 1.608 0 —0.54306
0 —0.5023 0 1.507 0
0.7996 0 0.54306 0 1.845
М-1
0
0
М+
) , ^ЬМ +(£4,6) « 3.114911064 ....
Экстремальный полином у>(£, £*) = /т(¿)М +(£*)ЬМ+(£*)/(¿) примет вид
^(¿,£*) = 2.851 — 0.262 сов(2£) + 0.116 сов(4£) + 0.262 сов(6£) + 0.147 сов(8£).
Рис. 2.
На рис. 2 изображены точки носителя оптимального плана, минимизирующего сумму дисперсий оценок параметров в4 и вб (т. е. коэффициентов при сов(2£) и сов(3£)) в тригонометрической регрессионной модели четвертого порядка (то = 4).
4. Приложение
Таблица 1.1
т = Зк {2к- 1,6 к - 1} {4 к - 1,6 к - 1}
X 0.6476 Зтг/10
г 0.14 (3 - л/Ё>)/4
ЪгЬМ~ 2.7044 (л/б + 3)/2
Таблица 1.2
т = Зк X г
{0,2 к} 0.9329 0.1519 2.77
{0,4к} 7г/2 1/4 2
{0,6 к} 7г/3 1/6 2
{2к, 4к} 1.1177 0.1258 3.4826
{2к, 6к} 0.9232 0.14 2.7044
{4к, 6к} 1.1668 0.1478 (л/б + 3)/2
т = 4к Xl X2 Zl trLM
{2k- 1,6 k- 1} 0.648 7r/2 0.14 2.704
{2k -1,8k- 1} 0.485 1.191 0.091 2.731
{4k — 1,6 k- 1} 0.734 1.388 0.168 2.96
{4k -1,8k- 1} 0.491 2.651 1/8 2.618
{6k — 1, 8fc — 1} 0.452 1.257 0.1417 2.618
Таблица 2.2
m = 4k XI X2 Z1 Z2 trLM
{0,4k} ж/4 7r/2 0.086 0.077 2.618
{0,6k} ж/3 7r/3 1/6 1/6 2
{0,8k} tt/4 ж/2 1/8 1/8 2
{2k,4k} tt/4 ж/2 0.065 0.092 3.664
{2k,6k} 0.923 0.923 0.07 0.07 2.704
{2k,8k} 0.713 ж/2 0.033 0.14 2.731
{4k,6k} 1.016 ж/2 0.07 0.093 3.115
{4k,8k} 7r/4 ж 12 0.086 0.077 2.618
{6k,8k} 0.8814 ж/2 0.048 0.13 2.618
Summary
P. V. Shpilev. L-optimal designs in trigonometric regression model on the full circle.
Singular optimal designs minimizing a sum of estimations variances of different couples of trigonometric regression models coefficients on the full circle for L-optimality criterion are found.
Литература
1. Карлин С., Стадден В. Чебышевские системы и их применение в анализе и статистике. М., 1976.
2. Ермаков С. М., Жиглявский А. А. Математическая теория оптимального эксперимента. М., 1987.
3. Федоров В. В. Теория оптимального эксперимента. М., 1971.
4. Pukelsheim F. Optimal Design of Experiments. New York: Wiley, 1993.
5. Dette H., Melas V. B. Optimal designs for estimating individual coefficients in Fourier regression models. The Annals of Statistics. Vol. 31, 2003. P. 1669-1692.
6. Dette H., Melas V. B., Shpilev P. V. Optimal designs for estimating the coefficients of the lower frequencies in trigonometric regression models. Bochum: Ruhr-Univ, 2005.
7. Kiefer J. C. General equivalence theory for optimum designs (approximate theory) // The Annals of Statistics. Vol. 2, 1974. P. 849-879.
8. Ра,о С. Р. Линейные статистические методы и их применения. М., 1968.
Статья поступила в редакцию 12 декабря 2006 г.