УДК 524.19
Вестник СПбГУ. Сер. 1. Т. 2(60). 2015. Вып. 1
ТЕОРЕМА ЭКВИВАЛЕНТНОСТИ
ДЛЯ ВЫРОЖДЕННЫХ ¿-ОПТИМАЛЬНЫХ ПЛАНОВ
П. В. Шпилев
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7-9
В статье рассматривается проблема проверки заданного вырожденного плана на ¿-оптимальность. В качестве возможного решения формулируется общий вариант теоремы эквивалентности для ¿-оптимальных планов. Предлагается метод нахождения коэффициентов экстремального многочлена, в случае, когда данный многочлен не может быть однозначно определен по дисперсионной матрице плана. Библиогр. 14 назв. Ил. 1.
Ключевые слова: ¿-оптимальные планы, регрессионные модели Фурье, теорема эквивалентности, обобщенно-обратная матрица, обобщенно-обратная в смысле Мура—Пенроуза матрица.
1. Введение. Линейные по параметрам регрессионные модели широко используются на практике для описания различного рода зависимостей (см., [2, 3, 6, 13]). Целью эксперимента, как правило, является либо нахождение оценок неизвестных параметров модели, либо нахождение оценок некоторых функций от этих параметров, либо проверка гипотез относительно значений этих параметров. На точность полученных оценок влияют как выбор условий проведения экспериментов, так и метод оценивания. В качестве последнего на практике обычно используется метод наименьших квадратов (см. [4]), позволяющий находить оценки, наилучшие в классе линейных, несмещенных оценок. Дополнительно повысить точность полученных оценок можно благодаря разумному выбору условий проведения эксперимента, т. е. выбора точек, в которых проводятся измерения и весов, характеризующих отношение числа наблюдений проводимых в точке к общему числу наблюдений. Задача нахождения подходящего плана сводится к нахождению плана, доставляющего экстремальное значение некоторому функционалу, заданному на множестве информационных матриц. Такие функционалы имеют конкретный статистический смысл и называются критериями оптимальности (см. [4]).
Наиболее широкое распространение, в силу своей универсальности, получил V-критерий. Невырожденный ^-оптимальный план позволяет несмещенно оценить сразу все параметры модели (см., например, [13]). Однако во многих биологических и медицинских задачах большое значение играют отдельные параметры, которые необходимо оценить с наибольшей точностью [7, 14]. В последние годы большое внимание уделяется критериям оптимальности, отвечающим поставленным требованиям (см. [8-12]). В частности, широко используются в^-, с-, /'(х)-критерии. Все они являются частными случаями Ь-критерия: линейного критерия оптимальности.
Нахождение оптимального плана в явном виде является весьма сложной задачей. В большинстве случаев оптимальный план удается найти только численно. В связи с этим является весьма актуальной разработка инструмента проверки заданного плана на оптимальность. В настоящий статье рассматривается являющийся таким инструментом общий вариант теоремы эквивалентности для Ь-оптимальных планов. Особый интерес представляет случай вырожденного оптимального плана, так как для невырожденного данный результат хорошо известен (см., например, [4]). Во втором
разделе сформулированы основные понятия и определения. В третьем разделе рассматривается теорема эквивалентности и ее следствие, в котором определяется способ построения экстремального полинома для вырожденного плана. В заключение приводится пример использования теоретических результатов для проверки конкретного плана на оптимальность.
2. Основные понятия. Рассмотрим линейную по параметрам регрессионную модель
у = вт/(х) + е, ь е х, (1)
где /(х) = (/1(х),..., /т(х))т — вектор регрессионных функций, в = (в1,..., вт)т — вектор неизвестных параметров, е — случайная величина, характеризующая ошибки наблюдения, х — множество планирования. Мы будем предполагать стандартные допущения об ошибках и регрессионных функциях (см., например, [3, 5]). Также мы полагаем, что регрессионные функции образуют систему Чебышёва (см. [1]).
Под непрерывным планом эксперимента будем понимать вероятностную меру £ с конечным носителем на интервале планирования [—п,п]. Мера £ определяется таблицей
£ =(11 ... М , и е [-п,п], г = 1, 2 ,...,п.
... Шп)
Носитель плана £ состоит из точек, в которых проводятся наблюдения, а веса
1
удовлетворяют условиям wi > 0, "=1 wi = 1. Информационной матрицей Фишера
этого плана называется матрица
м(£) = (у* /(ь)/т(гЖг)^ е н2т+1-2т+1.
Вырожденным планом называется план, информационная матрица которого вырожденная.
Для заданной матрицы
2m
L = £ Mi
i=о
с векторами li G R2m+1 класс Sl определим как множество всех непрерывных планов эксперимента, для которых линейная комбинация параметров lTß, i = 0,..., k оцениваема, то есть li G Range M(£) (i = 0,..., k) (см., например, [6, (4а.2)]). Будем говорить, что непрерывный план п принадлежит классу S*L, если n G Sl и для любого непрерывного плана £ существует предел
lim fT(t)M +(£a)LM +(£a)f(t) = fT(t)M +(n)LM + (n)f(t), (2)
где £a = (1 - a)n + a£, a G [0,1].
Наконец, план £* будем называть L-оптимальным, если
£* = arg min trLM +(£),
где матрица L — фиксированная неотрицательно определенная и M + (£) — обобщенно-обратная в смысле Мура—Пенроуза матрица для M(£) (см., например, [6]).
3. Теорема эквивалентности для L-оптимального плана. Удобным инструментом проверки вырожденного плана на L-оптимальность, является следующая теорема (см. [12]):
Теорема 3.1. Пусть матрица L £ R(2m+i)x(2m+i) _ фиксированная, неотрицательно определенная матрица. Имеют место следующие утверждения:
(a) план £ £ SL тогда и только тогда, когда
lTM-(£)M(£) = lT, i = 0,..., 2m, где M-(£) _ обобщенно-обратная для M(£) матрица;
(b) план £* £ SL является L-оптимальным тогда и только тогда, когда существует такая матрица M-(£*), что
max y(t,£*) = trLM + (£*),
tex
где y>(t, £) = /T(t)M-(£*)LM-(£*)/(t). При этом в точках ti £ supp(£*) имеет место равенство
(c)
^(ti) = trLM+(n.
Доказательство данной теоремы повторяет стандартные рассуждения для невырожденного случая (см., например, [4]) и здесь приводиться не будет.
Замечание 3.1. Отметим, что в случае, когда оптимальный план является невырожденным, матрица M-(£*) из условия (b) совпадает с M-1(£*), а в случае, когда он вырожден и принадлежит классу эта матрица совпадает с M + (£*). Наиболее сложен случай, когда оптимальный план £* £ Sl и £ SL
Для проверки оптимальности плана в этом случае можно использовать теорему, сформулированную ниже.
Для некоторого вырожденного плана £ £ Sl, введем следующие обозначения:
D, (£) .= í Vij, если 0 < | lima^o M- 1(£а)| < то, ij 0, в противном случае,
где £а = ап + (1 — а)£, а £ [0,1], П — произвольный план, такой, что £а —невырожденный, Vij — обозначения для элементов матрицы. Отметим, что в силу симметричности, Vij = Vji,
D + (£) .= Г M+ (£), если lima^o M- 1(£a) = M+ (£), ij [ Dij(£), в противном случае.
Теорема 3.2. Пусть матрица L £ R(2m+1)x(2m+1) _ фиксированная, неотрицательно определенная матрица и оптимальный план £* £ SL и £ S*L (т. е. матрица D + (£*) не совпадает с матрицей M + (£)). Коэффициенты экстремального многочлена <^(t) плана £* могут быть найдены как решение системы уравнений
ф'(ti) = 0, в точках ti £ supp(£*)
^o(ti) =trLM + (£*),
где m = /T(t)-D +(£*)lD +(£*)/(t). 70
Данная теорема является следствием теоремы 3.1.
Приведем пример, как можно использовать эту теорему для проверки вырожденного плана на оптимальность.
Пример 3.1. Рассмотрим вырожденный Ь-оптимальный план, минимизирующий сумму дисперсий оценок параметров в2 и вз (т. е. коэффициентов при сов(Ь) и вш(2Ь)), в тригонометрической регрессионной модели третьего порядка на интервале [—п, п]
Рассмотрим тригонометрическую регрессионную модель третьего порядка у = вТ/(Ь) = во+в1 вт(Ь) + в2 сов(Ь) + в3 вт(2Ь) + в4 сов(2Ь)+в5 вт(3Ь)+вб сов(3Ь) + е.
Рассмотрим симметричный план
£а =
—п + х —х
1—а 1—а
4 4
0
а
х
1 -а 4
п — х
1-а 4
Из определения информационной матрицы следует, что для этого плана она имеет вид
М(£а) =
1 0 0 0 шо,4 0 0
0 ш1,1 0 0 0 ш1,5 0
0 0 ш2,2 0 0 0 ш2,6
0 0 0 шз,з 0 0 0
Шо,4 0 0 0 ш4,4 0 0
0 Ш1,5 0 0 0 ш5,5 0
0 0 Ш2,6 0 0 0 ш6,6
(3)
где ненулевые элементы ш^-
212к=0 /г(Ьк)/з(Ьк)ши, ^, шу —точки и веса плана £а. Отметим, что план, оптимальный для оценивания коэффициентов в2 и вз, минимизирует сумму соответствующих диагональных элементов псевдообратной матрицы М + (£). Другими словами, оптимальный план доставляет минимум функции
^ЬМ +(£), где Ь =
0000000 0000000 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0000000 0000000 0000000
на множестве всех планов, для которых параметры в2 и вз оцениваемы. Из вида матрицы М (£а) следует, что существует невырожденная симметричная матрица Р такая, что
РМ (£а)Р
ш2,2 0 ш2,6 0 0 0 0
0 шз,з 0 0 0 0 0
ш2,6 0 ш6,6 0 0 0 0
0 0 0 1 0 шо,4 0
0 0 0 0 ш1,1 0 Ш1,5
0 0 0 шо,4 0 ш4,4 0
0 0 0 0 ш1,5 0 ш5,5
/^М(£а) 0 V 0 Л?1(£а)
Следовательно, для симметричного плана от задачи нахождения плана, минимизирующего функцию ^ЬМ +(£), мы можем перейти к задаче поиска плана минимизирующего функцию
100
^ЬМ +(£а), где Ь= ( 0 1 0 | .
000
Проверим по теореме 3.1 на оптимальность план
5тг 7Г 7Г 5тг
е = ( I6 I6 ? ?
4 4 4 4
Пусть = (1 — а)£* + ап, где п = ^ ° г! отметим, что
16 32 16 16
Ит 1Тт+(С)Ш+(С)1(г) = -coS2(t)-fcoS(t)coS(Зt)+YSm2(2t)+-coS2(Ш) ^
16
16
т. е. план ф
Для данного плана матрицы I +(£*) и М +(£*) имеют вид
I 0 \ /I о <Л
в+(С)= I О I о и м+(П= о I о I .
^Уз1 0 0 \0 0 0,
Поведение функции на интервале [—
Экстремальный полином из теоремы 3.1 имеет вид
¥>(*) = f (t)D+ (Г (Г)/(t) =
= у cos2(t) - COS(t) cos(3í) + y sin2(2t) + yli cos2(3t);
г/31 = f находим из условия = 0. Отметим, что в точках носителя оптимального
плана функция y>(t) достигает своего максимума на [—п, п] :
max ^(t) = I) = = tr¿M+(r) =
te[-n,n] 6 6 3
Поведение экстремального полинома можно видеть на рисунке. Таким образом, для плана выполнены условия (b) и (с) теоремы 3.1 и, следовательно, данный план является L-оптимальным.
Литература
1. Карлин С., Стадден В. Чебышевские системы и их применение в анализе и статистике. М.,
1976.
2. Федоров В. В. Теория оптимального эксперимента. М., 1971.
3. Математическая теория планирования эксперимента / под ред. С. М. Ермакова. М.: Наука,
1983.
4. Ермаков С. М., Жиглявский А. А. Математическая теория оптимального эксперимента. М.: Наука, 1987.
5. Мелас В. Б. Общая теория функционального подхода к оптимальному планированию эксперимента. СПб.: Изд-во С.-Петерб. ун-та, 1999.
6. Рао С. Р. Линейные статистические методы и их применение. М.: Наука, 1968.
7. Currie A. J., Ganeshanandam S., Noition D.A., Garrick D., Shelbourne C.J. A., Oragguzie N. Quantiative evalution of apple (Malus x domestica Borkh.) fruit shape by prinicple component analysis of Fourier descriptors // Euphytica. 2000. Vol. 111. P. 219-227.
8. Dette H., Melas V. B. Optimal designs for estimating individual coefficients in Fourier regression models // Ann. Stat. 2003. Vol. 3. N5. P. 1669-1692.
9. Dette H., Melas V.B., Pepelyshev A. Optimal designs for estimating individual coefficients in polynomial regression — a functional approach // J. of Statis. Plan. and Inference. 2004. N118. P. 201219.
10. Dette H., Melas V. B., Shpilev P. V. Optimal designs for estimating the coefficients of the lower frequencies in trigonometric regression models // Ann. Inst. Stat. Math. 2007. Vol.59. N4. P. 655-673.
11. Dette H., Melas V. B., Shpilev P. V. Optimal designs for estimating pairs of coefficients in Fourier regression models. // Statistica Sinica. 2009. 19. P. 1587-1601.
12. Dette H., Melas V. B., Shpilev P. V. Optimal designs for trigonometric regression models. 2011 // Journal of Statistical Planning and Inference. Vol. 141, N 3. P. 1343-1353.
13. Pukelsheim F. Optimal Design of Experiments. New York: Wiley, 1993.
14. Young J. C., Ehrlich R. Fourier biometrics: harmonic amplitudes as multivariate shape descriptors // Systematic Zoology. 1977. Vol.26. P.336-342.
Статья поступила в редакцию 23 октября 2014 г.
Сведения об авторе
Шпилев Петр Валерьевич — кандидат физико-математических наук, доцент; [email protected]
THE THEOREM OF EQUIVALENCE FOR SINGULAR L-OPTIMAL DESIGNS
Petr V. Shpilev
St.Petersburg State University, Universitetskaya nab., 7-9, St.Petersburg, 199034, Russian Federation; [email protected]
In a present paper a general variant of the theorem of equivalence for singular L-optimal designs is considered. This theorem is a powerful instrument for checking whether given design is optimal. Particular attention is paid to the case of a singular design. It is shown in the paper that there exists a class of singular designs such that the extremal polynomial can't be determined unambiguously by the dispersion matrix of design from this class. It is offered a method which allows to find a coefficients of the extremal polynomial in this case. This method is illustrated by an example. Refs 14. Figs 1.
Keywords: L-optimal designs, Fourier regression models, equivalence theorem, general inverse of information matrix, Moore—Penrose inverse of information matrix.
References
1. Karlin S., Studden W. J., Tchebychev systems: with applications in analysis and statistics (Interscience, New York, 1966).
2. Fedorov V. V., Theory of Optimal Experiments (Academic Press, New York, 1972).
3. S. M. Ermakov (ed.) Mathematical Theory of Experiment Planning (Nauka, Moscow, 1983) [in Russian].
4. Ermakov S.M., Zhigljavsky A. A., Mathematical Theory of Optimal Experiment 320 pp. (Nauka, Moscow, 1987) [in Russian].
5. Melas V. B., Functional approach to optimal experimental design (Springer-Verlag, New York, 2006).
6. Rao C.R., Linear Statistical Inference and Its Applications Second Edition (New York, John Wiley & Sons, Inc., 1973).
7. Currie A. J., Ganeshanandam S., Noition D.A., Garrick D., Shelbourne C.J. A., Oragguzie N., "Quantiative evalution of apple (Malus x domestica Borkh.) fruit shape by prinicple component analysis of Fourier descriptors", Euphytica 111, 219-227 (2000).
8. Dette H., Melas V. B., "Optimal designs for estimating individual coefficients in Fourier regression models", Ann. Stat. 3(5), 1669-1692 (2003).
9. Dette H., Melas V. B., Pepelyshev A., "Optimal designs for estimating individual coefficients in polynomial regression — a functional approach", J. of Statis. Plan. and Inference 118, 201-219 (2004).
10. Dette H., Melas V. B., Shpilev P. V., "Optimal designs for estimating the coefficients of the lower frequencies in trigonometric regression models", Ann. Inst. Stat. Math. 59(4), 655-673 (2007).
11. Dette H., Melas V. B., Shpilev P. V., "Optimal designs for estimating pairs of coefficients in Fourier regression models", Statistica Sinica 19, 1587-1601 (2009).
12. Dette H., Melas V. B., Shpilev P. V., "Optimal designs for trigonometric regression models", Journal of Statistical Planning and Inference 141(3), 1343-1353 (2011).
13. Pukelsheim F., Optimal Design of Experiments (Wiley, New York, 1993).
14. Young J. C., Ehrlich R., "Fourier biometrics: harmonic amplitudes as multivariate shape descriptors", Systematic Zoology 26, 336-342 (1977).