Научная статья на тему 'D-оптимальное планирование для полиномиальной регрессии: выбор степени и робастность'

D-оптимальное планирование для полиномиальной регрессии: выбор степени и робастность Текст научной статьи по специальности «Математика»

CC BY
744
194
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Антиль Жерар, Вайнберг-аллен Анна Львовна

Выбор степени регрессии является одной из основных проблем полиноминальной регрессии. В литературе по оптимальному планированию, как правило, предполагается, что статистическая модель известна. Однако на практике точная степень полиноминала достоверно не известна. Более того, используемый план экспериментов может не соответствовать оптимальному, полученному на основе аналитического решения задачи. В настоящей работе мы обращаем внимание на то, что для D-оптимального планирования, отклонения от плана экспериментов гораздо менее важны, чем от модели. Таким образом, на основании D-оптимальности, мы предлагаем правило для выбора степени регрессии. Мы также исследуем различные типы отклонений от модели для определения нового класа D-оптимальных планов экспериментов, который для анализируемых моделей устойчив и более эффективен, чем равномерные планы экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «D-оптимальное планирование для полиномиальной регрессии: выбор степени и робастность»

№4(8) 2007

Ж. Антиль, А. Вайнберг-Аллен

D-оптимальное планирование для полиномиальной регрессии: выбор степени и робастность

Выбор степени регрессии является одной из основных проблем полиноминальной регрессии. В литературе по оптимальному планированию, как правило, предполагается, что статистическая модель известна. Однако на практике точная степень полиноминала достоверно не известна.

Более того, используемый план экспериментов может не соответствовать оптимальному, полученному на основе аналитического решения задачи. В настоящей работе мы обращаем внимание на то, что для й-оптимального планирования, отклонения от плана экспериментов гораздо менее важны, чем от модели. Таким образом, на основании й-оптимальности, мы предлагаем правило для выбора степени регрессии.

Мы также исследуем различные типы отклонений от модели для определения нового класа й-оптимальных планов экспериментов, который для анализируемых моделей устойчив и более эффективен, чем равномерные планы экспериментов.

Рассмотрим E ( y | x) - fT (x)P — модель общей полиномиальной регрессии с гетеро-скедастичной ошибкой V(y |x) = ст2/X(x), где X(x) >0 — функция эффективности эксперимента.

План эксперимента является вероятностной мерой 2, определенной в области значений x. Оптимальный план минимизирует (или максимизирует) Фт, являющуюся некой выпуклой

(или вогнутой) функцией информационной матрицы M(2) - jMx)fT (x)f(x)d2(x).

Фm(M(2)) - [trace(M(2))-1]1/m определяет набор классических критериев. При m - 1 мы получаем Л-оптимальность. При m ^да E-оптимальность определяется через собственные значения матрицы. D-оптимальность соответствует m ^ 0.

D-оптимальные планы хорошо известны благодаря важному классу функций эффективности [Fedorov (1972)]. Антиль [Antille (1977)] предложил обобщенную версию результатов Федорова. Антиль, Дет и Вайнберг [Antille, Dette, Weinberg (2001)] предложили найденные аналитически D-оптимальные планы для функций эффективности ^(x)-(1+ x2)a+1exp(2p arctan(x)) и M x ) - x -< exp(-S/x ).

Более подробно об оптимальных планах эксперимента рассказывается в монографиях [Fedorov (1972)], [Silvey (1980)], [Atkinson, Donev (1992)] и [Pukelsheim (1993)].

Краткое изложение

65

<» Российско-швейцарский семинар по эконометрике и статистике

и о

N94(8) 2007

Для сравнения планов в терминах О-оптимальности, мы определяем О-эффективность

произвольного плана 2 относительно оптимального плана 2 как Ое(( - ^. Стандартизированная О-эффективность есть п-й корень О-эффективности, где п — степень полиномиальной регрессии.

Численные результаты, приведенные в различных графиках статьи, указывают на то, что возмущения граничных точек оказывают более значительное влияние на О-эффективность, чем возмущения любых других точек.

На практике точная степень полинома достоверно не известна. В этом разделе мы анализируем поведение детерминанта информационной матрицы относительно степени полиномиальной регрессии для классических функций эффективности. Для функций эффективности, удовлетворяющих х)|< 1для х £ [-1;+1], стандартизированный детерминант информационной матрицы является убывающей функцией степени регрессии. Обратное верно для ¡3 функций эффективности Лагерра.Таким образом, для О-оптимальных планов, генерируемых | полиномами Лежандра и Якоби, обобщенная дисперсия является возрастающей функцией степени регрессии. Для функций эффективности Лагерра, или обобщенного Лагерра, а верно обратное. В случае функции эффективности Эрмита общей закономерности не суще-$ ствует. <и

и

I

м

Таким образом, при анализе О-оптимальности можно сформулировать правило выбора степени регрессии. Для гомоскедастичных случаев и для функций эффективности типа Якоби степень регрессии должна быть «наименьшей приемлемой». Для функций эффективности Лагерра степень регрессии должна быть «наибольшей приемлемой». Для функции Эрмита ¡5 каждый случай должен изучаться отдельно. 8 В качестве иллюстрации в табл. 1 приводятся стандартизированные детерминанты

^ О-оптимальных планов для различных функций эффектиности.

о.

I

-о §

1 даже для достаточно небольших отклонений от линейности и показывавшего, что равно-

I

5

о мальные.

Л Как видно из табл. 2, отклонение от модели в большей степени влияет на величину стандартизированного детерминанта, чем отклонения от оптимального плана. Мы видим также, что в равномерных планах с увеличением количества точек значения стандартизированных детерминантов также монотонно возрастают.

Анализ, приведенный в этой части исследования, был мотивирован исследованиями Хьюберта [ИиЬег (1975), (1981)], указавшего, что Э-оптимальные планы крайне неробастны даже для достаточно небольших отклонений от линейности и показывавшего, что равномерные планы демонстрируют гораздо более удовлетворительное поведение, чем опти-

И, наконец, мы определяем новый класс планов (О-оптимальные планы более высокого порядка), который одновременно (1) более эффективен, чем равномерные планы, и (2) так же робастен как и равномерные планы и, следовательно, семейство О-оптималь-ных планов более высокого порядка может считаться почти оптимальным устойчивым се-§ мейством аппроксимированных планов, где, по определению, О-оптимальные планы о более высокого порядка являются О-оптимальными планами порядка к для степени регрессии I < к.

66

Российско-швейцарский семинар по эконометрике и статистике

i Надоели баннеры? Вы всегда можете отключить рекламу.