Научная статья на тему 'Проверка гипотезы адекватности статистической модели при ротатабельном планировании эксперимента'

Проверка гипотезы адекватности статистической модели при ротатабельном планировании эксперимента Текст научной статьи по специальности «Математика»

CC BY
1074
162
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТОР / РЕГРЕССИОННАЯ МОДЕЛЬ / ДИСПЕРСИЯ / АДЕКВАТНОСТЬ / ГИПОТЕЗА / ЗНАЧИМОСТЬ / РОТАТАБЕЛЬНОСТЬ / КОЭФФИЦИЕНТ / ЦЕНТР ПЛАНА / ОТКЛИК / ЭКСПЕРИМЕНТ / FACTOR / REGRESSION MODEL / VARIANCE / ADEQUACY / HYPOTHESIS / SIGNIFICANCE / ROTATABILITY / COEFFICIENT / CENTER POINT OF DESIGN / RESPONSE / EXPERIMENT

Аннотация научной статьи по математике, автор научной работы — Сидняев Н.И., Говор С.А.

Рассмотрены элементы множественного регрессионного анализа, являющиеся основой для расчета оценок параметров при построении модели процесса. Приведены специальные планы, которые используются при обработке экспериментальных данных и описан метод наименьших квадратов применительно к задачам построения математических моделей. Обсуждены вопросы оптимального планирования эксперимента для построения математической модели в виде линейной комбинации линейных и квадратических функций входных факторов с неизвестными параметрами. Представлены полные и дробные факторные планы, а также композиционные ортогональные и ротатабельные планы эксперимента для квадратичных моделей. Рассмотрены ситуации, в которых вид регрессионной модели точно неизвестен исследователю и постулируется им. Изучено смещение оценок параметров постулируемой модели, вызванное ее несовпадением с истинной. Рассмотрена связь между этими вопросами и вопросами проверки общей линейной гипотезы при анализе параметров модели. Описаны методы выделения существенных факторов, которые необходимо учитывать при построении математических моделей

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сидняев Н.И., Говор С.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HYPOTHESIS TEST OF STATISTICAL MODEL ADEQUACY IN THE ROTATABLE EXPERIMENT DESIGN

The elements of multiple regression analysis which are the basis to calculation parameter estimates necessary for constructing the process model are considered. Special plans used in experimental data processing are presented and the least square method applied to the tasks of mathematical models construction is described. The questions of optimal experiment design to construct mathematical models as a linear combination of linear and quadratic functions of input factors with unknown parameters are discussed. Complete and fractional factorial designs, as well as composite orthogonal and rotatable experimental designs for quadratic models are presented. The situations in which a regression model form is unknown exactly to a researcher and is postulated by him are considered. The parameter estimates bias of a postulated model caused by its noncoincidence with the true is studied. The connection between these issues and the ones of general linear hypothesis testing in the model parameters analysis is examined. The methods of important factors to be considered in mathematical models construction are described

Текст научной работы на тему «Проверка гипотезы адекватности статистической модели при ротатабельном планировании эксперимента»

ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

DOI: 10.18698/1812-3368-2016-1-3-16 УДК 519.24

ПРОВЕРКА ГИПОТЕЗЫ АДЕКВАТНОСТИ СТАТИСТИЧЕСКОЙ МОДЕЛИ ПРИ РОТАТАБЕЛЬНОМ ПЛАНИРОВАНИИ ЭКСПЕРИМЕНТА

Н.И. Сидняев, С.А. Говор

МГТУ им. Н.Э. Баумана, Москва, Российская Федерация e-mail: sidnyaev@yandex.ru; govor_sa@mail.ru

Рассмотрены элементы множественного регрессионного анализа, являющиеся основой для расчета оценок параметров при построении модели процесса. Приведены специальные планы, которые используются при обработке экспериментальных данных и описан метод наименьших квадратов применительно к задачам построения математических моделей. Обсуждены вопросы оптимального планирования эксперимента для построения математической модели в виде линейной комбинации линейных и квадратических функций входных факторов с неизвестными параметрами. Представлены полные и дробные факторные планы, а также композиционные ортогональные и ротатабельные планы эксперимента для квадратичных моделей. Рассмотрены ситуации, в которых вид регрессионной модели точно неизвестен исследователю и постулируется им. Изучено смещение оценок параметров постулируемой модели, вызванное ее несовпадением с истинной. Рассмотрена связь между этими вопросами и вопросами проверки общей линейной гипотезы при анализе параметров модели. Описаны методы выделения существенных факторов, которые необходимо учитывать при построении математических моделей.

Ключевые слова: фактор, регрессионная модель, дисперсия, адекватность, гипотеза, значимость, ротатабельность, коэффициент, центр плана, отклик, эксперимент.

HYPOTHESIS TEST OF STATISTICAL MODEL ADEQUACY IN THE ROTATABLE EXPERIMENT DESIGN

N.I. Sidnyaev, S.A. Govor

Bauman Moscow State Technical University, Moscow, Russian Federation e-mail: sidnyaev@yandex.ru; govor_sa@mail.ru

The elements of multiple regression analysis which are the basis to calculation parameter estimates necessary for constructing the process model are considered. Special plans used in experimental data processing are presented and the least square method applied to the tasks ofmathematical models construction is described. The questions of optimal experiment design to construct mathematical models as a linear combination of linear and quadratic functions of input factors with unknown parameters are discussed. Complete and fractional factorial designs, as well as composite orthogonal and rotatable experimental designs for quadratic models are presented. The situations in which a regression model form is unknown exactly to a researcher and is postulated by him are considered. The parameter estimates bias

of a postulated model caused by its noncoincidence with the true is studied. The connection between these issues and the ones of general linear hypothesis testing in the model parameters analysis is examined. The methods of important factors to be considered in mathematical models construction are described.

Keywords: factor, regression model, variance, adequacy, hypothesis, significance, rotatability, coefficient, center point of design, response, experiment.

Введение. В последние десятилетия происходит неуклонное расширение сферы приложения методов математического планирования эксперимента. Эти методы успешно используются для повышения эффективности экспериментальных исследований, поиска оптимальных технологических режимов производственных процессов, выбора конструктивных параметров изделий, состава многокомпонентных систем и т.д.

Основное внимание в современных исследованиях сосредоточено на оценивании функций отклика и проверке адекватности гипотез, линейных относительно неизвестных параметров. Задача оценивания многомерной функции отклика сводится к задаче оценивания одномерной функции отклика. Такой подход позволяет применять единый метод оценивания при решении обеих задач. Принятая точка зрения на задачи прикладного многомерного регрессионного анализа существенно упрощает их понимание и в дальнейшем активно используется при изложении проверки гипотезы. Методы построения доверительных интервалов и областей, а также проверки общей линейной гипотезы широко применяются в экспериментальных исследованиях для получения более полного представления о значениях параметров модели и выявления среди них статистически незначимых. В таких экспериментах каждый фактор варьируется на двух уровнях. Методы факторного эксперимента используются для исследования совместного влияния факторов на поведение функции отклика и построения качественных регрессионных моделей. При оценивании коэффициентов регрессии стремятся уменьшить избыточность опытов в факторном эксперименте. Для этого часто применяют регулярные дробные реплики, также используемые в экспериментах, в которых число опытов ограничено и заведомо меньше числа неизвестных параметров модели. В этом случае теория оценивания может быть построена на основе применения моделей наблюдений неполного ранга.

Построению и изучению свойств линейных оптимальных планов, используемых в задачах взвешивания предметов, поиска экстремума функции отклика, при построении качественных моделей функции отклика, посвящены работы [1-4]. Задача построения линейных оптимальных планов решена на основе теоремы Бокса [5]. Отмечено свойство ротатабельности линейных оптимальных планов при некоторых ограничениях, налагаемых на матрицу плана [6-8].

Задача планирования экстремальных экспериментов рассмотрена в работах [9-11]. Методы планирования экстремальных экспериментов получили широкое распространение в практических исследованиях. Среди них наиболее известен метод Бокса - Уильсона, основанный на методе наискорейшего подъема и статистического оценивания градиента, а также его проверки на адекватность. Особенность изложения работ [11-13] заключается в последовательном рассмотрении метода наискорейшего подъема, проблемы статистического оценивания градиента, метода Бокса - Уильсона. Раздельное изложение методов наискорейшего подъема и метода Бокса - Уильсона обусловлено стремлением показать, что метод Бокса - Уильсона представляет собой естественное развитие метода наискорейшего подъема, когда измерение функции многих переменных происходит с погрешностью.

Статистический анализ регрессионной многомерной модели. При построении регрессионных моделей в планировании эксперимента наибольший интерес часто представляет оценивание самой функции отклика, а не ее коэффициентов. Априори неизвестно, в каких точках факторного пространства может возникнуть при таком исследовании необходимость нахождения оценок функции отклика. Может оказаться, что в точках, одинаково удаленных от центра плана, дисперсия этих оценок будет существенно различаться. Другими словами, точность оценивания функции отклика в общем случае для планов второго порядка и выше является неодинаковой по различным направлениям факторного пространства. Это вызывает определенные затруднения при исследовании стационарной области. Исключение в этом отношении составляют ротатабельные планы, получившие значительное распространение в практических работах.

План порядка d будет ротатабельным, если дисперсия

(х1,х2,... ,хк )| оценки П (х1,х2,...,хк) функции отклика

п(х1, х2,..., хк) в точке (х1, х2,..., хк)' зависит лишь от расстояния р(х1, х2,..., хк) от этой точки до центра плана и не зависит от ее положения на гиперсфере. Статистический анализ регрессионной модели состоит из решения следующих задач:

22

— оценка дисперсии воспроизводимости а2 = а2,

— проверка адекватности модели;

— оценка значимости коэффициентов модели.

Для решения перечисленных задач необходимо сделать дополнительное допущение (к уже сделанным двум) о законе распределения случайной величины е^. Предположим, что е^ ~ N(0, а), г = 1,..., п, т.е. в каждой точке х» € X погрешность е» имеет нормальный закон распределения с параметрами 0 и а. Таким образом, измеренное в г'-й

точке х« € X значение отклика у« также имеет нормальный закон распределения с параметрами Му« = <^(ж) и Бу« = а2: у« ~ N [<^(ж),а]. Это допущение позволяет использовать для решения указанных задач аппарат теории проверки статистических гипотез.

При оценивании точности модели требуется знать дисперсию воспроизводимости а2, причем при ее оценке следует одновременно про-

2

верять допущение о постоянстве дисперсии ау в различных точках Х [14-17]. Чтобы оценить дисперсию воспроизводимости а2 = ау2, необходимо иметь параллельные наблюдения в каждой точке х« € X [9-11].

Если у«1, у«2, у«3,..., у^,..., УгГг — значения отклика в точке X, то наилучшая оценка дисперсии у« в этой точке а2 = Бу« имеет вид (при

1 Г

г« = г).: а2 ~ £2 = -- £(уу - у«)2.

г - 1 ¿=1

Для проверки справедливости допущения о постоянстве дисперсии ау2 проверяем гипотезу Н0 : а2 = а2 по критерию Кохрена (на некотором уровне значимости а). Если гипотеза Н0 принимается, то

можно получить усреднением оценок £2;

общую оценку дисперсии можно получить усреднением оценок S2:

.. n r

а2 ^ S 2 = nr^T) - у-)2 •

v ' -=i j=i

При отклонении гипотезы H0 необходимо проанализировать причины ее отклонения и принять меры для обеспечения однородности Dy- = а2 (например, сужая область проведения эксперимента П С X).

Отметим, что возможность проверки гипотезы H0 обеспечена допущением о нормальности распределения погрешностей [7-9]:

nn

S2 = £ a-S2, а- = (r- - 1)/ £(r- - 1). i=i i=i

i ^

Регрессионная модель y (x) = ^^ ßк fk (E) является наилуч-

k=0

шей в аппроксимирующем пространстве L, зависящем от вида и числа базисных функций {fk(E)}1, если погрешность 8 = ||y- — y-Ц =

n

= £(y-- У (x-))2 = min.

k=i

Однако это не означает, что величина 8 нас удовлетворяет, и регрессионная модель может быть признана адекватной (хорошо согласующейся с наблюдениями y-j). Все зависит от того, насколько погрешность 8 велика на фоне "шума", связанного с погрешностями эксперимента Общую погрешность регрессионной модели, называемую остаточной суммой квадратов отклонений Q0, можно предста-

П Т-1 П П Т-1

ВИТЬ В виде - У г)2 = ^ Гг(У'— У ^ ~

г=1 3=1 г=1 г=1 3=1

п

где Q1 = гг{Уг— Уг)2 = $ — сумма квадратов отклонений, обу-

г=1 п Т1

словленная неадекватностью модели; Q2 = ^^ — Уг)2 — сумма

г=1 3=1

квадратов отклонений отклика, обусловленная погрешностью эксперимента.

Если сумма Q1 не велика по сравнению с суммой Q2, то расширять пространство Ь за счет, например, увеличения числа членов разложения l в регрессионной модели, нецелесообразно и модель следует признать адекватной. Эти качественные рассуждения на языке математической статистики означают проверку гипотезы Н0 адекватности модели, состоящей в том, что МУ = Гв против альтернативы Н1:МУ = Г в, где F — выбранная матрица независимых переменных, определяющая вид регрессионной модели.

Можно показать, что независимо от того, истинна гипотеза Н0 или

п

нет, величина Q2/о2 имеет х2-распределение с ^^(гг — 1) степенями

г=1

свободы. Величина sl = Q2 / ^^(r — 1) совпадает с оценкой и явля-

з2

' г=1

22

ется несмещенной оценкой дисперсии воспроизводимости о2 = од.

Аналогично можно показать, что если гипотеза Н0 истинна, то величина Q2/о2 имеет х2-распределение с п — V — 1 степенями свободы, где I' = I + 1 — число неизвестных параметров регрессионной модели. При этом величина = Q1/(n — I' — 1) представляет собой

22

несмещенную оценку о2 = од и называется дисперсией, связанной с неадекватностью модели. Таким образом, если гипотеза Н0 — истинная, то отношение имеет вид /$1 ~ Г(и1,и2), и1 = п — I — 1;

п

у2 = — 1), т.е. имеет F-распределение Фишера с и1 и у2 степе-

г=1

нями свободы, следовательно, проверка гипотезы Н0 осуществляется стандартным способом по критерию Фишера. Если найдено табличное значения критерия Фишера Гт(р1,р2, а), отвечающее уровню значимости а, то гипотеза Н0 принимается при в^/э2 < Гт(р1,р2,а) и отклоняется в противном случае. Отклонив гипотезу Н0, необходимо строить более сложную модель, увеличив, например, число базисных

функций, выбрав другой их набор </ (

Некоторые базисные функции / (Е) могли быть включены ошибочно в регрессионную модель, т.е. на самом деле отклик у не зависит

от функции /к (Е), поэтому соответствующий коэффициент вк должен

быть равен нулю. При этом оценка не равна нулю (вк = 0), хотя и близка к нему. Проверка значимости коэффициента вк означает проверку гипотезы Н0: в к = 0 против альтернативной гипотезы H1: в к = 0.

Если вк— 0 и гипотеза Н0 принимается, то коэффициент вк полагается незначимым и соответствующий член исключается из регрессионной модели.

Проверка гипотезы Н0 основывается на том, что оценка вк имеет нормальный закон распределения M вк = 0 и D вк = (^к — ^-й

элемент на диагонали матрицы ковариации D вк), так как оценка вк линейно зависит от наблюдений уг (или уг), которые по предположению распределены нормально. Следовательно, можно использовать

критерий Стьюдента Т = вк —М вк = Ёк ^ — #(V = N), где

D в к ^

n

N = ^^ гг — общее число опытов. Если найдено табличное значе-

г=1

ние Т(^ а) критерия Стьюдента со степенями свободы ^ = пг при гг = г) и уровнем значимости а, то гипотеза Н0 принимается при

в к /ве < Т (^ а) и отклоняется в противном случае.

Проверка гипотезы адекватности модели в точках многофакторного плана. При анализе многофакторных экспериментов проводят проверку гипотезы Н0 : М|У| = Х°Ъ° против альтернативной гипотезы Щ: М(у| = х°в°, где в° = ^,в1 ,...,вР°0)', Ро — число неизвестных параметров. Для проверки гипотезы Н0 необходимо определить отношение /в2. В многомерном факторном эксперименте величина представляет собой несмещенную оценку дисперсии а2:

1 _ _ _ 1

= т.-(y'y - y'v-1Y), где y = fo,y2,..., yj'; y = - £ yls

N - ^ т

в=1

I = 1, 2,..., п. Поскольку v-1 = т1п, то

*2 = - т^'у),

или

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 / п т п

*2 = ЕЕ- т Еу2).

м=1 в=1 г=1

Здесь 1п — единичная матрица порядка п; т — число параллельных наблюдений. Оценка дисперсии а2, связанная с неадекватностью модели, составляет в2 = ^1/(п — г), г — ранг матрицы независимых

переменных x°. Величина Q1 = y v-1y - в°'x°'y, ¡3°' — МНК-оценка вектора в°; x° = (xj), l = 1,... ,n; j = 0,1,... ,p0 — матрица, состоящая из n различных строк матрицы x°.

Пусть rank x° = r = p0 + 1, тогда rank x° = p0 + 1 и МНК-оценка равна в°° = (x°'x°)-1 x°'y = (x^X^X'y. В силу ортогональности планирования запишем в°° = (1/n)x°'y [3]. Поэтому Qi = my'y - N||в°||2 или

ро . . 2

]

j=i

Qi — mJ2Vi2 - ^(Д

1

где Д° = n Y1 x°jlуЛ j — 0, 1... ,Р- Гипотеза Hq отклоняется, если

i

/ n

тгг 2

р0 - • 2

2 (N - n) ( т^У12 - ^(Д

]

1 j=Q

г2 / n m

> Fa;n—r,N—ni

(n-r) ^У2 -mYlyl2

\l=1 s=1 l=1

где r — po + 1.

В матричной записи гипотеза HQ отклонятся, если

(N - n) (mY'Y - N\\Д°\\2)

°2

> Fa;n—r,N—n.

(n - r)(y'y - my y)

Проверка гипотезы адекватности модели возможна лишь при ненасыщенном планировании: rank x° = r < n (n — число различных точек плана).

Поверка гипотезы адекватности модели при поиске экстремума. При поиске экстремума функции отклика часто после проведения факторного эксперимента выполняют проверку гипотезы адекватности модели. Эта проверка возможна лишь при ненасыщенном планировании. Ее особенность определяется видом модели, аппроксимирующей поверхность отклика в окрестности центра плана, наличием повторных наблюдений в точках плана и его центре, структурой плана. Различные варианты проверки гипотезы адекватности модели при поиске экстремума и ненасыщенном планировании предложены ниже.

Предположим, что при построении факторного эксперимента и оценивании градиента исследователь полагает, что функция отклика

Р0

имеет вид п = ^^ fj(x1,x2,..., xkгде fO) — известные функции;

3=0

— неизвестные параметры.

Рассмотрим проверку гипотезы Но, состоящей в том, что модель адекватна. Пусть ю = (ж^), г = 1,...,к; и = 1,...,^ — матрица полного или дробного факторного эксперимента с повторными наблюдениями у1, у2,... , уП0 в центре плана. Очевидно, что N = п + + п0, где п = 2к-9. Примем, что матрица независимых переменных x = (ж^), ] = 0,1,... ,р0; и = 1,..., N, соответствующая функции отклика, является матрицей ортогонального планирования и удовле-

N N

творяет условиям ж2и = п, ] = 0,1,..., р0; ^^ ж0и = N.

и=1 и=1

Обозначим через у1,у2,... ,yN наблюдения в точках плана. Тогда ууп+1 = у°, I = 1,... ,п0. Так, если имеется полный факторный эксперимент 22 с повторными наблюдениями у1, у2, у3 в центре ротатабель-ного плана, то

d

/ -1 -1 ^ Vi

1 -1 ^ V2

-1 1 ^ V3

1 1 ^ V4

0 0 ^ V5

0 0 ^ V6

V 0 0 ^ V7

где у1 = уб; у2 = уе; у3 = уг; п = 22 = 4; N = 7. В этом случае гипотеза Н0 может состоять в том, что адекватна модель п = в0 + + в°Ж1 + в2 Х2.

Несмещенная оценка дисперсии наблюдений а2 равна

^2 1

=

N - (n + 1)

n о

По - 1 ^ 0 i=1

(v0 - Уо)2.

no

Здесь n +1 — число различных точек плана; y0 = (1/n0) ^^

Vi

i=1

Оценка параметра а2, обусловленная неадекватностью модели, составляет = ^1/(п +1 — г), г = р0 + 1 — ранг матрицы x. Легко заметить, что п +1 — г = п — р0. Величина = — ф2, при этом = у'у-1у — в°'х'у, или Ql = у'у-1¥ — в0/х'хвгде

в° = (х°'х°)-1х°'у; у = (у1, у2,..., уп, у,)';

/1 0 ... 0 \ 0 1 ... 0

v-1 =

\ 0 0

in

0

0 По

по )

Поскольку имеет место ортогональное планирование, получим

п Р0 2

з = Е у2и+поУо2 - — Е (3°) -

и=1 3=1

~ 1 * ~ 1 *

Здесь в; = - Е Х'иУи, 3 = 1, 2,...,ро; в0 = N Е хоиУи-

и=1 и=1

Для матрицы плана и функции отклика запишем

-0 - 1 = 2; — - Ро = 2; — = 4; N = 7; Л 1 7 Л 1

Дэ° = 7 ^ уи; ¡3°1 = 4(-у1 + У2 - Уз + У4);

и=1

32 = 4(-У1 - У2 + Уз + У4).

Гипотеза Но отклоняется, если > Ра;п_р0,п0_1. Здесь порого-

вое значение Га.п_р0п0_1 определяется из условия Р{Гп_Р0П0_1 > > Га.п_.р0.п0_1} = а, где Гп_р0.п0_1 — случайная величина, имеющая распределение Фишера с — - ро и —о - 1 степенями свободы.

Задача проверки гипотезы адекватности модели, когда матрица плана оо = (х°и), г = 1,...,к; и = 1,...,Щ, является матрицей плана факторного эксперимента с кратными повторными наблюдениями {Уи}, I = 1, 2,...,—; в = 1,... ,т; N = т—, и когда наблюдения в центре плана отсутствуют, рассмотрена ниже.

Если х° = (х°и), 3 = 0,1,... ,ро; и = 1, 2,..., N — матрица независимых переменных, то гипотеза Но отклоняется при выполнении неравенства

п р0

(N0 - n) rnJ^Vi2 - ß

2

j

2

S2 __У 1=1_j=0 . > F

s2 / n m n \ > Fa\n—r,No—n,

e

(— - г) (Е Еу«« - т Е У'2

1=1 в=1 1=1

1 N0 1 т

где г = Ро + 1; 3° = — Ех°и3 = 1,2,...,ро; У = — ЕУ1з

N0 ги т

и=1 в=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I = 1, 2,...,—.

Предположим, что в центре плана также имеются повторные наблюдения у1 ,у2 ,...,уП0 ■

о = , о°

Здесь ю0 = (х°п), г = 1,..., к; и = 1,..., N0; N0 = ши — матрица факторного плана с повторными наблюдениями {у^}; 0 — нулевая матрица размером и0 х к. Очевидно, что ю = (х^), г = 1,...,к; и = 1,..., N — матрица размером N х к, N = N0 + и0. В этом случае несмещенная оценка параметра а2 равна

=

N - (n + 1)

п 0

ЕЕ(^ - у)2 + Е(у0 - У0)2

1=1 в=1 г=1

При f (0, 0,..., 0) = во матрица независимых переменных x = (х.,-«), 3 = 0,1,..., р0; и = 1, 2,..., N, удовлетворяет условиям

N N

Ех0и = N; Ех2« = N 3 = 0,1,...,Р0;

и=1 и=1

N

х]и = 0, г,з' = 0,1,2,...,Р0; г = 3

и=1

Оценка параметра а2, связанная с неадекватностью модели, составляет = $1/(и + 1 - г) = $1/(и - Р0), где г = Р0 + 1;

п Ро 2

$1 = ш Е у2 + И0У0 - N0 Е (в?) - ^02, причем

1=1 ¿=1

- 1 / " _ А ~ 1

/30 = n I mEy+n°y° I; = nExjuy«,j =1,2,...,p0.

/ N0 п

-1 / и=1

Гипотеза Н0 отклоняется, если ^г/^; > Еа;п_р01п<, и* = N - (и +1).

Проверка гипотезы адекватности модели при ротатабельном планировании. Пусть ю = (х^), г = 1,..., к; и = 1,..., N — матрица плана второго порядка, а x = (х^), 3 = 0,1,... ,р; и = 1, 2,..., N — соответствующая ей функция отклика матрицы независимых переменных.

Рассмотрим задачу проверки гипотезы адекватности модели. Обозначим через у1,у2,... наблюдения в точках плана. Примем, что повторные наблюдения {у0п}, и = 1, 2,... ,и0, имеются лишь в центре плана. В принятых обозначениях у0п = у^_п0)+п, и = 1, 2,... ,и0. Далее

п0 1 п0

$2 = Е(У0« - У«^ У« = — Е У0и.

и0

и=1 и=1

Число различных точек плана и = N - и0 + 1, поэтому величина = $2/ (N - и) = $2/ (и0 - 1), будет несмещенной оценкой дисперсии наблюдений а2. Сумма квадратов = - $2,

где ф! = у'у - З'х'у, причем в = (х'х)_1х'у. Величина

= ф1/ (и - г), г = р+1 = (к+1)(к+2)/2 — рангматрицы x, равный числу неизвестных коэффициентов в уравнении. Гипотеза адекватности модели отклоняется, если ^г/^2 > Еа;п_г п0_1. Здесь пороговое значение Еа;п_г,п0_1 определяется из условия Р{Еп_Г1п0_1>Еа;п_г,п0_1} = = а, где Еп_гп0_1 — случайная величина, имеющая распределение Фишера с и - г и и0 - 1 степенями свободы.

При отклонении гипотезы для описания поверхности отклика могут быть использованы полиномы третьей степени. При этом планирование эксперимента может осуществляться с помощью ротатабельных планов третьего порядка. Для них так же, как и для планов второго порядка, могут быть аналогичным способом сформулированы необходимые и достаточные условия ротатабельности. В случае принятия гипотезы дальнейшее исследование сводится к исследованию поверхности второго порядка.

Заключение. Подробно изложена проблема проверки гипотезы адекватности модели при использовании теории планирования эксперимента. В формальной постановке сформулирована общая задача проверки адекватности моделей. Дана исходная постановка задачи проверки гипотезы адекватности линейной модели наблюдений. Задача проверки гипотезы адекватности функции отклика сформулирована как задача проверки гипотезы адекватности линейной модели наблюдений. Показано, что хотя задача проверки гипотезы адекватности может быть сформулирована в терминах задачи проверки общей линейной гипотезы, отличие ее от последней весьма существенно. Введены понятия истинной и адекватной моделей с использованием теории планирования эксперимента. Особое внимание уделено различию этих понятий при ротатабельном планировании. Установлено, что если модель истинна, то она также будет и адекватной. Обратное утверждение неверно. Приведены необходимые и достаточные условия существования адекватных моделей. Из этих условий следует, что адекватная модель не единственна. Кроме того, класс адекватных моделей бесконечен. Исследована мощность критерия при проверке гипотезы адекватности. Регрессионная модель, прошедшая проверку на адекватность и значимость коэффициентов, может быть применена для решения различных практических задач, основными из которых являются:

— нахождение экстремальных условий протекания процесса, модель которого построена;

— определение значений отклика в той части факторного пространства, где эксперимент не проводится, т.е. либо интерполяция, либо экстраполяция (прогнозирования) отклика.

ЛИТЕРАТУРА

1. Сидняев Н.И., Мельникова Ю.С. Оценки статистических параметров распределений: М.: МГТУ им. Н.Э. Баумана, 2012. № 0321201235.

URL: http://wwwcdl.bmstu.ru/fn1/OcenkiSPR.html (дата обращения: 27.04.2015).

2. Елисеева И.И., Юзбашев М.М.Общая теория статистики. М.: Финансы и статистика, 2002. 480 с.

3. Сидняев Н.И., Вилисова Н.Т. Введение в теорию планирования эксперимента. М.: Изд-во МГТУ им. Н.Э. Баумана, 2011. 463 с.

4. Горяинов В.Б. Локально наиболее мощные ранговые критерии независимости наблюдений в модели пространственной авторегрессии // Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки. 2010. № 4. С. 16-28.

5. Сидняев Н.И. Теория планирования эксперимента и анализ статистических данных. М.: Юрайт, 2014. 495 с.

6. Сидняев Н.И., Садыхов Г.С., Савченко В.П. Модели и методы оценки остаточного ресурса изделий радиоэлектроники. М.: Изд-во МГТУ им. Н.Э. Баумана, 2015. 382 с.

7. Гусаров В.М. Теория статистики. М.: ЮНИТИ, 2001. 247 с.

8. Математическое моделирование интенсивности теплопередачи методами теории планирования эксперимента / Н.И. Сидняев, В.А. Левин, Н.Е. Афонина, А.М. Кац // Инженерно-физический журнал. 2002. Т. 75. № 2. С. 132-138.

9. Стрижов В.В. Методы индуктивного порождения регрессионных моделей. М.: Вычислительный центр им. А.А. Дородницына РАН, 2008. 54 с.

10. Бережная Е.В., Бережной В.И. Математические методы моделирования экономических систем. М.: Финансы и статистика, 2006. 432 с.

11. Hastie T., Taylor J., Tibshirani R., Walther G. Forward stagewise regression and the monotone lasso // Electronic Journal of Statistics. 2007. Vol. 1. No. 1. P. 1-29.

12. Павлов И.В. Вычисление некоторых показателей качества и надежности для системы с параллельно нагруженными элементами // Инженерный журнал: наука и инновации. 2012. № 7.

URL: http://engjournal.ru/catalog/mathmodel/technic/296.html DOI: 10.18698/2308-6033-2012-7-296

13. Bishop C.M., Lasserre J. Generative or discriminative? Getting the best of both worlds // In Bayesian Statistics 8; еd. by J.M.E.A. Bernardo. Oxford University Press, 2007. P. 3-23.

14. Стрижов В.В. Поиск параметрической регрессионной модели в индуктивно заданном множестве // Вычислительные технологии. 2007. Т. 12. № 1. С. 93-102.

15. Sidnyaev N.I., Andreytseva K.S. Independence of the Residual Quadratic Sums in the Dispersion Equation with Noncentral x2-Distribution // Applied Mathematics. 2011. Vol. 02. №. 10. P. 1303-1308. URL: http://file.scirp.org/Html/7855.html

DOI: 10.4236/am.2011.210181

16. Efron B., Hastie T., Johnstone I., Tibshirani R. Least angle regression // The Annals of Statistics. 2004. Vol. 32. No. 3. P. 407-499.

17. Гайдышев И.П. Анализ и обработка данных: специальный справочник. СПб.: Питер, 2001. 752 с.

REFERENCES

[1] Sidnyaev N.I., Mel'nikova Yu.S. Otsenki statisticheskikh parametrov raspredeleniy [Estimates of the Statistical Distribution Parameters]. Moscow, MGTU im. N.E. Baumana, 2012, no. 0321201235. Available at: http://wwwcdl.bmstu.ru/fn1/OcenkiSPR.html (accessed 27.04.2015).

[2] Eliseeva I.I., Yuzbashev M.M. Obshchaya teoriya statistiki [General Theory of Statistics]. Moscow, Finansy i statistika Publ., 2002. 480 p.

[3] Sidnyaev N.I., Vilisova N.T. Vvedenie v teoriyu planirovaniya eksperimenta [Introduction to the theory of experiment planning]. Moscow, MGTU im. N.E. Baumana Publ., 2011. 463 p.

[4] Goryainov V.B. Locally Most Powerful Rank Criteria of Independence of Observations in Model of Spatial Autoregression. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Estestv. Nauki [Herald of the Bauman Moscow State Tech. Univ., Nat. Sci.], 2010, no. 4, pp. 16-28 (in Russ.).

[5] Sidnyaev N.I. Teoriya planirovaniya eksperimenta i analiz statisticheskikh dannykh [The Experimental Design Theory and Analysis of Statistical Data]. Moscow, Yurayt Publ., 2014. 495 p.

[6] Sidnyaev N.I., Sadykhov G.S., Savchenko V.P. Modeli i metody otsenki ostatochnogo resursa izdeliy radioelektroniki [Models and Methods for Assessing Residual Life of Electronics Products]. Moscow, MGTU im. N.E. Baumana Publ., 2015. 382 p.

[7] Gusarov V.M. Teoriya statistiki [Theory of Statistics]. Moscow, YuNITI Publ., 2001. 247 p.

[8] Sidnyaev N.I., Levin V.A., Afonina N.E., Kats A.M. Mathematical Modeling of the Heat-Transfer Intensity by the Methods of the Theory of Experiment Design. Journal of Engineering Physics and Thermophysics, 2002, vol. 75, no. 2, pp. 432-440.

[9] Strizhov V.V. Metody induktivnogo porozhdeniya regressionnykh modeley [Methods of Inductive Generation of Regression Models]. Moscow, Vychislitel'nyy tsentr im. A.A. Dorodnitsyna RAN Publ. [Dorodnitsyn Computing Centre of RAS], 2008. 54 p.

[10] Berezhnaya E.V., Berezhnoy V.I. Matematicheskie metody modelirovaniya ekonomicheskikh sistem [Mathematical Methods of Modeling Economic Systems]. Moscow, Finansy i statistika Publ., 2006. 432 p.

[11] Hastie T., Taylor J., Tibshirani R., Walther G. Forward stagewise regression and the monotone lasso. Electronic Journal of Statistics, 2007, vol. 1, no. 1, pp. 1-29.

[12] Pavlov I.V. Calculation of Some Quality and Reliability Indices for a System with Parallel Strength Members. Jelektr. nauchno-tekh. izd. "Inzhenernyy zhurnal: nauka i innovacii" [El. Sc.-Tech. Publ. "Eng. J.: Science and Innovation"], 2012, iss. 7. Available at: http://engjournal.ru/catalog/mathmodel/technic/296.html

DOI: 10.18698/2308-6033-2012-7-296

[13] Bishop C.M., Lasserre J. Generative or discriminative? Getting the best of both worlds. In Bayesian Statistics 8; ed. by J. M. e.a. Bernardo. Oxford University Press, 2007, pp. 3-23.

[14] Strizhov V.V. Search for a parametric regression model in an inductive-generated set. Computational Technologies, 2007, vol. 12, no. 1, pp. 93-102 (in Russ.).

[15] Sidnyaev N.I., Andreytseva K.S. Independence of the Residual Quadratic Sums in the Dispersion Equation with Noncentral x2 -Distribution. Applied Mathematics, 2011, vol.2, no. 10, pp. 1303-1308. Available at: http://file.scirp.org/Html/7855.html DOI: 10.4236/am.2011.210181

[16] Efron B., Hastie T., Johnstone I., Tibshirani R. Least angle regression. The Annals of Statistics, 2004, vol. 32, no. 3, pp. 407-499.

[17] Gaydyshev I.P. Analiz i obrabotka dannykh: spetsial'nyy spravochnik [Data Analysis and Processing: Special Handbook]. St. Petersburg, Piter Publ., 2001. 752 p.

Статья поступила в редакцию 12.10.2015

Сидняев Николай Иванович — д-р техн. наук, профессор, заведующий кафедрой "Высшая математика" МГТУ им. Н.Э. Баумана.

МГТУ им. Н.Э. Баумана, Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5.

Sidnyaev N.I. — Dr. Sci. (Eng.), Professor, Head of Higher Mathematics department, Bauman Moscow State Technical University.

Bauman Moscow State Technical University, 2-ya Baumanskaya ul. 5, Moscow, 105005 Russian Federation.

Говор Светлана Александровна — аспирантка кафедры "Высшая математика" МГТУ им. Н.Э. Баумана.

МГТУ им. Н.Э. Баумана, Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5.

Govor S.A. — post-graduate student of Higher Mathematics department, Bauman Moscow State Technical University.

Bauman Moscow State Technical University, 2-ya Baumanskaya ul. 5, Moscow, 105005 Russian Federation.

Просьба ссылаться на эту статью следующим образом:

Сидняев Н.И., Говор С.А. Проверка гипотезы адекватности статистической модели при ротатабельном планировании эксперимента // Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки. 2016. № 1. C. 3-16. DOI: 10.18698/1812-3368-2016-1-3-16

Please cite this article in English as:

Sidnyaev N.I., Govor S.A. Hypothesis test of statistical model adequacy in the rotatable experiment design. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Estestv. Nauki [Herald of the Bauman Moscow State Tech. Univ., Nat. Sci.], 2016, no. 1, pp. 3-16. DOI: 10.18698/1812-3368-2016-1-3-16

i Надоели баннеры? Вы всегда можете отключить рекламу.