УДК 621.396
ПЕРМУТАЦИОННЫЕ КРИТЕРИИ КАК УНИВЕРСАЛЬНЫЙ НЕПАРАМЕТРИЧЕСКИЙ ПОДХОД К ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
КОЛЯДИН В.Л.___________________________
Рассматриваются логические основания концепции пермутационных критериев и показывается, что она представляет собой общий подход к синтезу непараметрических критериев для проверки статистических гипотез. Такой подход позволяет легко строить новые непараметрические критерии, максимально учитывающие специфику конкретной практической задачи. При этом не требуется применение каких-либо теоретико-вероятностных выкладок и аналитических методов. Рассматриваются основные классы статистических задач, где применение пермутационных критериев наиболее целесообразно.
Введение
Непараметрические критерии являются основным рабочим инструментом проверки статистических гипотез по реальным данным [1-3]. В отличие от параметрических критериев они обеспечивают гарантированное значение вероятности ошибки I рода (отвержения истинной нулевой гипотезы) практически для любого вида закона распределения, а не только для закона, принадлежащего некоторому параметрическому семейству распределений, например, нормальному, как в случае параметрических тестов. Поскольку вид закона распределения для реальных данных чаще всего неизвестен, то на практике предпочитают использовать именно непараметрические критерии.
Пермутационные критерии (синонимы: “критерии перестановок”, “рандомизированные критерии”) представляют неклассический подход к синтезу непараметрических решающих процедур, который обладает беспрецедентной общностью и, одновременно, алгоритмической и концептуальной простотой. Однако в настоящее время общность и универсальность этого подхода в полной мере пока не осознается ни специалистами в области статистических методов, ни теми, кто использует их для решения конкретных практических задач. Например, в классических монографиях [4,5] пермутационные критерии хотя и описаны, но представлены как некоторые специальные критерии, имеющие ограниченную область применимости.
Классический подход к построению непараметрических критериев является скорее искусством, чем наукой, и требует высочайшей квалификации в области математики и теории вероятностей. Усилиями математиков мирового уровня за 70-80 лет в рамках этого подхода были получены всего несколько десятков базовых непараметрических критериев и несколько сотен процедур, производных
РИ, 2002, № 3
от базовых критериев. При этом к конкретной практической задаче, как правило, применимы лишь немного известных непараметрических критериев, что не позволяет выбрать критерий, обеспечивающий максимальную мощность именно в данной задаче.
При использовании подхода, основанного на пермутационных критериях, ситуация радикально отличается от описанной выше. Достаточно просто можно синтезировать большое (строго говоря, бесконечное) количество пермутационных непараметрических критериев, ориентированных на специфику конкретной практической задачи, т.е. обладающих существенно большей мощностью в отношении специфических для данной задачи альтернативных гипотез, чем классические непараметрические критерии. При этом синтез пермутационных критериев не требует проведения каких-либо теоретико-вероятностных выкладок (хотя вычислительные затраты на реализацию пермутационно-го критерия могут быть существенно выше, чем на реализацию классического непараметрического критерия).
С увеличением мощности и доступности вычислительных средств интерес к пермутационным критериям постоянно растет [6,7]. Однако еще рано говорить о повсеместном признании и понимании достоинств этого неклассического подхода даже среди специалистов в области статистики, не говоря уже о многочисленном сообществе потенциальных пользователей - специалистов, сталкивающихся с необходимостью проверки статистических гипотез в конкретных прикладных областях. Одна из целей этой статьи — постараться исправить такую ситуацию и привлечь внимание широкой аудитории пользователей статистических методов к методологии пермутационных тестов как удобному практическому инструменту статистического анализа.
Основная цель статьи — показать, что пермутационные критерии представляют собой достаточно универсальную, практичную и доступную методологию оперативного синтеза непараметрических критериев, а не несколько специальных критериев, ориентированных на узкий круг задач. Предлагаем такой ракурс рассмотрения проблемы, при котором видна преемственность между классическим подходом к синтезу непараметрических критериев и подходом, основанным на применении методологии пермутационных критериев.
1. Классический подход к синтезу непараметрических критериев
При классическом подходе к построению непараметрических критериев основной задачей является нахождение такой статистики T(-) — функции от N независимых наблюдений X = (xj,...,xN) случайной величины х, что ее выборочное распределение (т.е. распределения значений T(X)) обладает следующими двумя важными свойствами:
P(T(X) | p(x)) = Po(T), Vp(x) є Ro , (1)
P(T(X) | p(x)) > Po(T), Vp(x) є Ri, (2)
7
где p(x) — плотность распределения случайной величины x; P(T | p) — интегральная функция выборочного распределения статистики T при заданной плотности p; R0, Rj — множества всех плотностей распределения, отвечающих нулевой (И0 ) и альтернативной (И) гипотезам, соответственно; P0(-) — интегральное выборочное распределение статистики T при нулевой гипотезе.
Свойство (1) означает, что выборочное распределение статистики T одно и то же для любого закона p(x) распределения наблюдений, удовлетворяющих нулевой гипотезе. Выполнение этого требования необходимо для обеспечения заданной вероятности а ошибок I рода. Свойство (2) означает, что при альтернативной гипотезе И статистика T(-) в среднем чаще принимает большее значение, чем при нулевой гипотезе Но . Это необходимо для обеспечения ненулевой мощности теста — его способности обнаруживать отклонения от нулевой гипотезы.
Решение принимается на основе наблюдаемого значения T(X) следующим образом:
H(X)
Н0,если T(X) < ta, Нресли T(X) > ta,
(3)
а значение ta определяется из условия
P0(ta) = 1 -a ,
где a — заданный уровень значимости критерия (максимально допустимая вероятность ошибки I рода — отвержения истинной нулевой гипотезы).
Свойства (1) и (2) далеко не равноценны с точки зрения сложности процесса синтеза критерия (т.е. нахождения статистики T с требуемыми свойствами). Удовлетворить требованию (2) достаточно просто, а требованию (1) — необычайно трудно. Именно поэтому обладающие свойствами (1) и (2) функции, найденные математиками за более чем полувековую историю непараметрической статистики, по праву считаются жемчужинами статистической науки, а описание их свойств составляет основное содержание монографий и справочников по непараметрической статистике [1,3,8].
Очевидно, что при таком подходе к синтезу статистических критериев рядовому пользователю остается только выбрать один из набора уже известных, более или менее подходящий к решаемой задаче. При этом, применительно к любой конкретной задаче, выбор оказывается невелик и ограничен несколькими, а иногда и одним непараметрическим критерием, зачастую мало чувствительным к ожидаемому виду альтернативной гипотезы.
2. Базовая идея пермутационных критериев
Применение методологии пермутационных критериев позволяет радикально изменить описанную выше ситуацию, характерную для классического подхода. Даже рядовой пользователь, применяя эту методологию, может легко синтезировать большое количество непараметрических критериев, макси-
мально учитывающих специфику решаемой задачи. При этом автоматически обеспечивается выполнение требования (1), т.е. обходится основная трудность, характерная для классического подхода.
Исторически первым пермутационным критерием, по всей видимости, является “точный критерий Фишера” (Fisher’s exact test) [6], ориентированный на проверку гипотезы о равенстве пропорций (вероятностей “успеха”) в двух генеральных совокупностях по конечным выборкам из них. Этот критерий и сегодня часто используется на практике. Достаточно сложно указать, кто и когда первым осознал, что пермутационные критерии — это не просто несколько специальных критериев, а достаточно общий подход к построению непараметрических критериев вообще. По всей видимости, это осознание было медленным и постепенным (эволюционным) процессом, катализированным компьютеризацией, ростом доступности и мощности компьютеров. Сегодня можно констатировать как факт, что в 1990 г. многие авторы уже достаточно хорошо понимали, что пермутационные критерии представляют общую методологию построения непараметрических критериев [6].
Идея, лежащая в основе пермутационных критериев, относительно проста. Пусть X = {xb...,xN} — случайная выборка однотипных элементов (скаляров, векторов, матриц и т.д.). Известно, что плотности распределения p0(X) и pj(X) последовательности X, соответствующие нулевой и альтернативной гипотезе, обладают следующим свойством:
p0(X) = p0(л (X)), УлєП, (4)
pi(X) *pj(*(X)), Зієп, (5)
где П — некоторая конечная группа перестановок п элементов x; последовательности X или некоторых их компонент (если элементы x; являются векторами). Свойства (4), (5) означают, что при нулевой гипотезе плотность распределения X инвариантна относительно любой перестановки из группы П , а при альтернативной — не инвариантна относительно некоторых перестановок из П .
Пусть t(X) — произвольная функция от X, называемая далее первичной статистикой пермутацион-ного критерия или просто первичной статистикой. Рассмотрим следующую статистику, формируемую на основе наблюдаемой реализации Xo последовательности X и первичной статистики t(-):
T(X0;t(-))=K I KXo, t(-), л k), (6)
Kk=1
здесь K — количество всех перестановок в группе П ; I(-) — индикаторная функция:
[1 если t(n(X)) > t(X),
I(X,t(-), л) = \
[0 если t(л^)) = t(X).
Другими словами, значение T(Xo) — это доля тех перестановок из группы п , после действия которых на выборку Xo значение t(rt(Xo)) первичной
8
РИ, 2002, № 3
статистики остается не меньшим, чем ее наблюдаемое значение t(Xo).
Статистика т принимает значения из множества {k/ K, k = , и при истинной нулевой гипо-
тезе обладает следующим уникальным свойством:
Prob(T(X) <а) <а , (7)
где Prob(-) — вероятность события. Далее статистику Т( •) будем называть результирующей или просто статистикой критерия. Целесообразность такого выбора терминов в отношении статистик t(X) и T(X; t(-)) обсуждается ниже в разделе 4.
Свойство (7) означает, что принятие решения на основе правила
H(X) _ JH0 > если T(X) >a,
( ) {H1 , если T(X) <а, (8)
гарантирует, что при истинной нулевой гипотезе вероятность ошибочного принятия альтернативной гипотезы (ошибки I рода) не превышает а . Напомним, что свойство (7) выполняется для любой первичной статистики t(-) и для любого закона p0(X) распределения X, отвечающего нулевой гипотезе и удовлетворяющего свойству (4). Именно это обстоятельство и позволяет рассматривать пермутационные критерии как универсальный подход к синтезу непараметрических критериев проверки статистических гипотез.
Свойство (7) обеспечивает выполнение условия (1), т.е. инвариантность выборочного распределения статистики T критерия при нулевой гипотезе независимо от выбора первичной статистики t(-). Это, в свою очередь, позволяет свести синтез нового непараметрического критерия к выбору функции t(-), максимально чувствительной к определенному виду отклонений от нулевой гипотезы, т.е. сосредоточить усилия на выполнении условия (2).
3. Статистическое обоснование основного свойства пермутационных критериев
Идея доказательства свойства (7) основывается на разбиении множества Q всех исходов (последовательностей X), возможных при истинной нулевой гипотезе, на конечные подмножества последовательностей, совпадающие с точностью до произвольной перестановки из группы П . Разобьем множество Q на непересекающиеся подмножества размера K, каждое их которых образовано всеми перестановками (из группы П ) некоторой последовательности X. Рассмотрим одно такое подмножество Q(X) = MX): леП}.
Заметим, что все K элементов такого подмножества при истинной нулевой гипотезе равновероятны в силу условия (4).
Сначала рассмотрим случай, когда значения первичной статистики t(-) различны для всех k элементов подмножества Q(X). Расположим (про-
индексируем) элементы подмножества Q в порядке убывания значения первичной статистики t(X):
t(X1)> t(X2) >...> t(XK), Xk єQ . (9)
Тогда для любого k = 1,...,K автоматически выполняется следующее свойство:
T(Xk, t(-))=^, k = 1,...,K , (10)
K
где T — результирующая статистика, определяемая выражением (6).
Допустим, что нулевая гипотеза верна, а решение о ее истинности принимается на основе решающего правила(8). Поскольку все элементы {Xk, k = 1,...,K} подмножества Q(X) при нулевой гипотезе равновероятны в силу условия (4), то из выражения (10) непосредственно следует, что результирующая статистика T принимает равновероятно значения из множества {k / K, k = 1,...,K} . Следовательно, для любого а є [0,1] выполняется неравенство
Prob(T(X,t(-)) <а | X eQ) < а , (11)
которое для конечного множества значений {а = k / K, k = 1,...,K} обращается в строгое равенство.
Поскольку неравенство (11) выполняется для любого подмножества Q множества q всех возможных последовательностей X (исходов), а различающиеся подмножества Q(X) не пересекаются, то можно легко перейти от условной вероятности (11) к безусловной:
Prob(T(X,t(-)) <а) =
= J Prob(T(X,t(-)) <а | X є Q) p(Q)dQ , (12)
S
где s — множество всех непересекающихся подмножеств Q; p(Q) — плотность вероятности подмножества Q. В силу того, что значение p(Q) неотрицательно, из (11) и (12) непосредственно следует свойство (7) для любого вида плотности распределения p(Q).
Теперь рассмотрим общий случай, когда значения t(X) для некоторых элементов X подмножества Q могут совпадать, т.е. некоторые строгие неравенства в выражении (9) заменяются нестрогими. В этом случае выражение (10) принимает вид
T(Xk) > k/K; k = 1,...,K (13)
в силу того, что значения T из-за наличия совпадающих значений t(Xk) могут только возрастать по сравнению со случаем (9). Например, если t(Xj) = t(X2) > t(X3)..., то T(Xj) = T(X2) = 2 / K, а не 1/ K . Поскольку решающее правило (8) предусматривает отвержение нулевой гипотезы при значениях T(X,t(-)), меньших или равных порогу а, то вероятность отвержения истинной нулевой гипотезы при наличии таких совпадающих значений только уменьшается, гарантированно сохраняя справедливость неравенства (7).
РИ, 2002, № 3
9
4. Связь между классическими и пермутационными непараметрическими критериями
При изложении материала, касающегося пермута-ционных критериев, в литературе [4,5,8] логическая связь между классическими непараметрическими и пермутационными критериями практически не видна. Это связано с неудачным выбором терминологии и понятийного аппарата - когда функцию t(-) рассматривают как статистику критерия. В классических непараметрических критериях статистикой критерия называют ту функцию T(-), на основании значений T(X) которой принимается решение и которая обладает свойством (1) независимости своего выборочного распределения от конкретной нулевой гипотезы. Очевидно, что в пермутационных критериях функция t(-) этими свойствами не обладает. Поэтому рассмотрение t(-) как статистики критерия вряд ли можно признать удовлетворительным, по крайней мере, с точки зрения преемственности между теорией классических и пермутационных критериев.
Для выявления такой преемственности в этой статье функцию t(-) мы называем лишь “первичной статистикой”, а в качестве собственно статистики критерия рассматриваем функцию T(X, t(-)), которая определяется выражением (6) и помимо самих данных х зависит и от первичной статистики t(-). Эта функция т (“результирующая статистика”) полностью соответствует классическому понятию “статистика непараметрического критерия”: она удовлетворяет требованию (1), и именно на основе ее значений принимается конечное решение. Такой взгляд на базовые понятия позволяет считать пермутационные критерии общей методологией синтеза непараметрических критериев. Фактически концепция пермутационного критерия позволяет на основе произвольной статистики t(-) автоматически получить статистику T, порождающую некоторый непараметрический критерий.
Понимание логических основ пермутационных критериев частично затрудняется непривычными свой -ствами результирующей статистики T(X; t(-)). Во-первых, она зависит от другой статистики t(-) и вычисляется согласно (6) довольно непривычным образом, требующим необычно больших вычислительных затрат даже при умеренном размере выборки. Во-вторых, статистика t практически “идеальна” в следующем смысле: ее выборочное распределение при нулевой гипотезе очень близко к равномерному в интервале [0,1]. Последнее означает, что не требуется каких-либо таблиц или алгоритмов для расчета p-значения (максимального значения уровня значимости а, при котором нулевая гипотеза еще не отвергается). Наблюдаемое значение T(Xo) этой статистики фактически сравнивается непосредственно c заданным уровнем значимости а, а не с некоторым пороговым значением, вычисляемым на основе таблиц или алгоритмически по заданному а .
Такое необычное сочетание свойств статистики т маскирует ее реальное место в логической структуре пермутационных критериев. Обычно при изложении идеи пермутационных критериев авторы вообще не рассматривают статистику (6) в явном виде, а статистикой критерия называют первичную статистику t(-). При этом процедуру вычисления значения T(Xo) из выражения (6) рассматривают как процесс, состоящий из двух логических ступе -ней: 1) вычисления условного (по наблюдаемым данным Xo) распределения статистики t(-) при нулевой гипотезе; 2) определения уровня значимости наблюдаемого значения t(Xo) для этого распределения (см., например, классическую монографию [4]).
5. Практическая реализация пермутационных критериев
Непосредственное вычисление результирующей статистики T(X,t(-)) из выражения (6) обычно затруднительно из-за большого значения K, которое быстро увеличивается с ростом размера N данных X (приблизительно как факториал от размера выборки N). Поэтому на практике для расчета значения T(X,t(-)) чаще всего прибегают к приближенным методам Монте-Карло. При этом используют случайную выборку (достаточно большого размера M << K) перестановок из группы П . Общий алгоритм такой приближенной реализации пермутационных критериев следующий:
Шаг1. Вычисляем наблюдаемое значение to = t(Xo) первичной статистики t(-) для наблюдаемых данных Xo.
Шаг 2. Выбираем случайно и равновероятно элемент п из группы перестановок п и вычисляем значение tk = t( ^(Xo)) первичной статистики от преобразованных данных rc(Xo). (Чаще всего, П представляет собой группу всех перестановок в последовательности из N элементов. В этом случае применяют известные алгоритмы случайной перестановки N элементов.)
Шаг 3. Повторяем шаг 2 M раз и определяем количество m реализаций шага 2, при которых выполнилось условие t(^(Xo)) > t(Xo). (Здесь и далее предполагается, что первичная статистика t(-) выбрана таким образом, что ее большие значения свидетельствуют против нулевой гипотезы. В противном случае просто используется обратное неравенство).
Шаг 4. В качестве оценки p-значения используем величину T = m / M — оценку значения результирующей тестовой статистики T .
Если стоит классическая задача проверки нулевой гипотезы при заданной вероятности а ошибки I рода, то решение принимается на основе правила (8). При интерпретации экспериментальных данных, где зачастую принято сообщать само p-значение, величина T, вычисленная на шаге 4
РИ, 2002, № 3
10
алгоритма, используется в качестве конечного p-значения.
6. Задача сравнения двух законов распределения
Рассмотрим практически важный класс задач, когда требуется проверить нулевую гипотезу о совпадении законов распределения двух генеральных совокупностей по случайным выборкам Xj и X2 размера Nj и N2 из этих генеральных совокупностей . Напомним, что такая задача рассматривается здесь в самой общей постановке: элементы выборок могут быть произвольной природы, т.е. описываться скалярами, векторами, матрицами и т.д., а о законе распределения ничего не известно. Единственное требование — статистическая независимость элементов выборок.
Рассмотрим объединенную выборку
X = X1 u X2 = (x1,...,xN); N = Nj + N2; где
xi eX1, i=1,...,N1;
xi єX2, i = N1+1,...,N1 + N2; .
Тогда при истинной нулевой гипотезе совместная плотность распределения pN (X) всех элементов объединенной выборки X имеет вид:
N
P0(X) = Пq0(Xj); N=N1 + N2; (14)
i=1
здесь qo(x) — неизвестная плотность распределения генеральных совокупностей при нулевой гипотезе. Плотность вида (14) инвариантна относительно любой из N! перестановок элементов объединенной выборки X. Поэтому группа П образована этими N! перестановками. Тогда шаги 1 и 2 общего алгоритма, описанного в разделе 5, реализуются следующим образом.
Шаг 1. Выбираем первичную статистику t(v), чувствительную к представляющему интерес виду отклонения от нулевой гипотезы, и вычисляем наблюдаемое значение to = t(X1,X2) этой статистики.
Шаг 2. Выполняем случайную перестановку p всех элементов объединенной выборки X, разбиваем результирующую последовательность X' = n(X) на две последовательности X1 и X2 размеров N1 и N2, и затем вычисляем значение t' = t(X1,X2).
Шаги 3 и 4 те же, что в общем алгоритме, описанном в разделе 5.
Заметим, что для столь общей нулевой гипотезы (14) возможно большое количество альтернативных гипотез, каждая из которых соответствует конкретной практической задаче. Практический интерес могут представлять различия некоторых статистических характеристик двух распределений, например их центрального положения, ширины распределения, степени тяжести хвоста распределений, асимметрии и т.д. В этих случаях в качестве первичной статистики t(v) может использоваться
РИ, 2002, № 3
модуль разности значений соответствующей статистической меры для выборок 1 и 2:
t(X1,X2) =|C(X1) - C(X2)|, (15)
где C — некоторая мера сравнения, характеризующая количественно то свойство распределений, различие по которому представляет основной практический интерес. Например, если таким свойством является центральное положение, то в качестве C(-) можно выбрать среднее, медиану, усеченное среднее и т.д. Если интерес представляет различие в ширине (или масштабе) распределения, то разумным выбором является дисперсия, среднее абсолютное уклонение от медианы, разность 75-й и 25й процентных точек и т.д.
Уже из этих элементарных примеров видно, что выбор первичной статистики вида (15) осуществляется достаточно просто, исходя из специфики решаемой задачи. При этом общая схема пермута-ционных критериев обеспечивает автоматическое выполнение свойства (1) инвариантности выборочного распределения результирующей тестовой статистики T(X,t(-)) вида (6) на всем множестве нулевых гипотез вида (14), т.е. независимо от вида плотности q0(x).
Заметим также, что первичные статистики вида (15) представляют лишь частный случай (хотя они и порождают широкий класс решающих правил за счет произвольного выбора меры C). В качестве более сложного случая можно привести пример ситуации, когда элементы x^ представляют собой не скалярные величины, а функции одного или большего числа аргументов, например, независимые реализации xi (t) сигналов, полученных для двух классов объектов. Практический интерес здесь может представлять, например, нулевая гипотеза о совпадении спектров мощности S^ra) и §2(0) для этих двух классов объектов. В качестве первичной статистики можно, например, выбрать функционал:
t(X1,X2) = J|S(ra;X1)-S(ra;X2)|P dra ,
где S (ю, X) — некоторая оценка спектра по выборке X = {x1(t),...,xN(t)}; р — параметр, влияющий на свойства такой меры различия двух спектров. При этом аргументы t ии могут быть векторными, т.е. в эту схему укладываются и задачи многомерного спектрального анализа.
Несмотря на возросшую сложность задачи, общая схема пермутационных критериев в равной степени применима и здесь, а ее алгоритм остается тем же, что и для более простых задач.
7. Задача сравнения нескольких законов распределения
В случае нескольких выборок подход к синтезу пермутационных критериев остается практически тем же, за исключением выбора первичной статистики t(X1,...,XL), которая должна быть чувствительна к отличию хотя бы одного из L распределений от остальных L -1 распределений. Выбор первичной статистики в этом случае шире, чем в
11
случае двух выборок. Даже если строить первичные статистики только на основе некоторой статистической меры (как это делается в выражении (15) для случая двух выборок), то выбор все же оказывается гораздо шире. Следующее выражение, например, порождает широкий круг первичных статистик:
t(X1,...,XL) =E|C(X1)- Avg(C(X1),...,C(XL))|P ,
1=1
где C(-) — некоторая мера, характеризующая ту статистическую характеристику распределений, различие по которой представляет интерес в контексте конкретной практической задачи (как и в описанном выше случае двух выборок); Avg(-) — некоторый оператор “усреднения”, например, оператор вычисления среднего значения или медианы. Выбор показателя степени р позволяет изменять чувствительность первичной статистики (и, следовательно, мощности критерия) относительно отдельных типов альтернативной гипотезы. Большие значения р делают критерий более чувствительным к отклонению одного (или малого числа) из L распределений от остальных; меньшие значения р — к тем ситуациям, когда все или большая часть распределений взаимно различаются.
8. Задача обнаружения статистической связи
Другим важным классом задач, где применимы пермутационные критерии, являются задачи проверки нулевой гипотезы об отсутствии статистической связи между случайными величинами x и у, или об отсутствии зависимости случайной величины у от x. Исходными данными в этом случае
является неупорядоченное множество из N независимых пар значений {(хі,уі),...,(х№у^} или, что эквивалентно, два упорядоченных множества X = (хі,..., Xn) и Y = (yi,...,yN) . При этом элементы последовательностей X и Y могут быть произвольной природы — не обязательно скалярными величинами. Ниже перечислены особенности основных подклассов задач этого типа, отличающихся видом альтернативной гипотезы и природой величин.
1. Величины х и у являются случайными, и интерес представляет альтернативная гипотеза о наличии некоторой статистической связи (не обязательно линейной) между х и у . В этом случае в качестве первичной статистики t(X,Y) можно выбирать некоторую меру корреляции, например, коэффициент линейной корреляции (Пирсона), коэффициент ранговой корреляции (Спирмена) и т.д. Когда х и у принимают значения из конечных множеств (и, следовательно, наблюдаемые пары значений могут быть представлены в виде таблицы сопряженности), в качестве первичной статистики t(X, Y) можно использовать одну из многочисленных известных мер статистической связи [9].
2. Величина х не является случайной; альтернативная гипотеза предполагает наличие определенной связи случайной величины у с х. Примером такой ситуации является классическая задача статисти-
ческой радиотехники — обнаружение сигнала известной формы x(t) по наблюдениям его аддитивной смеси с шумом:
у i = Ax; + n;; у i = уДД, х; = x(t;),
где ti — моменты формирования отсчетов принимаемого колебания y(t); щ — статистически независимые и одинаково распределенные отсчеты аддитивного шума (о законе распределения которых ничего не известно); A — неизвестная амплитуда сигнала. В качестве первичной статистики можно использовать некоторую меру корреляции последовательностей X и Y (в простейшем случае — модуль коэффициента корреляции).
3. Альтернативная гипотеза предполагает наличие определенной зависимости у от х:
у = f(xi; X ) + Пі,
здесь f(x; X) — некоторая функция, известная с точностью до параметра \ . При этом в качестве первичной статистики t(X,Y) целесообразно выбрать разность между некоторой оценкой X(X,Y) параметра X и значением X , соответствующим нулевой гипотезе (или, в случае двусторонней альтернативы, модуль этой разности). Например, в простейшем случае линейной зависимости у = a + bx в качестве t(X,Y) может использоваться оценка
b (X,Y) коэффициента b наклона в уравнении линейной регрессии. Уклонения значений этой оценки от нуля свидетельствуют в пользу альтернативной гипотезы о наличии зависимости.
Независимо от выбранной первичной статистики и интерпретации величин х (как случайных или фиксированных) общая схема пермутационного критерия здесь одна и та же: в качестве группы п перестановок используется группа N! перестановок элементов Xi (или уі , что статистически эквивалентно) среди N пар наблюдаемых значений [4]. Шаги 1 и 2 общего алгоритма, описанного в разделе 5, в этом случае реализуются следующим образом.
Шаг 1. Выбираем первичную статистику одним из описанных выше способов, исходя только из соображений ее чувствительности к ожидаемому виду отклонения от нулевой гипотезы, и вычисляем наблюдаемое значение to = t(X,Y) этой статистики.
Шаг 2. Выбираем случайную перестановку % всех элементов последовательности X (или Y) и вычисляем значение t = t(^(X),Y).
Шаги 3 и 4 те же, что в общем алгоритме, описанном в разделе 5.
9. Пример. Проверка гипотезы об идентичности двух участков зондируемой поверхности
Рассмотрим следующую задачу дистанционного радиозондирования. При зондировании двух участков поверхности получены два набора значений амплитуд отраженного сигнала — Xi и X2 . Условия
12
РИ, 2002, № 3
зондирования полагаются полностью идентичными (в противном случае амплитуды полагаем приведенными к некоторым стандартным условиям). При этом индивидуальные значения амплитуд для каждого из участков получены для неперекрывающихся элементов разрешения и, следовательно, могут считаться статистически независимыми (т.е. Xj и X2 можно считать случайными выборками). Практический интерес представляет нулевая гипотеза о том, что оба участка полностью статистически идентичны по своим отражающим свойствам. Альтернативная гипотеза предполагает, что участки отличаются значениями масштабного множителя, характеризующего среднюю амплитуду отраженного сигнала. Относительно вида закона распределения амплитуд при нулевой гипотезе ничего не известно и, более того, оно заведомо может отличаться от распределения Релея-Райса, предсказываемого простейшими моделями процесса рассеяния.
В качестве первичных статистик будем использовать 3 функции вида (15) при следующих статистических мерах C(X):
N N
Ci(X) = -jN I x,2 , C2(X) = ± I x ,
i=1 i=1
C3(X) = median(X),
где N — размер выборки X; median(X) — медиана выборки. Обратим внимание на то, что выбор первичных статистик достаточно тривиален. В качестве меры “средней” интенсивности отраженных сигналов выбраны средний квадрат, среднее значение и медиана амплитуды отраженного сигнала, а в качестве первичной статистики t(v) — модуль разности этой меры для двух участков.
Общая схема пермутационных критериев для этого класса задач, описанная в разделах 5 и 6, позволяет автоматически получить непараметрический критерий по заданной первичной статистике. Таким образом, выбрав три первичные статистики, мы фактически задали три непараметрических критерия. Ниже приводятся результаты статистического моделирования этих трех пермутационных критериев.
Моделирование проводилось для выборок размера Nj = N2 = 25 с двукратным различием в средней амплитуде отраженного сигнала. При реализации пермутационного критерия использовались M = 1000 случайных перестановок объединенной выборки. Оценки вероятности ошибки II рода (принятия нулевой гипотезы об идентичности двух участков) формировались по 1000 реализациям.
Сначала исследовалась ситуация, когда амплитуды отраженного сигнала для каждого из участков подчиняются закону распределения Релея-Райса (c-распределения с 2 степенями свободы), предсказываемого простейшей моделью отражения. Результаты моделирования для нескольких значений уровня значимости критерия приведены в табл. 1.
Таблица 1
Относительная частота ошибок II рода при распределении амплитуд по закону Релея-Райса
Мера сравнения Уровень значимости(а)
0,01 0,025 0,05 0,1
Средний квадрат 0.032 0.011 0.006 0.002
Среднее 0.044 0.016 0.007 0.005
Медиана 0.133 0.083 0.050 0.027
Из результатов табл.1 видно, что применение первичной статистики, основанной на среднем квадрате амплитуд, в данном случае обеспечивает максимальную мощность критерия. При этом использование медианы приводит к существенно меньшей мощности критерия.
Исследовалась также ситуация, когда закон распределения амплитуд существенно отличается от закона Релея- Райса в сторону наличия у распределения более тяжелого хвоста. При этом были использованы распределения с плотностью следующего вида:
p(x; р, 5 ) = (1-P)prr(x) + P'1prr(x/5),
где prr(-) — плотность распределения Релея-Райса;
Р и 5 — параметры тестового распределения. Такие тестовые распределения соответствуют ситуации, когда зондируется поверхность смешанного типа, и
в элемент разрешения с вероятностями 1 - р и р могут попадать два типа поверхности, для которых амплитуды отраженных сигналов в среднем различаются в 5 раз. При этом полагаем, что для каждого типа поверхности амплитуда отраженного сигнала подчиняется распределению Релея-Райса.
Результаты статистического моделирования для значений параметров р =0,2 и 5 =3 приведены в табл. 2.
Таблица 2
Относительная частота ошибок II рода для тестового распределения c тяжелым хвостом
Мера сравнения Уровень значимости(а)
0,01 0,025 0,05 0,1
Средний квадрат 0.542 0.433 0.329 0.231
Среднее 0.375 0.257 0.169 0.098
Медиана 0.334 0.206 0.118 0.057
Из результатов табл. 2 видно, что наибольшую мощность имеет критерий, использующий медиану в качестве меры сравнения, а наименьшую — критерий, использующий средний квадрат амплитуды. Иными словами, ситуация противоположна той, которая наблюдалась для распределения Релея-Райса (табл. 1). Наблюдается также существенное различие между результатами и в мощности наилучшего из трех критериев - наличие у распределения амплитуд более тяжелого хвоста привело к существенному снижению мощности как каждого критерия в отдельности, так и наилучшего из трех критериев.
РИ, 2002, № 3
13
Выводы
1. Пермутационные критерии представляют общую методологию синтеза непараметрических критериев, а не узкоспециальные статистические методы.
2. Данная методология позволяет легко синтезировать новые непараметрические критерии без привлечения каких-либо аналитических методов теории вероятностей и математической статистики. Это, в свою очередь, позволяет строить новые критерии непосредственно в процессе решения конкретной задачи и максимально полно адаптировать критерий к специфике этой задачи.
3. Синтез нового критерия сводится к выбору первичной статистики, чувствительной к отклонению от нулевой гипотезы. При этом методология синтеза пермутационных критериев автоматически обеспечивает формирование результирующей инвариантной статистики на основе выбранной первичной статистики.
4. Методология пермутационных критериев идеально подходит к задачам сравнения двух или нескольких распределений и к задачам обнаружения статистической связи произвольного вида.
УДК 517.9+538 "
ВОЗБУЖДЕНИЕ РЕШЕТКИ С ДИЭЛЕКТРИЧЕСКОЙ ПЛАСТИНОЙ
ЧУМАЧЕНКО С.В.__________________________
Предлагается точное аналитическое решение задачи об электромагнитном поле в решетке из плоских волноводов с диэлектрической пластиной. Для определения амплитудных коэффициентов применяется метод суммирования рядов по выборочным значениям.
1. Введение
Аналитические методы решения граничных задач занимают особое место в электродинамике. Полученные с их помощью результаты представляют интерес, поскольку являются основой для последующих численных расчетов. В связи с этим изучение и развитие методов решения граничных задач, допускающих построение строгого аналитического решения, остается актуальным во всех научных направлениях.
Большинство методов, используемых при расчете фазированных антенных решеток, основывается на классической теории [ 1,2], аналитических выводах [3-5], численных и экспериментальных результатах. Аналитические методы часто являются приближенными, а построенные на их основе численные — предполагают наличие временных затрат, связанных с вычислительной сложностью и повышением точности расчетов.
Таким образом, существует необходимость в разработке и развитии эффективных аналитических методов решения граничных задач, позволяющих строить точное решение, удобное для численного анализа.
Литература: 1. Холлендер М., Вулф Д. Непараметрические методы статистики. М.: Финансы и статистика, 1983. 518 с. 2. Тюрин Ю.Н. Непараметрические методы статистики. М.: Знание, 1978. 64с. 3. Siegel S, Castellan N.J. Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill. 1988. 399 p. 4. Кокс Д, Хинкли Д Теоретическая статистика. М.: Мир, 1978. 560с. 5. Леман Э. Проверка статистических гипотез. М.: Наука, 1979. 408 с. 6. Good P.I. Resampling methods: a practical guide to data analysis. Boston: Birkhauser, 1999. 269 p. 7. Davison A. C, Hinkley D. V. Bootstrap methods and their application. Cambridge: Cambridge University Press, 1997. 582 p. 8. Рунион P. Справочник по непараметрической статистике. Современный подход. М.: Финансы и статистика, 1982. 198 с. 9. Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов (Статистические методы классификации и измерения связей). М.: Статистика, 1977. 144 с.
Поступила в редколлегию 18.02.2002
Рецензент: д-р техн. наук, проф. Костенко П.Ю.
Колядин Владимир Леонидович, канд. техн. наук, докторант кафедры авиационно-космических радиотехнических систем Национального аэрокосмического университета “ХАИ”. Научные интересы: неклассические методы анализа данных, включая обработку сигналов и изображений. Увлечения и хобби: история и методология науки, теннис. Адрес: Украина, 61129, Харьков, пр. Тракторостроителей, 162-Г, кв. 128, тел.14-81-44.
Цель работы — получить аналитически выражения для амплитудных коэффициентов электромагнитного поля с использованием метода суммирования рядов по выборочным значениям.
2. Постановка и геометрия задачи
Рассматривается бесконечная периодическая система плоских волноводов, стенки которых считаются бесконечно тонкими, идеально проводящими, с расположенной над ней диэлектрической пластиной (рисунок) [1].
m= -1 0 1
Все волноводы синфазно возбуждаются волной TEi,o. Падающее поле в m -м волноводе имеет вид:
Еу(пад)(x,z) = Фпад (x,z) =
14
РИ, 2002, № 3