РАДИОТЕХНИКА.^^.,
УДК 621.396
РАСПРЕДЕЛЕНИЯ С БЕСКОНЕЧНОЙ ДИСПЕРСИЕЙ И ОГРАНИЧЕННОСТЬ КЛАССИЧЕСКОЙ СТАТИСТИКИ
КОЛЯДИН В.Л.__________________________
Рассматриваются особенности вероятностных распределений с бесконечными и неопределенными моментами - дисперсией, математическим ожиданием и др. Показывается, что такие распределения являются более адекватными моделями для многих видов реальных данных, чем нормальное распределение. На примере распределений с бесконечной дисперсией продемонстрирована ограниченность аппарата классической статистики, в частности, практическая неадекватность среднеквадратичного критерия качества в задачах оценивания параметров.
1. Введение
Вероятностные распределения являются базовыми математическими конструкциями для статистического анализа реальных данных стохастической природы, например, сигналов [1], а также для синтеза алгоритмов обработки такого рода данных [2]. Традиционно в качестве модельных используются распределения с конечной дисперсией, чаще всего — нормальные. Конечность дисперсии представляется чем-то самоочевидным, а само предположение о ее бесконечности, особенно применительно к реальным явлениям, входит в противоречие с воспитанной на классической статистике интуицией.
Цель этой статьи — показать, что распределения с бесконечной дисперсией не являются чем-то “экзотическим” и вполне могут быть моделями реальных явлений, причем более адекватными моделями, чем нормальное распределение. Более того, если отказаться от постулата о конечности дисперсии, то именно нормальное распределение следует рассматривать как “экзотическое”. Помимо бесконечной дисперсии, рассматриваются также классы распределений с бесконечным и неопределенным математическим ожиданием.
Стереотип о конечности дисперсии реальных распределений сформировался исторически. Прикладные дисциплины, ориентированные на решение задач представления и обработки случайных данных (например, статистическая радиотехника), в основном базируются на результатах, полученных в теории вероятностей и классической математической статистике в первой половине XX века. Тот круг распределений, которым оперирует классическая математическая статистика, в основном 4
ограничен нормальным распределением и производными от него: %2 -, t-, F-распределениями и некоторыми другими [3]. Такой выбор был продиктован необходимостью наличия у распределений “хороших” для математического исследования свойств, позволяющих получить конструктивные результаты в аналитическом виде.
Однако для прикладных дисциплин, помимо возможности аналитических манипуляций, важна адекватность используемых моделей реальности. Поэтому для них ключевое значение приобретает обоснование применимости основанных на нормальном распределении моделей, которые фактически навязаны имеющимся математическим аппаратом, а не продиктованы самой реальностью. Для такого обоснования традиционно ссылаются на центральную предельную теорему в сочетании с тем обстоятельством, что стохастические данные обычно порождаются как аддитивный эффект большого числа независимо действующих причин.
Тем не менее, поведение реальных данных обычно не укладывается в модель нормального распределения. Как правило, наблюдается тенденция к наличию у реальных распределений более тяжелых хвостов, чем у нормального распределения [4]. Такое поведение объясняют наличием “аномальных” событий, а само распределение рассматривают как вероятностную смесь нормального и некоторого другого распределения, описывающего эти относительно редкие аномальные события. Далее мы постараемся показать, что отказ от постулата о конечности дисперсии элементарных вкладов в результирующее явление лишает нормальное распределение того статуса уникальности и естественности, которым оно обладает в рамках классической статистики. Такой взгляд вполне может объяснить парадоксально упорное “нежелание” реальных данных укладываться в рамки нормального распределения.
2. Распределения с бесконечной дисперсией
Конструирование распределений с неограниченной дисперсией не представляет особых трудностей. В качестве примера рассмотрим однопараметрическое семейство Рр распределений с симметричной
относительно нулевого значения плотностью распределения вероятности (далее, для краткости, просто - “плотностью”) следующего вида:
св
Рр(x)=; р> 1 ' * <х<+”, (1)
где ср — нормировочная константа, обеспечивающая равенство интеграла от плотности единице и определяемая из выражения
і
ср = ( J—Та dx)_1 =р sin(л / Р)/2л . (2)
р -о, 1+1х1Р 4 7
Асимптотическое поведение плотности Рр (х) при росте |х| характеризуется степенной скоростью спада плотности с показателем -р :
РИ, 2002, № 2
Pp(x) * yxF Jx|>> 1 • (3)
Для распределения с плотностью pp (x) второй
момент относительно центра (т.е. значения x=0) определяется интегралом:
Dp=J x2Pp(x)dx • (4)
—X
Из соотношения (3) и элементарных свойств интегралов от степенной функции непосредственно следует необходимое условие сходимости интеграла (4) для второго момента: р > 3. Таким образом, дисперсия введенных выше распределений Рр, плотность которых определяется выражениями (1), (2), бесконечна в диапазоне значений 1 < р < 3 :
Dp=«, 1<Р<3. (5)
При этом, естественно, бесконечной является и среднеквадратичная ширина распределения, определяемая как квадратный корень из дисперсии.
Сразу оговоримся, что запись вида D = ж некорректна с математической точки зрения, поскольку » не является числом и, следовательно, некорректно говорить о “бесконечной” дисперсии. Строго говоря, при расходимости интеграла (4) дисперсия распределения не определена. Однако в контексте данной статьи мы будем использовать применительно к неопределенным моментам распределений рабочие термины “бесконечный” и “неопределенный” как различающиеся по смыслу. Необходимость такого различения станет ясна из раздела 4.
Семейство распределений с плотностью вида (1), (2) не является уникальным. Например, для любого допустимого значения р из распределения с плотностью pp(x) можно получить двухпараметрическое семейство распределений путем преобразований сдвига и изменения масштаба (аналогично тому, как двухпараметрическое семейство нормальных распределений получается из стандартного нормального распределения):
Pp;a,b(x) = -j^Pp ((x “ a)/b); P >1,b>0- (6)
Здесь a — параметр сдвига, определяющий положение центра распределения; b — параметр изменения масштаба относительно “стандартной” плотности распределения pp (x). При таких преобразованиях свойства конечности-бесконечности второго момента относительно центра распределения, естественно, сохраняются. Иными словами, при 1 < р < 3 все распределения вида (6) имеют бесконечный второй момент относительно центра распределения x = a.
Семейство вида (6) далеко не исчерпывает всего множества распределений с бесконечной дисперсией. Свойство конечности-бесконечности второго момента распределений с плотностью pp(x) определяется асимптотическим поведением плотности с
РИ, 2002, № 2
увеличением |x|, а не поведением плотности в окрестности центра распределения. Поэтому существует бесконечное множество распределений с одним и тем же асимптотическим поведением плотности вида (3), обладающих бесконечным вторым моментом, но взаимно не приводимых при помощи преобразований сдвига и изменения масштаба. Важный и интересный класс таких распределений будет рассмотрен в разделе 6.
3. Распределения с бесконечным математическим ожиданием
Конструирование распределений с бесконечным первым моментом (математическим ожиданием) также не представляет особых трудностей. Рассмотрим односторонние распределения (т.е. определенные только при неотрицательных значениях аргумента) с плотностью следующего вида:
Py(x) = ^ > x - 0 1, (7)
где с' — нормировочная константа, определяемая выражением
“ 1
с' = (11-7dx)-1 =уsin(п/у)/п . (8)
0 1 + x
В силу того, что асимптотическое поведение плотности вида (7), (8) с ростом x описывается степенной функцией
P У(x) * xr, x>>1,
интеграл, определяющий первый момент (математическое ожидание M) этого распределения, обладает следующим свойством:
M(pу (x)) =J xpу (x)dx = +<», 1< у< 2 .
0
В нашей терминологии, в диапазоне значений параметра 1 < у < 2, распределения с плотностью pу (x) имеют бесконечное математическое ожидание. Это свойство сохраняется и при произвольном изменении масштаба в b>0 раз. Поскольку сходимость интеграла, определяющего первый момент, зависит только от асимптотического поведения плотности с ростом х, то существует бесконечное множество односторонних распределений, обладающих бесконечным математическим ожиданием и взаимно не приводимых друг к другу путем изменения масштаба.
4. Распределения с неопределенным математическим ожиданием
Как отмечалось выше, в рамках данной статьи мы используем два рабочих термина, характеризующих моменты распределения: “бесконечный” и “неопределенный”. Чтобы проиллюстрировать целесообразность применения этих двух понятий, рассмотрим в качестве примера подмножество рас -пределений с симметричной плотностью pp(x) , определяемой выражениями (1), (2) при 1 < beta < 2 .
5
На первый взгляд уже сама симметрия плотностей этих распределений относительно нулевого значения позволяет утверждать, что их математическое ожидание равно нулю. Однако это не верно. Заметим, что значение следующего интеграла для первого момента распределения pp (x) не определено в указанном диапазоне значений параметра:
M(pp (x)) = J xpp (x)dx, 1< p< 2 . (9)
—да
Для объяснения этого факта достаточно представить интеграл (9) в виде суммы двух интегралов:
0 +о)
M(pp (x)) = J xpp (x)dx + J xpp(x)dx . (10)
—да 0
Значения обоих слагаемых в (10) не определены. В нашей терминологии первый интеграл равен -ж, второй — +ю , а значения суммы минус- и плюсбесконечности не определены.
Поясним сказанное подробнее. Для того чтобы интеграл со знакопеременной подынтегральной функцией f(x) имел определенное значение, необходимо, чтобы интеграл от модуля |f(x)| имел конечное значение. В противном случае возникает следующее противоречие. Разобьем весь интервал интегрирования на интервалы длиной Д и представим интеграл (9) для математического ожидания в виде бесконечного ряда:
(i+1) А
M(pp (x)) = X J xpp(x)dx . (11)
i=—<» iA
Значение суммы (11) и, следовательно, самого интеграла (10) можно считать определенным, если значение суммы не зависит от порядка суммирования. Для этого необходимо, чтобы сходился ряд
+да (i+1) А +да
S = £ I J xpp (x)dx| = J Ix|pp (x)dx, (12)
i=-“ iA -a>
т.е. чтобы ряд (11) был абсолютно сходящимся. В противном случае вступает в силу теорема Римана, согласно которой для ряда, не являющегося абсолютно сходящимся, изменением порядка суммирования можно сделать ряд сходящимся к любому значению [5]. Поскольку при 1 <р< 2 ряд (12) расходится (что следует из свойств интеграла от степенной функции), то значение математического ожидания (9) не определено при 1 < р < 2 .
5. Является ли нормальное распределение уникальным?
Нормальное распределение занимает особое место в ряду тех, которые рассматриваются в классичес -кой статистической теории. Его уникальность связана, прежде всего, со следующим фундаментальным свойством: сумма двух нормально распределенных случайных величин также распределена по нормальному закону. Это свойство в дальнейшем будем называть “устойчивостью распределения”. Оно тесно связано с другим свойством
нормальных распределений, выражаемым известной центральной предельной теоремой (ЦПТ). Эта теорема утверждает, что распределение суммы одинаково распределенных независимых случайных величин с конечной дисперсией сходится к нормальному распределению с увеличением числа слагаемых.
На ЦПТ часто ссылаются для того, чтобы обосновать адекватность статистических моделей, основанных на нормальном распределении, применительно к описанию самых различных реальных явлений. Такого рода аргументы обычно базируются на представлении о том, что многие наблюдаемые явления определяются суммой вкладов большого числа причинных факторов, действующих независимо друг от друга. Т огда, в силу Ц ПТ, независимо от закона распределения вкладов этих элементарных причин, суммарный эффект должен описываться нормальным распределением.
Тем не менее распределения, с которым приходится сталкиваться на практике, почему-то обычно отличаются от нормального — как правило, они имеют более тяжелые хвосты [4]. Именно этим объясняется столь высокий интерес практиков к так называемым робастным статистическим методам, мало чувствительным к отклонениям распред еле -ний от нормального в сторону увеличения тяжести хвоста [6].
Почему же статистические модели и методы, основанные на постулате о нормальности распределения, столь широко применяются на практике? Ответ скорее всего заключается в “хороших” аналитических свойствах нормального распределения, позволивших получить многие результаты, например, процедуры обработки данных, в аналитической форме. Тогда возникает естественный вопрос — почему такого рода процедуры все же оказываются работоспособными, будучи примененными к реальным данным? Это связано прежде всего с тем, что полученные в классической статистической теории решающие процедуры на практике обычно применяются не “в чистом виде”, а в сочетании с другими, зачастую, эвристическими методами. Характерным примером могут служить различные методы предварительного цензурирования первичных данных. Такое цензурирование ориентировано на исключение наиболее сильно уклоняющихся элементов выборки и позволяет существенно улучшить согласие между оставшимися данными и моделью нормального распределения.
Ниже мы предлагаем свой вариант ответа на следующий фундаментальный вопрос, на который пока нет единого удовлетворительного ответа: почему реальные распределения столь часто отличаются от нормального в сторону большей тяжести хвоста распределения? Поскольку ЦПТ, как и любое другое математически доказанное утверждение, безусловно верна, то ответ следует искать в невыполнении по крайней мере одного из условий, входящих в формулировку этой теоремы. В качестве возможных отклонений можно указать конеч-
6
РИ, 2002, № 2
ность числа независимых элементарных вкладов, их взаимную зависимость, а также различия в их законах распределения. Однако в рамках данной статьи нас будет интересовать менее тривиальная возможность, а именно - бесконечность дисперсии распределений элементарных аддитивных вкладов.
Если расширить круг рассматриваемых распред е -лений, включив в него и распределения с бесконечной дисперсией, то нормальное уже не является единственным устойчивым распределением. Как будет показано в разделе 6, существует континуум распределений с бесконечной дисперсией, обладающих свойством устойчивости. Такие распределения являются предельными для суммы большого числа слагаемых с неограниченной дисперсией. При таком взгляде на проблему нормальное распределение также уникально, но уже не своим свойством устойчивости, а совсем в другом смысле. Оно является единственным в классе устойчивых распределений, которое обладает конечной дисперсией.
Следующий раздел статьи содержит краткий обзор свойств интересного и сравнительно мало освещенного в отечественной технической литературе класса устойчивых распределений. В англоязычной литературе распределения этого класса называют альфа-устойчивыми — “alfa-stable distributions”. Более подробную информацию о математической стороне вопроса можно найти во вводном обзоре [7] и монографии [8].
6. Класс устойчивых распределений
Рассмотрим двухпараметрическое семейство распределений, получаемых из некоторого “стандартного” распределения c плотностью Pq(x) путем преобразований сдвига и изменения масштаба:
p(x|a,b) = -bp0((x-a)/b), b > 0, (13)
где a — параметр сдвига; b — параметр масштаба.
Такое семейство будем называть устойчивым, если распределение суммы двух случайных независимых величин из этого семейства также принадлежит ему. Аналитически свойство устойчивости можно выразить следующим образом:
p(x = x1 + x2) = p(x^ + a2, b(b1;b2)), (14)
здесь p(x1) = p(x1|a1,b1), p(x2) = p(x2|a2,b2).
Функция b(b1,b2) определяет зависимость масштабного коэффициента b (ширины) распределения суммы от значений масштабных коэффициентов Ц, b2 слагаемых. Вид функции b(b1,b2) специфичен для различных семейств устойчивых распределений и однозначно задает такое семейство. Например, семейству нормальных распределений (которое также относится к классу устойчивых) соответствует следующее выражение для функции b(b1,b2):
bnorm (b1,b2) = (bl2 + b2)1/2 .
Учтем, что плотность распределения суммы независимых случайных величин является сверткой плотностей слагаемых [3]. Перейдем от функций p(x) к их Фурье-образам f(t) и учтем свойства преобразования Фурье. Тогда для выполнения условия устойчивости (14) достаточно, чтобы Фурье-образ функции p(x) имел следующий вид:
fa(t) = exp(-|bt|a), a > 0, b > 0 , (15)
где параметр b соответствует масштабному коэффициенту для плотности p(x) в выражении (13). Обозначим семейство функций, Фурье-образ которых имеет вид (15), как {p a (x)}. Все эти функции симметричны относительно значения x=0.
Распределениями, плотность которых принадлежит семейству функций {pa (x)}, интересовался еще Коши. Однако ему так и не удалось решить принципиальный вопрос о том, в каком диапазоне значений параметра а функции pa(x) представляют собой плотности вероятности, т.е. являются всюду неотрицательными функциями. Лишь в 1925 г. Леви опубликовал монографию, где было окончательно установлено, что только подмножество {pa(x),0 <а< 2} представляет плотности вероятности устойчивых распределений, а остальные функции из этого семейства не являются всюду неотрицательными и, следовательно, не могут описывать плотность вероятности.
Перечислим некоторые интересные свойства устойчивых распределений.
1. Единственным устойчивым распределением с конечной дисперсией является нормальное, т.е. распределение с плотностью P2(x) .
2. При 0 < a < 2 скорость спада плотности устойчивых распределений асимптотически описывается степенной функцией с показателем -(а +1):
Ра (x)
>> 1, 0 < а < 2 .
3. В окрестности своего центра плотность всех симметричных устойчивых распределений обладает формой, напоминающей колокол, и нулевым значением первой производной в нуле:
dpa (0) dx
= 0, 0<a< 2.
4. За несколькими исключениями, устойчивые распределения не имеют явных выражений для плотности или функции распределения. Из симметричных устойчивых распределений, помимо нормального, через элементарные функции выражается только плотность распределения P1(x) . Выражение для плотности этого распределения, называемого распределением Коши, с точностью до масштабного коэффициента совпадает с выражением (1) при р = 2 .
5. Множество всех симметричных устойчивых распределений описывается тремя параметрами: пара-
РИ, 2002, № 2
7
метром а в выражении (15) для преобразования Фурье плотности (характеристической функции), масштабным коэффициентом b и параметром сдвига а. Поскольку распределения, различающиеся только значениями параметра сдвига и масштабно -го коэффициента, обычно относят к одному классу и называют одним термином (например, нормальное распределение), то можно говорить об однопараметрическом множестве классов симметричных устойчивых распределений, определяемых значением параметра а.
6. Множество всех устойчивых распределений включает также и асимметричные и в общем случае описывается четырьмя параметрами или, если определять классы распределений с точностью до произвольных значений сдвига а и масштабного коэффициента b, то двумя параметрами.
7. Распределение суммы независимых и одинаково распределенных случайных величин с неограниченной дисперсией, плотность распределения которых асимптотически характеризуется степенной скоростью спада плотности
p(x) и—, 1< Р <3
F |x|p р ,
с ростом числа слагаемых сходится к устойчивому распределению c плотностью p p_i(x). Это свойство является аналогом ЦПТ для распределений с бесконечной дисперсией.
7. Устойчивые распределения с бесконечной дисперсией и реальные данные
Существование устойчивых распределений с бесконечной дисперсией позволяет по -новому взглянуть на проблему парадоксально частого отклонения распределений реальных данных от нормального в сторону более тяжелых хвостов. Если допустить, что распределение элементарных вкладов в наблюдаемые величины описывается распределениями с бесконечной дисперсией, то ЦПТ уже становится неприменимой. В этом случае следует ожидать, что наблюдаемые данные будут подчиняться одному из устойчивых распределений с бесконечной дисперсией в силу предельных свойств сумм таких случайных величин, описанных в разделе 6.
Каковы основания для принятия постулата о конечности дисперсии элементарных вкладов? Этот постулат явно или, чаще всего, неявно принимается в многочисленных прикладных работах при обоснованиях применимости, базирующихся на нормальном распределении моделей. В основном, принятие данного постулата—это следствие традиции, психологической инерции и удобства аналитической работы с результирующим предельным нормальным распределением.
В некоторых случаях постулат о конечной дисперсии элементарных вкладов кажется естественным следствием самой физической природы описывае-
мого явления. Например, если описываемые величины имеют физический смысл амплитуды, т.е. их квадрат пропорционален энергии или мощности, то бесконечность дисперсии означает бесконечность средней энергии или мощности, что представляется не имеющим физического смысла. Однако даже применительно к описанию такого рода величин статистические модели, основанные на распределениях с бесконечной дисперсией, могут быть существенно более адекватными реальности, чем их аналоги, основанные на постулате о конечности дисперсии. Дисперсия любой конечной выборки из распределения с бесконечной дисперсией всегда конечна, независимо от размера выборки. А поскольку в реальности имеют дело именно с конечными выборками (возможно, очень большими), то бесконечность энергии никогда не наблюдается, даже если выборка формируется из распределения с бесконечной дисперсией.
Рассмотрим, например, теорию статистической обработки сигналов. Дисперсия мгновенных значений сигнала пропорциональна его мощности. Поэтому, казалось бы, распределения с бесконечной дисперсией вряд ли могут быть здесь адекватными, поскольку им соответствует бесконечная средняя мощность сигнала. Тем не менее за последние 1015 лет в англоязычной литературе было опубликовано множество теоретических и экспериментальных работ в области статистической обработки сигналов, посвященных применению распределений с бесконечной дисперсией, в частности, устойчивых распределений, к описанию статистических свойств реальных сигналов и помех. В ряде этих работ показано, что распределения с бесконечной дисперсией во многих случаях имеют достаточно строгое теоретическое обоснование [9], а также могут существенно более адекватно описывать многие реальные сигналы и помехи, чем нормальное распределение [10].
8. Поведение выборок из распределений с неограниченными моментами
Для знакомства с устойчивыми распределениями с бесконечной дисперсией полезно сравнить графическое представление выборок из таких распределений, а также поведение наиболее распространенных дескриптивных статистик (например, выборочной дисперсии) для таких выборок.
На рис. 1 представлены реализации из N=100 взаимно независимых значений, извлеченных из устойчивых распределений, которым соответствуют следующие значения параметра а: 2,0 (нормальное распределение), 1,99 и 1,0 (распределение Коши). Нормировка масштаба для представления значений здесь осуществлялась по максимальному абсолютному значению в выборке. Видно, что с уменьшением значения параметра а поведение выборочных значений приобретает все более ярко выраженный импульсный характер, т.е. появляются, хотя и редкие, но большие по абсолютной величине значения (если сравнивать с нормальным распределением).
8
РИ, 2002, № 2
Рис.1. Независимые значения случайных величин, подчиняющихся устойчивым законам распределения
На рис.2 представлено поведение значений выборочной дисперсии, сформированных по выборке нарастающего объема. Максимальный размер выборки — 1000, что соответствует крайней правой точке; шаг изменения размера выборки — 10. Для нормального распределения (а = 2) наблюдается сходимость выборочной дисперсии с ростом размера выборки. Для распределений с бесконечной дисперсией (а=1,99 и а=1,0) такой сходимости не наблюдается. Именно так бесконечность дисперсии распределения проявляется в свойствах выбор -ки - хотя выборочная дисперсия всегда конечна, сходимости выборочной дисперсии к определенно -
Рис.2. Поведение дисперсии выборки нарастающего объема из устойчивых распределений в зависимости от размера выборки
му значению с ростом размера выборки не наблюдается. В частности, это означает, что выборочная дисперсия не может служить приемлемой дескриптивной статистикой для описания степени разброса данных, извлеченных из распределений с бесконечной дисперсией.
9. Ограниченность среднеквадратичного критерия качества
В современной статистической теории обработки сигналов критерий качества, основанный на среднем квадрате (дисперсии) ошибки, играет ключевую роль. Основные теоретические результаты были получены именно применительно к среднеквадратичному критерию качества. Это связано, прежде всего, с удобством аналитических преобразований и наличием хорошо развитого математического аппарата для линейных и билинейных (в частности, квадратичных) операторов и функционалов. Например, практически вся прикладная теория, ориентированная на определение потенциальной точности оценивания параметров, основана на неравенстве Крамера-Рао [1,2], которое описывает теоретически предельные значения именно для среднеквадратичной ошибки оценивания.
Бесконечная дисперсия распределения ошибки может сделать классический среднеквадратичный критерий качества полностью не адекватным с практической точки зрения (а вместе с ним и значительную часть результатов, полученных в рамках классической статистической теории).
Для иллюстрации этого утверждения рассмотрим следующую парадоксальную ситуацию. Имеется два измерителя, например, радиолокационных дальномера. Путем абсолютно корректного теоретического анализа установлено, что среднеквадратичное значение ст ошибки измерения координат, обеспечиваемое этими измерителями, соответственно равно:
о 1 = 10 м,
СТ 2 = ГО.
Однако после детальных практических испытаний второй измеритель единодушно признается компетентной комиссией существенно более точным. Возможна ли такая ситуация?
Если закон распределения ошибок первого измерителя имеет конечную дисперсию (например, нормальный), а второго - принадлежит классу распределений с бесконечной дисперсией, то такая ситуация вполне возможна. Это объясняется тем, что для распределений с бесконечной дисперсией уменьшение масштабного коэффициента b в произвольное число раз (т.е. сжатие распределения в b раз) оставляет дисперсию (и, следовательно, среднеквадратичное отклонение) бесконечной. В то же время любая другая мера ширины распределения, имеющая конечное значение для заданного распределения, при таких преобразованиях уменьшится в b раз и, таким образом, может быть сколь угодно малой за счет выбора b.
РИ, 2002, № 2
9
Допустим, что при аттестации измерителей в качестве меры точности использовалась ширина Dg интервала между значениями аргумента функции распределения ошибки, соответствующими ее значениям є/2 и 1 -є/2 . Иными словами, Dg — это ширина такого интервала, за пределы которого ошибка выходит с вероятностью є :
P(|x|>DЕ/2) = є .
(Здесь для простоты предполагается, что закон распределения ошибки измерений имеет симметричную относительно нуля плотность.)
Величина Ds возрастает по мере уменьшения є , но для любого распределения и любого сколь угодно малого значения є она всегда конечна, а при сжатии распределения пропорционально уменьшается. Это означает, что распределение с бесконечной дисперсией может иметь сколь угодно малое значение Ds при произвольно малом є . Например, второй измеритель мог обеспечивать ошибку, не превосходящую 1 сантиметра с вероятностью, скажем, 10_9 , но при этом все же иметь бесконечную дисперсию ошибки (таблица).
Значения мер ошибки измерителей
Мера ошибки, м
а DB, є=10"9
Измеритель 1 10 50
Измеритель 2 го 0,01
Возможность такого рода парадоксальной ситуации существует и для распределений ошибок с конечной дисперсией. При этом вместо знака бесконечности в таблице может стоять сколь угодно большая величина, например ст 2 = 106 м. Конструирование соответствующей плотности распределения ошибок второго измерителя осуществляется достаточно просто. Единственное отличие от рассмотренного выше примера с бесконечным ст 2 — это дополнительная операция “усечения” плотности распределения:
' , ч [cxP(x) пРи |x|^ X px(x) = ( 0 при |x|> X,
где p(x) — некоторая плотность распределения с бесконечной дисперсией; X—абсолютная величина границ интервала ненулевых значений плотности; Сх — зависящий от X коэффициент перенормировки плотности. Распределение с такой плотностью всегда имеет конечную дисперсию. За счет выбора достаточно большого значения X среднеквадратичная величина x может быть сколь угодно большой.
Здесь следует также отметить, что такого рода парадоксы могут возникать и при использовании других интегральных мер ширины распределения, отличных от среднеквадратичной. Например, в качестве меры ширины распределения достаточно часто используется средний модуль уклонения от медианы. Для распределений с симметричной отно-
сительно нуля плотностью этой мере ширины соответствует просто среднее абсолютное отклонение:
Dabs = J|x|p(x)dx .
—X
Такая мера ширины распределения, будучи примененной к конечным выборкам, заметно менее чувствительна к наличию редких, но больших по абсолютной величине значений, чем среднеквадратичное значение. Поэтому она достаточно часто используется на практике и рассматривается как одна из наиболее робастных мер ширины распределения [6]. Тем не менее для распределений с асимптотически степенной скоростью спада хвоста плотности вида с показателем р значение этой меры ширины все же оказывается бесконечным при 1 < р < 2 . В частности, для устойчивых распределений, описанных в разделе 6, среднее абсолютное отклонение бесконечно в диапазоне значений параметра 0 < а < 1. Бесконечность некоторой меры ширины распределения неизбежно ведет к описанному выше парадоксу.
Выводы
1. Распределения с бесконечной дисперсией не являются чем-то экзотическим, по крайней мере с математической точки зрения. Они достаточно просто конструируются аналитически и моделируются методами Монте-Карло.
2. Конечные выборки из распределений с бесконечной дисперсией всегда имеют конечную (выборочную) дисперсию при сколь угодно большом размере выборки. Поскольку на практике всегда имеют дело именно с конечными наборами данных, то бесконечность дисперсии распределения никогда не приводит к реальному столкновению с бесконечными значениями функционалов от выборки, например с бесконечным значением выборочной дисперсии.
3. Для распределений с бесконечной дисперсией существуют предельные распределения для сумм. При симметричных распределениях они входят в класс так называемых устойчивых симметричных распределений с плотностью {pа(x), 0<а<2} и образуют его подкласс распределений с бесконечной дисперсией {pа(x), 0 < а < 2} . Единственным представителем класса устойчивых распределений, обладающим конечной дисперсией, является нормальное распределение с плотностью p2(x). Таким образом, именно нормальное распределение следует рассматривать как “экзотическое”, поскольку ему соответствует единственное значение параметра а = 2, граничное для интервала 0 < а < 2 значений параметра а, соответствующих всем симметричным устойчивым распределениям.
4. Для многих реальных данных, например, случайных сигналов (шумов), распределения с бесконечной дисперсией, в частности устойчивые, являются более адекватной моделью, чем нормальное распре-
10
РИ, 2002, № 2
деление. Это подтверждается многочисленными экспериментальными и теоретическими работами.
5. Возможность наличия у распределения ошибок измерений бесконечной дисперсии может приводить к полной практической неадекватности классического среднеквадратичного критерия качества, лежащего в основе классической статистической теории и необоснованно часто используемого на практике.
6. Наряду с распределениями с бесконечной дисперсией существуют и распределения с бесконечными значениями моментов, отличных от 2-го (дисперсии). В частности, достаточно просто конструируются распределения с бесконечным математическим ожиданием, а также с неопределенным математическим ожиданием. Например, подмножество (pa(x), 0 < а < 1} упомянутого выше семейства симметричных устойчивых распределений обладает неопределенным математическим ожиданием
7. Аппарат классической статистики мало приспособлен к оперированию распределениями с бесконечной дисперсией и требует дальнейшего развития.
8. При обработке реальных данных наличие признаков у распределения заметно более тяжелого хвоста, чем у нормального, является существенным основанием для применения модельных распределений с бесконечной дисперсией, в частности, устойчивых.
9. Одним из характерных признаков, свидетельствующих о целесообразности применения модель-
УДК 621.396.96
ПРЕДЛОЖЕНИЯ ПО ПОВЫШЕНИЮ ТОЧНОСТИ УГЛОМЕСТНЫХ ИЗМЕРЕНИЙ В ОБЗОРНЫХ РЛС
КЛИМЧЕНКО В.И., малышей а.а.
Рассматривается вариант решения задачи повышения точности измерений угла места воздушных объектов в обзорных РЛС. Предлагается обработку принимаемых сигналов проводить в области пространственных спектров с применением теории распознавания образов. Приводятся результаты анализа точности угломестных измерений с использованием предлагаемого способа обработки сигналов.
При определении высоты воздушных объектов обзорными РЛС в области малых углов места точность проводимых измерений вследствие влияния земной поверхности заметно снижается. В частности, в трехкоординатных РЛС метрового диапазона при углах места, меньших 2/3 ширины диаграммы направленности антенны в вертикальной плоскости, погрешность оценки высоты настолько велика, что данные, получаемые по каналу измерения высоты, считаются недостоверными.
ных распределений с бесконечной дисперсией, является отсутствие сходимости выборочной дисперсии с ростом размера выборки.
Литература: 1. Левин Б.Р. Теоретические основы статистической радиотехники. В 3-х т. М.: Сов. радио, 19741976. 2. Фалькович С.Е., Хомяков Э.Н. Статистическая теория измерительных радиосистем. М.: Радио и связь, 1981. 288 с. 3. Справочник по теории вероятностей и математической статистике / Под ред. В.С.Королюка. К.: Наук. думка, 1978. 584 с. 4. Устойчивые статистические методы оценки данных / Под ред. РЛ.Лонера, Г.Н.Уилкинсона. М.: Машиностроение, 1984. 232 с. 5. Дороговцев Л.Я. Ряды. К.: Вища шк., 1978. 112 с. 6. ХьюберП. Робастность в статистике. М.: Мир, 1984. 306 с. 7. Золотарев В.М. Одномерные устойчивые распределения. М.: Наука, 1983. 304 с. 8. Золотарев В.М. Устойчивые законы и их применения. М.: Знание, 1984. 64 с. 9. Sousa E. Performance of spread spectrum packet radio network link in a Poisson field of interferers. IEEE Trans. Information Theory, 38(6): 1743-1754, 1992.
10. Nikias, C.L., Shao M. Signal Processing with Alpha-Stable Distributions and Applications. John Wiley and Sons, New York, 1995. 374p.
Поступила в редколлегию 18.10.2001
Рецензент: д-р техн. наук, проф. Костенко П.Ю.
Колядин Владимир Леонидович, канд. техн. наук, докторант кафедры авиационно-космических радиотехнических систем Национального аэрокосмического университета “ХАИ”. Научные интересы: не классические методы анализа данных, включая обработку сигналов и изображений. Увлечения и хобби: история и методология науки, теннис. Адрес: Украина, 61129, Харьков, пр. Тракторостроителей, 162-Г, кв. 128, тел. 1481-44.
В статье предлагается вариант решения задачи повышения точности определения высоты воздушных объектов, позволяющий расширить диапазон достоверных измерений высоты в области малых углов места.
Перед описанием предлагаемого решения целесообразно рассмотреть метод оценки высоты воздушных объектов, реализованный в РЛС указанного класса, а также его особенности.
Суть метода заключается в следующем (рис.1). Отраженный от цели эхо-сигнал наводит на рас-крыве антенной решетки (АР) поле, характеризующееся в вертикальной плоскости определенным амплитудно-фазовым распределением. Это распределение анализируется путем Фурье-преобразова-ния [1]:
2 П
. _ • Ід~к•d-sin(Ei)
F(Si) = XAk • e k
где Ak = ak • eJ9k — комплексная амплитуда поля на k-м элементе АР; k — номер элемента АР; X — длина волны; d — шаг АР; є i — текущий угол места.
Результатом такого преобразования, по сути, является пространственный спектр принятого эхо-сиг-
РИ, 2002, № 2
11