Научная статья на тему 'О сходимости индикаторных оценок для параметров линейной модели'

О сходимости индикаторных оценок для параметров линейной модели Текст научной статьи по специальности «Математика»

CC BY
151
29
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Тарасенко Петр Феликсович

Рассматривается задача оценивания параметров линейной модели наблюдений, когда о распределении случайных погрешностей известно, что оно имеет определенные квантили заданных уровней. Введены оценки параметров по методу наибольшего достигнутого уровня значимости. Приводится доказательство равномерного закона больших чисел и состоятельности для одного класса индикаторных оценок. Предложенная оценка применима для привлечения априорной информации квантильного типа, а также для решения задач квантильной регрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of parameters estimation of linear model is considering for the case, when random errors are independent and their common distribution has known joint quintiles of a given levels. The uniform law of large numbers and consistency has been proved for a class of indicator-based estimators. The proposed estimator is applicable for utilizing prior information and particularly to the case of quantile regression.

Текст научной работы на тему «О сходимости индикаторных оценок для параметров линейной модели»

П.Ф. Тарасенко

О СХОДИМОСТИ ИНДИКАТОРНЫХ ОЦЕНОК ДЛЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МОДЕЛИ

Рассматривается задача оценивания параметров линейной модели наблюдений, когда о распределении случайных погрешностей известно, что оно имеет определенные квантили заданных уровней. Введены оценки параметров по методу наибольшего достигнутого уровня значимости. Приводится доказательство равномерного закона больших чисел и состоятельности для одного класса индикаторных оценок. Предложенная оценка применима для привлечения априорной информации квантильного типа, а также для решения задач квантильной регрессии.

В некоторых приложениях статистических методов обработки данных встречаются ситуации, когда информация о случайных ошибках измерений формулируется в виде суждений об их принадлежности некоторым интервалам с заданной вероятностью. Это имеет место при обработке результатов физических опытов, когда экспериментатор не может делать утверждений о форме распределения погрешностей, но готов назвать точность измерений и формулирует это в виде интервала, которому принадлежит большая часть погрешностей. Похожая ситуация встречается при обработке вторичных данных статистического учета. При проведении статистических обследований принято контролировать точность определения показателей с помощью доверительных интервалов, при этом первичный материал не предоставляется в вышестоящие органы статистики, где решаются задачи анализа вторичных данных.

В самом общем виде модель этого типа априорной информации рассматривалась ранее в [2 - 4] применительно к задаче проверки гипотез о параметрах линейной модели.

В данной работе примем следующую модель погрешностей. Случайные величины г1,.,г„ независимы, одинаково распределены, а их общая функция распределения F имеет квантили с1,.,ск_1 уровней д1,.,дк-1 и непрерывна в точках с1<.<ск_1 . Обозначим через Ск=(ск-1,ск) (А=1,...Д) интервалы разбиения числовой оси, образованные квантилями. Здесь предполагается, что с0 = -ж, ск = ж, а угловые скобки означают открытую или закрытую границу интервала. Каждому из интервалов приписана, таким образом, вероятность рк, и если ф.р. F непрерывна на границах разбиения ск , то Pk=F(ck) _ F(ck_l) = цк - дк_1 .

На таком уровне априорной информации неизбежен отказ от использования величин невязок в качестве признаков и переход к использованию индикаторов попадания этих невязок в множества разбиения {Ск}. Очевидно, что такой переход осуществляется без потери различающей информации, поскольку о распределении погрешностей ничего не известно, кроме его квантилей.

В качестве основных примеров можно рассматривать две ситуации. В первом случае {ск}={_с, с} и {рк}={р, 1_2р, р}. Во втором примере {ск}={_с,0,0,с} и {рк} = {р, 1_р, 0, 1_р, р}. Здесь постоянные с>0 и рє(0,1/2) будем считать известными. Случай неизвестного значения с, которое играет роль масштаба распределения, описывается в [2 _ 4].

Случай известной медианы, приводящий к знаковому анализу, также может быть описан с помощью введенной модели априорных сведений о погрешностях, если положить {ск} = {0,0} и {рк}={72, 0, 1/2}. В связи с этим техника доказательства результатов индикаторного статистического анализа во многом близка к доказательствам, полученным для знакового случая [1].

Со случаем {ск}={0,0} и {рк}={р, 0, 1 _ р} связан еще один класс задач, которые известны как квантильная регрессия (см., например, [5 _ 7]). Традиционно методы кван-тильной регрессии основаны на М-оценке квантиля уровня р. В данной работе развивается другой подход к этой задаче, основанный на анализе индикаторов попадания невязок во множества разбиения {Ск}.

Следует заметить, что чем больше квантилей распределения погрешностей известно, тем лучшего качества можно ожидать от статистических выводов, если они используют знание этих квантилей. Таким образом, разработка индикаторных методов анализа данных может рассматриваться как стремление улучшить свойства статистических процедур за счет привлечения доступной априорной информации. Однако эта информация не выводит задачу за рамки непараметрического уровня априорной неопределенности.

В данной работе рассматривается один класс индикаторных оценок параметров линейной модели статистических наблюдений. Доказана состоятельность этих оценок.

ПОСТАНОВКА ЗАДАЧИ

Рассмотрим задачу оценивания параметров 0 линейной модели

Y= X T0 + s , (1)

которая описывает статистическую зависимость наблюдений Y = (Yh...,Y„)T от неизвестных параметров

0 = (0ь---, 0T)T , случайных погрешностей измерений s = (s1,.,sn)T и матрицы плана X, образованной столбцами Xb... ,Xn .

Оценка параметров 0 может быть определена, если имеется метод проверки простой гипотезы H0: 0=0о против сложной альтернативы H1: 0^0о . Заметим, что первичными признаками являются наблюдения Y (или соответствующие невязки Y- XT0O), однако статистическая проверка гипотез возможна только на основе использования априорного знания распределения {рк}, которое задано на разбиении {Ck}. Это означает, что в качестве признаков достаточно использовать индикаторы попадания невязок модели (1) в множества разбиения {Ck}. Отсюда и происходит название индикаторных статистических процедур.

Оценкой параметров модели (1) может служить вектор 0о , доставляющий наибольший достигнутый уровень значимости при проверке гипотезы Н0 против альтернативы Н1. В [2 - 4] предложено несколько вариантов тестов для проверки таких гипотез. Эти тесты уровня значимости у представляются в виде H(h(0O))> tY, где Л(0о)=(М(0о),..., hn(0o))T - вектор индикаторных статистик hI(QO)=s(Y-X,T0O), а индикаторная функция s(u) принимает значение к, если u е Ck.

Поскольку пороговое значение tY не зависит от 0о, то оценка по методу максимума достигнутого уровня значимости запишется в виде

©n = UseSn ©(s), где Sn=Arg min seS(Y) H(s), (2)

S(Y) - множество возможных наборов индикаторных признаков, ©(s) - выпуклые многогранники в пространстве параметров, имеющие вид ©(s)={0: h(0)=s}. При решении дискретной задачи минимизации (2) пу-

тем полного перебора, критерий H(s) необходимо вычислять в K точках, поэтому для больших объемов выборки целесообразно использовать методы сокращения перебора, которые могут быть основаны на гипотезе «выпуклости» H(h(0)) как функции от параметров 0.

В данной работе рассматриваются некоторые асимптотические свойства оценки (2), когда в качестве критериальной статистики используется функция

я»=п хT=. (ххам) 2. <з>

Если ф.р. F непрерывно дифференцируема в окрестностях точек c\,...,cK-\ , то оптимальный выбор величин Б\(к) предполагает (см. [4]) их задание в виде

Bl(k)=\f(ck)-f(ck-l)\Alpk,

гдеf(ck)=F'(ck), fc0)=fcK)=0, A - произвольная постоянная. При необходимости вместо неизвестных величин f(ck) здесь могут быть использованы другие значения, играющие роль априорной догадки. Похожая ситуация с заданием весовых коэффициентов (меток) имеет место в ранговом анализе, где эти коэффициенты называются метками рангов. Поэтому веса Bj(k) будем называть метками множеств разбиения {Ck}.

В частности, для двух основных примеров, описанных во введении, метки могут быть взяты в виде {Bi(k)}={-1, 0, 1} для первого примера, а для второго

- в виде {B1(k)}={-2pl(1-2p),-a, 0, a, 2pl(1-2p)}. В последнем случае a - априорная догадка о значении величины (f(0)-f(c))lf(c). Для случая квантильной регрессии получаем метки {B1(k)}={-1lp, 0, 1l(1-p)}.

В дальнейшем будем в разных сочетаниях использовать и ссылаться на следующие условия.

(а) Ф.р. F непрерывна и удовлетворяет условию Липшица, т.е 3 L > 0: \F(u1) - F(u2)\ < L \щ - u2\

VU\, U2 eR .

(б) Матрица плана ограничена равномерно по п, т.е. 3H>0: sup ij,n \Xij\<H.

(в) Метки B1(k) имеют нулевое среднее и не убывают, т. е.

ZKk=l pkB 1(k) = 0 ; B1 (k)<B1(k+1) Vk=1,.. ,,K-1.

(г) Хотя бы для одного k0e 1,..,K - 1 выполняется B1(k0+1)>B1(k0) и для этого k0 существуют постоянные L0>0, 5>0 такие, что \F(u1) -

- F(u2)\>L0\u\-u2\ в 5-окрестности ko-й границы априорного разбиения (т.е. при любых ubu2E{u:\u-ck0\<5}).

(д) B1(s(u))>0 при u>0 и B1(s(u)) <0 при u<0.

(е) Матрица плана сходится и асимптотически не вырождена, т.е. существует предел

Vxn = Vx >0, где VXn= 1X ”=1 X- XT .

p {5 (t) = k} =

F (ci + XT t),

F (ck + XT t) - F (ck-i + XT t),

1 - F (cK-i + XT t),

k = 1,

k = 2,...,K -1, k = K.

Теорема 1. Пусть выполняются условия (а), (б) и

(в). Тогда для любого А>0 при всех/=1,...,Т имеет место сходимость по вероятности:

sup

И * л

1XXjBi (5 (t)) - M ] nXXjBi (5 (t))

-=1 I -=i

Доказательство. Зафиксируем j, обозначим через Un(t) выражение под знаком модуля в (5) и прежде всего докажем поточечную сходимость Un(t) к нулю по вероятности при любом фиксированном t. Введем в рассмотрение центрированную величину y(t)=Bi(s(t)) - M{Bi(5,(t))}. Заметим, что M{Un(t)}=0 и M{Un(t)}<B2H2/n^-0, где B=max k|B1(k)|. Пользуясь неравенством Чебышева, заключаем, что Un(t) сходится к нулю по вероятности.

Для доказательства (5), в пространстве значений вектора t=(t1,...,tT)T опишем вокруг компакта {t:||t||<A} куб со стороной 2А и разобьем этот куб на (2r)T конгруэнтных кубов с границами-гиперплоскостями вида tk=Aj/r (k=1,..,T, j=-r,..,r). При всяких А и r существует конечное множество таких кубов, которые покрывают компакт {t:||t||<A}. Обозначим это множество через C(A,r) и рассмотрим произвольный куб ceC(A,r).

При фиксированном i линейная функция XiTt достигает своего максимального и минимального значений внутри куба c на его диагонально противоположных вершинах. Величина B1(si(t))=B1(s(e—XITt)) как функция от X Tt является кусочно-постоянной и по условию (в) не возрастает. В результате получаем, что минимальные и максимальные значения функций [-X,Tt], B1(s,(t)) и M{B1(5,(t))} внутри куба c достигаются в одних и тех же точках - на диагонально противоположных вершинах этого куба, которые мы обозначим через tic1 и tc2 соответственно. При этом сами значения векторов tic1 и tc2 зависят только от вектора X, поэтому они не являются случайными. Таким образом, для всех tec имеет место

Ai'-A2'+A3'-A4'<Un(t) < А1-А2+А3-А4,

где

РАВНОМЕРНЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ

Введем обозначение для отклонения от истинных параметров ^ = 0о-0 и переобозначим индикаторные признаки ,5&)=,$(е -Х1Т0о)=к ,(0о), так что

-[ B i( 5, (t-ci)) - M{B i( 5, (t-ci ))}] ,

[B i(5 (tfc2)) - M{B 1(5 (tfc2))}] ,

- [B i(5, (tfc2)) - M{B 1(5 (tfc2))}] ,

[B i(5, (t,d)) - M{B i(5, (t,d))}] ,

:[M{Bi(5(tci))}-M{B 1(5(tfc2))}] , [M{B 1(5 (tfc2))} - M{B 1(5 (tci))}],

- [M{B 1(5(tlc2))}-M{B 1(5(tci))}], [M{B 1(5(tlc2))}-M{B 1(5(tci))}] ,

A1' = -і X n, Xj

1 n 1 =1 V

A =1Xn, X+

1 n 1 =1 V

а2 '=i Xn 1X

2 n ¿—i,=1 І

A2 = -1 X n1 X-

2 n ¿—i,=1 V

A3' = X n1 X

3 n ¿—i ,=1 h

A3 = 1 X n1 X+

3 n ¿—i,=1 V

A4' = -1 X n1 X

4 n 1=1 \

A4 = -L X n1 X-

4 n 1=1 V

X j = max{0Xj}, XT = -min{0,Xj}.

Сходимость к нулю по вероятности величин A1, A2, AI, A2 следует из неравенства Чебышева. Действительно, благодаря тому, что векторы tic1 и tic2 не являются случайными, все эти величины имеют нулевые средние, а их дисперсии ограничены сверху величиной B2H2/n^-0.

Перейдем к рассмотрению величин A3, A4, A3 ' , A4'. В силу условий теоремы, с учетом (4) справедлива оценка

|M{B ¿st (tic2))} - M{B!(s (^))}| < < ZL|Bi(k)|2¿|XTtic2 -XTtw\ < 2KLBHAT/r,

где учтено неравенство ||Х,||<НТ12 а также то, что точки tic1 и tic2 диагонально противоположны:

||tic1 —tic2

||=AT1/2/r. Отсюда, например, для A3 получаем

Из|< n Z ”=1 H M{Bi (Si (tlc 2 ))}-M{B1 (s (tci))} <

<2KLBH2AT/r.

В точности такая же оценка справедлива и для модулей величин A 4, A3 , A 4 .

Возвращаясь к (5), при всяком е>0 выберем

r>KLBH2AT/e и рассмотрим событие Q„, состоящее в том, что для каждого ceC(A,r) величины A1, A2, Al , A2' по модулю не превосходят е/4. В этих условиях событие maxceC(A,r) suptec |Un(t)|<e является следствием события и можно записать следующую цепочку неравенств:

Pi sup |Un(t)|<el>P j max sup|U„(t)|<e[>P(Q„) .

J||t||<A J [ceC(A,r) tEc J

В силу доказанной ранее сходимости случайных величин A1, A2, A1 , A2 к нулю по вероятности, при произвольных фиксированных r и е, рассуждая от противного о совместном распределении этих величин, несложно убедиться, что lim n^P{Qn}=1. Это и завершает доказательство теоремы 1.

СОСТОЯТЕЛЬНОСТЬ

Теорема 2. Пусть выполняются условия (а)-(е). Тогда оценка ©n, полученная по формулам (2) и (3), является состоятельной в том смысле, что выполняется равенство

lim n^M P{supenE5>n ||0n-ö|| > е}=0 (6)

Доказательство. Рассмотрим множества

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Tnj = Arg min||t||<A | Zj(t) |,

где Zj(t) = M{ j)}, j) = 1Z П=1 XjB i(s (t)). (7)

Введем векторную функцию Z(t)=(Z1(t),...,ZT(t)) и заметим, что по условию (в) имеем M{B1(si(0))}=0 и, следовательно, Z(0)=0. Поэтому при любом n и j своего минимума, равного нулю, целевая функция |Zj(t)| из (7) достигает в точке t=0, т.е. Tnj- ={t: Zj(t)=0, ||t||<A} при всех n и j=1,..,T. Покажем, что при достаточно больших n множество {t: Z(t)=0} состоит из единственной точки. Предположим противное, пусть существует t=¿0, при котором Z(t)=0. В этом случае

tTZ(t) = nZn=1 XTt M{B1 (s(ei - XTt))} = 0. (8)

Пользуясь (4), можно записать следующее выражение

М{в1(ф,. - XТ г))} =

= в 1( к) - X К-1 р (€к + ХТ г) [ в 1(к+1) - в 1 (к) ] =

= XК- [Р(Ск) - Р(Ск + ХТ г)] [в 1(к +1) - в 1 (к)] . (9)

Если рассматривать это выражение как функцию от Х,Тг, то она не возрастает, а по условиям (в) и (г)

для нее при если |хт г - ско | <5 справедлива оценка

|м{в! (Ф,. - ХТ г))} > ь X г\[ в ^ +1) - в х (ко)].

Это означает, что функция М{в1(5(е,-м))} равна нулю только при и=о и, следовательно, мМ{в1(5(е, -и))}<о

при всех иеЯ1 и равенство здесь достигается только при и=о. Поэтому равенство в (8) возможно только если Х,Тг =о для всех ,=1,..,п. Однако в этом случае

г ТУх,п г = П X П=1 (X,г )2 = о для данного г ^о, что при больших п противоречит условию (е). Таким образом,

{г: дг)=0}={0}.

Рассмотрим далее вопрос об отделимости значений функции Z(t) от нуля за пределами окрестности точки г=0. Для этого, пользуясь (9), представим ее в виде

z (г) = Х К- [ в 1(к+1) - в!(к) ]х х П X П=1 X, [Р(Ск) - Р(Ск + ХТ г)].

Отсюда получаем

гТ z (г) = Х К-1 [ в 1(к+1) - в 1 (к )]х

х п X п=,((Т г )2 ,

где слагаемые второй суммы, отвечающие случаю Х,Тг =о, считаются равными нулю. Применение к этому выражению условий (в) и (г) дает

-г^(г) > Ьо [ в1(ко+1) - в1(ко) ] г Тух^г , если ||г||<5/тах||Х,||. Из этого неравенства следует, что в указанной окрестности нуля

||Z(t)|| > ||г|| Ьо ■[ в1(ко+1) - в1(ко) ] -т1П/=1,..,Т к, , где к, - собственные значения матрицы УХ,п . Таким образом, функция ||Z(t)|| непрерывна, и на любом компакте вида К(А,в)={г:в<||/]|<А} выполняется ^(г)||^о, если УХ,п >о и в>о.

Отсюда следует, что функция ^(г)|| отделима от нуля на К(А,в), т.е. УА,в (о<в<А) Эе(А,в)>о такое, что УгеК(А,в) имеет место ||Z(t)||>s(A,B), если УХп>о. Действительно, если предположить обратное, то существует последовательность точек г/еК(А,в), для которой ^(/Ц^о и из нее можно выбрать подпоследовательность, сходящуюся к некоторой точке

гоеК(А,в). В силу непрерывности функции ||Z(t)|| отсюда следует, что ^(го)||=о, и это противоречит установленному ранее факту.

Перейдем к рассмотрению индикаторной оценки (2) - (3). Обозначим Тп={г: г=0п-0, 9пе©п}. Тогда

Tn =Arg min t

где £(і)=(^(і),...£т(і))Т, Ij(t) опре-

делены в (7). Условия теоремы (а)-(в) позволяют говорить о справедливости равномерного закона больших чисел (5), из которого следует, что

suP\M\<A Ш - Z(t)\\ 0.

11 11 п^да

Отсюда, в силу доказанной выше отделимости от нуля на компакте K(A,B), для всех B>0 и A>B выполняется

lim P J miп ||К(t)||

є( A,B ) 2

= 1.

(10)

1в<|| г| |<А

С другой стороны, для любого 6 > о существует в > о, при котором

lim P <! sup IК (t)|| < є L = 1.

Im<b j

(11)

limPТИН К(t)||>є(A) L = 1,

II |t| l> A

(13)

B

-Jp R fcl п R}+| XT11 > R}] =

1max ПR}+P{| >R}У!UXTІ] +Op (1),

=2 B

где в1тах = тахк=1,К|в1(к)|, а последнее соотношение получено по закону больших чисел. Продолжая цепочку (13), с помощью только что полученного соотношения можно утверждать, что для любых Я и б>о неравенство

|tT%(f)| >

х і У N

N¿¡=1

B1 min 2B1 max

p { Ы > r}]x

XT d - 2RB 1 maxP { Ы П ^“є

(14)

Действительно, выполняется неравенство

5иР|щ|<в ||£(г^1 < 5иР||4<в №(г) - z(г^1 + 5иР||4<в IV(г^1,

причем первое слагаемое сходится по вероятности к нулю при любом в>о, а благодаря непрерывности функции |^(г)|| можно выбрать достаточно малое в так, чтобы второе слагаемое не превышало 6/2.

Теперь если в дополнение к (1о) и (11) показать, что существует А>о и б(А)>о, при которых

(12)

то сходимость по вероятности (6) будет иметь место для случайного множества, заданного формулами (2) и (3), а доказательство теоремы будет завершено. Для этого заметим, что по условиям (в) и (д) В1(і'і(і))<0, если Х,ті<є,- ; В1(5,{#))=0, если Х,ті =є,- ; В^(€))>0, если Х,ті >є,- . Введем множества І+ ={/: |Х,г#|>|єІ|},

І+_={: |Хгг^|<|єг-|, є,-ХТі>0}, І__ ={: Х?4<Ы, є,-Хті<0},

Г={/: |Хггґ|<|є ¿|}= І+_ + І__. Заметим, что множества І+, І+_ и І__ образуют разбиение {1,...,”} и имеет место {¿: Х,^-В1Ш)>0}с І+ + /_-, {¿: Х,^-В1Ш)<0}с І+_.

Воспользуемся неравенством |а+Ь|>|а|_|Ь|, чтобы получить оценку сверху для

іт «<)=” е и*. •)В1<.*,(і))=

=” Е (Т<)ВЛ*<»>)-1ЕК<)В1<-'<«>)

ієІ++І_ ¿ЄІ+

> ” Е (і)в 1(^ (І))| - ” Е (І)в 1((І))

ІЄІ ¿ЄІ+

=” Е ,”.1 К1 • )В 1<-'.«»| - ” Е|(*т < )В 1( <»))

¿ЄІ+

Оценим сверху последнее слагаемое в (13). Используем для этого соотношение, которое выполняется для любых неотрицательных а, Ь и с:

аІ{а<Ь} = а І{а<Ь}[ І{Ь<с}+І{Ь>с} ] <

< сІ{Ь<с}+а І{Ь>с}, где І{-} _ индикатор выполнения условия. Тогда для любого Я>0 имеет место оценка

выполняется с вероятностью, которая сходится к единице при n ^ да, где ßlmm = min keJ |-8i(k)|, J={k: В1(к)^о, k=1,..,^}. Чтобы полученное неравенство не было тривиальным, всегда можно выбрать достаточно большую постоянную R так, чтобы

Blmm>2BlmaxPr{|e,|>R }.

Получим оценку снизу для величины n Е n j xj t|,

которая входит в (14). Для этого воспользуемся условием (е) и заметим, что

nЕXTt\2 = tT Vx,ntTVxt >X|\t\\2,

1 jl I n^W

где X - наименьшее из собственных чисел положительно определенной матрицы VX. Поэтому, начиная с

некоторого n, будет выполняться неравенство

1.2

T \ и и2

Xt t\ > 1X /2. С другой стороны, по условию (а) и неравенству Коши-Шварца, имеем

nЕüjxTt\ йHlИfnЕn=jxTi. Объединяя полученные неравенства, приходим к оценке

n Е n,JxT и >1 MIX /(2H )•

Используем полученное неравенство, чтобы продолжить цепочку (14). Итак, с вероятностью, стремящейся к единице с ростом n, при любых R и е>о выполняется неравенство

\t

'€ (t )|

> XI л -2RB

1 max

p{ h|nR}-£

где

__ Л D

min 1 max

P{ |єг| > R}]x/(2H) > 0.

Вернемся к доказательству (12). По неравенству Коши - Шварца и в силу полученных соотношений вероятность события

22

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

К (і )112 *

[tT ^)] [X| ill - 2RB1 maxP {єг| п R}-є]:

стремится к единице при любых Я и 6>о. Правая часть этого неравенства стремится к к2 снизу при ||г||^да. Поэтому существует достаточно большая постоянная А такая, что при всех ||г||>А вероятность события

||^(г)||2 > к2 /2 стремится к единице. Выбираемая величина А зависит от 6 (возрастает с ростом 6), однако если рассматривать только достаточно малые 6<6о, то

можно взять Л(е)=Л(ео). Этого достаточно, чтобы прийти к выводу о справедливости (12), что завершает доказательство теоремы 2.

Замечание 1. Условие (г) теоремы 2 можно усилить, заменив его следующей более простой формулировкой. Ф.р. F непрерывно дифференцируема в окрестностях точек cb...,cK-1 и хотя бы для одного ke 1,..,K-1 имеет место F'(е^о и Bi(k+1)>Bi(k).

Замечание 2. Результаты теорем 1 и 2 можно распространить на более общий случай, когда вместо (3) при оценивании используется квадратичная форма вида £T(t) Wn |(t). Для состоятельности такой оценки достаточно добавить условие lim n^M Wn = W > о и в соответствующих местах доказательства при получении верхних и нижних границ использовать неравенства, которые для сколь угодно малого w выполняются при достаточно больших n :

(Wmin-W) ||£t)||2 < Wn,min|||(t)||2 < £T(t) Wn£t) <

< Wn,max||£(t)||2 < (Wmax+W) ||£(t)||2

Здесь wnmax и wnmin - величины максимального и минимального собственных значений матрицы Wn , которые сходятся к собственным значениям wmax и wmin матрицы W. В результате в формулах (1о), (11) и (12) норма ||£(t)|| может быть заменена величиной [£T(t) Wn Kt)]12. Соответствующие изменения произойдут с функцией H(s), которая превратится в квадратичную форму. По поводу оптимального выбора матриц Wn см. [4].

Замечание 3. Для доказательства формулы (12) в теореме 2 использовано дополнительное условие (ж), которое не требуется для выполнения (1о) и (11). Если имеют место только формулы (1о) и (11), но не выполняется формула (12), то можно говорить о том, что при больших n в любой окрестности точки ¿=0 с вероятностью, сколь угодно близкой к единице, существует локальный минимум статистики KT(t) Wn K(t) . в связи с этим можно рассматривать множество локальных минимумов

Tn = Argu min t KT(t) Wn K(t), где оператор Argu min выделяет множество точек, в которых достигаются локальные минимумы функции. Таким образом, если имеют место только условия (а)

- (е), то для оценки

©n = Usesn ©(s), где Sn=Argu min 8еад H(s) свойство состоятельности выполняется в форме

lim n^M P{inf 6ne©n ||0n-6|| > е}=о .

Замечание 4. Для примеров, рассмотренных во введении, из числа условий (а)-(е) выполняются все те, которые касаются меток Bi(-). Лишь для второго примера это требует дополнительного ограничения: о<а<2р/(1-2р). Таким образом, если последовательность матриц плана и функция распределения погрешностей также удовлетворяют всем ограничениям, то в рассмотренных примерах индикаторные оценки параметров являются состоятельными.

ЛИТЕРАТУРА

1. Болдин М.В., Симонова Г.И., Тюрин Ю.Н. Знаковый статистический анализ линейных моделей. М.: Наука, 1997.

2. Tarassenko P.F. Hypothesis testing for indicator analysis of linear models // K0RUS-2002, 6th Russian-Korean International Symposium on Science and Technology, June 24-30, 2002, Novosibirsk: Proceedings. 2002. V.3, Mathematics. P.185.

3. Tarassenko P.F. On indicator-based hypothesis testing // 24th European Meeting of Statisticians (EMS2002), 14th Prague Conference on Information Theory, Statistical Decision Functions and Random Processes - Prague, August 19-23, 2002.

4. Тарасенко П.Ф. Оптимальные тесты, основанные на индикаторах событий // Вестник ТГУ. 2002. Прил. №1(1), сент. Докл. IV Всеросс. конф. «Нов. информ. технологии в иссл. сложн. структур». Томск, 10 - 13 сентября 2002. С. 185-190.

5. Koenker R., Bassett G. Regression quantiles // Econometrica. 1978. V.46. P.33-50.

6. Koenker R., Portnoy S. M Estimation of multivariate regressions // JASA. 1990. V.85, issue 412. P.1060-1068.

7. Koenker R., Ng, P., Portnoy S. Quantile smoothing splines // Biometrika. 1994. V.81. No. 4. P.673-680.

Статья представлена кафедрой теоретической кибернетики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 3о апреля 2оо3 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.