ПРОБЛЕМЫ ВЫСШЕЙ ШКОЛЫ
УДК 519.677: 004.021
О СОСТОЯТЕЛЬНОСТИ ДИХОТОМИЧЕСКОЙ МОДЕЛИ РАША
© 2012 г. И.Н. Елисеев, И.С. Шрайфель
Южно-Российский государственный South-Russian State University
университет экономики и сервиса, г. Шахты of the Economy and Service, Shahty
Установлено, что оценки максимального правдоподобия латентных параметров «уровень подготовки студента» и «трудность задания теста» дихотомической модели Раша стремятся по вероятности к точным значениям указанных параметров при неограниченном возрастании числа студентов N и числа заданий теста L. Сходимость доказана при существенном для справедливости утверждения нежёстком ограничении на рост N и L.
Ключевые слова: модель Раша, латентные параметры, метод максимального правдоподобия.
We found that the maximum likelihood estimates of latent parameters' level of «training of the student» and the «difficulty of the test questions» dichotomous model of Rush tend in probability to the exact values of these parameters with unbounded increase in student numbers N and the number of test questions L. Convergence is proved with substantial justice for the approval of nonrigid constraint on the growth of N and L.
Key words: Rush's model, the latent parameters, the method of the maximum likelihood.
Постановка задачи
Для измерения учебных достижений школьников в России (единый государственный экзамен, централизованное тестирование) и учебных достижений в образовании за рубежом применяется дихотомическая модель Раша [1, 2]. Согласно этой модели, вероятность правильного выполнения задания трудности ру
студентом с уровнем знаний еь равна р .. = ф(0г- -р )
Ь
(здесь и всюду далее используется обозначение
-). Оценки латентных параметров ei, ß .■
ф( х) = 7 Х 1 + е
рассчитываются методом максимального правдоподобия по результатам тестирования, которые представляются в виде дихотомической матрицы ответов X = (Ху) размера NxL, где N - количество студентов;
L - количество заданий теста; Ху - результат выполнения Ь-м студентом у-го задания (Ху =1 в случае правильного ответа на задание и хн =0, если ответ ока-
и
зался неверным). Для практического использования этих оценок важно знать, обладают ли они свойством состоятельности.
L N
Пусть хЬ = £ Ху - строчные, а у у = £ Ху - столб-■=1 ¿=1 цовые суммы элементов матрицы Х. Тогда
(е;,е2,..., eN; р*,р2,..., рL) (1)
есть вектор оценок максимального правдоподобия латентных параметров, если и только если его координаты удовлетворяют системе уравнений
Е ф(е*-ß* ) = x, i = 1,2,..., N;
N I * „\
Еф^-ß* ) = yj, j = 1,2,...,L.
(2)
Легко видеть, что каково бы ни было решение (1) системы (2), ее решением будет и всякий вектор вида
(* * * * * * \ е* +а, е2 +а,..., е1Я +а; Р*+а, Р2 +а,..., р*: + а1, (3)
где а - постоянная.
В настоящей работе используются следующие обозначения и определения: |А| - число элементов
конечного множества А; 1п ={1,2,...,п}, п > 1; Мж -
множество всех матриц размера NxL, состоящих из нулей и (или) единиц. Ряд (т.е. строку или столбец) матрицы X е Мж назовём экстремальным, если все
его элементы одинаковы. ХТ - обозначение матрицы, транспонированной по отношению к матрице Х. Каждой матрице X е Мж поставим в соответствие матрицу е(X) = (Ьу) е Мж, полученную из матрицы X
расположением её строк в порядке невозрастания строчных сумм (в случае равенства строчных сумм меньший номер в матрице е^) имеет строка с меньшим номером в матрице Х). При этом матрицу Х назовем допустимой, если матрица ) удовлетворяет следующим двум условиям:
а) для каждого у е ^ найдутся номера ¿,I е ^, для которых Ьу = 0, Ьу = 1;
б) для любого k е 1п-1 имеются номера Ь,у, I такие, что Ь е ^, у е ^, k < I < N , причем, Ьу = 0, Ьу = 1.
Требование а), означающее отсутствие в матрице е( X) экстремальных столбцов, очевидно, равносильно аналогичному требованию к матрице Х.
Приведём результаты статьи [3], используемые в настоящей работе, объединив их следующей формулировкой.
Теорема 1. Пусть X е Мж . Следующие утверждения равносильны:
x
1) Х - допустимая матрица;
2) существуют оценки максимального правдоподобия 8*, р* параметров 8i , р., I е 1Ы, у е 1Ь;
3) существует единственный (с точностью до аддитивной постоянной а) вектор оценок максимального правдоподобия (1);
4) матрица Хт допустима.
В случаях, когда нам это будет удобно, условимся для трудностей заданий применять обозначения Ру = 8N+у, 1 е JЬ . Если Х - допустимая матрица, то в
силу теоремы 1 и высказанного выше утверждения о векторе (3) для каждого k е ^+Ь существует единственное решение 8k = (8^^,82,...,8N+Ь) системы (2), удовлетворяющее условию 8<1 = 8k. Главным решением этой же системы назовём любое её решение 8Г, номер г которого определяется соотношением
6Г -б1, = max(9„ -Qln).
neIN+L
(4)
Для всякой допустимой матрицы Х существует главное решение системы (2), однако единственность главного решения утверждать нельзя. Докажем одно свойство главных решений.
Лемма 1. Если матрица Х допустима, то компоненты всякого главного решения 8Г системы (2) удовлетворяют неравенствам > 0п, п е ^+Ь.
Доказательство. На основании вышеизложенного можно утверждать, что для каждого k е ^+Ь найдется аk е R такое, что при всех п е ^+Ь имеет место равенство 0П = 0П + Щ . Подставив в него значение k = г(е ^+Ь), найдем:
8П =8П + аг, п е ^+ь . (5)
Отсюда при п = г получаем 8Г = 8г = = 8 Г +аг, т. е. аг =8г -8:г. Подставим это выражение в (5) и воспользуемся соотношением (4): 8П = 8П + 8Г - 8Г = 8Г -8Г - (8 п-8П) + 8п > 8п , п е ^+ь, что завершает доказательство леммы.
Настоящая работа посвящена доказательству состоятельности оценок 8*, р* параметров 8i,
Р у в следующем смысле. Для любых
8> 0,N,Ь > 2,81,82,...,8N, 8> 0,N,Ь > 2, 81,82,...,8N,
Р1,Р2,...,рь е R зададим событие В = {матрица Х до**
пустима, а компоненты 8i, р. каждого главного решения системы (2) удовлетворяют неравенствам |8*-8г| <8,р*.-р. <8,i е 1п,у е 1Ь }.
Теорема 2. Для любых чисел М, 8 > 0 найдутся номер N,3 и число ст > 0 , удовлетворяющие следующей импликации: N,Ь > N0,
1птах(^Ь) <сттт(N,Ь), (6)
|8г| < М, р ,1 < М, i е JN, . е JЬ ^ Р(В) > 1 - е.
Ниже будет показано, что ограничение (6) нельзя удалить из формулировки теоремы 2 без ущерба для её справедливости. А сейчас докажем три вспомогательных результата, используемых при доказательстве этой теоремы.
Лемма 2. Для любого конечного набора событий G1,G2,...,Gn выполнено неравенство
Р(П G1) >±Р&,)-п +1.
г=1 i=1
Доказательство.
Р(П G,) = 1 - Р(П G) =
г=1 г=1
= 1 - P(2G) > 1 -¿P(ö,) = 1 -2 (1 - P(G)) =
n n
= 1 -21+ 2 Р^) = 1 - п + 2 Р^).
i=1 i=1 ¿=1 п
Лемма 3. Пусть т = 2 т - сумма взаимно незави-i=1
симых дискретных случайных величин с законами распределения Р(т1 = 1) = ti, P(тi = 0) = 1 - ti, i е 1п. Р(Т = 1) = ti, P(тi = 0) = 1 - ti, i е 1п. Тогда при каждом целом 0 < I < п функция — (t1,t2,...,tn) = Р(т < I), 0 < ti < 1, i е 1п убывает (возможно, в нестрогом смысле) по каждому аргументу при любых значениях всех остальных аргументов.
Доказательство. Зафиксируем произвольное 0 < I < п и составим производящую функцию для нахождения закона распределения случайной величи-
ны
т : у(х) = П (^х +1 - ^). Тогда вероятность
i=1
Р(т < I) равна сумме всех коэффициентов многочлена х) при степенях х, не превосходящих I:
/г (^2,-, tn) = 2 Z П Г, П (1 - Г,).
k=0 T cIn'^T i<=I„ IT
\r\=k
При каждом фиксированном у е 1п представим это выражение в виде
2 (^ 2 П ^ П (1 - ^) + (1 -1 ) х
k=0 т, /{ ,} ет е1п/(т.}) 1
тя?-{11
х 2 п ^ п (1 - ^))
т<=1п/{1} !ет ¿^п/(т1}Г
Т l=k
(как обычно, сумма, не содержащая ни одного слагаемого, считается равной 0, а произведение, не содержащее ни одного множителя, - равным 1). Тогда
— =2 ( 2 П ^ П (1 -1¡ )-
&1 k=0 т/{1}lеT lеJn/(т1}Г |т|=k-1
- 2 П ^ П (1 - ^)).
,лiеT1iеJn/(т и{ у}Р 1'
Ь<= п / {1} п [
Первая сумма в скобках равна коэффициенту при
xk 1 производящей функции у ц (х) = П (^х +1 - ti),
i=1 i* j
соответствующей случайной величине т - т .■ = 2 тг , а
¿=1 г* Ц
вторая сумма - коэффициенту при хк той же функции. Следовательно,
= 2 (Р(т-ту = k-1)-Р(т-т! = k)) =
k=0
j
1-1 l = Z Р(т-т j = k)- Z P(t-t j = k) =
k=-1 k=0
"] ^ - V- -ц
k=0
= Р(т - тц = -1)-Р(т-тц = I) = = -Р(Т-Т у = I),
так как событие {т-ту = -1} невозможно. Таким /
образом, —— < 0, и линейная функция
/у (^) = / (t1, t2,..., tn) /ц (^) = /г (t1, t2,..., tn) убывает или постоянна на отрезке 0 < t]■ < 1 при произвольных фиксированных значениях ti е[0;1], г е 1п,г * у.
Лемма 4. Пусть заданы числа 5 > 0,
е (0;1), р0 = 1- . Тогда существуют положительные числа а, Ь такие, что при всех п > 1, р1,р2,...,рп е [^0;р0] выполнено неравенство
P(
ю-Z Р,
i=1
< n5) > 1- be
(7)
где ю = 2юь - сумма взаимно независимых дискрет-
¿=1
ных случайных величин с законами распределения Р(Юь = 1) = Рг, Р(Юь = 0) = 1-Рг,Ь е 1п .
Доказательство. Отметим, что р0 е (~~;1).
Положим е = min(5,q0) > 0 и зафиксируем произвольные п > 1, pi е[q0; р0 ], Ь е 1п . Зададим числа " 2 Рг ]
6
6 = 2
9о < 6 = 6(290-D < 2 2 2 \ 6
6 < —
2
2q°
< Pj
2 Ро
< Р°,
то есть
q° <Pj < р°, j е I,.
(9)
: вся-
Пусть Ту ={ц е 1п : 6ь = ру }, пу = |ТЦ |, ц е ^. Для ]
кого целого 0 < т < п зададим множества 5-мерных векторов с целочисленными координатами
Д т =|^ = m2,..., т5 ):0 < тц < пц , ] е ^; 2 ^ = т]
и оценим число его элементов. Если и - какое-либо т-элементное подмножество множества 1п , то вектор
с координатами ту = |и п Ту |,у е 15 принадлежит Дт ; следовательно, Дт * 0. С другой стороны, каждая из 5 координат любого вектора цеДт принадлежит (п+1) - элементному (0}и 1п , поэтому |Дт| < (п +1)5, и в силу (8) выполнено неравенство , , 2+2
|дт < (п+1)е . (10)
Зафиксируем произвольное целое
5 пе
0 < т < 2 пРу--(существование таких т следует
у=1 2
из неравенств е< q0 и (9):
Z n
j=1
pj -—> q° ^п,-П6 = n(q°-6) > 0).
j=1
Положив у = -
— , зададим множества 4(1 + е)
Ql = {1 е 15 : пу <уп}, Q2 = I, / 0. Допустим, что Q2 = 0, тогда Q1 = 15, и в силу неравенств е < q0 <1 (8),
■5-5 ,2 „. пе п ^
п = 2 пу = 2 уп = пу, < пу (— + 2) = — < — . Получен-
у=1 у=1 е 24
ное невозможное неравенство доказывает, что Q2 * 0. Зафиксируем произвольный вектор ц = (т1, т2,..., т5) еДт . Предположим, что для любого у е Q2
, г' е 1п (символом [х] обозначаем целую тц > njPj уп . Тогда
часть действительного числа х). Поскольку при всех Ь е 1п выполнены неравенства
j=i
П6 ( \
Z njPj- V > m = Z m > Z m; Z (njPj- yn) =
j=1 jeQ2 jeQ2
2q°-i <
2 P,
-1 <
2pi
< 2P < 2p°
= Z n,P] - Z njPj -ynQ2 >
j=1 jeQ1
, . 5 5
то число 5 элементов множества {б; :Ь е 1п} не пре- >2пуР^^ - 2 упРу -уn|Q2|>2njPj -уп(|Q1\ + 1) =
восходит
2р°-| 2q°-1| +1; подавно
j=1
jeQ1
j=1
2 „
5<- + 2 .
s s 2 s n6
= Z np -ynS > Z njPj -yn(- + 2) = Z njPj - —,
6 j =1 2
(8)
у=1 ц=1 ь ц=1
что невозможно, поскольку первое и последнее звенья
полученной цепочки неравенств совпадают (в этой Пусть Р,Р2,...,Р5 - все элементы этого множест- п
1 2 5 выкладке использовано неравенство (8)). Следова-
тельно, существует номер г е Q2 такой, что
ва. Учтя неравенство е < q°, получим оценки
ь
ь
2
£
£
ь
ь
6
6
mr < nrPr -yn ; (11)
при этом
пг >уп. (12)
Пусть |2,...,- взаимно независимые случайные величины, каждая из которых принимает лишь два значения 1 и 0 с вероятностями Р(^ = 1) = 8i, Р(^ = 0) = 1 - 8i (здесь важно отметить, что из (9) следуют неравенства 0 <8i < 1, ! е 1п). По; 2 «1
ложим
|j = ZI, j е Is; ^ = (i\ I2,..., Is) Ij = ZI
ieT, ' ieT,
Ij = Z|., j еIs;n = (|\I2,...,Is). Очевидно,
ieT, v '
случай-
ные величины 1 взаимно независимы, причём величина %1 имеет биномиальное распределение с параметрами п1,Р^,] еI,. Имеем
Р (л = ц) = Р 1 = , ] е I, ) =
= П Р 1 = т] )< Р = шг). ^з)
Из (11), (9) следует, что тг < пгРг < пг. Если тг > 1, то к правой части неравенства (13) можно применить теорему 3 из [4, с. 98]:
1
P
(Ir = mr ) =
¡2nm\ 1 - m
n„
x exp
( ( \ \ I ^^ I
-nrHpr \J + 0(mr, nr)
(14)
x 1 — x
где Hp (x) = x ln—+ (1 - x)ln-,
p 1 - p
0(mr,nr) <-
1
m
12mr (1--^)
nr
Для всех р, х е (0;1) имеем
ТТ, . ч . х р 1 ,1 - х .. Ч1 - р 1
Н' (х) = 1п - + х^--1п---(1 - х)- -=
р х р 1 - р 1 - х 1 - р
= 1п——— = 0 » х(1 - р) = (1 - х) р » х = р. (1 - х) р
При этом Н'р (х) < 0, если 0 < х < р, и Н'р (х) > 0 в случае р < х < 1. Следовательно, функция Н (х) убывает на интервале (0; р), возрастает на интервале (р;1), а в точке х = р достигает своего наименьшего на (0;1) значения Нр (р) = 0. Таким образом, Нр (х)> 0 при всех х е (0; 1) / {р}. Приняв во внимание неравенство (11), будем иметь т уп
0 < —^ < Рг--< Рг - у . Отсюда на основании прове-
пг пг
дённого исследования функции Н (х) получаем неравенство
Hpr\nL l> (pr-y).
(15)
Рассмотрим в плоскости переменных p, x множество Q0 = <!(p;p -y): — < p < p0 l. Из неравенства
e < q0 следует, что при всех p е
9о.
po
q0 q0 q0 e e
0 = < p — < p--
4 2 4 4 4(1 + 8)
= р - у < р < р0 < 1. Значит, прямолинейный отрезок О0 лежит в области 0 = {(р;х): 0 < р < 1,0 <х < 1}.
Выше фактически было доказано, что функция двух переменных G (р, х) = Нр (х) неотрицательна в квадрате О , причём обращается в 0 лишь на его диагонали 01 = {(р;р): 0 < р < 1}. Однако отрезок О0 не пересекается с 01, следовательно, G( р, х) > 0 при всех (р; х)е00. Множество 00 компактно, а функция G(р, х) непрерывна в области О , поэтому она достигает своего наименьшего на О0 значения в некоторой точке (р; х )е00. Положим
а1 = G (р; х) (> 0); заметив теперь, что < Рг < р0 (см. (9)), и значит, (Рг;Рг -у)е 00, на основании (15)
получаем неравенство НР I — I > G (Рг;Рг - у) > а1.
Г I пг )
Используя соотношение (14) вкупе с неравенст-т
вами (12), тг > 1, 1---> 1 -Рг > 1 -р0 = д0, имеем
пг
Р= тг) < ~г^ехр( -па,у + — | = Ь,е~п°1у ,
^ г> ^ I 12?0) 1
где b =
1
,12qo
V2^qo
При mr = 0 с помощью (9) и (12) получаем оценку
P(Ir = 0) = (1 - Pr )nr <(1 - Pr )yn <
q \'n ynlni1-^
<\ 1 - 1 = e l 2
Следовательно, для всех возможных значений mr вероятность P(Ir = mr) меньше b2e, где
b2 = max (bj,1), a2 =y min | a1, - ln - ^jj- положительные числа. Тем более, это можно сказать о вероятности события {"Л = М-} (см. (13)):
n
P(-q = |a)< b2e~n"2 . Приняв обозначение I = ZIi ,
i=1
2
x
2
представим событие Р (| = т) в виде суммы попарно несовместных событий 2 {"Л = М-}. Учтя оценку (10),
ЦеДт
получаем
Р(5 = т) = 2 Р(Л = М) < 2 Ь2е~п"2 =
МеДт
n n р
Z 6, = Z f
i=1 i=1 2
2 Рi
>Z ц 2Р± -1|=ZZ |P -6|=]ZP - — i=12 ^ 6 ) i=1^ г 2j i=1 г 2 '
1^еДт 2+2
= b2e-na2 |Дm\ <b2 (n + 1)6
e
-na2
то событие ^ю<2Рь -пе> благоприятствует собы-
Наконец, рассмотрим событие
n6 n n6 2
^<Z njPj - у = Z6, --
]=1 2 Ь=1
как сумму попарно несовместных событий
п пе ь=1
2 (I = т} . Тогда его вероятность равна
тию ^ю<2ег- - , и выполнено неравенство Р [ю<2 Рг - пе |< Ь3е~па.
(2°)
Z 6i -у i=1 2
Z P(l = т) < Z b2 (n +1)
2
n +1)6+2 e-na2
т=0 т=0
Поскольку число слагаемых в последней сумме не
п
превышает 2 ег +1 < п +1, справедлива оценка
г=1
2
Уже доказанное нами утверждение применим к
п
сумме случайных величин Х = п-ю = 2^г- , где
г=1
Хь = 1 -юь, г е 1п . Слагаемые в ней взаимно независимы, характеризуются законами распределения Р (хь = 1) = 1 - pi, Р (хь = 0) = рг и удовлетворяют
неравенствам q0 < Р = 1) < р0, г' е 1п . Следовательно, Ьзе > Р ^<2 (1 - Рг)-пе| =
P U<Z6, - ^|< b2 (n + 1)
-+3 -
(n +1)6 e
-na2
(16)
Положим
а = —, b3 = b2max (k +1)
2
6 e
k >1
(Ь3 < -+» , в силу бесконечной малости последовательности под знаком максимума). Тогда при всех п > 1 правая часть (16) не превосходит Ь3е~па, и мы приходим к неравенству
= Р |п - ю < п - 2 Рь - пе| = Р |ю>2 Рь + пе|.
Сложив полученное неравенство с неравенством (20), получаем оценку
PI Ю - Z Pi > n6 I + PI Ю - Z Pi < -n6 | =
i=1 ) V i=1
=P
PI ^ < Z 6 i - У I< Ьз^
ro-Z pi
i=1
> n6 I < be
(21)
(17) где Ь = 2Ь3.
Так как е < 8, событие
Покажем, что для любого целого 0 < I < п
Р(ю< 1)<Р(|<I). (18)
С учётом принятого в лемме 3 обозначения это приятствует событию неравенство можно записать в виде
Ъ (Р^ Р2,..., Рп )< Ъ (е1, е2,..., еп ) . Заметим, что
ro-Z Рi
i=1
> n8> благо-
> n6>, значит, нера-
(19)
Ю-2 Рг
г=1
венство (21) выполнено и при замене в нём е на 8. Для вероятности противоположного события имеет место неравенство
6
6i = 2
2 Рг
6 2 pi
<-— = Рг, i е In . 26
P
Поэтому согласно утверждению леммы, последовательное увеличение значений е1,е2,...,еп аргументов функции / до значений р1,р2,...,рп (в случае ег = рь г-й аргумент не меняется) приводит к её
= 1 - P
ro-Z Р,
i=1
ro-Z Рг
i=1
< n5j = > n5 I > 1 - be ~
Осталось заметить, что величины е, у, а1, а2, а, Ь1, Ь2, Ь3, Ь зависят только от q0 и 8 . Лемма дока-
уменьшению или сохранению ею постоянного значе- зана.
ния. Следовательно, неравенство (19) (т.е. неравенст- Приступаем к доказательству основного результа-
во (18)) выполнено, и на основании (17) получаем та статьи - теоремы 2. Зафиксируем произвольные
значения М, е> 0. Так как
пе _
оценку Р|ю<2ег--— |<Ь3е па (в роли I = {здесь
выступает
n n6
Z6-— ,i=1 2 .
: [°; n]). Поскольку
ф'( x) =
(1+' )2
> °
>
6
т=°
2
i=1
2
6
x
e
при всех х е R, то функция у = ф(х) возрастает на (-да; +да). Обратная к ней функция х = ф_1(у) =
= ln^-1 - У Положим
определена и возрастает в интервале (0;1).
p0 =ф( 2M), q0 = ф(-2М)
М1 = maxi 2М + 5, ф
-1 I 3 p0 +1
M 2 = max 12М + 5, -ф-11 ^ ||.
Легко видеть, что 1
ф(0) = - < ф(2М) < 1, ф(-2М) =
e-2М 1
= 1 -ф(2М).
1+e
-2М
1+e
2М
Следовательно, p0 + q0 = 1, 1
0 < q0 < ^ < p0 <!.
Из этих неравенств следует, что 1
4 2 4
(22)
3q0 1 3 p0 +1 0 < —— < — < —^-< 1,
значит,
ф
МП1>ф-■ 111 = 0 >»-■ 1
>» \ 2 | = 0 >,-1I-4-
М1, М2 > 0.
Поскольку функция ф'( x) положительна и непрерывна на отрезке [-М2;М1], она достигает на нём своего наименьшего значения а, причём а > 0. Для любых N,L > 2, 0,, ß, е[-М;М], i е IN, j е IL примем обозначения A, ={x,j = ij, P(A,,) = ф(0, -ß,) = = p,j, P (A,, ) = 1 - p,, = q,,. Заметим, что при всех i е IN, j e IL верны неравенства -2М < 0, - ß, < 2М. Значит, ввиду возрастания функции ф( x),
q0 = ф (-2М) < ф(0г -ß, ) = p,, < ф(2М) = p0;
1 -q0 >1 -pij >1 -p0;
тем самым установлены неравенства
q0 < p,j < Po, q0 < q,j < Po, 1 ein, j e h. (23)
Положим x = min|q0,^j e 10;1 j. В силу леммы 4,
существуют положительные числа a, b, удовлетворяющие неравенству (7) при 5 = а2x2 (> 0) и всех n > 1, pi e[q0; p0 ], i e In (случайная величина ю
охарактеризована в условии этой леммы). Выбрав пару таких значений a, b и введя обозначение
y = 1 - q2 (е(0;1)), зафиксируем некоторое ст е (0; min(-ln y; a)). Поскольку
lim em ln (1 -
n^w
(1 - be~na )= lim (-ben(CT-a)) = 0;
то есть
ЛГ ln b
то найдется номер N1 >-такой, что для всех
a
n > N1 enCTln(1 -be~na)> ln(1 -x) ,
(1 -be~na) > 1 -x, n > N1. (24)
Выберем какой-либо номер
Kr ln x
N0 > max\ N1;-
l CT + ln y
и положим N2 = min(N,L), N3 = max(N,L). Всюду
далее будем считать, что выполнено неравенство (6) lnN3 < ctN2 и неравенства N, L > N0 N2 > N0.
Из взаимной независимости случайных величин X, вытекает независимость в совокупности событий
A,,, i е IN, j e IL. Для суммы несовместных событий
N N_
А, = П A,, + П А,, (j e IL) имеем
,=1
i=1
P (A/ )=P1Й A 1+P (A
N
l i
N
N
= П Р (А)+П Р (А1 ) = П рЦ + П ъ < PoN +
+PoN <2PoN (1 + 9о)N = 2уN
в силу (23). Оценим сверху вероятность события
Ь
А = 2= {в матрице Х имеется хотя бы один экс-
1=1
тремальный столбец}:
Р(А) <2Р(А1) <2 2уN = 2ЬуN .
j=1
j=1
N
Из очевидных неравенств —3 > 1 > y
N
N3 -N2
следу-
ет, что N3у^ > N2у 3, т.е.
N3у^ = тах( Nу Ь, ЬуN). (25)
Используя это соотношение и неравенство (6), получаем
1п(Ьу^^) < 1п(N3у^) = 1п N3 + N21п у < < N2(ст + 1п у) < N0(ст + 1п у) < 1п т,
откуда вытекает оценка ЬуN < т. Значит,
Р(А) < 2ЬуN < 2т , а вероятность того, что в матрице
Х не окажется экстремальных столбцов, удовлетворяет неравенству
P(A) = 1 - P(A) > 1 - 2x.
(26)
Введем ещё несколько вспомогательных собы-
тий: Di] = А^А^,! (для удобства положим
Ь
х01 = хN1, А01 = АN1X i е ^, 1 е 1ь ; А = 2 ^, i е IN;
1=1
N
D =ПDi . Допустим, что событие D наступило.
i=1
Пусть перестановка g элементов множества ^ такова, что для элементов Ь^ матрицы 8(Х) выполнены
равенства Ьц = (г) ц, г е ^, у е ^ . Покажем, что эта
матрица удовлетворяет условию б) из определения допустимости матрицы. Предположим, что это не так, т. е. для некоторого k е ^^ и каждого у е ^ имеет место, по крайней мере, одно из двух равенств
k N
2Ьц = k, 2 Ьц = 0. Рассмотрим множество
Ь=1 i=k+1
Q = §+1,k + 2,...,N9. Для всякого элемента Ьц матрицы е( X) справедлива импликация Ьц = 1, г > k ^ Ьгц = 1, г е . Заменив в ней первый индекс т в обозначении элементов матрицы е^) на § 1(т), получаем импликацию
Ь*-1(0,1 = Х1 =1, §^ > k ^ Ья-1(г),] = ХГ] =1, (27) г е § (1к) = ^ / Q.
Зафиксируем какое-либо г е Q . Поскольку событие Di наступило, то при некотором у е ^ произошло и событие Di]■, т. е. оказались выполненными равенства Хц = 1, хг-1,ц = 0 . Так как г = §(§_1(0) е Q, то
§- (г) > k, и на основании импликации (27) приходим к выводу о невозможности принадлежности (/' -1) е ^ / Q. Следовательно, (/' -1) е Q (при г = 1 - N е Q). Применив только что доказанное утверждение ^ - 1) раз, получим цепочку импликаций
г е Q ^ (г -1) е Q ^ ... ^ 1 е Q ^ ^ N е Q ^ (N -1) е Q ^... ^ (/' +1) е Q,
влекущую совпадение множеств Q и ^, что противоречит неравенству = N - k < N . Значит, событие
D благоприятствует событию и={условие б) из определения допустимости матрицы выполнено}, и вероятности этих событий связаны неравенством Р(и) > Р(В). Оценим снизу его правую часть. В силу леммы 2
N N
Рф) = Р(П D1) >2 Р^г) - N +1. (28)
г =1 г =1
Оценим г-е слагаемое под знаком суммы в правой части (28), воспользовавшись независимостью в совокупности событий Dij, у е ^, а также событий Ату , т е ^, у е ^ (и та, и другая вытекают из взаимной независимости случайных величин Хц, г е ^, у е ^):
P(D, ) = P( Z Djj) = 1 - P( Z Djj) = 1 - P(nDj) =
j=1 j=1 j=1
= 1-П pD ) = 1 -II (1 -P( Djj)) =
j=1 j=1
= 1 - П (1 -Р^цМ])) = 1-П (1 -Р(Ац) Р(Аг-1])) = 1=1 1=1
= 1 - П (1 -Рг^г-1,] ) > 1 - П (1 -?02) = 1 - уL
у=1 у=1
(здесь использованы неравенства (22), (23)). С помощью неравенства (28) и соотношения (25) получаем оценку
P( D) >Z (1 -УL) - N +1 =
i=1
= N (1 -уL) - N +1 = 1 - N уL > 1 - N 3у „N?
N2
Так как N3у 2 <х (см. выкладку, следующую за формулой (25)), то
Р(и) > Р(D) > 1 -х . (29)
Представив событие Р={матрица Х допустима} в виде F = Аи, оценим его вероятность с помощью леммы 2 и неравенств (26), (29):
Р( F) > Р( А) + Р(и) -1 > 1 - 2х +1 - х -1,
откуда
Р^) > 1 - 3х . (30)
Рассмотрим набор независимых в совокупности
событий H, =
N
y,-Z р,,
i=1
>а 2х2N , j е IL и оценим
их вероятности с помощью леммы 4 при
п := , ю := хг] ,8 := а2х2, Рг := Рг] , е IN
(такая возможность имеется в силу неравенств (23) и взаимной независимости случайных величин хгу ).
Для выбранных выше постоянных а, Ь и всех у е 1Ь получаем Р(Нц) > 1 - Ье~> 0, так как
N > N,3 > N > . Тогда вероятность произведения а
Н указанных событий удовлетворяет неравенству
Р(Н) = Р(Пнц) = Пр(Н] ) >11 (1 -Ье-ш) =
1=1 1=1 1=1 = (1 - Ье -ш)L.
Подобным образом оценивается снизу вероУ1)-ность события
K = -
L
xi-Z р,
j=1
< а2х2L, i е IN I: P(K) > (1 - be~La)N.
(32)
Наконец с помощью неравенств (30) - (32), (6), ^ > N1, (24) и леммы 2 оценим снизу вероятность события G = FHK:
Р(О) > Р(^) + Р(Н) + Р(К) - 3 +1 > 1 - 3х + +(1 - Ье-ш)L + (1 - Ье^а)N - 2 = (1 - Ье-)Nз +
+(1 - Ье-Nза)^ - 3х-1 > 2(1 - Ье)^ --3х -1 > 2(1 - Ье-^^2а)е°Ы2 - 3х -1 > 2(1 - х) - 3х -1, то есть
Р(О) > 1 - 5х. (33)
В предположении, что событие G наступило, зафиксируем произвольное главное решение
ег = (е[, е2,..., eN+L) = (е*, е2,.., eN ;Р*, р2,..., РL)
системы уравнений (2) (г е ^+L). Приняв обозначение Х= тах (еп-еп), докажем неравенство Х< 10х .
пе1и+L
Допустим, что оно не выполнено, т.е. Х> 10х . Выберем номер k е ^ такой, что ek -ek =Х и рассмотрим два логически возможных случая:
1) k е ^. Приняв во внимание одно из равенств где точка \, принадлежит отрезку с концами
системы (2) и факт наступления события К, при каж- п а а* а*
к ' 4 : ' к 8k -р ,,8К -р ,, а значит, в силу (36) и неравенств
дом i е ^ будем иметь 7 7
ь . , ь - р 11 <ы +1р 11 < 2М < 2М + 5, и отрезку
2 ф(8* - р*) = х1 = 2 р + 81-ь = [-М2;М1 ], 1 е (2. Следовательно,
Ь
е
ах
j=1
или
= g ф(0,- ß j)+5L o < 0k - 0k - (ß*. - ß,) < —f-^- < x.
ф
■1?.)
l откуда ß; -ßj >0k-0k-x = x-x>9x, jeQ.
In
2 (ф(81 -рг)-ф(81 -рг)) =51Ь, i е1„ , (34) „ . ,
р! 1 1 1 Предположим, что при некотором 1 е 1Ъ[
где |51| <а2т2. Обозначим через а у 1-е слагаемое в 81 -81 < 5т . Тогда при всех 1 е (
сумме (34) при I = К. Ввиду выбора k при каждом 8* -р* -(81 -ру ) =
1 е 1Ь выполнено неравенство = 8* - 8 - (р* - р;) < 5т - 9т = -4т,
8k ^ 8k 8k >8+] 8N+] р] р], откуда 8* — р* <81 -ру - 4т . Вновь воспользуемся
а значит, и неравенство 8 к - В; > 8К - В 1. , /\ итт
' ^ к к ^ возрастанием функции ф( х) и теоремой Лагранжа:
Тогда, в си*лу в*озрастания функции ф(х), разно- ф(8*-р*)-ф(81 -р])<ф(81 -р1 -4т)-
сти а1 =ф(8* -р*)-ф(8к -р 1) неотрицательны, -ф(81 -р^ф,^ 1)(81 -рí -4т-(81 -р 1)) =
1 е I . Воспользуемся соотношением (34) при 1 = К:
L .2.2,
= ф'(л . )(-4x) < -4ax, j e Q
0 <2 а1 = ^Ь <а т Ь . (здесь -М2 < -2М - 4д0 <-2М - 4т<
1=1
Покажем, что число элементов множества <81 -р у - 4т<"Л у <81 -р у < 2М < М1,
т = { 1 е 1Ь : а у >ат} не превосходит атЬ . В самом и значит, ф'(^ у )>а).
деле, пусть это не так, т.е. |т| > атЬ. Тогда т Ф 0, и На основании (34)
2 2 ь -а 2т2Ь <8,-Ь =
а т Ь >2 а у >2 а у > ат |т| > а т Ь, что невозможно. Ь
= -а2т
"2~2г ^' Z a. >g a. > ax|T| >a2x2
1 = jeT =-a 2x2
L <5|L = g (ф(0*-ß*. )-ф(0г -ß i))
Тем самым неравенство т < атЬ, а с ним неравенст- у=1
во >Ь(1 -ат), где ( = 1Ь /т , установлены. Далее имеем 2 (ф(8*-р* )-ф(81 -р^)) + имеем
"* "* -ф(8к-ру ^«-т 1е
jeQ
0< a. =ф(0к-ß*)-ф(0к-ß,)<ax, 1 е Q. (35) + ZM0*-ß*)-ф(0-ß1 ))< Z +
Используя неравенства (35) и (23), для всех j e Q + g ф(0* - ß*.) < -4ax|Q\ + g 1 = -4axQ| + |T| <
получаем jeT jeT
qo < p. = ф(0k - ß j ) < ф(0; - ß* ) < pк. + ax < po + < -4axL (1 - ax) + axL ,
e0 что влечет неравенство
+x min ф'(x)< p0 +xф'(0) < p0 + q0-- = 2 2 T . .
-м^м 0 0 0 (1 + eo)2 -a2x2L <-4axL(1 -ax) +
^ 3pQ +1 +axL oax> 4(1 -ax)-1 oax> — .
= p0 +—0 = —0-. 5
0 4 4 q 1 3
Подействуем на некоторые части этой цепочки С другой стороны, ax^'(0)qo = — < 4 < 5.
Полученное противоречие доказывает, что при всех i е IN 0* -ß j > 5x. Отсюда вытекает неосу-
<ф-1 (ф(0* -ß*-))<ф 1 \3po +11<М1. ществимость принадлежности r еIN, приводящей
В результате получаем двойное неравенство к невозможному двойному неравенству
-М2 < -2М <0* - ß*^- < М1, j е Q. (36)
Применим теорему Лагранжа к средней части
двойного неравенства (35): 0i - ßr-N - (0i - ßr-N) = 0г -0i > 5x
равенств и неравенств возрастающей функцией ф-1( У): ф-1(qo) = ф-1 (ф(-2М ))<
0 1 ' 1 [ 1 ществимость принадлежности r е in ,
к невозможному двойному неравенству 0 <5x < 0*-0r =0r-0r = 0. Следовательно, r > N и
0r = 0r = ßr-N = ßr-N. Так как
0* -ß^N -(
0 <ф'(!-)(0*-0k-(ß*^--ß-))< ax, то есть 0*-ß**^ >0,-ßr-N + 5x, i e In , то
s = Е (ф(е*—ß*-N )-ф(е(—ßr-N ))>
N ,
>Е(ф(ег —ßr—N + 5х)—ф(е( — ßr—N )) =
i=1
N
= Еф'(С )(ег — ßr—N + 5х—(ег — ßr—N )) = j=1
NN
= 5тЕ ф' (С ■) > 5х£ а = 5axN
i=1
i=1
(ф' (£, ) > а , ввиду неравенств
-м2 < -2М < ег - Рr-N < Сг < ег - Рг^ + +5х < 2М + 5q0 < 2М + 5 < М1). С другой стороны, приняв во внимание факт появления события Н , по аналогии с (34) сумму можно представить в виде 5 = еr-NN , где |ег^| <а2х2.
Однако тогда 5aхN < 5 <а 2х2N ^ах> 5, что вновь
противоречит неравенству ах< -1. Итак, одновременное
4
выполнение неравенств X > 10х, k < N невозможно;
2) k > N. При этом предположении неравенство X > 10х опровергается аналогично. Приведём лишь вехи этой части доказательства. Используя представление
2 (ф(е*-р* )-ф(е,-р ц))=е ц^,
г=1
22
где е У < а х , ] е ^, устанавливаем неравенство
а, = ф (е* - Рk - N ) - ф(ег - Рk-N ) < 0, ' е 1Ы . Доказываем, что число элементов множества Q = ( е ^ : а]У > -ах} больше или равно N(1 - ах). Для каждого Ь е Q получаем оценки
-М 2 < ф-11 ^ ] < е* - Рk -N < ф-1 (Р0) = 2М.
С помощью теоремы Лагранжа выводим неравенство
е* -ег >рk-N ^-N -х = х -х > 9х.
Рассуждением от противного устанавливаем неравенство р* - рц > 5х при каждом у е ^. С этой целью, применяя теорему Лагранжа, устанавливаем оценку
ф(е*-р*)-ф(ег-р]) > 4ах , ь е 0, на основании которой приходим к невозможному неравенству а2х2N > 4aхN(1 - ах) - aхN » ах > 3 .
Замечаем, что неравенство еГ -ег = 0 влечет принадлежность г е ^. Используя неравенство е* - р* < ег - рц - 5х, у е ^ и теорему Лагранжа, приходим к невозможному неравенству
-а 2х2L <8, L =
ЕЕ (ф(е*—ß*)—ф(ег—ß ■ ))<
< —5axL ^ ах > 5.
1=1
Итак, каждая из возможностей k е 1Ы, k г 1Ы неосуществима, что доказывает неравенство X < 10х < е
при наступлении события G и вне независимости от выбора главного решения 6r системы (2). В силу леммы 1 Х= max 6rn-6n . Из всего изложенного
neIN+L 1 1
следует, что в случае выполнения неравенств N,L > N0, (6) и |6n| <M,n e IN+L событие G благоприятствует событию В. Но тогда, ввиду (33), P (B )> P (G )> 1 - 5х> 1 -е. Теорема доказана.
Покажем, что утверждение теоремы 2 верно не только для главных решений системы (2), но и для всех её решений вида 6k, k e IN+L. Пусть N,L > 2,6n e R,n e IN+L,е > 0.
Определим событие C = {матрица Х допустима, и при каждом k e IN+L компоненты решения 6k системы (2) удовлетворяют неравенствам
6-6n <е,n eIN+L }.
Следствие теоремы 2. Утверждение теоремы останется в силе, если заменить в нем событие В событием С.
Доказательство. Обозначим через B0 событие, которое задаётся определением события В при замене
в нём в обоих случаях е на е. Из теоремы 2 следует,
что для любых M, е > 0 найдутся N0 > 2, ст > 0 такие, что справедлива импликация: N,L > N0, max |6n| < M,
neIN+L
выполнено неравенство (6) ^ P (B0 )> 1 . Пусть
M,е>0; числа N0,ст удовлетворяют указанной импликации, а величины N,L,6n (n e IN+L)- неравенствам из этой импликации; тогда P (B0 )> 1 -е. Предположим, что событие В0 наступило, т.е. матрица Х оказалась допустимой, а неравенства
|е„ —е„| < ^П 6 IN+L
(37)
выполненными для каждого главного решения 6r системы (2). Выберем одно из этих решений. Тогда, как следует из теоремы 1, для любого k e IN+L существует действительное число a k такое, что
6kn =6rn +ak «ak =6kn-6n -(6n-6n) при всех n e IN+L. Подставив в это выражение n = k, будем
иметь ak =6k-6k - (6k-6k) = -(6k-6k). Следовательно, в силу (37) ill I е
|ak| = |6k-6k| < ^k e IN+L .
Теперь при всех k, n e IN+L получаем
еп —=
еП— еП +еП— еп < е—еП1+
е~—еп <а к\+2 <е
+
(здесь вновь использованы неравенства (37)). Таким мере одного экстремального столбца или хотя бы образом, событие С произошло, т.е. ему благоприят- одной экстремальной строки больше или равна
ствует событие B0, и P(C) > P(B0) > 1 — > 1 - е.
2
Следствие доказано.
тах(1 - р, 1 - Р2) > 1 - -1-. В силу теоремы 1 наличие в е
матрице Х хотя бы одного экстремального ряда бла-
В заключение покажем, что ограничение (6) су- гоприятствует событию F = { матрица Х не является
щественно для справедливости теоремы 2. При её доказательстве мы оценили сверху вероятность
N N
Р(Ау) = ПРу +пЧу того, что'-й столбец матрицы Х
г=1 г=1
допустимой}, значит, и Р(—) = 1 - Р(F) > 1 —1, отку-
е
да Р(—) < -1. Но событие В благоприятствует собы-
е 2
(23). Теперь, используя (23), оценим ту же вероят- тию — поэтому Р(В) < — для всех рассматриваемых ность снизу: Р(А]) >д" + Чо = ,] £Ь . пар номеров N, L и любых 9г,ре[-М;М],
Тогда вероятность р отсутствия в матрице Х экс- I £ JN, I £ ^. Из всего вышеизложенного следует, что
окажется экстремальным, с помощью неравенства
тремальных столбцов удовлетворяет неравенству
Pi = P [ш; j = ftp (Aj ) =
= 11 (i - P (Aj ))<П (i - 2?oN ) = (i - 2?ON )' j=i j=i
неравенство P(B) > 1 - е не может выполняться ни 1
при каких ее (0; 1 —-], N > L > 2, удовлетворяю-e
щих неравенству (38), и 6г-,ßj из отрезка [-M;M].
Более того, для указанных е, N, L, 6г-, ß j не выполне-
(здесь использованы независимость в совокупности ч _ , ^ ~
v __J но даже неравенство P(C0) > 1 -е, где C0 - событие,
событий Aj,j е Il ). Анал°гичн° оценивается вероят- определение которого получается из определения
ность P2 отсутствия в матрице X экстремальных события С заменой в нем слов «при каждом» словами
/ T\N
строк: P2 <11 - 2q0 I . Имеем
ln min (P, P2) = min(ln p ,ln P2) < < min (L ln (l - 2qN ), N ln(1 - 2qL) )<
< min(-2 LqN, -2 NqL) = -2 max(LqN, NqL) =
«при некотором». Это объясняется тем, что отношение
1птах( N, L) 1п N лг
-. ' ' = (-г- >- 1пЧо 1пN + L 1пЧо > 0 (38))
min( N, L) L
недостаточно мало для обеспечения сколь угодно малой близости Р(С0) к 1.
Литература
= -2max( N, L)q0min(N ,L) (здесь использовано известное неравенство ln(1 - x) <-x, 0 < x <1 и соотношение (25), справед- 1. RaSch G. Probalistic Models for Some Intelligence and At-ливое для любого ye (0;1)). Очевидно, существуют пары сколь угодно больших номеров N > L > 2 , удовлетворяющих неравенству
NqL > 1. (38)
Используя полученную оценку для lnmin(P1, P2), для каждой пары таких номеров получаем
min(P1,P2) > 1 -е
-2 Nq0L
<е . Однако тогда для этих
tainment Tests, 1960. Copenhagen, Denmark: Danish Institute for Educational Research.
2. Нейман Ю.М, Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов. М., 2000. 168 с.
3. Елисеев И.Н., Шрайфель И.С. Исследование существования и единственности оценок максимального правдоподобия параметров латентных переменных однопарамет-рической дихотомической модели Раша // Информатизация образования и науки. 2011. № 3 (11). С. 117 - 129.
пар вероятность появления в матрице X по крайней 4. Боровков А.А. Курс теории вероятностей. М., 1972. 288 с.
Поступила в редакцию
26 апреля 2012 г.
Елисеев Иван Николаевич - канд. техн. наук, профессор, кафедра «Энергетика и безопасность жизнедеятельности», Южно-Российский государственный университет экономики и сервиса. Тел. (8-863-6)-22-55-92. E-mail: [email protected]
Шрайфель Игорь Семёнович - канд. физ.-мат. наук, доцент Южно-Российского государственного университета экономики и сервиса, г. Шахты
Eliseev Ivan Nikolaevich - Candidate of Technical Sciences, professor, department «Power Engineering and Safety of Vital Activity», South-Russian State University of the Economy and Service. Ph. (8-863-6)-22-55-92. E-mail: [email protected]
Shraifel Igor Semenovich - Candidate of Science in Physics and Mathematics, assistant professor, South-Russian State University of the Economy and Service.