Научная статья на тему 'ОБ АСИМПТОТИКЕ СТАТИСТИКИ ТИПА χ2 ДЛЯ ИНТЕРНЕТ-ГРАФОВ'

ОБ АСИМПТОТИКЕ СТАТИСТИКИ ТИПА χ2 ДЛЯ ИНТЕРНЕТ-ГРАФОВ Текст научной статьи по специальности «Математика»

CC BY
82
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЕ ГРАФЫ / ИНТЕРНЕТ / СТАТИСТИКА ТИПА χ2 / ПРЕДЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ / χ2 TYPE STATISTIC / RANDOM GRAPHS / INTERNET / LIMIT DISTRIBUTION

Аннотация научной статьи по математике, автор научной работы — Павлов Юрий Леонидович, Чеплюкова Ирина Александровна

Рассматриваются Интернет-графы, состоящие из N вершин при условии, что сумма степеней вершин равна n. Получено предельное распределение статистики типа χ2 для таких графов в случае, когда N,n → ∞, 1 0, где ς(τ) значение дзета-функции Римана в точке τ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON ASYMPTOTICS OF χ

We consider random Internet graphs consisting of N vertices under the condition that the sum of vertex degrees is equal to n. We get the limit distribution of χ2 type statistic for these graphs such that N,n → ∞, 1 0, where ς(τ) is the Rimann's zeta-function

Текст научной работы на тему «ОБ АСИМПТОТИКЕ СТАТИСТИКИ ТИПА χ2 ДЛЯ ИНТЕРНЕТ-ГРАФОВ»

Труды Карельского научного центра РАН № 3. 2010. С. 66-71

УДК 519.2

2

ОБ АСИМПТОТИКЕ СТАТИСТИКИ ТИПА X ДЛЯ ИНТЕРНЕТ-ГРАФОВ

Ю. Л. Павлов, И. А. Чеплюкова

Институт прикладных математических исследований Карельского научного центра РАН

Рассматриваются Интернет-графы, состоящие из N вершин при условии, что сумма степеней вершин равна n. Получено предельное распределение статистики типа X2 для таких графов в случае, когда N, п ^ <х>, 1 < C < n/N < д(т), Т> 0,

где g(r) — значение дзета-функции Римана в точке Т.

Ключевые слова : случайные графы, Интернет, статистика типа X2, предельное распределение.

.,2

Yu. L. Pavlov, I. A. Cheplyukova. ON ASYMPTOTICS OF X - TYPE STATISTICS IN CONDITIONAL RANDOM INTERNET GRAPHS

We consider random Internet graphs consisting of N vertices under the condition that the sum of vertex degrees is equal to n. We get the limit distribution of X2 type statistic for these graphs such that N, n ^ ^, 1 < C < n/N < g(r), Т > 0, where g(r) is the Rimann's zeta-function.

Key words: random graphs, Internet, X2 type statistic, limit distribution.

Для связанной с критерием согласия %2 полиномиальной схемы хорошо известно асимптотическое поведение соответствующей статистики. Однако во многих комбинаторных задачах, отличающихся от полиномиальной схемы, при проверке статистических гипотез также возникает необходимость получения подобных результатов. В настоящей работе рассматривается одна из таких задач. Объектом исследования яв-

ляется известная конструкция случайного графа (см., например, [Faloutsos et al., 1999; Jason et al., 2000; Newman et al., 2001; Reittu, Norros, 2004]), являющаяся подходящей моделью сети Интернет. В связи с этим такие модели иногда называют Интернет-графами. Опишем этот граф. Предполагается, что граф состоит из N основных и одной вспомогательной вершин. Степени основных вершин, занумерованных числами от

(1)

1 до N , задаются независимыми случайными величинами i)1,...,tfN, распределение которых имеет вид

Pfa > к}= к—Т,

i = 1,..., N, к = 1,2,., где Т — некоторые положительные параметры.

Для описания структуры графа будем использовать понятие полуребра [Reittu, Norros, 2004], т. е. ребра, инцидентного конкретной вершине, но для которой смежная вершина еще не определена. Чтобы суммарное число полуребер было четным, степень вспомогательной вершины полагается равной 1 или 0, в зависимости от того, является ли число полуребер основных вершин четным или нет. Предполагается, что все полуребра различны и при образовании ребер полуребра соединяются равновероятно.

Во многих работах изучалось предельное поведение различных характеристик Интернет-графов. В работе [Faloutsos et al., 1999] было показано, что на практике, как правило, параметры распределения Т1,..., TN одинаковы и принадлежат

интервалу (1,2). В работах [Cheplyukova, Pavlov, 2007; Павлов, Чеплюкова, 2008] впервые было предложено использовать обобщенную схему размещения частиц по ячейкам с целью исследования асимптотического поведения Интернет-графов. Эта схема была введена и изучена В. Ф. Колчиным (см., например, [Колчин, 2004]).

В настоящей работе мы рассматриваем подмножество Интернет-графов при условии, что сумма степеней основных вершин задана и равна n , т. е.

П +... + П = n.

В качестве нулевой статистической гипотезы будем рассматривать гипотезу о том, что параметры распределения (1)

Т1 = Т2 = ••• = TN = Т

Для проверки этой гипотезы кажется естест-

2

венным использовать статистику типа X следующего вида

(2)

Введем независимые одинаково распределенные случайные величины £1,...,£ы, распределение которых имеет вид р{ = к}=

Як

1 — (1 — Л)Ф(Л,Т,1) кТ (к +1)

1

(3)

где к = 1,2,.; Ф(, 5, a)

трансцендентную

Ф(х, 5, a ) = Л

k

x

(к + a)5

функцию

a > 0 ,

означает

Лерча:

(4)

а параметр распределения X выбран из интервала (0,1) так, что выполнено равенство

Ф(Л,Т,1) —(1 — Л)Ф(Л,Т —1,1) = n_ 1 — (1 — Л)ф(Л,т,1) _ N

(5)

Нетрудно проверить, что уравнение (5) имеет единственное решение на интервале (0,1).

Пусть

Vi = £ (£ —1)2, i = 1,., N;

a = Ev1, <J2 = Dv1, p = cov(^1,^1 )Д/ Dv1D^1 .

Ниже приведена локальная предельная теорема для статистики (2) в случае N, n ^ ^ так, что 1 < C < n/N < д(т), где д(т) — значение дзета-функции Римана в точке Т. Заметим, что слабая сходимость распределения статистики (2) к нормальному закону следует из результатов работы [Ронжин, 1988]. Содержание данной статьи докладывалось на следующих конференциях: Barcelona Conference on Asymptotic

Statistics (2008) [Cheplyukova, Pavlov, 2008], X Всероссийском симпозиуме по прикладной и промышленной математике (2009) [Чеплюкова, 2009], 9th Internetional Conference «Computer Data Analysis and Modeling: Complex Stochastic Data and Systems» (2010), формулировки утверждений приведены в трудах этих конференций. В настоящей работе эти результаты обобщаются в виде приведенной ниже теоремы и дается ее подробное доказательство.

Далее будем считать, что при n/N ^ д(т) выполнено одно из условий:

1) Т > 6;

2) т = 6; VN/|ln(1 — Л)|^-;

3) 4 <т< 6; VN (1 — Л)6—Т^-;

4) т = 4; VN(1 — Л)2|1п3 (1 — Л)|^-;

5) 0 <Т< 4; N (1 — Л)Т^™.

Теорема. Пусть N, n так, что

1 < C < n/N < д(т). Тогда равномерно относительно целых к таких, что

к=0

1

( - Ла)Д<7д/N(1 - р2)) лежит в любом конечном фиксированном интервале, справедливо

р ^х2 =—

п

1 + 0(1)

ехр{ ((-N0 )2 1

Р{ 2Nа2(1-р2))

2П (1 -р2)

Эта теорема будет доказана с помощью приведенных ниже лемм 1 - 3.

Лемма 1. Справедливо равенство

р{ = п}

(6)

где

1 N

^ . +^N, ^ - 1)-

2 1=1

Доказательство. Учитывая равенство П +. + П = п, из (2) легко получить, что

_{ 2 2Ш \

Р^Х =---------+ N - п 1 =

(7)

^N =

е = -

1 -р 1 -р2 ^-р 1

Лемма 2. Пусть выполнены условия теоремы. Тогда последовательность распределений (SN - AN ')QN слабо сходится к двумерному нор-

мальному закону с плотностью g (х ) =------------------! 1 2 ехр{ -1 хЕ X

2ж^\-

Р

2

(9)

где х = (х1,х2)е Я2.

Доказательство. Для справедливости утверждения леммы достаточно показать, что в каждой точке Х1, *2) выполнено равенство

Ф(1 , *2 ) =

еХР{- 1 + (^ + 2Р^ ^ + °(1))

где (рХ\-> *2) обозначает характеристическую функцию случайной величины (SN - А,^ )QN. Обозначим через / (*1, *2) характеристическую функцию случайного вектора

(£ - Е£1,у1 - Еу1 ). Используя формулу Тейлора, получаем, что при достаточно малых *1 и

2^

Из (1), (3) и (4) несложно показать, что для рассматриваемого множества условных графов справедливо равенство

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р{1 = k1,•••,nN = kN }= (8)

Р{£1 = = kN £1 + ■■■ + £ = п}

Это равенство означает, что выполнены условия обобщенной схемы размещения ([Колчин, 2004]). Из (7) и (8) нетрудно получить утверждение леммы 1.

Легко видеть, что суммы случайных величин, стоящие в правой чисти равенства (6), образуют схему серий, поэтому задача получения предельного распределения статистики (2) сводится к доказательству локальных предельных теорем для случайной величины и случайного вектора XN, ^ )

Введем следующие обозначения:

X =£ V ) 1 = 1,., N,

SN =(Х1 + ••• + Х N ) = ^^N, ^ \

AN = Е^, а2 = ,

0 '

ч 0 1(а4м\

/(t1, *2 )= 1 -Х1а1 )2/2-(?2а)2/2 -*1*2 С0У(£1,^1 )+ *2 I

где

к

|3/

(11)

П.

( *2 )< С1 (^ (Е£3 + Е£)

(е^3 + Е\)

здесь и далее С1, С2,. означают некоторые положительные постоянные.

Из (3) несложно найти, что е£ = Ф(Х,т,1)-(1 -Х)Ф(Х,т -1,1).

Е£ 1 -(1 -Х)Ф(Х,т,1) ’

Еу1 = ((3 - Х)ф(Х, т -1,1) - (1 - Х)Ф(Х, т - 2,1) -

2Ф(Х,т,1) )(2(1 -(1 -Х)Ф(Х,т,1))-1; а12 = (2Ф(,т-1,1)-(1 -Х)Ф(Х,т-2,1)-Ф(Х,т,1)) - (1 -Х)Ф(Х,т,1)1 - Е2£; а2 =((1 -Х)Ф(Х,т-4,1)2 +

(3-Х)Ф(Х,т-3,1)-2 (13-Х)Ф(Х,т-2,1)+ (12)

6Ф(Х,т-1,1)-2Ф(Х,т,1) )х (2(1 -(1 -Х)Ф(Х,т,1))-1 - Е2^;

Е£3 =((Х- 1)Ф(Х,т- 3,1)+

3(Ф(Х,т-2,1)-Ф(Х,т- 1,1))+Ф(Х,т,1) )х (1 -(1 -Х)Ф(Х,т,1))-1;

п

Е^3 = ((А- 1)ф(А,г-6,1) +

(9 - 3А)ф(А,Г-5,1)+(А- 33)ф(А,Г-4,1) + (63-А)ф(А,Г-3,1)-66Ф(А,Г-2,1) + 36Ф(т-1,1)-8Ф(1,т,1) )х

(8(1 -(1 -а-ф(атл)))-1.

Используя (3) и (5), легко показать, что 01 > С2, а> С3. Поэтому из соотношения

Р(1, *2 ) = Ґ (*1 /(°1^} *2 / (°^))

находим, что

1п^(, *2 ) = N 1п

(13)

где, как следует из (11),

//

< С4 (3Е +1*213^

Е = Е£3 + Е3£. „ = Еу3 + E3Vl

(VN)3 ’ )3

(14)

(15)

Еу1 =

Еу13 =

а

'0(1), т> 6;

0(п(1 -А/- т = 6;

0(1 - А)-6- 0 <т< 6.

'1, Т> 2;

|1п(1 -А), Т = 2;

(1 -А)-4, 0 <Т< 2,

(16)

где запись / х g означает, как и в [Грэхем и др., 2006], что выполнены одновременно два неравенства |/| < С8к и к < С9\/1. Тогда из (14) и (16) получаем, что

О (-3/2), т > 6;

О (-3/21п(1 -Х)) т = 6;

О (-3/2 (1 -X)-6 ) 4 <т< 6;

(1 -х)-2 '

(17)

0

(іп(1 -А))Ы ) 0 (-3/2 (1 -А)-т 2)>

т = 4;

0<т< 4.

Аналогичным образом нетрудно показать,

что

Е =

В лемме 3 [Павлов, Чеплюкова, 2008] показано, что в случае 0 < С < п/И < С5 < д(т) справедливы неравенства С6 < X < С7 < 1, поэтому из соотношений (12) следует, что Е, F = о(-3/2), значит г = о(-1) Отсюда и из (13) видно, что в этом случае имеет место равенство (10).

Из леммы 3 [Павлов, Чеплюкова, 2008] следует, что Х^ 1 при п^ ^ д(т) При 5 < 1 для функции Лерча Ф(, 5,1)справедливы соотношения (см., например, [Иа_)о1е1;, Sedgewick, 2009]): Ф^Ц) = - 2 -11п(1 - 2 ) Ф(,0Д) = (1 - 2 )-1;

при 5 < 1,2 ^ 1

Ф(2,5,1) = Г(1 - 5)(- 1п2)5-1 (1 + 0(1)

где Г(х) - значение гамма-функции в точке х. Тогда, используя (12) и (15), несложно показать, что

О(1) т > 2;

о(|1п(1 -X)) т = 2;

0((1 -Х)т-2) 0 <т< 2.

0((-3/2), о(-3/21п(1 -а) 0( -3/2 (1 -А)-3 -(1 -А)-1 '

0

т> 3; т = 3;

2<т< 3;

т = 2;

(18)

(1п(1 -А—

0(-3/2(1 -А)-Т2- 0 <т< 2.

Из (17) и (18) следует, что г = о(-1) и в случае п^ ^ д(т), поэтому из (13) опять получаем соотношение (10), что и завершает доказательство леммы.

Лемма 2 показывает, что распределение статистики (2) слабо сходится к нормальному закону. Докажем, что имеет место локальная сходимость.

Лемма 3. Пусть выполнены условия теоремы. Тогда равномерно по 2 = (1, 22)

р{ = 2}= ^ QN к( - А ))+о(1)1 где к(х) определено в (9).

Доказательство. Пусть обозначает расстояние от а е Я до ближайшего целого числа,

^(1/2, ^4) =

{ = (1,с12)е Я2: Щ,^2| < 12,\Ц > 14}

*

*

2

г

*

г

2

г

Для двумерной случайной величины X и вектора d обозначим

h(x, d)_ E (x*, d 12

h n (s )_ У h(x, , d)_ ne{[ (x*, d 12,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

H N _ inf H N (S )

N <*єП(і/2,1/4) NV Г

(19)

H n (x)_ N X( (k — l )di +-

2

-d2) x

P{ = к }P{£ = /}

Из(16) видно, что

QN d| = Nd12 + o1 Nd2 -N, если 0 < C < n/N < C5 < д(т) или njN ^ д(т),т> 4;

N|ln(1 — Л), если n/N ^д(т),т = 4; (20)

N(1 — Л)Т—4, если n/N ^ д(т),0 <Т< 4,

а для всех d е П(1/2,1/4) справедливо

H

H n (к )> aQN'd

BN (в, u )> au2—-IQn1^-,

(22)

где

BN (в, u)_ N У (в, X і )P*

а P* — симметризованное распределение X

Мв.в),

в

_ 1, u є

[mhN ,eQ

где (х , ё) - скалярное произведение векторов X и ё, случайная величина X получена из X путем симметризации. Пусть также

Нетрудно найти, что при V > 0 справедливо соотношение

bN (в, u)_

N У в (к — l)+в2

(23)

_ к, l |(в, X і )<u

к (к — 1) l (l—l)

x

Поскольку X = ( — ;2, V1 — V2), нетрудно показать, что

(к — l Xk +1 — l)

P{; _ k}P{^2 _ l}>

N У Гві (к — l) + в2 kNflX! x

k:

?,Xі )<u

P{ _ k}P{; _ 1} C12 N У к3—Т > Ci2 Nu4—Т.

—u<k<u 2

Из (19) - (23) следует, что достаточно показать существование V и 8, обеспечивающих выполнение неравенства

1—- ( -

N 2u2—Т+-(1 — Л)( X > C13.

N (() > Сю N (((1 + ё 2 )2 + ((2^1 + 3ё 2 ) ) (21)

Отсюда, из (20) и леммы 2 следует, что в случаях, когда 0 < С < п/И < С5 < д(т) и

— д(т),т > 4, выполнено условие 1 локальной предельной теоремы [Мухин, 1991] для двумерных случайных сумм в схеме серий, а именно, существует такое а > 0, что

(24)

В силу условия леммы N(1 - Х)т — те, поэтому при достаточно малых V и 5 неравенство (24) выполнено и, следовательно, утверждение леммы 3 справедливо при 0 < т < 4. Осталось рассмотреть случай т = 4. Аналогично предыдущему получаем, что

B

в u )> C14N ln u,

> а

поэтому в этих случаях утверждение леммы 3 справедливо.

Пусть —> д(т), т > 4. Проверим вы-

полнение условия 2 указанной теоремы [Мухин, 1991]. Для этого достаточно показать, что Н N — те и существуют такие

а > 0,5 е (0,21 М > 0, в > 0, V е (0,12), что

N,x і l<u

и, как нетрудно проверить, (22) справедливо и при Т _ 4, что завершает доказательство леммы З.

Из результатов работ [Павлов, Чеплюкова, 2008] и [Павлов, 2009] следует, что в рассматриваемых условиях

p{n _ n}_ (N2nN)1 Iі+o(iX

поэтому из лемм 1 и 3 получаем утверждение теоремы.

Литература

Грэхем Р., Кнут В., Паташник О. Конкретная математика / пер. с англ. М.: Мир, 2006. 703 с.

Колчин В. Ф. Случайные графы. М.: Физматлит, 2004. 2Зб с.

Мухин А . Б. Локальные предельные теоремы для решетчатых случайных вершин // Теория вероятностей и ее применения. 1991. Т. 36, № 4. С. бб0 — б74.

*

2

2

k ,l

Павлов Ю. Л. О предельных распределениях степеней вершин в условных Интернет-графах // Дискретная математика. 2009. Т. 21, № 3. С. 14-23.

Павлов Ю. Л., Чеплюкова И. А. Случайные графы Интернет-типа и обобщенная схема размещения // Дискретная математика. 2008. Т. 20, № 3. С. 3-18.

Ронжин А. Ф. Критерии согласия для обобщенных схем размещения частиц по ячейкам, основанные на разделимых статистиках // Теория вероятностей и ее применения. 1988. Т. 33, № 1. С. 94-104.

Чеплюкова И. А. Об асимптотике статистики типа X для условных случайных Интернет-графах // Обозрение прикладной и промышленной математики. 2009. Т. 16, № 4. С. 272.

Cheplyukova I. A., Pavlov Yu. L. Limit distributions of vertex degree in conditional power-law random graphs / Transactios of the XXVI International Seminar on Stability Problems for Stochastic Models (Karmiel, October 22-26 2007). Karmiel, 2007. P. 52-59.

СВЕДЕНИЯ ОБ АВТОРАХ:

Павлов Юрий Леонидович

зав. лаб. теории вероятностей и копмьютерной статистики, д. ф.-м. н.

Институт прикладных математических исследований КарНЦ РАН

ул. Пушкинская, 11, Петрозаводск, Республика Карелия, Россия, 185910

эл. почта: [email protected] тел.: (8142) 763370

Чеплюкова Ирина Александровна

старший научный сотрудник, к. ф.-м. н.

Институт прикладных математических исследований КарНЦ РАН

ул. Пушкинская, 11, Петрозаводск, Республика Карелия,

Россия, 185910

эл. почта: [email protected]

тел.: (8142) 763370

Cheplyukova I. A., Pavlov Yu. L. On asymptotics of a X2 - type statistics in conditional random Internet graphs / Barselona Conference on Asymptotic Statistics (Bellatera // September 1-5 2008). Bellatera, 2008. P. 96.

Faloutsos C., Faloutsos P., Faloutsos M. On power-law relationships of the Internet topology // Computer communications Rev. 1999. Vol. 29. P. 251-252.

Flajolet P., Sedgewick R. Analytic combinatorics. Cambridge University Prees. Cambridge, 2009. 826 p.

Jason S., Luzak T., Rucinski A. Random grahps. Wiley, New York, 2000. 333 p.

Newman M. E. Y., Strogatz S. H., Wats D. J. Random graphs with arbitrary degree distribution and their applications // Phys. Rev. E. 2001. Vol. 64, paper 026118.

Reittu H., Norros I. On the power-law random graph model of massive data networks // Performance Evaluation. 2004. Vol. 55, N 1. P. 3-23.

Pavlov, Yury

Institute of Applied Mathematical Research, Karelian Research

Centre, Russian Academy of Science

11 Pushkinskaya St., 185910 Petrozavodsk, Karelia, Russia

e-mail: [email protected]

tel.: (8142) 763370

Cheplyukova, Irina

Institute of Applied Mathematical Research, Karelian Research

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Centre, Russian Academy of Science

11 Pushkinskaya St., 185910 Petrozavodsk, Karelia, Russia

e-mail: [email protected]

tel.: (8142) 763370

i Надоели баннеры? Вы всегда можете отключить рекламу.