Научная статья на тему 'Метод эталонной функции для нахождения функции распределения'

Метод эталонной функции для нахождения функции распределения Текст научной статьи по специальности «Математика»

CC BY
284
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ВОССТАНОВЛЕНИЯ ФУНКЦИИ / ПОЛИНОМЫ ЛЕЖАНДРА / РЯД ФУРЬЕ / ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ / DISTRIBUTION FUNCTION / FOURIER ROW / LEGENDRE POLYNOMIAL / THE TASK OF FUNCTION RESTORATION

Аннотация научной статьи по математике, автор научной работы — Васильева Т. В.

Предложен метод восстановления функции распределения по эмпирическим данным разложением в ряд Фурье в ортогональной системе функций пространства li. Доказаны два достаточных критерия, на основе которых можно сделать вывод о принадлежности эмпирических данных определенному типу функции распределения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of Etalon Function for Finding Distribution Function

The method of distribution function restoration by empirical data through decomposition into Fourier row in orthogonal system of space functions li is proposed. Two sufficient criteria are proved; on their basis the conclusion is made about empirical data belonging to a certain type of distribution function.

Текст научной работы на тему «Метод эталонной функции для нахождения функции распределения»

Математика. Физика

УДК 519.2; 519.6; 517.518.3; 517.518.366

МЕТОД ЭТАЛОННОЙ ФУНКЦИИ ДЛЯ НАХОЖДЕНИЯ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ Т.В. Васильева

Кафедра «Автоматизированные системы»,

Иркутский государственный технический университет

Представлена членом редколлегии профессором В.И. Коноваловым

Ключевые слова и фразы: задача восстановления функции; полиномы Лежандра; ряд Фурье; функция распределения.

Аннотация: Предложен метод восстановления функции распределения по эмпирическим данным разложением в ряд Фурье в ортогональной системе функций пространства ^. Доказаны два достаточных критерия, на основе которых можно сделать вывод о принадлежности эмпирических данных определенному типу функции распределения.

В данной статье нас будет интересовать следующая задача: как с помощью разложения в ряд Фурье в ортогональной системе функций в пространстве Ь,2 найти аналитическое представление эмпирических данных, и можно ли по эмпирическим данным с уверенностью утверждать, к какому типу распределения они относятся.

Постановка задачи, основные понятия и определения. Будем искать аналитическое представление функции распределения ^(х) на отрезке [а,Ь] по эмпирическим данным выбором координат в ортогональной системе функций. Все выводы данной статьи относятся к непрерывным распределениям.

Введем необходимые ограничения. Будем рассматривать такой отрезок [а,Ь], что при малом е > 0 ^(а) < е и 1 - ^(Ь) > е. Будем считать, что выборка эмпирических данных репрезентативна на этом отрезке.

Эмпирическая функция распределения на этом отрезке имеет представление

, нак нак ч

в виде (здесь и далее ю/ = ю/ , где ю/ - относительные накопленные частоты)

Fn (x) =

0, x < a;

tt>1, a < x < x^

o>2, x1 < x < x^;

wn, xn-1 < x < b;

1, x > b.

Введение нового аргумента

* - a

t = ~и- (1)

Ь — а

позволит перейти от отрезка [а,Ь] к [0,1]. Будем рассматривать эмпирическую функцию распределения ¥п(¥) на отрезке [0,1]. Этот переход необходим для упрощения процесса ортогонализации.

Введем общие понятия, касающиеся функционального анализа [6]. Рассмотрим пространство Ь,2 [0,1] функций с интегрируемым квадратом на отрезке [0,1] с обычной мерой Лебега на этом отрезке. Введем в ^ скалярное произведение

1

(У, г) = | У(0 г(№ (2)

и норму

||у||2 = (у, у). (3)

Любую функцию ¥(/) можно представить разложением в ряд Фурье по многочленам Лежандра

1 <1п і 2 \п

Рп (/) =-------------((2/ -1)2 -1) . (4)

п!• 2п^п' '

Система (4) ортогональна, так как 1

! Pn (t)Pm (t)dt =

n

0

0 при n Ф m, і

------- при n = m;

2n +1

F (t) = X CnPn (t), (5)

П=1

1

сп = (2п +1)| ¥ ^ )Рп ^ )Л. (6)

0

Таким образом, необходимо найти коэффициенты сп. Эмпирическая функция распределения, заданная в виде ¥п(/), не позволяет решить задачу по формуле (5), поэтому будем пользоваться методами численного интегрирования.

Способ расчета коэффициентов сп. Рассмотрим способ вычисления коэффициентов сп. Введем необходимые определения [3].

Определение 1. Функцией плотности непрерывной случайной величины X называется первая производная от функции распределения:

ф( х) = ¥'(х). (7)

Определение 2. Начальным моментом к-го порядка случайной величины X называется математическое ожидание к-й степени этой величины:

0

Определение 3. Начальный момент к-го порядка эмпирической функции распределения определяется по формуле

Mk=Ё

k

Xi ю,.

(9)

,=1

Замечание 1. Будем рассматривать только такие непрерывные случайные величины X, для которых существуют начальные моменты к-го порядка. Для нахождения первых п коэффициентов сп требуется первых п +1 моментов (см. ниже).

Для вычисления коэффициентов сп по формуле (6) рассмотрим дополнительное соотношение, воспользовавшись тем, что ¥(0) ® 0, ¥(1) ® 1:

ItkF(t)dt -

u = F (t) du = f(t)dt

tk+1

dv = tkdt v =

= F (t)

k+1

k +1

1 1 tk+1 1

I k+1 f(,)d' = k+1(1 -M+■ >•

0 0

В силу (10) и (6) получаем

k +1 1-

(10)

1

М1 = |tф(t)dt = 1 - 2со .

о

Существование высших начальных моментов позволяет выразить коэффициенты через эти моменты. Приведем первые четыре коэффициента ск:

1

с0 = | ¥ (^ = (1 - М1); о

1

с1 = 3| ¥(^ -= 3 (М1 - М 2); (11)

0

с2 = 51 ¥(t) (3 (2t -1)2 -11 dt = 5 (-2М3 + 3М2 - М1);

о ^2 2 '

с3 = 7|¥(t) ^5(2t -1)3 - 3(2t -1) jdt = 7 (-5М4 + 10М3 - 6М2 + М1).

Эти соотношения можно использовать для вычисления эталонной матрицы (об эталонной матрице смотрите ниже), кроме того, оценив начальные моменты к-х порядков начальными моментами к-го порядка вариационного ряда, получим коэффициенты, используемые в разложении (5).

—оо

0

В результате чего получаем следующую теорему.

Теорема 1. Если для функции распределения ¥ существуют начальные моменты высших порядков, то для каждой ортонормированной системы многочленов в пространстве Ь2 существует единственное аналитическое представление функции распределения ¥ через начальные моменты высших порядков.

Эта теорема является важным выводом данной статьи.

Оценка погрешности аналитического представления функции распределения первыми п коэффициентами ряда Фурье. Очевидно, что следующей нашей задачей является оценка погрешности возникающей при использовании этого метода и нахождение необходимого количества элементов ряда Фурье.

Определение 4. Дадим определение верхних и нижних сумм Дарбу. Пусть и ^ - соответственно верхняя и нижняя граница изменения ¥(х) в элементарном

п

интервале [хг-, хг+1] для разбиения 7 отрезка [а,Ь]. Числа £(X) = XО1 (хг+1 -х1) и

1=0

п

£ (Х ) = X 8г (хг+1 — х^) называются соответственно верхней и нижней суммой 1=0

Дарбу разбиения X [4, с. 390].

Для коэффициентов сп функции ¥(/) полной ортонормированной системы Рп (4) выполняется равенство Парсеваля [6, с. 151]

= X с2. (12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i=0

В силу того, что система полиномов Лежандра ортогональна, но не нормирована, для применения равенства Парсеваля коэффициенты сп необходимо ум-

1

ножить на

sl2n +1

Обозначим Сп = . п -. Найдем следующую разность, чтобы оценить ко-л]2п +1

личество коэффициентов сп, необходимых для построения эмпирической функции распределения ¥п:

к ¥

К112—Xс2 = X с2 <е. (13)

1=0 1=к+1

и оценим сумму оставшихся координат сп. Таким образом, задавая требуемое е > 0, мы можем оценить количество коэффициентов сп. Из сходимости ряда Фурье при п ^ да следует е ^ 0.

Так как функция распределения монотонно возрастающая, то верхняя и нижняя граница изменения ¥п(х) в элементарном интервале [хг-, хг+1] соответственно равны О1 = Ю/+1, gi = юг-.

В нашей задаче для эмпирической функции Рп(1) численное значение нормы необходимо оценить через верхние и нижние интегральные суммы Дарбу.

n—1 1 n—1

X w2(x-+1 — x) < IFn||2 = j(Fn)2dt < X ®2+1(x+1 — x). (14)

i=0 0 i=0

2

Таким образом, получаем интервальную оценку, дающую погрешность метода:

п—1 к ¥ п—1 к

X®2(хг+1-х)-Xс2 < X с < X®2+1(хг+1-х)-Xс2. (15)

1=0 1=0 1=к+1 1=0 1=0

Метод эталонной функции. Аналитическое построение функции распределения по эмпирическим данным в ортонормированной системе приводит к новым, интересным результатам, которые рассмотрены ниже.

Поскольку мы приводим функцию распределения в стандартный вид на интервале [0,1], то уместно говорить про некоторый «канонический» вид функции распределения Г(^ для каждого типа распределения. Коэффициенты Фурье сг-единственны для каждой функции канонического вида.

Определение 5. Эталонным вектором коэффициентов с1 для конкретного типа распределения будем считать такой вектор с1, который подсчитан для функции распределения ¥(/) на отрезке [0,1] с помощью формул (6). Математическое ожидание примем равным выборочному среднему, дисперсию, соответственно, равной выборочной дисперсии, в силу того, что выборка репрезентативна.

Составим эталонную матрицу С(1, /) (1 изменяется от 1 от п) из первых п коэффициентов Фурье для каждого /-го распределения. Для исследуемой эмпириче-

*

ской функции ¥п рассмотрим вектор С численных значений коэффициентов

*

Фурье. Нормируем каждый вектор С(1) и вектор С относительно нормы пространства Н (п-мерное Евклидово пространство).

С(1) С (1)

C*(i) C*(i)

C*(i)

(с12+...+сп2)

(1б)

Замечание 2. В общем случае (16) необходимо рассмотреть с нормой пространства І2 (бесконечномерное пространство последовательностей), но, так как для практического применения предложенной методики достаточно ограничиться конечным числом координат векторов С(і), будем рассматривать норму вектора в пространстве Н .

Рассмотрим два достаточных матричных критерия, с помощью которых по эмпирическим данным можно сделать вывод о принадлежности их к определенному типу распределений.

*

Критерий № 1. При условии, что вектора С(і) и С нормированы по формуле (16) справедлива следующая теорема.

Теорема 2. Для того чтобы эмпирическое распределение Рп(Р) совпадало с распределением Р(¥), достаточно, чтобы результат произведения матрицы на

*

вектор С(і, ]) С (і) в координате у был по модулю равен 1, то есть произведение

*

эталонного вектора С(у) функции Е(х) на вектор С координат эмпирической функции Еп по модулю равно 1.

Доказательство. Утверждение теоремы следует из неравенства Коши [4, с. 212].

\2

(C1C* +... + °n°„) <( C12 + ... + )(Cl2 + ... + C„2 ).

Так как векторы С и С нормированы, то правая часть неравенства равна 1.

(C1Cl +... + CnC„) < L

-14

Равенство достигается только тогда, когда векторы С и С пропорциональны, то есть, в данном контексте, совпадают.

*

Таким образом, после нахождения произведения векторов С и С вывод о принадлежности выборки к определенному типу функций распределения будем делать по максимальной близости этого произведения к 1.

Критерий № 2.

Теорема 3. Для того чтобы эмпирическое распределение Рп(Р) относилось к типу распределений Р(Р), достаточно, чтобы расстояние между эталонным

*

вектором С(ф) функции Р(х) и вектором С координат эмпирической функции Р„ было минимальным среди расстояний между эталонными векторами С(і) и век*

тором С .

Доказательство. Расстояние между двумя векторами в пространстве

Я

p=

)j(C1 — C1 ) + ... + (Cn — Cn ) .

В пространстве ^[0,1] расстояние между функциями определяется по фор-

муле

p(F,Fn ) =

Zc,P, (t) — Zс*p (t)

V i=0 i=0

dt =

jl Z(c,P, (t) — c*P (t))

0 V ,=0

dt =

jl ZPi (t) (O — C* )

0 V ,=0

dt.

В силу неравенства Коши-Буняковского получаем

1

і i w

jl Z P (t) (c, — C* )

0 V i=0

dt <

jlZ p2<'»z ( c,—o*)

0 Vi=0 i=0

dt =

Z(o,—ol) jl Zp2(')

i=0 0 V i=0

dt.

1 ( ¥ Л

jl Z p2(o

0 V i=0

dt = const для любых функций F и Fn и, кроме того,

¥ 2

^ (сі - с*) ® тіп по условию теоремы. Следовательно, нахождение мини-і=0

2

г

j

0

2

2

2

Л

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

*

мального расстояния между векторами С и С гарантирует максимальную близость теоретической и эмпирической функций распределения.

Основные результаты и выводы. Предложенный метод дает возможность:

1) составить эталонную матрицу, в которой каждая строка является коэффициентами ряда Фурье для канонического уравнения функции распределения конкретного вида;

2) сделать вывод о принадлежности эмпирической выборки к определенному классу распределений;

3) обрабатывать эмпирические данные в том виде, в котором они получены в результате эксперимента без дополнительной группировки на интервалы;

4) получить разложение эмпирических данных или функции распределения в ряд Фурье в системе ортогональных функций в пространстве ^2, коэффициенты которого однозначно определяются через начальные моменты высших порядков.

Список литературы

1. Айвазян, С. А. Прикладная статистика и основы эконометрики / С. А. Айвазян, В.С. Мхитарян. - М. : ЮНИТИ, 1998. - 952 с.

2. Айвазян, С.А. Прикладная статистика. Основы моделирования и первичная обработка данных / С.А. Айвазян, И.С. Енюков, Е.Д. Мешалкин. - М. : Финансы и статистика, 1983. - 473 с.

3. Андронов, А.М. Теория вероятностей и математическая статистика / А.М. Андронов, Е.А. Копытов, Л.Я. Гринглаз. - СПб. : Питер, 2004. - 460 с.

4. Бронштейн, И.Н. Справочник по математике / И.Н. Бронштейн, К. А. Семендяев. - М. : Наука, 1980. - 975 с.

5. Вулих, Б.З. Введение в функциональный анализ / Б.З. Вулих. - М. : Наука, 1967. - 416 с.

6. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М. : Наука, 1976. - 543 с.

7. Кремер, Н.Ш. Теория вероятностей и математическая статистика / Н.Ш. Кремер. - М. : ЮНИТИ, 2004. - 574 с.

8. Поллард, Дж. Справочник по вычислительным методам статистики / Дж. Поллард. - М. : Финансы и статистика, 1982. - 344 с.

Method of Etalon Function for Finding Distribution Function

T.V. Vasilyeva

Department “Automated Systems ”, Irkutsk State Technical University

Key words and phrases: distribution function; Fourier row; Legendre polynomial; the task of function restoration.

Abstract: The method of distribution function restoration by empirical data through decomposition into Fourier row in orthogonal system of space functions L2 is proposed. Two sufficient criteria are proved; on their basis the conclusion is made about empirical data belonging to a certain type of distribution function.

Methode der geeichten Funktion ftir das Auffinden der Verteilungsfunktion

Zusammenfassung: Es ist die Methode der Wiederherstellung der Funktion der Verteilung nach den empirischen Angaben durch Zerlegung in die Furie-Reihe im orthogonalen System der Funktionen des Raumes L2 angeboten. Es sind zwei ausreichende Kriterien bewiesen, auf deren Grundlage man die Schlussfolgerung uber die Zugehorigkeit der empirischen Daten einem bestimmten Typ der Funktion der Verteilung machen kann.

Methode de la fonction d'etalon pour la decouverte de la fonction de la repartition

Resume: Est proposee la methode de la reconstruction de la fonction de la repartition d’apres les donnees empiriques par la decomposition dans le rang de Fourier dans un systeme orthogonal de l’espace L2 . Sont prouves deux criteres suffisants a la base desquels on peut deduire l’appartenance des donnees empiriques a un type particulier de la fonction de la repartition.

i Надоели баннеры? Вы всегда можете отключить рекламу.