Научная статья на тему 'Статистическая групповая классификация в случае многомерных дискретных распределений'

Статистическая групповая классификация в случае многомерных дискретных распределений Текст научной статьи по специальности «Математика»

CC BY
83
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ / МНОГОМЕРНОЕ РАСПРЕДЕЛЕНИЕ ПОЙА / ПОЛИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / СТАТИСТИЧЕСКАЯ ГРУППОВАЯ КЛАССИФИКАЦИЯ / СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / DISCRETE DISTRIBUTIONS / MULTIDIMENSIONAL DISTRIBUTION OF POLYA / POLYNOMIAL DISTRIBUTION / STATISTICAL GROUP CLASSIFICATION / STATISTICAL MODELING

Аннотация научной статьи по математике, автор научной работы — Каменева Светлана Владимировна

В данной статье представлены методы групповой и поточечной классификации, позволяющие исследовать вероятностные модели многомерных дискретных распределений. Построены оптимальные решающие правила для многомерного распределения Пойа, полиномиального распределения, многомерного гипергеометрического распределения. В качестве частных случаев приведены решающие правила поточечной классификации данных совокупностей. Рассмотрены статистические решающие правила групповой классификации, построенные на основе оценок максимального правдоподобия и несмещенных оценках, определена их эффективность.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The methods of group and pointwise classification allowing investigate probability models of multivariate discrete distributions are presented in this article. Optimum decisive rules for a multivariate distribution of Polya, a polynomial distribution, a multivariate hypergeometric distribution are constructed. Decisive rules of pointwise classification of these distributions are given as special cases. The statistical decisive rules of group classification constructed on the basis of maximum likelihood estimates and unbiassed estimators are considered. Their effectiveness is defined.

Текст научной работы на тему «Статистическая групповая классификация в случае многомерных дискретных распределений»

Итак: доказано, что Ъ в уравнении Xй + У" = 2п не может быть чётным числом при чётном п>4 и целочисленных решениях уравнения.

Рассмотрим доказательство невозможности чётного Ъ при нечётном п.

X > Y - нечётные, Ъ - чётное, п - нечётное.

Преобразуем уравнение Хп + У" =7", вычтя из левой и правой его частей 2-У".

Имеем:

^П - уп = - 2 • уп = 2 • (2 (™-1) • - уп). (4)

Отметим, что (2(и-1) • — У") - нечётное число.

Примем 2(и-1) • — У" = 7".

Тогда ф.(4) примет вид:

Xй - Г" = 2 • г^. (5)

Представим уравнение (1) и уравнение (5) в качестве сомножителей разности квадратов Xй и

уп :

(Xй + уп)(Хи - ги) = х2и - У2и = 2- •

= 2 • (г2 • г)". (6) ( См. Общий случай.)

Произведём почленное сложение и вычитание уравнения (1) и уравнения (5), откуда имеем:

Выразим Z" = 2" • Z". Тогда:

ул

■ = 2

2(n-l).zn_zn

= 2(и-1) •Zg" +Z£; (7)

.2-i3-!2. = 2(и-1)2 • Z" - Z". (8)

Разложим ф. (7) по формуле разложения на множители суммы п - х степеней при нечётном п.

= 2(и-1) • + г2и = (У2(и-1) • ¿3 +

(п_1)2

• Z.

(п_1)

•• + Z.

(п_1)

(9)

Разложим ф. (8) на множители по формуле размножения на множители разности п-х степеней, имея в виду, что У" нечётное число.

Гп = 2("-1)^ - = (72(и-1) • г3 -

(п—1)2

г2)(2--г-г(п-1) + ••• + г(п-1)). (10)

Из ф.ф. (9) и (10) следует, что разложение Хп и У" на целочисленные множители невозможно, а значит Ъ не может быть чётным числом в уравнении (1), поскольку уравнение не имеет целочисленных решений.

Общий вывод: для рационального числа п>3 уравнение Хп + У" = 1п не имеет решений в целых положительных числах Х,У,Ъ.

Список литературы:

1. Сингх С. Великая теорема Ферма. М.: МЦИМО, 2000 г.

2. Серпинский В. Пифагоровы треугольники. М.: Учпедгиз, 1959 г.

3. Гусев В. А., Мордкович А. Г. Математика: учебное пособие. М.: Высшая школа, 1984 г.

© С. И. Ведерников, 2018

ЪХ = Z" + 2 • Z2 .

п

Z" + 2Z

2

2

Zn_2Z?

2

2

СТАТИСТИЧЕСКАЯ ГРУППОВАЯ КЛАССИФИКАЦИЯ В СЛУЧАЕ МНОГОМЕРНЫХ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЙ

Каменева Светлана Владимировна

старший преподаватель кафедры высшей математики, ПГНИУ, г. Пермь

АННОТАЦИЯ

В данной статье представлены методы групповой и поточечной классификации, позволяющие исследовать вероятностные модели многомерных дискретных распределений. Построены оптимальные решающие правила для многомерного распределения Пойа, полиномиального распределения, многомерного гипергеометрического распределения. В качестве частных случаев приведены решающие правила поточечной классификации данных совокупностей. Рассмотрены статистические решающие правила групповой классификации, построенные на основе оценок максимального правдоподобия и несмещенных оценках, определена их эффективность.

ABSTRACT

The methods of group and pointwise classification allowing investigate probability models of multivariate discrete distributions are presented in this article. Optimum decisive rules for a multivariate distribution of Polya, a polynomial distribution, a multivariate hypergeometric distribution are constructed. Decisive rules of pointwise classification of these distributions are given as special cases. The statistical decisive rules of group classification constructed on the basis of maximum likelihood estimates and unbiassed estimators are considered. Their effectiveness is defined.

Ключевые слова: дискретные распределения, многомерное распределение Пойа, полиномиальное распределение, статистическая групповая классификация, статистическое моделирование.

Keywords: discrete distributions, multidimensional distribution of Polya, polynomial distribution, statistical group classification, statistical modeling.

Дискретные распределения служат математиче- широко используются такие многомерные распреде-скими моделями для описания многих реальных задач ления, как полиномиальное распределение и распре-и процессов. В медико-биологических исследованиях деление Пойа. На основе полиномиального распреде-

ления строятся модели, позволяющие оценить эффективность новых сывороток и вакцин. Распределение Пойа широко используется при моделировании эпидемий заразных заболеваний, так как полностью описывает процесс заражения, при котором каждое заболевание увеличивает вероятность дальнейших заболеваний [6]. Многие из проблем, возникающих при подборе и анализе соответствующей модели распределения, описывающей реальный процесс, сводятся к задачам статистического оценивания, статистической проверки гипотез и статистической классификации. Поэтому их решение является весьма актуальным с теоретической и практической точки зрения при разработке и обосновании математических моделей реальных задач естествознания.

В данной статье исследован статистический подход к анализу дискретных данных с помощью методов статистической групповой классификации. Задачи групповой и поточечной классификации решались ранее в основном для совокупностей, имеющих непрерывные распределения. Реальные задачи классификации, как правило, сводятся к вероятностной модели, основанной на предположении о принадлежности рассматриваемой совокупности данных к известным и наиболее часто встречающимся параметрическим семействам распределений, к таким как многомерное нормальное распределение, многомерное распределение Стьюдента, распределение Уишарта, экспоненциальное распределение.

В статье разработаны методы групповой и поточечной классификации, позволяющие исследовать вероятностные модели дискретных распределений. Построены оптимальные решающие правила групповой классификации для многомерных дискретных распределений. В качестве частных случаев получены решающие правила поточечной классификации рассматриваемых многомерных совокупностей.

Далее приведем все теоретические выкладки на примере многомерного распределения Пойа, как наиболее распространенного на практике многомерного дискретного распределения.

Модель эксперимента, соответствующая распределению Пойа, впервые была введена в работе [5] в качестве примера зависимых друг от друга величин, к которым нельзя применить закон больших чисел. Многомерный аналог распределения Пойа задается следующей урновой схемой [3]. Пусть урна содержит Ж шаров, каждый из которых окрашен в один из к цветов, причем имеется Ж(^ шаров / -го цвета (

0 < Ж(г) < Ж, г = 1к, Ж(г) = Ж). Каждый вынутый шар возвращается назад в урну вместе с $ шарами ($ > 1) того же цвета.

В этом случае вероятность распределения будет иметь следующий вид:

Р( X{1> = х(1),..., X(к > = х(к >\п) =

п!

П х

.(0|

Здесь х(г) - число шаров г -го цвета (г = 1, к)

х(г) = п.

•^■лк (г

вынутых при П извлечениях, ^ X

На практике более широко используется преобразованное распределение Пойа. Обозначим в

П Ж(0)'

Ж'пЯ ]

Ж(г)

[х^ ]

(1)

формуле (1) 6(г) =

Ж

$

ос = — и получим мно-Ж

гомерное распределение Пойа, для которого вероятность того, что вектор X = (X(1),..., X(к))' примет фиксированное значение

X = (х(1),..., X(к))' задается формулой

Р(X(1) = х(1),..., X(к) = х(к) | п) =

(к) _ Лк)

п!

п>" )1ы

I [п'\ '

(2)

пк=1 х(г)! 1 _

Здесь вероятности 6(г) удовлетворяют условиям: 0 < 6(г) < 1, г = 1, к, ^ 6^г) = 1,

в(к) = 1 -Ук-6(г).

В дальнейшем соотношение (2) будет использоваться как основная формула, задающая многомерное распределение Пойа.

Математические ожидания и дисперсия для распределения (2) находятся следующим образом: Ы^) = п6(г\ Б^) = п6(1)(1 -6(г)У-^0, г = 1к.

Известно, что при о = 0 из распределения (2) следует полиномиальное распределение. В случае полиномиального распределения вероятность того, что вектор

X = (X(1),..., X(к-1), X(к))' примет фиксированное значение х = (х(1),..., х(к 1),х(к))' задается формулой

к в) У''

рв (X(1) = х(1),..., = х(к-1),X(k) = х(к) | п) = «!пвТ"• (3)

1-1 х !

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к Г N

'=1 V х

Г N ^

V п у

Здесь X(к) = п — ) , £ х(г) = п; х(г) - целые неотрицательные числа (' = 1,к); вероят-

ности в(г) удовлетворяют условиям: 0 < в(г) < 1, ' = 1,к, в(к) = 1 — — в(г) •

. N (') _ ъ 1

Также из распределения (2) при в(г) = , 0 < N(0 < N (' = 1, к), N(г) = N, а = — —

следует многомерное гипергеометрическое распределение. Его вероятности задаются соотношением

п:

р,„,(X= хX<:> = х':п) = у , (4)

где N(г) (' = 1, к) - натуральные числа, N > п •

Построим оптимальные решающие правила групповой классификации для многомерного распределения Пойа (2). Так как случай М > 2 классов сводится к последовательному решению задач классификации двух классов, то далее будут приведены правила групповой классификации полностью описанных

двух классов лх и Ж2, подробно они изложены в работе [4].

При отсутствии какой-либо априорной информации о вероятностях заданных распределений

Р(Ж00 I

Ж в) (^ = 1,2) оптимальное решающее правило групповой классификации, основанное на отношении функций правдоподобия будет иметь вид

ЦЖ00 1 Ж1) т/

Жоо с Ж1, если 77-;—Г > V , (5)

1(Ж00 1 Ж2)

д2С (1/2) _

где V =- - заданный порог.

(2/1)

Если же априори известно, что условные распределения вероятностей Р(ж00 | в ) зависят от некоторого параметра в (s=1,2), то оптимальное решающее правило групповой классификации строится как отношение условных распределений вероятностей достаточной статистики ? вида

Р^ 1в)

Жт с Ж,, если-> V • (6)

Пусть объекты в совокупностях Ж (s=1,2) имеют многомерное распределение Пойа с вероятностями (2). При отнесении выборки Ж00 к одной из двух совокупностей Ж1, Ж2 оптимальное решающее

правило групповой классификации (5), построенное на основе отношения функций правдоподобия, запишется следующим образом

1К;«21 к (в« ^ );а1] '-в)'

обозначение и() введенное ранее для обозначения ' -й компоненты достаточной статистики исполь

Жт с Жл, если -г-т- • П / 1 ч ол-> V , (7)

1К;а1 П/ о ^'0'С

зуется для замены суммы, так как и() = ^ ^ х^ , ' = 1, к.

Из правила (7) при ССХ = а2 = 0 следует оптимальное решающее правило групповой классификации для совокупностей, имеющих полиномиальное распределение (3) вида

к (а(') V0')

в1 > V. (8)

Ж00 с Ж , если П^

а(') \в2 У

При 0<') = / N (' = 1, к; s =1,2) и ах=а2 = — —, то из правила (7) можно получить оптимальное решающее правило групповой классификации совокупностей, имеющих многомерное гипергеометрическое распределение (4), задаваемое соотношением

к ( ЛТ<') Л

Ж00 С Жх , если

N <°

V1У 2 У

N1" I1- 0 N-

1 > V . (9)

п

'=1

При п0 = 1 из правила (7) следует решающее правило поточечной классификации совокупностей. имеющих многомерное распределение Пойа вида

|[«;«2 ] к (п <') Vх<'

^] ^ 00))х<'^ ' 0« >

X е^,, если 1-Г П1 ' -> V. (10)

1

Аналогично методам построения правил групповой классификации, из правила (10) могут быть получены решающие правила поточечной классификации полиномиального и многомерного гипергеометрического распределений.

Если ранее распределения данных внутри совокупностей Ж3 (S = 1, М) предполагались известными, то далее будем считать, что распределения данных известны лишь частично, т.е. содержат неизвестные параметры. В этом случае совокупности задаются только конечными подмножествами

своих представителей Жж0 = <хл,хх2,..., х^ ) , называемыми обучающими выборками объемов N из совокупностей Жх (£ = 1,М).

Пусть объекты в совокупностях ж распределены в соответствии с вероятностями Р<X | 0 ), которые зависят от неизвестного параметра 0 е 0. Как и ранее, для простоты рассматривается случай, когда имеются только две совокупности ж и ж, заданные своими обучающими выборками ж10 и ж20, соответственно, и выборка Ж00, которую нужно отнести к одной из них.

В классической задаче распознавания образов по одному объекту (поточечной классификации) [2], решающие правила строились только по обучающим выборкам жж0 ^=1,2). Это означало, что

структурно они включают только отношения независимых величин. Позднее, в работе [1], был введен принципиально новый подход к решению задач статистической групповой классификации. Классифицируемая выборка ж стала использоваться

вместе с обучающими выборками ж для построения самих статистических решающих функций. При таком подходе возникает другая структура решающих правил, заключающаяся в том, что эти правила основаны на отношениях зависимых случайных величин. В данной статье, согласно вто-

рому подходу, состоятельные оценки и статистические решающие правила строятся на основе объединенной выборки жм ^ Ж00. Как следствия из

них, будут приведены статистические решающие правила, построенные на основе обучающих выбо-

р°к ж8 о.

Пусть объекты в совокупностях ж имеют полиномиальное распределение (3) с неизвестным параметром 0 ^=1,2). При отнесении выборки ж00

к одной из совокупностей жх ,ж2 статистическое решающее правило групповой классификации, основанное на отношении оценок максимального правдоподобия, построенных по объединенной выборке Жж0 ^Ж00 (s=1,2), будет иметь вид

к (

п

< N 2 + п0)и <° N14

< N1+ По)и

\ио

Ж00 С ж1, если

<')

<')

> V. (11)

У2 + «0 У

Статистическое решающее правило (11), основанное на отношении оценок максимального правдоподобия, построенных по обучающей выборке

Жво (s=1,2) примет вид

Жш С Ж, если

п

N . и <') N ')"•"

N •и

<')

> V, (12)

У2 У

2 }

' = 1, к.

При « = 1 из правил (11), (12) получаются

статистические решающие правила поточечной классификации для полиномиального распределения

'=1

'=1

x G ж1, если

k f (N2 + 1)(U(i)n + x

п

(N, + 1)(U« „ + x(i)

> V ;

(13)

x G ж , если

п

i=1

N2 • U(i)n1

N • и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ji)

(i )

> V.

(14)

В отличие от оценок максимального правдоподобия, несмещенные оценки существуют не для любых функций неизвестного параметра 9, в частности, возможны ситуации, когда несмещенной оценки не существует даже для самого параметра 9. Однако, во всех случаях, когда несмещенная оценка существует для заданной функции неизвестного параметра 9, рекомендуется пользоваться именно ею, так как важное свойство асимптотической несмещенности оценки для нее выполняется автоматически. Также, в классе несмещенных оценок существует единственная оценка равномерно лучшая в этом классе в смысле минимума дисперсии и задача нахождения этой оценки имеет решение.

Далее построим статистические решающие правила групповой и поточечной классификации в случае полиномиального распределения (3) при неизвестном значении параметра 9Ж ^=1,2), используя его несмещенные оценки.

Пусть объекты в совокупностях ж имеют полиномиальное распределение (3), где параметр 9Ж неизвестен ^=1,2). При отнесении выборки ж00 к

одной из совокупностей ж1, ж2 статистическое решающее правило групповой классификации, основанное на отношении несмещенных оценок, построенных по объединенной выборке Жм ^Ж00 ^=1,2) будет иметь вид

Ж00 с ж1, если

N1 +«0 1 ^ тг (Л

(пЫ2)![п(N1 + «о)] -Ц и(0 N1! и(0 N2 +«о 1

При « = 1 из правила (15) следует статистическое решающее правило поточечной классификации для полиномиального распределения вида

x G Ж

если

(nN,)![n(N +1.)]! À U(i)n2!(U(i)n, + x(16) (nN2)![n(N, +1)]!П U(i) n,!(U (i) n2 + x(i))! '

При статистическом моделировании методов групповой классификации, приведенных в данной статье, было установлено, что наиболее эффективными являются статистические решающие правила групповой классификации, построенные на основе несмещенных оценок по объединенной выборке

Ж ^Жю (s=1,2)-

Список литературы:

1. Абусев Р.А. Групповая классификация. Решающие правила и их характеристики. Изд-во Пермского университета. Пермь. 1992. 220 с.

2. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М. : Статистика. 1974. 240 с.

3. Володин И.Н. О числе наблюдений, необходимых для различения двух гипотез о параметре биномиального распределения// Теор. вероятн. и ее применения. 1969, Т.14, №2. - С. 327-332.

4. Каменева С.В. О некоторых задачах проверки гипотез и групповой классификации. Случай дискретных распределений. LAP Lambert. 2016.104 c.

5. Марков А.А. Избранные труды. Теория чисел и теория вероятностей.

Изд-во АН СССР. 1951. - С.351-361, 575-585.

6. Математические методы в иммунологии и медицине. - М.: Мир, 1986. - 312 с.

x

i=1

УДК 539.3_

КОЛЕБАНИЯ ДВУХСЛОЙНЫХ НЕОДНОРОДНЫХ СТЕРЖНЕЙ В УПРУГОЙ СРЕДЕ ПОД ДЕЙСТВИЕМ ТЕРМОМЕХАНИЧЕСКИХ НАГРУЗОК.

Мамедли Рамиль Эльман оглы

Нижневартовский Государственный Университет

доцент кафедры ИиМПИ

АННОТАЦИЯ

В статье исследуется задача собственных колебаний двухслойных неоднородных стержней при нахождении в неравномерном температурном поле под действием термомеханических сил.

Здесь предполагается, что слои стержня изготовлены из разных неоднородных изотропных материалов, и температура является непрерывной функцией координаты толщины. (Т=Т(1)).

i Надоели баннеры? Вы всегда можете отключить рекламу.