Применение метода Монте-Карло при изучении свойств статистических критериев однородности двух независимых выборок

Орлов Александр Иванович

УДК 330.4:519.245

08.00.13 - Математические и инструментальные методы экономики (экономические науки)

ПРИМЕНЕНИЕ МЕТОДА МОНТЕ-КАРЛО ПРИ ИЗУЧЕНИИ СВОЙСТВ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ ОДНОРОДНОСТИ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК

Орлов Александр Иванович

д.э.н., д.т.н., к.ф.-м.н., профессор

РИНЦ БРШ-код: 4342-4994

Московский государственный технический

университет им. Н.Э. Баумана, Россия, 105005,

Москва, 2-я Бауманская ул., 5, prof-orlov@mail.т

К инструментальным методам экономики относится метод Монте-Карло (метод статистических испытаний). Он широко используется при разработке, изучении и применении математических методов исследования в эконометрике, прикладной статистике, организационно-экономическом моделировании, при разработке и принятии управленческих решений, является основой имитационного моделирования. Разработанная нами новая парадигма математических методов исследования опирается на применение метода Монте-Карло. В математической статистике для многих метолов анализа данных получены предельные теоремы об асимптотическом поведении рассматриваемых величин при безграничном росте объемов выборок. Следующий шаг - изучение свойств этих величин при конечных объемах выборок. Для такого изучения применяют метод Монте-Карло. В настоящей статье этот метод применяем для изучения свойств статистических критериев проверки однородности двух независимых выборок. Рассмотрены наиболее используемые при анализе реальных данных критерии - Крамера-Уэлча, совпадающий при равенстве объемов выборок с критерием Стьюдента; Лорда, Вилкоксона (Манна-Уитни), Вольфовица, Ван-дер-Вардена, Смирнова, типа омега-квадрат (Лемана-Розенблатта). Метод Монте-Карло позволяет оценить скорости сходимости распределений статистик критериев к пределам, сравнить свойства критериев при конечных объемах выборок. Для применения метода Монте-Карло необходимо выбрать функции распределения элементов двух выборок. Для этого использованы нормальные распределения и распределения Вейбулла -Гнеденко. Получена рекомендация: для проверки гипотезы совпадения функций распределения двух выборок целесообразно использовать критерий Лемана - Розенблатта типа омега-квадрат. Если есть основания предполагать, что распределения

UDC 330.4:519.245

08.00.13 - Mathematical and instrumental methods of Economics (economic sciences)

APPLICATION OF THE MONTE-CARLO METHOD WHEN STUDYING THE PROPERTIES OF STATISTICAL TESTS OF HOMOGENEITY OF TWO INDEPENDENT SAMPLES

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

The instrumental methods of economics include the Monte Carlo method (statistical simulations method). It is widely used in the development, study and application of mathematical research methods in econometrics, applied statistics, organizational and economic modeling, in the development and making management decisions, in the basis of simulation modeling. The new paradigm of mathematical research methods developed by us is based on the use of the Monte Carlo method. In mathematical statistics, limit theorems on the asymptotic behavior of the considered random values were obtained for many methods of data analysis with an unlimited increase in sample volumes. The next step is to study the properties of these random values for finite sample sizes. For such a study, the Monte-Carlo method is used. In this article, we use this method to study the properties of statistical criteria for testing the homogeneity of two independent samples. We considered the most used in the analysis of real data criteria - Cramer-Welch, which coincides with the equality of the sample sizes with Student's criterion; Lord, Wilcoxon (MannWhitney), Wolfowitz, Van der Waerden, Smirnov, type omega-square (Lehmann-Rosenblatt). The Monte Carlo method allows us to estimate the rates of convergence of distributions of criteria statistics to the limits, to compare the properties of the criteria for finite sample sizes. To use the Monte Carlo method, it is necessary to select the distribution functions of the elements of the two samples. For this purpose, normal and Weibull - Gnedenko distributions are used. The recommendation was received: to test the hypothesis of coincidence of distribution functions of two samples, it is advisable to use the Lehmann-Rosenblatt (type omega-square) test. If there is reason to assume that the distributions differ mainly by the shift, then the Wilcoxon test and Van der Waerden criteria can also be used. However, even in this case, the omegasquare type test may be more powerful. In the general case, besides the Lehmann-Rosenblatt

отличаются в основном сдвигом, то можно использовать также критерии Вилкоксона и Ван-дер-Вардена. Однако даже в этом случае критерий типа омега-квадрат может оказаться более мощным. В общем случае, кроме критерия Лемана - Розенблатта, допустимо применение критерия Смирнова, хотя для этого критерия реальный уровень значимости может значительно отличаться от номинального. Оценены частоты расхождений статистических выводов по разным критериям

criterion, the use of the Smirnov criterion is permissible, although for this criterion the real level of significance may differ from the nominal level of significance. We sstudied the frequency of discrepancies of statistical findings on different criteria

Ключевые слова: ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ, ЭКОНОМЕТРИКА, ПРИКЛАДНАЯ СТАТИСТИКА, МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ, МЕТОД МОНТЕ-КАРЛО, ДАТЧИКИ ПСЕВДОСЛУЧАЙНЫХ ЧИСЕЛ, КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ, ОДНОРОДНОСТЬ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК, КРИТЕРИЙ КРАМЕРА-УЭЛЧА, КРИТЕРИЙ ЛОРДА, КРИТЕРИЙ ВИЛКОКСОНА, КРИТЕРИЙ ВАН-ДЕР-ВАРДЕНА, КРИТЕРИЙ СМИРНОВА, КРИТЕРИЙ ЛЕМАНА-РОЗЕНБЛАТТА

DOI: http://dx.doi.org/10.21515/1990-4665-154-007

Keywords: INSTRUMENTAL METHODS OF ECONOMICS, ECONOMETRICS, APPLIED STATISTICS, STATISTICAL SIMULATIONS METHOD, MONTE-CARLO METHOD, PSEUDO-RANDOM NUMBER GENERATORS, CRITERIA FOR TESTING STATISTICAL HYPOTHESES, HOMOGENEITY OF TWO INDEPENDENT SAMPLES, CRAMER-WELCH TEST, LORD TEST,WILCOXON TEST, VAN DER WAERDEN TEST, SMIRNOV TEST, LEHMANN-ROSENBLATT TEST

1. Введение. Новая парадигма математических методов исследования

Среди математических и инструментальных методов экономики важное место занимают метод статистических испытаний (Монте-Карло). Он широко используется при разработке, изучении и применении математических методов исследования в эконометрике, прикладной статистике, организационно-экономическом моделировании, при разработке и принятии управленческих решений.

В развитии математических методов исследования выделяем два важных периода [1]. Первый - начало ХХ в., когда были разработаны базовые положения современной математической статистики, сформулированы основные идеи таких ее разделов, как описание данных, оценивание параметров, проверка статистических гипотез. Эти идеи легли в основу учебников, используемых и в настоящее время. Наряду с

рациональными приемами анализа данных продолжают пропагандироваться устаревшие воззрения, например, основанные на использовании параметрических семейств распределений вероятностей, в то время как установлено, что практически все распределения реальных данных ненормальны и не описываются с помощью иных семейств распределений вероятностей.

Второй период - с 1980-х годов по настоящее время. Усилиями сотен исследователей разработана новая парадигма прикладной статистики [2]. Фактически речь идет о новой парадигме математических методов исследования [3]. В соответствии с новой парадигмой заложены основы математики XXI в. - системной нечеткой интервальной математики [4]. На первое место вышла статистика нечисловых данных. Так, за десять лет (2006 - 2015) ей посвящены 27,6% всех публикаций раздела "Математические методы исследования" журнала "Заводская лаборатория. Диагностика материалов", т.е. 63,0% статей по прикладной статистике [5].

Новая парадигма математических методов исследования опирается на эффективное применение информационно-коммуникационных технологий как при расчете характеристик методов анализа данных, так и при имитационном моделировании. Датчики псевдослучайных чисел лежат в основе многих современных технологий анализа данных. Эти эффективные инструменты исследователя внутренне противоречивы - в них с помощью детерминированных алгоритмов получаем последовательность чисел, обладающих многими свойствами случайных величин. Поэтому свойства таких инструментов требуют тщательного изучения.

2. Метод статистических испытаний - инструмент исследователя

Для решения конкретных прикладных задач исследователи постоянно разрабатывают новые методы обработки статистических

данных - результатов измерений (наблюдений, испытаний, анализов, опытов) и экспертных оценок. Свойства каждого вновь предлагаемого метода необходимо изучить. Какие интеллектуальные инструменты можно применить для такого изучения?

Мощным инструментом исследователей в области математической статистики являются предельные теоремы теории вероятностей - закон больших чисел, центральная предельная теорема и т.п. Некоторые ориентированные на математику специалисты призывают ими и ограничиться. Однако для практического использования статистических методов предельных теорем недостаточно. Необходимо найти границу -выяснить, начиная с какого объема выборки можно пользоваться результатами, полученными с помощью предельных теорем. И выяснить, как принимать решения, если объем имеющихся данных меньше этой границы.

С середины ХХ в. исследователю доступна универсальная "отмычка" - метод статистических испытаний (метод Монте-Карло), другими словами, имитационное моделирование. Он основан на использовании последовательности псевдослучайных чисел, свойства которых напоминают свойства рассматриваемых в теории вероятностей случайных величин. Основная идея состоит в последовательном выполнении следующих этапов: (1) разработке вероятностно-статистической модели реального явления или процесса; (2) планировании статистического испытания, в котором случайные величины заменяются псевдослучайными, полученными с помощью того или иного датчика псевдослучайных чисел; (3) проведении большого числа испытаний (тысяч или миллионов); (4) анализе полученных результатов расчетов.

С каждым этапом связаны соответствующие проблемы адекватности имитационного моделирования. Так, для предельных теорем обычно справедлив тот или иной принцип инвариантности, т.е. в пределе исчезает

зависимость от конкретного вида распределения. Однако при изучении скорости сходимости выбор этого конкретного вида весьма важен, поскольку от него зависит итоговый результат статистического моделирования - один для нормального распределения, другой - для логистического, третий - для распределения Коши...

Датчики псевдослучайных чисел лишь имитируют случайность. Алгоритмы получения псевдослучайных чисел имеют достаточно короткое описание, в то время как по определению А.Н. Колмогорова 60-х годов (в рамках теории информации) описание случайной последовательности должно расти пропорционально длине этой последовательности [6]. Кроме этой глобальной причины методологической несостоятельности датчиков псевдослучайных чисел есть и частные недостатки. Например, у некоторых популярных до настоящего времени датчиков три последовательных значения связаны линейной зависимостью.

Значения, рассчитанные с помощью метода Монте-Карло, имеют погрешности, определяемые конечностью числа испытаний. При оценивании вероятности события погрешность достигает величины 1/(2л^), где N - число испытаний. Значит, для оценивания вероятности с точностью 10-6 необходимо 1012 / 4 испытаний. На практике провести такое количество испытаний невозможно.

3. Дискуссия о современном состоянии и перспективах развития статистического моделирования

Проблемы теории и практики статистических испытаний (Монте-Карло) заслуживают тщательного обсуждения. В 2016 г. журнал "Заводская лаборатория. Диагностика материалов" начал дискуссию о современном состоянии и перспективах развития статистического моделирования, т.е. теории и практики применения метода статистических испытаний (Монте-Карло), различных вариантов имитационного

моделирования. Предыдущая дискуссия о свойствах таких датчиков была проведена в журнале "Заводская лаборатория. Диагностика материалов" в 1985 - 1993 гг.

"Затравкой" дискуссии послужили статьи [7] и [8]. В первой из них рассмотрены задачи повышения эффективности вычислений методом Монте-Карло. Отмечено, что ключевую роль в их решении играют вопросы выбора объема статистических испытаний (количества моделируемых случайных чисел), а также качества соответствующих датчиков случайных чисел. Обсуждены проблемы реализации алгоритмов методов Монте-Карло, обусловленные требованиями повышения скорости сходимости асимптотических решений к истинным решениям.

В статье [8] констатируется, что цель прикладной математической статистики - разработка методов анализа данных, предназначенных для решения конкретных прикладных задач. С течением времени подходы к разработке таких методов менялись. Сто лет назад принимали, что распределения данных имеют определенный вид, например, являются нормальными, и исходя из этого предположения развивали статистическую теорию. На следующем этапе на первое место в теоретических исследованиях выдвинулись предельные теоремы. Под «малой выборкой» понимают такую выборку, для которой нельзя применять выводы, основанные на предельных теоремах. В каждой конкретной статистической задаче возникает необходимость разделить конечные объемы выборки на два класса: для одного можно применять предельные теоремы, а для другого делать этого нельзя из-за риска получения неверных выводов. Для выбора границы часто используют метод Монте-Карло (статистических испытаний). Более сложные проблемы возникают при изучении влияния на свойства статистических процедур анализа данных тех или иных отклонений от исходных предположений. Такое влияние также часто изучают, используя метод

Монте-Карло. Основная и пока не решенная в общем виде проблема при изучении устойчивости выводов при наличии отклонений от параметрических семейств распределений состоит в том, какие распределения использовать для моделирования. Сформулированы и другие нерешенные проблемы.

Подборка из трех статей опубликована в мартовском номере 2017 г. О.И. Кутузов и Т.М. Татарникова [9] рассмотрели две задачи, обусловленные особенностями применения имитационного моделирования при исследовании сложных технических систем. Одна из них связана с реализацией подхода к повышению эффективности метода Монте-Карло при моделировании редких событий: сочетание расслоенной выборки с равновзвешенным моделированием позволяет значительно ускорить алгоритмический анализ моделей стохастических систем методом имитации. Решение другой задачи выявило проблему, связанную с неадекватностью использования одного и того же датчика псевдослучайных чисел при сопоставлении выборочных значений очередей, полученных на имитационных моделях фрактальной и классической систем массового обслуживания.

И.З. Аронов и О.В. Максимова [10] представили результаты статистического моделирования, характеризующие зависимость времени достижения консенсуса от числа членов технических комитетов по стандартизации (ТК) и их авторитарности. Использована математическая модель обеспечения консенсуса в работе ТК, основанная на модели, предложенной Де Гроотом. Проведен анализ основных проблем достижения консенсуса при разработке консенсусных стандартов в условиях предложенной модели. Показано, что увеличение числа экспертов ТК и их авторитарности негативно влияет на время достижения консенсуса и способствует разобщенности группы.

В комментарии [11] к этой статье проанализировано соотношение консенсуса и истины. Работа технических комитетов по стандартизации -одна из форм экспертных процедур, поэтому ее целесообразно рассматривать в рамках теории и практики экспертных оценок. Тогда проблема консенсуса - это проблема согласованности мнений членов комиссии экспертов. Однако цель работы экспертной комиссии - не достижение согласованности экспертов (консенсуса), а получение (в качестве коллективного мнения) выводов, отражающих реальность, обычно нацеленных на выработку обоснованных управленческих решений, короче говоря, на получение истины. Наблюдаем объективное противоречие между стремлением к выявлению истины и желанием обеспечить консенсус.

Итоги первого этапа дискуссии подведены в [12]. Продолжают публиковаться статьи, посвященные применению метода статистических испытаний (Монте-Карло) для решения различных задач. Так, М.С. Жуков применяет его для изучения свойств алгоритмов нахождения медианы Кемени как итогового мнения комиссии экспертов [13], а И.В. Гадолина и Н.Г. Лисаченко - при разработке метода построения доверительных интервалов для процентилей случайной выборки прочности композитов [14]. Столь интересно начатая дискуссия заслуживает продолжения и расширения круга обсуждаемых проблем.

4. Статистические критерии проверки однородности двух независимых выборок

Обсудим применение метода статистических испытаний для изучения свойств статистических критериев проверки однородности двух независимых выборок.

Исходные данные - две выборки х1, х2,...,хт и уь у2,...,уп (т. е. наборы из т и п действительных чисел), требуется проверить их однородность.

В общепринятой модели хь х2, ..., хт - независимые одинаково распределенные случайные величины с функцией распределения F(x), а уь у2, ..., уп- также независимые одинаково распределенные случайные величины, но с, вообще говоря, другой функцией распределения G(x).

Разделяют однородность характеристик (равенство математических ожиданий, или медиан, или дисперсий и т.п.) и однородность (совпадение) функций распределения (абсолютную однородность). Во втором случае речь идет о проверке нулевой гипотезы:

Н0: F(x)=G(x) при всех х. Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой

Н1: F(x0)^CJ(x0) хотя бы при одном значении аргумента x0. Если гипотеза Н0 принята, то выборки можно объединить в одну, если нет - то нельзя.

Рассмотрим следующие статистические критерии, предназначенные для проверки однородности двух независимых выборок.

(1) Критерий Крамера-Уэлча Т, совпадающий при равенстве объемов выборок (т = п) с критерием Стьюдента / [15].

(2) Критерий Лорда, или модифицированный /-критерий [16, табл.3.10, с.42] со статистикой

2 x - у

Ь = -,-

Imax x. - min x +1 max y, - min y

\<i<m 1<i<m ' ^ 1£ j£n 1 1£ j£n J

(3) Критерий Вилкоксона (Манна-Уитни) ([16, табл.6.8, с.94]. [17]), основанный на статистике U - сумме рангов элементов первой выборки в общем вариационном ряду.

(4) Критерий Вольфовица (серий) V, основанный на количестве серий в общем (объединенном) вариационном ряду (серия - часть

последовательности, состоящая из элементов одной выборки) и разобранный в [16, табл.6.7].

(5) Критерий Ван-дер-Вардена [16, табл.6.9], основанный на статистике

к

х = у у

7=1 [ т + п +1]

где к - ранг г-го элемента первой выборки в общем вариационном ряду, ¥(г) - функция, обратная к функции стандартного нормального распределения Ф( х).

(6) Критерий Смирнова [16, 18], основанный на статистике

Я = Вш,п = Рт (х) - Оп (х)|

т,п

х

где Рт (х) - эмпирическая функция распределения, построенная по первой выборке, а Оп (х) - эмпирическая функция распределения, построенная по второй выборке.

(7) Критерий типа омега-квадрат [16, 18], предложенный Леманом [19] изученный впервые Розенблаттом [20], а потому называемый критерием Лемана-Розенблатта. Этот критерий основан на статистике

2 2 ОТ = О)' =

тп +¥

тп I V т

т + п

| Р (х) - Оп (х))2 ёИт+п (х)

где Ит+п (х) - эмпирическая функция распределения, построенная по объединенной выборке.

За пределами перечня остались многие критерии - хи-квадрат [21], Сэвиджа [22], знаков [23], основанные на последовательных рангах [24] и другие.

5. Постановка задачи изучения статистических критериев методом статистических испытаний

С помощью вычислительных экспериментов по изучению свойств критериев однородности двух выборок можно выяснить, при каких объемах выборок можно пользоваться предельными распределениями. Ясно, что ответ определяется заданной исследователем точностью (максимально возможным отклонением допредельного распределения от предельного на заданном отрезке или на всей прямой). Можно сравнивать критерии по мощности при тех или иных конкретных альтернативах (например, альтернативах сдвига или масштаба). Представляет интерес анализ "корреляции" критериев на основе изучения доли совпадающих решений по результатам проверки статистических гипотез с помощью этих критериев (эта задача допускает несколько вариантов постановок - можно сравнивать критерии при фиксированном уровне значимости, например, 0,05, можно использовать несколько уровней значимости, можно установить связь между достигаемыми уровнями значимости, ...).

Поскольку статистики ранговых критериев принимают лишь конечное число значений, то их распределения дискретны. Поэтому они "проскакивают" обычно используемые в таблицах [16, 23] номинальные уровни значимости - 0,01; 0,05; 0,1 и др. Особенно существенным это обстоятельство оказывается для статистик, принимающих небольшое число значений, таких, как статистика Смирнова: реальный уровень значимости статистического критерия может быть в несколько раз меньше номинального - например, равняться 0,02 вместо 0,05 [21, 25]. Сравнение непараметрических критериев затрудняется тем, что по указанной причине невозможно обеспечить совпадение их уровней значимости. Казалось бы, можно использовать рандомизированные критерии. Однако использование таких критериев не соответствует большинству практических задач, в которых проверяется однородность двух конкретных выборок, в то время

как рандомизированные критерии нацелены на обработку большого числа однотипных выборок фиксированных объемов.

Таким образом, многообразие перспективных вычислительных экспериментов обширно. Для обеспечения изучения свойств различных критериев проверки гипотез однородности нами совместно с Ю.Э. Камнем и Я.Э. Камнем разработан программный продукт, состоящий из четырех блоков: генерации равномерно распределенных на [0; 1] псевдослучайных чисел; вычисления на их основе псевдослучайных чисел с заданными законами распределения; блока расчета значений статистик критериев и блока сервисных и управляющих программ.

При моделировании использовался датчик равномерно распределенных на множестве {1,2,...,215 -1} псевдослучайных чисел [26], построенный на основе рекуррентной формулы

хп+1 =(1285хп + 6925^(2^), п = 1,2,... (1)

Тестирование [27] этого датчика с помощью критерия Колмогорова для выборок объема 5000 на уровне значимости 2,5% показало согласие с равномерным распределением. Поскольку далее гипотеза однородности проверяется при уровне значимости 0,05, то погрешность метода Монте-Карло оценивается как

Как отмечал акад. АН СССР Ю.В. Прохоров (1929 - 2013) на "неформальном обсуждении" проблем статистического моделирования, проведенном в рамках Первого Всемирного конгресса Общества математической статистики и теории вероятностей им. Бернулли [28], применения метода Монте-Карло можно разделить на два класса. В первом из них, появившемся исторически раньше, качество датчика определяется соответствием распределения даваемых датчиком псевдослучайных чисел заданному распределению, например, равномерному. Выполнения этого

условия достаточно, например, для вычисления многомерных интегралов. Именно этот класс применений обычно имеется в виду в литературе по методу Монте-Карло [29, 30]. Для применений из второго класса существенно обеспечить независимость псевдослучайных чисел, точнее, достаточное для успешного применения датчика приближение к независимости. Как показано в работах И.Г. Журбенко с соавторами [31 -33], датчики типа (1) принципиально не могут обеспечить независимость. Однако из расчетов Г.В. Рыдановой [34] следует, что последовательности из не более чем 24 псевдослучайных чисел, используемые для одного статистического испытания, есть основания рассматривать как модели последовательностей независимых случайных величин.

Коротко говоря, наша позиция по поводу метода Монте-Карло такова. Мы активно используем этот метод в научных исследованиях. В частности, для изучения скорости сходимости распределений статистик - в предельной теории помех, создаваемых электровозами [35], в теории люсианов [36], при изучении свойств критериев однородности [25]. Но одновременно отдаем себе отчет в недостатках этого инструмента и предостерегаем от его бездумного употребления [37].

Для постановки вычислительного эксперимента необходимо задать две функции распределения Г^) и О^) - функции распределения элементов двух выборок. Обоснованных теорией или практикой рекомендаций по выбору Г^) и О^) в настоящее время нет. Поэтому для поискового исследования будем использовать привычные нормальные распределения и распределения Вейбулла - Гнеденко.

Функция распределения Вейбулла - Гнеденко имеет вид

где а - параметр сдвига, Ь - параметр масштаба, с - параметр формы.

x > а.

0, x < а.

Нормально распределенные псевдослучайные числа находились методом обратной функции [38, с. 440, ф-ла (12.10)]. Распределение Вейбулла - Гнеденко моделировалось по [39, с.93].

6. Вычислительные эксперименты

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Приведем некоторые результаты изучения свойств критериев однородности двух независимых выборок в двух случаях:

Р(х) и О(х) - функции нормального распределения;

Р(х) и О(х) - функции распределения Вейбулла-Гнеденко - как с одинаковыми, так и с различными значениями параметров.

В первом случае первая выборка бралась из стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1, а вторая - из нормального распределения с математическим ожиданием т2 и дисперсией <с22, где значения т2 и с2 приведены в табл.1. Таблица 1. Проверка равенства математических ожиданий для выборок из нормальных распределений по критерию Крамера-Уэлча

Номер Объем Параметры Частота Вероятность Вероятность

вычислитель- выборок второй принятия принятия И0 принятия И0

ного т = п выборки нулевой (исходя из (исходя из

эксперимента т2 С2 гипотезы И0 распределения Стьюдента) нормального распределения)

1 6 0 1 0,969 0,974 0,950

2 7 0 1 0,954 0,971 0,950

3 8 0 1 0,956 0,968 0,950

4 10 0 1 0,958 0,961 0,950

5 6 1 1 0,596 0,691 0,592

6 6 1,5 1 0,366 0,356 0,262

7 8 2 1 0,048 0,032 0,021

8 12 3 1 0 0 0

9 6 0 1,5 0,948 0,974 0.950

10 8 0 2 0,938 0,968 0,950

11 6 0 3 0,930 0,974 0,950

12 10 0 3 0,934 0,961 0,950

Во втором случае параметр масштаба Ь функции распределения Вейбулла-Гнеденко во всех выборках принят равным 1. Первая выборка бралась (при всех экспериментах, кроме четырех) при а = 0 и с = 1, т.е. из экспоненциального распределения с функцией распределения

1 - ехр{- х}, х > 0, 0, х < 0.

Р (х) =

Вторая выборка бралась из распределений Вейбулла-Гнеденко с параметрами а, Ь = 1, с, приведенными в табл.2 (там же оговорены исключения).

Таблица 2. Проверка равенства математических ожиданий для выборок из распределений Вейбулла-Гнеденко по критерию Крамера-Уэлча

Номер Объем Параметры Частота Вероятность Вероятность

вычислитель- выборок второй принятия принятия Н0 принятия Н0

ного т = п выборки нулевой (исходя из (исходя из

эксперимента а с гипотезы распределения нормального

Н0 Стьюдента) распределения)

1 6 0 1 0,956 0,974 0,950

2 10 0 1 0,954 0,961 0,950

3 6 0,5 1 0,828 0,912 0,861

4 8 0,5 1 0,772 0,874 0,829

5 10 0,5 1 0,750 0,837 0,800

6 6 1 1 0,750 0,689 0,592

7 8 1 1 0,450 0,558 0,484

8 10 1 1 0,348 0,446 0,313

9 6 0 1,5 0,950 0,971 0,946

10 8 0 1,5 0,950 0,963 0,946

11 10 0 1,5 0,956 0,958 0,942

12 6 0 2 0,940 0,949 0,943

13 8 0 2 0,944 0,954 0,938

14 10 0 2 0,928 0,949 0,935

15 12 0 2 0,944 0,950 0,935

16 8 0 3 0,930 0,961 0,942

17 12 0 3 0,942 0,949 0,935

18 6 0 5 0,904 0,971 0,945

19 8 0 5 0,910 0,963 0,944

20 10 0 5 0,920 0,958 0,943

21 12 0 5 0,940 0,955 0,941

22 8 0 1 0,928 0,968 0,950

23* 6 0 3 0,946 0,974 0,950

24* 10 0 3 0,928 0,961 0,950

25* 6 0,5 3 0,292 0,553 0,447

26* 10 0,5 3 0,094 0,273 0,228

27 6 0,5 3 0,690 0,905 0,850

28 10 0,5 3 0,676 0,826 0,781

* В экспериментах 23 - 26 первая выборка взята из распределения

Вейбулла-Гнеденко с параметрами а = 0, Ь = 1, с = 3.

Выбор распределений для экспериментов определяется наряду с желанием сравнить свойства статистик на выборках из нормального семейства распределений, для которых статистики Стьюдента и Крамера-Уэлча имеют определенные оптимальные свойства, так и желанием рассмотреть класс распределений, существенно отличающихся от нормальных, в частности, несимметричностью. Экспоненциальное распределение часто используют при изучении показателей надежности [40], поэтому оно и было включено в эксперименты.

Из семи перечисленных в п.4 критериев однородности критерий Вольфовица (серий), как установлено, имеет малую мощность. Поэтому его исключение из дальнейших рассмотрений не приводит к отрицательным последствиям.

В табл.3 приведены результаты экспериментов для выборок из нормальных распределений. Табл. 3 соответствует табл. 1 - при совпадающих номерах речь идет об одних и тех же экспериментах. В табл. 4 для облегчения анализа свойств критериев приведены относительные мощности критериев по отношению к критерию Крамера-Уэлча (совпадающего с критерием Стьюдента в рассматриваемых экспериментах). В табл. 4 стоят отношения двух случайных величин -оценки мощности рассматриваемого критерия, полученной по 5000 испытаниям, к оценке мощности критерия Крамера-Уэлча.

В табл. 5 приведены результаты экспериментов для выборок из распределений Вейбулла-Гнеденко. Табл. 5 соответствует табл. 2 - при совпадающих номерах речь идет об одних и тех же экспериментах.

Таблица 3. Частоты принятия гипотезы однородности для выборок из нормальных распределений

№ Объем выборок т = п Параметры второй выборки Частоты принятия нулевой гипотезы Н0 для критериев

1 2 3 5 6 7

т2 г Ь и X

1 6 0 1 0,969 0,970 0,976 0,976 0,982 0,976

2 7 0 1 0,954 0,968 0,986 0,964 1,00 0,956

3 8 0 1 0,956 0,958 0,50 0,954 0,994 0,944

4 10 0 1 0,958 0,960 0,974 0,972 0,998 0,958

5 6 1,0 1 0,596 0,624 0,680 0,698 0,754 0,690

6 6 1,5 1 0,366 0,390 0,464 0,474 0,616 0,496

7 8 2,0 1 0,048 0,054 0,064 0,078 0,480 0,084

8 12 3,0 1 0 0 0 0 0 0

9 6 0 1,5 0,948 0,952 0,974 0,976 0,980 0,972

10 8 0 2,0 0,938 0,940 0,930 0,950 0,998 0,904

11 6 0 3,0 0,930 0,924 0,950 0,956 0,934 0,920

12 10 0 3,0 0,934 0,902 0,930 0,946 0,988 0,846

Таблица 4. Мощность критериев относительно критерия Крамера-Уэлча (для экспериментов №№ 5-12 в табл. 1 и 3)

№ Относительная мощность критериев

экспе риме нта 2 3 5 6 7

L U X 5 а2

5 0,931 0,792 0,748 0,609 0,767

6 0,727 0,739 0,783 0,000 0,957

7 0,993 0,983 0,968 0,546 0,962

8 1,000 1,000 1,000 1,000 1,000

9 0,923 0,500 0,460 0,385 0,538

10 0,806 1.129 0,806 0,030 1,548

11 1,086 0,714 0,629 0,943 1.140

12 1,485 1,061 0,818 0,182 2,323

Таблица 5. Частоты принятия гипотезы однородности для выборок из распределений Вейбулла-Гнеденко

№ Частоты принятия нулевой гипотезы Н0 для критериев

1 2 3 5 6 7

г L и X 5 а)2

1 0,956 0,942 0,964 0,968 0,964 0,960

2 0,966 0,940 0,956 0,962 0,998 0,952

3 0,828 0,818 0,840 0,858 0,878 0,840

4 0,772 0,764 0,720 0,746 0,974 0,698

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 0,750 0,724 0,678 0,668 0,962 0,634

6 0,528 0,514 0,534 0,586 0,552 0,482

7 0,450 0,432 0,354 0,392 0,756 0,336

8 0,348 0,344 0,268 0,272 0,662 0,206

9 0,950 0,934 0,958 0,958 0,974 0,958

10 0,950 0,936 0,946 0,954 1,000 0,950

11 0,956 0,934 0,954 0,956 1,000 0,946

12 0,940 0,934 0,962 0,970 0,960 0,952

13 0,944 0,922 0,930 0,972 0,984 0,958

14 0,928 0,900 0,930 0,932 0,990 0,894

15 0,944 0,918 0,938 0,944 0,932 0,898

16 0,930 0,906 0,906 0,924 0,986 0,884

17 0,942 0,908 0,910 0,930 0,816 0,786

18 0,904 0,886 0,934 0,946 0,876 0,866

19 0,910 0,872 0,866 0,896 0,972 0,790

20 0,920 0,872 0,874 0,920 0,968 0,714

21 0,940 0,886 0,862 0,908 0,662 0,606

22 0,928 0,908 0,944 0,952 0,998 0,944

23 0,946 0,948 0,964 0,966 0,978 0,970

24 0,928 0,934 0,948 0,944 0,998 0,936

25 0,292 0,312 0,392 0,408 0,578 0,430

26 0,094 0,100 0,142 0,132 0,654 0,144

При анализе табл. 3 и 5 необходимо иметь в виду отличие реальных уровней значимости ар от номинальных ан (см. [25]). Особенно это

касается критерия Смирнова. Различие между собой реальных уровней значимости у свободных от распределения статистик делает трудным сравнение между собой критериев по мощности - такое сравнение

желательно проводить при одном и том же уровне значимости, но это невозможно.

Как и должно быть согласно теории математической статистики [41], для выборок из нормального распределения наиболее мощным оказался критерий Крамера-Уэлча (Стьюдента). Близким к нему по мощности оказались критерий Лорда и критерий типа омега-квадрат. Отметим; критерий Лорда использует размахи, а потому неустойчив к засорениям на "хвостах"; следовательно, возможность его использования при анализе реальных данных в каждом конкретном случае требует специального обоснования. Критерии Вилкоксона и Ван-дер-Вардена также имеют высокую мощность, особенно в экспериментах №№ 6,8. Малая мощность

критерия Смирнова объясняется, видимо, отличием а от ан.

Другая картина наблюдается при изменении дисперсии. Критерии Крамера-Уэлча и Лорда слабо реагируют на нее. Еще меньше реагируют линейные ранговые статистики и и X. Критерий Вилкоксона не может, даже асимптотически, различить нормальные совокупности с одинаковыми математическими ожиданиями, но разными дисперсиями [17]. Обращает на себя внимание высокая мощность критерия омега-квадрат (см. табл.4, эксперименты №№ 10 - 12).

Для выборок из распределений Вейбулла-Гнеденко картина несколько иная. Если распределения отличаются только сдвигом (эксперименты №№ 3 - 8), то наибольшую мощность имеет критерий омега-квадрат, затем идут критерии Вилкоксона и Ван-дер-Вардена, после них - критерии Стьюдента и Лорда, наименьшая мощность у критерия Смирнова. Если же изменяется также и параметр формы (см., например, эксперимент № 21), то наибольшая мощность также у критерия омега-

квадрат, следующим является критерий Смирнова (с учетом отличия ар от

а). Заметно также существенное возрастание мощности с ростом объемов выборок и увеличением различия параметров.

На основе анализа таблиц 3 - 5 можно сформулировать, с понятными оговорками, следующие практические рекомендации.

A. Для проверки гипотезы абсолютной однородности (гипотезы совпадения функций распределения двух выборок) целесообразно использовать критерий Лемана - Розенблатта типа омега-квадрат [18] - во всех случаях.

Б. Если есть основания предполагать, что распределения отличаются в основном сдвигом, то целесообразно использовать линейные ранговые критерии Вилкоксона и Ван-дер-Вардена. Однако даже в этом случае критерий омега-квадрат может оказаться более мощным.

B. Из рассмотренных критериев для проверки гипотезы

однородности в общем случае, кроме критерия а2, можно использовать критерий Смирнова - с учетом отличия реального уровня значимости от номинального.

7. Частота совпадений статистических выводов по разным критериям

По итогам обработки данных с помощью определенного критерия однородности принимают одно из двух решений; "гипотеза однородности отклоняется" или "гипотеза однородности не отклоняется". Решения по разным критериям могут не совпадать. Насколько часты расхождения?

Были изучены доли (в %) расхождений решений по критериям L,

2

и,Х, 5, а с решениями по критерию Крамера-Уэлча. Для описания полученных результатов введены "зоны". Пусть гп - критическое значение для критерия Крамера-Уэлча, соответствующее уровню значимости а = 0,05 и объему выборок т = п. Используется абсолютное значение

статистики критерия Крамера-Уэлча. Введено 8 зон: 1 - [0; „4), 2 - [/„/4; ¿и/2), 3 - [„2; 3„4), 4 - [3„4; г„), 5 - [„ 5„4), 6 - [5„4; 3„2), 7 - [3„2; 7„4), 8 - [7/„/4; ).

В качестве примера проведенных исследований приведем в табл. 6 данные по вычислительному эксперименту № 19 для выборок из распределений Вейбулла - Гнеденко (см. табл. 2). В строке "Т (частота попадания в зону)" приведено асимптотическое распределение статистики Крамера - Уэлча (сгруппированное по зонам). В каждой строке, соответствующей определенному критерию, для каждой зоны указана доля совпадений решений по этому критерию с решением по критерию Крамера - Уэлча.

2

Таблица 6. Доли совпадений решений по критериям Ь, и, X, Б, а

с решениями по критерию Крамера-Уэлча Т (эксперимент № 19)

Критерии Доля принятия Н0 по Т Зоны

1 2 3 4 5 6 7 8

Т (частота попадания в зону) 0,910 0,362 0,274 0,194 0,080 0,042 0,022 0,008 0,018

Ь 0,872 1 1 0,979 0,575 1 1 1 1

и 0,866 0,956 0,978 0,897 0,775 0,562 0,937 1 1

X 0,896 0,978 0,978 0,928 0,900 0,500 0,875 1 1

Б 0,972 1 0,985 0,990 1 0,125 0,125 0,750 0,555

а)2 0,790 0,889 0,927 0,835 0,600 0,875 1 1 1

В качестве второго примера в табл. 7, построенной аналогично табл. 6, приведена сводка для экспериментов №№ 1-21 с выборками из

распределений Вейбулла-Гнеденко. Табл.8 содержит информацию о

2

расхождениях (в %) решений по критериям Ь, и,Х, Б, а с решениями по критерию Крамера-Уэлча.

Таблица 7. Сводка для выборок из распределений Вейбулла-Гнеденко (эксперименты №№ 1-21). Проценты расхождений с решениями по критерию Крамера-Уэлча.

Критерии Зоны

1 2 3 4 5 6 7 8

Ь 0 0 0,9 24,4 6,6 0 0 0

и 1,1 2,2 5,8 22,5 30,7 3,0 0,4 0

X 0,5 1,3 3,5 17,7 34,6 6,2 1,2 0,3

Б 3,3 3,4 4,4 10,4 77,8 60,3 46,0 17,0

со2 6,5 6,6 11,8 29,5 30,7 2,5 0 0

2

Таблица 8. Расхождения (в %) решений по критериям Ь, и,Х, Б, с с решениями по критерию Крамера-Уэлча.

По критерию Крамера-Уэлча По другим критериям

Ь и X Б со2

Принято 84,6%, из них отвергнуто 3,2 5,1 3,5 4,5 10,5

Отвергнуто 15,4%, из них принято 2,7 13,1 15,8 56,5 12,9

Проверено 100%, из них расхождений 3,1 6,3 5,4 12,4 10,9

По сравнению с критерием Крамера -Уэлча, % - 2,3 - 2,3 - 0,5 + 4,9 - 6,9

Из полученных результатов можно сделать ряд выводов. Наибольший процент расхождений приходится на зоны № 4 (от 10.4% до 29,5% по табл. 7) и № 5 (от 6,6% до 77,8%), что естественно, т.к. при переходе от зоны 4 к зоне № 5 и происходит изменение решения по критерию Крамера-Уэлча. Обратим внимание, что расхождения имеются и в зоне №1 - для 6,5% экспериментов, попавших в эту зону, критерий

Лемана - Розенблатта отвергает нулевую гипотезу (т.е. во всех этих случаях гипотеза однородности неверна). Вместе с тем нет ни одного случая, когда бы этот критерий принял гипотезу для экспериментов из зон

7, 8. Другими словами, если критерий Крамера - Уэлча отклоняет нулевую

2

гипотезу с Т > 3,0, то критерий а также отклоняет гипотезу однородности.

Наибольшее расхождение с критерием Крамера - Уэлча наблюдается у критерия Смирнова, в основном за счет принятия гипотезы в случае, когда Т - критерий ее отверг. Это во многом объясняется существенным а а

различием р и н для критерия Смирнова. Почти такое же суммарное число расхождений у критерия Лемана-Розенблатта, но причина иная - у этого критерия выше мощность, чем у критерия Крамера - Уэлча.

Наиболее близок к Г-критерию критерий Лорда. Это подтверждается тем, что расхождения имеются лишь в зонах 4 и 5, и незначительное(0,9%) - в зоне 3.

По числу расхождений критерии Вилкоксона и Ван-дер-Вардена занимают промежуточное положение, они вдвое ближе к статистике Лорда, чем к критериям Смирнова и омега-квадрат. При этом критерий Ван-дер-Вардена ближе к Г-критерию, чем критерий Вилкоксона, чего и следовало ожидать, учитывая нацеленность критерия Ван-дер-Вардена на применение к распределениям, близким к нормальным.

При справедливости гипотезы однородности расхождения не превышают 2,2 - 3,2% и проявляются в зонах 3 - 6. При альтернативе

изменения параметра формы расхождения возрастают лишь для критериев

2

Смирнова и а (до 8,4 - 9,9%), оставаясь в пределах 3,0 - 4,7% для остальных критериев, слабо реагирующих на эту альтернативу. При альтернативе сдвига расхождения резко возрастают (до 11,3% у критерия Вилкоксона, 10,2% - у критерия Ван-дер-Вардена, 24,4% - у критерия

2

Смирнова, 15,8% - у критерия с ), оставаясь малыми (3,7%) лишь у критерия Лорда.

Можно сделать и ряд других выводов, например, проследить зависимость от объемов выборок и различия параметров. Проведенный нами более детальный анализ подтверждает сформулированные выше практические рекомендации А. Б, В (завершение раздела 6).

Обращает на себя внимание наличие значительного процента расхождений между решениями, принимаемыми по разным критериям. Этот факт необходимо учитывать при обработке конкретных данных в прикладных исследованиях и при разработке нормативно-технической и методической документации, программных продуктов и экспертных систем. В частности, в соответствии с общей теорией устойчивости [42] целесообразно анализировать данные одновременно с помощью нескольких критериев проверки гипотезы однородности двух независимых выборок и затем исходить из выводов, инвариантных относительно выбора критерия.

Литература

1. Горский В.Г., Орлов А.И. Математические методы исследования; итоги и перспективы // Заводская лаборатория. Диагностика материалов. 2002. Т.68. №1. С.108-112.

2. Орлов А.И. Новая парадигма прикладной статистики // Заводская лаборатория. Диагностика материалов. 2012. Т.78. №1. С. 87-93.

3. Орлов А.И. О новой парадигме математических методов исследования // Научный журнал КубГАУ. 2016. №122. С. 807-832.

4. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика.-Краснодар, КубГАУ. 2014. - 600 с.

5. Орлов А.И. Развитие математических методов исследования (2006 - 2015 гг.) // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №1. Ч.1. С. 78-86.

6. Колмогоров А.Н. Теория информации и теория алгоритмов. - М. Наука, 1987.

- 304 с.

7. Григорьев Ю.Д. Метод Монте-Карло; вопросы точности асимптотических решений и качества генераторов псевдослучайных чисел // Заводская лаборатория. Диагностика материалов. 2016. Т.82. №7. С. 72-84.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Орлов А.И. Предельные теоремы и метод Монте-Карло // Заводская лаборатория. Диагностика материалов. 2016. Т.82. №7. С. 67-72.

9. Кутузов О.И., Татарникова Т.М. Из практики применения метода Монте-Карло // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №3. С. 65-70.

10. Аронов И.З., Максимова О.В. Анализ времени достижения консенсуса в работе технических документов по стандартизации по результатам статистического моделирования // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №3. С. 71-77.

11. Орлов А.И. Консенсус и истина (комментарий к опубликованной выше статье И.З. Аронова и О.В. Максимовой) // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №3. С. 78-79.

12. Орлов А.И. Значение информационно-коммуникационных технологий для математических методов исследования // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №7. С. 5-6.

13. Жуков М.С. Об алгоритмах расчета медианы Кемени // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №7. С. 72-78.

14. Гадолина И.В., Лисаченко Н.Г. Разработка метода построения доверительных интервалов для процентилей случайной выборки прочности композитов с применением бутстреп-моделирования // Заводская лаборатория. Диагностика материалов. 2017. Т.83. №11. С. 73-77.

15. Орлов А.И. О проверке однородности двух независимых выборок // Заводская лаборатория. Диагностика материалов. 2003. Т.69. №1. С.55-60.

16. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики / 3 изд. - М.: Наука, 1983. - 416 с.

17. Орлов А.И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? // Заводская лаборатория. Диагностика материалов. 1999. Т.65. № 1. С.51-55.

18. Орлов А.И. Состоятельные критерии проверки абсолютной однородности независимых выборок // Заводская лаборатория. Диагностика материалов. 2012. Т.78. №11. С.66-70.

19. Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests // Ann. Math. Statist. 1951. V.22. N 2. P.165-179.

20. Rosenblatt M. Limit theorems associated with variants of the von Mises statistic // Ann. Math. Statist. 1952. V.23. N 4. P.617-623.

21. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч.3. Статистические методы анализа данных. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2012. - 624 с.

22. Гаек Я., Шидак З. Теория ранговых критериев. - М.: Наука, 1971. - 374 с.

23. Холлендер М., Вулф Д. Непараметрические методы статистики. - М. : Финансы и статистика, 1983. - 520 с.

24. Парджанадзе А.М., Хмаладзе Э.В. Об асимптотической теории статистик от последовательных рангов // Теория вероятностей и её применения. 1986. Т.ХХХ1. Вып.4. С. 758-772.

25. Орлов А.И. Реальные и номинальные уровни значимости при проверке статистических гипотез // Научный журнал КубГАУ. 2015. № 114. С. 42-54.

26. Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений. - М.: Мир, 1980. - 144 с.

27. Шеннон Р. Имитационное моделирование систем: Искусство и наука. -М.: Мир, 1978. - 418 с.

28. Орлов А.И. Первый Всемирный конгресс Общества математической статистики и теории вероятностей им. Бернулли // Заводская лаборатория. Диагностика материалов. 1987. Т.53. №3. С.90-91.

29. Ермаков С.М. Метод Монте-Карло и смежные вопросы. - М.: Наука, 1971.

- 328 с.

30. Ермаков С.М., Михайлов Г.А. Статистическое моделирование. - М.: Наука, 1982. - 296 с.

31. Журбенко И.Г., Кожевникова И.А., Клиндухова О.В. Определение критической длины последовательности псевдослучайных чисел // Вероятностно-статистические методы исследования. - М.: МГУ им. М.В. Ломоносова, 1983. - С.18-39.

32. Журбенко И.Г., Кожевникова И.А., Смирнова О.С. О построении и исследовании псевдослучайных последовательностей различными методами // Заводская лаборатория. Диагностика материалов. 1985. Т.51. № 5. С. 47-51.

33. Журбенко И.Г. Анализ стационарных и однородных случайных систем. -М.: МГУ им. М.В. Ломоносова, 1987. - 240 с.

34. Рыданова Г.В. Методика изучения временных зависимостей в последовательностях псевдослучайных чисел // Заводская лаборатория. Диагностика материалов. 1986. Т.52. № 1. С. 56-58.

35. Орлов А.И. Вероятностно-статистическое моделирование помех, создаваемых электровозами // Научный журнал КубГАУ. 2015. № 106. С. 225 - 238.

36. Орлов А.И. Теория люсианов // Научный журнал КубГАУ. 2014. № 101. С. 275 - 304.

37. Орлов А.И. О реальных возможностях бутстрепа как статистического метода // Заводская лаборатория. Диагностика материалов. 1987. Т.53. № 10. С. 82-85.

38. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983. - 472 с.

39. Хастингс Н., Пикок Дж. Справочник по статистическим распределениям.

- М.: Статистика, 1980. — 95 с.

40. Фомин В.Н. Нормирование показателей надежности. - М.: Изд-во стандартов, 1986. - 140 с.

41. Кокс Д., Хинкли Д. Теоретическая статистика. - М.: Мир, 1978. - 560 с.

42. Орлов А.И. Устойчивые математические методы и модели // Заводская лаборатория. Диагностика материалов. 2010. Т.76. № 3. С. 59-67.

References

1. Gorskij V.G., Orlov A.I. Matematicheskie metody issledovaniya: itogi i perspektivy // Zavodskaya laboratoriya. Diagnostika materialov. 2002. T.68. №1. S.108-112.

2. Orlov A.I. Novaya paradigma prikladnoj statistiki // Zavodskaya laboratoriya. Diagnostika materialov. 2012. T.78. №1. S. 87-93.

3. Orlov A.I. O novoj paradigme matematicheskih metodov issledovaniya // Nauchnyj zhurnal KubGAU. 2016. №122. S. 807-832.

4. Orlov A.I., Lucenko E.V. Sistemnaya nechetkaya interval'naya matematika.-Krasnodar, KubGAU. 2014. - 600 s.

5. Orlov A.I. Razvitie matematicheskih metodov issledovaniya (2006 - 2015 gg.) // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №1. CH.1. S. 78-86.

6. Kolmogorov A.N. Teoriya informacii i teoriya algoritmov. - M. Nauka, 1987. -

304 s.

7. Grigor'ev YU.D. Metod Monte-Karlo: voprosy tochnosti asimptoticheskih reshenij i kachestva generatorov psevdosluchajnyh chisel // Zavodskaya laboratoriya. Diagnostika materialov. 2016. T.82. №7. S. 72-84.

8. Orlov A.I. Predel'nye teoremy i metod Monte-Karlo // Zavodskaya laboratoriya. Diagnostika materialov. 2016. T.82. №7. S. 67-72.

9. Kutuzov O.I., Tatarnikova T.M. Iz praktiki primeneniya metoda Monte-Karlo // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №3. S. 65-70.

10. Aronov I.Z., Maksimova O.V. Analiz vremeni dostizheniya konsensusa v rabote tekhnicheskih dokumentov po standartizacii po rezul'tatam statisticheskogo modelirovaniya // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №3. S. 7177.

11. Orlov A.I. Konsensus i istina (kommentarij k opublikovannoj vyshe stat'e I.Z. Aronova i O.V. Maksimovoj) // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №3. S. 78-79.

12. Orlov A.I. Znachenie informacionno-kommunikacionnyh tekhnologij dlya matematicheskih metodov issledovaniya // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №7. S. 5-6.

13. ZHukov M.S. Ob algoritmah rascheta mediany Kemeni // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №7. S. 72-78.

14. Gadolina I.V., Lisachenko N.G. Razrabotka metoda postroeniya doveritel'nyh intervalov dlya procentilej sluchajnoj vyborki prochnosti kompozitov s primeneniem butstrep-modelirovaniya // Zavodskaya laboratoriya. Diagnostika materialov. 2017. T.83. №11. S. 73-77.

15. Orlov A.I. O proverke odnorodnosti dvuh nezavisimyh vyborok // Zavodskaya laboratoriya. Diagnostika materialov. 2003. T.69. №1. S.55-60.

16. Bol'shev L.N., Smirnov N.V. Tablicy matematicheskoj statistiki / 3 izd. - M.: Nauka, 1983. - 416 s.

17. Orlov A.I. Kakie gipotezy mozhno proveryat' s pomoshch'yu dvuhvyborochnogo kriteriya Vilkoksona? // Zavodskaya laboratoriya. Diagnostika materialov. 1999. T.65. № 1. S.51-55.

18. Orlov A.I. Sostoyatel'nye kriterii proverki absolyutnoj odnorodnosti nezavisimyh vyborok // Zavodskaya laboratoriya. Diagnostika materialov. 2012. T.78. №11. S.66-70.

19. Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests // Ann. Math. Statist. 1951. V.22. N 2. P.165-179.

20. Rosenblatt M. Limit theorems associated with variants of the von Mises statistic // Ann. Math. Statist. 1952. V.23. N 4. P.617-623.

21. Orlov A.I. Organizacionno-ekonomicheskoe modelirovanie : uchebnik : v 3 ch. CH.3. Statisticheskie metody analiza dannyh. - M.: Izd-vo MGTU im. N.E. Baumana, 2012. -624 s.

22. Gaek YA., SHidak Z. Teoriya rangovyh kriteriev. - M.: Nauka, 1971. - 374 s.

23. Hollender M., Vulf D. Neparametricheskie metody statistiki. - M. : Finansy i statistika, 1983. - 520 s.

24. Pardzhanadze A.M., Hmaladze E.V. Ob asimptoticheskoj teorii statistik ot posledovatel'nyh rangov // Teoriya veroyatnostej i eyo primeneniya. 1986. T.XXXI. Vyp.4. S. 758-772.

25. Orlov A.I. Real'nye i nominal'nye urovni znachimosti pri proverke statisticheskih gipotez // Nauchnyj zhurnal KubGAU. 2015. № 114. S. 42-54.

26. Forsajt Dzh., Mal'kol'm M., Mouler K. Mashinnye metody matematicheskih vychislenij. - M.: Mir, 1980. - 144 s.

27. SHennon R. Imitacionnoe modelirovanie sistem: Iskusstvo i nauka. - M.: Mir, 1978. - 418 s.

28. Orlov A.I. Pervyj Vsemirnyj kongress Obshchestva matematicheskoj statistiki i teorii veroyatnostej im. Bernulli // Zavodskaya laboratoriya. Diagnostika materialov. 1987. T.53. №3. S.90-91.

29. Ermakov S.M. Metod Monte-Karlo i smezhnye voprosy. - M.: Nauka, 1971. -

328 s.

30. Ermakov S.M., Mihajlov G.A. Statisticheskoe modelirovanie. - M.: Nauka, 1982. - 296 s.

31. ZHurbenko I.G., Kozhevnikova I.A., Klinduhova O.V. Opredelenie kriticheskoj dliny posledovatel'nosti psevdosluchajnyh chisel // Veroyatnostno-statisticheskie metody issledovaniya. - M.: MGU im. M.V. Lomonosova, 1983. - S.18-39.

32. ZHurbenko I.G., Kozhevnikova I.A., Smirnova O.S. O postroenii i issledovanii psevdosluchajnyh posledovatel'nostej razlichnymi metodami // Zavodskaya laboratoriya. Diagnostika materialov. 1985. T.51. № 5. S. 47-51.

33. ZHurbenko I.G. Analiz stacionarnyh i odnorodnyh sluchajnyh sistem. - M.: MGU im. M.V. Lomonosova, 1987. - 240 s.

34. Rydanova G.V. Metodika izucheniya vremennyh zavisimostej v posledovatel'nostyah psevdosluchajnyh chisel // Zavodskaya laboratoriya. Diagnostika materialov. 1986. T.52. № 1. S. 56-58.

35. Orlov A.I. Veroyatnostno-statisticheskoe modelirovanie pomekh, sozdavaemyh elektrovozami // Nauchnyj zhurnal KubGAU. 2015. № 106. S. 225 - 238.

36. Orlov A.I. Teoriya lyusianov // Nauchnyj zhurnal KubGAU. 2014. № 101. S. 275 - 304.

37. Orlov A.I. O real'nyh vozmozhnostyah butstrepa kak statisticheskogo metoda // Zavodskaya laboratoriya. Diagnostika materialov. 1987. T.53. № 10. S. 82-85.

38. Ajvazyan S.A., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika. Osnovy modelirovaniya i pervichnaya obrabotka dannyh. - M.: Finansy i statistika, 1983. - 472 s.

39. Hastings N., Pikok Dzh. Spravochnik po statisticheskim raspredeleniyam. - M.: Statistika, 1980. — 95 s.

40. Fomin V.N. Normirovanie pokazatelej nadezhnosti. - M.: Izd-vo standartov, 1986. - 140 s.

41. Koks D., Hinkli D. Teoreticheskaya statistika. - M.: Mir, 1978. - 560 s.

42. Orlov A.I. Ustojchivye matematicheskie metody i modeli // Zavodskaya laboratoriya. Diagnostika materialov. 2010. T.76. № 3. S. 59-67.

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Похожие темы научных работ по математике , автор научной работы — Орлов Александр Иванович

APPLICATION OF THE MONTE-CARLO METHOD WHEN STUDYING THE PROPERTIES OF STATISTICAL TESTS OF HOMOGENEITY OF TWO INDEPENDENT SAMPLES

Текст научной работы на тему «Применение метода Монте-Карло при изучении свойств статистических критериев однородности двух независимых выборок»