Научная статья на тему 'Степенная регрессия на примере третьего закона Кеплера'

Степенная регрессия на примере третьего закона Кеплера Текст научной статьи по специальности «Математика»

CC BY
789
230
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОРМУЛА ТРЕТЬЕГО ЗАКОНА КЕПЛЕРА / ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ / НОРМАЛЬНЫЕ УРАВНЕНИЯ / ДИФФЕРЕНЦИРОВАНИЕ / ДИСПЕРСИОННЫЙ АНАЛИЗ / ЭКСТРАПОЛЯЦИЯ / ЧИСЛО ЭЙЛЕРА / СТАТИСТИЧЕСКАЯ НАДЁЖНОСТЬ / F-СТАТИСТИКА / ИНТЕРПОЛИРОВАНИЕ ВЕРОЯТНОСТЕЙ / FORMULA OF KEPLER''S THIRD LAW / FUNCTIONAL EQUATION / NORMAL EQUATION / DIFFERENTIATION / ANALYSIS OF VARIANCE / EXTRAPOLATION / EULER NUMBER / STATISTICAL RELIABILITY / F-STATISTICS / INTERPOLATION OF PROBABILITIES

Аннотация научной статьи по математике, автор научной работы — Таенват Михаил Михайлович

В статье исследуется степенная регрессия. Представлены четыре способа вывода функционального уравнения из нормальных уравнений; получение нормальных уравнений из функционального уравнения путём дифференцирования; дисперсионный анализ; экстраполяция в степенной регрессии; повышение точности формулы третьего закона Кеплера; число Эйлера; статистическая надёжность, F-статистика; интерполирование вероятностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Power regression as an example of the third law of Kepler Planets

All about Power regression: four ways to display a functional equation of the normal equations; obtain the normal equations from the functional equation by differentiating; analysis of variance; extrapolation of the power of the regression improve the accuracy of the formula Kepler's third law; Euler number; statistical reliability, F-statistics; interpolation of probabilities.

Текст научной работы на тему «Степенная регрессия на примере третьего закона Кеплера»

УДК 311+ 311.214

М. М. Таенват1

Владивостокский государственный университет экономики и сервиса Владивосток. Россия

Степенная регрессия на примере третьего закона Кеплера

В статье исследуется степенная регрессия. Представлены четыре способа вывода функционального уравнения из нормальных уравнений; получение нормальных уравнений из функционального уравнения путём дифференцирования; дисперсионный анализ; экстраполяция в степенной регрессии; повышение точности формулы третьего закона Кеплера; число Эйлера; статистическая надёжность, F-статистика; интерполирование вероятностей.

Ключевые слова и словосочетания: формула третьего закона Кеплера, функциональное уравнение, нормальные уравнения, дифференцирование, дисперсионный анализ, экстраполяция, число Эйлера, статистическая надёжность, F-статистика, интерполирование вероятностей.

M. M. Taenvat

Vladivostok State University of Economics and Service Vladivostok. Russia

Power regression as an example of the third law of Kepler Planets

All about Power regression: four ways to display a functional equation of the normal equations; obtain the normal equations from the functional equation by differentiating; analysis of variance; extrapolation of the power of the regression improve the accuracy of the formula Kepler's third law; Euler number; statistical reliability, F-statistics; interpolation of probabilities.

Keywords: formula of Kepler's third law, functional equation, normal equation, differentiation, analysis of variance, extrapolation, Euler number, statistical reliability, F-statistics, interpolation of probabilities.

Использование регрессии в физике небесных тел. Устойчивое отношение к статистике как к скучному предмету поможет изменить данная статья. В сознании большинства статистика предстает лишь одной стороной - подсчётом изготовленных изделий, съеденных продуктов и т.п. Но когда такие подсчёты могут привести к открытию мирового значения, статистика захватывает дух!

1 Таенват Михаил Михайлович - аспирант кафедры государственного и муниципального управления института права и управления ВГУЭС; e-mail: hh.dd.00@mail.ru.

75

Кеплер Джон, немецкий математик, астроном, механик, оптик и астролог, первооткрыватель законов движения планет Солнечной системы, открыл третий закон движения планет, за что ныне мог бы получить Нобелевскую премию... Сейчас мы можем за полчаса повторить его путь, уяснив, как это было.

Автор статьи «Законы Кеплера» Крис Импи [10] отметил: «Законы Кеплера применяются к любому орбитальному движению, будь то планеты вокруг Солнца, Луны вокруг Земли или звезды вокруг центра галактики. Второй и третий законы были результатом попыток Кеплера найти закономерности в орбитах планет. Второй и третий законы Кеплера изучают математические отношения между расстоянием планеты от Солнца и скорости её движения вокруг Солнца. Оба они являются последствиями применения закона всемирного тяготения Ньютона и закона сохранения момента импульса объекта, движущегося по эллиптической траектории, но Кеплер удивительно смог получить их без любого из этих понятий!».

Но суть и в том, что количественные действия в любых предметах после математической обработки могут обернуться важным открытием и для Вас. Каких же любых предметах? Л. Закс производил подсчёты в медико-биологической лаборатории, Вы же можете считать в любой иной лаборатории. Л. Закс пишет: «Для оценивания параметров по выборочным данным разработаны многочисленные методы. Особое значение имеет метод максимального правдоподобия (Р.А. Фишер); это универсальный метод максимального оценивания неизвестных параметров, применимый в случаях, когда вид функции распределения известен; оценки неизвестных параметров в этом случае равны значениям, при которых полученная выборка имеет максимальную вероятность появления, т. е. в качестве оценок отыскиваются значения, максимизирующие функцию максимального правдоподобия для параметров, в предположении, что эти параметры существуют. Этот метод построения точечных оценок параметров находится в тесной связи с методом наименьших квадратов» [2. С. 71-72].

Мэтьюз и Финк [3] приводят прекрасный пример использования уравнения регрессии: «Техника численного анализа в науке и в инженерном деле часто применяется для вычерчивания графиков экспериментальных данных. В 1601 г. немецкий астроном Джон Кеплер (Johannes Kepler) сформулировал третий закон движения планет, где x - расстояние до Солнца, измеряемое в миллионах километров, Т - период прохождения по орбите в днях и С - постоянная. Наблюдения пар данных (x, T) для первых четырёх планет, Меркурия, Венеры, Земли и Марса дали итоги (58; 88), (108; 225), (150; 365), (228; 687); коэффициент С, полученный методом наименьших квадратов, равен С=0,199769... В этом случае функция имеет вид».

Авторы приводят степенную подгонку: «Предположим, что точек с различными абсциссами».

N

Е (А) = £ (Ахм - у)2.

к=1

Поскольку имеем лишь одну переменную А, взятие частных производных не требуется.

Е( А) = £

N

к=1

и2, если и = Ахм - у. Отсюда — = £ 1х А" х хм - 0 = £м; ^^ = £ 2м1.

йА к=1 к=1 йи

к=1

N

к=1

Соответственно = х — = £ 2м1 х Ухм = £ 2(Ахм - у)1 х (хм) =

йА йи йА к~\ к~\

к=1

N N

к=1 к=1

= 2£ (Ахм+м - ухм) = 2(Ах2м - ухм); Е'(А) = 0; 0 = £ (Ах2м - ухм) = А£ х2м - £ ухм

к=1 к=1

А£х2м = ±ухм.

Отсюда коэффициент А кривой, построенной методом наименьших квадратов (табл. 1), у = Ахм, равен

N

£ хм ук

А = Ч-.

£

к=1

.2м

800 700 600 500 400 300 200 100 о

V = 0.1997х14"7 _

Р2 = 1

.■•т

50

100

150

200

250

Рис. 1. Кривая, полученная методом наименьших квадратов, Т = 0,199769х 312, вычерчена для первых четырёх планет, которые использовал Кеплер для выведения третьего закона движения планет [3]

77

к

Таблица 1

Исходные данные для коэффициента А

X у хл3/2 (хл(3/2))*у хЛ(2*(3/2))

58 88 441,7148 38870,906 195112

108 225 1122,369 252533,01 1259712

150 365 1837,117 670547,82 3375000

228 687 3442,725 2365151,7 11852352

3327103,5/16682176=0,199440616.

В описанном случае выводится только коэффициент А, коэффициент М уже известен. Это сберегает время, когда А - уже известная физическая, иная постоянная. Но нас интересует, как получен и коэффициент М. И здесь приходит на помощь таблица готовых нормальных уравнений (табл. 2) для наиболее важных функциональных уравнений книги по медико-биологической статистике, написанной Л. Заксом.

Таблица 2

Нормальные уравнения для наиболее важных функциональных

уравнений

Функциональные уравнения Нормальные уравнения

у = а + Ь X х а X п + Ь£ х = £ у а£ х + Ь£ х2 = £ (х X у)

1§10 У = а + Ь X х а X п + Ь£ х = £ у а£х+Ь£х 2 = £(х X 18ю у)

у = а + Ь X 1§10 х а X п + Ь£ 1§ю х = £ у а£ 1ёю х+Ь£ (1ёю х)2 = £(у X 1ёю х)

1&0 У = а + Ь X %0 х а X п + Ь£ ^ю х = £ 1Вюу а£ 18ю х + Ь£(18ю х)2 = £(18ю хX 18ю у)

у = а X Ь" 1ё10 У = 1§10 а + "X^ю Ь п X 18ю а + ^ю Ь£ х = £ ^юу 1§ю а£ х + ^ю Ь£ х2 = £ (х X 1§ю у)

у = а + Ь X х + с X х2 а X п + Ь£ х + с£ х2 = £ у а£ х + Ь£ х2 + с£ х3 = £ ху а£ х2 + Ь£ х3 + с£ х 4 = £ ( х2 у)

Окончание табл. 2

У = a + Ь X х + с х4х n х lg10 a + Ь£х + с4х = У y a^ х + ЬУ х + сУ Ух3 = У(ау) ayVx + + сУ х = ^

У = aхЬх хсх nXlg 10 a + lg10 ЬУ х + lg^ с У х2 = У ig«у

1&0 У = lg10 a + х X lg10 Ь + х2 lg10 с lg!0 ay х + lg10 ЬУ х2 + lg10 сУ х3 = У(х х lg10 у)

lg10 aУ х2 + lg10 ЬУ х3 + lg^ сУ х4 = У (х2 X lg у)

Дополним таблицу Закса:

Дополненения к таблице 2

Таблица 3

Функциональные уравнения Нормальные уравнения

ln еу = a + Ь х ln е х an + ЬУ lnе х = У lnе у;

aУ lnех + ЬУ (lnе х)2 = У (lnе х х lnе у)

1Ь2 у = a + Ь х 1Ь2 х an + ЬУ 1Ь2 х = У1Ь2 у;

аУ 1Ь2 х + ЬУ (1Ь2 х)2 = У (1Ь2 х X 1Ь2у)

Логарифмы по разным основаниям взаимно переходят друг в друга. Приводим абсолютно точные пересчёты и их формулы:

log10 х = log10 е X lnе х = log10 2,71828182845904 X lnе х @ 0,434294482 X lnе х 4,060443x0,434294482=1,763427989; lnе х = lnе 10Xlog10 х @ 2,302585093xlog10 х 1,763428x2,302585=4,060443025. Логарифм по основанию 2 - lb (binär): 1

1Ьх = log10 х

log10 2 0,301029996 1,763428x3,321928=5,857981017; ln х 1

log10 х = 3,321928095log10 х

1Ьх = -

ln х = 1,442695041 ln х

1п, 2 0,693147181 4,060443x1,442695=5,85798098.

Таблица 4

Первый вариант исходных данных для коэффициентов нормальных уравнений

x У lnx lny ln(xA2) lnx*lny

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 2 3 4 5 6

58 88 4,060443 4,477337 16,4872 18,17997

79

Окончание табл. 4

1 2 3 4 5 6

108 225 4,682131 5,4161 21,92235 25,35889

150 365 5,010635 5,899897 25,10646 29,56223

228 687 5,429346 6,532334 29,4778 35,4663

ап + Ь£ 1пе х = £ 1пе у;

а£ 1пех + Ь£(1пе х)2 = £(1пе хX 1пеу).

4а+19,18256Ь=22,32567;

19,18256а+92,99381Ь=108,5674.

Систему уравнений на выбор можно решить методами исключения Гаусса, разложения на треугольные матрицы либо матричным, но, экономя место, мы используем калькулятор уравнений: Ответ: а = -64515504413/ 40046318464=-1,611022109, Ь = 3753809803/2502894904=1,499787225.

ЕХР(-1,611022109)=0,199683412

Используя дифференцирование, покажем, как выведена система уравнений:

N

Е(а, Ь) = £ (а + Ь X х - ^ у)2.

к=1

Поскольку имеем две переменных a и Ъ, возьмём частные производные:

п ди п п

Е(а, Ь) = £ и2, если и = а + ЬXх — у. Отсюда — = а14 + 0 - 0 = £1 и

к=1 да к=1 к=1

ЭЕ(а, Ь)

ди

= £ 2и2—1 = £ 2и;

к=1 к=1

дЕ(а, Ь) дЕ(а, Ь) ди ^ 1 ^ , , , ,

Соответственно—:-= —:-X— = £2и X£1 = £2(а + ЬXщ10 х — 1g10 у) X(1) =

да ди да к"1

к=1 к=1 к=1

к=1 к=1

= 2£ (а + Ь X 1gl0 х — 1gl0 у); Е( А) = 0; 0 = £ (а + Ь X х — 1gl0 у) = а X п + ь£ 1gl0 х — £ у;

к=1 к=1 п п

аXп + Ь£ 1glo х = £^ю у.

Зафиксируем а и продифференцируем Е (а, Ъ) по Ъ. Получим

п ди п п

Е(а, Ь) = £ и2, если и = а + Ь X х — у. Отсюда — = £ 0 + ^ Ь1—1 X х — 0 = £ .

к=1 дЬ к=1 к=1

дЕ(а, Ь) дЕ(а, Ь) ди ^ ! А,

Соответственно :-=-X— = £ 2и X £ 1g10 х =

дЬ ди дЬ к=1 к=1

п п

= £ 2(а + Ь X 1g1o х — 1g1o у) X (1^ х) = £ 2(а 1g1o х + Ь 1g1o х1+1 — 1g1o у Xх);

к=1

к=1

n n n

E\A) = 0; 0 = £ (a + b x lg10 x- lg10 y) = a xn + b£ lg10 x- £ y;

к=1 к=1 к=1 nn

a x n + b£ lg10x = £ lg10 y.

к=1 к=1

Таблица 5

Второй вариант исходных данных для коэффициентов нормальных

уравнений

lgx igy lg(xA2) lgx*lgy

1,763428 1,944483 3,109678 3,428955

2,033424 2,352183 4,134812 4,782984

2,176091 2,562293 4,735373 5,575783

2,357935 2,836957 5,559857 6,689359

an + b£ lg10x = £ lg10 y;

a£lg10x + b£(lg10 x)2 = £(lg10 xxlg10 y).

4a+8,330878b=9,695915;

8,330878a+17,53972b=20,47708.

Используем калькулятор уравнений: Ответ: a = -132105258110/ 188837937279=-0,699569483, b = 566417518315/377675874558= 1,499745037. 10-0,699569483 = 0,19972412.

Таблица 6

Третий вариант исходных данных для коэффициентов нормальных

уравнений

log2(x) log2(y) log2(xA2) log2(x)*log2(y)

5,857981 6,459432 34,31594 37,83923

6,754888 7,813781 45,62851 52,78121

7,228819 8,511753 52,25582 61,52992

7,83289 9,424166 61,35417 73,81846

an + b£ log 2x = £ i°g2 y;

a£log2x + b£ (log2 x)2 = £ (log2 x x log2 y).

4a+27,67458b=32,20913;

19,18256a+193,5544b=225,9688.

Используем калькулятор уравнений:

Ответ: a = -48432003580/20838054559=-2,324209462,

b= 62505275423/41676109118=1,49978673,

2-2324209462 = 0,199683985.

Далее проведём обработку той же выборки с помощью программы Microsoft Office Excel, существо некоторых её показателей мы рассмотрим ниже. Суть прочих показателей хорошо описана в [1].

81

Таблица 7

Сводная регрессионного анализа зависимости периода прохождения первых четырёх планет, которые использовал Кеплер, от расстояния до Солнца (экспоненциальная модель)

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R 0,999991

R-квадрат 0,999981

Нормированный R-квадрат 0,999972

Стандартная ошибка 0,004598

Наблюдения 4

ДИСПЕРСИОННЫЙ АНАЛИЗ

- df SS MS F Значимость F

Регрессия 1 2,251954 2,251954 106513,2 9,39Е-06

Остаток 2 4,23Е-05 2,11Е-05

Итого 3 2,251996

Окончание табл. 7

- Коэффициенты Стандартная ошибка ^статистика Р-значение Нижние 95%

Y-пересечение -1,61083 0,022157 -72,7004 0,000189 -1,70617

1п(х) 1,499748 0,004595 326,3635 9,39Е-06 1,479976

ВЫВОД ОСТАТКА

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Наблюдение Предсказанное 1п(у) Остатки

1 4,478809 -0,00147

2 5,411184 0,004916

3 5,903858 -0,00396

4 6,531818 0,000516

Таблица 8

Предельные значения F и ^статистик

Односторонний критерий

Тестовая F-cтатистика 18,51282051

Двусторонний ^критерий

Нижняя доверительная граница -4,30265273

Верхняя доверительная граница 4,30265273

Поскольку 106513,2>18,51282051 и 9,39Е-06<0,05, с 95% надёжностью нулевая гипотеза отклоняется. И далее, поскольку 326,3635>4,30265273, а 9,39Е-06<0,05, нулевая гипотеза отклоняется окончательно.

1п(х) График остатков

0,006 0,004 0,002 0

-0,002 -0,004 -0,006

5 ♦

!п(х)

1

2

3

6

Рис. 2. График остатков

Гомоскедастичность не выявлена. Математическая модель примет вид:

л

1п У е = -1,61083 +1,499748 X 1пе X,;

л

Ь о = 2,71828182845904ч'61083 = 0,199721776;

л

Ь = 1,499748;

л

1п У,е = Ь0 + Ь1 X X,;

л л л Ь

У, = Ьо X, ;

л л 1,499748

У г = 0,199721776 X X, . Проверка :

л

У Земли = 0,199721776 X1501,499748 = 366,4493дня Предсказание периода прохождения по орбите Юпитера:

л

У Юпитера = 0,199721776 X 778,331,499748 = 4329,547дней; 4329,547 /365 = 11,8617726 Земных лет.

4329,547/365=11,8617726 лет, вмещающих 2 високосных года, а поскольку 2 дня составляют 0,005479452 года, то 11,8617726+-+0,005479452=11,86725205 года.

Сайт «Большая энциклопедия школьника» сообщает, что период обращения по орбите самой большой планеты Юпитер составляет 11,867 лет! Кеплер и для сегодняшнего дня сделал прекрасный расчёт.

Мэтьюз и Финк [3. С. 290] в упражнениях к главе «Построение кривой по точкам» приводят современные данные, которые мы и пустим в обработку. Авторы дают указание: «Ниже приведены измерения расстояний девяти планет от Солнца и их звёздный период в днях. Найдите степенную подгонку вида для (а) первых четырёх планет и (Ь) всех девяти планет».

Таблица 9

Измерения расстояний девяти планет от Солнца и их звёздный

период, дн.

Планета Расстояние от Солнца (км 10Л6) Звёздный период, дни

Меркурий 57,59 87,99

Венера 108,11 224,7

Земля 149,57 365,26

Марс 227,84 686,98

Юпитер 778,14 4332,4

Сатурн 1427 10759

Уран 2870,3 30684

Нептун 4499,9 60188

Плутон 5909 90710

Примечание: сост. по [3. С. 290]. Выполним задание «а»:

Рис. 3. График остатков

85

Таблица 10

Сводная регрессионного анализа зависимости периода прохождения первых четырёх планет, которые использовал Мэтьюз, от расстояния до Солнца (экспоненциальная модель)

ВЫВОД ИТОГОВ ш

Регрессионная статистика • ^^ . ' * ►г * " * II • Л- , . В : 1' к ■ ' * ■ ■ ■ -■ ЛШЯ В к. ^^я * * ^И^НШ-'ы-м: 1 . - - «.

Множественный R 0,999998

R-квадрат 0,999995

Нормированный R-квадрат 0,999993

Стандартная ошибка 0,00227

Наблюдения 4

Дисперсионный анализ

- df SS MS F Значимость F

Регрессия 1 2,253078 2,253078 437091,8 2,29Е-06

Остаток 2 1,03Е-05 5,15Е-06

Итого 3 2,253088

Окончание табл. 10

- Коэф. Стандартная ошибка ^статистика Р-значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%

Y-пересече-ние -1,58024 0,010892 -145,09 4,75Е-05 -1,62711 -1,53338 -1,62711 -1,53338

1п(х) 1,494081 0,00226 661,1292 2,29Е-06 1,484358 1,503805 1,484358 1,503805

ВЫВОД ОСТАТКА

Наблюдение Предсказанное 1п(у) Остатки

1 4,475789 0,001435

2 5,416761 -0,002

3 5,901763 -0,00115

4 6,530591 0,001714

Таблица 11

Предельные значения F и ^статистик

Односторонний критерий

Тестовая F-cтатистика 18,51282051

Двусторонний критерий

Нижняя доверительная граница -4,30265273

Верхняя доверительная граница 4,30265273

Поскольку 437091,8>5,591447848 и 2,29Е-06<0,05, то с 95%-й надёжностью нулевая гипотеза отклоняется. И далее, поскольку 661,1292>->2,364624251, а 2,29Е-06<0,05, нулевая гипотеза отклоняется окончательно.

Итак, как и ожидалось, более, чем было возможно Кеплеру, точная формула: ЕХР(-1,58024)= 0,20592567; Т = 0,20592567 х1494081. Выполним задание «Ь» (рис. 4):

100000 90000 80000 70000 60000 50000 40000 30000 20000 10000

0 I

о

Рис. 4. Кривая, полученная методом наименьших квадратов, вычерчена для всех девяти планет, которые использовали Мэтьюз и Финк для выведения третьего

закона движения планет

Звёздный период (дни)

Л Л Л. Л Л "1 ■ 989

V = 0,2013х1Я ^ = 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

я **

ф*

-...Г''"

.....

1000 2000 3000 4000 5000 6000 7000

Таблица 12

Сводная регрессионной зависимости периода прохождения всех 9 планет по орбите от расстояния до Солнца (экспоненциальная модель) с использованием современных данных

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R 0,9999996

R-квадрат 0,9999993

Нормированный R-квадрат 0,9999992

Стандартная ошибка 0,0023366

Наблюдения 9

Дисперсионный анализ

- df SS MS F Значимость F

Регрессия 1 53,51453 53,51453 9801780 8,96Е-23

Остаток 7 3,82Е-05 5,46Е-06

Итого 8 53,51457

Окончание табл. 12

Коэффициенты Стандартная ошибка ^статистика Р-Значение Нижние 95%

Y-пересечение -1,603165 0,00319 -502,567 3,26Е-17 -1,61071

1п(х) 1,4988974 0,000479 3130,779 8,96Е-23 1,497765

ВЫВОД ОСТАТКА

Наблюдение Предсказанное 1п(у) Остатки

1 4,4723886 0,004835

2 5,4163946 -0,00163

3 5,9029596 -0,00235

4 6,5338142 -0,00151

5 8,3748542 -0,00098

6 9,2838202 -0,00032

7 10,331313 0,000184

8 11,005275 -4,7Е-05

9 11,413607 0,001816

Таблица 13

Предельные значения F и t-статистик

Односторонний критерий

Тестовая F-статистика 5,591447848

Двусторонний критерий

Нижняя доверительная граница -2,364624251

Верхняя доверительная граница 2,364624251

Поскольку 9801780>5,591447848 и 8,96Е-23<0,05, то с 95%-й надёжностью нулевая гипотеза отклоняется. И далее, поскольку 3130,779>2,364624251, а 8,96Е-23<0,05, то нулевая гипотеза отклоняется окончательно.

Рис. 5. График остатков

Поскольку присутствует определённая гомоскедастичность, выводы требуют осторожности.

Итак, самая точная формула, что нам удалось рассчитать:

EXP(-1,603165)= 0,201258526;

T = 0,201258526 х х1'4988974

Значение F-статистики при 1 и 7 степенях свободы и величине ошибки равно 9819961,394. Но при a = 8,96х 10-23 оно равно уже 9801128,085; 1 неуспех приходится на 1,11607 х 1022 успехов. Поскольку 9801128,085<9801780<<9819961,394 и 8,96E-23< 8,9 х 10-23,

с 0,999999999999999999999911 надёжностью нулевая гипотеза отклоняется. И если ещё мы используем первые 1000 знаков после запятой числа e (рис. 6), большинство из которых программа Microsoft Office Excel не использует, допуская, как пишет Мэтьюз, ошибку округления [3. C. 39], можно говорить о хороших шансах на успех в межпланетных полётах.

91

Третий закон Кеплера [9]: «Квадраты периодов обращения планет вокруг Солнца относятся, как кубы больших полуосей орбит планет» -справедлив не только для планет, но и для их спутников.

T2

— = const; a

где T — периоды обращения планет вокруг Солнца, а — длина больших полуосей их орбит.

Итак, формула третьего закона с нарастающей точностью: T = 0,199721776х1'499748;

T = 0,20592567 х1'494081 ;

T = 0,201258526 х1'4988974.

Произведём преобразования, получив формулу (2):

1 4988974Х2 /-

T = 0,201258526х1-4988974 = 0,201258526 х' 2 = 0,201258526 XV х2-"77948 ;

I--T 2

T2 = (0,201258526 х-у/ х2-"77948 )2 = 0,040504994 X х2-9977948; = 0,040504994.

4 у ' у a7 7948 у

Мэтьюз отмечает: «Важно сознавать, что численное решение - это не точное математическое решение. Точность численного решения уменьшается по многим причинам... Понимание этих трудностей часто может привести профессионала к правильному выполнению и/или усовершенствованию численного алгоритма» [3. С. 37-38].

Найдём абсолютную и относительную ошибки:

Ех

Л

х - х

= 3 - 2,9977948 = 0,0022052;

х - х

3_2 9977948

Ях =-= 3 = 0,000735067.

х 3

Итак, численно ошибка не подавляет. Как указывает Мэтьюз: «Ошибка может распространиться в последующих вычислениях». Далее мы можем полностью устранить эту ошибку, использовав формулу, но за это мы должны будем заплатить искажением коэффициента А.

e — математическая константа, основание натурального логарифма, трансцендентное число. Иногда число e называют числом Эйлера или числом Непера [8]. Натуральные логарифмы (1п) в качестве основания имеют постоянную

е = 2,718281 (предел ряда е = 1 + - + — + —1— +-1-+... = 2,708333333).

1 1х 2 1х 2 х 3 1х 2 х 3 х 4

Л

Что означает 99,9 999 999 999 999 999 999 911% надёжность? Это означает, что при бросании монеты 76-кратное появление герба ещё допускается как вероятное, в то время как семидесяти семикратное уже рассматривается как «сверхслучайное».

2.7182818284 5904523536 0287471352 6624977572 4709369995 9574966967 6277240766 3035354759 4571382178 5251664274 2746639193 2003059921 8174135966 2904357290 0334295260 5956307381 3232862794 3490763233 8298807531 9525101901 1573834187 9307021540 8914993488 4167509244 7614606680 8226480016 8477411853 7423454424 3710753907 7744992069 5517027618 3860626133 1384583000 7520449338 2656029760 6737113200 7093287091 2744374704 7230696977 2093101416 9283681902 5515108657 4637721112 5238978442 5056953696 7707854499 6996794686 4454905987 9316368892 3009879312 7736178215 4249992295 7635148220 8269895193 6680331825 2886939849 6465105820 9392398294 8879332036 2509443117 3012381970 6841614039 7019837679 3206832823 7646480429 5311802328 7825098194 5581630176 5717361332 0698112509 9618188159 3041690351 5988885193 4580727386 6738589422 8792284998 9208680582 5749279610 4841984443 6346324496 8487560233 6248270419 7862320900 2160990235 3043699418 4914631409 3431738143 6405462531 5209618369 0888707016 7683964243 7814059271 4563549061 3031072085 1038375051 0115747704 1718986106 8739696552 1267154688 9570350354

Первые 1000 знаков после запятой числа е^ ■ [последовательность А001112 в 0Е15)

Рис. 6. Первые 1000 знаков после запятой числа е По теореме вероятностей для независимых событий вероятности равны:

рЛх = (I)4 = 0,06250) 0,05;

2

р5х = (I)5 = 0,03125 < 0,05;

Р16 х = (1)16 = 0,000015288;

1 ,7

Р17 х = (_)17 = 0,00000762939; Р76Х = ф76 = 1,32349 х10"23;

Р77 х = (|)77 = 6,61744 Х10-24.

Другими словами, примерно 0, 0015 и 0, 00076%. Итак, статистическая надёжность 95% означает, что случайное появление обстоятельства столь же невероятно, как и событие, состоящее в выпадании герба подряд 17 раз. Вероятность того, что при п-кратном бросании монеты каждый раз будет выпадать герб, равна (1/2)п и приведена в табл. 14. Об этом хорошо сказано в [2].

93

Таблица 14

Вероятность Р того, что при ^кратном бросании монеты каждый раз она выпадает одной и той же стороной, как модель случайного

события

п 2п Р

2-п Уровень

1 2 0,5

2 4 0,25

3 8 0,125

4 16 0,0625 <10%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 32 0,03125 <5%

6 64 0,01562

7 128 0,00781 <1%

8 256 0,00391 <0,5%

9 512 0,00195

10 1024 0,00098 -0,1%

11 2048 0,00049 -0,05%

12 4096 0,00024

13 8192 0,00012

14 16384 0,00006 <0,01%

15 32768 0,00003

Примечание: сост. по [2. С. 111].

Таблица 15

Дополнение вероятностей для третьего закона Кеплера

п 2 п Р

2-п Уровень

16 65536 0,000015288

17 131072 0,00000762939

76 1,55579х 1022 1,32349х10-23

77 1,51116х 1023 6,61744х10-24

И здесь мы можем показать, насколько важно знание бинара: 1Ь2 0,0000076293 9 = -17.

Лотар Закс указывает: «Если мы выбираем коэффициент таким, что высказывание в 95% окажется правильным и только в 5% неправильным, то мы говорим: со статистической надёжностью S в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности». Подводя итог, нужно заметить: мы имеем 5%-ные шансы отвергнуть верный коэффициент уравнения и 95%-ные - принять тоже верный коэффициент.

Интерполирование вероятностей. Для чего нужен способ интерполирования значения уровня F-критерия для п1 ип2 степеней свободы? [2. С. 152] В особых случаях, прежде всего тогда, когда исследуемое представляет опасность для жизни человека, необходимо принимать мень-

шие, чем а=0,001 вероятности ошибок. Так, например, при изготовлении вакцины требуется предельная константа сыворотки. Небезупречные измерения должны быть обнаружены и исключены.

Л. Закс отмечает: «Необоснованное принятие нуль-гипотезы «сыворотка в норме» означает опасную ошибку» [2. С. 114]. Нуль-гипотеза - гипотеза о том, что две совокупности, рассматриваемые с точки зрения одного или нескольких признаков, одинаковы, т. е. действительное различие равно нулю, а найденное из опыта отличие от нуля носит случайный характер. Среднее значение ¡1 генеральной совокупности, оцениваемое на основании случайной выборки, не отличается от желаемого значения ¡0.

И далее Л. Закс пишет, что наука делает ячейки сети всё меньше с тем, чтобы постоянно выдвигать и проверять всё новые гипотезы, наиболее точно и наиболее правдоподобно объясняющие этот мир. Получающиеся при этом выводы и заключения никогда не будут абсолютно надёжны, но они ведут от предварительных гипотез ко всё более общим и строгим теориям, выдерживающим тщательную проверку, приводят к лучшему познанию мира и двигают науку [2. С. 112].

Определённое сводной таблицей значение F=106513,2 (П = 1иУ2 = 2) расположим таким образом между двумя табличными значениями F2) с вероятностями ошибок аиахm,что^(F(^ и подберём вероятность того, что это значение будет превышено.

(т. е.а= 0000090909 1, ш = 000952381 = 1,047619048):

000909091

^ = 104998,4947 < F = 106513,2(109998,489;

к = ^ = 109998,489 -106513,2 = 0 7058594;

^ - ^ 109998,489 -104998,4947

р = ах шк = 0,0000090909 11'047619048 = 0,0000093905 3.

Наблюдаемое Б-значение лежит между границами 0,000909091 и 0,000952381%. Составим таблицу статистик:

Таблица 16

Таблица статистик

Надёжность Вероятн. Число Предельные Предел. Предельные

S, % ошибки, а % станд. значения знач. ^ значения ^

откл., § Б-статистики статистики статистики

1 2 3 4 5 6

90 10 1,56 8,53 -2,92 2,92

95 5 1,96 18,51 -4,3 4,3

95,44 4,56 2 20,44 -4,5 4,5

99 1 2,58 98,5 -9,9 9,9

99,73 0,27 3 368,9 -19,2 19,2

99,9 0,1 3,29 998,5 -31,6 31,6

99,99 0,01 9998,5 -99,9 99,9

95

Окончание табл. 16

1 2 3 4 5 6

99,9936 0,0064 4 15623,50001 124,994 124,994

99,999047619 0,000952381 104998,4947 -324,0347123 324,0347123

0,99999090909 0,000909091 109998,489 -331,6602011 331,6602011

Определим число стандартных отклонений для 5=90%. Итак, Р=0,1/2=0,05, z=1,56.

Поскольку в таблице мы получили t=326,3635, то получаем подтверждение: -331,66<326,3635<331,66.

Определим значимость произвольного эмпирического F-критерия [2. С. 152], в особенности для значений с Р>0,1, воспользовавшись аппроксимацией, предложенной Паульсоном, которая справедлива для числа степеней свободы, не меньшего трёх (чем больше число степеней свободы, тем лучше аппроксимация), причём значимая вероятность определяется как площадь, соответствующая z-границам на обоих концах нормального распределения. Находим новое F-значение, равное 602187,5.

2 2 (1 +-)х 73720171/3 - (1--)

г =-9.х 6 9 х 6 = 5,188614.

, х 7372017 2/3 + — \9х6 9х 1

По таблице площадей [2. С. 68] под кривой стандартного нормального распределения Фишера [11] от z до ~ вероятность того, что переменная z примет значение > z Р=0,0001. Поскольку:

т ± 1,96с,или г = ±1,96накрывают95%всейплощади (Р = 0,025;0,025 х 2 = 0,05;1 - 0,05 = 0,95) и

т± 3с, или г = ±3 накрывают 99,73% всейплощади (Р = 0,0013; 0,0013 х 2 = 0,0026;1 - 0,0026 = 0,9974) и

т± 5,188614с,или г = ±5,188614накрывают не менее 99,98% всей площади (0,0001х 2 = 0,0002; 1 - 0,0002 = 0,9998).

Л

Поскольку г = 5,188614, а максимальное табличное значение

Л

г = 3,7 (при котором вероятность ошибки Р = 0,0001). Вероятность ошибки

а = гх 2 = 0,0001 х 2 = 0,0002; отсюда статистическая надёжность 5=1-0,0002=0,0098. Вероятность ошибки, разумеется, значительно ниже, поскольку возможности таблицы Фишера ограничены потолком в 3,7. Подтвердилось ожидание, что надёжность выше. Рассмотрим связь F и 1/Б и п1 ип2 [2. С. 150]:

Р (п,п2;1 -а) =-1-.

Р (п2,п;а)

По соотношению 1 легко вычислить значение F0,95 при известном F0,05. Если даны п = 1ип2 = 2;а = 0,05,Р = 18,51. Найти F для: п1 = 1ип2 = 2;а = 0,95. Определяем для п1 = 2ип2 = 1;а = 0,05,Р = 199,5 [2. С. 138-149], откуда искомое

значение равно 1/199,5=0,00501. Программа Microsoft Office Excel даёт ответ F=0,005012531. Способ получения данных вручную всё же остаётся нужным ввиду различных обстоятельств.

В заключение отметим, что надёжность S=99,999047619%, полученная для выведенного Кеплером уравнения, и сегодня актуальна, даже сегодня звучит, поскольку по умолчанию используется S=95%. Запуская ракету к Марсу, Вы получите ошибку a=9,52381E-06 - шансы у ракеты не будут отличными, но хорошими будут. Почему всё же не отличными? По мнению Мэтьюза: «Множество реальных данных содержат неопределённость или ошибку. Этот вид ошибки рассматривается как шум. Она воздействует на точность любого численного вычисления, основой которого являются данные. Улучшение точности не достигается при успешных вычислениях, использующих зашумленные данные» [3. C. 49-50].

Представленные Мэтьюзом исходные данные, как и ожидалось, в задании «a» значительно уменьшили ошибку; в задании «b» ошибка по существу исчезла. Таким образом, получен идеальный итог. Уотшем и Паррамоу [4] пишут, что новая литература и новые методы задействовали количественные приёмы, ранее применявшиеся только в физике, в то же время развив и приспособив технику количественного анализа к экономике. Напомним, экспоненциальные модели необходимы для расчётов в экономике.

1. Винстон, У. Microsoft Excel: анализ данных и построение бизнес-моделей / У. Винстон; пер. с англ. - М.: Русская редакция, 2005. - 576 с.: ил.+CD-ROM.

2. Закс, Л. Статистическое оценивание /Л. Закс; пер. с нем. - М.: Статистика, 1976. -598 с.

3. Мэтьюз, Джон Г. Численные методы. Использование MATLAB / Д. Г. Мэтьюз, К. Д. Финк; пер. с англ. - 3-е изд. - М.: Издательский дом «Вильямс», 2001. -720 с.

4. Уотшем, Т. Дж. Количественные методы в финансах: учеб. пособие для вузов / Т. Дж. Уотшем, К. Паррамоу; пер. с англ. - М.: Финансы, ЮНИТИ, 1999. -527 с.

5. NASA Научно-исследовательский центр Эймса [Электронный ресурс]. - Режим доступа: Johannes Kepler, NASA.com (дата обращения 15.03.2014).

6. Свободная энциклопедия Википедия [Электронный ресурс]. - Режим доступа: ru.wikipedia.org>Солнечная система (дата обращения 15.03.2014).

7. Большая энциклопедия школьника [Электронный ресурс]. - Режим доступа: http://www. for-schoolboy.ru>YUpiter-374.html (дата обращения 15.02.2014).

8. Свободная энциклопедия Википедия [Электронный ресурс]. - Режим доступа: ru.wikipedia.org>E (число) (дата обращения 20.09.2014).

9. Свободная энциклопедия Википедия [Электронный ресурс]. - Режим доступа: ru.wikipedia.org>Законы Кеплера (дата обращения 08.10.2014).

10. Импи К. Законы Кеплера / К. Импи, И. Даубар-Спитайл, П. Гей // Учить астрономию [Электронный ресурс]. - Режим доступа: http://m.teachastronomy.-com/astropedia/article/Keplers-Laws (дата обращения 25.09.2014).

97

i Надоели баннеры? Вы всегда можете отключить рекламу.