Научная статья на тему 'Инструменты экспериментальных исследований полиномиальной регрессии'

Инструменты экспериментальных исследований полиномиальной регрессии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
201
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКСПЕРИМЕНТ / ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ / СЛУЧАЙНЫЕ ПРОЦЕССЫ / КОРРЕЛЯЦИЯ / ПОЛИНОМИАЛЬНАЯ РЕГРЕССИЯ / EXPERIMENT / PROBABILISTIC CHARACTERISTICS / RANDOM PROCESSES / CORRELATION / POLYNOMIAL REGRESSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петров Александр Васильевич

Описывается программный инструментарий численного моделирования и проверки методов исчисления коэффициентов полиномиальной регрессии и автоматического определения порядка регрессионного полинома.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петров Александр Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

POLYNOMIAL REGRESSION EXPERIMENTAL STUDY TOOLS

The article describes the software tools of numerical simulation and testing of calculation methods for polynomial regression coefficients and automated determination of regression polynomial order.

Текст научной работы на тему «Инструменты экспериментальных исследований полиномиальной регрессии»

УДК 622.20

ИНСТРУМЕНТЫ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ ПОЛИНОМИАЛЬНОЙ РЕГРЕССИИ

© А.В. Петров1

Иркутский государственный технический университет,

664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Описывается программный инструментарий численного моделирования и проверки методов исчисления коэффициентов полиномиальной регрессии и автоматического определения порядка регрессионного полинома.

Ил. 8. Библиогр. 6 назв.

Ключевые слова: эксперимент; вероятностные характеристики; случайные процессы; корреляция; полиномиальная регрессия.

POLYNOMIAL REGRESSION EXPERIMENTAL STUDY TOOLS

A.V. Petrov

Irkutsk State Technical University,

8Э Lermontov St., Irkutsk, 664074, Russia.

The article describes the software tools of numerical simulation and testing of calculation methods for polynomial regression coefficients and automated determination of regression polynomial order.

8 figures. 6 sources.

Key words: experiment; probabilistic characteristics; random processes; correlation; polynomial regression.

Для экспериментальной (численной) проверки полученных в [3] выводов была разработана серия программных средств [2, с.4-6]. Инструментальной средой являлись средства MS Office (Excel) с встроенным VBA. Особых требований к техническим средствам не выдвигалось.

Ниже представлены назначение, описания работы и получаемые результаты для программного средства под названием «Инструмент численного моделирования», предназначенного для численной проверки полученных результатов.

При запуске программы обычным для MS Excel способом и разрешении на работу с макросами открывается окно для задания параметров эксперимента и выбора вида работ (рис. 1).

Для проведения численного эксперимента генерируется постоянная составляющая t. И затем на эту постоянную составляющую накладывается аддитивная помеха, имеющая выбранный в окне «Закон распределения вероятностей» закон распределения с параметрами, задаваемыми в окнах «Параметры закона».

На выбор исследователя предлагается пять законов распределения аддитивной помехи:

- равномерный в интервале [a,b];

- нормальный с параметрами (m,a);

- экспоненциальный с параметром А;

- арксинуса с параметром m;

- Рэлея с параметром a.

Обозначения параметров закона распределения вероятностей выводятся слева от окон задания их значений.

Аргумент полинома (независимая переменная регрессии) генерируется по формуле

xt = (t-h)+ ^, (1)

где где xt - аргумент полинома; t - текущий номер (начальное значение - 0); h - приращение номера t ,или шаг тренда, задаваемое в соответствующем окне (рис. 1); ^t - помеха, генерируемая как случайное некоррелированное число с избранным законом распределения (методы генерирования таких случайных чисел широко известны, см., например, [1]).

Зависимая переменная регрессии генерируется по формуле

К = £Г=оаГ4. (2)

где где yt - значение полинома; xt - аргумент полинома; n - порядок полинома, задаваемый в соответствующем окне (рис. 1); aj - коэффициенты полинома, задаваемые в соответствующих окнах (рис.1).

Объем генерируемой выборки - 1000 значений и может быть увеличен с учетом шапки таблицы (две строки) до имеющегося в Excel'e ограничения на число строк.

Введено непринципиальное ограничение: порядок регрессионного полинома n, задаваемый в соответствующем окне (см. рис. 1 - окно «Порядок полинома тренда»), должен быть не более 5-ти.

Кнопка «Сброс параметров» предназначена для очистки внутренних окон главного окна.

Кнопка «Расчет» обеспечивает вычисление всех параметров эксперимента.

Кнопка «Импорт» доставляет сохранение результатов эксперимента при заданных параметрах в отдельном листе книги Excel с именем, составленным из наименования закона распределения, даты и времени эксперимента, например, «Нормальный ЗРВ. (12-08, 13-49)», что обеспечивает возможность последующей обработки результатов экспериментов по усмотрению исследователя.

Петров Александр Васильевич, доктор технических наук, профессор, тел.: (3952) 405162, e-mail: petrov@istu.edu. Petrov Alexander, Doctor of technical sciences, Professor, tel.: (3952) 405162, e-mail: petrov@istu.edu.

Рис. 1. Окно задания параметров и выбора вида работ

Кнопка «Переход в Excel» позволяет перейти боты с книгой Excel'a с соответствующим стандарт-

непосредственно на основной лист книги Excel'a, на ным запросом на сохранение результатов.

котором представлены результаты расчетов. Результаты расчетов представляются на листе

Кнопка «Выход» необходима для завершения ра- книги Excel'a «Произвольная выборка» (рис. 2).

Паравіегрьі ЗРВ

а = 0,0000

Ь = 1,0000

Шаг аргумента

h =

0,1000

Заданные коэФ^тыл-Ш

І aCj)

0 1,0000

1 2,0000

2 3,0000

3 4,0000

4 5,0000

S 6,0000

Исчисленные коэффициенты a(j) полинома

а(0) 0,9999

а(1) 2,0000

а(2) 3,0000

а(3) 4,0000

а(4) 5,0000

а(5) 0,0000

Степень (1с) а(Хь) e(Xk)

0 1 0

1 54464Е+01 2,8878Е+01

2 3,481бЕ+03 3,0650Е+03

3 2,&494Е+05 2^б80Е+05

4 2,150бЕ+07 2,&386Е+07

5 1,8187Е+09 2,7176Е+09

Y 1,0860Е+08 1,4312Е+08

СКО: Полином - расчет 5,5023Е-07

Заданные точность вычислений и порядок полинома тренда

0,0001

Исчисленный порядок полинома

Г~^~1

Коэффициенты - индикаторы

Коэффициенты Значения

В(-1Д,0,1) 0,86974886955012

В(0,2,0Д) 1,94763742945242

В(1,3,0,3) 2,14550751900180

В(2,4,0,4) 0,99170702637067

В(3,5,0,5) 0,00000000000431

Коэффициенты корреляции

R(Y*X) 0,8697 R(X*X) 1,0000 R(XA2*XA2) 1,0000 R(XA3*XA3) 1,0000 R(XA4*XA4) 1,0000 R(XA5*XA5) | 130000

R(Y*XA2) 0,9589 R(X*XA2) 0,9699 R(XA2*XA3) 0,9862 R(XA3-XA4) 0,9922 R(XA4*XA5) 0,9950

R(Y‘XA3) 0,9923 R(X*XA3) 0,9193 R(XA2*XA4) 0,9586 R(XA3*XA5) 0,9750

R(Y*XA4) 1,0000 R(X*XA4) 0,8693 R(XA2WXA5) 0,9274

R{Y*XA5) 0,9949 R(X*XA5) 0,8240

Рис. 2. Лист «Произвольная выборка»

Лист «Произвольная выборка» является основным листом, на котором представляются все результаты расчетов, проводимых макросами VBA. Лист разделен на пять зон.

Зона 1 (рис. 3) содержит информацию о заданных параметрах эксперимента и основных результатах. В заголовке зоны указано наименование закона распределения вероятностей.

В первой слева четверти - заданные параметры закона распределения вероятностей, шаг тренда и заданные значения коэффициентов анализируемого полинома.

Во второй четверти представлены исчисленные по формулам (3.25) и (3.26), изложенным в [2], коэффициенты регрессионного полинома (главный результат полиномиального регрессионного анализа).

В третьей четверти выводятся оценки начальных моментов независимой переменной оск (X) =ос1 (Хк) и а (Хк) и зависимой переменной ос1 (Y) и a (Y), а также оценки средневкадратических ошибок, описывающие

погрешности между:

- сгенерированным с параметрами, заданными в первой четверти, и рассчитанным по исчисленным коэффициентам (вторая четверть) полиномом;

- сгенерированным полиномом и очищенным от случайной составляющей (помехи) полиномом исчисленной степени с коэффициентами из первой четверти;

- рассчитанным по исчисленным коэффициентам полиномом и очищенным от случайной составляющей (помехи) полиномом исчисленной степени с коэффициентами из первой четверти.

И, наконец, в четвертой четверти первой зоны представлены точность для определения значимости вычисленного по формуле (3.28) из [2] коэффициента

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В, заданный в главном окне порядок генерируемого полинома и исчисленный порядок регрессионного полинома, определенный с помощью сравнения с нулем с заданной точностью коэффициента В, описываемого выражением (3.28) из [2].

Исчисленные коэффициенты (Шум: Равномерный ЗРВ, Знакопеременная АКФ. Аргумент: X)

Па намети ьт ЗРВ

я = 0,0000

Ь = 1,0000

Ш;<г аргумента

|| - I 0,1000

Заданные коаФгТы аЩ

і a O')

0 1,000(1

1 2,0000

2 3,0000

3 4,0000

4 5,0000

5 6,0000

Рис. 3. Зона 1

Аргумент и полином

t і. X(j) X2(j) X3(j) X4(j) X5(j) Полином Расчет

1,000000 0,758715 1,758715 3,093079 5,439844 9,567136 16,825867 83,3917 83,3917

1,100000 0,383342 1,483342 2,200303 3,263801 4,841332 7,181350 47,8295 47,8294

1,200000 0,881991 2,081991 4,334685 9,024773 18,789493 39,119549 148,2146 148,2145

1,300000 0,091718 1,391718 1,936880 2,695591 3,751503 5,221035 39,1340 39,1339

1,400000 0,776164 2,176164 4,735692 10,305644 22,426775 48,804349 172,9159 172,9158

1,500000 0,214967 1,714967 2,941113 5,043914 8,650148 14,834721 76,6797 76,6796

1,600000 0,955848 2,555848 6,532358 16,695714 42,671705 109,062387 305,8502 305,8501

1,700000 0,577426 2,277426 5,186671 11,812262 26,901558 61,266320 202,8717 202,8717

1,800000 0,960196 2,760196 7,618684 21,029063 58,044342 160,213781 403,7144 403,7144

1,900000 0,694441 2,594441 6,731123 17,463501 45,308022 117,548982 322,7764 322,7763

2,000000 0,012555 2,012555 4,050380 8,151614 16,405575 33,017130 131,8106 131,8105

2,100000 0,891133 2,991133 8,946878 26,761305 80,046630 239,430137 541,1013 541,1012

2,200000 0,497742 2,697742 7,277810 19,633653 52,966524 142,890001 371,5961 371,5961

2,300000 0,958416 3,258416 10,617276 34,595504 112,726550 367,310015 741,3834 741,3834

2,400000 0,703682 3,103682 9,632840 29,897270 92,791612 287,995630 619,6530 619,6530

2,500000 0,230336 2,730337 7,454737 20,353942 55,573111 151,733293 388,1062 388,1062

Рис. 4. Зона 2

Вторая зона (рисунок 4) содержит значения номера ^ аддитивной помехи независимой переменной в 1-й - 5-й степенях, значения сгенерированного полинома, рассчитанного по исчисленным коэффициентам полинома и очищенного от случайной составляющей (помехи) полинома исчисленной степени с коэффициентами из первой четверти.

В третьей зоне (рис. 5) выводятся рассчитанные по формуле (3.28) из [2] значения коэффициентов В, графическое их отображение и график первых ста значений сгенерированного полинома, рассчитанного

по исчисленным коэффициентам полинома и очищенного от случайной составляющей (помехи) полинома исчисленной степени с коэффициентами из первой четверти.

Четвертая зона (рис. 6) содержит оценки смешанных моментов высших порядков. Например, Р(ХЛ2*ХЛ4)=

И, наконец, в пятой зоне (рис. 7 и 8) представлены вычисленные по формулам (3.27) - (3.34) из [2] коэффициенты В(тду).

Рис. 5. Зона 3

Коэффициенты корреляции

Щ*Х) 0,8697 Щ*Х) 1,0000 ЩХЛ2*ХА2) 1,0000 И(ХЛ3*ХА3) 1,0000 Н(ХЛ4*ХА4) 3,0000 К(ХА5*ХЛ5) | 1,0000

Щ*ХЛ2) (ЦШ ЩХ*ХЛ2) 0,9699 ЩХЛ2*ХЛ3) 0,9862 К(ХЛ3*ХЛ4) 0,9922 ЩХЛ4*ХА5) 0,9950

И(\7*ХЛ3) 0,9923 Щ*ХА3) 0,9193 ЩХЛ2*ХЛ4) 0,9586 И(ХА3*ХА5) 0,9750

1,0000 ЩХ*ХЛ4) 0,8693 ЩХЛ2*ХЛ5) 0,9274

Й(У*ХЛ5) 0,9949 Щ*ХЛ5) 0,8240

Рис. 6. Зона 4

В(т, 5, і, і), т = -1, 0 І

1 2 3 4 5

5=1 ш = -1 і=0 0,9170 0,?В61 1,0000 0,5921 0,974В

і=1 1,0000 0,9бВ4 0,9167 0,В662 0,В20В

і=2 1,0000 0,9В60 0,9583 0,5270

і=3 1,0000 0,9921 0,9750

і=4 1,0000 0,9950

і=5 1,0000

5=2 т= 0 і=0 1.5773

і=1

і=2 1,і79б 1,9203 2,1237

і=3

і=4

і=5

5=3 т= 0 і=0 О.МВ4

і=1

і=2 0,61 аб 0,74ВЗ 0,В27б

і=3 1,2409 1,3941

і=4

і=5

5=4 т = 0 і=0 0,7920

і=1

і=2 0,6156 0,47Й4 0,5291

і=3 0,7933 0,В912

і=4 1,137ї

і=5

5=5 т = 0 і=0 О.вВОВ

і=1

і=2 0,404В

і=3 0,6В19

і=4 0,В703

і=5

Рис. 7. Зона 5. Коэффициенты B(m,s,ij) при m=-1, 0

Б(ш=з- 8, 1г ]) .1

1.0000 2.0000 3.0000 4.0000 5.0000

1=0 О.ЭЭгЭ

1=1

3=3 |=:

П1 = 1 1=3 11-::

1=4

1=5

1=0 0,4504

1=1

5 = 4 |=:

ш = 1 1=3 о,-с; з

1=4 ■ ,1030

1=5

1=0 0,0000

1=1

5 = 4 1=:

ш = 2 1=3

1=4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 5

1=0 0,3014

1=1

з = г 1=:

ш = 1 1=3 о,зо:б

1=4 0, й С1 “

1=5

1=0 0,0000

1=1

э = 5 1=:

га = 2 1=3

1=4 0,^':;

1=5

1=0 0,0000

1=1

з = г 1=:

га =5 1=3

1=4

1=5

Рис.8. Зона 5. Коэффициенты B(m=s-2,s,i,j)

Проведенные исследования полностью подтвердили правомерность выдвинутых предположений по высокой эффективности изложенного в [2] подхода.

Таким образом, использование смешанных моментов высших порядков и развитие метода наименьших квадратов, выразившегося в новой методике нахождения коэффициентов регрессионного по-

Библиограф

1. Быков В.В. Цифровое моделирование в статистической радиотехнике. М.: Советское радио, 1971. 328 с.

2. Петров А.В. Нелинейная стохастическая бинарная модель: Свидетельство об отраслевой регистрации разработки Отраслевого фонда алгоритмов и программ Минобрнауки РФ № 7054 от 12.10.2006 г.

3. Петров А.В. О полиномиальной регрессии (научное издание). Иркутск, Изд-во Иркутского государственного техн. ун-та, 2005. 74 с.

4. Петров А.В. Полиномиальный регрессионный анализ

линома, обеспечивает, помимо полного совпадения с результатами, достигаемыми при традиционном подходе, АВТОМАТИЧЕСКОЕ определение порядка регрессионного полинома без привлечения аппарата проверки статистических гипотез и информации о физической сущности анализируемых зависимостей.

ский список

(ПРА): Свидетельство об официальной регистрации программ для ЭВМ № 2008615509 от 19.11.2008 г.

5. Петров А.В. Расчет матриц смешанных моментов. Свидетельство об отраслевой регистрации разработки Отраслевого фонда алгоритмов и программ Минобрнауки РФ № 7053 от 12.10.2006 г.

6. Петров А.В. Экспоненциальная стохастическая бинарная модель: Свидетельство об отраслевой регистрации

разработки Отраслевого фонда алгоритмов и программ Минобрнауки РФ № 7055 от 12.10.2006 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.