Научная статья на тему 'О взаимосвязи индикатора базового уровня с порядком регрессионного полинома'

О взаимосвязи индикатора базового уровня с порядком регрессионного полинома Текст научной статьи по специальности «Математика»

CC BY
54
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук
Ключевые слова
РЕГРЕССИОННЫЙ АНАЛИЗ / ПОЛИНОМ / ПОРЯДОК ПОЛИНОМА / МОМЕНТНЫЕ ФУНКЦИИ / ИНДИКАТОРЫ / МЕТОД ВЫЧИСЛЕНИЯ / REGRESSION ANALYSIS / POLYNOMIAL / POLYNOMIAL ORDER / MOMENT FUNCTIONS / INDICATORS CALCULATION METHOD

Аннотация научной статьи по математике, автор научной работы — Петров Александр Васильевич

Целью исследования является нахождение методов оценивания нелинейных вероятностных зависимостей. Методы. Основными методами исследования являются теоретический вероятностный анализ и численные методы. Результаты. Исследуется поведение индикаторов, рассчитанных по статистическому материалу, предположительно содержащему полиномиально связанные независимую и зависимую переменные. Особое внимание уделено базовым индикаторам, служащим основой для расчета индикаторов высших уровней, через которые вычисляются регрессионные коэффициенты полинома и точно определяется его порядок. Заключение. Базовый индикатор может успешно применяться на этапе предварительного, оценочного статистического анализа для приближенной оценки порядка регрессионного полинома.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON BASE LEVEL INDICATOR AND REGRESSION POLYNOMIAL ORDER RELATIONSHIP

The purpose of the study is to find the estimation methods for nonlinear probabilistic dependencies. Methods. The main methods of the research are the theoretical probabilistic analysis and numerical methods. Results. The behavior of indicators calculated by statistical material presumably containing polynomially related independent and dependent variables has been studied. Special attention has been given to the basic indicators serving as a basis for the calculation of higher level indicators through which polynomial regression coefficients are calculated and polynomial order is accurately determined. Conclusion. The basic indicator can be successfully used at the stage of preliminary and estimated statistical analysis for the approximate estimation of the regression polynomial order.

Текст научной работы на тему «О взаимосвязи индикатора базового уровня с порядком регрессионного полинома»

Оригинальная статья / Original article УДК: 519.233.5

DOI: 10.21.285/1814-3520-2016-7-102-108

О ВЗАИМОСВЯЗИ ИНДИКАТОРА БАЗОВОГО УРОВНЯ С ПОРЯДКОМ РЕГРЕССИОННОГО ПОЛИНОМА

© А.В. Петров1

Иркутский национальный исследовательский технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Резюме. Целью исследования является нахождение методов оценивания нелинейных вероятностных зависимостей. Методы. Основными методами исследования являются теоретический вероятностный анализ и численные методы. Результаты. Исследуется поведение индикаторов, рассчитанных по статистическому материалу, предположительно содержащему полиномиально связанные независимую и зависимую переменные. Особое внимание уделено базовым индикаторам, служащим основой для расчета индикаторов высших уровней, через которые вычисляются регрессионные коэффициенты полинома и точно определяется его порядок. Заключение. Базовый индикатор может успешно применяться на этапе предварительного, оценочного статистического анализа для приближенной оценки порядка регрессионного полинома.

Ключевые слова: регрессионный анализ, полином, порядок полинома, моментные функции, индикаторы, метод вычисления.

Формат цитирования: Петров А.В. О взаимосвязи индикатора базового уровня с порядком регрессионного полинома // Вестник Иркутского государственного технического университета. 2016. № 7. С. 102-108. DOI: 10.21.285/1814-3520-2016-7-102-108

ON BASE LEVEL INDICATOR AND REGRESSION POLYNOMIAL ORDER RELATIONSHIP A.V. Petrov

Irkutsk National Research Technical University, 83 Lermontov St., Irkutsk, 664074, Russia.

Abstract. The purpose of the study is to find the estimation methods for nonlinear probabilistic dependencies. Methods. The main methods of the research are the theoretical probabilistic analysis and numerical methods. Results. The behavior of indicators calculated by statistical material presumably containing polynomially related independent and dependent variables has been studied. Special attention has been given to the basic indicators serving as a basis for the calculation of higher level indicators through which polynomial regression coefficients are calculated and polynomial order is accurately determined. Conclusion. The basic indicator can be successfully used at the stage of preliminary and estimated statistical analysis for the approximate estimation of the regression polynomial order. Keywords: regression analysis, polynomial, polynomial order, moment functions, indicators calculation method

For citation: Petrov A.V. On base level indicator and regression polynomial order relationship. Proceedings of Irkutsk State Technical University. 2016, no. 7, рp. 102-108 (in Russian). DOI: 10.21.285/1814-3520-2016-7-102-108

Введение

В работах [1, 2] и ряде других, изложены новые подходы к решению задач полиномиального регрессионного анализа. Получены результаты, обеспечивающие не только исчисление коэффициентов регрессионного полинома, но и (что крайне важно с практической точки зрения) автоматическое объективное определение порядка этого полинома.

В основу этого инструментария положены специально сконструированные вероятностно-статистические характеристики, названные индикаторами. Индикаторы построены на основе поликорреляционных моментов, связывающих зависимую Y и независимую X переменные регрессионного полинома порядка n:

1

Петров Александр Васильевич, доктор технических наук, профессор кафедры автоматизированных систем, e-mail: [email protected]

Petrov Alexander, Doctor of Engineering, Professor of the Department of Automated Systems, e-mail: [email protected]

Vo,k = M

(:Y - M (Y ))•( Xk - M ( Xk ))

либо связывающих независимые переменные в различных степенях:

= M

( X* - M ( X* ))•( XJ - M ( XJ ))

(1)

(2)

Поликорреляционные коэффициенты получают нормированием поликорреляционных моментов соответствующими среднеквадратическими отклонениями:

^0] ... Т0,](3)

ги = (4)

__

'h] g(X) •<J(Xj )

Индикаторы

Индикаторы вычисляются с помощью коэффициентов вида (3) и (4). Назовем коэффициенты (3) и (4) индикаторами базового или (-1)-го уровня и в соответствии с [2, с. 127-128] обозначим их соответственно В(-1,1,0,]) и В(-1,1,1,]). В обозначениях индикатора

В (к,ь,1,]) приняты следующие наименования: к - уровень индикатора, к=-1,0,1, ..., п;

з - номер регрессионного коэффициента, в расчете которого участвует индикатор, з=2,.,п;

/ - индекс первой переменной поликорреляционного момента или индикатора (0 указывает на зависимую переменную), /=0,...,з;

} - индекс второй переменной поликорреляционного момента или индикатора, у=0,...,з. Здесь под поликорреляционным моментом или индикатором понимается момент или индикатор, стоящий первым в числителе расчетной формулы.

Для полинома первого порядка имеет место только один индикатор В (-1,1,0,1) =

01 .

Для полинома второго порядка существуют два индикатора (-1)-го уровня:

В (-1,1,0,1) = го1; (5)

В(-1,1,1,2) = Г12, (6)

и один индикатор нулевого уровня:

, , Т, - Т, ■ В (-1,1,0,2 )-В (-1,1,0,1)-В (-1,1,1,2) В (0,2,0,2) = 0(0,2) = 0—01~12 -^ ' ' ' ' } ' ' ' '. (7)

1 -(Г12)2 1 -[_В(-1,1,1,2)\2

Для полинома третьго порядка добавляются индикаторы базового или (-1)-го и нулевого уровней:

В(-1,1,0,3) = Г03, В(-1,1,1,3) = Г13, В(-1,1,2,3) = т^, (8)

-т, ■ Г,? В(-1,1,0,3)-В(-1,1,0,1)-В(-1,1,1,3) В(0,3,0,3) = 0(0,3) = 03 Т01 13 -V ' } ', (9)

( ) 1 -ы2 1 -[_В{-1,1,1,3)\2

В (0 2 13) = Т23 - Т12 ■ Т13 =В (-1,12,3) - В (-1,112) ■В (-1,113) (10)

( , , , ) 1 -(Т12)2 1 -[В(-1,1,1,2)]2 '

В(0 32 3\ = 2 - 1 ■ Т13 =В (-1,1,2,3) - В (-1,I12) ■В (-1,113)

( , , , ) 1 -Ы2 1 -[В(-1,1,1,3)]2 .

Они позволяют рассчитать индикатор первого уровня:

В{,.30.3) ВВ)•В(°'3'1'3). (12)

1 -[ В {0,3,1, 3)]

Аналогичные действия можно произвести и для других степеней регрессионного полинома. Несмотря на вынужденную громоздкость обозначений, удалось получить рекуррентные соотношения для исчисления индикаторов [ 2, с. 127-128].

Используя выражения (4.1.30) и (4.1.31) из [2, с. 127], можно вычислить коэффициенты регрессионного полинома.

Если обрабатываемый статистический материал действительно содержит полиномиальную зависимость между зависимой и независимой переменными, то индикаторы вида В{5-2,з,0,s) при 5 > п будут обращаться в ноль. Такое обращение обеспечивает объективное определение порядка п регрессионного полинома.

Обратим внимание, что все возможные индикаторы в конечном итоге вычисляются через базовые индикаторы В{-1,1 ,0,-) = r0j и В{-1,1 ,г,-) = г-. Их поведение в значительной

степени определяет поведение индикаторов более высокого уровня.

Исследование свойств базовых индикаторов

В работе [1] получено выражение, определяющее поликорреляционный момент ,

являющийся числителем индикатора г01:

г=п

Ц0- = Е |_Ъг • {а«+- - аг • а- )], (13)

г =1

где аг, а - - начальные моменты порядков / и } соответственно независимой переменной регрессионного полинома порядка п.

Нормируя (13) среднеквадратическими отклонениями а(Г) и о(Х]), получаем индикатор г0j (с учетом [2, с. 79]):

__^0/__

0 ^П(Г) • Б(ХП

г =п

Ъг • {аг+ / - аг 'а/)] (14)

_ г=1

V

Е Ъ2 • {а2г -а2 )] + Е Ък • Ъг • {аг+к -аг 'ак ) ' {а2/ -а2 )

_г=0 г*к ]

Таким образом, поведение базового индикатора г определяется начальными моментами независимой переменной. Аналогичные рассуждения можно провести и для другого индикатора г..

Начальные моменты законов распределения вероятностей в зависимости от значения их порядков изменяются по-разному. Например, для равномерного закона начальные моменты с ростом их порядка стремятся к нулю, для экспоненциального закона - показательно возрастают, а для бернуллиевского закона распределения вероятностей - постоянны. Учитывая, что при расчете базовых индикаторов вида (14) начальные моменты входят и в числитель, и в знаменатель формулы, возможно предположение о их взаимной компенсирующей роли.

Для подтверждения этой гипотезы проведены численные эксперименты. Суть их состояла в генерации пары наблюдений {х-,у-), / = 1,2, ..., N. Независимая переменная х-изменялась линейно от 0 до 999 с шагом 0,01 (иными словами, объем выборки N=1000). Рассчи-

тывались значения хк, к = 1,2, ..., п; п < 50 и вычислялось значение полинома по формуле

к=п

У} = Е хк. (15)

к=1

После этого на каждое значение yj накладывалась аддитивная помеха б^. Помеха

представляет собой некоррелированное случайное число с одним из трех законов распределения вероятностей - равномерным в интервале [а, 6], нормальным с параметрами т, о и экспоненциальным с параметром А. Параметры задаются исследователем. Выбор экспоненциального закона распределения вероятностей помехи обусловлен его положительной определенностью и, главное, асимметричностью относительно математического ожидания. Эта асимметричность предположительно обеспечивает возможность выявления влияния вероятностных свойств помехи на индикаторы.

На рис. 1 представлены результаты численных экспериментов - вычисленные значения индикаторов r0j и г^ при нормально распределенной помехе с нулевым математическим

ожиданием и среднеквадратическими отклонениями о=0,1; 1; 10 и 100 (ясно, что чем больше а, тем меньше проявляется полиномиальная зависимость). Выбор индикаторов r0j и г^ обусловлен тем, что они участвуют в расчетах индикаторов нулевого и всех последующих уровней, использующих информацию о поведении зависимой переменной. Поэтому на рис. 2 представлены индикаторы нулевого уровня, полученные расчетом через соответствующие индикаторы базового уровня, отображенные на рис. 1.

В работе [1] показано, что индикатор уровня 2-п обращается в ноль при } > п. Это и является объективным указанием порядка регрессионного полинома, отражаемого обрабатываемым статистическим материалом.

а = 10 а = 100

Рис. 1. Базовые индикаторы r0j и rjj при нормальном законе распределения

помехи с параметрами 0, а Fig. 1. Basic indicators roj and r1j under the normal distribution law

of the interference with the parameters 0, а

a = 0,1

a = 1

a = 10 a = 100

Рис. 2. Индикаторы нулевого уровня D(0,j) при нормальном законе распределения

помехи с параметрами 0, a Fig. 2. Zero level indicators D(0,j) under the normal distribution law of the interference with the parameters 0, a

Особо отметим, что значимого влияния вероятностных свойств помехи на индикаторы не зафиксировано. На рис. 3 приведены фрагменты реализации полиномов (по 100 значений), по которым проводился расчет индикаторов (см. рис. 1 и 2).

На рис. 4 и 5 приведены экспериментальные значения индикаторов r0j, rlj и D(0,j)

при тех же, что и ранее, вероятностных свойствах помехи, но только при о=1 и различных порядках регрессионного полинома. Эти результаты свидетельствуют о том, что характер поведения индикаторов не зависит от порядка полинома.

(0; 0,1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(0; 1)

(0; 10) (0; 100) Рис. 3. Фрагменты реализации полиномов при нормальном распределении помехи

с параметрами m, о

Fig. 3. Fragments of polynomials implementation under the normal distribution of the interference

with the parameters m, о_

n=30 n=40

Рис. 4. Базовые индикаторы r0j и rjj при различных порядках регрессионного полинома Fig. 4. Basic indicators roj and r1j under various orders of the regression polynomial

n=10

n=20

n=30 n=40

Рис. 5. Индикаторы нулевого уровня D(0,j) при различных порядках регрессионного полинома Fig. 5. Zero level indicators D(0,j) under various orders of the regression polynomial

Выводы

Анализ полученных результатов позволяет сделать вывод о том, что базовый индикатор r0j, рассчитанный по статистическому материалу, предположительно содержащему полиномиально связанные переменные пар наблюдений {xj'yj)' j = 1>2> ■■■Nдостигая значения

«единица», может служить показателем, определяющим порядок регрессионного полинома. Он не позволяет исчислить регрессионные коэффициенты полинома и точно определить его порядок. Но r0j может успешно применяться на этапе предварительного оценочного статистического анализа для приближенной оценки порядка регрессионного полинома.

Библиографический список

1. Петров А.В. Метод вычисления индикаторов полиномиальной зависимости // Вестник ИрГТУ. 2016. № 5 (112). С. 87-94.

2. Петров А.В. Основы теории полиномиальных стохастических взаимосвязей. Иркутск: Изд-во ИРНИТУ, 2016. 170 с.

References

1. Petrov A.V. Metod vychisleniya indikatorov polinomial'noi zavisimosti [Polynomial dependence indicator calculation method]. Vestnik IrGTU [Proceedings of Irkutsk State Technical University]. 2016, no. 5 (112), pp. 87-94 (in Russian).

2. Petrov A.V. Osnovy teorii polinomial'nykh stokhasticheskikh vzaimosvyazei [Fundamentals of the theory of stochastic polynomial relationships]. Irkutsk, IRNITU Publ., 2016, 170 p. (in Russian)

Критерии авторства

Петров А.В. сформулировал задачу, провел исследования, подготовил статью к публикации и несет ответственность за плагиат.

Authorship criteria

Petrov A.V. formulated the objective, conducted the study, prepared the article for publication and bears the responsibility for plagiarism.

Конфликт интересов

Автор заявляет об отсутствии конфликта интересов.

Conflict of interests

The author declares that there is no conflict of interests regarding the publication of this article.

Статья поступила 16.05.2016 г. The article was received on 16 May 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.