Научная статья на тему 'Структурное моделирование, когда число опытов меньше, чем число показателей'

Структурное моделирование, когда число опытов меньше, чем число показателей Текст научной статьи по специальности «Математика»

CC BY
41
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧНі МОДЕЛі / МіНіМАЛЬНА ПОХИБКА / MATHEMATICAL MODELS / MINIMUM ERROR / МАТЕМАТИЧЕСКИЕ МОДЕЛИ / МИНИМАЛЬНАЯ ПОГРЕШНОСТЬ

Аннотация научной статьи по математике, автор научной работы — Кодола Г.Н.

На основании метода ε -ортогонализации предложена методика построения математических моделей с минимальной погрешностью по опытным данным, когда число показателей превышает число опытов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кодола Г.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRUCTURAL MODELING, WHEN THE NUMBER OF EXPERIMENTS IS LESS THAN THE NUMBER OF INDICATORS

On the basis of the method of ε -orthogonalization, a technique of constructing mathematical models with a minimum error has been proposed under the test data, when the number of indices exceeds the number of tests.

Текст научной работы на тему «Структурное моделирование, когда число опытов меньше, чем число показателей»

УДК 519.6

Г. Н. КОДОЛА (УГХТУ) СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ,

КОГДА ЧИСЛО ОПЫТОВ МЕНЬШЕ, ЧЕМ ЧИСЛО ПОКАЗАТЕЛЕЙ

На n^craBi методу е -ортоroналiзацil наведена методика побудови математичних моделей з мшмальною похибкою за дослвдними даними, коли кшьшсть показнишв перевищуе кшьшсть доcвiдiв.

На основании метода е -ортогонализации предложена методика построения математических моделей с минимальной погрешностью по опытным данным, когда число показателей превышает число опытов.

On the basis of the method of е -orthogonalization, a technique of constructing mathematical models with a minimum error has been proposed under the test data, when the number of indices exceeds the number of tests.

Деятельность железных дорог Украины и Укрзалiзницi в целом описывается очень большим числом показателей: грузооборот, пассажирооборот, количество груженых вагонов, количество разгруженных вагонов, продуктивность локомотива, оборот груженого вагона, простой груженого вагона на одной технической станции, простой вагона под одной грузовой операцией, участковая скорость, объем отправленных грузов, количество отправленных пассажиров, средняя численность работников на перевозках, потребная доля электротяги в грузообороте и многие другие. При описании деятельности дорог с помощью математических моделей возникает множество вопросов: какие же из этих показателей можно использовать для описания грузовой или же пассажирской деятельности дорог? А какие для описания деятельности дороги в целом? Какие из них наиболее существенные для построения модели? Какие параметры более точно позволят описать работу и в дальнейшем помогут производить прогноз на последующие года?

Если рассматривать данные переменные как простые количественные показатели, не учитывая ту смысловую информацию, какую они несут, возникает задача исследования влияния одних переменных на другие. Даже тогда, когда не очевидна связь между переменными, мы можем стремиться к тому, чтобы выявить ее с помощью математического моделирования.

Один из методов выбора математической модели с заданным набором переменных - Метод регрессионного анализа [1]. Существенным недостатком этого метода является то, что необходимо построить все модели, а за тем среди них выбрать математическую модель, осуществляющую прогноз с минимальной погрешно-

стью. При большом количестве переменных -это очень громоздкая работа.

В случае, когда переменных больше, чем опытов, возникает вопрос выбора набора переменных, которые можно взять в качестве независимых. В методе наименьших квадратов [1; 2] количество опытов больше числа переменных, однако, очень часто возникает ситуация, когда переменных больше, чем опытов. Так как не удалось найти в литературе рассмотренной ситуации, то настоящая работа посвящается ее рассмотрению.

£ -ортогональность и ее применение в задачах математического моделирования

Традиционно при построении математических моделей линейных по параметрам, то есть при раскрытии зависимости вида

У = &Ф, (x)

1=1

где Рг- - параметры модели; фг- (х) - заданные функции; х - вектор размерности п.

Существенно используется понятие ортогональности векторов, так, например, в методе наименьших квадратов [2] рассматривается задача минимизации функции

N

s 2 (РЫ

j=1

yj

■Ер.- Ф, ()

г=1

где у / - значения отклика в /-ом эксперименте;

Х/ - вектор предикторных переменных в /-ом

эксперименте.

Необходимые и достаточные условия минимума функции S 2 представляют собой

2

а?2

N

-2Е

■=1

Уз -ХР, Ф () М^ )=0

к

х

,=1

у = и

или в нормальной форме получаем систему уравнений:

ХР,- Ф г фу = Уфу,

,=1

где

Ф, Фу =

1 N

N Хф, (х, ),

Л г=1

_ 1 N

уф = N Х. Уз фv(xj )•

Таким образом, если рассмотреть вектора:

v/ гф. (х. )>

1 1

У

У_2_

ф. =

ф, (Х1) ф (2)

ф, (%)

откуда

< УФ. > р, = ' г

<ф ф >

Понятие ортогональности позволяет ввести базис [3]. Обобщая это понятие, введем в рассмотрение 8 - базис.

Определение 2. 8 -базисом некоторого пространства X будем называть максимальный набор попарно 8 -ортогональных векторов из пространства X. То есть, если е., е2,...ет — век-

тора из пространства X и такие, что

<8 ,

при чем этот набор не пополняем, то его, в силу определения, и будем называть 8 -базисом.

Разложение (представление) вектора в 8 -ортогональном базисе

Пусть X — векторное пространство, а {е,},, = 1,т его ортогональный базис. Для любого вектора х е X представление

Х = Х1е1 + Х2 е2 + ••• + Хтет

то уфу и ф,фv можно рассмотреть как скалярное произведение введенных векторов. Если вектора Ф, ортогональны, тогда система нормальных уравнений принимает простой вид

р,. <Ф,, Ф, >=< У, Ф, >,

Однако ортогональность в расчетах на ЭВМ не может быть строго реализована из-за конечности разрядной сетки ЭВМ и естественно возникает задача 8 -ортогональности и ее последствий при построении математических моделей.

8 -ортогональность

Для определенности изложения введем формальное понятие 8 -ортогональности.

Определение 1. Пусть имеется два вектора а, Ь, тогда будем говорить, что эти вектора 8 -ортогональны если имеет место

|< а, Ь >| <8 ,

где 8 — наперед заданное положительное число.

называют разложением вектора х по базисным векторам {е,}, а числа х.,х2,...,хт называют компонентами вектора Х в рассматриваемом базисе [3]. Для определения чисел х, используется система:

х. < е.,е. > + Х2 < е2,е. > +... +

+Хт < ет, е. >=< х, е. > ;

х. <е.,е2 >+Х2 <е2,е2 >+... +

+Хт < ет, е2 >=< Х е2 > ;

х1 <еьет >+х2 <e2,ет >+... +

+Хт < ет , ет >=< Х, ет > .

Не ограничивая общность рассмотрения, считаем, что 8 — базис нормирован, то есть

< е,, е, >= 1.

Обозначим скалярное произведение векторов е, и е■ через 8 у =< е,, ез > , тогда вышеприведенная система примет вид

х1 +812 х2 + . + 81тхт = ь1;

821х1 + х2 + . + 8 2тХт = ь2;

8т1х1 + 8т2х2 + . • • + хт = ьт ..

где ь = ( х, е,), , = 1, т .

В матричной форме имеем (С + Е)х = Ь ,

где

' 1 0 0 0Л

I = 0 1 0 0

0 V 0 0 1 /

Е =

0 812 813 81т

821 0 8 23 8 2т

8т1 8т 2 8т3 0

В силу определения скалярного произведения матрица Е является симметричной, и ее элементы

^ £ , при ' * 7 .

удовлетворяют условию 8у

Решение системы (1) формально имеет вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

:=£(-1)*£*Ь .

(2)

к=0

Е =

Г 0

Ч£21

12 0

Л

и так как 812 = £

-21

, то имеет место

Г о 1 ^

Е = 8

12

V1 0У

Квадрат матрицы Е будет равен

Г1 0^

Е2 =82

12

V0 1У

а для куба получаем

Е3 =83 Е =812

Тогда

х = -

1

-12

Г 0 1 >

V1 0,

Г 0 1 ^

V 1 0,

откуда следует, что если 812 1, то это условие является необходимым и достаточным,

чтобы разложение вектора х по базису ^ было единственным.

Естественно возникает вопрос о сходимости ряда (2). Прежде, чем рассмотрим этот вопрос в общем виде, исследуем частный случай, когда число базисных векторов равно 2, то есть в качестве X выступает плоскость. Матрица Е будет следующей:

61 Рис. 1

Геометрическая интерпретация данной ситуации представляет собой разложении вектора х в косоугольной системе координат (рис. 1). И если угол между векторами в1 и в^ незначительно отличается от прямого, т. е. ^^ << 1, то в качестве координат можно взять

х1 ~ ь1 -812ь2;

х2 ~ ь2 — 812ь1. Точность этого представления будет иметь порядок о(822 ) .

В общем случае можно утверждать, что если

аег (I + Е )* 0,

то разложение вектора х по 8 -базису {в'} единственно, а при

8 = тах к у I << 1

' * 7

в качестве приближенного значения получаем

( \

Хт

V У

Г и ^ Г Ь1

Ь_2_

Ьт

0 812 813 81т

821 0 8 23 82т

8т1 8 т 2 8т3 0

ЛГ и л Ь1

ьь

Ьт

.(3)

Для оценки погрешности данного приближения воспользуемся следующей леммой.

Лемма. Если 8т < 1, то ряд (2) сходится

и погрешность разложения (3) равна О (8т)2

Доказательство. Для доказательства этой леммы рассмотрим матрицу

(

Е =

0 812 813 81т

8 21 0 8 23 8 2т

8 т1 8 т 2 8 т3 0

Л

Порядок элементов матрицы Е найдем,

используя порядок элементов матрицы Е , где

в

2

Е =

0 1 1 1

1 0 1 1

1 1 1 0

Используя метод математической индукции, получаем

(

Е2 =

т -1 т - 2 т - 2

т - 2 т -1 т - 2

т - 2 т - 2 т -1

л

Е =

(т-1)(т-2) (т-1)+(т-2)2 (т-1)+(т-2)2 (т-1)(т-2)

(т-1)+(т-2)2 (т-1)+(т-2)2

(т-1)+(т-2) (т-1)+(т-2)2

2 А

(т-1)(т-2)

? к

-к с Еж, к = 1, т ; У =

( \

У1 У2

Уж

V /

— значения откли-

{Х,,Х])

<8;

2. (Ухк е X|M^ е М

|<Хк , -V ^ > 8 .

(4)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Модель с минимальной погрешностью

Рассмотрим модель вида:

У = а0Х0 + а1 х1 + ...+ атхт , (5)

где а,, , = 0, т определяются по методу наи-

меньших квадратов. Положим

80 = тах

1<к < N

Ук - Х а,Х,к ,=1

(6)

Пусть й = {х., х2,...хт } , а V ей, тогда модель типа (5) по показателям х е й/V будет равна

У(й^)= Х а,х,

х, ей/ V

погрешность этой модели будет определяться

8 (V )= тах

1<к < N

Ук - Х

ах

, ,к

,ей/ V

и т. д. то есть элементы матрицы Е будут иметь порядок о( тк-1) .

Следовательно, элементы матрицы Ек будут иметь порядок о(гктк-1), потому что

Ек < 8кЕк < 8ктк-1, а с учетом условия леммы (8т < 1) получаем, что ряд (2)сходится, но т. к.

он является знакочередующимся, то условие 8т < 1 является не только необходимым, но и достаточным [3].

Пусть X = {х.,х2,...,хт} — набор векторов;

Очевидно, что

8 (V )= тах

1<к < N

Ук-Х а,Хк +Х

ах.

Нл,к

,=0

iеV

<80 +

+ тах

1<к < N

Х

iеV

ах,

, ,к

Положим, 8 = тах

1<к < N

Х

iеV

ах

, ,к

представляет

собой оценку сверху приращения погрешности при удалении из модели (5) показателя из перечня V.

Возникает задача

'■(V )

• тт, V ^ тах, V ей,

ков; У с EN ; N — размерность каждого вектора (число опытов); 8 — наперед заданное положительное число.

Определение 3. Множество М с X назовем 8 -базисом если выполняются следующие два условия:

1. Ух, ; с М,, Ф у

(7)

где V — число элементов во множестве V .

Решение этой задачи и позволит определить наборы предикторных переменных для построения математических моделей, с погрешностью, не превышающей заданную.

Пример. Используя среднесуточные статистические данные [4; 5] по годам за период 1991—2001 гг., построить математическую модель с погрешностью, не превышающей заданной, для описания грузовой деятельности Приднепровской железной дороги.

Решение данной задачи разложим на три этапа: 1. Применяя метод 8-ортогонализации определим наборы предикторных переменных типа М с X , удовлетворяющие условию (4), которые будут являться базисом для построения математической модели с погрешностью, не превышающей заданную.

и

2. Строятся математические модели для описания грузовой деятельности Приднепровской железной дороги и определяются максимальные относительные погрешности для каждой модели.

3. Используя усовершенствованный метод регрессионного анализа отбора предикторных переменных по заданной точности математической модели, определить наборы предикторных переменных для построения математических моделей, описывающих грузовую деятельность дороги с погрешностью, не превышающей заданную.

В исходной информации представлено 17 параметров (грузооборот, пассажирооборот, количество груженых вагонов, количество разгруженных вагонов, производительность локомотива, оборот груженого вагона, простой груженого вагона на одной технической станции, простой вагона под одной грузовой операцией, участковая скорость, объем отправленных грузов, количество отправленных пассажиров, средняя численность работников на перевозках, потребная доля электротяги в грузообороте и т. д.) за 11 лет, то есть количество опытов меньше, чем количество показателей.

Определяя наборы переменных, которые удовлетворяют условию (4), рассмотрим один из них:

М — {х2, x3, x4, x5, x7, x8, x9, х12, x13, х17 } .

Построим математическую модель, описывающую грузооборот Приднепровской железной дороги (показатель x1) по методу наименьших квадратов, исключив сначала показатель X2, и определим максимальную относительную погрешность для данной модели.

x (*) — 7,927x3 (*) +13,596x4 (*) +

+0,109x5 (*) + 9,46^ (*) -1,734x8 (*) +

+6,818x3 (*) + 0,027x12 (*) + 0,002x13 (*) -

-1,720х17 (*)- 547,393 .

Максимальная относительная погрешность составляет 1,81 %.

Теперь построим математические модели, выражающие показатель x1, через набор переменных М, исключив из него сначала показатель Xз затем X4 и т. д. Для каждой модели определим максимальные относительные погрешности и результат сведем в табл. 1.

Таблица 1

Исключенная переменная Коэффициент при Свободный член Относительная погрешность, %

*2 Л:3 ОС4 ¡Х9 л:12

- 7,927 13,60 0,109 9,461 -1,734 6,818 0,027 -0,002 1,720 -547,390 1,81

-1,296 - 18,51 0,222 5,731 -2,172 5,100 -0,042 -0,011 0,679 -133,790 1,47

-1,256 11,250 - 0,350 12,760 -3,508 8,134 -0,107 -0,015 0,280 -60,675 1,37

X5 -0,827 7,389 21,15 - 6,484 -1,044 6,492 0,081 0,001 2,950 -741,430 1,78

^ -1,335 -1,056 25,62 0,081 - -0,709 3,475 0,024 -0,005 1,278 -285,720 2,77

-0,772 5,021 24,55 -0,030 3,411 - 8,075 0,086 0,007 3,123 -755,970 2,27

X9 -1,287 -7,464 29,16 0,169 -2,500 -0,618 - -0,029 -0,007 0,198 54,166 5,32

-1,09 6,935 14,85 0,520 8,290 -2,051 6,686 - -0,006 1,825 -427,780 0,53

-0,909 7,637 16,37 0,102 8,005 -1,403 6,606 0,025 - 2,502 -588,330 1,12

-1,263 4,835 8,95 0,293 8,662 -2,919 6,343 -0,080 -0,145 - -13,209 0,75

На третьем этапе полученный результат ляет собой оценку сверху погрешности матема-

сведем в табл. 2.

тической модели, построенной на основе соответ-

Погрешность, указанная в табл. 2, представ- ствующего набора предикторных переменных.

Вариант Набор предикторных переменных Исключенные переменные Погрешность, %

1 {^2 , Х3 , Х4, Х5 , Х7, х^ , Х9 , х^3 , Л*! 7 } {х12 } 0,53

2 {, Х3 , X4, *5 , Х7, , *9 , 3 } {х12, х17 } 1,28

3 , Х3, Х4, Х5, Х7, *8, Х9 } {х12 , х13, х17 } 2,40

4 {, Х3 , Х5 , Х7 , , Х9 } {х4, х12 , х13, х17 } 3,77

5 {, Х5 , Х7, , Х9 } {х3, х4, х12 , х13, х17 } 5,24

6 {х2 , *7 , х8 , х9 } {х3 , х4, х5 , х12 , х13, х17 } 7,02

7 {х7, х8 , Х9 } {х2 , х3, х4, х5 , х12 , х13, х17 } 8,83

8 {х7, Х9 } {х2 , х3, х4, х5 , х8 , х12 , х13, х17 } 11,10

9 {Х9 } {х2, х3, х4, х5, х7, х8, х12, х13, х17 } 13,87

10 {} { х2 , х3 , х4, х5 , х7 , х^ , х9 , х^ 2 , х^ 3, х17 } 19,19

Итак, для того чтобы построить математическую модель с заданной погрешностью, необходимо выбрать из табл. 2 соответствующий набор предикторных переменных, у которого погрешность не превосходит заданную.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того, чтобы убедиться в правильности данного утверждения построим для каждого полученного набора, представленного в таблице 2, математические модели, подсчитаем погрешности. Результат сведем в табл. 3. Как видно из табл. 3 математические модели с первой по четвертую удовлетворяют погрешности, представленной в табл. 2, а уже начиная с набора 5...9, погрешности намного превышают оценку сверху из табл. 2.

Это происходит за счет того, что математические модели строятся на основе исходной информации, у которой в -базис не является

нормированным. Для того чтобы избежать превышение оценок из табл. 2 необходимо орто-нормировать исходную информацию, то есть привести к виду, чтобы удовлетворялись следующие два условия:

|(2, )| = в*' 1 ф 1 (2г ,*] ) =1 г' = 1,

(8)

где в* - машинная точность.

Рассмотрим тот же пример, но только для ортонормированных данных. В качестве базиса рассмотрим прежний:

М = { ^2, Т.ъ,2 4, 25, г7, г8, ^9,2Х2, 213, 217 } .

Результат сведем в табл. 4.

Таблица 3

Исключенная переменная Коэффициент при Свободный член Относигель-ная погрешность, %

х2 х3 х4 х5 х7 х8 х9 х12 х13 х17

1 -1,090 6,935 14,85 0,152 8,290 —2,05 6,686 - -0,006 1,83 -427,78 0,53

2 -0,808 3,167 14,85 0,145 5,808 —2,09 5,739 - -0,011 - -173,04 1,21

3 -0,352 2,595 13,94 0,122 4,776 -0,91 4,968 - - - -226,29 1,80

4 0,022 13,260 - 0,134 10,410 -1,64 7,938 - - - -347,60 1,98

5 1,457 - - 0,304 27,240 -5,19 17,910 - - - -805,15 20,84

6 -2,637 - - - 19,570 -3,56 25,170 - - - -589,55 29,27

7 - - - - 23,690 -3,93 25,180 - - - -687,97 29,06

8 - - - - -4,870 - 22,660 - - - -566,20 32,02

9 - - - - - - 27,350 - - - -745,67 30,38

Исключенная переменная Коэффициент при Свободный член Относительная погрешность, %

¿2 ¿3 ¿4 ¿5 ¿7 ¿8 ¿9 ¿12 ¿13 ¿17

22 - 0,029 0,015 -0,032 0,0030 0,012 -0,017 -0,003 -0,0003 -0,004 0,2883 46,16

23 -0,311 - 0,017 -0,035 0,0033 0,013 -0,018 -0,003 -0,0004 -0,005 0,3108 8,14

¿4 -0,311 0,032 - -0,035 0,0033 0,013 -0,018 -0,003 -0,0004 -0,005 0,3161 3,81

¿5 -0,311 0,032 0,017 - 0,0033 0,013 -0,018 -0,003 -0,0004 -0,005 0,3158 5,57

¿7 -0,311 0,032 0,017 -0,035 - 0,013 -0,018 -0,003 -0,0004 -0,005 0,3162 1,08

-0,311 0,032 0,017 -0,035 0,0033 - -0,018 -0,003 -0,0004 -0,005 0,3161 4,67

-0,311 0,032 0,017 -0,035 0,0033 0,013 - -0,003 -0,0004 -0,005 0,3161 4,85

212 -0,311 0,032 0,017 -0,035 0,0033 0,013 -0,018 - -0,0004 -0,005 0,3162 0,54

213 -0,311 0,032 0,017 -0,035 0,0033 0,013 -0,018 -0,003 -0,005 0,3162 0,08

¿17 -0,311 0,032 0,017 -0,035 0,0033 0,013 -0,018 -0,003 -0,0004 - 0,3162 1,11

Коэффициенты при показателях в построенных моделях (табл. 4) по преобразованным данным мало изменяются.

Решая задачу (7), усовершенствуем метод регрессионного анализа. Результаты сведем в табл. 5. По данным наборам предикторных переменных построим математические модели и подсчитаем для каждой модели погрешности (табл. 6). Все построенные модели (табл. 6) имеют погрешность, не превышающую погрешность для

соответствующего набора предикторных переменных, представленного в табл. 5.

На первом этапе моделирования использовалась в-ортогональность для определения базиса, набора переменных, на основе которого должен проводиться анализ. Такой набор является не единственным (в качестве примера для исследования был представлен только один набор). Возникает вопрос: какому набору отдать предпочтение ?

Таблица 5

Вариант Набор предикторных переменных Исключенные переменные Погрешность, %

1 , гъ, 2 4, г5, г7, г8,29, .г^, } ы 0,08

2 , г 4, г5, г7, 29, г^ } {¿12, ¿13 } 0,62

3 {¿2, 23, ¿4, 25, 28, 29, ¿17} {¿7, ¿12, ¿13 } 1,70

4 {¿2,23,¿4,25,28,29} {¿7, ¿12, ¿13, ¿17 } 2,81

5 {22,¿3,25,¿8,¿9} { 24, 27, ¿12, ¿13, ¿17 } 6,62

6 {22,¿3,25,29} {¿4, ¿7, ¿8, ¿12, ¿13, ¿17 } 11,29

7 {z2,^2з} {24, ¿7, ¿8, ¿9, ¿12, ¿13, ¿17 } 16,14

8 {^ 23 } {24, ¿5, ¿7, ¿8, ¿9, ¿12,213, 217 } 21,71

9 {¿2 } {23, ¿4,25,27, ¿8,29,212, ¿13, ¿17 } 29,85

10 {} {22, 23, 24,25, 27 , 28,29, 212,213, 217 } 76,01

Исключенная переменная Коэффициент при Свободный член Относительная погрешность, %

г2 г3 г4 г5 г7 г8 г9 г12 г13 г17

1 -0,311 0,032 0,017 -0,035 0,0033 0,013 -0,018 —0,003 - —0,005 0,3162 0,080

2 -0,311 0,032 0,017 -0,035 0,0033 0,013 -0,018 - —0,005 0,3162 0,549

3 -0,311 0,032 0,017 -0,035 - 0,013 -0,018 - - -0,005 0,3162 1,440

4 -0,311 0,032 0,017 -0,035 - 0,013 -0,018 - - - 0,3162 1,560

5 -0,311 0,032 - -0,035 - 0,013 -0,018 - - - 0,3161 3,690

6 -0,311 0,032 - -0,035 - - -0,018 - - - 0,316 6,850

7 -0,311 0,032 - -0,035 - - - - - - 0,3159 3,070

8 -0,31 0,032 - - - - - - - - 0,3156 9,480

9 -0,310 - - - - - - - - - 0,3152 10,480

Проделав исследования на нескольких базисах, можно сказать, что предпочтение можно отдать тому набору, у которого сумма погрешностей для построенных моделей на втором этапе (представленных в табл. 1 и 4) минимальна.

Нашу задачу можно записать теперь так.

Исходные данные:

У1 х11 х12 х1т

У2 х21 х22 х2т

УN xN 1 xN 2 xNm

где N - количество опытов, т - количество показателей.

Используя £ -ортогонализацию, определяем наборы типа М с X, удовлетворяющие условию (4). |М| = р - мощность множества М .

Ортонормируем исходные данные для каждого набора и строим модели типа:

к

У "=Е

1=0 1ФУ

сУ г

1 '

где С, 1 = 1, к определяются по методу наименьших квадратов; у = 1, р - номер модели; к - количество независимых переменных.

Далее определим погрешности для каждой модели

(УУ ) = тах

х ' 1< ]< N

У; - Е с^г] 1=1

, V = 1, р

и выбираем такой базис, для которого

• тт.

у=1

Решаем задачу (7). Вернемся от ортонорми-рованных данных к исходным. В этом случае модель примет вид

к к к к к

уу = Е с1 г =Е с1 Е ]=Ех; Е сау 1=0 1=1 ]=1 ]=1 1=1 1ФУ

или в общем виде:

Ту = СТ АХ,

где X - набор предикторных переменных; С -вектор коэффициентов в ортонормированных моделях; А - матрица коэффициентов перехода к ортонормированным данным.

Данная методика позволяет значительно сократить количество переборов построения моделей в регрессионном анализе и тем его усовершенствовать.

Благодарность

Автор благодарит проф. А. А. Босова за помощь в постановке и решении задачи.

1ФУ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дрейпер Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. - М.: Финансы и статистика. Т. 1, 1986. - 366 с.

2. Наконечний С. I. Економетрiя / С. I. Наконеч-ний, Т. О Терещенко, Т. П. Романюк. - К.: КНЕУ, 2000, - 296 с.

3. Гельфанд И. М. Лекции по линейной алгебре. -М.: Наука, 1971. - 272 с.

4. Пасечник В. I. Аналiз динашки показнишв залiзниць Украни // Залiзничний транспорт Украши, 2002. - № 5. - С. 2-6.

5. Железнодорожный транспорт - ведущая отрасль экономики Украины: (Информ.-стат. и аналит. материалы) / Под ред. Т. Мукминовой. - К.: Транспорт Укра1ни, 2003. - 32 с.

Поступила в редколлегию 11.06.2004.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.