Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИ ПОСТРОЕНИИ ЭКОНОМИЧЕСКИХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ'

ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИ ПОСТРОЕНИИ ЭКОНОМИЧЕСКИХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
6
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
The Scientific Heritage
Область наук
Ключевые слова
количественные методы / параметры / оценка достоверности / дисперсионный анализ / модель / адекватность / quantitative methods / parameters / reliability assessment / analysis of variance / model / process the adequacy

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Бунтова Е.В.

В работе представлено место и значимость использования методов математической статистики при построении моделей прогнозирования экономических показателей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF MATHEMATICAL STATISTICS METHODS FOR CONSTRUCTING ECONOMIC MODELS PREDICT

The work presents the place and the importance of using one of the methods of mathematical statistics, particularly analysis of variance, in the process of building forecasting models for economic indicators.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИ ПОСТРОЕНИИ ЭКОНОМИЧЕСКИХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ»

PHYSICS AND MATHEMATICS

Бунтова Е.В.

кандидат педагогических наук, доцент Самарский государственный экономический университет

ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИ ПОСТРОЕНИИ ЭКОНОМИЧЕСКИХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ

THE USE OF MATHEMATICAL STATISTICS METHODS FOR CONSTRUCTING ECONOMIC

MODELS PREDICT

Buntova E. V.

candidate of pedagogical Sciences, associate Professor Samara state University of Economics

АННОТАЦИЯ

В работе представлено место и значимость использования методов математической статистики при построении моделей прогнозирования экономических показателей.

ABSTRACT

The work presents the place and the importance of using one of the methods of mathematical statistics, particularly analysis of variance, in the process of building forecasting models for economic indicators.

Ключевые слова: количественные методы, параметры, оценка достоверности, дисперсионный анализ, модель, адекватность.

Keywords: quantitative methods, parameters, reliability assessment, analysis of variance, model, process the adequacy.

Рассмотрение качественных признаков экономических систем, как правило, сопровождается изучением количественной стороны хозяйственных процессов при помощи методов математической статистики. Задача количественных исследований состоит в получении численной оценки состояния экономического процесса.

Исследования с использованием количественных методов являются основным инструментом получения информации для планирования и принятия решений. Основное преимущество количественных исследований состоит в том, что появляется возможность снижения риска принятия неправильных решений и выбора неточных параметров планирования.

Большинство исследований, связанных с использованием количественных методов в экономике - это построение моделей планирования, прогнозирования и принятия решений. Цель моделирования понять и изучить качественную и количественную природу явления, отразить существенные для исследования черты в пригодной для использования в практической деятельности форме.

В абсолютном большинстве случаев с той или иной дискретностью и формой представления, явления и процессы характеризуются некими измеряемыми или описываемыми параметрами.

Сведения об исследуемом процессе могут быть получены в виде статистических данных определенного перечня произвольно выделенных параметров, соответствующих математической модели. В процессе обработки этих сведений могут быть оценены информативность и значимость части па-

раметров, и сформировано осознание недостаточности или избыточности первоначального перечня параметров. При этом производится и предварительная оценка достоверности и прогностической ценности математической модели.

Различают детерминированные и стохастические математические модели. В детерминированных моделях все параметры, оказывающие влияние на ответные реакции объекта исследования, однозначно определены и их значения известны в момент принятия решения. Стохастические модели предполагают наличие элемента неопределенности, учитывают возможное вероятностное распределение значений факторов и параметров, определяющих развитие ситуации.

Следует отметить, что детерминированные модели, с одной стороны, являются более упрощенными, поскольку не позволяют достаточно полно учитывать элемент неопределенности. С другой стороны, они позволяют учесть многие дополнительные факторы, зачастую недопустимые стохастическим моделям. Никакая модель не может учесть абсолютно все факторы. Профессионально разработанная модель отличается тем, что позволяет учесть наиболее существенные из них.

Очевидно, что разделение моделей на детерминированные или стохастические вполне условно, так как даже простейшие детерминированные модели можно рассматривать как стохастические при учете влияния на конечный результат случайных ошибок измерения или влияния случайных возмущений на сам процесс.

Сложность создания математической модели обычно состоит в огромном числе параметров влияния и отклика, большом числе связей между ними.

Задача заключается не только в том, чтобы создать адекватное математическое описание изучаемого процесса, т.е. его модель, но и разработать методику работы с нею. С громоздкими многопараметрическими моделями трудно проводить исследования, поэтому исследователь вынужден при формализации реального процесса отбрасывать многие, реально или якобы менее существенные связи, за-грублять математическое описание.

Наличие влияния заданных факторов на изучаемый процесс, отображаемый наблюдаемой статистической совокупностью экономических данных, устанавливается методами математической статистики.

В качестве примера рассмотрим оценку модели множественной регрессии, построенную с це-

лью прогнозирования расходов бюджета Российской Федерации согласно статистическим данным показателей с 1992 года по 2015 год (таблица 1): у = 874,2 - 7,3хх + 4,6х2 - 8,7х3 + 9,43х5 + 2,3х6,

где у - расходы бюджета РФ в млрд. рублей, х1 - расходы на общегосударственные вопросы в млрд. рублей, х2 - расходы на национальную оборону в млрд. рублей, х3 - расходы на национальную безопасность и правоохранительную деятельность в млрд. рублей, х4 - расходы на национальную экономику в млрд. рублей, х5 - расходы на жилищно -коммунальное хозяйство в млрд. рублей, х6 - расходы на социально - культурные мероприятия в млрд. рублей.

Таблица 1

Статистические данные по расходу бюджета РФ с млрд. рублей

Расходы на

национа Расходы

Год Расход бюд жета, У Расходы на обще государственные вопросы хх Расходы на национа льную оборону льную без-опас ность и право охрани тельную Рас ходы на нацио нальную эконо мику Расходы на жилищ но - комму нальное хозяйство на соци-аль но -культур ные ме-роп

деятельность х^ риятия

1992 6000 900 860 350 4700 900 1400

1993 57700 13000 7200 4200 9800 13000 14300

1994 230400 59100 28500 18100 10500 59100 55700

1995 486100 57700 49600 27200 11900 65200 129100

1996 652700 79200 63900 39200 17200 88600 188400

1997 839500 97900 81400 59000 29000 112600 270500

1998 842100 75200 65100 45400 31100 96800 245700

1999 1258 78,6 115,6 74,6 46,3 127,3 367

2000 1960,1 129 191,7 132,5 72,9 199,8 536,4

2001 2419,4 131,5 247,7 183,9 111 196 727,6

2002 3422,3 189,1 295,4 240,4 149 221,9 1356,8

2003 3964,9 682,5 355,7 304 183,2 254,1 1175,5

2004 4669,7 778,7 430 381,6 223 291,7 1465,5

2005 6820,6 754,3 581,8 585,2 764,2 471,4 3642

2006 8375,2 827,4 683,4 714,1 948,9 631,7 4546,4

2007 11378,6 1171,3 834 864,3 1558 1102,3 5822,3

2008 13991,8 1291 1043,6 1092,1 2258,6 1153,2 7122,1

2009 16048,3 1313,8 1191,2 1245,9 2782,1 1006,1 8479,6

2010 17616,7 1440,6 1279,7 1339,4 2323,3 1071,4 10133,8

2011 19994,6 1357 1517,2 1518,6 2793,4 1195 11245,9

2012 23174,7 1437,9 1814,1 1929,2 3273,6 1075 13215,2

2013 25290,9 1525,9 2105,5 2159,3 3281,7 1052,7 14678

2014 27611,7 1640,4 2480,7 2192,9 4543,1 1004,7 15154,2

2015 29741,5 1848,2 3182,7 2072,2 3774,4 979,9 17151,5

Согласно предпосылкам модели, случайные ошибки характеризуются постоянным разбросом или постоянной дисперсией, и данную дисперсию необходимо оценить, так как дисперсия - это характеристика влияния случайных факторов модели. Несмещенная оценка дисперсии случайных ошибок с2 имеет вид

п

£? = 594618728,

где - сумма квадратов остатков, п -

число наблюдений, к - число коэффициентов в модели.

Несмещенная оценка дисперсии Б2 используется для расчета стандартных ошибок коэффициентов и стандартной ошибки регрессии.

Стандартная ошибка регрессии вычисляется по формуле:

SEE = Js2 =

N

п — к

= 24384.

Стандартная ошибка регрессии измеряет среднюю величину ошибки модели. Данная характеристика точности модели позволяет сравнивать между собой разные модели.

Следующая характеристика - это коэффициент детерминации И2, который показывает долю дисперсии зависимой переменной, «объясненной» уравнением регрессии, т.е.

Уаг(у) Т?}=1(У1 - У)2

R2

= 0,99,

Уаг(у) ТЦ=1(У1-У)2

где Уаг(у) - дисперсия предсказанных значений У, Уаг(у) - дисперсия значений У.

Смысл коэффициента детерминации состоит в том, что он показывает долю дисперсии, которая объясняет уравнение регрессии, т.е. показывает, какой процент независимой переменной объясняется факторами, включенными в модель. Следует помнить, что коэффициент детерминации Я2 объясняет уравнение регрессии технически. Кроме того, при добавлении новых факторов в модель, в не зависимости от их полезности или от существенности независимых переменных, коэффициент детерминации Я2 будет увеличиваться.

Альтернативный показатель коэффициента детерминации Я2 - это скорректированный или нормированный Я2, т.е. Я2 с учетом штрафа за число переменных, вошедших в модель.

Скорректированный коэффициент детерминации Я2 рассчитывают по формуле: 9 к -1

где Я2 - коэффициент детерминации, п - число наблюдений, к - число коэффициентов в модели.

Высокий скорректированный коэффициент детерминации Я^] говорит о том, что регрессоры предсказывают большую долю изменений У. Высокий скорректированный коэффициент детерминации не говорит о том, что верно выявлена причинно - следственная связь между переменными и не гарантирует отсутствия смещения оценок из-за некорректной спецификации.

Поэтому стоит обращать внимание на другие характеристики качества уравнения регрессии.

Следует провести тестирование некоторых гипотез о качестве модели.

Начинают с теста на значимость коэффициентов регрессии.

Рассматриваемая модель в общем виде:

Ji=ßl+ ß2*l2) +

■ + ßkxf+ei.

Тестируемая гипотеза Н0: рк = 0 - коэффициент, при какой - то переменной х(к) равен нулю, т.е. переменная х(к) не оказывает значимого влияния на переменную у. Альтернативная гипотеза Н^ рк Ф

0, т.е. переменная х(к) оказывает значимое влияние на переменную у.

На первом шаге тестирования значимости коэффициентов регрессии необходимо вычислить расчетное значение £ - статистики

с =-А-

где 5Е(р2) стандартная ошибка коэффициента

&

На втором шаге выбирается уровень значимости, т.е. вероятность ошибки первого рода, вероятность отклонить гипотезу Н0, если на самом деле она верна. Обычно используют уровень значимости а = 0,01, а = 0,05.

На третьем шаге находится критическое значение £ - статистики из таблиц £ - распределения Сть-юдента, которое зависит от уровня значимости а и числа степеней свободы, которое равно (п — к).

На четвертом шаге сравнивается расчетное и критическое значение Ь - статистик. Если | £расч | < £кр, то гипотезу Н0 нет оснований отклонить. В этом случае делают вывод о том, что переменная х(к) не оказывает значимого влияния на переменную у. Коэффициент при переменной х(к), в данном случае, незначим.

Тестирование гипотезы о том, что коэффициент рк = А. В данном случае расчетное значение £ - статистики

= $к—А

^ 1раСЧ $Е{Цк) ^

где ¡Зк - оценка коэффициента рк, БЕ((^к) -стандартная ошибка коэффициента /?2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доверительный интервал для оценки коэффициента регрессии строится согласно формуле

^п—к

•ЗЕ(0к),

где ¡Зк - оценка коэффициента , Ьп—к - табличное значение статистики, 5Е(рк) - стандартная ошибка коэффициента $2.

Доверительный интервал - это интервал, внутри которого истинное значение оцениваемого коэффициента ¡Зк находится с некоторой заданной вероятностью.

В случае множественной регрессии недостаточно тестировать гипотезу для отдельной переменной. Возникает необходимость тестирование значимости уравнения в целом.

Рассматриваемая модель

М)

+

■ + ßkx[k) + ei.

У1=01+Р2Х(' Тестируемая гипотеза Н0: р2 = ■■■ = рк = 0, т.е. все переменные х(22),...,х(к) не оказывают значимого влияния на переменную у или факторы, включенные в модель не существенны.

Альтернативная гипотеза Н1: хотя бы одна из

переменных х(22), ...,х(п-' оказывает значимое влияние на переменную у.

На первом шаге вычисляется расчетное значение ¥ статистики

Лк)

Я2

п — к

F =

Грасч 1-Я2 к — Г

2

l£i

где Д2 - коэффициент детерминации, п - число наблюдений модели, к - число коэффициентов модели.

На втором шаге выбирается уровень значимости. Обычно используют уровень значимости а = 0,01, а = 0,05.

На третьем шаге находится критическое значение F - статистики (/кр = 2,714) из таблиц F - распределения Фишера, которое зависит от уровня значимости а и числа степеней свободы, которые равны (п — и (^ — 1).

На четвертом шаге сравниваются расчетное и критическое значение Р - статистик. Если £расч > /кр, то нулевая гипотеза Н0 отклоняется, т.е. все пе-оказывают значимое влияние

ременные х(2), ...,х на переменную у.

(fc)

Проведенный расчет показал, что модель в целом значима, однако не все оценки параметра значимы. Такая ситуация является одним из признаков наличия в модели мультиколлинеарных факторов. В случае мультиколлинеарности оценки параметров модели становятся неустойчивыми.

Полученный вывод проверили, отбросив первые два и последние три наблюдения, и построили модель по «усеченной» выборке. В полученной модели оценки параметров существенно не изменились.

Далее проверили присутствие в модели муль-тиколлинеарных факторов. Для этого построили матрицу парных коэффициентов корреляции с помощью процедуры «корреляция» пакета анализа и получили таблицу 2.

Таблица 2

У Xi *2 *3 Х4 Х5 Хб

У 1

Xi 0,504113 1

0,558314 0,525989 1

0,688386 0,683989 0,558737 1

0,619441 0,566137 0,720469 0,809141 1

0,163939 -0,27161 -0,22216 0,006189 -0,01921 1

0,495235 0,265987 0,568741 0,43592 0,354863 0,265873 1

В построенной модели присутствует две пары мультиколлинеарных признаков (модуль коэффициента корреляции коэффициента больше 0,7):

Х2, Х4 и Х3, Х4.

Модуль коэффициента корреляции между у и х3 равный 0,69 больше, чем модуль между у и х4 равный 0,62, следовательно, из модели следует удалить х4.

Порядок включения факторов в модель, определяется с использованием первого столбца матрицы парных коэффициентов корреляции (таблица 2): Х3, Х2, Хх, Хб, х5.

В итоге получается модель: у = 874,2 — 7,3хх + 4,6 х2 — 8,7х3 + 9,43х5 + 2,3х6,

Для которой стандартная ошибка регрессии равна 5ЯЯ = = 0,13, скорректированный коэффициент - Д2^ = 0,9999. Согласно полученным значениям К,асч = 42853,5; /^(0,05; 18) = 2,71,

делается вывод о значимом влиянии факторов на отклик у.

Таким образом, методами математической статистики установлено влияние заданных факторов на расход бюджета Российской Федерации.

Список литературы

1. Бунтова Е.В. Способы анализа результатов наблюдений методами математической статистики // Инновации в науке. Новосибирск.- 2017. №1(62) С.42-50.

2. Бабешко Л.О. Основы эконометрического моделирования: учебное пособие. Издание 2-е, исправленное. -М.: КомКнига, 2006.- 432 с.

3. Доугерти К. Введение в эконометрику: учебник, 2-е издание, перевод с англ.-М.:ИНФРА-М.2004.-418 с.

4. Ефремова Е.А. Этапы эконометрического моделирования // Экономика и менеджмент инновационных технологий. 2016. № 6 [Электронный ресурс]. URL: http://ekonomika.snauka.ru/2016/06/12151

5. Слуцкин Л.Н. Анализ стабильности модели линейной регрессии во времени // Прикладная эконометрика. 2007. Выпуск №2.

i Надоели баннеры? Вы всегда можете отключить рекламу.