Научная статья на тему 'Разработка методики прогнозирования с использованием корреляционно-регрессионного анализа'

Разработка методики прогнозирования с использованием корреляционно-регрессионного анализа Текст научной статьи по специальности «Экономика и бизнес»

CC BY
3275
427
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТОЧНОСТЬ / ОДНОРОДНОСТЬ / ЗАКОН НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ / КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ / ТРЕХВАРИАНТНЫЙ ПРОГНОЗ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Андреева Н.В., Червякова М.Ю.

В статье с помощью корреляционно-регрессионного анализа выявлены наиболее значимые показатели, влияющие на объем жилищного фонда, определена взаимосвязь между ними и построено уравнение регрессии. На основе уравнения регрессии спрогнозированы объемы жилищного строительства во Владимирской области до 2015 г. на основе трехвариантной модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка методики прогнозирования с использованием корреляционно-регрессионного анализа»

37 (340) - 2013

Анализ видов экономической

деятельности

УДК 336.717

РАЗРАБОТКА МЕТОДИКИ ПРОГНОЗИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА

Н. В. АНДРЕЕВА,

доктор экономических наук, профессор кафедры экономики и управления инвестициями и инновациями E-mail: kafedra-euii@mail. ru Владимирский государственный университет им. Александра Григорьевича и Николая Григорьевича Столетовых

М. Ю. ЧЕРВЯКОВА, экономист-менеджер, г. Владимир E-mail: kafedra-euii@mail. ru

В статье с помощью корреляционно-регрессионного анализа выявлены наиболее значимые показатели, влияющие на объем жилищного фонда, определена взаимосвязь между ними и построено уравнение регрессии. На основе уравнения регрессии спрогнозированы объемы жилищного строительства во Владимирской области до 2015 г. на основе трехвариантной модели.

Ключевые слова: точность, однородность, закон нормального распределения, корреляционно-регрессионный анализ, трехвариантный прогноз.

Выбор базовых показателей является важнейшим этапом в определении существенности, а потому обязательно должен быть обоснованным. Даже если кажется, что выбор сделан правильно, то для его утверждения необходимо привести множество доказательств помимо собственного профессионального суждения. Объективными дока-

зательствами могут служить лишь строгие математические расчеты, которые соответствуют какому-либо методу принятия решений, а зачастую целой группе или даже последовательности методов. Для обоснования набора базовых показателей, используемых при расчете уровня существенности и долей, применяемых к этим показателям, целесообразно использовать метод корреляционно-регрессионного анализа. Приемы корреляционного анализа используются для измерения степени влияния факторов, когда взаимосвязь между показателями неполная, вероятностная [7, 8].

Цель регрессионного анализа — установить конкретную аналитическую зависимость одного или нескольких результативных показателей от одного или нескольких признаков-факторов [2].

Корреляцию и регрессию принято рассматривать как совокупный процесс статистического исследования, поэтому их использование в статистике

38

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ж8бРЪЯ it ЪР/ГКЖЪХА

часто именуют корреляционно-регрессионным анализом, который доказывает, что изменение любого экономического показателя зависит от большого числа факторов, но из них лишь некоторые оказывают существенное воздействие на исследуемый показатель. Доля влияния остальных факторов столь незначительна, что их игнорирование не может привести к существенным отклонениям исследуемого объекта. В большинстве случаев между экономическими явлениями не существует строгой функциональной взаимосвязи, поэтому в экономике говорят не о функциональных, а о корреляционных или статистических зависимостях [6—8].

При рассмотрении таких взаимосвязей выделяют одну величину как независимую (результативный показатель), а другие — как зависимые (факторные показатели). При рассмотрении зависимости двух случайных величин говорят о парной регрессии (корреляции). Зависимость нескольких переменных называют множественной регрессией (корреляцией).

Первым этапом проведения корреляционно-регрессионного анализа в рамках данного исследования является определение результативного показателя и факторных показателей-признаков. В качестве результативного показателя было бы логичным выделить уровень существенности, однако в таком случае ввиду отсутствия обоснованной методики расчета уровня существенности числовые значения данного показателя, рассчитанные исключительно на основании профессионального суждения, могут оказаться необъективными и привести к неточным результатам анализа или к неправильным выводам.

Отбор факторных показателей для корреляционно-регрессионного анализа — также очень важный момент. От того, насколько правильно отобраны факторы, зависят конечные результаты анализа. Главная роль при отборе факторов принадлежит теории, а также практическому опыту анализа.

При этом необходимо придерживаться следующих правил [8]:

- следует учитывать причинно-следственные связи между показателями, ибо только они раскрывают сущность изучаемых явлений. Анализ же таких факторов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла;

- при создании многофакторной корреляционной модели необходимо отбирать самые зна-

чимые факторы, которые оказывают решающее воздействие на результативный показатель, так как охватить все условия и обстоятельства практически невозможно. Факторы, которые имеют критерий надежности по Стьюденту меньше табличного, не рекомендуется принимать в расчет;

- в корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер.

Учитывая перечисленные требования, для многофакторной корреляционной модели объема жилищного фонда были подобраны следующие факторы:

- валовой региональный продукт Х1;

- среднедушевые денежные доходы населенияХ2;

- среднемесячная номинальная начисленная заработная плата работников организаций Х3;

- численность экономически активного населения Х4;

- объем ветхого и аварийного жилищного фонда Х5;

- предприятия по виду экономической деятельности «строительство» Х6;

- объем основного фонда по виду экономической деятельности «строительство» Х7.

Поскольку корреляционная связь достаточно полно проявляется только в массе наблюдений, объем выборки данных должен быть большим, так как в этом случае сглаживается влияние других факторов. Чем большая совокупность объектов исследуется, тем точнее результаты анализа.

Однако следует помнить, что для проведения корреляционно-регрессионного анализа выбранная совокупность данных должна удовлетворять определенным условиям, следовательно, необходимо провести проверку анализируемых факторов на соответствие таким условиям и исключить из совокупности те, которые не удовлетворяют им. В первую очередь необходимо убедиться в достоверности информации, соответствии ее объективной действительности, поскольку использование недостоверной информации приведет к неточным результатам анализа и к неправильным выводам.

Информация должна быть однородной относительно ее распределения около среднего уровня. Если в совокупности имеются группы объектов, которые значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации.

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жебрпя -и ЪР^тжгсх*

39

Критерием однородности информации являются среднеквадратическое отклонение и коэффициент вариации, которые рассчитываются по каждому факторному и результативному показателю.

Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднего арифметического. Его значение определяется по формуле [8]

-\2

X(x- x)

с = ■

где с — среднеквадратическое отклонение;

х — 7-е значение показателя;

x — среднее арифметическое значение показателя;

n — количество наблюдений.

Коэффициент вариации V показывает относительную меру отклонения отдельных значений от среднего арифметического. Он рассчитывается по формуле

V = С 100

x

Чем больше коэффициент вариации, тем относительно больший разброс и меньшая вы-равненность изучаемых объектов. Изменчивость вариационного ряда принято считать:

- незначительной, если вариация не превышает 10 %;

- средней, если вариация составляет 10—20 %;

- значительной, если вариация составляет больше 20 %, но не превышает 33 %.

Вариация выше 33 % свидетельствует о неоднородности информации и о необходимости исключения нетипичных наблюдений, которые обычно бывают в первых и последних ранжированных рядах выборки.

Результаты проверки исходных данных выборки на однородность представлены в табл. 1.

Проанализировав результаты, можно сделать вывод, что по большинству показателей выборку нельзя признать однородной, так как коэффициент вариации значительно превышает 33 %. Однако и пойти по методу исключения нетипичных наблюдений также нельзя, потому как это значительно сократит количество элементов выборки и понизит точность выводов. Таким образом, устранить неоднородность данных можно только путем исключения из анализа тех показателей, по которым коэффициент вариации превышает 33 %, т. е. оставив в составе исходных данных следующий набор показателей: Х2, Х3, Х4, Х5, Х6.

Но прежде чем утвердить новый состав факторных показателей, проверим, выполняется ли последнее условие корреляционно-регрессионного анализа — соответствие исходной информации закону нормального распределения.

Подчинение исходной информации закону нормального распределения означает, что основная масса исследуемых данных по каждому показателю должна быть сгруппирована около ее среднего значения, а объекты с очень маленькими или очень большими значениями должны встречаться как можно реже.

Для количественной оценки степени отклонения информации от нормального распределения используются отношение показателя асимметрии к ее ошибке и отношение показателя эксцесса к его ошибке.

Показатель асимметрии А рассчитывается по формуле

A =

Z(X7 - Х)

.3

nc

а его ошибка ma — по формуле [1, 2] Í6

ma = л/" •

V n

Таблица 1

Показатели статистической однородности исходной информации

n

Показатель Среднеарифметическое значение Среднеквадратическое отклонение Вариация, %

Y 35,08571 0,962777 2,74407

X 9 189,143 3 514,134 38,24224

X 184 504 49 830,65 27,0079

X 11 928,31 1 978,198 16,58405

X 778 17,9364 2,305449

X 1,200286 0,095918 7,991239

X 2 678,286 383,5681 14,3214

X 4 120,714 1 417,559 34,4008

40

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ж80РЪЯ те ЪРЖЖЪЫ

Показатель эксцесса Е рассчитывается по

формуле

E =

Z(x< - х)

na

а его ошибка me — по формуле /24

В симметричном распределении А = 0. Отличие от нуля указывает на наличие асимметрии в распределении данных около средней величины. Отрицательная асимметрия свидетельствует о преобладании данных с большими значениями; положительная асимметрия — о том, что чаще встречаются данные с небольшими значениями.

В нормальном распределении показатель эксцесса Е = 0. Если Е > 0, то данные густо сгруппированы около средней, образуя островершинность. Если Е < 0, то кривая распределения будет островершинной. Однако когда отношения A Im и E I me меньше 3, то асимметрия и эксцесс не имеют существенного значения, и исследуемая информация соответствует закону нормального распределения. Ошибка асимметрии и ошибка эксцесса составляют соответственно 0,925 и 1,852.

Результаты проверки исходной информации на соответствие закону нормального распределения представлены в табл. 2.

В данном случае закону нормального распре -деления соответствуют все исходные данные, по которому отношения A /т и E I me по абсолютной величине превышают 3.

Таким образом, исходная совокупность данных для проведения корреляционно-регрессионного анализа, отвечающая трем перечисленным условиям, состоит из следующих показателей: X2, X3,

X4, X5, X6 •

Следующим этапом исследования являются определение тесноты взаимосвязи между результативным и факторными показателями и подбор уравнения, выражающего данную зависимость.

Для его обоснования используются те же приемы, что и для установления наличия связи: аналитические группировки, линейные графики и др.

Зависимость показателей может носить как прямолинейный, так и криволинейный характер, причем, как уже отмечалось, в корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер.

Таким образом, чтобы обосновать тип уравнения связи, необходимо определить ее характер, для чего строится точечный график зависимости. Размещение точек на графике покажет, какая зависимость образовалась между изучаемыми показателями — прямолинейная или криволинейная. Точечные графики зависимостей между результативным показателем и каждым из факторных показателей представлены на рис. 1—5.

36,5 36 35,5 35 34,5 34 33,5 33

о

0 5 000 10 000 15 000 20 000 Среднедушевые денежные доходы, руб.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 1. Зависимость объема жилищного фонда от среднедушевых денежных доходов населения Х2

Таблица 2

Показатели статистического соответствия исходной информации закону нормального распределения

me =

Переменная Асимметрия Эксцесс Отношение асимметрии к ее ошибке Отношение эксцесса к его ошибке

Y —0,18 1,73 —0,20 0,93

Xi 0,02 1,64 0,02 0,88

X2 —0,26 2,14 —0,28 1,15

X3 1,12 2,95 1,21 1,59

X4 0,31 1,95 0,33 1,05

X5 —0,93 2,50 —1,01 1,35

X6 —0,56 1,77 —0,60 0,95

X7 0,62 1,74 0,67 0,94

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ш5б7>ЪЯ те ЪР*?жг(Ъ4

41

а

о

£

я

Ю

О

36,5 36 35,5 35 34,5 34 33,5 33

0 5 ООО 10 ООО 15 ООО 20 ООО Среднемесячная заработная плата, руб.

Рис. 2. Зависимость объема жилищного фонда от среднемесячной номинальной начисленной заработной платы работников организаций по виду экономической деятельности «строительство» X3

Между объемом жилищного фонда и валовым региональным продуктом существует зависимость, которая носит прямолинейный характер. Следует отметить, что наблюдается некоторый разброс точек на графике, однако это объясняется тем, что объем выборки невелик, поэтому не все точки тренда находятся на одинаково близком расстоянии от него.

Изучение взаимосвязей между исследуемыми факторами и величиной прибыли до налогообложения показало, что все зависимости в исследовании имеют прямолинейный характер, поэтому для их описания целесообразно использовать уравнение линейной функции. Так как в данном случае корреляционно-регрессионный анализ является множественным (многофакторным), линейная функция может быть выражена в виде уравнения

Y = a + bX + bX +••• + b X.

x 112 2 n n

В данной модели коэффициенты b. показывают, на сколько единиц изменяется результативный показатель с изменением факторного на единицу в абсолютном выражении.

Решение задачи многофакторного корреляционного анализа требует множества громоздких расчетов, очень трудоемко, поэтому в данном исследовании такой анализ проводился с использованием программы Excel.

Сначала формируется таблица исходных данных (табл. 3).

Данные сведения вводятся в программу Excel [1], и на их основании рассчитываются

а

о

£

ю

о

36,5 36 35,5 35 34,5 34 33,5 33

X

X

740 760 780 800 820 Численность экономически активного населения

Рис. 3. Зависимость объема жилищного фонда от численности экономически активного населения Х,

а

о

£

ю

о

36,5 36 35,5 35 34,5 34 33,5 33

94 96 98 100

Объем ветхого и аварийного жилищного фонда, млн м2

Рис. 4. Зависимость объема жилищного фонда от объема ветхого и аварийного жилищного фондов Х5

36,5 36 35,5 35 34,5 34 33,5 33

а

о

О

0 5 000 10 000 15 000 20 000 Предприятия

Рис. 5. Зависимость объема жилищного фонда от численности предприятий по видам экономической деятельности «строительство» Х6

Таблица 3

Исходные данные для корреляционного анализа за 2005—2011 гг.

Показатели 2005 2006 2007 2008 2009 2010 2011

Жилищный фонд, млн м2 33,6 34 34,8 35,1 35,6 36,1 36,4

Среднедушевые денежные доходы 4 107 5 627 7 015 9 480 10 827 12 956 14 312

населения, руб.

Среднемесячная номинальная начисленная 11 156,8 10 098,9 13 469,5 10 148,4 11 071,8 11 502,3 16 050,5

заработная плата работников организаций по

виду экономической деятельности «строи-

тельство», руб.

Численность экономически активного 809 792 787 776 755 758 769

населения, тыс. чел.

Объем ветхого и аварийного жилищного 1,108 1,224 1,287 1,298 1,246 1,227 1,012

фонда, млн м2

Предприятия по видам экономической де- 2 029 2 237 2 559 2 883 2 896 3 070 3 074

ятельности «строительство», ед.

матрица коэффициентов корреляции, уравнение множественной регрессии, а также показатели, с помощью которых оценивается надежность коэффициентов корреляции и уравнения связи.

Изучая матрицу коэффициентов корреляции, можно сделать вывод о тесноте связи между изучаемыми явлениями. Коэффициенты парной корреляции характе-

чим уравнение вида У = 0,00017 Х1 — 0,0024 Х2 + + 0,276 Х3 — 0,00079 Х4 + 33,51.

Средняя ошибка аппроксимации составляет: множественный Я = 0,99274681.

Статистическая значимость, полученная в результате расчета:

- У-пересечение = 2,154222803;

- Х2 = 0,610244405;

- Х4 = 0,134932532;

- Х5 = — 0,087181134;

- Х6 = 0,379356958.

Прогноз жилищного развития Владимирской области на 2012—2015 гг. разработан на основе анализа тенденций развития экономики, сложившихся в 2011 г., исходя из целей и задач долгосрочной целевой программы «Жилище» на 2011—2015 гг.

Прогнозные расчеты осуществлялись на основе уравнения корреляционно-регрессионного анализа и построения трехвариантной модели.

Первый вариант — консервативный (рис. 7). Разработан в условиях сохранения рисков невысокого инвестиционного спроса, слабого роста потребительского спроса, медленного восстановления

Y X2 X3 X4 X5 X6

Y 1

X2 0,989699 1

X3 0,540945 0,507154 1

X4 —0,89178 —0,87639 —0,16499 1

X5 0,826887 0,790382 0,76715 —0,84081 1

X6 0,97103 0,959173 0,383919 —0,91735 0,909428 1

Рис. 6. Матрица парных коэффициентов корреляции

ризуют тесноту связи между двумя показателями в общем виде с учетом взаимодействия с остальными факторами, определяющими уровень результативного показателя. Матрица парных коэффициентов корреляции для анализа представлена на рис. 6.

Зная коэффициент корреляции, можно дать качественно-количественную оценку тесноты связи (табл. 4).

Исходя из градации, приведенной в табл. 4, можно утверждать, что данные по среднемесячной номинальной начисленной заработной плате можно исключить, так как они оказывают наименьшее влияние на объем жилищного фонда.

Составим с помощью программы Excel уравнение множественной парной регрессии и полу-

Таблица 4 Качественная оценка тесноты связи

Величина коэффициента Характеристика

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

парной корреляции силы связи

До 0,3 Практически отсутствует

0,3—0,5 Слабая

0,5—0,7 Заметная

0,7—0,9 Сильная

0,9—0,99 Очень сильная

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ш5б7>теЯ те ЪР*?жгеЪ4

43

кредитной активности. Составлялся на основе уравнения корреляционно регрессионного анализа У = 0,00017 — — 0,0024 X + 0,276 X— 0,00079 Х4 + + 33,51.

Наблюдается рост объемов жилищного фонда на 0,08 %.

Второй вариант — умеренный или средний (рис. 8). Отражает более быстрое восстановление экономики на основе повышения эффективности бизнеса, увеличения объемов жилищного фонда, а также стимулирования экономического роста и модернизации (2,5—3,6 %). Заложим среднее арифметическое 3,05 %.

Наблюдается рост объемов жилищного фонда на 2 %.

Третий вариант — оптимистический (рис. 9). В него закладываются усовершенствование современных материально оснащенных строительных организаций, внедрение эффективных наукоемких энергосберегающих технологий, обеспечение повышения качества и конкурентоспособности строительной продукции, строительных материалов, изделий и конструкций, обеспечение высоких потребительских характеристик зданий и сооружений, их надежность, безопасность, комфортность, увеличение объемов жилищного фонда (3,5—4,6 %). Заложим среднее арифметическое 4,05 %.

Наблюдается рост объемов жилищного фонда на 2,85 %.

На основе трех вариантов прогноза и требований постановления [4] можно рассчитать, сколько жилья будет приходиться на одного жителя с учетом развития демографической ситуации в области (рис. 10).

К 2015 г. по отношению к 2011 г. данный показатель должен увеличиться на 6 % по консервативному варианту, по умеренному — на 9,6 %, по оптимистическому — на 16 %. Таким образом, наблюдается тенденция стабильного роста показателя по трем вариантам прогноза.

38,5

38

37,5

37

36,5

36

35,5

¡8,035

¡7,588

37,14

¡6,693

2011

2012

2013

2014

2015

Рис. 7. Прогноз роста объемов жилищного фонда по консервативному варианту на 2011 —2015 гг., млн м2

4039,5

39 38,5 38 37,5 37 36,5 36 35,5 35

34,5

39,401

38,628

37,871

37,128

36,4

2011

2012

2013

2014

2015

Рис. 8. Прогноз роста объемов жилищного фонда по умеренному варианту на 2011 —2015 гг., млн м2

44 43 42 41 40 39 38 37 36 35 34 33

ао сек

41,004

¡9,408

37,874

36,4

2011

2012

2013

2014

2015

Рис. 9. Прогноз роста объемов жилищного фонда по оптимистическому варианту на 2011 —2015 гг., млн м2

Рис. 10. Прогноз роста площади жилых помещений на одного жителя Владимирской области на 2012—2015 гг., м2

Список литературы

1. Бараз В. Р. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel: учеб. пособие. Екатеринбург: УГТУ—УПИ, 2005.

2. Глинский В. В., Ионин В. Г. Статистический анализ: учеб. пособие. М.: ИНФРА-М, 2002.

3 . Левковская Т.Н., Девятерикова О. Н. Разработка методики расчета уровня существенности с использованием корреляционно-регрессионного анализа // Научный вестник Костромского государственного технологического университета. 2012. N° 1. URL: http://vestnik. kstu. edu. ru/numbers. php?id_k=17/.

4. О Концепции демографической политики во Владимирской области до 2015 года: указ губернатора Владимирской области от 19.02.2007 № 7.

5. О федеральной целевой программе «Жилище» на 2011—2015 годы: постановление Правительства РФ от 17.12.2010 № 1050 (ред. от 12.09.2011).

6 . Переяслова И. Г., Колбачев Е. Б. Статистика: учеб. пособие. Ростов н/Д: Феникс, 2007.

7. Савицкая Г. В. Анализ хозяйственной деятельности предприятия: учебник. М.: ИНФРА-М, 2008.

8. Савицкая Г. В. Теория анализа хозяйственной деятельности: учеб. пособие. М.: ИНФРА-М, 2008.

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жеорпя те ЪР*?жгеЪ4

45

i Надоели баннеры? Вы всегда можете отключить рекламу.