Научная статья на тему 'О применимости корреляционного анализа для исключения факторов в регрессионно-дифференциальных моделях'

О применимости корреляционного анализа для исключения факторов в регрессионно-дифференциальных моделях Текст научной статьи по специальности «Экономика и бизнес»

CC BY
443
75
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ / МОДЕЛИРОВАНИЕ / ПРОГНОЗИРОВАНИЕ / РЕГРЕССИЯ / СОЦИАЛЬНО-ЭКОНОМИЧЕСКАЯ СИСТЕМА / DIFFERENTIAL EQUATION / MODELING / PREDICTION / REGRESSION / SOCIO-ECONOMIC MODEL

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Григалашвили Алена Сергеевна, Кокшарова Лилия Фаилевна, Зуева Ирина Олеговна

Рассмотрена гипотеза о возможности исключения невлияющих факторов на регрессионно-дифференциальную модель на основе значений парных корреляций. Предположение проверено на трех социально-экономических системах. Построены регрессионно-дифференциальные модели динамики рождаемости, уровня образования и инновационной деятельности в РФ. Выбраны из числа общедоступных годовых статистических рядов частные критерии и факторы, потенциально влияющие на них. Представлены линейные многофакторные модели динамики этих систем, показано, что они не могут применяться для прогнозирования из-за плохого качества постпрогноза. Построены регрессионно-дифференциальные модели динамики этих систем, описано их преимущество перед линейными многофакторными в смысле качества прогнозирования. Оценена парная корреляция факторов, ряды факторов с высокой парной корреляцией исключены из регрессионно-дифференциальных моделей. Таким образом доказано, что высокая взаимная корреляция рядов не является достаточным основанием для исключения годового ряда факторов из регрессионно-дифференциальной модели социально-экономической системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Григалашвили Алена Сергеевна, Кокшарова Лилия Фаилевна, Зуева Ирина Олеговна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of Correlation Analysis to Exclude Factors from Regression-Differential Models

The paper considers the hypothesis aboutthe possibility of excludingfactors not influencing theregression-differential modelbased on the valuesof pair correlations. The assumptionis verifiedon the threesocio-economic systems. Linear multifactor and regression-differential models of fertility, educational level and innovation activity in Russia are built. An advantage of differential models for forecasting is in good quality of post-prognosis. Pair correlations between factors are estimated. Series of factors with a high correlation was excluded from the differential model. As a result, an error of post-prognosis grows significantly. Thus, a high linear correlation between annual series of factors is not a sufficient basis for excluding them from regression-differential models.

Текст научной работы на тему «О применимости корреляционного анализа для исключения факторов в регрессионно-дифференциальных моделях»

УДК 51-77

Б01: 10.17277/уе81шк.2016.01.рр.035-044

О ПРИМЕНИМОСТИ КОРРЕЛЯЦИОННОГО АНАЛИЗА ДЛЯ ИСКЛЮЧЕНИЯ ФАКТОРОВ В РЕГРЕССИОННО-ДИФФЕРЕНЦИАЛЬНЫХ МОДЕЛЯХ

А. С. Григалашвили, Л. Ф. Кокшарова, И. О. Зуева

Кафедра «Автоматизация технологических процессов», Березниковский филиал ФГБОУВПО «Пермский национальный исследовательский политехнический университет», г. Березники; atp@bf.pstu.ru

Ключевые слова: дифференциальное уравнение; моделирование; прогнозирование; регрессия; социально-экономическая система.

Аннотация: Рассмотрена гипотеза о возможности исключения невлияю-щих факторов на регрессионно-дифференциальную модель на основе значений парных корреляций. Предположение проверено на трех социально-экономических системах. Построены регрессионно-дифференциальные модели динамики рождаемости, уровня образования и инновационной деятельности в РФ. Выбраны из числа общедоступных годовых статистических рядов частные критерии и факторы, потенциально влияющие на них. Представлены линейные многофакторные модели динамики этих систем, показано, что они не могут применяться для прогнозирования из-за плохого качества постпрогноза. Построены регрессионно-дифференциальные модели динамики этих систем, описано их преимущество перед линейными многофакторными в смысле качества прогнозирования. Оценена парная корреляция факторов, ряды факторов с высокой парной корреляцией исключены из регрессионно-дифференциальных моделей. Таким образом доказано, что высокая взаимная корреляция рядов не является достаточным основанием для исключения годового ряда факторов из регрессионно-дифференциальной модели социально-экономической системы.

Моделирование социально-экономических систем является одним из основных методов оценки характеристик сложных систем, используемых для принятия решений в различных сферах деятельности [1 - 4].

Для построения прогнозных моделей социально-экономических систем используются [5] временные ряды, авторегрессионные модели разных порядков, модели в пространстве состояний, в том числе с применением фильтрации данных, а чаще всего - линейные многофакторные модели (ЛММ) вида

где >>(0 - значение критерия оценки деятельности социально-экономической системы в момент времени V, а0 - параметр модели, описывающий ее состояние в отсутствие воздействий; а, - вес фактора, / = 1, ..., п; х() - факторы (управляющие воздействия). Идентификация весов факторов производится минимизацией

n

(1)

погрешности аппроксимации исходных данных или погрешности постпрогноза в пределах известных данных.

Дополнительные проблемы возникают при оснащении моделей, если использовать только открытые данные Росстата или любые другие разреженные данные, что особенно важно при решении задач тактического прогнозирования последствий управленческих решений в интересах предприятий и общественных организаций.

В работе [6] показано, что в ряде случаев регрессионно-дифференциальные модели (РДМ) на основе обыкновенного дифференциального уравнения (ОДУ) первого порядка с соответствующей задачей Коши вида

^ = а0 + X а1Х1 () + ап+1 У() = /(X х(X *) (2)

у(0) = 0,

где обозначения могут быть предпочтительнее, чем линейные многофакторные модели вида (1). В работе [7] в задачах моделирования эколого-экономических систем вида (2), показано преимущество РДМ вида (2) перед моделями других видов.

Итоговая оценка деятельности социально-экономической системы, как правило, формируется в виде линейной свертки частных критериев У(()

N

у( ) = Х а1Г1 (*), (3)

,=1

где а, > 0 - весовое значение частного критерия.

Общепринятым для определения а, является подход, когда путем экспертных заключений или на основании дополнительной информации определяются ранги значимости частных критериев К,, при этом меньшие значения рангов соответствуют большей значимости критериев, например,

а,■ = К~. (4)

Чтобы исключить влияние размерности, выполняется нормирование рядов частных критериев и факторов. Для этого находятся максимальное и минимальное значения критерия в ряде, затем производится нормирование по формуле

7 (*)= 7 (>)-ш'", 7( '■) (5)

1 тах У, (*) - тт, У, ()

г

Затем У, () используется в (3) вместо 7,(0. Факторы нормируются аналогично.

При разреженных данных, кроме идентификации а, в (2), необходимо определить вид интерполяции между значениями годового ряда, так как интегрирование (2) с большим шагом по времени приводит к высокой погрешности. В статистике значения факторов могут быть приведены в начале или конце года (ступенчатая интерполяция), или значение фактора может изменяться линейно (линейная интерполяция). Кроме того, фактор в (2) может быть выбран исследователем ошибочно, и требуется формализованная процедура оценки применимости фактора.

Для линейных многофакторных моделей вида (1) исключение зависимых факторов возможно на основе оценки коэффициента парной корреляции [8] вида

Х(Х (*)- Х, )(х] (*)- Х])

г, = , к е [-1,1], (6)

Х(х (*)-х )2 (()-Х])

V к к

1 K 1 K

где средние значения х, = — V х, (tk) и х]- = — V х]- (tk); I, ] - номера факторов;

Kk=1 Kk=1 К - число значений факторов (продолжительность годового ряда). Если модуль Гу близок к единице, это означает, что 1-й фактор линейно зависит от ¡-го фактора, и конечная модель не ухудшится, если один из факторов из нее исключить.

Построением дифференциальных моделей сложных социально-экономических систем занимались многие ученые, например [9, 10] и др. Однако предположения о том, можно ли исключать из модели несущественные или зависимые факторы в РДМ вида (2) на основе значений их парной корреляции, не проверены. Также не существует метода, позволяющего априори определить, какие факторы можно отбросить в РДМ.

Отброс факторов производится в порядке возрастания модулей их коэффициентов и оценки ухудшения аппроксимации или прогнозных свойств РДМ при исключении фактора. Возникает необходимости многократно производить идентификацию весов в (2), что ведет к большим вычислительным затратам.

Предположим, что так же, как и для ЛММ (1) большой модуль коэффициента (5) может указывать на возможность исключения одного из пары факторов в РДМ (2). Проверим данную гипотезу на примере нескольких социально-экономических систем.

В качестве первого примера выбрана динамика рождаемости в РФ. Данный критерий зависим от многих факторов, сведения о которых общедоступны, например, численности населения, миграции, уровня жизни и образования, развития здравоохранения. В соответствии с поставленной задачей, рассмотрим все возможные (и доступные на сайте Росстата) факторы, значения которых могут влиять на динамику рождаемости:

- численность населения X\;

- число женщин на 1000 мужчин в возрасте от 15 - 49 лет, именно этот возраст считается детородным, Х2;

- количество браков, заключение большинства которых приводит к рождению детей, Х3;

- среднемесячная номинальная начисленная заработная плата одного работника Х4. Как правило, молодые люди не решаются на рождение детей, пока не будут уверены в своей финансовой независимости;

- число семей, получивших жилье и улучшивших жилищные условия, Х5. Данный фактор играет немалую роль в создании семьи и ее увеличении;

- число дошкольных образовательных учреждений Х6. В последние годы их недостаточное количество - актуальная проблема для молодых семей.

Проведен корреляционный анализ факторов. Высокую парную корреляцию имеют факторы:

Х2 и Х4 (г24 = - 0,95377);

Х2 иХ6 (г26 = 0,97011);

Х4 и Х6 (г46 = - 0,96981).

Отсюда следует предположение, что два из трех факторов незначительны в модели, и их можно отбросить. Данную гипотезу проверим при построении модели (1) (если прогноз будет удовлетворительным) и РДМ.

Возьмем статистические данные по всем вышеперечисленным факторам в течение шести лет. Условно неизвестной для постпрогноза примем рождаемость в последнем (шестом) году. На основе известных данных по пяти годам строятся постпрогнозы по моделям (1) и (2). Полученный результат сравнивается с известными данными о рождаемости шестого года. Увеличение продолжительности

постпрогноза с контролем отклонения от известных данных позволяет в первом приближении определить горизонт прогноза для данной модели.

Постпрогноз на один год при использовании ЛММ достаточно качественный. Так как важность фактора в ЛММ прямо пропорциональна модулю его коэффициента, фактор с наименьшим значением по модулю а2 можно отбросить. Значения коэффициентов факторов в модели на основе ЛММ: Х1 = -0,1751; Х2 = -0,0173; Х3 = -0,1708; Х4 = 0,8246; Х5 = 0,0501; Х6 = -0,1994.

Затем проверена возможность отброса остальных факторов. Результаты исключения из модели факторов приведены в табл. 1. Погрешность постпрогноза на один год при исключении из модели фактора Х2 (число женщин на 1000 мужчин) уменьшается в 1,8 раз, что соответствует хорошей корреляции между вторым и шестым факторами. Несмотря на высокое значение коэффициента парной корреляции г46, исключение факторов Х4 или Х6 значительно ухудшает постпрогноз. Следовательно, эти и остальные факторы должны учитываться в линейной многофакторной модели для построения прогноза.

Далее построена РДМ первого порядка. Поиск наилучших интерполяций факторов был проведен генетическим алгоритмом. В результате получена следующая комбинация - 0Л1Л0Х, где «0» - интерполяция влево, «Л» - линейная интерполяция, «1» - интерполяция вправо, «X» - фактор отключен. Фактор Х6 отброшен, что совпадает с результатом корреляционного анализа.

Далее отключаем факторы так же, как и при исследовании ЛММ.

Гипотеза о возможности исключения фактора из РДМ на основе корреляционного анализа подтверждена в отношении факторов Х2 и Х6.

Таким образом, можно предположить, что на динамику рождаемости в стране влияние оказывает число зарегистрированных браков, что вполне естественно, так как большинство браков между молодыми людьми, создающими семьи, впоследствии приводит к рождению детей. Уровень дохода влияет на сознание людей в том смысле, пора или не пора заводить детей. Условия, в которых будет семья расширяться, также немаловажны. Численность населения, оказалась незначительным фактором, можно предположить, что это возможно из-за малых изменений его значения в течение взятого периода (2007, 2008 гг. - 142,8 млн чел., 2009 г. -142,7 млн чел., 2010, 2011 гг. - 142,9 млн чел., 2012 г. - 143 млн чел.). Число женщин на 1000 мужчин в возрасте 15 - 49 лет (Х2) существенно не влияет на динамику рождаемости. Число дошкольных общеобразовательных учреждений

Таблица 1

Значение погрешностей прогноза при отключении факторов

Факторы Погрешность постпрогноза на один год по ЛММ Степень важности в ЛММ Погрешность прогноза на основе РДМ Степень важности в РДМ

Включены все

факторы 0,001543 - 0,489431 -

Отключен: Х1 1,168960 Важен 0,182573 Не важен

Х2 0,000850 Не важен 0,129861 Не важен

Х3 1,657631 Важен 3,500591 Важен

Х4 9,455727 Важен 0,496217 Важен

Х5 0,102603 Важен 1,599055 Важен

Х6 0,905805 Важен 0,081853 Не важен

Х3, Х4, Х5 - - 0,276423 -

(Х6) также не влияет на динамику рождаемости в стране, - будет ли предоставлено ребенку место в детском саду, родители задумываются уже после того, как он родился.

В результате исследования независимого, а также совместного влияния оставшихся факторов на прогноз было выяснено, что динамика рождаемости зависит от числа браков в стране, финансовой независимости и среднемесячного дохода граждан (в большей степени), а также от жилищных условий семьи, причем совместное увеличение последних двух факторов дает лучший результат, чем по отдельности. При этом гипотеза о возможности отброса одного из факторов при их высокой корреляции подтвердилась.

Вторым исследованным объектом был уровень образования, который характеризует развитие общества и общественных отношений. В качестве экономического показателя уровень образования населения является базой для развития науки и высокотехнологичных отраслей экономики и характеризует потенциал экономически активного населения как фактора производства. Выступая в качестве социального показателя, уровень образования способствует повышению культурного уровня населения, развитию таких направлений, как кинематография, литература, музыка, изобразительное искусство.

В данном случае уровень образования определяли числом аспирантов, кандидатов и докторов наук. При этом весовой коэффициент каждого из них установили 0,2; 0,3; 0,5 соответственно сложности получения того или иного звания.

В качестве факторов, которые могут оказать влияние на уровень образования населения, выбраны следующие:

- численность студентов, обучающихся на очном отделении, Х1;

- число организаций, ведущих подготовку аспирантов, Х2;

- число организаций, выполнявших научные исследования и разработки, Х3;

- среднемесячная номинальная начисленная заработная плата работников в сфере образования Х4;

- численность персонала, занятого научными исследованиями и разработками, Х5;

- финансирование науки из средств федерального бюджета Х6.

В результате проведения корреляционного анализа факторов выявлено, что высокую корреляцию друг с другом имеют факторы:

Х2 и Х4 (г24 = 0,96032);

Х2 иХ5 (г25 = - 0,98771);

Х2 иХ6 (г26 = 0,93936);

Х4 и Х5 (г45 = - 0,95736);

Х4 и Х6 (г46 = 0,98570);

Х5 и Х6 (г56 = - 0,92418).

Отсюда следует, что в линейной многофакторной модели из факторов Х2, Х4, Х5, Х6 должен остаться только один.

Построение линейной многофакторной модели показало, что она приближает значения к известным данным, однако, последний год прогнозирует с погрешностью 70 %. Поэтому применение ЛММ для прогнозирования поведения объекта невозможно.

При построении РДМ первого порядка в результате генетического перебора получена наилучшая интерполяция факторов 1Х1Х01. Факторы Х2 и Х4 могут быть отброшены, что частично совпадает с результатом корреляционного анализа, однако, несмотря на большое значение г56, ни Х5, ни Х6 отброшены быть не могут.

Далее осуществлена проверка значимости оставшихся (Хь Х3, Х5, Х6) факторов путем последовательного их исключения из модели. Она показала, что ис-

ключение хотя бы одного из них заметно увеличивает погрешность постпрогноза в среднем на 98 %. Таким образом, эти факторы не могут быть отброшены.

В результате всех вышеперечисленных действий РДМ имеет следующие окончательные коэффициенты факторов в модели: Х1 = -0,5875; Х2 = 0; Х3 = 0,6625; Х4 = 0; Х5 = -1,4982; Х6 = -1,8949.

Таким образом, число организаций, ведущих подготовку аспирантов, и среднемесячная номинальная начисленная заработная плата работников в сфере образования мало влияет на динамику уровня образования. При исключении этих факторов качество прогнозирования РДМ улучшается.

После исключения малозначащих факторов, определены факторы, которыми можно управлять: число организаций, выполнявших научные исследования и разработки (Х3); финансирование науки из средств федерального бюджета (Х6). Для каждого из этих факторов исследовано развитие объекта при малых отклонениях фактора от выявленной тенденции. При уменьшении/увеличении числа организаций, выполнявших научные исследования и разработки на 15 %, увеличится/ уменьшится уровень образования на 9 %. При уменьшении/увеличении финансирования науки из средств федерального бюджета на 15 %, уровень образования повысится/понизится на 16 %. Следовательно, чем меньше возможностей есть у человека, занимающегося наукой, тем изобретательней он становится.

Затем, подобные действия проведены с факторами, которыми невозможно управлять: численность студентов, обучавшихся на очном отделении (Х1), численность персонала, занятого научными исследованиями и разработками (Х5). Увеличение численности персонала, занятого научными исследованиями, а также увеличение численности студентов, обучающихся на очном отделении, может привести к повышению уровня образования населения. Это логично, так как чем больше персонала и студентов, тем больше научных трудов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сочетание различных отклонений одновременно управляемых и неуправляемых факторов показало, что наибольший рост динамики уровня образования населения достигается: если численность студентов, обучающихся на очном отделении и численность персонала, занятого научными исследованиями и разработками увеличится на 15 %; финансирование науки из средств федерального бюджета сократиться на 15 %.

Третьим объектом исследования является инновационная деятельность в РФ. Одним из ключевых направлений подъема российской экономики является вовлечение в хозяйственный оборот результатов научной и научно-технической деятельности. Хорошее развитие такой инновационной деятельности во многом определяет уровень национальной экономики.

С сайта Росстат выбраны годовые ряды следующих критериев за шесть лет, представленные ниже, так как именно они отражают тенденцию развития инновационной деятельности в РФ:

- число выданных патентов на изобретения У;

- созданные передовые производственные технологии У2;

- объем инновационных товаров работ и услуг промышленным предприятиям У3.

Ранг 1 присвоен частному критерию У3, как определяющему в оценке инновационной деятельности в РФ. Критерий оценки У2 отражает те технологии, которые созданы, но еще не запатентованы. Таким образом, этому критерию оценки присваивается ранг 2, а критерию У - ранг 3.

Определены факторы, влияющие на динамику инновационной деятельности:

- внутренние затраты на научные исследования и разработки Х\;

- финансирование науки и исследования из средств федерального бюджета Х2;

- специальные программные средства для научных исследований Х3;

- численность персонала, занятого научными исследованиями и разработками, Х4;

- число организаций, выполнявших научные исследования и разработки, Х5;

- число выпустившихся аспирантов с защитой диссертации Х6.

Корреляционный анализ показал факторы, имеющие наибольшую степень

корреляции - Х1 и Х2 (г!2 = 0,99428), Х4 и Х6 (г46 = 0,93132). Отсюда следует предположение, что один из двух факторов не значителен в модели, и в результате дальнейшего исследования эти факторы могут быть исключены.

Постпрогноз с использованием ЛММ даже на один год неудовлетворительный: погрешность прогноза при этом составляет 192 %. Следовательно, использование линейной многофакторной модели для прогнозирования не целесообразно.

Способом, представленном выше, построена РДМ первого порядка.

На рисунке 1 видно, что РДМ почти идеально приближает график постпрогноза на два года к реальным данным.

Для нахождения наилучшей комбинации интерполяции факторов использован алгоритм полного перебора с числом вариантов 4096. В результате определилась следующая комбинация - 000010, ни один из факторов не был исключен. Таким образом ранее выдвинутая гипотеза не находит своего подтверждения. Значения коэффициентов РДМ при погрешности постпрогноза на один год - 19 %: Х, = 0,1067; Х2 = 0,1611; Х3 = 0,2339; Х4 = -0,1120; Х5 = 0,2237; Х6 = 0,1954.

Проверим возможность исключения факторов с наименьшими модулями весов (Хь Х2, Х4, Х6). В результате, без ущерба для качества постпрогноза, можно исключить факторы Х4 и Х6, тогда значения коэффициентов РДМ при погрешности прогноза - 3,9 %: Х = 0,0905; Х2 = 0,2985; Х3 = 0,0899; Х4 = 0; Х5 = 0,5310;

Х6 = 0.

Таким образом, численность персонала, занятого научными исследованиями и разработками, и численность аспирантов с защищенными диссертациями мало влияет на динамику развития инновационной деятельности. При исключении этих факторов качество прогнозирования РДМ улучшается.

Наибольшие значения весов имеют факторы: Х2 - финансирование науки из средств федерального бюджета; Х5 - число организаций, выполняющих научные исследования и разработки. При малых отклонениях в положительную сторону значений каждого из них интенсивность развития инновационной деятельности увеличивается, а в отрицательную сторону - уменьшается. В результате можно сделать вывод, что для успешного развития инновационной деятельности в РФ необходимо вкладывать средства в развитие науки, проведение исследований и разработок, тем самым поднимая уровень российской экономики.

Итогом проведенных исследований моделей социально-экономических систем стал вывод о том, что корреля- А'я ционный анализ не всегда дает воз- 1,5 можность априорного определения незначащих факторов РДМ. Его 1 результат требует проверки путем исключения каждого предложенного фактора из модели поочередно. Тем не менее, применение 0 корреляционного анализа значи-

0,5

2006 2008 2010 2012 Годы

тельно сужает поиск мал°значимых Рис. Прогноз на основе ОДУ первого порядка: факторов. 1 - исходный; 2 - модель

Список литературы

1. Purcell, M. Prédiction of Household and Commercial BMW Génération According to Socio-Economic and Other Factors for the Dublin Région [Электронный ресурс ] / M. Purcell, W. L. Magette // Waste Management. - 2009. - Vol. 29, No. 4. -P. 1237 - 1250. - Режим доступа : http://www.sciencedirect.com/science/article/pii/ S0956053X0800367X (дата обращения: 22.12.15).

2. Дзюба, С. А. Модели управления подсистемами предприятия в сфере среднего бизнеса и их инструментальное обеспечение : автореф. дис. ... д-p экон. наук: 08.00.13 [Электронный ресурс] / С. А. Дзюба. - Иркутск, 2011. - 46 с. -Режим доступа : http://econom.nsc.ru/ieie/news/zashiti/avtoref/mart12/dzuba.pdf (дата обращения: 22.12.15).

3. Мицек, Е. Б. Эконометрическое моделирование инвестиций в основной капитал экономики России : автореф. дис. ... д-p экон. наук : 08.00.13 [Электронный ресурс ] / Е. Б. Мицек. - Екатеринбург, 2011. - 40 с. - Режим доступа : test.vak.ed.gov.ru/common/img/uploaded/files/MitsekEB.doc (дата обращения: 22.12.15).

4. Сиротина, Н. А. Многофакторная модель сложной системы на основе дифференциального уравнения первого порядка / Н. А. Сиротина, А. В. Затонский // Вест. КИГИТ. - 2012. - № 7 (25). - С. 9 - 18.

5. Мышкис, А. Д. Элементы теории математических моделей / А. Д. Мыш-кис. - М. : Комкнига, 2007. - 192 с.

6. Затонский, А. В. Преимущества дифференциальных моделей в эколого-экономическом моделировании / А. В. Затонский // Изв. Томского политехн. университета. - 2012. - Т. 320, № 5. - С. 134 - 139.

7. Орлов, А. И. Нечисловая статистика [Электронный ресурс ] / А. И. Орлов. -М. : МЗ-Пресс, 2004. - Режим доступа : http://www.aup.ru/books/m162/ (дата обращения: 22.12.15).

8. Любушин, Н. П. Экономический анализ / Н. П. Любушин. - 3-е изд., пере-раб. и доп.. - М. : Юнити-Дана, 2010. - 575 с.

9. Акаев, А. А. Анализ решений общего уравнения макроэкономической динамики / А. А. Акаев // Экономика и мат. методы. - 2008. - Т. 44. - № 3. - С. 62 - 78.

10. Сиротина, Н. А. Преимущества регрессионных дифференциальных моделей для прогнозирования экономического развития / Н. А. Сиротина // Прикладная информатика. - 2013. - № 2 (44). - С. 6 - 18.

Application of Correlation Analysis to Exclude Factors from Regression-Differential Models

A. S. Grigalashvili, L. F. Koksharova, I. O. Zuyeva

Department "Automation of Technological Processes", Berezniki branch of Perm National Research Polytechnic University, Berezniki; atp@bf.pstu.ru

Keywords: differential equation; modeling; prediction; regression; socioeconomic model.

Abstract: The paper considers the hypothesis aboutthe possibility of excludingfactors not influencing theregression-differential modelbased on the valuesof pair correlations. The assumptionis verifiedon the threesocio-economic systems. Linear

multifactor and regression-differential models of fertility, educational level and innovation activity in Russia are built. An advantage of differential models for forecasting is in good quality of post-prognosis. Pair correlations between factors are estimated. Series of factors with a high correlation was excluded from the differential model. As a result, an error of post-prognosis grows significantly. Thus, a high linear correlation between annual series of factors is not a sufficient basis for excluding them from regression-differential models.

References

1. Purcell M., Magette W.L. Prediction of household and commercial BMW generation according to socio-economic and other factors for the Dublin region, Waste Management, 2009, vol. 29, no. 4, pp. 1237-1250, available at: http://www.sciencedirect.com/science/article/pii/S0956053X0800367X (accessed: 22 December 15).

2. Dzyuba S.A. PhD Dissertation (Economics), Irkutsk, 2011, 46 p., available at: http://econom.nsc.ru/ieie/news/zashiti/avtoref/mart12/dzuba.pdf (accessed: 22 December 15). (In Russ.)

3. Mitsek E.B. PhD Dissertation (Economics), 2011, 40 p., available at: test.vak.ed.gov.ru/common/img/uploaded/files/MitsekEB.doc (accessed: 22 December 15). (In Russ.)

4. Sirotina N. A., Zatonskii A. V. [Multi-factor model of a complex system based on the first order differential equation], Vest. KIGIT [Kamsky Institute of Humanitarian and Engineering Technologies], 2012, no. 7 (25), pp. 9-18. (In Russ.)

5. Myshkis A.D. Elementy teorii matematicheskikh modelei [Elements of the theory of mathematical models], Moscow: Komkniga, 2007, 192 p. (In Russ.)

6. Zatonskii A.V. [Advantages of differential models of ecological-economic modeling], Izv. Tomskogo politekhn. universiteta [Bulletin of the Tomsk Polytechnic University], 2012, vol. 320, no. 5, pp. 134-139. (In Russ.)

7. Orlov A.I. Nechislovaya statistika [Non-numerical statistics], Moscow: MZ-Press, 2004, available at: http://www.aup.ru/books/m162/ (accessed: 22 December 15). (In Russ.)

8. Lyubushin N.P. Ekonomicheskii analiz [Economic analysis], Moscow: Yuniti-Dana, 2010, 575 p. (In Russ.)

9. Akaev A.A. [Analysis of the solutions of the general equation of macroeconomic dynamics], Ekonomika i matematicheskie metody [Economics and Mathematical Methods], 2012, vol. 44, no. 3, pp. 62-78. (In Russ.)

10. Sirotina N.A. [Benefits differential regression models to predict the economic development], Prikladnaya informatika [Applied informatics], 2013, no. 2 (44), pp. 618. (In Russ.)

Über die Anwendbarkeit der Korrelationsanalyse für die Ausschließung der Faktoren in den regression-differentialen Modellen

Zusammenfassung: Es ist die Hypothese über die Möglichkeit der Ausschließung der nicht beeinflussenden Faktoren auf das regression-differentialen Modell aufgrund der Bedeutungen der paarigen Korrelationen betrachtet. Die Vermutung ist auf drei sozial-ökonomischen Systemen geprüft. Es sind die regressiondifferentialen Modelle der Dynamik der Geburtenzahl, des Niveaus der Ausbildung und der innovativen Tätigkeit in der Russischen Föderation aufgebaut.

Es sind aus der Zahl der allgemeinverständlichen jährlichen statistischen Reihen die privaten sie potential beeiflussenden Kriterien und die Faktoren ausgewählt. Es sind die linearen multifaktoriellen Modelle der Dynamik dieser Systeme dargelegt. Es ist gezeigt, dass sie für die Prognostizierung wegen der schlechten Qualität der Nachprognose nicht verwendet werden können. Es sind die regression-differentialen Modelle der Dynamik dieser Systeme aufgebaut, es ist ihr Vorteil vor den linearen multifaktoriellen Systemen im Sinne der Qualität der Prognostizierung beschrieben. Es ist die paarige Korrelation der Faktoren bewertet, die Reihen der Faktoren mit der hohen paarigen Korrelation sind aus den regression-differentialen Modellen ausgeschlossen. So ist es bewiesen, dass die hohe gegenseitige Korrelation der Reihen keine ausreichende Gründung für die Ausschließung der jährlichen Reihe der Faktoren aus dem regression-differentialen Modell des sozial-ökonomischen Systems ist.

Sur l'application de l'analyse de corrélation pour exclure les facteurs dans les modèles régressifs différentiels

Résumé: Est examinée l'hypothèse de la possibilité d'exclure les facteurs non infuençants sur le modèle régressif différentiel à la baseé des valeurs de corrélations de paires. L'hypothèse est testée sur trois systèmes socio-économiques. Sont construits les modèles régressifs différentiels de la fécondité, du niveau de l'éducation et de l'activité d'innovation dans la Fédération de la Russie. Sont présentés les modèles linéaires multifactoriels de la dynamique de ces systèmes; il montré qu'ils ne peuvent pas être utilisés pour la prévision à cause de la mauvaise qualité de post-prognostic. Sont construits les modèles régressifs différentiels de la dynamique de ces systèmes, sont décrits leurs avantages.

Авторы: Григалашвили Алена Сергеевна - аспирант кафедры «Автоматизация технологических процессов»; Кокшарова Лилия Фаилевна - магистрант кафедры «Автоматизация технологических процессов»; Зуева Ирина Олеговна -магистрант кафедры «Автоматизация технологических процессов», Березников-ский филиал ФГБОУ ВПО «Пермский национальный исследовательский политехнический университет», г. Березники.

Рецензент: Затонский Андрей Владимирович - доктор технических наук, профессор, заведующий кафедрой «Автоматизация технологических процессов», Березниковский филиал ФГБОУ ВПО «Пермский национальный исследовательский политехнический университет», г. Березники.

i Надоели баннеры? Вы всегда можете отключить рекламу.