РАЗДЕЛ 6. МАТЕМАТИЧЕСКИЕ МЕТОДЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЭКОНОМИКЕ И УПРАВЛЕНИИ
УДК 51-77 ГРНТИ 06.35.51
ПРИМЕНЕНИЕ ВРЕМЕННЫХ РЯДОВ ДЛЯ ИЗУЧЕНИЯ МЕЖРЕГИОНАЛЬНОЙ МИГРАЦИИ НА ПРИМЕРЕ АЛТАЙСКОГО КРАЯ
АЛЯБЬЕВА ЕЛЕНА ВИКТОРОВНА
кандидат педагогических наук, доцент, доцент кафедры «Математика и информатика» Финансовый университет при Правительстве РФ, Барнаульский филиал, 656036, пр. Ленина, д. 54, Барнаул, Россия E-mail: [email protected]
ИЛЬИНА МАРИНА АЛЕКСАНДРОВНА
кандидат технических наук, доцент, доцент кафедры «Математика и информатика» Финансовый университет при Правительстве РФ, Барнаульский филиал, 656036, пр. Ленина, д. 54, Барнаул, Россия E-mail: [email protected]
КОХАНЕНКО ДМИТРИЙ ВАСИЛЬЕВИЧ
кандидат физико-математических наук, доцент кафедры «Математика и информатика» Финансовый университет при Правительстве РФ, Барнаульский филиал, 656036, пр. Ленина, д. 54, Барнаул, Россия E-mail: [email protected]
Аннотация. В данной работе решена задача выявления общей динамики межрегионального миграционного потока выбывших из Алтайского края. Аддитивная модель временного ряда представлена трендовой и сезонной компонентами, построена на основе официальных статистических данных с 2012 по 2016 гг. Показана методика построения точечного и интервального прогнозов на основе модели.
Ключевые слова: межрегиональная миграция, социально-экономический процесс, аддитивный временной ряд, точечный и интервальный прогноз, тренд, сезонная компонента, рынок труда, эмпирические данные, законы миграции.
THE USE OF TIME SERIES FOR THE STUDY OF INTERREGIONAL MIGRATION THROUGH THE EXAMPLE OF THE ALTAI TERRITORY
Elena V. Alyabeva
Candidate of Pedagogical Sciences, Associate professor, Assistant professor of Mathematics and IT department. Financial University under the Government of the Russian Federation. Barnaul brunch,
656036, Lenin St., bld. 54, Barnaul, Russia E-mail: [email protected]
Marina A. Iliina
Candidate of Engineering Sciences, Associate professor, Assistant professor of Mathematics and IT department. Financial University under the Government of the Russian Federation. Barnaul brunch,
656036, Lenin St., bld. 54, Barnaul, Russia E-mail: [email protected]
Dmitry V. Kokhanenko
Candidate of Physical and Mathematical Sciences, Assistant professor of Mathematics and IT department. Financial University under the Government of the Russian Federation. Barnaul brunch. 656036, Lenin St., bld. 54, Barnaul, Russia E-mail: [email protected]
Abstract. The paper solves the problem of identifying the overall dynamics of interregional migration flow left the Altai Territory. Based on the official statistical data from 2012 to 2016 the additive model of time series is presented with trend and seasonal components. The paper is concerned with the method of point and interval forecast constructing based on the model.
Key words: interregional migration, socio-economic process, additive time series, point and interval forecast, trend, seasonal component, the labor market, the empirical data, the laws of migration.
Развитие человечества непосредственно связано с переселением народов. Люди постоянно переезжают из одного места в другое. Данный процесс называется миграцией. Миграция может быть в пределах района, области, страны. Цели миграции подразделяются на экономическую, учебную, рекреационную, в поисках убежища [1]. На процесс миграции действует множество факторов, как внешних, например, социально-политических, экономических, географических и других, так и внутренних, присущих отдельному человеку. Вследствие чего, его активность является синтезом как случайных, неопределенных факторов, так и определенных сложившихся обстоятельств.
Изучение данного процесса представляется важным, поскольку миграция населения влияет на формирование рынка труда через изменение спроса и предложения рабочей силы. Рынок труда несёт две основные функции: социальную и экономическую. Миграция оказывает существенное влияние, как на стабильность, так и на развитие политической, социальной, экономической обстановки региона, в котором она происходит.
К настоящему времени сформировался ряд теорий и концепций, которые объясняют влияние миграции населения на социально-экономические процессы и рассматривают обратный процесс. С их помощью можно определить взаимосвязи потоков миграции (их масштабов, направлений, интенсивности) с величиной заработной платы, уровнем доходов, обеспеченностью жильем, числом рабочих мест и т.д. Кроме того, для изучения этих процессов представляет интерес качественный состав мигрантов (их возраст, пол, уровень образования, профессиональная принадлежность, социальный статус и т.д.).
Впервые выявленные закономерности развития миграционных процессов относят к 1885 году и приписывают их английскому географу Эрнесту Георгу Равенстейну [2], который сформулировал законы миграционных процессов. Изначально законов было семь. В дальнейшем, при изучении эмпирических данных миграционных процессов разных стран, добавили еще четыре.
Законы миграции, выявленные Э.Г. Равенстейном [3]:
1. Между территориями идет перераспределение населения.
2. Территории различаются главным образом по экономическим характеристикам.
3. Большинство мигрантов переезжает на короткие расстояния.
4. Миграция происходит ступенчато.
5. Каждому миграционному потоку соответствует обратный поток.
6. Мигранты на длинные расстояния мигрируют в крупные центры промышленности и торговли.
7. Жители городов менее подвижны, чем жители сельской местности.
8. Женщины подвижней мужчин в перемещениях внутри страны, мужчины подвижней женщин в перемещениях на длинные расстояния.
9. Большие города растут главным образом из-за миграции.
10. Объем миграции увеличивается с развитием промышленности, торговли и транспорта.
11. Главные причины миграции -экономические.
Единой теории, описывающей миграционные процессы, до настоящего времени не существует. Многие из данных законов миграции актуальны и на сегодняшний день. И так как миграция - это сложный социально-экономический процесс, он привлекает особое внимание исследователей различных научных областей [4, 5, 6].
Сложность изучения миграционных процессов состоит в том, что можно рассматривать отдельно миграцию международную и в пределах России, которая в свою очередь разделяется на межрегиональную и внутри региональную. При этом следует учитывать направление миграционных потоков, выделяя прибывших и выбывших.
В Алтайском крае представлены различные виды миграции. Это связано с социально-экономическим развитием края, климатическими особенностями и географическим расположением края, так как Алтайский край является приграничным регионом России и расположен на Юго-Западе Сибирского Федерального округа. В условиях межрегиональной миграции, число прибывших, официально зарегистрированных лиц из других регионов России в Алтайский край, не
превышает числа выбывших. Миграционный прирост за последние пять лет преимущественно остается отрицательным. А это значит, что из региона происходит отток квалифицированной рабочей силы, регион теряет трудовой и интеллектуальный потенциал, теряет молодежь. Как следствие, увеличивается средний возраст трудоспособного населения. Таким образом, в современных условиях в Алтайском крае складывается проблема воспроизводства квалифицированных трудовых ресурсов.
Следует отметить, что эти виды миграции при условии выбытия граждан в другие регионы, неблагоприятно влияют на экономическую и демографическую ситуацию. Имея отдельные низкие показатели социально-экономического развития по сравнению с другими регионами [5, 7], в Алтайском крае становится сложнее для населения решать проблемы трудоустройства, реализовывать свои способности и инвестировать средства в развитие экономики.
Среди комплекса внешних факторов, влияющих на межрегиональную миграцию Алтайского края можно отметить следующие:
- спрос на квалифицированную рабочую силу;
- условия труда;
- численность населения с доходами, ниже прожиточного минимума;
- размер ВВП региона;
- уровень образования;
- индекс потребительских цен;
- реальные денежные доходы в различных отраслях экономики;
- реальные расходы населения на товары и услуги.
Комплексное изучение процесса миграции с учётом всех факторов и особенностей является весьма сложной, трудоёмкой задачей, предполагающей длительные исследования. В данной работе предлагается начать изучение этого социально-экономического процесса с рассмотрения и анализа общей тенденции межрегиональной миграции потока граждан, выбывших из Алтайского края. [8]
Важным направлением статистических исследований является изучение развития явлений во времени.
Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда могут быть связаны с периодичностью, например, сезонной или недельной, месячной или квартальной. В общем виде при исследовании экономического
временного ряда выделяют четыре составляющие:
Y(t) = fit) + S(t) + C(t) + £(t),
где f(t) - тренд, представляет собой устойчивую тенденцию изменения признака, наблюдаемую в течение длительного периода времени. Обычно тренд описывается с помощью достаточно «гладкой» (часто монотонной) функции, аргументом которой является время;
S(t) - сезонная компонента - это регулярные колебания, которые носят периодический или близкий к нему характер и заканчиваются в течение года. Сезонная компонента связана с наличием факторов, действующих с заранее известной периодичностью;
C(t) - циклическая компонента, описывающая длительные периоды относительного подъема и спада и состоящая из циклов переменной длительности и амплитуды;
fit), Sit), C(t) - закономерные составляющие временного ряда;
s{t) - случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов.
Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной:
Y(t) = fit) + S(t) + C(t) + £(t).
Модель, в которой временной ряд представлен как произведение перечисленных компонент - мультипликативной:
Yit)=fit)^Sit)^Cit)^it).
Важнейшей задачей при исследовании временных рядов является выявление основной тенденции развития изучаемого процесса.
Изучение социально-экономических
процессов, представленных одномерными временными рядами, сводится к выполнению следующих основных этапов:
1. Предварительный анализ данных.
2. Построение моделей (формирование набора аппроксимирующих функций и численное оценивание их параметров).
3. Проверка адекватности моделей, оценка качества, выбор лучшей модели.
4. Расчет точечного и интервального прогнозов.
Рассмотрим динамику межрегиональной миграции оттока населения из Алтайского края (на основе данных Алтайкрайстата [9]). Данные представлены в таблице 1.
Данные межрегиональной миграции оттока населения из Алтайского края
дата t Число выбывших дата t Число выбывших
Январь 2013 1 1830 Январь 2015 25 1814
Февраль 2013 2 2232 Февраль 2015 26 2180
Март 2013 3 2227 Март 2015 27 2228
Апрель 2013 4 2266 Апрель 2015 28 2165
Май 2013 5 2111 Май 2015 29 1976
Июнь 2013 6 2696 Июнь 2015 30 2451
Июль 2013 7 2879 Июль 2015 31 2685
Август 2013 8 3133 Август 2015 32 2978
Сентябрь 2013 9 3878 Сентябрь 2015 33 3600
Октябрь 2013 10 3774 Октябрь 2015 34 3209
Ноябрь 2013 11 3021 Ноябрь 2015 35 2682
Декабрь 2013 12 2566 Декабрь 2015 36 2544
Январь 2014 13 1752 Январь 2016 37 1771
Февраль 2014 14 2186 Февраль 2016 38 2022
Март 2014 15 2047 Март 2016 39 2430
Апрель 2014 16 2257 Апрель 2016 40 2168
Май 2014 17 2067 Май 2016 41 2059
Июнь 2014 18 2379 Июнь 2016 42 2513
Июль 2014 19 2568 Июль 2016 43 2477
Август 2014 20 2896 Август 2016 44 3102
Сентябрь 2014 21 3627 Сентябрь 2016 45 3613
Октябрь 2014 22 3266 Октябрь 2016 46 3143
Ноябрь 2014 23 2559 Ноябрь 2016 47 2655
Декабрь 2014 24 2613
Этап предварительного анализа включает в себя: выявление аномальных наблюдений и проверку наличия тренда.
Наличие аномальных наблюдений приводит к искажению результатов моделирования, поэтому необходимо убедиться в отсутствии аномалии данных. Примером аномалии может служить скачок курса доллара, зафиксированный в «Черный вторник».
Причины появления в совокупности аномальных наблюдений условно подразделяют следующим образом:
1) внешние, возникающие в результате технических ошибок;
2) внутренние, объективно существующие. Такие наблюдения для исследователя представляют особый интерес, т.к. могут содержать за счет влияния неучтенных факторов особую информацию.
Выбор метода выявления, анализа аномальных наблюдений определяется объемом совокупности, характером исследуемых процессов и задач (одномерных или многомерных).
Наибольшее распространение получил при исследовании динамики метод Ирвина,
основанный на определении X - статистики для каждого уровня ряда:
Ъ = тЬ+1)-¥(1;{)У5У1
Здесь Бу - выборочное среднее квадратичное (стандартное) отклонение признака Y; Схема проверки:
Таким образом, если расчетное значение At превышает критический уровень Акр (при заданном уровне значимости и числе наблюдений), то соответствующее наблюдение признается аномальным.
Предварительно определим:
Sy = 555,408 (функция СТАНДОТКЛОН);
Акр = 1,6 (при уровне значимости а = 1% и числе наблюдений 47 (найдено по таблице).
Вычисления проведены в Excel и представлены в таблице 2.
Значения X - статистики для каждого уровня ряда
t Y kt t Y Xt t Y Xt t Y Xt
1 1830 13 1752 1,466 25 1814 1,439 37 1771 1,392
2 2232 0,724 14 2186 0,781 26 2180 0,659 38 2022 0,452
3 2227 0,009 15 2047 0,250 27 2228 0,086 39 2430 0,735
4 2266 0,070 16 2257 0,378 28 2165 0,113 40 2168 0,472
5 2111 0,279 17 2067 0,342 29 1976 0,340 41 2059 0,196
6 2696 1,053 18 2379 0,562 30 2451 0,855 42 2513 0,817
7 2879 0,329 19 2568 0,340 31 2685 0,421 43 2477 0,065
8 3133 0,457 20 2896 0,591 32 2978 0,528 44 3102 1,125
9 3878 1,341 21 3627 1,316 33 3600 1,120 45 3613 0,920
10 3774 0,187 22 3266 0,650 34 3209 0,704 46 3143 0,846
11 3021 1,356 23 2559 1,273 35 2682 0,949 47 2655 0,879
12 2566 0,819 24 2613 0,097 36 2544 0,248
Для каждого уровня < Акр = 1,6, значит, ряд не содержат аномальных наблюдений.
Представим чески.
исходные данные графи-
Количество, чел.
4500
4000 3500 3000 2500 2000 1500 1000
Г \ А д Д
J У t \ у P } / !4 V / r \ 4
/ Ы V s/ V V V
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 t
Рис. 1. Число выбывших граждан из Алтайского края с января 2013 г. по ноябрь 2016 г.
Полученный график позволяет сделать предположение о том, что временной ряд имеет тенденцию и сезонные колебания.
Структуру временного ряда, т.е. наличие в нем трендовой f(t), сезонной S(t) и периодической C(t) составляющих, можно выявить с помощью анализа автокорреляционной функции временного ряда.
При наличии тенденции и сезонных колебаний значения каждого последующего уровня ряда зависят от предыдущих. Зависимость между последовательными уровнями временного ряда Y(t{), Y(ti+i) называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью коэффициента автокорреляции р(1) между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми относительно друг друга на I шагов времени (с лагом I).
Заметим, что с увеличением I число пар наблюдений У(^1+{) уменьшается и
поэтому число I не должно быть сравнительно большим (рекомендуют I < п/4).
Оценкой для р(1) является выборочный коэффициент автокорреляции г(1),
определяемый по имеющемуся набору фактических данных.
Формула для расчета выборочного коэффициента линейной корреляции между переменными V и w имеет вид [10, стр. 134]:
1?=1(У1 -V)* (Щ - ж)
r(v,w) =
Для вычисления г(1) в качестве переменной V рассматривают ряд, У(Ь1), У(Ь2), ...,У(Ьп-1), а в качестве переменной ^ ряд У(^г), У(Ь2), ...,У(1п). Для вычисления г(2) в качестве
переменной V рассматривают ряд У(Ь-), У(Ь2), —,У(?п-2), а в качестве переменной w ряд У(^з), У(12).....У(1п) и так далее.
Поскольку выборка исходных значений является случайной, то случайной будет и величина выборочного коэффициента корреляции г. Она имеет закономерное среднее значение и некоторый случайный разброс относительно него. В связи с этим возникает вопрос о достоверности найденного значения и сделанных выводов.
Для ответа на вопрос о достоверности наличия между переменными линейной корреляционной зависимости проверяют закономерность отличия выборочного коэффициента корреляции г от нуля. Эта процедура называется проверкой значимости выборочного коэффициента корреляции и выполняется с помощью ¿-критерия Стъюдента:
' (г ) = ■
¡г2 (п
(п - 2)
1 - г2
г-
Сопоставляя фактическое значение критерия с критическим гкр, делают вывод:
если г > гКр, то полученное значение выборочного коэффициента корреляции г является значимым, закономерно отличающимся от нуля, т.е. можно считать, что между переменными V и w существует линейная корреляционная зависимость;
если г < гкр , то полученное значение выборочного коэффициента корреляции г не является значимым, т.е. зависимость между переменными V и w нельзя считать достоверной.
Последовательность коэффициентов
автокорреляции р(0),р(1),р(2),... называют автокорреляционной функцией временного ряда, а график зависимости значений р(1) от величины лага I (или порядка коэффициента автокорреляции I) - коррелограммой.
Анализ автокорреляционной функции и коррелограммы можно проводить следующим образом:
Если максимальным оказался коэффициент автокорреляции р(1), то исследуемый ряд содержит только трендовую составляющую.
Анализ автокорреляционной функции и коррелограммы можно проводить следующим образом:
• если максимальным оказался коэффициент автокорреляции р(1), то исследуемый ряд содержит только трендовую составляющую.
• если наиболее высоким оказался коэффициент автокорреляции р(к) порядка к, то ряд содержит сезонные колебания с периодичностью в к моментов времени.
• если ни один из коэффициентов г(1) не является значимым, то относительно структуры ряда можно сделать одно из двух предположений:
- временной ряд не содержит тренда и сезонных колебаний, а включает только случайную компоненту, т.е. является белым шумом;
- временной ряд содержит сильный нелинейный тренд, для выявления которого необходимо провести дополнительный анализ.
Поэтому коэффициент автокорреляции и автокорреляционную функцию целесообразно использовать для выявления во временном ряде трендовой составляющей и периодической, сезонных составляющих.
Определим структуру временного ряда данных по межрегиональной миграции потока выбывших.
Найдем последовательность оценок коэффициентов автокорреляции и оценим их значимость. Для этого скопируем столбцы исходных данных (рисунок 2), при этом расположение данных каждый раз смещается на одну ячейку вниз до тех пор, пока не получим
1 = ^ = ^=12
4 4
А В с [5 Е Р С Н 1 К М N О
дата Число выбыбшик
ЯН Б 13 1 1830 1=1 1=2 1=3 1=4 1=5 1=6 1=7 1=8 1=9 1=10 1=11 1=12
фев.13 2 2232 1330
мэр. 13 3 2227 2232 1830
апр.13 4 2266 2227 2232 1830
май. 13 5 2111 22$$ 2227 2232 1в30
ИЮН.13 б 2696 2111 2266 2227 2232 1830
ИЮЛ.13 7 2879 2696 2111 2266 2227 2232 1830
авг.13 3133 2879 2$9$ 2111 22$$ 2227 2232 1830
сен. 13 9 3873 3133 2879 2696 2111 2266 2227 2232 1330
ОКТ.13 10 3774 3378 3133 2879 2696 2111 2266 2227 2232 1830
ноя.13 11 3021 3774 3878 3133 2879 2696 2111 226$ 2227 2232 1830
дек.13 12 2566 3021 3774 3878 3133 2879 2696 2111 2266 2227 2232 1830
ЯНВ.14 13 1752 256$ 3021 3774 3878 3133 2879 2696 2111 22$$ 2227 2232 1330
фев.14 14 2186 1752 2566 3021 3774 3878 3133 2879 2696 2111 2266 2227 2232
мер. 14 15 2047 2136 1752 2566 3021 3774 3878 3133 2879 2696 2111 2266 2227
апр.14 16 2257 2047 218$ 1752 25$$ 3021 3774 3878 3133 2879 2$9$ 2111 22$$
май. 14 17 2067 2257 2047 2186 1752 2566 3021 3774 3878 3133 2879 2696 2111
ион.14 13 2379 2067 2257 2047 2186 1752 2566 3021 3774 3878 3133 2879 2696
Рис. 2. Подготовка данных для вычисления корреляции
151
Значения выборочных коэффициентов автокорреляции г(1) найдем с помощью встроенной функции КОРРЕЛ. Для оценки значимости найденных коэффициентов
Расчет г(1) и оц
вычислим ^ статистику и ^ кр (функция СТЬЮДЕНТ.ОБР.2Х при уровне значимости а = 5%). Результаты расчета показаны в таблице 3.
Таблица 3
:а их значимости
Лаг 1 Коэффициент автокорреляции г(1) tстатистика t кр
1 0,692 6,438 2,01
2 0,325 2,283 2,02
3 -0,050 0,326 2,02
4 -0,408 2,898 2,02
5 -0,563 4,362 2,02
6 -0,560 4,271 2,02
7 -0,611 4,826 2,02
8 -0,516 3,709 2,02
9 -0,187 1,160 2,03
10 0,261 1,623 2,03
11 0,671 5,360 2,03
12 0,957 19,254 2,03
Расчеты показывают, что 9 полученных значений выборочных коэффициентов автокорреляции из 12 являются значимыми, т.е. можно считать, что существует линейная автокорреляционная зависимость между уровнями ряда.
Анализ значений коэффициента
автокорреляции г(1) позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в 12 месяцев, так как наиболее высоким оказался коэффициент автокорреляции г(12) = 0,957, а также линейного тренда. Эти выводы вполне согласуются с графиком значений временного ряда (см. рисунок 1).
Перейдем к построению модели временного ряда.
Трендовая компонента отражает долговременную тенденцию. Для её построения используют метод аналитического выравнивания, кото-
Вывод
рый заключается в подборе функции, наилучшим образом описывающей зависимость уровней временного ряда от времени. Параметры функции определяются на основе метода наименьших квадратов (МНК). Наиболее часто используют линейную, экспоненциальную, логарифмическую и полиномиальную функции.
Так как выборочные коэффициенты регрессии вычислялись по формулам, предполагающим линейную зависимость, оценим параметры модели линейного тренда. Для построения линейной модели f(t) = a + b^t используем инструмент РЕГРЕССИЯ в MS Excel. Следует отметить, что MS Excel предлагает несколько инструментов для решения поставленной задачи. Предпочтение отдается РЕГРЕССИИ, так как она определяет сразу и теоретические значения по тренду (Предсказанное Y) и остатки.
Итоги работы программы приводятся в таблицах 3 и 4:
Таблица 3
итогов
Регрессионная статистика
Множественный R 0,08
R-квадрат 0,0065
Нормированный R-квадрат -0,02
Стандартная ошибка 559,71
Наблюдения 47
Коэффициенты
Y-пересечение 2502,13
Переменная X 1 3,28
Таким образом, найдены оценки параметров a= 2502,13;b = 3,28.
Модель построена, ее уравнение имеет вид f(t) = 3,28t + 2502,13.
Программа РЕГРЕССИЯ определяет также величину коэффициента детерминации (строка «R-квадрат» таблица 3). Коэффициент детер-
В нашем случае Я2 = 0,0065. Однако не следует делать преждевременные выводы о том, что качество модели очень низкое, ведь сейчас сезонная компонента включена в остатки вместе со случайной компонентой.
Теперь остановимся на выделении сезонной компоненты. Выше отмечалось, что можно построить аддитивную или мультипликативную модель временного ряда. Выбор одной из двух моделей проводится на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
минации показывает, какая доля вариации (изменения) результирующего признака Y учтена в модели и объясняется изменением факторных переменных. Коэффициент детерминации Я2 является универсальной мерой качества эконо-метрической модели, пригодной для любого типа (линейной, нелинейной, парной, множественной).
Таблица 4
В рамках поставленной задачи будем считать колебания амплитуды незначительными и будем строить аддитивную модель временного ряда.
По методике С.А. Кошечкина [11], оценки сезонной компоненты определяются как разность между фактическими уровнями ряда и значениями тренда (в отчете программы РЕГРЕССИЯ столбец Остатки). Найдем средние оценки сезонной компоненты по каждому 7-му периоду за все 4 сезона (столбец 6 таблицы 5).
В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем периодам (за 12 месяцев) должна быть равна ну-лю. В данной модели эта сумма равна = -1,6. Скорректируем средние значения сезонной компоненты таким образом, чтобы их сумма была равна нулю. Для этого:
Вывод остатка
Наблюдение Предсказанное Y Остатки
1 2505,41 -675,41
2 2508,685 -276,685
3 2511,96 -284,96
4 2515,236 -249,236
5 2518,511 -407,511
6 2521,787 174,2132
7 2525,062 353,9378
8 2528,338 604,6623
9 2531,613 1346,387
10 2534,889 1239,111
11 2538,164 482,836
12 2541,439 24,56059
43 2642,978 -165,978
44 2646,253 455,7465
45 2649,529 963,4711
46 2652,804 490,1957
47 2656,08 -1,07979
- определим корректирующий коэффициент
к = —16 = —0,13; 12 ' '
- рассчитаем скорректированные значения сезонной компоненты как разность между ее средней
оценкой и корректирующим коэффициентом к (столбец 7 таблицы 5): §1 = Б1 — к; - проверим условие равенства нулю суммы значений сезонной компоненты.
Расчёт сезонных компонент
Таблица 5
Период 1-ый сезон 2-ой сезон 3-ий сезон 4-ый сезон средние оценки Скорректиров анное
1 2 3 4 5 6 7
Январь -675,41 -792,71 -770,02 -852,33 -772,62 -772,48
Февраль -276,69 -361,99 -407,30 -604,60 -412,64 -412,51
Март -284,96 -504,27 -362,57 -199,88 -337,92 -337,78
Апрель -249,24 -297,54 -428,85 -465,15 -360,19 -360,06
Май -407,51 -490,82 -621,12 -577,43 -524,22 -524,09
Июнь 174,21 -182,09 -149,40 -126,70 -70,99 -70,86
Июль 353,94 3,63 81,33 -165,98 68,23 68,36
Август 604,66 328,36 371,05 455,75 439,95 440,09
Сентябрь 1346,39 1056,08 989,78 963,47 1088,93 1089,06
Октябрь 1239,11 691,81 595,50 490,20 754,15 754,29
Ноябрь 482,84 -18,47 65,23 -1,08 132,13 132,26
Декабрь 24,56 32,26 -76,05 -6,41 -6,28
Сумма -1,60 0,00
Получив скорректированные значения тренда и сезонной компоненты
сезонных компонент (5;) для двенадцати месяцев и зная значения по тренду /(Ь) для всех периодов (47 месяцев), можно рассчитать значения уровней ряда как сумму значения
для
соответствующего месяца У(0 = /(¿) + ^>(. Вычисления приведены в таблице 6. Например: ?(15) = /(15) + .§3 = 2551,27 — 337,78 = 2213,49.
Таблица 6
Вычисления значений модели
дата г Выбывшие У Значение тренда /(€) Значение модели Ш = № + §1
1 2 3 4 5
Январь 2013 1 1830 2505,41 1732,93
Февраль 2013 2 2232 2508,69 2096,18
Март 2013 3 2227 2511,96 2174,18
Апрель 2013 4 2266 2515,24 2155,18
Май 2013 5 2111 2518,51 1994,43
Июнь 2013 6 2696 2521,79 2450,93
Июль 2013 7 2879 2525,06 2593,43
Август 2013 8 3133 2528,34 2968,43
Сентябрь 2013 9 3878 2531,61 3620,68
Октябрь 2013 10 3774 2534,89 3289,18
Ноябрь 2013 11 3021 2538,16 2670,43
1 2 3 4 5
Декабрь 2013 12 2566 2541,44 2535,16
Январь 2014 13 1752 2544,71 1772,23
Февраль 2014 14 2186 2547,99 2135,48
Март 2014 15 2047 2551,27 2213,48
Апрель 2014 16 2257 2554,54 2194,48
Май 2014 17 2067 2557,82 2033,73
Сентябрь 2016 45 3613 2649,53 3738,59
Октябрь 2016 46 3143 2652,80 3407,09
Ноябрь 2016 47 2655 2656,08 2788,34
Представим на графике исходные данные и результаты моделирования (рисунок 2). 4500
1000
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 481 — •■ - Эмпирические данные —■— Результаты моделирования -Тренд
Рис. 2. Эмпирические данные и результаты моделирования
Как видно из графика, результаты моделирования вполне удовлетворительно соответствуют эмпирическим данным. Однако, необходимо проверить адекватность и качество построенной модели.
Следует заметить, что в результате моделирования тренд определен как функция, а сезонная компонента определена двенадцатью числовыми значениями, соответствующими каждому месяцу.
Это, согласитесь не очень удобно. Конечно, было бы логичнее представить сезонную компоненту ) отдельным уравнением. Так, в нашем примере, сезонную компоненту можно достаточно точно описать полиномом 6-го порядка (рисунок 3). Но это усложнит процесс моделирования. На этом этапе исследования миграции в данной работе такая цель не ставилась.
1000
е; 01
500
0 ш
I-
и
01 т
¡1 0 о
5С
-500
-1000
у = 0,1542х6 - 5,4602х5 + 71,191х4 - 418,83х3 + 1096,3х2 - 954,24х - 551,07
R2 = 0,9622
12
Месяц
Рис. 3. Аппроксимация сезонной компоненты.
При построении временного ряда возникает вопрос, насколько модель близка к экономической реальности, насколько обосновано её применение для анализа и прогнозирования изучаемого социально-экономического процесса.
Для ответа на эти вопросы необходимо проверить адекватность модели изучаемому процессу и её качество. Данные исследования проведены, модель является адекватной и качественной (Я2 = 0,922), что будет показано в другой работе.
Идея прогнозирования базируется на предположении, что закономерности, действующие в пределах периода наблюдений, будут действовать и в будущем.
Прогнозное значение модели будет определяться уравнением
?Ю = т+Ъ.
Экстраполяцию тренда /(0 на будущее в общем случае можно определить как /(Ь*), где * 1
момент прогноза / = П + к ( п - номер последнего фактического наблюдения, к - период упреждения). Такой прогноз называется точечным. Он получается путём подстановки в уравнение модели соответствующих значений вре-
* 1 мени / = П + к
Построим прогноз на следующих два месяца, что соответствует периоду упреждения к = 1 и к = 2. Получим соответственно:
/*(47 + 1) = 3,28 • 48 + 2502,13 = 2659,355; ¡*(47 + 2) = 3,28 • 49 + 2502,13 = 2662,631.
Рассчитанные сезонные компоненты при прогнозировании просто переносятся на соответствующие месяцы прогнозного периода.
Момент времени Ь* = 48 соответствует декабрю месяцу 2016 года, ранее определили, что сезонная компонента для декабря была равна: §12 = -6,28
Таким образом, прогнозное значение определяется как:
?*(48) = 2659,355 - 6,28 = 2653,08
Таким образом, ожидаемое число выбывших в декабре 2016 года составит в среднем 2653 человек.
Аналогично, момент времени Ь* = 49 соответствует январю 2017 года, сезонная компонента для января равна ^ = -772,48.
Таким образом, прогнозное значение составит
У*(49) = 2662,63 - 772,48 = 1890,15
То есть, ожидаемое число выбывших в январе 2017 года будет примерно равно 1890 человек.
С высокой степенью вероятности найденное прогнозное значение У* будет отличаться от фактического значения. Во-первых, выбранная для прогнозирования линейная модель не является единственной для описания тенденции, возможно нелинейная модель даст более точные результаты. Во-вторых, исходный временной ряд обладает случайной компонентой, поэтому прогноз должен также отражать случайный характер процесса.
Для учёта случайных колебаний найденное прогнозное значение У* дополняют расчетом доверительного интервала (У* - и; У* + и), то есть выполняют интервальное прогнозирование. Прогнозный интервал показывает, в какие
границы с требуемой вероятностью попадёт фактическое значение признака У.
В случае линейной модели величину размаха прогнозного интервала определяют по формуле:
Г)2 = 8648 (функция КВАД-
и = ^ • Я
1 +1 + п
41Л. £ (' -')
Iп-р-1
•^е2 - стандартная ошибка
ЯШ
РОТКЛ).
По формуле вычислим размах прогнозного интервала:
при Г = 48 и48 = 321,06 при Г = 49 и49 = 321,90 Теперь можно определить границы: инижн(48) = 2653,08 — 321,06 = 2331,01 и и ии
верх
(48) = 2653,08 + 321,06 = 2974,14; ,(49) = 1890,15 — 321,90 = 1568,25
и
верх
(49) = 1890,15 + 321,90 = 2212,05.
модели.
Здесь п - количество наблюдений; р - количество факторов, включенных в модель (для линейной модели р = 1 ).
Затем рассчитывают границы интервала вокруг точечного прогнозного значения: инижн = У* — и и иверх = У* + и.
Размах и характеризует ошибку прогнозирования. Чем больше размах, тем менее точным является прогноз.
Для оценки точности прогнозирования рассчитаем границы прогнозного интервала (примем доверительную вероятность / = 95%). Для расчета подготовим: Ькр = 2,01 (функция СТЬЮДЕНТ.ОБР.2Х при уровне значимости а = 5%о и числе степеней свободы к = п — 2 = 45);
Б(е) = 152,93 1= 24 (функция СРЗНАЧ);
Количество, чел.
4500 4000 3500 3000 2500 2000
1500 '
1000
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 t
Для наглядности покажем результаты расчета прогнозных оценок на графике (рисунок
4).
Таким образом, с вероятностью 95% можно утверждать, что число людей, выбывших в другие регионы в декабре 2016 года, составит в среднем от 2331 до 2974 человек, а в январе 2017 года - от 1568 до 2212 человек.
Цель, поставленная в данной работе, достигнута. Построена математическая модель миграционного потока выбывших в другие регионы, которая подтверждает возрастающую тенденцию числа мигрантов и зависимость его от сезонной компоненты и даёт возможность принимать более аргументированные управленческие решения.
— •— Эмпирические данные ......нижняя граница ■
значения по модели верхняя граница
Точечный прогноз
»-1
1
Рис. 4. Результаты моделирования и прогнозирования
Список использованных источников:
1. Воробьева О.Д, Топилин А.В. Миграционное движение населения: теория, политика, практика, перспективы: монография / Проект РГНФ № 13-42-93009 [Электронный ресурс] - Режим доступа: http://www.rfh.ru/downloads/Books/134293008.pdf дата обращения (14.12.2016)
2. Ravenstein E.G. The Laws of Migration // Journal of the Statistical Society of London, Vol. 48, No. 2. (June, 1885), pp. 167-235.
3. Абылкаликов С. И., Винник М. В. Экономические теории миграции: рабочая сила и рынок труда // Бизнес. Общество. Власть. 2012. № 12, с 1-19. [Электронный ресурс] - Режим доступа: https://www.hse.ru/mag/27364712/2012--12/71249233.html Дата обращения (14.12.2016)
4. Особенности миграционной политики. Проблемы, поиски, решения. Сборник научных трудов Международной молодежной конференции / под ред. Г.А. Барышевой. Томский политехнический университет. -Томск: Изд-во Томского политехнического университета, 2012. -516 с.
5. Максимова С.Г., Гончарова Н.П., Ноянзина О.Е. Трудовая миграция в Алтайском крае: состояние, динамика и социально-экономические последствия // Вестник Алтайского государственного аграрного университета. - 2013. - № 5. С. 129 - 133.
6. Методология и методы изучения миграционных процессов / под ред. Ж. Зайончковской, И. Молодико-вой, В. Мукомеля. - М., 2007, 375 с.
7. И. С. Кашницкий, Н. В. Мкртчян, О.В.Лешуков Межрегиональная миграция молодежи в России: комплексный анализ демографической статистики // Вопросы образования. 2016. - № 3. - С. 169 - 203.
8. Лопухов, В.М. Вопросы автоматизации финансово-экономической деятельности участников бюджетного процесса / Горащенко Т.С., Лопухов В.М. // Сб. науч. тр. Междунар. научно-практической конф. Алтайская академия экономики и права. - Барнаул, 2013. С. 64-70.
9. Управление Федеральной службы государственной статистики по Алтайскому краю и Республики Алтай // Официальная статистика Алтайский край [Электронный ресурс] - Режим доступа http://akstat.gks.ru/wps/wcm/connect/rosstat_ts/akstat/ru/statistics/altayRegionStat/ Дата обращения (10.12.2016)
10. Основы теории вероятностей и математической статистики: лекции в презентациях. Учебно-методическое пособие / Ильина М.А., Копылова Н.Т.; ФГБОУ ВПО «Алтайский государственный технический университет им. И.И. Ползунова» (АлтГТУ) (Барнаул), 2013. - 132 с.
11. Кошечкин С.А. Алгоритм прогнозирования объёма продаж в MS Excel [Электронный ресурс] - Режим доступа: http://www.cfin.ru/finanalysis/sales_forecast.shtml дата обращения (14.12.2016)