Бюллетень науки и практики /Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
УДК 519.21 https://doi.org/10.33619/2414-2948/46/02
СТОХАСТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ПРОГНОЗИРОВАНИЯ ЧИСЛЕННОСТИ НАСЕЛЕНИЯ
©НосоваМ. Г., ORCID: 0000-0003-3641-7759, SPIN-код: 8091-3333, канд. физ.-мат. наук, Томский государственный университет систем управления и радиоэлектроники, г. Томск, Россия, [email protected]
STOCHASTIC MODEL FOR POPULATION FORECASTING
©Nosova M., ORCID: 0000-0003-3641-7759, SPIN-code: 8091-3333, Ph.D., Tomsk State University of Control Systems and Radioelectronics, Tomsk, Russia, [email protected]
Аннотация. В статье разрабатывается стохастическая модель для прогнозирования численности населения. Модель для прогнозирования численности мужского и женского населения представляет собой систему массового обслуживания с двумя типами заявок и марковским модулированным процессом. Метод и модель могут быть адаптированы для обработки различных типов данных и источников информации. Чтобы проиллюстрировать это, анализируются демографические данные Российской Федерации и прогнозируется изменение численности населения до 2115 года. При этом демонстрируется гибкость и преимущества применения данного подхода к прогнозированию численности населения и выделяются области, в направлении которых работа может быть продолжена.
Abstract. The article develops a stochastic model for population forecasting. The model for forecasting the male and female population is a queuing system with two types of applications and a Markov modulated process. The method and model can be adapted to process various types of data and information sources. To illustrate this, the demographic data of the Russian Federation are analyzed and a change in population is forecasted before 2115. At the same time, the flexibility and advantages of applying this approach to population forecasting are demonstrated and areas in which work can be continued are highlighted.
Ключевые слова: система массового обслуживания, стохастическая модель, численность населения, прогнозирование численности населения.
Keywords: queuing system, stochastic model, population, population forecasting.
Введение
По мере того, как происходит переход от детерминированных демографических моделей к тем, которые учитывают неопределенности, является важным интегрировать различные источники неопределенности в структуру моделирования. Обоснование для рассмотрения стохастического подхода заключается в том, что он предлагает естественную вероятностную основу для прогнозирования будущих численностей населения. Изменчивость данных и неопределенности в параметрах и выборе модели могут быть явно включены с использованием вероятностных распределений, а предсказательные распределения следуют непосредственно из применяемой вероятностной модели.
Бюллетень науки и практики /Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
Необходимость учета вероятностной неопределенности в оценках и прогнозах численности населения хорошо известна. Вероятностные прогнозы имеют преимущество перед другими прогнозами в том, что они определяют шансы или вероятность того, что определенная будущая характеристика населения будет в пределах некоторого диапазона [17]. Однако, несмотря на известные преимущества вероятностных прогнозов, они еще не получили широкого распространения в статистических органах [8]. Причина в том, что существует много типов неопределенностей, которые необходимо учитывать, и включение их в прогнозы не всегда является простым.
В данной статье в качестве стохастической модели для прогнозирования численности населения рассматривается автономная система массового обслуживания с двумя типами заявок, а процесс генерирования новых заявок предполагается марковским модулированным процессом. Данная работа продолжает и углубляет исследования, представленные в [9-13].
Стохастическая модель
Рассмотрим автономную систему массового обслуживания с двумя видами заявок. Будем их называть заявками первого типа и заявками второго типа соответственно [14]. Определим процесс обслуживания заявок. Обслуживание заявок первого типа состоит из трех фаз, при этом обслуживание начинается на первой фазе в момент ее поступления на свободный прибор. Обозначим продолжительность обслуживания т заявки первого типа, тогда:
т = Т1 +т2 +т3.
Пусть т — независимые и экспоненциально распределенные случайные величины с параметрами которые характеризуют длительности фаз обслуживания.
Мы предполагаем, что заявка первого типа, завершив обслуживание на 1-й фазе, с вероятностью qi переходит к обслуживанию на -+1-ю фазу, а с обратной вероятностью 1-Ц1 завершает обслуживание и уходит из системы, / = 1,2. Обслуживание заявки первого типа всегда завершается после третьей фазы. Заявки первого типа, находящиеся на обслуживании на втором этапе, могут генерировать новые заявки (первого и второго типа). С вероятностью г генерируется заявка первого типа, а с вероятностью (1-г) второго типа. Поток новых заявок представляет собой ММР-процесс, заданный матрицей инфинитезимальных характеристик вида где к, V = 1, 2, ..., К, где К — число состояний управляющей цепи Маркова, а
также интенсивностями генерации новых заявок Хк.
Определим процесс обслуживания заявок второго типа. Будем считать, что длительность обслуживания определяется величиной т4, которая распределена экспоненциально с некоторым параметром ц4. После завершения обслуживания на единственной фазе заявка второго типа также покидает систему.
В демографических терминах под заявкой первого типа мы подразумеваем женщину, а под заявкой второго типа — мужчину. Вторая фаза для заявок первого типа — репродуктивный возраст женщины, а время нахождения в системе массового обслуживания — продолжительность жизни человека.
Поскольку общий коэффициент рождаемости [15], который варьируется каждый год, является основным показателем рождаемости в стране, целесообразно рассматривать процесс рождаемости в виде марковского пуассоновского процесса (ММП-процесс) [16]. Интенсивность рождаемости Хк определяется формулой
\ =\ /
Бюллетень науки и практики /Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
где Хк — суммарный коэффициент рождаемости за время пребывания цепи Маркова в состоянии k.
Исследование системы массового обслуживания Обозначим, что где ni(t) — число заявок первого типа, обслуживаемых на i-й фазе в момент времени t, а m(t) — число заявок второго типа, находящихся на обслуживании в
системе в момент времени t, тогда случайный процесс n(t) = {n(t), Щ(t), Щ(t), m(t)}T, представляет собой цепь Маркова с непрерывным временем. С точки зрения демографии, ni(t) определяет количество женщин в фазе i в момент t, i = 1,3 (в i-й возрастной группе), m(t) — количество мужчин в момент времени t. Для распределения вероятностей
Р(к, щ, щ , щ , m, t) = Р{к (t) = к, щ (t) = щ , щ (t) = щ , щ (t) = щ , m(t) = m}, пишем систему дифференциальных уравнений Колмогорова [16]
дР(к, n, щ , щ, m, t) . „ чг./, ч (1)
-1—2—3-= -(ЩД + Щд2 + Щд3 + mßA + щХ)Р(к,Щ,Щ,Щ,m,t) + v y
dt
+Р(к, n -1, щ , щ , m, t)nХ + Р(к, Щ, n2, n3, m -1, t)n2Х (1 - r) +(m + 1)дР(к, n, щ , щ , m +1, t) + (щ +1) д (Р(к, щ +1, n2 , щ , m, t )(1 - q ) + +Р(к, n +1, n2 -1, щ , m, t) + (n2 +1)д2 (Р(к, щ , n2 +1, щ , m, t)(1 - q2 ) + +Р(к, n, n2 +1, щ -1, m, t)q2 ) + (щ +1) дР(к, щ , n2, n3 +1, m, t) + ^ Р(к, щ , n2 , n3, t)qvjfc.
V
Определим характеристическую функцию числа обслуживаемых заявок в системе массового обслуживания с двумя типами заявок в момент времени t в виде
H (к , u, t) = ^ Р(к, nx, n2, n3, m, t) exp {J^nj + u2n2 + u3n3 + u4 m)}, (2)
П, П2, П3, m
где J = л/-1 — мнимая единица.
Из уравнения (1), учитывая (2), запишем уравнение для характеристической функции
H(u,t)
dH(к,U,t) = J dH(к,U,t) д{1 - e-Ju. + ^«(1 - e]u2 )}+ (3)
dt ddu j 1 '
+J dH(k, ^t) Я (1 - reu1) + XkeJu4 (r -1) + ß2(1 - e"Ju2) + <du2
+M2e~u q2(1 - e7u3)} + j^^A Д{1 - eJu3} + jH^ - e- + £ H (к, u, t )qvk.
du3 <m4 v
Для нахождения вероятностных характеристик (первый и второй моменты для числа обслуживаемых заявок) применим метод моментов [16].
Продифференцируем (3) поочередно по щ, u2, u3, u4. Обозначив
дН (k, u, t)
du,
= jzt (k, t), i = 1,4,
Щ =0,U2 =0,U3 = 0,
u
4
Бюллетень науки и практики / Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
получим следующую систему четырех обыкновенных дифференциальных уравнений,
т
определяющую компоненты вектора ¿(^^(О, 22(0, 23(0, z4(t)}
(4)
z[(k, t) = z (k, Г) + Л,^(k> t) + Z zi(v> tq,
v
Z2 (k>t) = MlZ1 (k>t) - MZ2 (k>t) + Z Z2 (v't)qvk >
v
Z3 (k, t) = М2Ч2z2 (k,t) - M3Z3 (k,t) + Z z3 (v, t)qvk ,
v
(k,t) = Ak ( 1 - Г )z2 (k, t) - M4Z4 (k,t) + Z Z4 (v, t)qvk •
Предполагается, что начальное распределение состояний ММР-потока цепи Маркова к(^ совпадает с конечным. Следовательно, цепь работает в стационарном состоянии, определяемом стационарным распределением вероятностей Я(к).
Известно, что стационарное распределение цепи Маркова определяется системой
X = 0
Обозначим
и условием нормировки
X К (к) = 1.
к
z1 (?) = Х 2 (к, ?) = МП (?), г = 1,3,
к
(?) = Х , ?) = Мт(?)
к
и просуммируем все уравнения системы (4) относительно к, и получим
) = "/1 (?) + Л^2(? ),
22 (?) = ) -/222(?X
¿3 (?) = /222(?) -/323(?X 24 (?) = 2(1 - г) г2(?)-/4 ^),
где 2 = X 2кЯ(к) — интенсивность генерирования заявок ММР-потока. Запишем сразу
к
решение системы дифференциальных уравнений (5)
2 (?) = С^2 ?+ С2е2 ?,
(5)
(6)
(t) = Q eAt + С2 eAt
(7)
M2 + Л
M2 +A2
v
v
z
Бюллетень науки и практики /Bulletin of Science and Practice https://www.bulletennauki.com
Т. 5. №9. 2019 DOI: 10.33619/2414-2948/46
z,(t) =
-С1 +
МЧМЧг
(Мз + Л)(М + Л) 1 (Мз +^2)(M2 + *2)
С+
+
Z3(0) -
M q мъ
С-
Mi q M2Q2
(Мз +Л )(M + Л ) 1 (Мз +*2)(M2 + *2)
С
-M,i
(8)
*(i - r )м q
-Ce* +
*(i - r )м q
Z4(t) = ■ С 1 e ,
(M4 +Л )(M + Л ) (M4 +*2)(M2 +*2)
^ *(i - r )M q 1/1 ^
сe*2' +
(9)
+
Z4(0) -
С -
•*4 1
*(1 - r )M q
С
(M4 +Л )(M2 +Л ) (M4 +*2)(M2 + *2) где характеристические корни и X2 определяются как
+ У (М-М2)2 + 4*rM q
, = -M M2 +y (M M2) + 4*rMi q , =-м-М2 *= 2 ' * =
а произвольные постоянные C1 и C2 имеют вид
V(M-M2)2 + 4*rM q
2
_ * + м2 (\ + M2)z2(0) -M q z(0) _ * +м2 Mi q z(0) -+Mz2(0) С 1 = <i <i ' С2 = '
Mi q *2" Mi q
где z1(0), z2(0), z3(0), z4(0) — начальные условия.
-Л
Аналогично нахождению моментов первого порядка, мы можем найти моменты более высоких порядков для автономной системы массового обслуживания с двумя типа заявок и марковским модулированным процессом.
Численные результаты и обсуждение
Применим предложенную стохастическую модель в виде автономной системы массового обслуживания с двумя типами заявок и марковским модулированным процессом для прогнозирования численности мужского и женского населения в Российской Федерации.
Предположим, что ожидаемая продолжительность жизни женщины может быть разделена на три этапа: средняя длительность первого этапа составляет 15 лет, второго этапа — 30 лет, а третьего этапа — 30 лет. Поскольку продолжительность жизни т каждой женщины складывается из трех фаз тг-, где тг- — независимые и экспоненциально распределенные случайные величины с параметрами характеризующими
продолжительности фаз обслуживания, то
1 1 1
Д =—, Д2 = —, Д3 = — • 1 1 5 2 30 30
Вторая фаза жизни представляет собой репродуктивный возраст женщины. Мужчины образуют одну группу, продолжительность их нахождения в системе определяется продолжительностью фазы т4 с параметром ц4 таким, что
1
Д = 65-
Бюллетень науки и практики / Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
Отправной точкой является 2015 год (https://clck.ru/HtJMY). Исходя из предположений о динамике суммарного коэффициента рождаемости, можно сделать прогнозную оценку демографической ситуации в Российской Федерации.
Согласно Российскому статистическому ежегоднику (https://clck.ru/HtJMY), суммарный коэффициент рождаемости в 2015 году составил 1,777. В последние годы можно ожидать увеличение значения до 2,3 за счет активно проводимой демографической политики. Чтобы построить оптимистический сценарий для развития демографической ситуации, давайте установим
2 = (1,78 2,2 2,3 2,5 3,2)Г, Я = (0,2 0,3 0,4 0,09 0,01)Г
когда интенсивность рождения детей X определяется как
2 = (0,012 0,022 0,031 0,0075 0,001)Г.
Предположения об изменении суммарного коэффициента рождаемости служат отправной точкой для построения вероятностного прогноза. Положим ^=^2=1. Вероятность рождения девочки будем считать равной г=0,488, мальчика 1—г=0,512 соответственно.
Согласно [17] в начальный момент времени ¿2015=0 известны следующие начальные условия
щ(2015) = 11,885 , щ(2015) = 30,942, щ(2015) = 35,669 ,
где даг(0, I = 1,3 - численность женщин соответствующей возрастной группы (млн. чел.), а численность мужчин щ (0) = 67,8.
Используя возможности МаШСАО и формулы (6)-(8) построен оптимистический сценарий изменения численности женщин в каждой возрастной группе, а по формуле (9) спрогнозирована динамика общей численности мужчин на долгосрочную перспективу (до 2115 года). Полученные результаты представлены на Рисунке.
2015
2025
2035
2045
2055
2065
2075
2085
2095
2105
2115
Рисунок. Прогноз изменения численности женщин (синяя линия) и мужчин (красная линия) в Российской Федерации (млн чел.)
Анализ Рисунка показывает, что при таком предположении о суммарном коэффициенте рождаемости численность женского и мужского населения России будет постепенно увеличиваться. Эффективность предложенной математической модели для прогнозирования численности мужского и женского населения подтверждено ее применением для
Бюллетень науки и практики / Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
прогнозирования численности на период 1990-2010 гг., используя данные 1950-1990 гг. [9]. Сравнивая с реальными статистическими данными по численности населения периода 19902010 гг., было продемонстрировано, что модель и метод обеспечивает достаточно точные прогнозы численности населения Российской Федерации.
Заключение
Итак, предложена новая стохастическая модель в виде автономной системы обслуживания с двумя типами заявок и марковским модулированным пуассоновским процессом. Ее исследования было проведено методом моментов. Разработанная модель и метод были успешно применены для прогнозирования численности мужского и женского населения в Российской Федерации.
Список литературы:
1. Ahlburg D. A., Land K. C. Population forecasting: Guest editors' introduction // International Journal of Forecasting. 1992. V. 8. №3. P. 289-299. https://doi.org/10.1016/0169-2070(92)90048-E
2. Alho J. M., Spencer B. D. Uncertain population forecasting // Journal of the American Statistical Association. 1985. V. 80. №390. P. 306-314. https://doi.org/10.1080/01621459.1985.10478113
3. Alho J., Spencer B. Statistical demography and forecasting. Springer Science & Business Media, 2005. 410 p.
4. Keilman N. Uncertainty in national population forecasting: Issues, backgrounds, analyses, recommendations. Amsterdam, Lisse: Swets & Zeitlinger B.V, 1990. V. 20. 221 p.
5. Lee R. D., Tuljapurkar S. Stochastic population forecasts for the United States: Beyond high, medium, and low // Journal of the American Statistical Association. 1994. V. 89. №428. P. 1175-1189. https://doi.org/10.1080/01621459.1994.10476857
6. Lutz W. The future population of the world: what can we assume today. Routledge, 2013. https://doi.org/10.4324/9781315066929
7. Lutz W., Goldstein J. R. Introduction: How to deal with uncertainty in population forecasting? // International Statistical Review. 2004. V. 72. №1. P. 1-4. https://doi.org/10.1111/j.1751-5823.2004.tb00219.x
8. Beyond six billion: Forecasting the world's population / Ed. by J. Bongaarts, R. A. Bulatao. Washington: National Academy Press, 2000. 236 p.
9. Носова М. Г. Автономная немарковская система массового обслуживания и ее применение в задачах демографии: дисс. ... канд. физ.-мат. наук. Томск, 2010. 204 с.
10. Назаров А. А. Носова М. Г. Исследование математической модели демографических процессов в виде пятифазной системы массового обслуживания // Вестник Сибирского государственного аэрокосмического университета им. академика Решетнева. 2010. Т. 1. C. 4952.
11. Назаров А. А., Носова М. Г. Многофазная автономная система массового обслуживания и ее применение к задачам демографии // Известия Томского политехнического университета. Инжиниринг георесурсов. 2009. Т. 315. №5. C. 183-186.
12. Назаров А. А., Носова М. Г. О нецелесообразности аппроксимации процесса рождаемости потоками Пуассона при долгосрочном прогнозировании // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. №3 (8). 75-79.
Бюллетень науки и практики / Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
13. Nosova M. Research of a three-phase autonomous queuing system with a Markov Modulated Poisson process // Информационные технологии и математическое моделирование (ИТММ-2018). 2018. С. 33-38.
14. Гнеденко Б. В. Введение в теорию массового обслуживания. 3-е изд., испр. и доп. М.: КомКнига, 2005. 397 с.
15. Боярский А. Я., Валентей Д. И., Кваша А. Я. Основы демографии / под ред. А. Я. Боярского. М.: Статистика, 1980. 295 с.
16. Назаров А. А., Терпугов А. Ф. Теория массового обслуживания. Томск: Изд-во НТЛ, 2004. 228 с.
References:
1. Ahlburg, D. A., & Land, K. C. (1992). Population forecasting: Guest editors' introduction. International Journal of Forecasting, 8(3), 289-299. https://doi.org/10.1016/0169-2070(92)90048-E
2. Alho, J. M., & Spencer, B. D. (1985). Uncertain population forecasting. Journal of the American Statistical Association, 80(390), 306-314. https://doi.org/10.1080/01621459.1985.10478113
3. Alho, J., & Spencer, B. (2005). Statistical demography and forecasting. Springer Science & Business Media, 410.
4. Keilman, N. (1990). Uncertainty in national population forecasting: Issues, backgrounds, analyses, recommendations. Amsterdam, Lisse, Swets & Zeitlinger B. V, 20, 221.
5. Lee, R. D., & Tuljapurkar, S. (1994). Stochastic population forecasts for the United States: Beyond high, medium, and low. Journal of the American Statistical Association, 89(428), 11751189. https://doi.org/10.1080/01621459.1994.10476857
6. Lutz, W. (2013). The future population of the world: what can we assume today. Routledge. https://doi.org/10.4324/9781315066929
7. Lutz, W., & Goldstein, J. R. (2004). Introduction: How to deal with uncertainty in population forecasting? International Statistical Review, 72(1), 1-4. https://doi.org/10.1111/j.1751-5823.2004.tb00219.x
8. Bongaarts, J., & Bulatao, R. A. (eds.). (2000). Beyond six billion: Forecasting the world's population. Washington, National Academy Press, 236.
9. Nosova, M. G. (2010). Avtonomnaya nemarkovskaya sistema massovogo obsluzhivaniya i ee primenenie v zadachah demografii: Ph.D. diss. Tomsk, 204. (in Russian).
10. Nazarov, A. A., & Nosova, M. G. (2010) Issledovanie matematicheskoj modeli demograficheskih processov v vide pyatifaznoj sistemy massovogo obsluzhivaniya [The Mathematical Model of Demographic processes research in the Form of a five-phase System of Mass Service]. Vestnik Sibirskogo gosudarstvennogo aerokosmicheskogo universiteta im. akademika Reshetneva, 1, 49-52. (in Russian).
11. Nazarov, A. A., & Nosova, M. G. (2009). Mnogofaznaya avtonomnaya sistema massovogo obsluzhivaniya i eyo primenenie k zadacham demografii [Multiphase independent System of Mass service and its Application to demography Problems]. Izvestiya Tomskogo politekhnicheskogo universiteta. Inzhiniring georesursov [Bulletin of the Tomsk Polytechnic University], 315(5), 183-186. (in Russian).
12. Nazarov, A. A., & Nosova, M. G. (2009). O necelesoobraznosti approksimacii processa rozhdaemosti potokami Puassona pri dolgosrochnom prognozirovanii. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika, (3), 75-79. (in Russian).
Бюллетень науки и практики /Bulletin of Science and Practice Т. 5. №9. 2019
https://www.bulletennauki.com DOI: 10.33619/2414-2948/46
13. Nosova, M. G. (2018). Research of a three-phase autonomous queuing system with a Markov Modulated Poisson process. Information Technologies and Mathematical Modeling (ITMM-2018): Proceedings of 17th International Conference named after A. F. Terpugov, September 10-15, 2018, Tomsk, Russia. Tomsk, NTL, 33-38.
14. Gnedenko, B. V. (2005). Vvedenie v teoriyu massovogo obsluzhivaniya. 3-e izd., ispr. i dop. Moscow, KomKniga, 397. (in Russian).
15. Boyarskii, A. Ya., Valentei, D. I., & Kvasha, A. Ya. (1980). Osnovy demografii. Ed. A. Ya. Boyarskii. Moscow, Statistika, 295. (in Russian)
16. Nazarov, A. A., & Terpugov, A. F. (2004). Teoriya massovogo obsluzhivaniya. Tomsk, Izd-vo NTL, 228. (in Russian).
Работа поступила Принята к публикации
в редакцию 17.08.2019 г. 22.08.2019 г.
Ссылка для цитирования:
Носова М. Г. Стохастическая модель для прогнозирования численности населения // Бюллетень науки и практики. 2019. Т. 5. №9. С. 17-25. https://doi.org/10.33619/2414-2948/46/02
Cite as (APA):
Nosova, M. (2019). Stochastic Model for Population Forecasting. Bulletin of Science and Practice, 5(9), 17-25. https://doi.org/10.33619/2414-2948/46/02 (in Russian).