Научная статья на тему 'Метод передвижки возрастных групп в демографии и его приложения1'

Метод передвижки возрастных групп в демографии и его приложения1 Текст научной статьи по специальности «Математика»

CC BY
2556
318
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД ПЕРЕДВИЖКИ / ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ / THE TECHNIQUE OF AGING / POPULATION

Аннотация научной статьи по математике, автор научной работы — Назаров Анатолий Андреевич, Носова Мария Геннадьевна

Предлагаются методы прямой и обратной передвижки возрастных групп. Находятся основные характеристики, определяющие распределение вероятностей значений численностей групп для методов прямой и обратной передвижки. Выполняется оценка величины людских потерь Российской Федерации в годы Великой Отечественной войны с использованием данных переписей населения 1939 и 1959 гг. и методов прямой и обратной передвижки возрастных групп.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Назаров Анатолий Андреевич, Носова Мария Геннадьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The direct and reverse techniques of aging are offered. The basic characteristics determining distribution of probabilities of population groups for the techniques of aging are found. The base equation for the direct technique of aging is 1 (, ) (, ) ( ) ( ) N x t N x t S x S x Ґу Ґу Ґу = Ґе, where N(x,t) is known and N(x-ƒ,t-ƒ) is estimation of value of population group with age x-ƒ in year t-ƒ, S(x) is a survival function, Ґе1 is random error with MҐе1 = 0. The equation for the reverse technique of aging is obtained: 2 (, ) (, ) ( ) ( ) N x t N x t S x S x − Ґу − Ґу − Ґу = Ґе, where N(x,t) is known and N(x-ƒ,t-ƒ) is estimation of value of population group with age x-ƒ in year t-ƒ, S(x) is a survival function, Ґе2 is random error with MҐе2 = 0. High enough accuracy of these estimations is shown. The estimation of human losses of the Russian Federation within Great Patriotic War using data of population censuses in the 1939 and in the 1959 and the direct and reverse techniques of aging is executed.

Текст научной работы на тему «Метод передвижки возрастных групп в демографии и его приложения1»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2009 Управление, вычислительная техника и информатика № 3(8)

УДК 519.21

А.А. Назаров, М.Г. Носова

МЕТОД ПЕРЕДВИЖКИ ВОЗРАСТНЫХ ГРУПП В ДЕМОГРАФИИ И ЕГО ПРИЛОЖЕНИЯ1

Предлагаются методы прямой и обратной передвижки возрастных групп. Находятся основные характеристики, определяющие распределение вероятностей значений численностей групп для методов прямой и обратной передвижки. Выполняется оценка величины людских потерь Российской Федерации в годы Великой Отечественной войны с использованием данных переписей населения 1939 и 1959 гг. и методов прямой и обратной передвижки возрастных групп.

Ключевые слова: метод передвижки, численность населения.

В связи с возрастающей ролью демографического фактора в социальноэкономическом планировании актуальными являются перспективные расчеты численности и состава населения. В решении этой задачи полезным является математическое моделирование. Разработка и использование разного рода математических моделей служат как для анализа воспроизводства населения в целом, так и для выявления закономерностей развития тех или иных демографических процессов. При моделировании принимаются определенные исходные предположения в отношении основных составляющих процесса (рождаемость, смертность, миграция и т.п.). На этой основе исчисляются другие характеристики населения и его структуры.

Особое место в математическом моделировании занимает метод передвижки возрастов (или метод компонент), разработанный П. К. Уэлптоном [1]. Исчислением половозрастной структуры населения методом возрастной передвижи занимались С.Г. Струмилин, А.Я. Боярский, П.П. Шушерин, М.С. Бедный, С. Щербов, В. Лутц, У. Сандерсон, а также Комиссия по народонаселению ООН, Государственный комитет Российской Федерации по статистике, Центр демографии и экологии человека [2, 3].

Метод передвижки возрастных групп достаточно эффективен для краткосрочных прогнозов с горизонтальным планированием на срок не более 10 - 15 лет. В данной работе методом передвижки возрастных групп определяется величина людских потерь Российской Федерации в годы Великой Отечественной войны, с использованием данных переписей населения 1939 и 1959 гг.

1. Метод передвижки по возрастам

Метод прямой передвижки применяется для определения оценок значений численности Мх+т/+т) группы лиц возраста х+т в году t+т при условии, что известна численность Щх,(), т - шаг прогнозирования. Численность населения рас-

1 Работа выполнена при поддержке АВЦП «Развитие научного потенциала высшей школы (2009 -2010 гг.)» Федерального агентства по образованию РФ по проекту «Разработка методов исследования немарковских систем массового обслуживания и их применения к сложным экономическим системам и компьютерным сетям связи».

сматривается в совокупности, без разделения по половому признаку. Обозначим через р(х,х+т) условную вероятность достижения возраста х+т лицами возраста х. Известно [4], что

р(х, х + т) = £(х + т) / £(х),

где £(х) - функция дожития [4], которая есть вероятность того, что человек доживет до возраста х. При заданных Щх,() и р(х,х+т) распределение вероятностей значений величины Мх+т, t+т) определяется схемой Бернулли и является биномиальным:

Р{Ы (х + т, t + т) = т} = Ст( x,t) р( х, х + т)т (1 - р( х, х + т))N (x,t )-т (1)

с математическим ожиданием

MN(х + т, t + т) = N(х, 0р(х, х + т) = N(х, ^ £(х + т) . (2)

£ (х)

Обозначая оценку значения величины М(х+т^+т) тем же символом, равенство (2) перепишем в виде

N (х + т, t + т)£ (х) = N (х, ^£ (х + т) + е1, (3)

где е1 - случайная ошибка с математическим ожиданием М е1 = 0.

Равенство (3) является основным для применения метода передвижки по возрастам. В частности, для метода прямой передвижки оно записывается в виде

N (х + т, t + т) = N (х, 0 £ (х + т) +е2, (4)

£ (х)

где Щх^) задано, а N(x+т,t+т) является оценкой значения численности демографической группы лиц возраста х+т в году t+т, а е2 - случайная ошибка с математическим ожиданием Ме2 = 0 .

При замене аргумента х на х-т и t на - равенство (3) перепишем в виде N(х,^£(х-т) = N(х-т,t-т)£(х) + е3, где е3 - случайная ошибка с математическим ожиданием Ме3 = 0 . Откуда получим

N (х -т, t -т) = N (х, t)£(х—— + е4, (5)

£ (х)

где N(x,t) задано, а Щх-т, t-т) является оценкой значения численности демографической группы лиц возраста х-т в году ^т, е4 - случайная ошибка с математическим ожиданием Ме4 = 0 . Равенство (5) позволяет определить оценку значения численности демографической группы в прошлые моменты времени. Назовем это методом обратной передвижки. Оценка N(x-т, ^т) требует дополнительного исследования, которое выполним ниже.

Из равенства (1) очевидно следует, что оценка численности N(x+т, t+т), полученная прямой передвижкой, имеет дисперсию

DN(х + т, t + т) = N(х,Г)р(х, х + т)(1 - р(х, х + т)) = N(х,Г) £(х + т) | \ - £(х + т) |,

£(х) I £(х) )

а коэффициент вариации У1 этой величины составляет

V = л/DN(х + т, t + т) = 1 I £(х) 1

1 MN(x + т, t + т) Л/N(х, t) \ £(х + т)

Определим границы значений коэффициента вариации ¥\. Так как численности пятилетних возрастных групп в статистических данных РФ составляют порядка нескольких миллионов, то первый сомножитель 1/VN(х,ґ) имеет величину менее 10-3. Используя статистические данные о зависимости функции выживания от возраста и проанализировав все возможные значения второго сомножителя для т є [1; 45] лет их < 70 лет, получаем, что второй сомножитель принимает максимальное значение 12,578 при т = 45 лет. В результате получаем, что коэффициент V] в этом случае имеет значения менее 0,0126. Поскольку оценка (4) обладает достаточно высокой точностью, то ошибкой є2 можно пренебречь.

2. Метод обратной передвижки

Равенство (5), определяющее оценку численности Щх-т, ґ-т) в методе обратной передвижки, получено применением прямой передвижки, поэтому необходимо найти характеристики этой оценки, в частности ее математическое ожидание и дисперсию. При заданном значении М(х,ґ) найдем распределение вероятностей значений численности М(х-т, ґ-т) группы лиц возраста х-т в году ґ-т.

По формуле Байеса [5] можно записать

(х-т, ґ-т) = т / N (х, ґ) = п} =

(х, ґ) = п / N (х-т, ґ-т) = т}Р{М (х-т, ґ-т) = т}

(6)

^ Р{М (х, ґ) = п / N (х-т, ґ-т) = у}Р{М (х-т, ґ-т) = V}

V=п

Здесь, аналогично (1)

Р{Ы(х,t) = п / N(х -т,t -т) = т} = СПр(х -т, х)п (1 - р(х -т, х))т-п , (7)

где р(х-т,х) = £(х)/£(х-т). Априорное распределение Р^(х-т,t-т) = т} будем полагать пуассоновским с некоторым параметром а, значение которого определим ниже:

ат

Р^(х-т,t-т) = т} =-----------е~а . (8)

т!

Рассмотрим сумму

ад

у (х) = X хуР^ (х, ^ = п / N (х - т, t - т) = у}Р^ (х - т, t - т) = V}.

V=п

Для краткости обозначим р(х, х + т) = р . В силу равенств (7) и (8) функцию уХ запишем в виде

ад V ад ! V

у (х) = X хСрп (1 - р)”-п ^-е~а = рпе-а X - (1 - рГп а =

V! п!(V - п)! V!

V=n ' V=n 'V ’ • •

п -а ад л /- _ \п ад V—п

= Р^е- X ^ (1 - р)v-па = (ар!-е-а X [а(1 - р)]-п =

п! v=n (V - п)! п! v=n (V - п)!

(ар)п я-ае (!-р) = (ар)п

п! п!

ехр{а[(1 - р)г -1]}.

Производящая функция ф(х) распределения (6) имеет вид

ад

ф(г) = X гтР^(х - т,t - т) = т /N(х,t) = п} =

т=п

= У7Т) = хп ехр{(х - 1)а(1 - р)}. (9)

У(1)

Таким образом, распределение (6) является сверткой вырожденного распределения детерминированной величины п и пуассоновского распределения с параметром

Х = а(1 - р) = а{1 - р(х -т, х)} . (10)

Найдем апостериорное среднее значение величины Мх-т,М:). Очевидно, можно записать

MN(х -т, t -т) = п + а{1 - р(х-т, х)} .

Полагая, что априорное и апостериорное средние значения совпадают, запишем равенство

а = п + а{1 - р(х-т,х)} ,

из которого найдем значения параметра а в виде

£ (х_т)

а = п / р( х -т, х) = п------. (11)

£ (х)

Таким образом, распределение (6) определяется производящей функцией (9) с параметром а вида (11). Найдем условные математическое ожидание и дисперсию величины Мх—т/-т) при условии, что выполняется равенство п=Щх,(). Очевидно, что выполняется равенство

MN (х-т, t-т) = а = N (х, Г) -£(———, (12)

£ (х)

которое оправдывает выбор оценки в виде (5).

Найдем условную дисперсию величины оценки (5) при условии, что п=Щх,(). В силу равенства (9)

DN (х-т, t-т) = а{1 - р(х-т, х)} =

= N (х,,) [1 - -р>-1 = N (х,,) Г ^ -1

£ (х) [ £ (х -т)) [ £ (х)

а коэффициент вариации У2 составляет величину

^]DN(х-т,t-т) 1 I £(х) Т £(х)

MN(х-т,t-т) ^(х,£(х-т) [ £(х-т))

Здесь аналогично У1 определим диапазон значений коэффициента вариации У2. Первый сомножитель 1/^/^х,7) имеет величину менее 103. Аналогично Уь проанализировав все возможные значения второго сомножителя для т е [1; 45] лет и х < 70 лет, получаем, что второй сомножитель максимальное значение 0,489 при-

нимает при т = 45. В результате имеем, что коэффициент вариации У2 имеет значения менее 10-3 для любых т и х. Заметим, что в смысле значений коэффициентов вариации, оценки, полученные обратной передвижкой, на порядок (в 10 раз) точнее оценок, полученных прямой передвижкой при одинаковом горизонте прогнозирования т. Поэтому случайной ошибкой е4 здесь также можно пренебречь.

Применим рассмотренный метод передвижки по возрастам к решению поставленной задачи определения величины людских потерь РФ в годы ВОВ.

3. Определение величины людских потерь РФ в годы ВОВ

Для решения поставленной задачи кроме статистических данных [6] распределения населения РФ по основным пятилетним возрастным группам в 1939 и 1959 гг. необходимо знать значения коэффициентов дожития. Такую информацию можно получить по результатам переписи населения РФ до 1939 г., либо после 1959 г. В данной работе воспользуемся статистическими данными 1979 г. (табл. 1).

Таблица 1

Статистические данные распределения численности населения РФ 1939 и 1959 гг. (тыс. чел.)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ гр.: возраст 1939 1959 1979

№ 1: 0-4 13806 13353 10523

№ 2: 9 - 5 11735 12415 9707

№ 3: 10-14 14158 8502 9512

№ 4: 15-19 9495 8975 12385

№ 5: 20-24 8744 11552 12995

№ 6: 25-29 10454 10591 11902

№ 7: 30-34 8820 11103 8016

№ 8: 35-39 7240 6423 8399

№ 9: 40-44 5315 6177 10485

№ 10 9 4 - 5 4 4268 7167 9376

№ 11 4 5 - 0 5 3710 5965 9716

№ 12 : 55-59 3332 4751 5595

№ 13 4 6 - 0 6 2775 3589 5065

№ 14 9 6 - 5 6 2079 2664 5493

№ 15 : >70 2426 4303 8200

По данным 1959 и 1979 гг. найдем оценки коэффициентов дожития лиц п-й группы до возраста лиц (п+4)-й группы

N (п + 4,1979)

р(п, п + 4) =-

N (п,1959)

как отношение численности Мп+4,1979) (п+4)-й группы населения в 1979 г. к численности Мп,1959) п-й группы населения 1959 г., состоящих из одних и тех же лиц Российской Федерации (табл. 2).

Последнее значение 0,3855 в первой строке получено как отношение численности 8200 последней (15)-й группы 1979 г. к суммарной численности 21272

групп с 11-й по 15-ю 1959 г. Коэффициенты р(п, п+4) применяются в методе прямой передвижки, а р(п-4, п) соответственно в методе обратной передвижки.

Т аблица 2

Оценки коэффициентов дожития

№ гр. р(п, п+4) р(п-4, п)

№ 1 0,9732

№ 2 0,9587

№ 3 0,9428

№ 4 0,9358

№ 5 0,9076 0,9732

№ 6 0,8853 0,9587

№ 7 0,8751 0,9428

№ 8 0,8711 0,9358

№ 9 0,8200 0,9076

№ 10 0,7664 0,8853

№ 11 0,3855 0,8751

№ 12 0,8711

№ 13 0,8200

№ 14 0,7664

№ 15 0,3855

3.1. Определение людских потерь методом прямой передвижки

Применяя значения коэффициентов дожития, приведенные в первой строке табл. 2, методом прямой передвижки, по формуле (4), найдем значения оценок численностей возрастных групп на 1959 г. по данным 1939 г. Эти значения приведены в табл. 3.

Т аблица 3

Значения оценок численностей возрастных групп на 1959 г., полученных методом прямой передвижки

№ гр. 1939 р(п, п+4) Передвижка на 1959 1959 Разность

№ 1 13806 0,9732

№ 2 11735 0,9587

№ 3 14158 0,9428

№ 4 9495 0,9358

№ 5 8744 0,9076 13436 11552 1884

№ 6 10454 0,8853 11250 10591 659

№ 7 8820 0,8751 13349 11103 2246

№ 8 7240 0,8711 8886 6423 2463

№ 9 5315 0,8200 7936 6177 1753

№ 10 4268 0,7664 9255 7167 2088

№ 11 14322 0,3855 7718 5965 1753

№ 12 6307 4751 1556

№ 13 4358 3589 769

№ 14 3271 2664 607

№ 15 5521 4303 1218

В последней строке этой таблицы приведены значения разностей прогнозных, полученных методом прямой передвижки, и фактических значений численностей возрастных групп 1959 г. Эти значения можно интерпретировать как величину людских потерь РФ в годы ВОВ. Их суммарные значение составляет й = 17001 тыс.

3.2 Определение людских потерь методом обратной передвижки

Применяя значения коэффициентов дожития, приведенные во второй строке табл. 2, методом обратной передвижки по формуле (5), найдем значения оценок численностей возрастных групп на 1939 г. по данным 1959 г. Результаты приведены в табл. 4.

Т аблица 4

Значения оценок численностей возрастных групп на 1959 г., полученных методом обратной передвижки

№ гр. 1959 р(п-4, п) Передвижка на 1939 1939 Разность

№ 1 11870 13806 1936

№ 2 11047 11735 688

№ 3 11776 14158 2382

№ 4 6863 9495 2632

№ 5 11552 0,9732 6806 8744 1938

№ 6 10591 0,9587 8096 10454 2358

№ 7 11103 0,9428 6817 8820 2003

№ 8 6423 0,9358 5454 7240 1786

№ 9 6177 0,9076 4377 5315 938

№ 10 7167 0,8853 3476 4268 792

№ 11 5965 0,8751 11163 14322 3159

№ 12 4751 0,8711

№ 13 3589 0,8200

№ 14 2664 0,7664

№ 15 4303 0,3855

Здесь значения последней строки получено вычитанием из фактической численности возрастных групп 1939 г. значений, полученных обратной передвижкой. Эти разности можно интерпретировать как количество тех лиц данной возрастной группы, которые оказались исключенными из процесса формирования населения 1959 г. Суммарная величина £2 этих разностей по всем возрастным группам составляет £2 = 20612 тыс. Эта сумма складывается из потерь по естественным причинам, а также людских потерь, обусловленных ВОВ, значения которых по возрастным группам определяется произведением значений последней строки табл. 4 на коэффициенты р(п, п+4). Эти значения приведены в табл. 5.

Значения последней строки этой таблицы совпадают со значением последней строки табл. 3, следовательно, значение людских потерь РФ в годы ВОВ составляет 17 млн человек.

Таблица 5

Значения людских потерь, обусловленных ВОВ

а г % p(n,n+4)

№ 1 1936 0,9732

№ 2 688 0,9587

№ 3 2382 0,9428

№ 4 2632 0,9358

№ 5 1938 0,9076 1884

№ 6 2358 0,8853 659

№ 7 2003 0,8751 2246

№ 8 1786 0,8711 2463

№ 9 938 0,8200 1759

№ 10 792 0,7664 2088

№ 11 3159 0,3855 1753

№ 12 1556

№ 13 769

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ 14 607

№ 15 1218

Заключение

Метод прямой и обратной передвижки возрастов может применяться для расчета численности возрастных групп населения в годы между датами переписи. Данный метод является простым инструментом при демографическом анализе и дает результаты, вполне адекватные реальности.

ЛИТЕРАТУРА

1. Whelpton P.K. Population of the United States, 1925 to 1975 // The American Journal of Sociology. 1928. V. 34. N 2. P. 253 - 270.

2. Демографический энциклопедический словарь / под ред. Д.И. Валентея. М.: Советская энциклопедия, 1985. 608 с.

3. МедковВ.М. Демография. М.: ИНФРА-М, 2007. 683 с.

4. Фалин Г.И., Фалин А.И. Введение в актуарную математику. М.: Изд-во МГУ, 1994. 86 с.

5. Назаров А.А., Терпугов А.Ф. Теория вероятностей и случайных процессов: Учебное пособие. Томск: Изд-во НТЛ, 2006. 204 с.

6. Российский статистический ежегодник: Статистический сборник: Официальное издание / Гос. комитет РФ по статистике (Госкомстат России) / под ред. В. Л. Соколина и др. М.: 2001. 642 с.

Назаров Анатолий Андреевич Носова Мария Геннадьевна Томский государственный университет

E- mail: nazarov@fpmk.tsu.ru; nosova_mg@mail.ru Поступила в редакцию 11 мая 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.