Научная статья на тему 'Некоторые статистические методы анализа надёжности данных по населению мира'

Некоторые статистические методы анализа надёжности данных по населению мира Текст научной статьи по специальности «Экономика и бизнес»

CC BY
49
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Учет и статистика
ВАК
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые статистические методы анализа надёжности данных по населению мира»

Григорьянц М. Г., Рыльский И. В.

НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА НАДЁЖНОСТИ ДАННЫХ ПО НАСЕЛЕНИЮ МИРА

Социально-экономическое развитие каждой страны, составляющих её территориальных образований, континентов, их регионов и мира в целом во многом связано с населением, его численностью и качественным составом, особенно в условиях глобализации. Современный анализ социально-экономического развития базируется на основе данных мировой, глобальной системы статистической информации. Первоочередным условием при этом должно быть качество данных, их достоверность, надёжность. Точность данных по населению всех стран зависит от многих объективных и субъективных

причин и является далеко не идеальной, особенно в развивающихся странах, несмотря на усилия статистических организаций на всех уровнях, начиная с ООН.

Для оценки качества данных по населению в комплексе многих характеристик, не поддающихся количественному выражению, в статистических публикациях, в частности, в ежегодниках ООН, по каждой из стран и административных единиц мира приводится показатель «надёжности данных» (НД), обозначенный по мере снижения качества специальным буквенным кодом: А, В, С, Д. Знак «—» проставляется по незначительному коли-

честву небольших по численности административных территорий при отсутствии должного учёта и такой ненадёжности данных по населению, которая не соответствует даже категории Д [см. 3, 4]. Надёжность данных (НД) определяется с учётом их источника (переписи, записи актов гражданского состояния, регистров, опросов, выборочных зондажей) и даты их получения, т.е. исходя из систематичности и налаженности получения сведений о населении. Точность учёта внешней миграции является самым слабым информационным звеном, над усовершенствованием которого работают во всех странах мира.

Категория надёжности данных раз в два года, начиная с 1997 г., по каждой из 205 стран и административных единиц (адм. ед.) с населением не менее 150 тыс. человек приводится в информационных бюллетенях Центра демографии и экологии человека Института народно-

хозяйственного прогнозирования РАН «Население и общество» под заголовком «Все страны мира» [1, 2, 3, 4].1 По каждой из этих стран и адм. единиц в разрезе регионов континентов представлен набор основных сведений: численность населения на середину года и прогноз её на 2025 г., территория,2 коэффициент рождаемости, смертности общей и младенческой, коэффициент суммарной рождаемости, ожидаемая продолжительность жизни при рождении (мужчин, женщин), % населения в возрасте 0—14 и 65 лет и старше, ВНПппс на одного жителя в долл. США, а с 2001 г. и доля ВИЧ-инфицированных в возрасте 15—49 лет. Ряд группировок, произведённых по [2, 3,

1 Общее количество стран и административных территорий в мире более 230 (в [8, с. 255] дана цифра 234). Именно на данных «Все страны мира» [1, 2, 3, 4] и проводятся наши исследования [5, 6, 7, 9].

2 В последующих выпусках «Население и общество» прогноз численности населения на 2025 г. и площадь территории уточняются. Поэтому в

расчётах за предыдущие годы по странам и адм. единицам площадь территории и прогноз численности населения на 2025 г. взяты по «Все страны мира» (2003) [4].

4] и «Население и общество»” №7, август 1995 г., позволил выявить контрасты показателей воспроизводства населения мира в начале XXI в. при зафиксированной надёжности данных, нуждающейся в её повышении [6].

Введение оценки надёжности данных (НД) показывает большой разброс в качестве информации по населению мира. От периода к периоду НД по некоторым странам и адм. единицам меняется.3 Так, из 205 стран и адм. единиц в 2001 г. по сравнению с 1997 г. НД сохранилась в 140, в 25 она повысилась, в 31 — снизилась, по 9 оценка НД менялась то в сторону повышения, то в сторону понижения по периодам с 1997 г. по 1999 г., и с 1999 г. по 2001 г. [1, 2, 3]. К 2003 г. по сравнению с 2001 г. оценка НД сохранилась в 170, в 27 странах и адм. единицах она снизилась, в том числе по Америке — в 11 раз, Аф -рике — в 9 раз, Азии — в 6 раз (в частности, в Туркмении и Узбекистане) и только в 8 странах она повысилась (в том числе в Пакистане, Сербии и Черногории, Эстонии). В результате на 18 стран и адм. единиц уменьшилось количество стран категорий А и В и, соответственно, увеличилось количество стран с более низкой оценкой их качества.

К категориям надёжности данных А, В, С, Д нами были добавлены ещё две: категория Е вместо обозначения в [3, 4] “—” и Х в [5] и категория Б, обозначенная знаком ХХ в [5]. Категория Б, в которой отражены результаты округлений данных по странам и адм. единицам с населением не менее 150 тыс. человек и общие итоги по странам и адм. единицам с населением менее 150 тыс. человек, введена для сбалансированности опубликованных данных по миру в целом, континентам и их регионам [1, 2, 3, 4]. Однако при буквенных кодах по каждой стране нельзя дать обобщающую оценку надёжности данных по миру в целом, континентам и их регионам, т.е. получить

3 После намечаемого на октябрь 2010 г. проведения Всероссийской переписи населения возможна замена по России категории надёжности данных с В на А.

среднюю надёжность данных (Х или НД ),

важную для анализа качества статистических показателей в статике и динамике.

Определить среднюю надёжность данных по миру в целом, регионам и их континентам возможно при замене буквенных кодов (символов) баллами надёжности данных по формуле средней арифметической взвешенной

(Х = ЕХ : ). Для этого нами предла-

гаются буквенные коды оценки НД по каждой из 205 стран и адм. единиц заменить соответствующими им цифровыми кодами (баллами) по пятибалльной шкале: вместо А — 5 баллов, вместо В — 4, С — 3, Д — 2, Е — 1. Эта замена необходима для определения среднего балла надёжности по миру в целом, континентам и их регионам, приходящегося на одно территориальное образование. Для территорий стран (Г или Т) и численности населения на середину года (Г или Б) средние баллы надёжности данных в_це-лом по миру, континентам и их регионам были определены по шестибалльной шкале с заменой буквенных кодов цифровыми (баллами): вместо А — 6, баллов, вместо В — 5, С — 4, Д — 3, Е — 2, Б —

1. Результаты были представлены в [7, с. 182—185], и на основе их выявлены и проанализированы существенные различия в средних баллах надёжности данных по континентам и их регионам, а также снижение средних баллов надёжности данных в 2003 г. по сравнению с 2001 г. по всем континентам, кроме Океании, и гипотетический прогноз-предупреждение при сохранении к 2025 г. по каждой из стран и адм. единиц балла надёжности на уровне 2003 г., по которому процесс снижения надёжности данных по миру в целом и континентам может быть продолжен, особенно в Африке [7].

С переходом на балльную оценку надёжности данных появилась возможность глубже проанализировать надёжности данных по населению и территории мира, обратив особое внимание на необходимость повышения надёжности данных ряда конкретных стран и адм. единиц, расширить арсенал статистиче-

ских методов при анализе данных в статике и динамике.

Анализ в статике и динамике по миру в целом средней надёжности данных (НД), показателей динамики, индексов надёжности данных, структуры и структурных сдвигов (перераспределения) по территории и населению целесообразно проводить в двух вариантах, дающих

один и тот же результат по НД т , НД §

и индексам переменного состава НД

(1^ илиI™ ). Расчет за 2001 г. и 2003 НДт НД'

г. по миру в целом дан в Приложениях №№1—4:

по первому варианту: в качестве вариант берутся баллы НД по миру в целом (от 6 до 1) и по территории и по населению, а в качестве весов — площадь территорий стран и адм. единиц мира, соответствующая каждому из баллов НД при определении средней надёжности данных

по территории мира НДт (Приложение 1); численность населения на середину года стран и адм. единиц мира, соответствующая каждому из баллов НД при определении по населению мира НД § (Приложение 2).

по второму варианту: в качестве варианта берётся средняя надёжности данных по территории континентам (НДт ), а в качестве весов — площадь территории континентов при определении средней надёжности данных по территории

мира НДТ (Приложение 3); или в качестве варианта берётся НД § по континентам, а весами — численность населения при определении НД § по миру

(Приложение 4). Аналогично в двух вариантах может быть проанализирована

НД по континентам в разрезе их регионов.

Из приложений №№1—4 видно, что в 2003 г. по сравнению с 2001 г. по миру

и континентам снизилась НД § (кроме Океании) и НДт (кроме Азии и Океа-

нии). Причём НДт за период снизилась

больше, чем по населению НД § (кроме Европы). В отличие от 2001 г. в 2003 г. по миру НД § стала больше, чем НДт . Такая динамика по миру сложилась на фоне неизменной территории, наибольшего роста численности населения в Африке (105,26%), наименьшего в Европе

(100,14%) и наибольшего снижения НД в Африке.

Представляет интерес определение и анализ индексов динамики надёжности данных переменного, постоянного состава и структурных сдвигов по населению и разложения общего прироста человеко-

баллов и НД § по факторам прироста [9]. Так как территория мира и континентов берётся неизменной, то индекс надёжности данных переменного состава и постоянного состава по территории равны, а индекс структурных сдвигов равен 1.

Отмечая необходимость повышения качества данных по населению мира, всех стран, приведём такие цифры: на одну миллионную (0,000001) среднего балла надёжности по населению мира приходилось в 1999 г. 1192 человека, в 2001 г. — 1219, в 2003 г. — 1262, а по гипотетическому прогнозу-

предостережению при условии сохранения в 2025 г. категории надёжности данных в каждой стране и адм. единице на уровне 2003 г. может приходиться 1598 человек; по территории мира на 0,000001 среднего балла надёжности данных в 2001 г. приходилось 26 км , в 2003 г. — 27 км2, что лишний раз подтверждает необходимость повышения качества данных.

Список литературы

1. Все страны мира (1997). Население и общество: Информационный бюллетень Центра демографии и экологии человека Института народнохозяйственного прогнозирования РАН. — 1997. — №20. — Август.

2. Все страны мира (1999). Население и общество. — 1999. — №38. — Август.

3. Все страны мира (2001). Население и общество. — 2001. — №56. — Август.

4. Все страны мира (2003). Население и общество. — 2003. — №74. — Август.

5. Григорьянц М.Г., Рыльский И.В. Качество статистической информации о населении мира к началу XXI века // Учёт и статистика / РГЭУ «РИНХ». — Ростов н/Д, 2003. — №1.

6. Григорьянц М.Г., Рыльский И.В. Контрасты показателей воспроизводства населения мира в начале 21 века // Учёт и статистика / РГЭУ «РИНХ». — Ростов н/Д, 2003. — №2.

7. Григорьянц М.Г., Рыльский И.В. Надежность данных при оценке качества информации о населении XXI века // Учёт и статистика / РГЭУ «РИНХ». — Ростов н/Д, 2005. — №3(7).

8. Народонаселение: Энциклопедический словарь. — М: Большая российская энциклопедия, 1994.

9. Рыльский И.В. Индексы надёжности данных по населению мира // Проблемы теории и практики развития статистики: Материалы межвузовской научно-практической конференции / РГЭУ «РИНХ». — Ростов н/Д, 2005.

Распределение территории (Т) стран и административных единиц (адм. ед.) по категориям (баллам) надёжности данных (НД) по шестибалльной шкале, средний балл (НДТ) и коэффициент вариации для мира в целом на середину 2001 и 2003 г.г. и структурные сдвиги в распределении территории по баллам за период. *

Категории НДТ и НДт По территории Прирост за период АЙТ“ ЙТГ ЙТ0 (гр. 7 - гр. 6) Прирост

Тыс. км2 Прирост за период Структура %-ных пунктов удельного веса за пери-

2001 То 2003 Ті Тыс. км2 гр. 3 - гр. 2 В % (гр. 4 : гр. 2)х100 2001 ЙТ0 2003 ЙТ1 од в % (гр. 7 : гр. 6)х100

1 2 3 4 5 6 7 8 9

Мир в целом 134288 134288 0 0 100,000 100,000 0 (±7,226) Х

В т.ч. А В С 37136.4 80371.7 9656,8 33248 74558.1 18810.2 -3888.4 -5813.6 9153,4 -10.47 -7,23 94,79 27,654 59.850 7,191 24.759 55,522 14,007 -2.895 -4.328 6,816 89.53 92,77 194,79

Б 6755,02 7307,002 552,0 8,17 5,031 5,441 0,410 108,15

Е 4,2 0,8 -3,4 -80,95 0,003 -0,003 -

Е 363,898 363,898 0 0 0,271 0,271 0 X

НДт 5,0930994 4,987831 В т.ч. +9705,4 - - - - -

Ут 15,013 16,143 - - - - - -

* Из 234 стран и адм. единиц по миру в публикациях [2, 3] приведены данные по 205-ти с населением более 15 тыс. человек, в том числе в 2001 г. и 2003 г. соответственно: А(50 и 44), В(93 и 41), С(41 и 60), Д(16 и 17), Е(5 и 3), средний балл надёжности нд по пятибалльной шкале (3,8146 и 3,7122).

ПРИЛОЖЕНИЕ 2

Распределение населения (З) стран или административных единиц (адм. ед.) по категориям

(баллам) надёжности данных (НД), среднему баллу надёжности данных (НД3) и коэффициенту вариации (УЗ) для населения всего мира на середину 2001 г. и 2003 г. и структурные сдвиги в распределении населения по баллам за 2001—2003 гг.

Категории НД По населению Рост за период удельного веса (в %) (гр. 7 : гр. 6)х100

Млн чел. Прирост за период Структура %-ных пунктов Прирост %-ных пунктов Ай8= ^0

НД 3 2001 Я0 2003 81 Млн. чел. гр. 3-гр. 2 В % (гр. 4 : гр. 2)х100 2001 ЙТ0 2003 ЙТ1

1 2 3 4 5 6 7 8 9

Мир в целом 6137 6134 177 2,88 100,000 100,000 0 (±1,607) Х

В т.ч. А 1049,62 979,68 -69,94 -6,66 17,103 15,516 -1,587 90,72

В 4429.85 4579.07 149.22 3,37 72.183 72,522 0.339 100.47

С 479.84 554.62 74.78 15.58 7.819 8.784 0.965 112.34

О 176.52 200,73 24.21 13.72 2.876 3.179 0,303 110.54

Е 0,60 о -0,35 -58,33 0.010 0.004 -0.006 40.00

Е 0,57 -0,35 -0,92 -161,4 0,009 -0,005 -0,014 -55,56

нд8 5,034652 5,003841 В т.ч. +248,21 - - - - -

Уз 11,947 12,154 -71,21 - - - - -

Средние баллы надёжности данных (НДт ) и коэффициенты вариации (УТ) по территории

континентов и мира в целом за 2001—2003 гг.

Континенты* Средняя надёжность данных НДт НДт0 НДт! По территории Индекс НДТ НДтУ I НД = /ндт 0 Территория (тыс. км2) 2001 и 2003 Т0=Т! Структура территории ат0= ат1

1 2 3 4 5 6

I 4,432110 4,243870 0,957528 30333 22,588

II 5.542539 5.414479 0.976951 40570 30.211

III 4,865492 4,774789 0,981358 31796 23,678

IV 5,177102 5,160960 0,996882 23015 17,138

V 5,923407 5,926375 1,000494 8574 6,385

Мир в целом НДт 5,093094 4,987831 0,979332 134288 100,000

VI 9,152 10,067

* Условные обозначения: I — Африка, II — Америка, III — Азия (без России), IV — Европа (включая Россию), V — Океания.

243

Среонш баллы ьадеЩности данных (нд 81 по населению континентов и мира в целом, коэффтщенты: вариаций (У$), динамика и структурные сдвйЩ

в распределении населения за 2001-2003 гг.

* По населению

Я Ё 4? к Средняя надёжность данных нд"8 Индекс НД8 Население (млн чел.) Индекс Прирост населения за Структура населения Прирост за период Рост удельного

к Ё $ Ш НД51 1вд3=Н,1Ч'-— /Ш, :п(!| Эо .2003 населения период 'М* $х-$а 2001 2003 %-ных пунктов )с15=с181-с1Зо веса за период (в-%)

1 2 3 4 5 б 7 8 9 ю 11 12

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X 4,507421 4,415890 0,979691 818 861 1,0526 43 13,329 13,636 0,307 102,30

II 5,449215 0,979553 841 863 1,0262 22 13,704 13,668 -0,036 99,74

III 4,943984 4,953238 1,000685 3720 3830 1,0296 п! 60,616 60,659 0,043 100,07

IV 5,586204 5,539766 0,991687 727 728 1,0014 1 11,846 11.531.1 0.316 97,33

V 5,645484 5,681560 1,0.67014 31 32 1,0323 1 0.505 0.507 + 0.002 100,40

По миру 5,034652 5,003841 0,995054 6137 6314 1,0288 177 100,000 100,000 Г 11.352) X

Уз 6,392 7,187

* Условные обозначения: I — Африка, II — Америка, III — Азия (без России). IV — Европа (включая Россию), V —«Океания.

i Надоели баннеры? Вы всегда можете отключить рекламу.