Научная статья на тему 'Исследование социально-экономического развития сельских муниципальных районов Оренбургской области методами робастного оценивания'

Исследование социально-экономического развития сельских муниципальных районов Оренбургской области методами робастного оценивания Текст научной статьи по специальности «Экономика и бизнес»

CC BY
155
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СОЦИАЛЬНАЯ СТРУКТУРА / РОБАСТНОЕ ОЦЕНИВАНИЕ / МУНИЦИПАЛЬНЫЙ СЕЛЬСКИЙ РАЙОН / КЛАСТЕРНЫЙ МЕТОД / КОМПОНЕНТНЫЙ МЕТОД / SOCIAL STRUCTURE / STABLE EVALUATION / MUNICIPAL RURAL DISTRICT / CLASTER METHOD / COMPONENTS METHOD

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Ларина Татьяна Николаевна, Беньковская Людмила Валерьевна

Разработка государственных программ социально-экономического развития сельских территорий должна опираться на объективную оценку сложившейся ситуации. С целью обоснования выбора статистических методов исследования уровня развития социальной инфраструктуры сельских муниципальных районов Оренбургской области авторы осуществляют робастное (устойчивое) оценивание параметров распределения значений девяти показателей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE STUDY OF SOCIO-ECONOMIC DEVELOPMENT OF RURAL MUNICIPAL DISTRICTS OF ORENBURG REGION USING THE METHODS OF STABLE EVALUATION

The development of state programs of socio-economic development of rural territories should be based on the objective evaluation of the available situation. To substantiate the choice of statistical methods of investigation the level of social infrastructure development in the rural municipal districts of the Orenburg region the authors have carried out the robast (stable) assessment of distribution parameters of nine index values.

Текст научной работы на тему «Исследование социально-экономического развития сельских муниципальных районов Оренбургской области методами робастного оценивания»

Исследование социально-экономического развития сельских муниципальных районов Оренбургской области методами робастного оценивания

Т.Н. Ларина, к.эн, Л.В. Беньковская, преподаватель, Оренбургский ГАУ

Разработка государственных программ социально-экономического развития сельских территорий должна опираться на объективную оценку сложившейся ситуации. Большое значение при этом имеет качество информационной базы, а также достоверность обобщающих выводов, сделанных на основе научно обоснованных статистических расчётов. Как известно, применение многих распространённых на практике методов статистической обработки данных (например, корреляционно-регрессионный анализ) предполагает соответствие характеристик изучаемой совокупности нормальному закону распределения, что фактически встречается редко, особенно при малых объемах выборки. Однако значительная вариация изучаемых признаков может привести к потере оптимальных свойств метода наименьших квадратов и, как следствие, к ошибкам интерпретации статистических величин (средней, дисперсии и др.). В значительной мере решить указанную проблему позволяет применение группы специальных статистических процедур — робастных оценок.

Методы робастного (устойчивого) оценивания — это статистические методы, которые позволяют получать достаточно надёжные оценки статистической совокупности с учётом неявности закона её распределения и наличия существенных отклонений в исходной статистической информации [1]. В конечном итоге, применение робастных оценок позволяет обосновать выбор статистических методов исследования и более достоверно изучить сложившиеся закономерности.

Робастное оценивание проводится в два этапа:

1) выделение, распознавание данных, значительно отклоняющихся от основного массива (т.е. «выбросов» или «грубых ошибок»);

2) преобразование данных таким образом, чтобы оценки изучаемой совокупности (средняя величина, стандартное отклонение, дисперсия и др.) удовлетворяли требованиям надёжности и несмещённости.

Рассмотрим применение методики робастного оценивания на примере показателей развития социальной инфраструктуры сельских муниципальных районов Оренбургской области [2].

По территории Оренбургского региона объекты социальной инфраструктуры размещены неравномерно. Так, в 2008 г. число дошкольных учреждений варьировалось от 1 (одного) в Аб-дулинском районе до 50 учреждений в Оренбургском районе при плотности населения 7,4 и 14,38 чел. на 1 км2 соответственно. Это зависит от ряда причин: системы расселения, демографической структуры населения, направлений региональной и местной политики, финансирования, кадрового обеспечения и т.д. В Оренбургской области значительная асимметрия большинства показателей социальной инфраструктуры сохраняется на протяжении ряда лет (табл. 1).

Наиболее сильной вариации подвержены показатели х4 и х8, для которых коэффициент вариации составляет более 30%. Однако значительная величина коэффициента вариации не всегда сопутствует наличию в изучаемой совокупности аномальных наблюдений («выбросов»). Следовательно, к вариационным рядам показателей Х1...Х9 необходимо применить процедуры робастного оценивания.

Возможны несколько вариантов появления грубых ошибок в ранжированном вариационном ряду — это в верхней части, когда «выбросы» принимают минимальное значение, в нижней части — для максимального значения, а также сочетание двух этих вариантов, когда имеются как максимальные, так и минимальные аномальные значения показателя.

Анализ диаграмм размаха вариации (рис. 1) свидетельствует о том, что в 2008 г. «выбросы» снизу (т.е. максимальные аномальные значения) присутствуют в обеспеченности населения жильем (хх), амбулаторно-поликлиническими учреждениями (х5), врачами (хб), в ряду удельного веса бытовых услуг в общем объёме платных услуг населению (х8), для которого выявлены также экстремальные значения.

Экстремальные значения и «выбросы» сверху (т.е. минимальные аномальные значения) наблюдаются в ряду показателей благоустройства жилья газом (х2) и удельного веса автомобильных дорог с твёрдым покрытием в общей протяжённости автомобильных дорог общего пользования (Х9).

Отсутствуют «выбросы» в 2008 г. по показателям благоустройства жилья водопроводом (х3), наличию культурно-досуговых учреждений (х4) и обеспеченности детей дошкольными учреж-

1. Динамика коэффициентов вариации показателей развития социальной инфраструктуры муниципальных районов Оренбургской области, % [1]

Показатель 2000 г. 2005 г. 2007 г. 2008 г. 2008 г. к 2000 г-, (+/-)

Общая площадь жилых помещений, приходящаяся в среднем на одного жителя, кв. м / чел. (х^ 9,71 7,11 8,25 9,30 -0,41

Благоустройство жилищного фонда газом, в % к общей площади (х2) 6,02 4,09 2,55 1,99 -4,03

Благоустройство жилищного фонда водопроводом, в % к общей площади (х3) 33,52 32,7 30,11 29,44 -4,08

Число мест в учреждениях культурно-досугового типа на 1000 чел. (х4) 32,61 31,61 32,75 34,85 2,24

Численность врачей на 10 000 человек населения (х5) 18,55 17,85 18,26 18,72 0,17

Обеспеченность населения врачебными амбулаторнополиклиническими учреждениями (на конец года; число посещений в смену на 10 000 человек населения) (х6) 31,32 30,42 30,88 29,58 -1,37

Охват детей дошкольными образовательными учреждениями, в % от численности детей соответствующего возраста (х7 ) 29,95 32,18 30,22 29,55 -0,40

Удельный вес бытовых услуг в общем объеме платных услуг населению, % (х8) 104,74 117,32 117,23 59,95 -44,79

Удельный вес автомобильных дорог с твёрдым покрытием в общей протяженности автомобильных дорог общего пользования, % (х9) 9,36 7,68 6,33 6,15 -3,21

26 25 24 23 22 ч 21

и ^ $

о 20

19

18

17

16

□ Медиана І I 25%-75%

I Размах без выбр.

О Выбросы

х1

550

500

450

400

350

300

250

200

150

100

50

□ Медиана І I 25%-75%

I Размах без вы

□ Медиана І I 25%-75%

I Размах без выбр. О Выбросы

Рис. 1 - Диаграммы размаха вариации показателей развития социальной инфраструктуры по муниципальным районам Оренбургской области в 2008 г.

дениями (х7). Отсутствуют ряды, в которых имеются «выбросы» сверху и снизу.

Надёжными критериями выявления грубых ошибок являются L- и L'-критерии, предложенные Г. Титьеном и Г. Муром [1].

Для выявления грубых ошибок в верхней части ранжированного ряда данных используется L-критерий:

п—к

Е(хк хк)2

ь = -*=-

(1)

1=1

где XI — выборка I наблюдений по какому-либо одному, „/-му признаку; п — объём выборки;

Хк — общая для выборочной совокупности данных средняя величина;

X — средняя, которую рассчитывают по (п—к) наблюдениям, остающимся после отбрасывания к грубых ошибок «сверху» ранжированного ряда данных:

——к

х.

X = —

хк

— - к

Для выявления грубых ошибок в нижней части ранжированного ряда данных используется Ь-критерий:

ь' =

1=к+1

Е(хк х )2

(2)

1=1

где хк — средняя, которую рассчитывают по (п—к) наблюдениям, остающимся после отбрасывания к грубых ошибок «снизу» ранжированного ряда данных:

——к 1х,

— - к

Приведённые критерии Ь и Ь ' обладают табулированными критическими значениями для заданного уровня значимости а при известном объёме выборки п и предполагаемом числе ошибок к. Результаты критериального оценивания даны в таблице 2.

Сравнивая значения критериев Ь и Ь' с табличным значением Са>к, делаем вывод, что только величина Ь'-критерия для показателя обеспеченности населения жильем (хх) превышает критическую границу Са,к. Следовательно, значение показателя 25,4 кв. м/чел., соответствующее Новоорскому району, с вероятностью 95% нельзя признать грубой ошибкой («выбросом»). Исходные данные по этому району признаны типичными для изучаемой совокупности наблюдений. Совокупности по остальным оцениваемым показателям (х2, х5, х6, х8, Х9) в 2008 г. содержат «выбросы», нетипичные значения и не являются однородными, поэтому необходимо выполнить их модификацию.

Низкие по сравнению с большинством районов показатели х2 и Х9 Асекеевского района заставляют обратить внимание на неудовлетворительные результаты работы муниципалитета в плане благоустройства жилья газом и развития дорожного хозяйства.

Следующий этап робастного оценивания предполагает преобразование данных. При этом рекомендуется либо избавиться от аномальных наблюдений, исключив их из изучаемого ряда (подход, предложенный математиком А. Пуанкаре), либо заменить аномальные наблюдения расчётными величинами, не искажающими параметры распределения [1]. В первом случае

2. Результаты выявления аномальных наблюдений среди 35 муниципальных районов Оренбургской области по показателям развития социальной инфраструктуры в 2008 г.

Показа- тель Выбросы Район Значения Табличное значение оценки а = 0,05

сверху (тт) снизу (тах) Ь-критерий Ь -критерий

*1 - 25,4 Новоорский - 0,809 0,762

*2 93.2 93,9 94,0 94.2 - Новоорский Асекеевский Ясненский Саракташский 0,421 - 0,554

*5 - 39,8 Новосергиевский - 0,740 0,762

*6 - 343,4 358,3 Переволоцкий Светлинский - 0,634 0,642

*8 - 9,4 11,2 11,6 14.1 18.1 Адамовский Соль-Илецкий Абдулинский Кувандыкский Оренбургский - 0,228 0,424

*9 О 00 - Тоцкий Асекеевский 0,337 - 0,642

3. Характеристики распределения показателей развития социальной инфраструктуры по исходным и винзорированным данным в 2008 г.

Показатель *2 *5 *6 *8 *9

Средняя (х) 97,95 25,58 203,38 5,75 96,15

Винзоризованная средняя (хВ) 98,05 25,42 199,98 5,12 96,78

Стандартное отклонение (а) 1,98 4,86 61,03 3,49 6,00

Винзоризованное стандартное отклонение (аВ) 1,77 4,46 53,72 2,02 4,03

Коэффициент вариации (К), % 2,00 19,00 30,00 60,80 6,20

Винзоризованный коэффициент вариации (КВ), % 1,80 17,50 26,80 39,40 4,20

Коэффициент асимметрии (Лл) -1,08 0,53 0,70 1,94 -2,54

Винзоризованый коэффициент асимметрии (ЛлВ) -0,85 0,02 0,20 0,55 -0,98

Коэффициент эксцесса (Ех) 0,17 1,11 0,43 4,09 8,22

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Винзоризованый коэффициент эксцесса (ЕхВ) -0,40 -0,21 -0,61 -0,65 -0,47

Вероятность нормального распределения винзоризован-ных показателей (р) 0,38 0,10 0,41 0,38 0,001

исходные ряды укорачиваются (например, ряд показателя х2 станет короче на 4 наблюдения, а ряд показателя х8 — на 5 наблюдений). Очевидно, что дальнейшие аналитические действия будут затруднены, так как невозможно выполнить парные сравнения для рядов разной длины. При исследовании пространственной совокупности целесообразно применять второй подход, заменяя аномальные наблюдения так называемыми «винзоризованными» (модифицированными) величинами.

Метод модификации аномальных данных, реализованный Винзором, предполагает проецирование к значений, «засоряющих» выборку, в ближайшую точку оставшейся (п—к) части вариационного ряда. Средняя по Винзору (а-винзоризованная оценка) определяется с известным заранее уровнем а по формуле [1]:

( ——к-1 \

Ж (а) =1 п

X X + к (Хк+1 + Хп-к )

і=к+2

(3)

где к — число грубых ошибок, к < ап — целая часть от произведения ап; п — объем выборочной совокупности; а — некоторая функция величины засорения е. Значения а находят по специальным таблицам.

Приёмы робастного оценивания Пуанкаре и Винзора дают хороший результат на выборках

с симметричным распределением, хотя общих методов проверки данного требования нет [3].

После процедуры винзоризирования данных по формуле (3) значения характеристик распределения улучшились (табл. 3).

Анализ таблицы 3 показывает, что гипотезу о соответствии нормальному закону распределения винзорированных наблюдений на уровне значимости 5% нельзя отклонить для всех показателей, за исключением показателя х9.

Таким образом, большинство вариационных рядов изучаемых показателей развития социальной инфраструктуры сельских муниципальных районов Оренбургской области в 2008 г. содержат грубые ошибки. Поэтому для дальнейшей обработки массива данных необходимо их предварительно модифицировать. В противном случае для анализа этих данных следует применять такие многомерные методы, как кластерный, компонентный, факторный анализ, не требующие соответствия эмпирического распределения нормальному закону

Литература

1. Сошникова, Л.А.. Тамашевич В.Н., Уебе Г., Шеффер М. Многомерный статистический анализ в экономике: учеб. пособие для вузов / под ред. проф. В.Н. Тамашевича. М.: ЮНИТИ-ДАНА, 1999.

2. Города и районы Оренбургской области: стат. сб. / Территор. орган ФСГС по Оренбургской области. Оренбург, 2009.

3. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: учебник. М.: Финансы и статистика, 2003.

i Надоели баннеры? Вы всегда можете отключить рекламу.