Научная статья на тему 'Статистический анализ валового сбора семечковых культур в Центральном федеральном округе Российской Федерации'

Статистический анализ валового сбора семечковых культур в Центральном федеральном округе Российской Федерации Текст научной статьи по специальности «Социальная и экономическая география»

CC BY
223
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ИСХОДНЫХ ДАННЫХ / СТАТИСТИЧЕСКИЙ АНАЛИЗ / ГРУППИРОВАНИЕ ОБЪЕКТОВ / КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ / УРАВНЕНИЕ РЕГРЕССИИ / THE NONFORMAL ANALYSIS OF INITIAL DATA / STATISTICAL ANALYSIS / GROUPING OBJECTS / CORRELATION COEFFICIENT / EQUATION OF REGRESSION

Аннотация научной статьи по социальной и экономической географии, автор научной работы — Борисов Александр Николаевич

Обоснована необходимость предварительной неформальной подготовки данных, предназначенных для последующего статистического анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по социальной и экономической географии , автор научной работы — Борисов Александр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS INITIAL DATA FOR THE STATISTIC STUDY OF POME FRUIT YIELDS IN THE CENTRAL FEDERAL DISTRICT OF THE RUSSIAN FEDERATION

The need for the preliminary nonformal preparation of data, intended for the subsequent statistical analysis is substantiated.

Текст научной работы на тему «Статистический анализ валового сбора семечковых культур в Центральном федеральном округе Российской Федерации»

УДК 336.717.1

СТАТИСТИЧЕСКИЙ АНАЛИЗ ВАЛОВОГО СБОРА СЕМЕЧКОВЫХ КУЛЬТУР В ЦЕНТРАЛЬНОМ ФЕДЕРАЛЬНОМ ОКРУГЕ РОССИЙСКОЙ ФЕДЕРАЦИИ

А.Н. Борисов

Обоснована необходимость предварительной неформальной подготовки данных, предназначенных для последующего статистического анализа.

Ключевые слова: анализ исходных данных, статистический анализ, группирование объектов, коэффициент корреляции, уравнение регрессии.

На основе данных Федеральной службы государственной статистики о состоянии сельского хозяйства в 2014 г. [1] выясним корреляционную взаимосвязь между валовым сбором и площадью насаждений семечковых культур (табл.1) для регионов Центрального федерального округа. К семечковым культурам относятся яблоня, груша, рябина, айва. Воспользуемся методикой, изложенной в работах [2,3].

Таблица 1

Валовый сбор и площадь насаждений семечковых культур в ЦФО Российской Федерации в 2014 году

№ п/п Площадь Валовый сбор се-

Регион насаждений, мечковых культур,

тыс. га (х) тыс. ц (у)

1 Липецкая область 5,5 412,4

2 Брянская область 3,5 5,7

3 Волгоградская область 4,4 394,3

4 Кабардино-Балкарская республика 4,3 387,5

5 Калужская область 1,3 7,8

6 Курская область 2,5 64,5

7 Орловская область 3,5 28,5

8 Пензенская область 2,8 83,6

9 Республика Дагестан 2,1 14,6

10 Республика Крым 4,4 526,5

11 Ростовская область 6,2 157,5

12 Самарская область 3,8 138,9

13 Ставропольский край 3,3 153,7

14 Тамбовская область 7,4 93,1

15 Тульская область 6,4 213,8

16 Ульяновская область 0,5 6,4

17 Чувашская Республика 1 6,2

Попытаемся выяснить корреляционную взаимосвязь между площадью насаждений и валовым сбором. Расчет, выполненный в Excel средствами статистического анализа, дает значение коэффициента корреляции, равное 0,46379. Такое значение коэффициента формально свидетельствует о слабой взаимосвязи между площадью насаждений и валовым сбором семечковых культур, что явно противоречит не только экономическому, но и здравому смыслу, так как с увеличением площади насаждений, несомненно, должен возрастать и валовый сбор урожая.

С целью разрешения противоречия выполним предварительный неформальный анализ приведенных в табл. 1 исходных данных. Для этого построим точечный график расположения регионов на плоскости «площадь насаждений (x) - валовый сбор (у)», где каждая точка соответствует номеру региона в табл.1.

На рисунке видна пропорциональность распределения набора данных, однако, выявить сходство регионов для их последующего группирования по-прежнему затруднительно.

Рис.1. Распределение регионов в зависимости от валового сбора и площади насаждений семечковых культур

Попытаемся выяснить, чему соответствует полученное группирование регионов и что общего у них в рамках этих групп. Для этого у каждого региона рассчитаем значение показателя урожайности, равное отношению валового сбора к площади насаждений:

Урожайность; =

( В ал о в ы й с б о р с е м е ч ко в ы х кул ь т ур, т ы с . ц )

( П л о щ ад ь н а сажд е н и й , т ыс . га)

i = 1, 17

и отсортируем регионы по возрастанию урожайности (табл.2).

Таблица 2

Урожайность семечковых культур в ЦФО Российской Федерации

№ п/п Регион Площадь насаждений, тыс. га (х) Валовый сбор семечковых культур, тыс. ц (у) Урожайность ц/га

2 Брянская область 3,5 5,7 1,63

5 Калужская область 1,3 7,8 6,00

17 Чувашская Республика 1 6,2 6,20

9 Республика Дагестан 2,1 14,6 6,95

7 Орловская область 3,5 28,5 8,14

14 Тамбовская область 7,4 93,1 12,58

16 Ульяновская область 0,5 6,4 12,80

11 Ростовская область 6,2 157,5 25,40

6 Курская область 2,5 64,5 25,80

8 Пензенская область 2,8 83,6 29,86

15 Тульская область 6,4 213,8 33,41

12 Самарская область 3,8 138,9 36,55

13 Ставропольский край 3,3 153,7 46,58

1 Липецкая область 5,5 412,4 74,98

3 Волгоградская область 4,4 394,3 89,61

4 Кабардино-Балкарская республика 4,3 387,5 90,12

10 Республика Крым 4,4 526,5 119,66

Построим точечный график расположения регионов на плоскости «регион (х) - урожайность (у)» (рис.2).

На этом графике можно увидеть разбиение регионов (по схожести урожайности) на три условных группы (табл.3), в рамках которых восстанавливается экономический смысл (валовый сбор семечковых культур прямо пропорционален посевным площадям). Регион под номером 10 (Республика Крым) обладает экстремальным значением, поэтому его необходимо исключить из дальнейшего рассмотрения.

Оказывается, что регионы первой группы имеют близкие (в интервале (1,6 - 12,8) значения урожайности, правда и самые низкие, что свидетельствует, скорее всего, о климатических условиях или бедности почвы минеральными ресурсами, неправильном уходе за посевом или слабым развитием данной отрасли в регионе). Но именно благодаря этой схожести (урожайность), они и образуют свою группу и могут сравниваться между собой, свидетельством чему и является значение коэффициента корреляции для этой группы регионов, равное 0,911.

Рис.2. Расположение регионов после сортировки по возрастанию урожайности

Продолжая рассуждать подобным образом, мы видим, что урожайность второй группы изменяется в интервале 25,4 - 46,58, можно сделать вывод (рис.1), что данные регионы имеют общие черты, например, климат, качество почвы, уровень развития данной отрасли в регионе. Об этом свидетельствует и достаточно высокое значение коэффициента корреляции для второй группы, равное 0,845.

Таблица 3

Разбиение регионов на группы по схожести урожайности

Группа Урожайность Номера регионов Коэффициент корреляции

1 Низкая 2,5,6,7,9,16, 17 0,911

2 Средняя 8,11,12,13,14,15 0,845

3 Высокая 1, 3, 4 0,982

Регионы, включенные в третью группу, имеют теплый климат, богатую минеральными ресурсами почву, или грамотный уход за посевами (значение урожайности равно 74,98 - 90,12). Значение коэффициента корреляции для третей группы равно 0,982. Это говорит о высокой степени взаимосвязи между посевными площадями и валовым сбором урожая.

Таким образом, только неформальный анализ исходной выборки позволил распределить регионы по трем группам и выполнить последую-

щий статистический анализ внутри каждой из групп. Так стало возможным построить линейные уравнения регрессии у=а*х+Ь зависимости валового сбора урожая (у) от посевных площадей (х) (табл.4):

Таблица 4

Регрессионные уравнения групп регионов

Группа

Уравнение регрессии

2

валовый сбор семечковых культурдыс .ц

300

о

X и 200

О.

п 100

ш

и

15

~ 0

а

а

с

а

у = 26,741х + 23,912

2 4 6

площадь насаждений, тыс. га

♦ валовый сбор семечковых культурные ,ц (У)

-Линейная {валовый

сбор семечковых культурдыс ,ц

(у))

3

валовый сбор семечковых культурдыс .ц

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

415

и 410

■ 405

И

Ос 400

ш

и

л

- 390

г с: ЗА 5

т Я

у = 17,695х + 315,44

-1-1-1-1—

3,5 4 4,5 5 5,5

площадь насаждений, тыс. га

♦ валовый сбор семечковых культурдыс .ц (V)

-Линейная (валовый

сбор семечковых культурдыс .ц (V)}

1

Найденные уравнения регрессии групп регионов позволяют ответить на два вопроса:

1. На сколько надо увеличить (уменьшить) площади насаждений для достижения желаемого объема валового сбора семечковых культур, оставаясь в своей группе регионов, x=(y-b)/a;

2. А главное - позволяют сделать ориентировочные оценки по достижению тех значений урожайности, которые бы позволили перейти региону в более продуктивную группу регионов. Например, Тульской области (15) для перехода в третью группу (высокая урожайность) регионов необходимо поднять урожайность с 33,41 ц/га до, используя уравнение третьей группы, y=(17,695*6,4+315,44)/6,4~67 ц/га.

Список литературы

1. Бюллетени о состоянии сельского хозяйства 2014 \\ Федеральная служба государственной статистики. [Электронный ресурс]. Режим доступа: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publicatio ns/catalog/doc_12 65196018516 (дата обращения 01.11.2015)

2. Борисов А.Н. Роль предварительной подготовки исходных данных для статистического анализа / Известия ТулГУ. Экономические и юридические науки. 2012. Вып. 1. Ч.1. С. 296-313.

3. Борисов А.Н. Эвристический метод группирования объектов на основе статистических данных // Известия ТулГУ. Экономические и юридические науки. Вып.5. Ч.1. Тула: Изд-во ТулГУ, 2014. с.436 - 441.

4. Территориальный орган Федеральной службы государтсвенной статистики по Тульской области [Электронный ресурс]. Режим доступа: www.tulastat. gks .ru

5. Официальный сайт Росстата [Электронный ресурс]. Режим доступа: http://www.gks.ru

Борисов Александр Николаевич, д-р техн. наук, проф., Россия, Тула, Тульский государственный университет

ANALYSIS INITIAL DATA FOR THE STATISTIC STUDY OF POME FRUIT YIELDS

IN THE CENTRAL FEDERAL DISTRICT OF THE RUSSIAN FEDERATION

A.N. Borisov

The need for the preliminary nonformal preparation of data, intended for the subsequent statistical analysis is substantiated.

The keywords: the nonformal analysis of initial data, statistical analysis, grouping objects, correlation coefficient, the equation of regression.

Borisov Aleksandr Nikolaevich, doctor of technical science, professor, Russia, Tula, Tula State University

i Надоели баннеры? Вы всегда можете отключить рекламу.