Научни трудове на Съюза на учените в България-Пловдив. Серия В. Техника и технологии, т. XV, ISSN 1311 -9419 (Print), ISSN 2534-9384 (On- line), 2017. Scientific Works of the Union of Scientists in Bulgaria-Plovdiv, series C. Technics and Technologies, Vol. XV., ISSN 1311 -9419 (Print), ISSN 2534-9384 (On- line), 2017.
МАТЕМАТИЧЕСКИ МЕТОД И ЗА ГРУПИРАНЕ И ОЦЕНКА НА РАЙОНИТЕ НА БЪЛГАРИЯ СПОРЕД СРЕДЕН ДОБИВ НА НЯКОИ ЗЕМЕДЕЛСКИ КУЛТУРИ ОТ 2001 Г. ДО 2015 Г.
Нели Керанова
Аграренуниверситет-ГЕювднв
USING MATHEMATICAL METHODS FOR GROUPING AND EVALUATING THEREGIONSOFBULGARIA ACCORDING TO THE AVERAGE YIELD OF SOME AGRICULTURAL CROPS
FROM 2001 TO 2015
Nel i Keranova
Agricultural University-Plovdiv
Abstract
dhe present work analyzes statistical data related to the average yields of the following agricultural crops: wheat, barley, grain maize and silage maize, sunflower, rye, triticale and alfalfa in Bulgaria in the period from 2001 to 2015. For this purpose the territory of our country is divided into six regions: northwest, north central, northeast, southwest, south central and southeast. The main objectives that have been set can be summarized in the following directions: to group the regions of our country according to the average yields of the respective crops, to make a comparative assessment, to compile mathematical models representing the dependence of the average yields of the respective crops on time for each region. Hierarchical cluster analysis and single-factor analysis of variance were used. As a result, it was found that the northeastern region has the highest average yields of wheat (3930.07 kg/ha) and barley (3556.13 kg/ha). The highest average yields of grain maize (4749,07 kg/ha), sunflower (1868,93 kg/ha) and triticale (3625,75 kg/ha) are in the north central region and the highest average yields of rye (2178,21 kg/ha) - in the northwest. The highest average yields of alfalfa (5009.43 kg/ha) are in the southwestern region.
Keywords: mathematical models, hierarchical cluster analysis, agricultural crops
Зърнопроизводството е основен подотрасъл на растениевъдството в България, тъй като зърното е основната част от хранителните запаси на страната. Зърнените култури осигуряват храни за животните и хората. Зърното и неговите производни заемат значителен дял в износа на България (Kostadinov, A., Mollov, D., 2015, Ivanov, P., 2014). У нас съществуват благоприятни почвени и климатични условия за отглеждането на разнообразни зърнени култури - пшеница, ечемик, царевица и др. Отглеждането им зависи до голяма степен и от релефа, надморската височина, плодородието на почвите и тяхната влажност.
Основните цели в настоящата работа могат да се класифицират в следните няколко направления:
• да се направи групиране на шестте района, на които е разделена България, според средните добиви от зърнените култури: пшеница, царевица за зърно и за силаж, ечемик, ръж, тритикале;
• да се направи многопосочна сравнителна оценка на тези райони според средните добиви от посочените култури.
Материали и методи
Статистическите данни, подложени на математическа обработка в тази статия, са получени от базата данни на отдел „Агростатистика“ на Министерството на земеделието и храните (Agrostatistical Reference Book 2000-2014). Получената информация е свързана със средните добиви на следните зърнени земеделски култури: пшеница, ечемик, царевица за зърно, царевица за силаж, слънчоглед, ръж, тритикале и люцерна за периода от 2001 г. до 2015 г. за шестте района на територията на България: северозападен, северен централен, североизточен, югоизточен, южен централен и югозападен.
Класически математико-статистически метод за групиране на отделни обекти в клъстери според степента им на сходство по определени показатели е йерархичният клъстерен анализ. Съществуват различни методи за клъстеризация, както и различни мярки на сходство, чрез които може да се извърши този анализ (Ganeva, Z., 2016, Cronk, B., 2012). В настоящата работа използваме методът на междугруповото свързване, а за мярка на сходство избираме квадратичното евклидово разстояние. При този метод разстоянието между два клъстера А и В се дефинира като средната стойност на nA.nB на брой разстояния между nA точки от А и nB точки от В чрез формулата:
1 nA' ПВ ^ __
D(A,В) — ^ ^ ' d(Xj, X, ) , d{xt, Xj) — Yim=li.Xim — xjm) , i, j — 1 n
ПАПВ i—1 j—1
където сумата се изменя по всички точки x_(i ) и x_j от А и В. Чрез означаваме квадратичното евклидовото разстояние между два вектора xi (xi1, xi2,..., Xip )и
Xj (Xj1, Xj 2^^ Xjp ).
За извършване на многопосочна сравнителна оценка на районите от България според средния им добив от съответната култура е използван еднофакторен дисперсионен анализ и тест на Дънкан. Данните са извлечени и подготвени за обработка в средата на MS Excel. Математическата обработка е извършена чрез статистическия програмен продукт IBM Statistics SPSS 23 (Ward JH., 1963).
Резултати и обсъждане
На фигура 1 са представени графично резултатите от клъстеризационната процедура чрез дендрограма. В самостоятелен клъстер на сравнително малко евклидово
разстояние се групират северен централен район и североизточен район, които имат доказано сходство по среден добив на пшеница, ечемик, слънчоглед, при това са с най-високи добиви по посочените култури в сравнение с останалите райони. Южен централен район и югозападен район също формират отделен клъстер, поради доказано сходство в добивите от люцерна /най-високи в сравнение с другите райони/ и най-ниски добиви от пшеница, ечемик и слънчоглед.
Фигура 1. Дендрограма, представяща резултатите от клъстеризационната процедура на шестте района на България според среден добив на фуражни култури (kg/ha) от 2001 г. до 2015 г. чрез метода на междугруповото свързване
Еднофакторният дисперсионен анализ дава възможност да се направи многопосочна сравнителна оценка на шестте района, на които е разделена територията на България според средните добиви от разглежданите земеделски култури. Общата статистическа оценка при повечето земеделски култури показва ниво на значимост, по-малко от грешката 0,5, което е достатъчно да считаме, че средните добиви от тях притежават статитически различия и общият модел е статистически значим. Изключение правят оценките за среден добив на царевица за зърно (0,7) и царевица за силаж (0,9). Това означава, че общият модел, отнасящ се до тях, е статистически незначим.
След прилагане на еднофакторен дисперсионен анализ се установи, че с най-високи средни добиви от пшеница за периода от 2001 г. до 2015 г. е североизточният район (3930,07 kg/ha), но тук добивите имат голямо стандартно отклонение, което означава, че не са стабилни във времето, а с най-ниски - югозападния (2721,87 kg/ha). С най-висок среден добив от ечемик е североизточен (3556,13 kg/ha), но също неустойчиви във времето, а с най-нисък - южен централен 2550,87 kg/ha) и югозападен (2549,07 kg/ha). Слънчоглед (1258 kg/ha), ръж (1579 kg/ha) и тритикале (2476,29 kg/ha) има най-малко произведено количество в югозападен район. Най-високи добиви от слънчоглед (1868,93 kg/ha) и тритикале (3625,75 kg/ha) има в северен централен, от ръж (2178,21 kg/ha) - северозападен. Най-високи средни добиви на люцерна (5009,43 kg/ha) има в югозападен район, като същевременно тук
добивите са с най-малко стандартно отклонение (660 kg/ha), което доказва стабилност във времето. Най-ниски са в североизточен (4284,86 kg/ha).
Клъстер № Район Пшеница Ечемик Царевица за зърно Слънчоглед
1 Северозападен 3401,27 ab 3271,47 a 4494,67 a 1762,13 ab
2 Северен централен 3754,67 ab 3517,4 a 4749,07 a 1868,93 a
Североизточен 3930,07 a 3556,13 a 4706,93 a 1843,87 a
3 Югоизточен 3240,53 bc 3167,87 a 4324,33 a 1489,4 bc
4 Южен централен 2794,8 c 2550,87 b 4171 a 1299,4 c
Югозападен 2721,87 c 2549,07 b 4057,4 a 1258,8 c
Клъстер № Район Царевица за силаж и за зелено Ръж Тритикале Люцерна
1 Северозападен 11917,33 a 2178,21 a 2869 bc 4649 a
2 Северен централен 14090,2 a 1972,62 ab 3625,75 a 4730 a
Североизточен 14163,33 a 2002,79 ab 3312,79 ab 4284,86 a
3 Югоизточен 13672,2 a 1860,71 ab 2486,43 c 4710,07 a
4 Южен централен 13966,2 a 1724,64 ab 2521,86 c 4987,86 a
Югозападен 13426,73 a 1579 b 2476,29 c 5009,43 а
Таблица 1. Многопосочна сравнителна оценка на шестте района на територията на България според средни добиви на фуражни култури (kg/ha) за периода от 2001 г. до 2015 г. чрез еднофакторен дисперсионен анализ по критерия на Дънкан при а = 0,5
Изводи
В резултат на направените анализи се установи, че северен централен район и североизточен район са с най-високи добиви по пшеница, ечемик и слънчоглед, при това формират самостоятелен клъстер, поради статистически доказаното сходство по тези показатели. Вторият клъстер включва южен централен район и югозападен район поради статистически доказано сходство в добивите от люцерна, които са най-високи в сравнение с останалите райони.
Литература:
1. Kostadinov, A., Mollov, D., 2015. Competitiveness of Grain Producers in Bulgaria, Economic and Social Alternatives, 3, 91-105
2. Ivanov, P., 2014. High yields of wheat, but with poor grain quality, Bulgarian farmer
3. Ganeva, Z., 2016. To rediscover the statistics with SPSS, Elestra, Sofia
4. Agrostatistical Reference Book 2000-2014, Ministry of agriculture and food
5. Cronk, B., 2012. How to use SPSS. A step-by-step guide to analysis and interpretation
6. Ward JH., 1963. Hierarchical grouping to optimize an objective function. Journal of the American Statistical Association, 58, 236-244.