Научни трудове на Съюза на учените в България-Пловдив, серия Б. Естествени и хуманитарни науки, т.ХУ1. Научна сесия „Техника и технологии, естествени и хуманитарни науки", 30-31 Х 2013 Scientific researches of the Union of Scientists in Bulgaria-Plovdiv, series B. Natural Sciences and the Humanities, Vol. XVL,ISSN 1311-9192, Technics, Technologies, Natural Sciences and Humanities Session, 30-31 October 2013
динамика в изменението на покупателната
СПОСОБНОСТ НА ДОмАКИНСТВАТА
Деляна Димова
Катедра „Математика, информатика и физика" Аграрен Университет - Пловдив, e-mail: delyanadimova@abv.bg
DYNAMICS IN THE CHANGE OF THE HOUSEHOLD PURCHASING POWER
Abstract
This paper studies the purchasing power of households. Built-in software is used to search for the necessary information and to present queries containing basic food categories. Data concerning meat and meat products, milk and milk products, vegetables and other are analysed. Cluster and regression analysis are used for grouping and studying the dynamics in the change of the purchasing power of households for selected food.
Увод
Клъстерните методи разделят множеството от обекти в групи такива, че обектите в един клъстер са подобни помежду си в сравнение с обектите в различните клъстери според дефинирани критерии. Колкото по-голяма е хомогенността в рамките на групата и разликата между групите [5, 3], толкова по-ясно изразена е клъстеризацията. Тя е основна задача при извличането на знания от данни (data mining) и общ метод за статистически анализ на данни, използван в области като машинно обучение, анализ на изображения, извличане на информация. Статистическите модели обикновено се определят от систематичен и случаен компонент [6,7]. Статистическите зависимости между признаците освен по сила и по направление могат да се анализират и по количествени съотношения между сравняваните признаци с помощта на регресионния анализ [2]. В настоящото изследване се разглеждат част от изброените проблеми специално за данните, свързани с различни групи стоки. Те са съхранени в електронна форма, в xls файлове [8].
Целта на настоящата работа е да се представят заявки получени от споменатите файлове, които съдържат информация относно основни категории стоки. Посредством прилагането на методите на статистиката като клъстеризация и регресионен анализ се проследява естественото групиране и динамиката в изменението на покупателната способност на домакинствата за данни от избрани заявки.
Формиране на заявки, съдържащи основни категории стоки
Информацията, свързана с различните групи стоки се търси от xls файл, посредством използване на изграден софтуер [1]. В тази връзка се изисква да се посочат:
- стоки, които са обект на разглеждане. За целта потребителят трябва да селектира една от предоставените му възможности, където са включени съответно групите хранителни, нехранителни или и двата вида стоки;
-една или повече категории от избрана група стоки. В електронния източник, от който се намират данните това разделяне не е направено. То позволява впоследствие при обработка на информацията да се извършат по-задълбочени анализи и обобщения;
- интервалът от време, през който се извършва изследването.
Обект на разглеждане в настоящата работа са хранителните стоки. Те могат да се представят в следните категории: хляб и хлебни изделия, варива и зърнено-житни, зеленчуци, плодове, мляко и млечни продукта, месо и месни продукта, захар (захарни изделия). В случая трябва да се отбележи, че за изброените данни се анализира покупателната способност на домакинствата. Единствено се изключват тези продукта, които са представени с мерни единици различни от килограм (като пример литър или бр.). Предоставената информация във файловете на Excel е за 20 различни стоки. Две от тях не се включват, поради споменатата причина. Избраният изследван период от време обхваща единадесет годишен интервал. Той съдържа годините от 2001 до 2011. Софтуерът търси изброените данни и ги представя в зависимост от принадлежността им към съответната категория продукти, както е показано на фиг. 1. Така получената заявка се записва също в xls файл. Потребителите могат да избират и част от изброените категории. В случая това зависи главно от множеството продукта, които са предмет на изследване. Интервалът от време също е възможно да се задава допълнително и да бъде по-малък от предложения.
шяб е ар не а и зврнено-житаи з&пенчуци пподове мпяко и млечни продукта месо и месни продукта
год шяб бяп зряп фасул и pic краста-вици пипер-ки дожги карте фи ябьпки грозде мпяко кисепо сирене кашкавал кпечни маспа свинско месо месо ОТ 1ГГИЦИ малотрайни колбаси трайни колбаси захар
2001 1897 503 1207 1302 1660 1600 2251 1315 1925 1218 384 220 219 205 366 356 164 1253
2002 2191 627 1440 1543 2071 1914 2653 1219 2363 1350 491 256 256 251 437 401 186 1738
2003 2303 882 1564 1521 2475 2153 2763 1550 2369 1494 562 290 295 306 509 435 206 1998
2004 2208 1118 1746 1540 2014 1746 3160 1797 2182 1594 546 282 319 304 524 464 221 2014
2005 2571 1122 1881 1638 1721 1693 3693 1721 1782 1638 571 299 338 282 553 487 231 2031
2006 2788 1177 2002 1920 2518 2390 3548 1936 2129 1722 636 331 370 325 679 541 257 1582
2007 2528 1270 1966 1758 2145 1826 3539 2161 2597 1803 631 340 409 392 710 628 292 1716
2008 2513 1178 1538 2187 2201 2307 4432 2159 2783 1861 671 338 413 421 757 679 316 2054
2009 2997 1217 1372 2257 2641 2584 4458 2764 3876 1959 752 377 413 457 820 650 309 2286
2010 3103 1307 1518 2149 2530 2230 4516 2925 3304 1993 746 379 386 492 894 653 313 2411
2011 2814 1312 1522 2544 2835 2772 4269 2691 3439 1976 703 345 357 512 876 673 327 1673
фиг. 1 Основни категории хранителни продукти
Клъстеризация и регресионен анализ, приложени върху изследваните данни
Специално за получените данни от фиг. 1, свързани с основните категории хранителни продукта се прилага йерархичен клъстерен анализ. Статистическият пакет SPSS се използва за реализиране на споменатата процедура. Според дендограмата на фиг. 2а), представяща групирането в клъстери по изследвания признак количества стоки (в килограми), които могат да се купят с общия доход средно на лице (тоест покупателната способност), те са разделени в четири основни групи като част от тях съдържат подгрупи:
- седем стоки формират един клъстер при сравнително малки разстояния. В него са включени кашкавал, сирене, млечни масла, свинско месо, трайни колбаси, малотрайни колбаси и месо от птици. В тази група се съдържат предимно месо и месни продукта, както
и млечни продукта. Зрелият фасул образува отделен клъстер, който се присъединява към предходния;
- в отделен клъстер са представени следните стоки: краставици, мляко кисело, захар, ябълки. Тук се наблюдават различни категории хранителни продукти. Впоследствие към тях се присъединява от зърнено-житните и оризът;
- картофите образуват един клъстер. Както е показано на фиг. 1 количествата, които могат да се купят от тази стока са най-големи. Те надвишават значително другите продукти;
- останалите три стоки формират клъстер. Той съдържа хляб бял, пиперки и домати. Към тях се присъединява от плодовете и гроздето.
а) групиране в клъстери на количествата стоки, които могат да се купят с общия доход средно на литте
фиг. 2 Визуализация на получените дендограми
Отделно се извършва клъстеризация по години на покупателната способност на домакинствата (фиг. 2б):
- един клъстер образуват годините 2002 и 2003. На значително разстояние към тях се присъединява 2001;
- 2004-2005, както и 2006-2007 формират два отделни клъстера, които също на значително разстояние се присъединяват един към друг;
- в един клъстер са представени 2009 и 2010. Самостоятелни клъстери образуват съответно 2008 и 2011 години. Двата клъстера се присъединяват към предходния, като първия на значително голямо разстояние, а втория на по-малко.
Регресионният анилиз дава възможност да се проследи динамиката в изменението на покупателната способност на домакинствата за 11 годишния период чрез аналитичен и графичен подход. Обектите, които се изследват са от категория месо и месни продукти и както беше представено те са част от един клъстер. Разглеждат се данните за количествата, които могат да се купят при четирите вида стоки, а именно свинско и пилешко месо, малотрайни и трайни колбаси от 2001 до 2011 г.
продукти линеен г2 логаритмичен г2 квадратичен г2
свинско месо у = 29,99х -59801 0,9502 у = 60156Ln(x) -457058 0,9498 у = 0,9095х2 - 3618,8х + 4Е+06 0,957
месо от птитти у = 53,965х -107605 0,9804 у = 108255Ln(x) -822515 0,9804 у = -0,6386х2 + 2616х -3Е+06 0,9815
малотрайни колбаси у = 34,621х -68907 0,9269 у = 69457Ln(x) -527603 0,9271 у = -1,8901х2 + 7617,7х -8Е+06 0,9485
трайни колбаси у = 17,128х -34102 0,9565 у = 34362Ln(x) -261026 0,9567 у = -0,7649х2 + 3085,8х -3Е+06 0,9714
Таблица 1 Представяне на трите модела
Изчислените параметри на четирите регресионни уравнения са визуализирани на таблица 1. Освен права линия динамичните промени в покупателната способност на изброените продукти може да бъде описана и от други модели. В разработката се използват логаритмичен и квадратичен модел. Променяйки типа на трендовата линия е възможно да бъдат сравнени получените стойности за коефициента на детерминация (г2). От представените резултати се установява, че най-добре вариациите в данните за разглежданите вида стоки се описват с полином от втора степен. Емпиричните стойности представени за двата изследвани продукта свинско и птиче месо показват увеличаваща тенденция с еднакво изразени спадове от началото до средата на периода. Аналогична е тенденцията на база емпирични стойности и при другите две стоки, но с по-малки спадове за същия период. Краят на периода се характеризира с устойчиво нарастваща покупателна способност на домакинствата по отношение на трайни, малотрайни колбаси и свинско месо (фиг. 3). Параметрите на регресионните линии са статистически значими при а=0,05, което е основание да се твърди, че описаните модели са адекватни.
фиг. 3 Представяне на трендовите линии
Заключение
В настоящата работа е изследвана покупателната способност на домакинствата. Изграден софтуер се използва за търсене на необходимата информация и представяне на заявки, съдържащи основни категории хранителни стоки. Анализирани са главно данните, свързани с месо и месни продукти, мляко и млечни продукти, варива и зърнено-житни, хляб и захар. Приложени са клъстерен и регресионен анализ просредством, които се проследява групирането и динамиката в изменението на покупателната способност на домакинствата за избрани хранителни стоки.
Литература
1. Димова Д. Изследване динамиката на средната работна заплата и наети лица по икономически дейности, международна конференция „Техсис 2013", Фундаментални науки и приложения, том 19, кн.2, Пловдив, България, 2013,стр.101-104
2. Лидански Т., Статистически методи в биологията и в селското стопанство, Земиздат, София, 1988, стр. 195
3. Лилова Р, Н. Благоева, Дефицитно финансиране и данъчно облагане-причинно-следствени връзки, Монография, АИ на АУ, Пловдив, 2012
4. Онков К., Т. Мокрева, Д. Стоянова, Методично ръководство за използване на База данни за стареене на населението на България, София, 2009, ISBN 978-954-91728-8-1
5. Saxena P., S. Lehri, Analysis of various clustering algorithms of data mining on health informatics, International Journal of Computer & Communication Technology, Volume 4, Issue 2, 2013, p. 108-112
6. Sharma N., A. Bajpai, R. Litoriya, Comparison the various clustering algorithms of weka tools, International Journal of Emerging Technology and Advanced Engineering, Vol. 2, Issue 5, 2012, p. 73-80
7. Faraway J., On the Cost of Data Analysis, Journal of Computational and Graphical Statistics, Volume 1, Issue 3, 1992, p.213-229
8. www.nsi.bg