Научни трудове на Съюза на учените в България-Пловдив, серия Б. Естествени и хуманитарни науки, т.ХУЬ Научна сесия „Техника и технологии, естествени и хуманитарни науки", 30-31 Х 2013 Scientific researches of the Union of Scientists in Bulgaria-Plovdiv, series B. Natural Sciences and the Humanities, Vol. XVI.,ISSN 1311-9192, Technics, Technologies, Natural Sciences and Humanities Session, 30-31 October 2013
ОПРЕДЕЛЯНЕ НА ЗАВИСИМОСТИ ЗА СРЕДНИ ЦЕНИ И ЗАКУПЕНИ КОЛИЧЕСТВА СТОКИ СРЕДНО НА ДОМАКИНСТВО
Деляна Димова
Катедра „Математика, информатика и физика" Аграрен Университет - Пловдив, e-mail: [email protected]
DETERMINING DEPENDENCIES FOR AVERAGE PRICES AND PURCHASED QUANTITIES OF MAIN FOOD AVERAGE PER
HOUSEHOLD
Abstract
Data about main food are examined in the paper. They are stored in groups in tabular form. The necessary information is found from the relevant pre-selected groups. Assessment of data concerning average prices and purchased quantities of main food average per household is done. Analysis of variance is applied for searching and determining dependencies between presented data.
Увод
Проблемът за намиране на полезна информация и знания се превърна в един от важните в областта на компютърните науки. Повечето процеси, свързани с извличане на информация (information retrieval) и характеристики на данните са автоматизирани. Това дава възможност големи множества от документи да се обработват по-бързо и последователно [8,5]. В областта на извличане на информация (IR) се използват някои статистически техники. Те действително са се доказали като доста ефективни при намиране на съответната информация. Впоследствие тя би могла да бъде обобщавана и анализирана[6,3]. В тази връзка могат да се приложат някои от методите на статистиката. Основно при дисперсионния анализ е определянето на самостоятелното или на комбинираното влияние на един или повече признаци върху друг признак и оценяването на тези влияния [1]. Много често необходимата информация се търси от електронни източници, включително и в случая, където разглежданите икономически данни са представени в xls файлове. При обработката им се използва един от мощните статистически пакети, а именно SPSS.
Целта на настоящата работа е оценка на данните, свързани със средни цени и закупени количества хранителни стоки средно на домакинство, изследване и определяне на зависимости между тях чрез дисперсионен анализ и множествени сравнения.
Намиране и организиране на изследваните данни за хранителни стоки
От публикуваната информация относно 85 различни видове хранителни стоки [7], обект на разглеждане са 55. Те са разделени в няколко категории. В случая това са хлебни и тестени изделия; месо и колбаси; риба и рибни продукта; мляко и млечни произведения; растителни и животински мазнини; пресни, сушени и консервирани плодове; пресни, замразени и консервирани зеленчуци; захар и захарни изделия; сушени бобови и семена. В изследването не участва информацията, свързана с двата вида напитки-безалкохолни и алкохолни. Необходимите данни относно средни цени и закупени количества (в килограми) средно на домакинство се търсят и извличат от xls файл. За тях се прилагат дисперсионен анализ и множествени сравнения по метода на Дънкан. В тази връзка, както е представено в отделни таблици 1а) и 1б) се разделят различните хранителни стоки съответно със средните им цени и със закупените количества. Избраният в разработката период от време включва десетгодишен интервал от 2003 до 2012 година. Чрез дисперсионния анализ се прави обща статистическа оценка на разглежданите данни, без отчитане на статистически доказаните разлики между средните на изследваните групи, тоест показва се вероятното влияние на факторите, но не на всеки фактор поотделно. Всички възможни разлики между средните на изследваните групи се установяват чрез метода на Дънкан [2].
2003 2004 2005 2003 2004 2005
хранителни стоки ср цена ср цена ср цена хранителни стоки колич. колич. колич.
ориз 1,06 1,05 1,08 ориз 15,140 15,693 15,791
брашно 0,54 0,67 0,53 брашно 26,231 22,103 22,459
хляб бял 0,72 0,83 0,79 хляб бял 209,949 199,007 184,991
тестени закуски 3,07 3,22 3,28 тестени закуски 3,450 3,909 4,204
свинско 5,42 6,02 7,21 свинско 5,767 5,652 5,163
кайма -смес 4,07 4,14 4,48 кайма -смес 13,454 13,886 14,973
птиче 3,26 3,50 3,67 птиче 13,712 13,580 14,919
а) средни цени на избрани стоки б) закупени количества средно на домакинство
Таблица 1 Визуализация на част от изследваните данни Определяне на зависимости и оценка за данни, свързани с хранителни
стоки
Информацията относно закупени количества средно на домакинство за 55-те различни стоки през изучавания период се обработва и анализира с помощта на софтуерния продукт SPSS. Резултатите от приложената процедура на дисперсионния анализ са показани в таблица 2. Най-много закупени количества средно за всяка от избраните хранителни стоки за домакинство се установява през 2011, а най-малко през 2005 година. Стандартного отклонение, което характеризира средната степен
на разсейване около средните ракупени количества е с най-ниски стойности за 2012. Това означава най-слабо разсейване на изследвания пнказател през пооочения период. Следователно интервалът от време се характеризира с разнообразие в потре бленисто. Стандартната грешкв, о:редо ставяща информация с колко закупените количество средно от всяка стока на домакинство се различават от ретултата, който би се получил при изследване на генералната съвкупност, е най-малка отноао през 2012 гадина. Границите, в които варира изследвания показател за годините от разглеждания период могат да се проследят от визуализираните стойности на доверителния интервал.
mean std. deviation std. error lower bound upper bound
2003 13,10 30,63 4,13 4,82 21,38
2004 13,09 29,77 4,02 5,05 21,14
2005 12,71 27,81 3,75 5,19 20,23
2006 12,83 26,74 3,61 5,61 20,06
2007 12,93 25,97 3,50 5,91 19,95
2008 13,20 25,33 3,42 6,36 20,05
2009 13,26 24,29 3,28 6,69 19,83
2010 13,69 25,21 3,39 6,87 20,50
2011 13,81 25,27 3,41 6,97 20,64
2012 12,97 22,85 3,08 6,79 19,14
а)статистически характеристики на данните
Sum of Squares df Mean Square F Sig.
Between Groups 61,16 9 6,796 ,010 1,000
Within Groups 378824,48 540 701,53
Total 378885,65 549
б) резултати от дисперсионния анализ
Levene Statistic df1 df2 Sig.
,018 9 540 1,000
в) тест за хомогенност на дисперсиите
Таблица 2 Резултати относно данните за закупени количества стоки
От представените резултати в таблица 2б) е видно, че критерият на Фишер (Б) е недостоверен. В случая Sig=1 е по-голяма от нивото на грешката а=0,05. Следователно между изследваните години няма достоверни разлики по отношение на закупени количества средно от всяка от стоките за домакинство. Този резултат обезсмисля частната оценка на разликите между средните по метода на Дънкан.
Различна е ситуация при анализиране на средни цени за закупени хранителни стоки средно на домакинство (таблица 3). Стандартного отклонение и стандартната грешка са най-малки през 2003 година, а за всяка следваща постепенно нарастват. Резултатите от реализирания дисперсионен анализ показват, че нивото на значимост за F, Sig=0,002 е по-малко от грешката а=0,05. Следователно критерият на Фишер е достоверен и има статистически значими разлики между отделните години по отношение на цена средно за закупена стока от домакинство. Прилагайки множествени сравнения по метода на Дънкан се установява конкретно кои от разликите са статистически доказани. В случая като резултат от направения сравнителен анализ се получават няколко групи. Най-висока средна цена на хранителна стока закупена от домакинство се наблюдава през 2012 година. Интервалът, който включва годините от 2008 до 2011 може да се разглежда като период с високи средни цени. Първите две години съответно 2003 и 2004, участващи в изследването се характеризират с ниски средни цени.
std. deviation std. error
2003 2,19 ,29
2004 2,28 ,31
2005 2,39 ,32
2006 2,53 ,34
2007 2,67 ,36
2008 2,99 ,41
2009 3,14 ,42
2010 3,12 ,42
2011 3,30 ,44
2012 3,41 ,46
а) част от статист. х-ри
sum of squares df mean square F Sig.
Between Groups 213,4 9 23,71 2,95 ,002
Within Groups 4339,2 540 8,04
Total 4552,6 549
б) резултати от приложения еднофакторен дисперсионен анализ
год. ср. цена
2012 4,46 a
2011 4,27 ab
2010 4,07 abc
2009 4,06 abc
2008 4,00 abc
2007 3,50 abc
2006 3,15 bcd
2005 2,95 cd
2004 2,78 d
2003 2,69 d
в)множ. сравнения по Дънкан
Таблица 3 Анализ и оценка на данните, свързани със средни цени
Отделно за всяка от изброените категории хранителни стоки се анализират и сравняват данните относно тяхното потребление:
- Количествата от група хляб, хлебни и театени изделия през целия разглеждан десетгодишен интервал от време са по-големи от тези, включени в останалите групи. Но в случая трябва да се отбележи една интересна тенденция. Специално при потреблението на продукти от споменатата група се наблюдава непрекъснато понижаване, макар и малко почти за всяка следваща година от изучавания период (фиг. 1).
фиг. 1 Графично представяне на потреблението на стоки от група хляб, хлебни и тестени
изделия
Последната констатация е валидна и за стоките, включени в категория захар и захарни изделия;
- Единствено консумацията на растителни и животински мазнини остава непроменена през три последователни години, а именно от 2010 до 2012. През останалия интервал тя варира в граници близки до тези за изброените години;
- Хранителните продукта, участващи в останалите шест групи (месо и колбаси; риба и рибни продукта; мляко и млечни произведения; пресни, сушени и консервирани плодове; пресни, замразени и консервирани зеленчуци; сушени бобови и семена) бележат ръст на покачване, но той е доста малък.
Два основни извода могат да се направят в резултат от извършеното в разработката изследване:
- През всяка от разглежданите години (от 2003 до 2012) закупените количества хранителни стоки средно от домакинство не се различават съществено.
- За същия период средната цена на хранителна стока закупена от домакинство съществено се различава, като увеличението е с около 1,5-1,7 пъти.
Заключение
В настоящата работа са изследвани данните, свързани с основни хранителни стоки. Те са представени по групи в таблична форма. Необходимата информация се търси и извлича от съответните предварително избрани групи. Извършена е оценка за намерените данни относно средни цени и закупени количества хранителни стоки средно на домакинство, изследвани и определени са зависимости между тях чрез прилагане на дисперсионен анализ и множествени сравнения.
Литература
1. Лидански Т., Статистически методи в биологията и в селското стопанство, Земиздат, София, 1988, стр. 135
2. Мокрева Т, Сравнителни характеристики на статистически критерии и алгоритми за оценка на експериментални данни от лозарството, Дисертация, Пловдив, 2007, с. 32-37
3. Цайкин Н., Д. Димова, Д. Стоянова, В. Кръстева, Програма за изготвяне и визуализация на финансов анализ, II-ри международен симпозиум икономика, икономическо развитие и растеж, наука инвест еоод-клон Бургас, 2003, том III, стр. 214-219
4. Baeza-Yates R., and Ribeiro-Neto B., Modern Information Retrieval, Addison Wesley, New York, 1999.
5. Cunningham S., G. Holmes, J. Littin, R. Beale, and I. Witten, Applying connectionist models to information retrieval, Brain-Like Computing and Intelligent Information Systems, SpringerVerlag, 1997, p. 435-457
6. Singhal A., Modern Information Retrieval: A Brief Overview, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering, Vol. 24, No. 4, 2001, p. 35-42
7. www.nsi.bg
8. Yao Y., Information Retrieval Support Systems, IEEE World Congress on Computational Intelligence, Honolulu, Hawaii, USA, 2002, p. 1092-1097.