Научная статья на тему 'Компьютерное моделирование и математическое обеспечение экономико-социальных задач'

Компьютерное моделирование и математическое обеспечение экономико-социальных задач Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
241
40
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лихачев Г.Г., Сухорукова И.В.

В работе проведено описание методов проверки статистических гипотез при исследовании и компьютерном моделировании экономических или социальных задач с использованием статистических пакетов программ для персонального компьютера.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лихачев Г.Г., Сухорукова И.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерное моделирование и математическое обеспечение экономико-социальных задач»

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жгоръя ъ ъраъжъы

5 - 2003 (|*ай)

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ И МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЭКОНОМИКО-СОЦР1АЛЬНЬ1Х ЗАДАЧ

ПГ. ЛИХАЧЕВ, кандидат физико-математических наук

КВ. СУХОРУКОВА, доктор экономических наук

В работе проведено описание методов проверки статистических гипотез при исследовании и компьютерном моделировании экономических или социальных задач с использованием статистических пакетов программ для персонального компьютера.

Одной из важнейших сфер приложения математической статистики является экономика. В настоящее время трудно себе представить исследование и прогнозирование экономических явлений без применения эконометрического моделирования, регрессионного анализа, трендовых и сглаживающих моделей и других приемов, использующих и опирающихся на методы математической статистики [1,2]. Одним из наиболее мощных методов, позволяющих не только описать, но и проанализировать, а впоследствии и сделать экономическое предсказание, является метод проверки статистических гипотез [3 + 5]. Разумеется, речь идет о применении некоторой упрощенной экономико-математической модели, включающей в свое рассмотрение лишь некоторые (или иногда даже один, но наиболее важный) параметры реалистической ситуации. Однако даже в этом случае возможность математического описания и компьютерного моделирования экономических и социальных задач вызывает большой интерес.

О важности применения упоминавшихся выше методов математической статистики, и в частности проверки статистических гипотез, свидетельствует наличие таких твердо устоявшихся в экономике понятий, как страховой запас, резервные мощности, государственные резервы и т.п. Таким образом, проявление случайности в экономике следует рассматривать как отклонение от сложившегося русла событий. При этом отклонение может происходить как в положительную сто-

рону (появление новых научных открытий, технологий, способов ведения и организации производства и т.п.), так и в отрицательную (стихийные бедствия, поломки оборудования, болезни работников и т.п.), что впоследствии приводит к существенному изменению самого течения событий. С развитием общества экономика все более усложняется, следовательно, по законам развития динамических систем должен усиливаться статистический характер законов, описывающих социально-экономические явления.

С развитием материально-технической базы в современном обществе на первый план выходит задача своевременной, быстрой, точной и качественной обработки полученной информации, что позволяет найти наиболее оптимальное решение и получить преимущество над конкурентами в той или иной области экономики. Поставленной задаче как нельзя лучше отвечает использование персонального компьютера и программного обеспечения, предназначенного для обработки резуль-.татов исследований в различных социальных и экономических областях. В данной работе проэе-ден анализ и дано сравнение двух пакетов программ - один включает в себя стандартный набор статистических программ для обработки больших массивов данных в Microsoft Excel, другой представляет собой статистический пакет Stadia.

На практике часто приходится на основе результатов обследований, испытаний и т.д. проверять различные предположения о характеристи-

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жгоръя « ъмкппем

5 - 2003 (май)

ках конкретного массового явления. Обычно выдвигается гипотеза о некотором распределении случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина) и делается предположение о каком-либо параметре этого распределения (например, математическое ожидание или дисперсия) при известном или неизвестном значении другого параметра (соответственно дисперсии или математического ожидания). Предположения гипотез могут быть проверены на основе статистических данных.

Пусть в результате наблюдений за каким-либо экономическим или социальным процессом получена некоторая выборка из п статистических данных. Это могут быть результаты наблюдений за динамикой распределения зарплаты в различных отраслях промышленности, или финансовые отчеты о доходах крупных предприятий либо мелких и средних фирм, или данные о различного рода социологических опросах (в том числе даже о таком грандиозном событии, как недавно прошедшая Всероссийская перепись населения).

Все перечисленные выше и другие подобные им события объединены тем фактом, что по этим данным имеются основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача заключается втом, чтобы подтвердить или опровергнуть это предположение, используя выборочные (экспериментальные) данные. Поскольку проверить статистическую гипотезу - значит проверить, согласуются ли данные, полученные из выборки с этой гипотезой, то такая проверка осуществляется с помощью статистических критериев или критериев согласия (имеется в виду согласие принятой гипотезы с результатами, полученными из выборки). Обычно используют наиболее распространенные, популярные и известные критерии согласия Колмогорова, хи-квадрат (%2) Пирсона, а также некоторые другие (например, омега-квадрат (£22), подробнее см. [1,2]).

Проведем описание порядка выполнения проверки статистической гипотезы о законе распределения генеральной совокупности, из которой извлечена выборка (для определенности предположим, что случайная величина распределена по нормальному закону). Отметим, что при предположении о другом законе распределения генеральной совокупности порядок выполнения проверки статистической гипотезы сохраняется.

Сначала проверим гипотезу о нормальном распределении генеральной совокупности, из которой извлечена выборка, используя критерий Колмогорова. Критерий согласия Колмогорова позволяет проверить гипотезу о согласии, когда известны параметры модели. В качестве меры расхождения между теоретическим и эмпирическим распределениями рассмотрим максимальное значение абсолютной величины разности между эмпирической и теоретической функциями распределения:

D = max|FTCOp (х) - FM„ (х)|. (1)

Величина

А = ЛЛ5 (2)

называется статистикой критерия Колмогорова.

Для проверки гипотезы о нормальном распределении сначала представляем выборку в группированном виде, то есть составляем интервальный вариационный ряд, который строится с учетом минимального jcmîn и максимального значения х j а также математического ожидания M и

• max' -

дисперсии ст2. Для этого составляется таблица значений, в которой указываются левые и правые границы интервалов разбиения, а также количество чисел /1, попавших в соответствующий интервал из общего числа п. В Microsoft Excel для этого можно использовать статистическую функцию ЧАСТОТА. Затем для каждого интервала вычисляем значение эмпирической функции распределения FjMn(x). Для каждого интервала вычисляем значение теоретической функции распределения/^^*). В Microsoft Excel для этого можно использовать статистическую функцию НОРМ-РАСП, в качестве параметров нормального распределения следует принять математичесое ожидание и среднее квадратическое отклонение генеральной совокупности. Для каждого интервала вычисляем абсолютную величину разности теоретической и эмпирической функций распределения, затем по формуле (1) находим его максимальное значение Ь. В Microsoft Excel для этого можно использовать математическую функцию ABS и статистическую функцию МАКС. Затем по формуле (2) вычисляем статистику Л=Драсчстнос и определяем критическое значение статистики Лкр при уровне значимости а (обычно равной 0,05, 0,01 или еще меньшей и задаваемой наперед), для чего необходимо использовать специальные таблицы (см, [1, 4, 5}). Наконец, сравниваем Арпсчепюс с ^критическое' гюсле чего следует принять (в случае

Лрас,стнос<дкритическое) отвергнуть (в случае

^расчетнос^^критическое) гипотезу о нормальном распределении генеральной совокупности.

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: ШОРНЯ » ъмъжъха

5 - 2003 (май)

Аналогично проверяется гипотеза о нормальном распределении с помощью критерия согласия %2-Пирсона при том же уровне значимости а. В составляемой аналогично предыдущей таблице добавляются значения выборочной средней и среднего квадратичного отклонения величин х* - середин отрезков, на которые происходит разбиение интервала. Для расчета выборочной средней и среднего квадратичного отклонения величин х* следует использовать математическую функцию СУММПРОИЗВ.

Теперь проведем описание исследования проверки статистической гипотезы о законе распределения генеральной совокупности, из которой извлечена выборка, используя статистический пакет Stadia. Отметим, что в программе Stadia рассматриваются случаи, когда дисперсия а2 и математическое ожидание М неизвестны. Оправданность этого ограничения следует из того, что в действительности (за исключением частных случаев) известна лишь приблизительная информация о а2 и М генеральной совокупности. Подготовка данных осуществляется так же, как и в предыдущем случае. После этого по запросу системы необходимо ввести объем выборки п и минимальное и максимальное значения выборки. После этого программа сделает описанные выше действия автоматически. По окончании выполнения программа предоставит результаты расчетов, включающие таблицу распределения частот по диапазонам, значения статистик Колмогорова, омега-квадрат и X2- Пирсона, а также заключение системы: распределение не отличается от нормального, принимается нулевая гипотеза #0. В первом столбце таблицы указан правый конец интервала группировки, во втором - значения первого столбца трансформированы следующим образом: из каждого элемента первого столбца вычитается среднее значение выборки и полученная разность делится на стандартное отклонение выборки. Следующие четыре столбца содержат частоту, относительную частоту, накопленную частоту и относительную накопленную частоту соответственно.

К достоинству описываемой программы Stadia следует отнести возможность построения и вывода графика гистограммы с наложенным графиком нормальной кривой. Построенный график позволяет использовать глазомерный метод в качестве предварительной, субъективной оценки выборки на выбранный закон распределения (в данном случае на нормальность). Отметим также, что в пакете Stadia помимо критериев Колмогорова и х2-Пирсона приведен еще

один популярный критерий - омега-квадрат. Этот критерий в противоположность критерию Колмогорова, реагирующему на наибольшую разность между распределениями вблизи максимума функции плотности вероятности, является более равномерным, учитывая различия между распределениями во всем интервале выборочных значений.

Выводы о нормальности распределения по программе Stadia строятся путем сравнения полученного уровня значимости с уровнем а. Если вычисленный уровень значимости больше критического значения а, то оснований отвергать нулевую гипотезу нет. По поводу различия между абсолютными значениями статистик Колмогорова и Пирсона можно отметить следующее. В пакете Stadia статистика Колмогорова строится с учетом всех элементов вариационного ряда. В предыдущем же подходе статистика строилась для интервального ряда. Значительные отличия между значениями критерия Пирсона связаны с различными способами разбиения диапазона изменения случайной величины.

В заключение отметим, что описанная методика с успехом была использована авторами на протяжении ряда лет для расчета конкретных экономико-математических моделей (см., например, [5]). Результаты, полученные при использовании описанных выше двух разных программ, в основном совпадают. Имеющиеся разногласия (не превышающие 0,5%) можно объяснить, по-ви-димому, точностью округления результатов в программе Stadia, в которой учитываются только четыре значащие цифры.

СПИСОК ЛИТЕРАТУРЫ

1. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория вероятностей и математическая статистика: Учебное пособие для экономических специальностей вузов. - М.: Высш. шк., 1991. - 400 с.

2. Прохоров Ю.В., Розанов Ю.А. Теория вероятностей. Основные понятия, предельные теоремы, случайные процессы. - М.: Наука, 1973. - 494 с.

3. Тейл Г. Прикладное экономическое прогнозирование. - М.: Прогресс, 1970.

*4. Леман Э. Проверка статистических гипотез. - М.: Наука, 1964.

5. Сухорукова И.В., Червяков А.В. Проверка статистических гипотез. - ГУЗ, ЮжНИИгипрозем, 1996. - 11 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.