Научная статья на тему 'Методика прогнозирования показателей стохастических экономических систем'

Методика прогнозирования показателей стохастических экономических систем Текст научной статьи по специальности «Математика»

CC BY
849
107
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Трегуб А. В., Трегуб И. В.

Трегуб А.В., Трегуб И.В. МЕТОДИКА ПРОГНОЗИРОВАНИЯ ПОКАЗАТЕЛЕЙ СТОХАСТИЧЕСКИХ ЭКОНОМИЧЕСКИХ СИСТЕМ. Среди методов прогнозирования, наиболее часто применяемых в экономической практике, можно отметить методы экспертных оценок, методы анализа и прогнозирования динамических рядов. Среди методов оценивания на практике успешно применяется теория игр, регрессионный анализ, имитационное моделирование и вероятностное прогнозирование. В данной статье представлено вероятностное прогнозирование объема продаж дополнительных услуг на рынке телекоммуникаций, осуществленное на основе эмпирических данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика прогнозирования показателей стохастических экономических систем»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Участок, до которого не дошла продольная волна, уменьшился за время At на величину ((/ / 2) + а0 • At). Участок, где прошла только продольная волна, увеличился на (a0 - b) • At, а участок, где прошли и продольная и поперечная волны, увеличился на b • At. Посчитаем полную энергию всей струны за время At

2Wo((/ / 2) + ao • At) + 2[ W^ - b) + E2b] At = = W/ + 2[(W - Wo)ao + (W2 - Wi) b] At = W/ +

+ E{[(eo - ei)2 + ei2 - eo2]ao +

+ [(eo - e1)2 (((1 + cos9) / (1 - cos9)) - 1)]x xao ((eo - e1) / (1 + e1)) (cos9 / (1 - cos9))}At =

= Wo/ + Eao{(eo - e1)2 + e12 - eo2 + (eo - e1)2(2

cos29 / (1 - cos9)2) ((eo - e1) / (1 + e1))} At =,

учитывая

даAS?-

получим

= Wo/ + Eao[(eo - e1)2 + e12 - eo2 + 2(eo - e1) x x (e1 (1 + e1) / (1 + e1))] At = Wo/ + Eao[eo2 -

- 2eoe1 + e12 + e12 - eo2 + 2eoe1 - 2e12] At = Wo/.

Как и следовало из постоянства интеграла энергии, полная энергия всей струны в этой конкретной задаче постоянна, а если за нулевую энергию принять Eo/, то полная энергия будет равна нулю.

Сравним величины энергий на участках продольной и поперечных волн в случае,

когда продольное возмущение дошло до конца струны. В этом случае участок, где нет возмущения, отсутствует, а полная энергия складывается из энергий на участках продольного и поперечного движений. Очевидно, что вклад энергии продольных и поперечных волн в полную энергию будет одинаков.

При рассмотрении продольно-поперечных движений струн нельзя ограничиваться рассмотрением только поперечных составляющих и пренебрегать продольными, поскольку они вносят равный вклад в энергетику и динамическое нагружение струн.

В приведенных примерах проиллюстрировано распределение энергий между продольными и поперечными волнами и проведено сравнение энергий поперечного и продольного движений. Вклад энергии продольных составляющих в общую энергию колебаний гибких связей может быть найден как разность между полной энергией и энергией поперечных колебаний.

Библиографический список

1. Рахматулин, Х.А. Прочность при интенсивных кратковременных нагрузках / Х.А. Рахматулин, Ю.А. Демьянов. - М.: Физматгиз, 1961. - 399 с.

2. Демьянов, Ю.А. К уточнению теории колебаний музыкальных инструментов / Ю.А. Демьянов // Доклады РАН. - 1999. - Т 369. - № 4.

МЕТОДИКА ПРОГНОЗИРОВАНИЯ ПОКАЗАТЕЛЕЙ СТОХАСТИЧЕСКИХ ЭКОНОМИЧЕСКИХ СИСТЕМ

А.В. ТРЕГУБ, доц. МГУЛ, канд. физ.-мат. наук,

И.В. ТРЕГУБ, доц. Финансовой академии при Правительстве РФ, канд. техн. наук

Математическое моделирование сложных экономических систем на современном этапе предполагает, как правило, использование аналитических подходов к изучению функционирования реальных объектов. В различных задачах, встречающихся при моделировании, могут использоваться величины, значения которых определяются случайным образом. Примерами таких величин могут быть случайные воздействия внешней среды, случайные моменты времени, в которые система находится в особом состоянии и т.п. Системы, в которых переменные или воз-

действия являются случайными величинами, называются стохастическими.

На сегодняшний день технологии прогнозирования экономических показателей разработаны достаточно хорошо. Среди методов прогнозирования, наиболее часто применяемых в экономической практике, можно отметить методы экспертных оценок, основывающиеся на субъективной оценке текущего момента и перспектив развития. Эти методы успешно используются для конъюнктурных оценок, особенно в случаях, когда невозможно получить непосредствен-

144

ЛЕСНОЙ ВЕСТНИК 2/2oo8

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

ную информацию о каком-либо явлении или процессе.

Методы анализа и прогнозирования динамических рядов связаны с исследованием изолированных друг от друга показателей, каждый из которых состоит из двух элементов: из прогноза детерминированной компоненты и прогноза случайной компоненты. Разработка первого прогноза не представляет больших трудностей, если определена основная тенденция развития и возможна ее дальнейшая экстраполяция. Прогноз случайной компоненты связан с определением закона вероятности и оценкой его параметров.

В основе казуальных методов определяются факторы, обусловливающие поведение прогнозируемого показателя. Поиск этих факторов приводит собственно к экономикоматематическому моделированию - построению модели поведения экономического объекта, учитывающей развитие взаимосвязанных явлений и процессов. Следует отметить, что применение многофакторного прогнозирования требует решения проблемы выбора факторов, которая связана с необходимостью глубокого изучения экономического содержания рассматриваемого явления или процесса.

Среди методов оценивания на практике успешно применяется теория игр, регрессионный анализ, известно нейросетевое прогнозирование, нечеткая логика и имитационное моделирование. Разработаны соответствующие программные пакеты, которые, к сожалению, не всегда доступны рядовому пользователю, в то же время многие из этих проблем можно достаточно успешно решать, реализуя алгоритмы в широко известном и распространенном пакете прикладных программ MS Excel.

В данной статье представлено вероятностное прогнозирование объема продаж дополнительных услуг на рынке телекоммуникаций, осуществленное на основе эмпирических данных.

Выборочное наблюдение. Под выборочным наблюдением понимается метод статистического исследования, при котором обобщающие показатели изучаемой системы устанавливаются по некоторой ее части на основе положений случайного отбора. При

выборочном методе изучается сравнительно небольшая часть всех данных, характеризующих систему. Выборка должна быть представительной (репрезентативной), чтобы по ней можно было судить о генеральной совокупности. Репрезентативность означает, что объекты выборки должны обладать теми же свойствами, что и генеральная совокупность. Предупреждение систематических ошибок выборочного обследования достигается в результате применения научно обоснованных способов формирования выборочной совокупности, в зависимости от которых выборка может быть: собственно-случайной, механической, типической, серийной, комбинированной. Собственно-случайная выборка образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. Формирование выборки может быть осуществлено по схемам повторного и бесповторного отбора. При этом повторный отбор предполагает возможность включения в выборку одного и того же элемента генеральной совокупности два раза и более, бесповторный отбор исключает такую возможность.

Первый шаг на пути создания прогноза при выборочном наблюдении - это сбор и анализ статистической информации об исследуемой системе, формирование выборки из генеральной совокупности, отслеживание аномальных результатов в выборке.

В нашем случае анализируемым параметром является объем продаж дополнительных услуг регионального оператора сотовой связи за один месяц. Под генеральной совокупностью в данной задаче мы будем понимать множество месячных объемов продаж дополнительных услуг по предоставлению пользователю информации (новости, биржевые сводки, прогноз погоды и т.п.), полученных региональным оператором за все время работы на рынке. При этом к одной генеральной совокупности будем относить информационные сервисы с сопоставимыми за анализируемый период объемами продаж.

Выборкой из генеральной совокупности в нашем случае будет множество месячных объемов продаж услуг определенного сервиса. Формирование выборки осуществляется

ЛЕСНОЙ ВЕСТНИК 2/2008

145

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

в табличном процессоре Microsoft Excel, в котором выполнена собственно-случайная выборка, реализованная по схеме повторного отбора.

Далее необходимо построить вероятностную модель, оценить ее параметры и построить прогноз. Построение модели основано на выборе и идентификации закона распределения. Алгоритм выбора закона распределения целиком и полностью базируется на аппарате математической статистики. Идентификация закона распределения заключается в последовательной реализации двухэтапной процедуры для каждого вида параметрической модели из рассматриваемого множества законов. На первом этапе процедуры на основании выборочных данных строится модель закона определенного вида (из рассматриваемого множества моделей), оцениваются параметры этой модели. На втором этапе оценивается степень адекватности полученной модели экспериментальным наблюдениям, как правило, с применением различных критериев согласия.

При проведении выборочного обследования и построения прогноза объема продаж мы будем формировать две выборки из генеральной совокупности. Одну - для подбора и идентификации закона распределения вероятностей, другую - для оценки параметров моделируемого теоретического закона распределения.

Анализ эмпирических данных. Прежде чем приступать к построению модели, необходимо проанализировать наблюдаемые значения переменных на наличие аномальных результатов, т.е. таких наблюдений, которые резко отличаются в большую или меньшую сторону от средних значений по выборке. Поскольку существенным моментом вероятностного прогнозирования является предположение о законе распределения, соответствующего реальным наблюдаемым величинам, и оценка параметров этого распределения [1], то любые отклонения от предположений могут повлиять на оценки.

Если наблюдаемая выборка действительно принадлежит тому закону распределения, параметры которого мы оцениваем, отклонения могут быть связаны с наличием

аномальных наблюдений, появление которых в выборке определяется самыми различными причинами. Если не учитывать наличие аномальных наблюдений, попытки оценивания параметров распределения могут привести к самым негативным результатам. В этом случае обычно отбраковывают аномальные величины, а затем находят оценки параметров. К сожалению, реализовать отбраковку наблюдений в общем случае оказывается совсем не просто. Наблюдения, аномальные с позиций одного закона распределения, являются естественным проявлением закономерностей другого. Если нет надежной процедуры отбраковки или практических соображений, связанных с сущностью наблюдаемой величины, пытаются выйти из положения одним из следующих способов. В первом случае усекают выборку, отбрасывая определенную часть минимальных и/или максимальных наблюдений, и по оставшейся части оценивают параметры распределения. Во втором - перед процедурой оценивания всем наблюдениям левее и/или правее определенных значений присваивают одинаковые значения. Обе эти процедуры могут не всегда приводить к положительным результатам. Третий подход заключается в цензурировании выборки. Для наблюдений, попавших левее и/или правее определенных значений, фиксируют лишь факт попадания в соответствующий интервал, опуская конкретные значения этих наблюдений. По такой цензурированной выборке оценивают параметры закона.

В работе [2] доказано, что процедура предварительного группирования наблюдений перед вычислением оценок параметров распределения позволяет резко снизить влияние аномальных наблюдений, а иногда практически исключить последствия присутствия их в выборке. При этом также снижается влияние на оценки параметров и отклонение вида наблюдаемого закона распределения от предполагаемого. Кроме того, группирование исходных наблюдений позволяет получать устойчивые оценки параметров.

Построение эмпирического распределения. Для построения эмпирического распределения будем использовать одну из двух сформированных ранее выборок. Груп-

146

ЛЕСНОЙ ВЕСТНИК 2/2008

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

пирование наблюдений используется как при оценке параметров распределений, в задачах проверки статистических гипотез, так и для построения эмпирического распределения.

Выборка называется группированной, если область определения случайной величины разбита на к непересекающихся интервалов граничными точками х0 < *1 < ... < <

х где *0 - нижняя грань области определения случайной величины X, хк - верхняя грань области определения случайной величины X, и зафиксированы количества наблюдений п, попавших в i-ый интервал значений. Объем выборки определяется соотношением

N=Ь, .

i=1

Существуют различные способы объединения данных в группы. При группировании область определения случайной величины разбивается на интервалы равной длины или равной вероятности, кроме того существует еще так называемое асимптотически оптимальное группирование. Нахождение х. граничных точек интервалов в этом случае связано с вычислением интегралов вида

P(e)=] f (х,в)л,

*i-i

которые не всегда имеют аналитическое решение, здесь e - скалярный или векторный параметр распределения, функция P(e) - вероятность попадания наблюдаемой величины в i-й интервал, f(x, e) - плотность распределения.

В данной работе в качестве способа группировки выбрано разбиение области определения объема продаж на интервалы равной длины. Величину интервала b для группировки исходных данных определим по формуле

b = (х

m

Xmin) / 0} - 1),

где х - х - максимальные и минимальные

max min

значения;

{n} - округленное оптимальное число групп, определяемое по формуле Стерджесса n = 1 + 3,322lg(N);

N - объем выборки.

Нижняя граница первого интервала соответствует минимальному значению объема продаж за рассматриваемый период, правая граница последнего интерва-

ла - максимальному значение объема продаж. Относительная частота попадания переменной в интервал определяется по формуле

f = n / N,

J г г 5

где ni - количество исходных значений, попавших в i-й интервал.

Графическое изображение эмпирических данных в виде гистограммы относительных частот - удобный и наглядный способ представления выборки, необходимый для первичного формирования гипотезы о законе распределения генеральной совокупности. При построении графика по оси абсцисс (OX) отложим значения середины интервалов объема продаж, а соответствующие им значения относительных частот - по оси ординат (OF). На рис. 1 приведен график эмпирических относительных частот, представленных в виде гистограммы.

Оценка параметров эмпирического распределения. Визуальный анализ графика показывает, что эмпирическое распределение является унимодальным и несимметричным. Для более детального описания воспользуемся надстройкой «Пакет анализа» «Описательная статистика» MS Excel. Результаты расчета приведены в таблице.

Средняя арифметическая - наиболее часто используемый показатель центра распределения, в нашем случае равна 17313,18. Вычисление средней X в программе осуществляется по формуле, совпадающей с формулой оценки математического ожидания методом моментов. Следовательно, в качестве оценки математического ожидания в начальном приближении можно использовать значение д = 17313,8. Оценка дисперсии, выполненная Пакетом анализа, дает значение D = 11631522,29.

Мода (Мо) - это наиболее часто встречающееся значение признака, или значение варианты с наибольшей частотой.

Медианой (Me) является значение варианты, находящейся в центре упорядоченной по возрастанию значений признака совокупности. Медиана делит вариационный ряд на две равные части. При этом 50 % единиц совокупности имеют значение меньше медианного, а 50 % - больше медианного.

ЛЕСНОЙ ВЕСТНИК 2/2008

147

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Объем продаж, USD

I I эмпирическая относительная частота й теоретическое гамма-распределение —♦ - теоретическое нормальное распределение

Рис. 1. Гистограмма относительных частот и теоретические функции плотности вероятности

Таблица

Месячный объем продаж, USD

Среднее 17313,18

Стандартная ошибка 363,56

Медиана 16539

Мода 16802

Стандартное отклонение 3410,50

Дисперсия выборки 11631522,29

Эксцесс 0,46

Асимметрично сть 0,71

Интервал 16988

Минимум 10801

Максимум 27789

Сумма 1523560

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Счет 88

В нашем случае значение моды равно 16802, а значение медианы - 16539.

Для симметричного распределения значения средней, медианы и моды должны совпадать. В нашем же случае они различны. Таким образом, можно предположить, что искомое распределение несимметрично.

Чтобы в этом убедиться, надо определить, есть ли смещения в рассеянии данных. Индикатором этих смещений является скошенность данных или, по-другому, асимметрия As - показатель симметрии распределения. В случае положительной асимметрии распределение имеет длинную правую ветвь. Средняя величина больше медианы. Отрицательная асимметрия проявляется в виде более длинной левой ветви, а величина средней меньше медианы и моды. В случае симмет-

ричного распределения, например нормального, As = 0. При этом следует учитывать значимость коэффициента асимметрии. Если выполняется неравенство

|As| / ° < 3

где

6(n-1)

ш \(n+1)(n+3) ’

n - количество наблюдений, то асимметричность считается несущественной.

Коэффициент асимметрии, рассчитанный в «Описательной статистике», равен 0,71, а значение параметра = 0,26. Следовательно, в нашем случае \ASI / = 2,73 < 3,

и асимметрией при подборе теоретического распределения объема продаж за месяц можно пренебречь. Параметры, полученные на основе эмпирических данных, могут быть использованы как начальные приближения при построении вероятностной модели.

Построение математической модели. Для исследуемой экономической системы построение модели, как правило, включает два этапа. На первом этапе высказываются предположения о виде модели закона распределения и по выборкам, извлекаемым из генеральной совокупности, оцениваются параметры этой модели. На втором этапе адекватность модели наблюдаемым данным проверяется с использованием критериев согласия типа Пирсона, типа Колмогорова, типа Мизеса и других. В статистике этим этапам соответствует основные типы задач: идентификация закона распределения и проверка статистических гипотез, оценивание параметров распределения.

Под задачей идентификации закона распределения наблюдаемой случайной величины, как правило, понимают задачу выбора такой модели закона распределения вероятностей, которая наилучшим образом соответствует результатам наблюдения.

Визуальный анализ гистограммы относительных частот (рис. 1) позволяет сделать предположение о том, что вероятностная модель может быть представлена в виде нормального или гамма-распределения. Для построения кривых теоретических законов распределения найдем оценку параметров нормального и гамма-распределений, исполь-

148

ЛЕСНОЙ ВЕСТНИК 2/2008

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

зуя вторую из двух сформированных ранее выборок.

Среди всего множества различных оценок параметров модели можно выделить три основных класса оценок [3]. Это M-оценки, к которым относятся, например, оценки максимального правдоподобия и наименьших квадратов, L-оценки, формирующиеся как линейные комбинации порядковых статистик, и R-оценки, основанные на использовании ранговых критериев. Еще один класс оценок образуют методы, минимизирующие расстояния (MD-оценки).

Определяющими факторами при выборе метода оценивания являются структура представления наблюдаемых данных и качество оценок. Качество оценок определяется такими свойствами, как несмещенность, состоятельность и асимптотическая эффективность. Вместе с тем, оценки должны быть устойчивыми к малым отклонениям от предположений.

Если последовательность независимых одинаково распределенных случайных величин xp..., xN имеет функцию распределения F(x, 9) и функцию плотности fx,9), то оценкой максимального правдоподобия (ОМП) неизвестного векторного или скалярного параметра 9 по группированным наблюдениям называется такое значение параметра, при котором функция правдоподобия

L(0)=П pn (0)

i=1

достигает максимума на множестве возможных значений параметра. Вероятность попадания наблюдения в i-ый интервал значений определяется выражением

Р (е)= J f (x,e)dx.

x_1

Для вычисления ОМП дифференцируют функцию правдоподобия по 01 и, приравнивая производные нулю, получают систему уравнений правдоподобия

.^ПА0, l= 1m,

N

Z n

i=1

80,

решая которые находят искомые оценки параметров, здесь m - размерность вектора параметров.

Закон гамма-распределения имеет функцию плотности вероятности

f (х)=

1

-• ха-1е р.

Р“- Г (а) где Г(а)- гамма функция.

Векторный параметр гамма распределения 0 = (а, в), при этом связь с оценками математического ожидания и дисперсии осуществляется по формулам

д = а-р, D = а-р2.

Для нормального распределения 0 = (д, а), где a=4D - среднеквадратичное отклонение. Плотность вероятности нормального закона распределения вероятности задается формулой

f (x)=-

1

V2n

а

exp

1Г x-д

а

Функция правдоподобия для нормального распределения имеет вид

!(0)=

1

exp

_ 1Z| x -д"

2i=ii а ,

Продифференцировав функцию правдоподобия по параметрам д, а, приравняв получившиеся уравнения к нулю и выразив значения д, D, получим, что искомые оценки параметров нормального распределения, осуществленные по методу максимума правдоподобия, совпадают с оценками, выполненными по методу моментов.

- 1 N _ 1 N 2

д=x=NZxi D=N_1,^(x' _ x) ■

Значения математического ожидания и дисперсии в этом случае равны соответственно

д = 17313, D = 11631522. (1)

Для гамма-распределения ОМП параметров а, р находятся аналогичным способом с дифференциацией соответствующей функции правдоподобия. В этом случае система уравнений для определения оценок параметров а, р имеет вид

1N

-Zx _р=0 ;

N •а i=1

1 N dlnГ(0) , n л

—Zlnx.--------—-lnP = 0 .

Ni=1 ‘ d0

Данная система была решена численными методами, в результате чего получились следующие значения параметров

а = 25,8; р = 671,8. (2)

x

2

ЛЕСНОЙ ВЕСТНИК 2/2008

149

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Метод максимального правдоподобия, в отличие от других, позволяет определять оценки максимального правдоподобия параметров по негруппированным, частично группированным и группированным данным, т.е. дает возможность исследователю самому определять, в каком виде хранить эмпирическую информацию. Этот метод при соответствующих условиях регулярности [5] дает состоятельные и асимптотически эффективные оценки. Кроме того, применение метода максимального правдоподобия регламентировано в Рекомендациях по стандартизации [1] при проверке согласованности опытного распределения с теоретическим.

Используя оценки параметров распределения (1) и (2), полученные по выборке из генеральной совокупности в предыдущем пункте, на графике относительных частот построим теоретические законы распределения вероятностей. На рис. 1 кривая, соответствующая нормальному закону распределения, изображена в виде пунктирной линии, закон гамма-распределения представлен сплошной линией. Из графика видно, что эти два закона достаточно хорошо аппроксимируют эмпирический закон распределения, однако для принятия решения о виде распределения необходимо решить задачу идентификации закона распределения.

Для этого, опираясь на предыдущий анализ эмпирических данных, сформулируем гипотезу H0: F(x) = F(x, 9 ), где 9 - оценки (2) параметров гамма-распределения, рассчитанные по второй выборке методом максимума правдоподобия. В этом случае проверяемая гипотеза является простой в отличие от сложной гипотезы, в которой помимо проверки вида распределения необходимо еще производить оценивание параметром.

В случае простых гипотез для проверки согласия теоретического и эмпирического законов распределения применяются [1] критерии согласия, такие как Колмогорова, Смирнова, ш2 и Q2 Мизеса, которые не зависят от вида наблюдаемого закона распределения F(x, 9) и, в частности, от его параметров 9. В этом случае при проверке согласия опытного распределения с теоретическим распределением случайной величины X действуют

в соответствии алгоритмом, представленным ниже:

1. Формулируют проверяемую гипотезу, выбирая теоретическое распределение случайной величины, согласие которого с опытным распределением этой величины следует проверить.

2. Из совокупности отбирают случайную выборку объема N. Полученные результаты наблюдений располагают в порядке их возрастания, так что в распоряжении имеют упорядоченную выборку значений.

3. В соответствии с выбранным критерием проверки вычисляют значение статистики S* критерия (статистику Колмогорова, Смирнова, ш2 и Q2 Мизеса).

4. В соответствии с выбранным критерием проверки вычисляют значение

p( > SS >7 g (Ho yis =1-G(? Ho ),

S*

где G(S\H0) - распределение статистики критерия при справедливости гипотезы

ho;

g(s|H0) - условная плотность распределения статистики критерия при справедливости гипотезы.

Если выполняется неравенство

p{S > S*} > a,

где a = J g(s|H0)ds

- задаваемый уровень значимости (вероятность ошибки 1-го рода - отклонить справедливую гипотезу H0), то нет оснований для отклонения проверяемой гипотезы. В противном случае проверяемая гипотеза H0 отвергается.

В критерии Колмогорова в качестве расстояния между эмпирическим и теоретическим законом используется величина

dn = sup|FN (x)-F (x,e), (3)

ix<^

где FN(x) - эмпирическая функция распределения;

F(x, 9) - теоретическая функция распределения;

N - объем выборки.

При проверке гипотез обычно [4] используется статистика вида

S = S = 6' N6^DNN +1, D„ = max(D+N, Dn),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

150

ЛЕСНОЙ ВЕСТНИК 2/2008

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

D+= max

1< i< N

N

F(x ,e), D-=f^iiN iF (xi,e)-

i-1

N

где N - объем выборки;

xp..., xN - упорядоченные по возрастанию выборочные значения;

F(x) - функция закона распределения, согласие с которым проверяется.

Распределение величины Sk при простой гипотезе в пределе подчиняется закону Колмогорова K(S) [4].

Для проверки согласия двух распределений воспользуемся статистикой Колмогорова. Выберем уровень значимости a = 0,05, рассчитаем значение статистики Колмогорова для нашей задачи и величину расстояния между эмпирическим и теоретическим законом (3). В нашем случае оказалось, что теоретическое гамма-распределение согласуется с экспериментальными данными.

Повторяя вышеизложенные расчеты для нормального распределения, получаем, что нормальное распределение также хорошо согласуется с опытными данными. Следовательно, на основании выбранного критерия проверки Колмогорова два теоретических закона распределения - нормальный и гамма - могут быть использованы для построения прогнозной модели.

Прогноз объема продаж

- ♦ - нормальное распределение USD —*— гамма-распределение

Рис. 2. Интегральные функции вероятности гамма- и нормального распределения

Результаты моделирования. Для

построения прогноза объема продаж дополнительных услуг сотовой связи необходимо рассчитать значения интегральных функций

найденных выше теоретических законов нормального и гамма-распределения вероятностей с оцененными параметрами (1) и (2) этих распределений. График, построенный на рис. 2, позволяет спрогнозировать будущее значение месячного объема продаж с заданной вероятностью. Так, с 95 % вероятностью можно утверждать, что объем продаж в следующем месяце составит 11745 USD. При этом относительная погрешность прогноза в зависимости от выбора модели нормального или гамма-распределения в этом случае не превышает одного процента.

Для дальнейшего исследования модели прогнозирования объема продаж дополнительных услуг представляется целесообразным формулировать две конкурирующие гипотезы: H0: F(x) = F(x, e ) - о соответствии эмпирических данных гамма-распределению и альтернативную ей H1: F(x) = F1(x, Э ) - о нормальном распределении наблюдаемых величин, и рассчитывать вероятность в ошибки 2-го рода, т.е вероятность ошибочного принятия гипотезы H0, в то время как верна гипотеза Н1. При этом чем больше мощность критерия 1-в, тем лучше он различает соответствующие гипотезы.

Напоследок следует заметить, что в дальнейшем построенную вероятностную модель объема продаж можно улучшить, если идентификацию закона проводить с использованием ряда критериев согласия. Это связано в первую очередь с тем, что в непараметрических критериях проверки согласия опытного и теоретического распределений типа Колмогорова, типа Мизеса, типа Смирнова, и в критериях согласия типа хи-квадрат используются различные меры, поэтому критерии по-разному улавливают в выборках различные отклонения от предполагаемых теоретических законов. В этом случае окончательное решение может быть принято по совокупности критериев, когда выбирается модель, для которой достигаемый уровень значимости по всем критериям максимален.

Кроме того, при идентификации планируется рассматривать более широкое множество законов распределения, в том числе модели в виде смесей законов. В этом случае для любого эмпирического распределения можно построить адекватную, статистически

ЛЕСНОИ ВЕСТНИК 2/2008

151

i Надоели баннеры? Вы всегда можете отключить рекламу.