Научная статья на тему 'Оценивание средних и ковариаций нечетко-случайных величин'

Оценивание средних и ковариаций нечетко-случайных величин Текст научной статьи по специальности «Математика»

CC BY
460
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук
Ключевые слова
АНАЛИЗ НЕЧЕТКИХ ДАННЫХ / НЕЧЕТКО-СЛУЧАЙНЫЕ ВЕЛИЧИНЫ / СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ / НЕСМЕЩЕННОСТЬ / СОСТОЯТЕЛЬНОСТЬ / FUZZY DATA ANALYSIS / FUZZY RANDOM VARIABLES / POINT ESTIMATION / UNBIASEDNESS / CONSISTENCY

Аннотация научной статьи по математике, автор научной работы — Шведов А.С.

В настоящее время методы нечеткой математики широко применяются в различных прикладных исследованиях. Например, при составлении портфелей, когда для некоторых активов нет достаточно длинных рядов цен, относящихся к предыдущим периодам, для моделирования доходностей этих активов могут использоваться нечеткие числа. При этом для других активов надо сохранить возможность использования случайных величин. В данной работе предложены новые оценки средних и ковариаций нечетко-случайных величин. Доказаны несмещенность и состоятельность этих оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Estimating the means and the covariances of fuzzy random variables

At present, methods of fuzzy mathematics are applied in different fields. For example, fuzzy numbers can be used to model returns of assets in portfolio selection problem when historical data is unavailable. While for other assets possibility of using random variables should be kept. This paper presents new estimators of the means and the covariances of fuzzy random variables. Unbiasedness and consistency of these estimators are established.

Текст научной работы на тему «Оценивание средних и ковариаций нечетко-случайных величин»

Прикладная эконометрика, 2016, т. 42, с. 121-138. Applied Econometrics, 2016, v. 42, pp. 121-138.

А. С. Шведов1

Оценивание средних и ковариаций нечетко-случайных величин

В настоящее время методы нечеткой математики широко применяются в различных прикладных исследованиях. Например, при составлении портфелей, когда для некоторых активов нет достаточно длинных рядов цен, относящихся к предыдущим периодам, для моделирования доходностей этих активов могут использоваться нечеткие числа. При этом для других активов надо сохранить возможность использования случайных величин. В данной работе предложены новые оценки средних и ковариаций нечетко-случайных величин. Доказаны несмещенность и состоятельность этих оценок.

Ключевые слова: анализ нечетких данных; нечетко-случайные величины; статистическое оценивание; несмещенность; состоятельность.

JEL classification: C13.

1. введение

Подходы к описанию неопределенности в математических моделях, основанные на использовании теории вероятностей и на теории нечетких множеств, удачно дополняют друг друга. Теория вероятностей отражает то, что неизвестные величины могут принимать различные значения, и каждому значению или группе значений приписывается некоторая вероятность. Теория нечетких множеств отражает то, что сами значения могут быть «расплывчатыми, нечеткими», и допускает различные формы этой расплывчатости.

Первой работой по теории нечетких множеств является (Zadeh, 1965). Нечетко-вероятностный анализ стал применяться уже в 70-х годах XX века.

Методы нечеткой математики находят приложения в различных прикладных исследованиях. Например, при анализе временных рядов и прогнозировании (Tseng et al., 2001; Nguyen, Wu, 2006, Ch. 9), при изучении волатильности на финансовых рынках (Thiagarajah, Thavaneswaran, 2006). Открываются новые типы задач по многокритериальной оптимизации (Sakawa, 1993), обобщаются классические постановки в портфельной теории (Fang et al., 2006; Huang, 2007). Нечеткие множества используются при оценке опционов (Liu, 2009). Методы нечеткой регрессии позволяют усовершенствовать модель оценки фондовых активов (Kocadagli, 2013; Mbairadjim Moussa et al., 2014). Нечеткую математику можно использовать при организации движения транспорта (Torfi et al., 2011). Конечно, здесь приведены лишь немногие из существующих в этой области работ прикладной направленности.

В настоящей статье рассматриваются нечеткие множества только одного вида — нечеткие числа. Отметим, что частным случаем нечетких чисел являются действительные числа.

1 Шведов Алексей Сергеевич — НИУ ВШЭ, Москва; ashvedov@hse.ru.

Комбинировать идеи теории нечетких множеств и теории вероятностей можно многими способами. Так, в монографии (Buckley, 2006) нечеткими числами являются сами вероятности. Как об отдельном направлении нечеткого анализа, можно говорить о теории возможностей (см., например, (Пытьев, 2000)). Пространства с вероятностной мерой и пространства с возможностной мерой рассматриваются и в рамках единых конструкций (Yazenin, 2007).

Однако представляется, что в наибольшей степени унаследовать структуру тех постановок задач и результатов, которые выработались при вероятностном моделировании (и при необходимости включать в анализ нечеткие данные), позволяет следующий подход. Как известно, случайная величина — это измеримая функция, определенная на вероятностном пространстве, значениями которой являются действительные числа. Нечетко-случайная величина — это измеримая функция, определенная на вероятностном пространстве, значениями которой являются нечеткие числа.

Такая идея впервые рассматривалась в работах (Kwakernaak, 1978, 1979; Puri, Ralescu, 1986). Однако конструкции, которые при этом возникают, и теория статистических выводов, как отмечается, например, в (Wang, 2004), являются математически достаточно сложными. Из более поздних работ по нечетко-случайным величинам назовем (Colubi et al., 2001; Krätschmer, 2001; Shapiro, 2009). Упомянутые сложности во многом связаны с определением расстояния между нечеткими числами.

Представляется, что наиболее простой подход к определению нечетко-случайной величины предложен в (Шведов, 2013). В этой работе нечеткие числа рассматриваются как компактные множества на плоскости. Тогда метрику на множестве нечетких чисел можно ввести, используя обычное расстояние Хаусдорфа. Такой подход позволяет ограничиться относительно простыми конструкциями. Отметим, что в этой же работе изучаются квантили и распределения нечетко-случайных величин.

Дисперсии нечетко-случайных величин рассматриваются в работах (Körner, 1997; Näther, 2006). Моменты нечетко-случайных величин изучаются и в ряде других публикаций.

Различные вопросы, относящиеся к теории статистического вывода с нечеткими данными, рассматриваются, например, в (Akbari et al., 2009; Colubi et al., 2007; Colubi, 2009; Nguyen, Wu, 2006; Sadeghpour-Gildeh, Rahimpour, 2011; Taheri, 2003; Viertl, 2011; Wang, 2004; Wu, 2003; Yoshida, 2008).

Существуют различные варианты определений нечетких чисел и операций над ними; определения, используемые в данной работе, приводятся в разделе 2.

В разделе 3 приводятся с некоторыми модификациями результаты работы (Шведов, 2013). Здесь же рассматриваются моменты нечетко-случайных величин. Используемое определение ковариации нечетко-случайных величин наиболее близко к определению из (Feng et al., 2001), однако у определения из настоящей работы имеется важное преимущество, подробнее см. раздел 3.

Разделы 4 и 5 содержат основные результаты работы. В четвертом разделе приводятся новые оценки средних и ковариаций нечетко-случайных величин, исследуется их несмещенность, а в пятом устанавливается состоятельность этих оценок. Понимание этих разделов не должно вызвать трудностей у специалистов по математической статистике, в отличие от некоторых перечисленных выше работ по теории статистического вывода с нечеткими данными, где авторы предлагают использовать нетрадиционный и достаточно тяжеловесный математический инструментарий. Поэтому приведенный в настоящей работе подход

представляется перспективным и для построения оценок в более сложных эконометриче- §

ских задачах с нечеткими данными. 8

3 о

2. нечеткие числа и операции над ними

Определения, приводимые в этом разделе, являются некоторым «общим местом» для работ по нечеткому анализу. Однако в разных работах под одними и теми же названиями понимаются немного разные объекты, поэтому здесь дадим все определения полностью. В частности, некоторые из них близки к определениям из (Feng et al., 2001) — в первую очередь, это касается определений средних значений и моментов (похожие определения встречаются и в других, в том числе более ранних работах).

Будем рассматривать пространство R с координатами (X, f).

Определение 1. Множество zс R2, лежащее в полосе 0 < f< 1, называется нечетким числом, если существуют монотонные, непрерывные слева функции zL : [0,1]^ R и zR : [0,1] ^ R, где zL не убывает, zR не возрастает, причем zL (1) < zR (1) такие, что для любого f0 Е [0,1] пересечение множества z с прямой f = f 0 представляет собой отрезок

{(X,f): zL (fo)<£< zR(fo), f = fo}.

Функции zL (f) и zR (f) называются, соответственно, левым индексом и правым индексом нечеткого числа z .

Другими словами, нечеткое число — это «горка» единичной высоты, склоны которой могут включать как вертикальные, так и горизонтальные участки. Из определения видно, что z — ограниченное множество.

В частности, функции zL (f) и zR (f) могут совпадать (тогда они обе являются константами). Такие нечеткие числа (вертикальные отрезки высоты 1) в последующем играют роль действительных чисел.

Доказательство того, что при указанных условиях на функции zL (f) и zR (f) множество z является замкнутым, несложно. Оно приведено в работе (Шведов, 2013, с. 8). Поскольку любое замкнутое ограниченное подмножество пространства R2 компактно, нечеткое число z является компактным множеством.

Определение 2. Если z — нечеткое число с индексами zL (f) и zR (f), й — нечеткое число с индексами йL (f) и uR (f), то суммой z + й нечетких чисел z и й называется нечеткое число с левым индексом zL (f) + йL (f) и с правым индексом zR (f) + uR (f). Произведением действительного числа l и нечеткого числа z называется нечеткое число 1z , которое имеет при 1> 0 левый индекс 1zL (f) и правый индекс 1zR (f), а при 1< 0 — левый индекс 1zR (f) и правый индекс 1zL (f).

Определение 3. Если z — нечеткое число с индексами zL (f) и zR (f), то средним значением нечеткого числа z называется

i

0.5/(z^ (f) + zR (f))df .

o

Определение 4. Если т. — нечеткое число с индексами гь (и гк (, и — нечеткое число с индексами иь (и ик(, то скалярным произведением (т,и) нечетких чисел г и и называется

0.25 /(zL (ц) + zR(^))(uL (ц) + uR(ц))dц.

о

Отметим, что из условия (и,и) = 0 не следует тождественное равенство нулю левого индекса и правого индекса нечеткого числа и .

В некоторых задачах набор наблюдений — это набор нечетких чисел ^,...,хп. Например, если данные представляют собой цены некоторого актива за п дней, то каждое нечеткое число может нести в себе информацию и о максимальной, и о минимальной, и о средней цене в каждый из дней. Также такие понятия, как «плохое», «среднее», «хорошее» состояние рынка удобно выражать в виде нечетких чисел. Возникают и другие ситуации, например, связанные с отсутствием достоверной информации, когда использование нечетких чисел оказывается полезным.

3. Нечетко-случайные величины и их моменты

Пусть J — множество, элементами которого являются компактные множества пространства R2. Если K, K2 Е J, то расстоянием Хаусдорфа между Kj и K2 называется наибольшее из чисел

sup inf || aj — a21| и sup inf || aj — a21|.

aJEKJ a2 EK2 a2EK2 aJEKJ

При таком определении расстояния множество J является метрическим пространством.

Через S обозначим о-алгебру борелевских подмножеств множества J , т. е. наименьшую о-алгебру, содержащую все открытые подмножества множества J и все замкнутые подмножества множества J.

Пусть (W, S, P) — вероятностное пространство, т. е. S — о-алгебра, состоящая из некоторых подмножеств множества W, P — вероятностная мера.

Как обычно, отображение из W в J называется измеримым, если прообраз любого множества M Е S входит в о-алгебру S.

Определение 5. Измеримое отображение X : W^ J называется нечетко-случайной величиной, если при любом w£W множество X(w) является нечетким числом.

Индексы нечеткого числа X(w) будем обозначать XL (w, ц) и XR (w, ц). Функции XL (w, ц) и XR (w, ц) называются, соответственно, левым индексом и правым индексом нечетко-случайной величины X.

Следующие две леммы являются частными случаями известных результатов теории многозначных отображений (см., например, (Castaing, Valadier, 1977)). Расстояние Хаусдорфа между компактными множествами плоскости Kj и K2 будем обозначать dist(Kj, K2).

Лемма 1. Для любого открытого G с М2 множество Ма = {К Е J: К с G} является § открытым подмножеством множества 3 . |

Доказательство. Пусть К0 Е М°. Это означает, что К0 с G . Тогда ^

е= inf а, — а2 > 0 .

а,ЕК0, а2 ЕМ2\о" 11

Для любого К Е J такого, что dist (К, К0) <£, выполняется условие К с G, т. е. К Е М° . Это означает, что К0 входит в М° вместе со своей е-окрестностью. Тем самым М° — открытое множество. Лемма доказана.

Лемма 2. Для любого замкнутого F с М2 множество MF = {К Е J: К П F Ф 0} является замкнутым подмножеством множества 3 .

Доказательство. Нетрудно видеть, что МР = J \ММ \р . Но ММ \р , согласно Лемме 1, является открытым подмножеством множества 3. Поэтому Мр — замкнутое подмножество 3. Лемма 2 доказана.

Теорема 1. Пусть X — нечетко-случайная величина. Тогда при любом л0 Е [0,1] левый и правый индексы Хь (ю, л0) и Xя (ю, л0) являются измеримыми функциями ю .

Доказательство проведем для функции X , для X оно будет аналогично.

При с Е М рассмотрим замкнутое подмножество Р пространства М2

р ={(х л): л = л0}.

Тогда

{юЕЙ: X1- (ю, л0 с} = {ю Е Й: X (ю) П Р Ф 0} = {юЕ Й: X (ю) Е МР }.

По Лемме 2 множество МР является замкнутым подмножеством множества 3 , поэтому МР Е S . Следовательно, множество {юЕЙ:Xь (ю, л0с} входит в о-алгебру 2. Теорема 1 доказана.

В дальнейшем сузим определение нечетко-случайной величины и будем рассматривать только такие нечетко-случайные величины X, для которых функции Xь (ю, л) и Xя (ю, л) ограничены на множестве й X [0,1] по абсолютной величине некоторой константой. Отметим, что при этом условии, например, нормальные случайные величины перестают быть частным случаем нечетко-случайных величин. Это не исключает, однако, использования центральной предельной теоремы после дефазификации2.

Поскольку любая измеримая ограниченная функция аргумента ю является интегрируемой (по мере Р), можно воспользоваться Теоремой 1 и определить функции

хь (л) = ¡Xе (ю, л)dP, хй (л) = /Xя (ю, л)dP .

и и

2 Дефазификация — это «процесс получения скаляра, представляющего ожидаемую величину управляющей переменной из нечеткого множества» (Нерода, Проскуряков, 2013, с. 42). Так же называется и получение действительного числа, в том или ином смысле близкого к нечеткому числу.

Очевидно, что функция хь монотонно неубывающая, функция хЕ монотонно не-

возрастающая, X (1) < хЕ(1). Также нетрудно видеть, что функции хь и хЕ являются

непрерывными слева. Действительно, пусть V,, при п ^ю . Тогда Хь (ю, ) ^ Хь (ю, V) при п ^ю для любого юёй. По теореме Лебега (см., например, (Колмогоров, Фомин,

1976)) хь() ^хь(V) при п ^ю, поскольку функция Хь(ю,V) ограничена по абсолютной

величине некоторой константой. Так же устанавливается непрерывность слева и функции

хЕ (V).

Доказанное означает, что функции хь и хЕ являются, соответственно, левым и правым индексом некоторого нечеткого числа.

Определение 6. Нечетким ожиданием нечетко-случайной величины X называется нечеткое число х с левым индексом хь и правым индексом хЕ . Ожиданием Е (Х) нечетко-случайной величины Х. называется среднее значение нечеткого числа х. .

Таким образом, ожидание нечетко-случайной величины Х.

1

Е(Х) = 0.5 / /(Х* (ю, + Xе(ю, V)) ЛРЛV .

о а

Пусть У — нечетко-случайная величина с индексами Уь (ю, V) и Уе (ю, V). Положим

/ Ы = /У^ (ю, V)ЛР, уе (V) = /Уе (ю, V)ЛР.

а а

Теорема 2. Каждый из интегралов

/Хь (ю, v)Уi (ю, V)ЛР, /X* (ю, v)УE (ю, V)ЛР ,

а а

/Хе (ю, v)У* (ю, V)ЛР , /Хе (ю, V)УЕ (ю, V)ЛР

а а

как функция аргумента V является функцией ограниченной вариации на отрезке [0,1].

Доказательство проведем, например, для второго интеграла. Для остальных трех интегралов доказательства аналогичны. Пусть 0 <v1 <V2 < 1; С — константа, которой ограничены по абсолютной величине функции Хь (ю, V) и УЕ (ю, V) на множестве ах[0,1]. Тогда

/Хь (ю, V2)УЕ (ю, V2)ЛР-/Х* (ю, VI )УЕ (ю, VI)ЛР

а а

< / |Х* (ю, V2 )УЕ (ю, V2) - Х* (ю, VI )УЕ (ю, VI)|ЛР<

а

< / |Х* (ю, V2)УЕ (ю, V2)- Х* (ю, V2 )УЕ (ю, VI )| ЛР +

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+/ |Х* (ю, V2)УЕ (ю, VI) - Х* (ю, VI )УЕ (ю, VI)| ЛР <

а

< С/1 Уя (ю, л2 ) — Уя (ю, л! )^Р + С/ |X* (ю, л2) — X* (ю, л! )| dP =

й й

= С/ (уя (ю, л,) — Уя (ю, л2)) dP + С/ (X* (ю, л2) — X* (ю, л,)) dP .

й й

При последнем переходе использовано то, что при любом юЕй функция Xе(ю,л) как функция аргумента л является неубывающей, а функция У (ю, л) — невозрастающей. Для любого разбиения 0 <л0 <л1 <---<лх < 1 отрезка [0,1] имеем

О

0

5

1

о

2 /X* (ю,л, )УЯ (ю, л,)dP — /X* (ю, л,— )УЯ (ю, л,—)dP

]=, й й

< С2 (х* (л, ) — х* (л1)) + С2 (/ (л1) — / (л,)) =

]=1 ,=1

= С (х* (1) — х* (0)) + С (уя (0) — уя (1)) .

Теорема 2 доказана.

Поскольку каждая функция ограниченной вариации является интегрируемой по Лебегу на отрезке [0,1], то Теорема 2 позволяет корректно дать следующие определения.

Пусть X — нечетко-случайная величина с индексами Xе (ю, л) и Xя (ю, л), У — нечетко-случайная величина с индексами У (ю,л) и У (ю,л).

Определение 7. Скалярным произведением {X,У} нечетко-случайных величин X и У называется

1

0.25//(X* (ю, л) + Xя(ю, л))(У* (ю, л) + УЯ(ю, л))dPdл .

Ковариацией соу (X, У) нечетко-случайных величин X и У называется

1

0.25 // (X * (ю, л) + Xя (ю, л) — х * (л) — хя (л)) (У * (ю, л) + Уя (ю, л) — у * (л) — УЯ (л)) dP d л .

Дисперсией Уаг (X) нечетко-случайной величины X называется Соу (X, X ). Нетрудно увидеть, что для любых нечетко-случайных величин X и У

Соу(X,У) = (X,У) — х,у).

Очевидно также, что для любых нечетко-случайных величин X и У

соу (X ,У ) = соу (У, X). Дисперсия любой нечетко-случайной величины неотрицательна.

Существование ожиданий, дисперсий и ковариаций для любых нечетко-случайных величин обеспечивается условием, что все индексы ограничены по абсолютной величине некоторой константой.

Определение 8. Нечетко-случайные величины X и Y называются независимыми, если для любых Mj,M2 Е S

P (X ЕMj ,Y Е M2 ) = P (X ЕMj)P(Y ЕM2) (ср. (Биллингсли, 1977)).

Отметим, что для независимых нечетко-случайных величин X и Y

J ( \

(X,Y) = 0.25/ /(XL (w,ц) + XR(w,ц))dP J(YL (w,^ + YR(w,ц)) dP dц=(x,y).

о V а а /

Поэтому для независимых нечетко-случайных величин X и Y

Cov (X ,Y ) = о.

Поскольку определены сложение нечетких чисел и умножение действительных чисел на нечеткие числа, можно естественным образом определить сложение функций, значениями которых являются нечеткие числа, а также умножение действительных чисел на такие функции. Нетрудно видеть, что для любых нечетко-случайных величин X, Y , Z и любых действительных чисел l и u

Cov (X + Y, Z ) = Cov (X, Z ) + Cov (Y, Z ), Cov (lX, ¡uY) = lu Cov (X, Y).

Отметим, что в работе (Feng et al., 2001) предлагается несколько иное определение кова-

риации нечетко-случайных величин, которое в наших обозначениях имеет вид

j

0 5U(XL (w,ц) — xL(ц))(YL (w,ц) — yL(ц))dPdц +

о а j

+0.5//(XR (w,ц) — xR(ц))(YR (w,ц) — yR(ц))dPdц .

Такая «ковариация» нечетко-случайных величин ХХ и /гУ равна «ковариации» нечетко-случайных величин Х и У, умноженной на Дм, вообще говоря, лишь в том случае, когда знаки чисел Х и м не являются противоположными.

о а

4. оценки среднего и ковариации, их несмещенность

Пусть математической моделью для наблюдений х1,..., хп является набор независимых нечетко-случайных величин Х1,...,Хп. Кроме того, в последующем потребуется одинаковость некоторых характеристик этих нечетко-случайных величин. Соответствующие условия будут сформулированы в этом и следующем разделах в виде трех Предположений таким образом, чтобы было видно, какие именно свойства используются в соответствующем месте

доказательства; полностью независимыми данные предположения не являются. В чисто § стохастическом случае можно было бы сказать, что эти величины одинаково распределены, 8 хотя и здесь при доказательстве использовалась бы не одинаковость функций распределе- ^ ния, а некоторые более слабые условия. ^

Первая рассматриваемая в данном разделе задача — построение оценки Е (Xi). Это ожидание будем считать одним и тем же для всех i = 1,...,п .

Пусть Xi (ю, л) и Xя (ю, л) — индексы нечетко-случайной величины X,. Положим

— 1 n

X(w,rç) = -^ 0.5 (XL ( w,rç) + XR (w, rç)).

П i=1

В качестве оценки E (X,.) предлагается следующая:

1

î (w) = f X (w, rç) d rç.

0

Измеримость функции î (w) устанавливается ниже.

В ряде работ, например (Colubi et al., 2007; Colubi, 2009; Sadeghpour-Gildeh, Rahimpour, 2011; Wang, 2004), рассматривается вопрос об оценке среднего в нечетко-случайной выборке, но речь идет об изучении свойств нечетко-случайных величин (X1 +... + Xn)n.

Пусть теперь имеется другой набор наблюдений y1,...,yn, математической моделью которого является набор нечетко-случайных величин Y1,...,Yn. Двумерные нечетко-случайные величины

/ т> \

Xi

/ т"> \

X

Y

\i / V n /

предполагаются независимыми.

Вторая задача, рассматриваемая в данном разделе, это построение оценки для Соу (Xi, У). Эту ковариацию будем считать одной и той же для всех i = 1,...,п . Просуммируем сделанные предположения.

Предположение 1 (одинаковость характеристик нечетко-случайных величин). Существуют действительные числа jJ,X , цу, ККТ такие, что при любом i = 1,...,п

Их = Е (X,), Цу = Е (у.), КХу = Соу (X,. ,¥г). Пусть У(ю, л) и Уя (ю, л) — индексы нечетко-случайной величины У1. Положим

— 1 "

У (ю, л) = -210.5 (У* (ю, л) + УЯ (ю, л)).

П ,=1

Для Соу (Xi У ) предлагается следующая оценка:

1 п 1

К(ю) = —Л 2 Л0.5(X* (ю, л) + Xя(ю,л)) — X(ю,л)]х

п 1 ,=1 0

X [ 0.5(У,* (ю, л) + УЯ (ю, л)) — У (ю, л)]d л.

Для доказательства измеримости функции К (w), как и для функции u (w), основной является следующая теорема.

Теорема 3. Для любой нечетко-случайной величины X индексы XL (w, ц) и XR (w, ц) являются Q-измеримыми функциями, где мера Q — это произведение вероятностной меры P, заданной на а-алгебре L, и борелевской меры, заданной на а-алгебре борелевских подмножеств отрезка [0,1].

Доказательство проведем для функции XL (w, ц) . Для XR (w, ц) оно аналогично.

Напомним, что функция XL (w, ц) является ограниченной на множестве а X [0,1]. Кроме того, при каждом w£w функция XL(w,ц) как функция аргумента ц является монотонно неубывающей и непрерывной слева. Пусть cmin, cmax — действительные числа такие, что

Cm,n < XL ц)< Cmx

при любых w£Q, цЕ [0,1].

При l Е N рассмотрим равномерную сетку на отрезке [cmin, cmax ] с шагом Ac = (cmax — cmin) /1:

c . = cn <c <■■■ <c, = c .

mm 0 J l max

При т Е N рассмотрим равномерную сетку на отрезке [0,1] с шагом Дл = 1/ т:

0 = ^0 <...<Пт =1 • При у = 1,..., т; к = 1,..., I рассмотрим подмножества множества й

Лк] = {ш Е Й : Ск_1 < X^ (ш, у )<Ск}.

Поскольку при любом лЕ[0,1] функция Хь (ш, л) является измеримой по ш (Теорема 1), все подмножества Лку. входят в о-алгебру Е . Отметим, что при любом у = 1,...,т

U Akj =а.

k=J

Определим следующую функцию Хт : ЙХ [0,1] ^ М .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Хт л) = Ск_1, если лЕ (,П}], шЕ Лк для некогорого у = ^.,т; и Хы (ш,0) = с_,

если шЕ Лк1. Очевидно, что функция Хт (ш, л) ^-измерима.

Если будет установлено, что для каждой точки (ш, л) Е ЙХ [0,1]

,Ит Хт Л) = лХ

то функция Хь (ш, л) будет ^-измеримой (см., например, (Колмогоров, Фомин, 1976)).

Зафиксируем точку (ш, л) Е ЙХ [0,1] и е> 0. Будем считать, что л> 0. При л = 0 доказательство проводится аналогично, но несколько проще.

Из непрерывности слева функции Хь (ш, л) как функции аргумента л при фиксированном ш вытекает, что существует б> 0 такое, что

XL (w,у)-XL(w,y-d)<2.

e й

Напомним, что рассматриваемая функция является монотонно неубывающей по у. о Пусть I и га выбраны таким образом, что Ас <е / 2, Ау < б; уj_1 — ближайшая к у точка 4 сетки, удовлетворяющая условию Уj_1 <у .

Тогда й£ Ду при некотором к . Это означает, что

ск_1 < X- у>_1) < ск , Хгт (ш у) = ск_1.

Поэтому

0 < Хь ( ш, у) _ X,,,, ( ш, у) = ( X- (ш, у) _ X- (ш, у^)) + +(X- (^ ) _ Х1т у^ < 2 + Дс < е.

Теорема 3 доказана.

Из ограниченности и измеримости функций Хь (ш, у) и X* (ш, у) следует их интегрируемость на ЙХ [0,1] . Поэтому выполнены условия теоремы Фубини (см., например, (Колмогоров, Фомин, 1976)), согласно которой

1 1 //X1- (ш,у)СуСР = //X1- (ш,у) с1Рс1 у ,

Й 0 0 Й

и внутренний интеграл в левой части является интегрируемой (а следовательно, и измеримой) функцией аргумента ш . Аналогичное утверждение верно для X (ш,у), а также /^^ (ш,у),...,(ш,у),X/' (ш,у),...,X* (ш,у)), где/ — любая измеримая, ограниченная на ограниченных подмножествах М2п функция.

После того как обоснована замена порядка интегрирования, можно показать несмещенность оценок Д и К.

Для / = 1,...,п положим

х- (у) = ¡X- (ш, у)йР, хГ (у) = fxR (ш, у)СР,

ЙЙ

У- (у) = (ш, у)СР, у* (у) = (ш, у)йР.

ЙЙ

Предположение 2 (одинаковость характеристик нечетко-случайных величин). При любом у£ [0,1] левые части в четырех последних равенствах не зависят от 7.

В дальнейшем эти функции будем обозначать хь (у), х* (у), уь (у), у * (у) соответственно.

Из Предположения 2 имеем

1 1 1 Е (Д ) = f f X (ш, у) С у сСР = ff X (ш, у) СР сС у = 0.5 х^ (у) + х* (у)) С у = д;г.

и 0 0 и 0

Таким образом, оценка Д является несмещенной.

Запишем оценку К (ш) в виде

1 n 1

K w-«—г 2/

" 1 ¿-1 0

rrf X,1- (w, л) + XR (w, л) xL (л) + Xй (л) , xL (л) + Xй (л) -

+ -

-X(w, л)

X

X

(Yl (w,л)+YR(w,л) ZMlzRM^ yL (л)+yR (л) v( ) -Ö---ö-+-ö--Y (w, л)

d л.

После введения обозначений

U г л)-

XL (w, л) + XR (w, л) xL (л) + Xй (л)

( ) YL (w, л) + Y,R (w, л) yL (л) + УR (л) ^ л) --------

имеем

1 п 1 ' 1 п ^^ 1 п ^

К(ш) = —2/ ^(ш,л)_-2иу (ш,л) (ш,л)_-^ (ш,л) ¿л.

п 1 • 1 п 1 п 1

Согласно определению ковариации нечетко-случайных величин,

1

КХУ

= //и (ш, л)^- (ш, л) йР й л

0 й

при любом 7 = 1,..., п . С другой стороны, при любом лЕ [0,1] и 7 = 1,..., п

/ с/,, (ш, л) dP = 0 , /?;. (ш, л) dP = 0.

Й Й

В силу условия независимости при 7 ^ у имеем

/с(ш, л)^ (ш, л) dP = 0.

й

Проинтегрировав левую и правую части последнего выражения для К(ш) по ш и поменяв в правой части порядок интегрирования, получаем

E(K)--—rJ(/ /и, (w,л)^.(w,л)dPdл-2/ /и,(w,л)^.(w,л)dPdл

П 1 г-1 V 0 W П 0 W

+-rr://^ (w, лх- (w, л) dp d л)=: ( - - ^+U -ir

n inn n— V n n I n — 1

у=1 0 й у 1=1

Таким образом, оценка КГ является несмещенной.

+

n-1

- K

n

5. состоятельность оценок Д и К

Приводимое доказательство состоятельности основано на применении неравенства Чебы-

щ

0

5

1

шева, из которого следует, что если оценка несмещенная и ее дисперсия стремится к нулю (при п ^^), то оценка является состоятельной. Такой подход распространен в прикладной статистике (см., например, (Айвазян, Мхитарян, 1998)).

Предположение 3. Все индексы X^ (ю, у), Xя (ю, у), У ^ (ю, у), Ур (ю, у), 7 = 1,2,..., п , ограничены по абсолютной величине одной и той же константой (не зависящей от п).

Получаем

Var (Д ) = /(д (w) — /лх ) 2 dP =

1 n 1

4 2 //

lr f XL (w, y) +XR (w, y)

■Дх

1=1 Q\ 0

\ \2

d y / /

dP +

+— n

•1 n __1

? 2 2/ /

i=1 y^i Q

1. f XL (w, y) + XR (w, y)

-Дх

d y/

(w, y) + X^ (w, y)

^X

\ \

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

dy

/ /

dP.

Вторая сумма в правой части равна нулю из-за условия независимости. Все п слагаемых первой суммы ограничены по абсолютной величине одной и той же константой. Поэтому

Уаг (Д ) = 1 Таким образом, оценка Д — состоятельная.

Выражение для оценки К (ю) через интегралы от функций и (ю, у), V (ю, у), полученное в предыдущем разделе, может быть записано в виде

1 1 И 1 п п

К(ю) = —Т/ 2^(ю,(ю,у)--22^(ю,у)^, (ю,у)

п 1 0 \ 1=1 п 1=1 ,=1

Если рассмотреть случайные величины

1

2 и(ю) = !и. у) Vу)^У,

0

1 п л п п

то к =— 2 —2 .

п-1^ 11 п(п-1)^^ 1

d y.

п(п -1) 1=1 Тогда К2 = ^ + + ^з , где

*=(n——lyr z ill2 *

kk

k=1 /

, S2 =

(n — 1)2

п п I п

22, 12 z

\ i=1 ,=1 /

Jkk

\ k=1 /

Q

2

1

n2 (n — 1)2

\ ¡-I j-r i v k-r ¡-г

При изучении суммы ^ воспользуемся тем, что Е (2' ; 1) = КХТ при любом ; . По условию независимости при ; Ф к

Е(2,2кк) = Е(2;.;)Е(2кк) = КХг .

Все функции Х^ (ш, л), ХЕ (ш, л), Угь (ш, л), ^ (ш, л), 7 = 1,2,., п , ограничены по абсолютной величине одной и той же константой. Поэтому

E ( Z ¿2)- о (1)

E ( 51)-KXY + о{11

равномерно по п. Таким образом,

При рассмотрении суммы Б2 воспользуемся тем, что если все индексы 7,у, к различные, то

Е( 2у2кк ) = Е (2у ) Е (2кк ) = 0 ,

поскольку Е (2у ) = 0 при 7 Ф у . Тогда

E (52)-о{ 1\

Для суммы воспользуемся тем, что если все индексы 7, у,к,I различные, то

Поэтому Следовательно,

E (ZijZkl )-E( Zj ) e( Zи )-0 .

E (5з)-о{1I

E (K2)- K2xy + 01-

и Var(K)-E(¿2) —(e(K))2 -о{11.

Поэтому оценка К — состоятельная.

Таким образом, в данной работе предложены обобщения классических оценок среднего и ковариации для случая, когда среди имеющихся данных могут быть нечеткие. Установлены несмещенность и состоятельность построенных оценок.

Описок литературы

Айвазян С. А., Мхитарян В. С. (1998). Прикладная статистика и основы эконометрики. М.: ЮНИТИ.

Биллингсли П. (1977). Сходимость вероятностных мер. М.: Наука.

Колмогоров А. Н., Фомин С. В. (1976). Элементы теории функций и функционального анализа. М.: Наука.

Нерода В. Я., Проскуряков С. Ф. (2013). Толковый словарь англоязычных терминов по нечеткому управлению. М.: УРСС.

Пытьев Ю. П. (2000). Возможность. Элементы теории. М.: Эдиториал УРСС.

Шведов А. С. (2013). О нечетко-случайных величинах. Препринт WP2/2013/02. М.: НИУ ВШЭ.

Akbari M. Gh., Rezaei A. H., Waghei Y. (2009). Statistical inference about the variance of fuzzy random variables. Sakhyä: The Indian Journal of Statistics, 71-B, Part 2, 206-221.

Buckley J. J. (2006). Fuzzy probability and statistics. Berlin: Springer.

Castaing C., Valadier M. (1977). Convex analysis and measurable multifunctions. Lecture Notes in Mathematics. Vol. 580. Berlin: Springer.

Colubi A., Dominguez-Menchero J. S., Lopez-Diaz M., Ralescu D. A. (2001). On the formalization of fuzzy random variables. Information Sciences, 133, 3-6.

Colubi A., Coppi R., D'Urso P., Gil M. A. (2007). Statistics with fuzzy random variables. METRON— International Journal of Statistics, 65, 277-303.

Colubi A. (2009). Statistical inference about the means of fuzzy random variables: Applications to the analysis of fuzzy- and real-valued data. Fuzzy Sets and Systems, 160, 344-356.

Fang Y., Lai K. K., Wang S. (2006). Portfolio rebalancing model with transaction costs based on fuzzy decision theory. European Journal of Operational Research, 175, 879-893.

Feng Y., Hu L., Shu H. (2001). The variance and covariance of fuzzy random variables. Fuzzy Sets and Systems, 120, 487-497.

Huang X. (2007). Two new models for portfolio selection with stochastic returns taking fuzzy information. European Journal of Operational Research, 180, 396-405.

Kocadagli O. (2013). A novel nonlinear programming approach for estimating CAPM beta of an asset using fuzzy regression. Expert Systems and Applications, 40, 858-865.

Körner R. (1997). On the variance of fuzzy random variables. Fuzzy Sets and Systems, 9, 83-93.

Krätschmer V (2001). A unified approach to fuzzy random variables. Fuzzy Sets and Systems, 123, 1-9.

Kwakernaak H. (1978). Fuzzy random variables — I. Definitions and theorems. Information Sciences, 15, 1-29.

Kwakernaak H. (1979) Fuzzy random variables — II. Algorithms and examples for the discrete case. Information Sciences, 17, 153-178.

Liu F.-Y. (2009) Pricing currency options based on fuzzy techniques. European Journal of Operational Research, 193, 530-540.

Mbairadjim Moussa A., Sadefo Kamdem J., Shapiro A. F., Terraza M. (2014). CAPM with fuzzy returns and hypothesis testing. Insurance: Mathematics and Economics, 55, 40-57.

Näther W. (2006). Regression with fuzzy data. Computational Statistics and Data Analysis, 51, 235-252.

Nguyen H. T., Wu B. (2006). Fundamentals of statistics with fuzzy data. Berlin: Springer.

Puri M. L., Ralescu D. A. (1986). Fuzzy random variables. Journal of Mathematical Analysis and Applications, 114, 409-422.

Sadeghpour-Gildeh B., Rahimpour S. (2011). A fuzzy bootstrap test for the mean with Dpq distance. Fuzzy Information and Engineering, 4, 351-358.

Sakawa M. (1993). Fuzzy sets and interactive multiobjective optimization. New York: Plenum Press.

Shapiro A. F. (2009). Fuzzy random variables. Insurance: Mathematics and Economics, 44, 307-314.

Taheri S. M. (2003). Trends in fuzzy statistics. Austrian Journal of Statistics, 32, 239-257.

Thiagarajah K., Thavaneswaran A. (2006). Fuzzy random coefficient volatility models with financial applications. Journal of Risk Finance, 7, 503-524.

Torfi F., Farahani R. Z., Mahdavi I. (2011). Fuzzy least-squares linear regression approach to ascertain stochastic demand in the vehicle routing problem. Applied Mathematics, 2, 64-73.

Tseng F.-M., Tzeng G.-H., Yu H.-C., Yuan B. J. C. (2001). Fuzzy ARIMA model for forecasting the foreign exchange market. Fuzzy Sets and Systems, 118, 9-19.

Viertl R. (2011). Statistical methods for fuzzy data. Chichester: Wiley.

Wang D. (2004). A note on consistency and unbiasedness of point estimation with fuzzy data. Metrika, 60, 93-104.

Wu H.-C. (2003). The fuzzy estimators of fuzzy parameters based on fuzzy random variables. European Journal of Operational Research, 146, 101-114.

Yazenin A. V. (2007). Possibilistic-probabilistic models and methods of portfolio optimization. In: Studies in Computational Intelligence (SCI), 36, 241-259. Berlin: Springer.

Yoshida Y. (2008). Perception-based estimations of fuzzy random variables: Linearity and convexity. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 16, Suppl. 1, 71-87.

Zadeh L. A. (1965). Fuzzy sets. Information and Control, 8, 338-353.

Поступила в редакцию 08.05.2015; принята в печать 27.05.2016.

Shvedov A. S. Estimating the means and the covariances of fuzzy random variables. Applied Econometrics, 2016, v. 42, pp. 121-138.

Alexey Shvedov

National Research University Higher School of Economics, Moscow, Russian Federation; ashvedov@hse.ru

Estimating the means and the covariances of fuzzy random variables

At present, methods of fuzzy mathematics are applied in different fields. For example, fuzzy numbers can be used to model returns of assets in portfolio selection problem when historical data is unavailable. While for other assets possibility of using random variables should be kept. This paper presents new estimators of the means and the covariances of fuzzy random variables. Unbiasedness and consistency of these estimators are established.

Keywords: fuzzy data analysis; fuzzy random variables; point estimation; unbiasedness; consistency. JEL classification: C13.

References §

=3

Aivazian S. A., Mhitarian V. S. (1998). Prikladnaja statistika i osnovy jekonometriki. M.: YUNITI (in ^ Russian). ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Billingsli P. (1977). Shodimost'verojatnostnyh mer. M.: Nauka (in Russian).

Kolmogorov A. N., Fomin S. V. (1976). Elementy teorii funkcij i funkcional'nogo analiza. M.: Nauka (in Russian).

Neroda V. Ja., Proskurjakov S. F. (2013). Tolkovyj slovar'anglojazychnyh terminovpo nechetkomu up-ravleniju. M.: URSS (in Russian).

Pyt'ev Ju. P. (2000). Vozmozhnost'. Elementy teorii. M.: Jeditorial URSS (in Russian).

Shvedov A. S. (2013). On fuzzy random variables. NRU HSE Working paper WP2/2013/02 (in Russian).

Akbari M. Gh., Rezaei A. H., Waghei Y. (2009). Statistical inference about the variance of fuzzy random variables. Sakhyä: The Indian Journal of Statistics, 71-B, Part 2, 206-221.

Buckley J. J. (2006). Fuzzy probability and statistics. Berlin: Springer.

Castaing C., Valadier M. (1977). Convex analysis and measurable multifunctions. Lecture Notes in Mathematics. Vol. 580. Berlin: Springer.

Colubi A., Dominguez-Menchero J. S., Lopez-Diaz M., Ralescu D. A. (2001). On the formalization of fuzzy random variables. Information Sciences, 133, 3-6.

Colubi A., Coppi R., D'Urso P., Gil M. A. (2007). Statistics with fuzzy random variables. METRON— International Journal of Statistics, 65, 277-303.

Colubi A. (2009). Statistical inference about the means of fuzzy random variables: Applications to the analysis of fuzzy- and real-valued data. Fuzzy Sets and Systems, 160, 344-356.

Fang Y., Lai K. K., Wang S. (2006). Portfolio rebalancing model with transaction costs based on fuzzy decision theory. European Journal of Operational Research, 175, 879-893.

Feng Y., Hu L., Shu H. (2001). The variance and covariance of fuzzy random variables. Fuzzy Sets and Systems, 120, 487-497.

Huang X. (2007). Two new models for portfolio selection with stochastic returns taking fuzzy information. European Journal of Operational Research, 180, 396-405.

Kocadagli O. (2013). A novel nonlinear programming approach for estimating CAPM beta of an asset using fuzzy regression. Expert Systems and Applications, 40, 858-865.

Körner R. (1997). On the variance of fuzzy random variables. Fuzzy Sets and Systems, 9, 83-93.

Krätschmer V (2001). A unified approach to fuzzy random variables. Fuzzy Sets and Systems, 123, 1-9.

Kwakernaak H. (1978). Fuzzy random variables — I. Definitions and theorems. Information Sciences, 15, 1-29.

Kwakernaak H. (1979) Fuzzy random variables — II. Algorithms and examples for the discrete case. Information Sciences, 17, 153-178.

Liu F.-Y. (2009) Pricing currency options based on fuzzy techniques. European Journal of Operational Research, 193, 530-540.

Mbairadjim Moussa A., Sadefo Kamdem J., Shapiro A. F., Terraza M. (2014). CAPM with fuzzy returns and hypothesis testing. Insurance: Mathematics and Economics, 55, 40-57.

Näther W. (2006). Regression with fuzzy data. Computational Statistics and Data Analysis, 51, 235-252.

Nguyen H. T., Wu B. (2006). Fundamentals of statistics with fuzzy data. Berlin: Springer.

Puri M. L., Ralescu D. A. (1986). Fuzzy random variables. Journal of Mathematical Analysis and Applications, 114, 409-422.

Sadeghpour-Gildeh B., Rahimpour S. (2011). A fuzzy bootstrap test for the mean with Dpq distance. Fuzzy Information and Engineering, 4, 351-358.

Sakawa M. (1993). Fuzzy sets and interactive multiobjective optimization. New York: Plenum Press.

Shapiro A. F. (2009). Fuzzy random variables. Insurance: Mathematics and Economics, 44, 307-314.

Taheri S. M. (2003). Trends in fuzzy statistics. Austrian Journal of Statistics, 32, 239-257.

Thiagarajah K., Thavaneswaran A. (2006). Fuzzy random coefficient volatility models with financial applications. Journal of Risk Finance, 7, 503-524.

Torfi F., Farahani R. Z., Mahdavi I. (2011). Fuzzy least-squares linear regression approach to ascertain stochastic demand in the vehicle routing problem. Applied Mathematics, 2, 64-73.

Tseng F.-M., Tzeng G.-H., Yu H.-C., Yuan B. J. C. (2001). Fuzzy ARIMA model for forecasting the foreign exchange market. Fuzzy Sets and Systems, 118, 9-19.

Viertl R. (2011). Statistical methods for fuzzy data. Chichester: Wiley.

Wang D. (2004). A note on consistency and unbiasedness of point estimation with fuzzy data. Metrika, 60, 93-104.

Wu H.-C. (2003). The fuzzy estimators of fuzzy parameters based on fuzzy random variables. European Journal of Operational Research, 146, 101-114.

Yazenin A. V. (2007). Possibilistic-probabilistic models and methods of portfolio optimization. In: Studies in Computational Intelligence (SCI), 36, 241-259. Berlin: Springer.

Yoshida Y. (2008). Perception-based estimations of fuzzy random variables: Linearity and convexity. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 16, Suppl. 1, 71-87.

Zadeh L. A. (1965). Fuzzy sets. Information and Control, 8, 338-353.

Received 08.05.2015; accepted 27.05.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.