Научная статья на тему 'Применение численного вероятностного анализа в задачах интерполяции'

Применение численного вероятностного анализа в задачах интерполяции Текст научной статьи по специальности «Математика»

CC BY
63
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЧИСЛЕННЫЙ ВЕРОЯТНОСТНЫЙ АНАЛИЗ / NUMERICAL PROBABILISTIC ANALYSIS / ФУНКЦИЯ СЛУЧАЙНЫХ АРГУМЕНТОВ / FUNCTIONS OF RANDOM VARIABLES / ИНТЕРПОЛЯЦИЯ / INTERPOLATION / ГАРАНТИРОВАННЫЕ ОЦЕНКИ / VERIFIED BOUNDS

Аннотация научной статьи по математике, автор научной работы — Попова Ольга Аркадьевна

Рассмотрено построение интерполяционных многочленов и сплайнов в условиях, когда входные данные носят случайный характер и могут быть представлены функциями, аппроксимирующими плотности вероятности этих случайных величин. Для решения поставленных задач мы развиваем численный метод, в основу которого положены компьютерная реализация арифметических операций над плотностями случайных величин и процедуры построения так называемых вероятностных расширений функций. Новый подход получил название численного вероятностного анализа. Исследовано, в частности, применение интерполяционных многочленов и сплайнов для построения гарантированных оценок функций распределения и функций плотности вероятности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of numerical probabilistic analysis in interpolation problems

The paper addresses the application of numerical probabilistic analysis for construction of function approximations under conditions of stochastic uncertainty. We introduced the definitions of random interpolation and random spline in this study. To define these concepts we use the probabilistic extensions as the base component for numerical probabilistic analysis. To construct these extensions the arithmetical operations for probability density functions of the random variables and numerical procedures for the probabilistic extensions have been applied. Lagrange interpolation polynomials and polynomial splines with input random data are discussed. To employ the numerical probabilistic analysis we propose the special class of the random Lagrange interpolating polynomials. We argue that our approach to uncertainty representation allows us to build reliable estimates for random functions. In the case of a random piecewise linear interpolation we assess the accuracy of the mathematical expectation and variance. To use the numerical probabilistic analysis we proposed special class of the random cubic splines. For the construction of the random splines we solved the random system of linear algebraic equations. Our study shows that the application of the random splines for approximation of distribution functions and probability densities and allows the reliable estimate. This approach is based on the properties of order statistics. Reliable estimates are represented as the histogram P-boxes and second order histograms. To demonstrate our theory we use numerical examples to build the histogram P-boxes and the second order histogram. It is important to note that numerical results show the effectiveness of our techniques to small samples.

Текст научной работы на тему «Применение численного вероятностного анализа в задачах интерполяции»

Вычислительные технологии Том 22, № 2, 2017

Применение численного вероятностного анализа в задачах интерполяции

О. А. ПОПОВА

Институт космических и информационных технологий СФУ, Красноярск, Россия Контактный e-mail: OlgaArc@yandex.ru

Рассмотрено построение интерполяционных многочленов и сплайнов в условиях, когда входные данные носят случайный характер и могут быть представлены функциями, аппроксимирующими плотности вероятности этих случайных величин. Для решения поставленных задач мы развиваем численный метод, в основу которого положены компьютерная реализация арифметических операций над плотностями случайных величин и процедуры построения так называемых вероятностных расширений функций. Новый подход получил название численного вероятностного анализа. Исследовано, в частности, применение интерполяционных многочленов и сплайнов для построения гарантированных оценок функций распределения и функций плотности вероятности.

Ключевые слова: численный вероятностный анализ, функция случайных аргументов, интерполяция, гарантированные оценки.

Введение

Наличие неопределенностей и неоднозначностей во входных данных при решении многих практических задач приводит к необходимости создания методов, учитывающих эти неопределенности. Так, интервальная (или ограниченная) неопределенность, когда об интересующей величине известны лишь границы ее возможных значений, привела к развитию интервального анализа. Сами интервалы по определению не несут никакой дополнительной структуры (ни вероятностной, ни какой другой), и все их точки считаются равнозначными и имеющими одинаковый статус, или, как еще иногда говорят, равновозможными. Из-за этой концептуальной простоты методы интервального анализа получили наибольшее развитие среди дисциплин, занимающихся обработкой неопределенных и неточных данных. Дальнейшие обобщения интервального анализа направлены на получение более детальных характеристик получаемых множеств решений [1, 2].

С другой стороны, на практике часто оказывается, что не все точки полученных интервальных оценок (даже оптимальных по ширине) в самом деле равнозначны. Как правило, варианты решений, близкие к концам интервальных оценок, реализуются крайне редко или вообще никогда не случаются на практике. В последние годы развития интервального анализа появилось ощущение того, что более детальный учет структуры входных данных внутри интервалов их изменения позволит более точно оценивать интервалы оценок решений. В русле этих идей выполнена и настоящая работа. Мы используем информацию о плотности вероятности случайных величин внутри интервалов

© ИВТ СО РАН, 2017

и развиваем численные методы для расчетов с такими величинами. Это дает возможность получать результаты в виде случайных величин, имеющих интервальные носители, с приближенно найденными плотностями вероятности.

Одним из подходов к решению задач со случайными входными данными является, как известно, метод Монте-Карло [3, 4]. При всех его положительных качествах этот метод обладает рядом недостатков, и один из самых существенных — низкая скорость сходимости. Так, в работе [5] сравнение трудоемкости метода Монте-Карло и численных операций с гистограммой арифметики для достижения одинаковой точности ответа показало преимущество гистограммной арифметики от 100 до 1000 раз. В целом при благоприятных обстоятельствах численные операции над плотностями вероятностей случайных величин позволяют существенно поднять точность расчетов при сравнительно небольшом объеме вычислений [6].

В работе рассматриваются вероятностные расширения интерполяционных полиномов и сплайнов на случай, когда входные данные представляют собой случайные величины, заданные своими плотностями вероятности. Далее случайные величины, по аналогии с интервальными переменными, будем обозначать а, Ь, с.

Задачу интерполяции можно сформулировать следующим образом: пусть для некоторой функции / ее значения ^ = / ) в точках а = х0 < хг < х2 < ... < хп = Ъ являются случайными величинами fг = 0,1,... ,п, причем задана функция их совместной плотности вероятности р(/о, /г,... , /га). Возникает задача приближенного восстановления всех реализаций функции в произвольной точке х. Далее эта задача будет решена в рамках численного вероятностного анализа с использованием понятия вероятностного расширения. Для этих целей будут построены вероятностные расширения интерполяционных полиномов Лагранжа, кусочно-линейных функций, кубических сплайнов.

1. Элементы численного вероятностного анализа

Обозначим через И множество {ж} случайных величин, заданных своими плотностями вероятности рх, и соответственно через Ип пространство случайных п-векторов. Пусть имеется совокупность непрерывных случайных величин (хг, х2,... , хп) с совместной плотностью распределения р(хг,х2,... ,хп), а случайная величина у связана с (х\, х2,... , хп) функциональной зависимостью

у = ¡(хг, х2,..., хп).

Тогда функция распределения Ру для случайной величины у задается, как известно, выражением [7, 8]

Ру(г) = Р(У < г) = р(хг,х2,..., хп) йхгйх2 ... йхп, (1)

где = { (хг,х2,... ,хп) | /(хг,х2,... хп) < х}. В тех случаях, когда это возможно, дифференцируя Ру, можно получить плотность вероятности для у:

(г)

¿г =

¡у (*).

Плотность вероятности /у будем называть вероятностным расширением функции /.

Полагая /(х\, х2) = Х\ * х2, где * Е {+, —, ■, /}, можно получить аналитические формулы для определения плотности вероятности результатов арифметических действий над случайными величинами. Например, для нахождения плотности вероятности рХ1+Х2 суммы двух случайных величин Х\ + х2 используется соотношение [8]

те те

Рх1+х2 (х)= р(х — у,у) дь = р(ь,х — у) ¿V (2)

(оно является сверткой плотностей вероятности слагаемых в случае их независимости). Для нахождения плотности вероятности рХ1/х2 частного двух случайных величин х\/х2 имеем

те 0

Рх1/х2 = J vp(xv,v) dv — j vp(v,xv) dv. (3)

0 -те

Плотность вероятности рХ1Х2 произведения двух случайных величин Х\Х2 определяется соотношением [7]

те 0

рХ1Х2 = J(\/v)p(x/v,v) dv — j (1 /v)p(v, x/v) dv. (4)

0 -те

Из этих выражений непосредственно вытекают коммутативность и ассоциативность операций сложения и умножения случайных величин.

Заметим, что для численного вычисления интегралов вида (1) использование ку-батурных формул возможно только при небольших размерностях п, а в общем случае используются методы Монте-Карло [3]. В рамках численного вероятностного анализа рассматриваются численные арифметические операции над различными типами плотностей случайных величин. Это позволяет в некоторых случаях вычислять интегралы вида (1) с необходимой точностью.

В численном вероятностном анализе используются различные типы представления плотностей случайных величин: дискретные, гистограммы, полиграммы, полигоны, кусочно-полиномиальное и аналитическое представление. Далее подробно рассмотрим решение поставленных задач с помощью гистограмм.

Гистограммой называется случайная величина, плотность распределения которой представлена кусочно-постоянной функцией. Гистограмма Р определяется некоторой сеткой { Xi | г = 0,..., и}, и на каждом подынтервале [xi-\, Xj\, г = 1,... ,п, гистограмма принимает постоянное значение Pi. Величины h = (xi — Xi-\), г = 1, 2,... ,п, обычно называют шагами гистограммы Р, а h = maxi<j<n hi определяет ее максимальный шаг.

В символическом анализе данных и научном направлении, образно называемом Data Mining [9], гистограммы используются для исследования множества различных процессов и применяются для описания изменчивости количественных признаков. Использование гистограмм обусловлено прежде всего тем, что они позволяют достаточно точно представлять произвольные распределения.

Важно отметить, что, несмотря на свою простоту, гистограммы охватывают все возможные интервалы оценки плотности вероятности. Наиболее популярны из них гистограммы с постоянным шагом (т.е. с фиксированной шириной столбцов), которые широко используются на практике, полиграммы и дискретные плотности вероятности [6].

В случае неизвестных плотностей вероятности возможно использование гистограмм второго порядка, т.е. кусочно-гистограммных функций [10, 11].

1.1. Операции над плотностями вероятности случайных величин

В качестве примера рассмотрим арифметические операции над гистограммными переменными. Реализация арифметических операций основана на работе с р(х, у) — совместной плотностью вероятности двух случайных величин х, у. Пусть pz — гистограмма, приближающая плотность вероятности арифметической операции над двумя случайными величинами х * у, где * Е {+, —, ■,/}. Тогда значение гистограммы на интервале [zi, zi+l] определяется по формуле [12]

Vi =-1- I Р(х, у) dxdy, (5)

Zi+i — Zi J Hi

где Üi = {(х, у) | < x * у < zi+i}.

Рассмотренный выше подход обобщается на случай большего числа переменных. Пусть требуется найти гистограмму pz суммы

z = а\xi + а,2 Х2 + ... + ап хп

и пусть р(х1, х2,... , хп) — плотность распределения вероятностей случайного вектора (х1, х2,... , хп). Тогда вероятность попадания z в интервал (Zi, Zi+1) соответственно равна [8]

Р(z, < z < zi+i) = j ...f Фьъ...^) d.^ fe2

Hi

где Üi = {(х1,х2,..., хп) | Zi < а1х1 + а2х2 + ... + апхп < zi+i}, а pzi имеет вид

pzi =-1- 1'1 Р(х1,х2,... ,хп)йх1(1х2 ...&хп.

Zi+i — Zi J J

Hi

Рассмотрим вопрос существования обратных элементов по сложению и умножению. Заметим, что для уравнения а + х = 0 существует решение, которое можно представить в виде совместной функции распределения (а, х):

< \ — / Ра(х\), если х1 = —х2, Р-*(х1,х2)={ 0, если х, = —х2,

где ра(х) — плотность вероятности случайной величины а. Таким образом, р-а(х1,х2) определяет обратный элемент по сложению для а. Аналогично несложно построить и обратный элемент по умножению.

1.2. Вероятностные расширения

Рассмотрим задачу нахождения закона распределения функции нескольких случайных аргументов, для которых распределения известны.

Пусть f(х1,...,хп) — рациональная функция от случайных аргументов. Для вычисления гистограммы F распределения значений f заменим переменные Х\, х2, ... , хп их гистограммными значениями, а арифметические операции — на соответствующие гистограммные. Полученную гистограмму F будем называть естественным ги-стограммным расширением функции f.

Теорема 1 ([13]). Пусть f (xf,... ,хп) — рациональная функция, в выражении для которой каждая переменная встречается только один раз, и х1,...,хп — независимые случайные величины. Тогда естественное гистограммное расширение аппроксимирует вероятностное расширение с точностью O(h), где h — максимальный шаг гистограмм распределений аргументов.

Рациональная функция

f {x,y,z) = х(у + z) имеет равносильное представление

f (х, у, z) = ху + XZ,

но только первое из этих представлений подпадает под условие теоремы 1. Как следствие, только для первого представления естественное гистограммное расширение будет аппроксимировать вероятностное с точностью O(h). Таким образом, для численных операций сложения и умножения над гистограммами дистрибутивность не выполняется.

Теорема 1 легко обобщается на следующий случай.

Замечание 1 ([13]). Пусть для функции f (х\,... ,хп) возможна замена переменных такая, что f (z1,... ,Zk) — рациональная функция от переменных zf,... ,Zk, удовлетворяющая условиям теоремы 1, и Zi — функции от множества переменных Xi,i Е Indi, причем множества Indi попарно не пересекаются. Пусть для каждой Zi существуют вероятностные расширения. Тогда естественное расширение f (z\,... ,Zk) будет аппроксимировать вероятностное с некоторой точностью.

Пусть f (х1,х2) = (—х\+х1) sin(x2). Тогда, полагая Z\ = (-xf + 1) и z2 = sin(x2), можно построить вероятностные расширения функций zf и z2, а f = zfz2 — рациональная функция, подпадающая под условия теоремы 1. Следовательно, ее естественное гистограммное расширение будет аппроксимировать вероятностное с некоторой точностью.

Рассмотрим случай, когда для f(х1,...,хп) необходимо найти вероятностное расширение f, но не удается построить замену переменных согласно замечанию 1. Пусть для определенности только Х\ встречается несколько раз. Заметим, что если подставить вместо случайной величины х\ детерминированную t, то для функции f (t,x2,... ,хп) можно построить естественное вероятностное расширение.

Пусть t — дискретная случайная величина, аппроксимирующая х\ следующим образом: t принимает значения ti с вероятностью Pi, и пусть для каждой f (ti,x2,... ,хп) можно построить естественное вероятностное расширение Тогда вероятностное расширение f функции f (х\,... , хп) можно аппроксимировать плотностью вероятности ip следующим образом [13]:

п

<р(о = Е р^).

г=1

Для частного вида случайных функций нам понадобятся некоторые дополнительные понятия. Пусть случайная функция имеет вид

п

f (ж) = X]

г=1

где дг Е Ст[а,Ь] — пространство функций, определенных на [а,Ь] и имеющих на этом интервале т непрерывных производных. Тогда формальную производную от f (х) определим таким образом:

п

9к f (х) = X а^(к)(х), к = 0,...,т.

г=1

Далее запись а Е а будет означать, что а есть некоторая реализация случайной величины а. Соответственно, функцию

п

!(х) = ^2 а^9г(х), аг Е Щ,

г=1

будем называть сужением функции f по параметрам а^

2. Задачи интерполяции

2.1. Случайные полиномы Лагранжа

Задачу интерполяции сформулируем следующим образом: пусть для некоторой функции / в точках а = х0 < х1 < х2 < ... < хп = Ь известны аппроксимации /(хг) случайными величинами f ^ и задана их совместная функция плотности вероятности р(1о, /1,... , 1п). Необходимо построить случайный интерполяционный полином 1п(х):

^п (хъ) f %.

Рассмотрим интерполяционные полиномы Лагранжа для случая линейной интерполяции. Пусть для некоторой функции / в точках х1, х2 известны значения /1, /2. В случае линейной интерполяции имеем точное равенство

/ (х) = 11(х) + ^12^2) / "а),

где 11 — полином Лагранжа первой степени,

к (Х) = ¡1 —-— + 12 —-— , С Е [Х1,Х2].

Х2 — Х1 Х2 — Х1

В случае, когда Е f 1, ¡2 Е f 2 известны неточно, необходимо построить линейную случайную функцию 1(х), такую что выполнены условия интерполяции 1(х1) = f 1 и 1(х2) = f 2. Таким образом, используя естественные вероятностные расширения, построим случайный полином Лагранжа первой степени

// \ п Х2 X л X Х1 (х) = f 1- + Í2

Х2 — Х1 Х2 — Х1

Заметим, что условия интерполяции выполнены и 1(х) принимает соответствующие значения в узлах интерполяции. Отметим, что здесь сужение случайной линейной функции по параметрам f ^ будет вещественной линейной функцией.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Далее, если требуется построить случайную функцию I, для которой при всех х Е [х1,х2] выполнено включение £ Е I, то необходимо знать априорную информацию о плотности вероятности /" Е f" на интервале [х^х2]. Заметим, что

Кх) = 1(х) + (х -Х1)(Х -х) по.

Получаем оценку

х) Е 1(х) + (х - х1)(х - х2) f

Рассмотрим интерполяционный полином Лагранжа в общем случае. Справедливо представление

п

1п{х) = ^ /

г=0

где базисные функции

<*(х)=п (хх-х).

3=г

Таким образом, вычисление интерполяционного полинома Лагранжа в произвольной точке сводится к вычислению суммы f ^ с весами. Наиболее просто это осуществляется в случае независимости случайных величин f поскольку подпадает под условия теоремы 1.

2.2. Случайная кусочно-линейная интерполяция

При значениях п > 5 использование интерполяционных полиномов Лагранжа неэффективно. В этом случае для простоты можно использовать кусочно-линейную интерполяцию, при которой на каждом подынтервале [хг ,хг+\] реализуется полином Лагранжа первой степени:

/V» _ /V» /V» _ /V»

// \ <> г+1 . п г

1(х) = fi-— + fi+1-—.

хг+1 хг хг+1 хг

Оценим математическое ожидание интерполяционных полиномов Лагранжа. В силу линейности математическое ожидание интерполяционного полинома будет линейной комбинацией математических ожиданий значений функции и совпадать с интерполяционным полиномом Лагранжа, проведенным через математические ожидания значений функции:

/V» . _ /V» /V» _ /V» .

ММх)] = М^г] ^^ + М[/т] .

хг+1 хг хг+1 хг

В тех случаях, когда для математического ожидания случайной функции f известны оценки второй производной тах |М[/(2)]|, справедлив следующий результат.

х£[а,Ь]

Теорема 2. Пусть 11 — кусочно-линейная интерполяция случайной функции f. Тогда справедлива оценка

\ М[11] - М^] \ < Кк2 тах\М^(2)]|,

хЕ.[а,Ь]

где К — константа, не зависящая от к.

Доказательство повторяет аналогичное доказательство для вещественных интерполяционных полиномов.

Рассмотрим теперь свойства дисперсии кусочно-линейной интерполяции 11 случайной функции f.

Теорема 3. Дисперсия кусочно-линейной интерполяции 11 удовлетворяет следующей оценке:

Э^] < тах шах{ 0[Рг], 0[Рг+1 ],Кцг+1}.

0<г<п-1

Доказательство. Дисперсия линейной функции 11 на интервале [х1,х+ ] выражается формулой [7]

г^г + f г+1аг+1] = г] + г+1] + 2<1%а%+1 <

< тах{^ ^к^} (о% + а%+1 + 2aiai+l),

где

/V» , _ /V» /V» _ /V» ,

= -, ~ '

хг+1 хг+1

Кг,г+1 — корреляционный момент f f Поскольку Чг + а,1+1 = 1, Чг € [0,1], то + а%+1 + 2ща+1 = (щ + а.г+1)2 = 1.

2.3. Случайные сплайны

Рассмотрим вопросы построения случайных сплайнов. Они вводятся как вероятностные расширения соответствующих вещественных сплайнов по некоторым их параметрам. При небольшой априорной информации об интерполируемой функции строятся ее вероятностные приближения.

Приведем необходимые для дальнейшего изложения элементы теории сплайнов [14]. Пусть для некоторого целого N > 2 на интервале [а,Ь] задана сетка

Ш = { Хг | а = Х0 < Х1 < . . . < Хн = Ь }

с шагами к = Хг+1 — Хг, К = шах Кг.

0<<М-1

Функцию в называют сплайном степени п дефекта к (к — целое, 1 < к < п) с узлами из ш, если:

п

з(х) = ац(х — х3)г на [х^,х3+1\, ] = 0,..., N — 1; (6)

г=0

в € Сп-к[а,Ъ]. (7)

Множество сплайнов, удовлетворяющих этим условиям, обозначим через ЯП.

Обратимся к вопросу интерполирования заданных функций сплайнами нечетных степеней. Положим целое т = (п — 1)/2 и будем считать дефект к < т +1.

Пусть / € Сп-к[а,Ь]. Поставим задачу определения сплайна 5 € ЯП, интерполирующего функцию / в следующем смысле:

8и)(Хг ) = ! а)(Хг), г = 1,...,М — 1, 3 = 0,...,к — 1.

(8)

Дополнительно задается еще по т +1 краевому условию на [а, Ь]. Часто они берутся в виде

5 и)(а) = /и)(а), 8 и)(Ъ) = /(з)(Ъ), ] = 0,...,т. (9)

Условия (8), (9) приводят, соответственно, к 2(N — 1) к и (п +1) уравнениям для коэффициентов а^. Еще (п — 2к + 1)(N — 1) уравнений вытекают из условия непрерывности производных в соответствии с (7). В итоге получается система линейных алгебраических уравнений с квадратной матрицей А Е (га+1)х%(п+1), вектором неизвестных а известной правой частью Ь Е (а+1\ Не исследуя общего случая, в даль-

нейшем выпишем эту систему для конкретных примеров и исследуем ее разрешимость.

Теперь перейдем к определению случайных сплайнов от вещественного аргумента. Необходимость в их использовании возникает, когда вместо точных значений функции и ее производных известны только какие-то случайные величины. Пусть даны случайные константы

П(хг) Е Л г=1,...^ — 1, ] = 0,... ,к — 1; (10)

1()(а) Е & !(\Ъ) Е ) = 0,... ,т. (11)

Случайным сплайном назовем функцию в : [а, Ь] ^ И. со случайными значениями, определяемую как

(х) = {¿(х) | вЕБ*, 8и)(хг) Е К, г=1,...^ — 1, ] = 0,... ,к — 1;

8(>)(а) Е К, з(»(Ъ) Е Гм, ] = 0,...,т }. (12)

Эта случайная функция является вероятностным расширением соответствующего вещественного сплайна.

Для сплайнов известны следующие оценки [14].

Теорема 4. Пусть f Е Ср[а, Ь], 1 < р < п +1, и сплайн в, в Е Б^, интерполирует, функцию f в смысле (8), (9). Тогда при 0 < ] <р имеет место

IIЯ — з(Л|и <Кы*II¡(р)\и, (13)

где К3 — константы, не зависящие от ¡и к; || ■ — чебышевская норма в пространстве функций.

Далее мы подробнее рассмотрим сплайны степени 3, т. е. кубические сплайны, наиболее популярные в современных вычислительных технологиях. Рассмотрим случайную функцию в : [а, Ь] ^ И со значениями

з(х) = { 8(х) I 8 Е в13, 8(хг) Е /0, 1 = 0,..., N,8 "(а) Е й, 8"(Ь) Е f % }.

В итоге кубический сплайн на подынтервалах [хj-1,хj], ] = 1,...^, имеет два представления [14]:

8(х) = М- (х, — х)3/(6к) + М, (х — х—)3/(6к) + + (/— — М3-1к2/6)(х3 — х)/к + (£ — М3 Щ/6)(х — х—)/к, (14)

в(х) = т3-\(х3 — х)2(х — х3--\)/Щ — т3 (х — х3-г)2(х3 — х)/Щ+ +!з-г(х3 — х)2(2(х — х—) + К3)/К3 + /3 (х — х3-\)2(2(х3 — х) + к3)/к3,

15)

где Мз = в" (х3), тз = з' (хз), ¡з = f (хз).

Заменяя М3, тз, ¡3 на М3, ш3, f 3 = f 0, получаем соответствующее представление случайного кубического сплайна. Выпишем случайные системы линейных алгебраических уравнений: для М3

М3-1 + 2М 3 + \3 М

М0 = f0,

М

3+1 -N = f n

В 3

О 3

т3+1 — — ^ 3 — fз-l)/hз)/(hз + к3+г),

= }13+1/(}13 + к3+1)1 Рз = 1 — хз,

:1б)

3 = 1,

М - 1;

для тз

'17)

\3 т3-г + 2т3 + цз Ш3+1 = 43, 2т0 + шг = 3^г — f 0)/Ы — к^1/2, 2mN + ШN-1 = 3^ N — f N-l)/hN + hN f N/2, ¿3 = 3Хз ^ з — fз-l)/hз + 3^з №3+1 — fз)/hз+l,

з = 1,...,м — 1.

Матрицы систем (16) и (17) имеют вещественные элементы, а правые части содержат случайные переменные. Кроме того, эти матрицы являются трехдиагональными и имеют строгое диагональное преобладание.

Таким образом, в силу вещественности матриц (16), (17) решения М и ш можно представить как линейные комбинации от правых частей

М = В^ или ш = В^,

где Вг, В2 — обратные матрицы к матрицам систем (16), (17).

С помощью найденных решений, используя вероятностные расширения, можно построить случайные функции в(х) : [а, Ь] ^ И со значениями

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8(х) = Мз-г ((Х3 — х)3/(6^) — (Х3 — х)^/6) + +Мз((х — Хз-г)3^з) — (х — хз-^з/6) + +f з -1(Хз — x)/hз + f Ах — х3-\)/К3

18)

или

в(х) = ш3-1(х3 — х)2(х — х3-1)/Ц— — Ш3 (х — Хз-\)2(Хз — х)/Ц+ +fз-l(Xз — х)2(2(х — Х3-1) + 1г3)/Ц+ +f М — Хз-г)2(2(Хз — х) + !г3)/Ь3

'19)

при х Е [х3-\,х3], ] = 1,..., N.

Заметим, что если в (18) брать сужение в по случайным параметрам М3, то в общем случае мы не получим кубического сплайна, так как М3 могут не удовлетворять

2

системе (16) и, как следствие, будем иметь s' ф С [а, Ь]. Если брать сужение по в (19), то s' е С [а, Ь], но s" ф С [а, Ь].

Заметим, что сплайн на каждом подынтервале [xj-\,xj] можно представить как линейную комбинацию

s(x) = Y1 f&(x)> i

где фг(х) — некоторые вещественные функции. В этом представлении сужение s по случайным параметрам f i не нарушает гладкости сплайна.

Рассмотрим случайные эрмитовы кубические сплайны si : [а, b] ^ R. На каждом интервале [xj-1,xj],j = 1,...,N, согласно формуле (15), эти сплайны представимы в виде

Si(x) = f j-iv((x — xj-i)/hj) + f )-iW((x - xj-i)/hj) + + f jV((x — xj)/hj) + fjw((x — xj)/hj),

где v(x) = (|x| — \)2(2lxl + 1), w(x) = x(lxl — l)2. Кроме того, сужение Si по параметрам fj, fj будет эрмитовым кубическим сплайном. Следовательно, при аппроксимации функций эрмитовыми сплайнами наличие ошибок в данных не снижает гладкости сплайна.

3. Гарантированные оценки функции распределения

Рассмотрим построение гарантированных оценок эмпирической функции распределения.

Пусть (£ 1,...,£п) — выборка случайной величины X с функцией распределения F(t),t е [а, Ь]. Соответствующая эмпирическая функция распределения находится, как известно, следующим образом:

Fn(t) = —, (20)

п

где mt — число элементов, удовлетворяющих ^ < t.

Пусть Zi = F(£i), г = 1,... ,п. Заметим, что Zi, г = 1,... ,п, — равномерно распределенные случайные величины на [0,1]. Если zi < z2 < ... < zn, то Zk — к-я порядковая статистика с математическим ожиданием M[zk] = к/(п +1) [15]. Далее будем использовать точки (/(п + 1)) для построения подходящей аппроксимации функции распределения F.

Пусть ш = {а < < (;2 < ... < < Ъ} — сетка на [а, Ь]. На этом интервале, используя сетку ш, построим кусочно-линейную функцию s, такую что

s(Ci) = г/(п +1), г = 1,... ,п, в(а) = 0, s(b) = 1.

Заметим, что если вместо математических ожиданий i/(п + 1) можно было бы использовать точные значения Zi, то погрешность кусочно-линейной функции s(x) на сетке { = 0,1,... ,п } с h = max (^ — ^i-i) удовлетворяла бы оценке

Кг <п

||F — s\\<Kh2\\F (2>||.

Таким образом, даже при относительно небольших п построенные оценки достаточно хорошо аппроксимируют функцию распределения Р. Относительно Хг известно, что они образуют порядковые статистики.

Плотность вероятности к-й порядковой статистики

п!

*( г)=(п - к)!(к - 1)! ^ - ^, [0-Ч-

Совместная плотность вероятности вектора (Zj, Хк) выражается следующим образом:

">*(г<■ *) = о - 1)!(к - П- 1)!(п - к)! г>>"( * - *(1 - ^■

3 < к, 0 < ^ < хи < 1.

Каждому случайному вектору (х2,... , zn) соответствует кусочно-линейная функция 8. Перебирая все возможные случайные векторы (г2 ■,..., %п), получаем все множество кусочно-линейных функций {в}. Заметим, что { в} содержит интерполянт функции распределения Р. Таким образом, используя для значения в узле ^ плотность вероятности к-й порядковой статистики, множество { } можно представить в виде случайной кусочно-линейной функции Ь. Соответственно, Ь — гарантированная оценка эмпирической функции распределения.

Рассмотрим аппроксимацию случайной кусочно-линейной функции Ь в виде гис-тограммной функции распределения [16]. Построим две сетки шу = {Уг = г/^,1 = 0,1,.. - , Ху} и (¿1 = {0 = ¿о < tl < ... < }. Не ограничивая общности, будем считать ш С (. На сетке ш построим гистограммную кусочно-линейную функцию. Для значений в узле ^ будем использовать плотность вероятности к-й порядковой статистики. Поскольку известны совместные плотности вероятности для порядковых статистик, используя численные операции над плотностями случайных величин, построим на сетке шу гистограммные значения ^ в узлах сетки ш4.

Рассмотрим сетку П = (1 хшу. Далее, используя гистограммы несложно в центре каждой ячейки сетки П восстановить среднее значение. Таким образом, на сетке П получаем кусочно-постоянную аппроксимацию, где Н^ — матрица значений в ячейках сетки.

Перепишем матрицу Н^ в виде списка гистограммной функции распределения , гр3), где — гистограммы, образованные значениями Н^ при фиксированном 3.

Рис. 1. Гарантированная оценка функции распределения

На рис. 1 представлена кусочно-постоянная аппроксимация гарантированной оценки эмпирической функции распределения, размерность выборки 7. Оттенками серого представлены плотности вероятности, сплошной линией показана точная функция распределения, точечная линия — математические ожидания гистограмм .

4. Гарантированные оценки функции плотности вероятности

Основным недостатком кусочно-линейных функций является невозможность вычислить от них производные и получить оценки функции плотности вероятности. Рассмотрим использование эрмитовых сглаживающих сплайнов для построения аппроксимаций функций распределения.

Пусть (£i,... , — выборка случайной величины X с функцией распределения F(t), t Е [a, Ь], сетка [xi,г = 0,1,..., N}, х0 = а, xn = b, <pi — базис в пространстве сплайнов Эрмита. Будем искать сплайн в виде

m

S(X) = X S1^(X)

1=1

с граничными условиями

s'(a) = 0, s(a) = 0, s'(b) = 0, s(b) = 1.

Для нахождения неизвестных параметров si будем использовать метод наименьших квадратов

п

£>&) - *)2 + a\W\\2 ^ min,

г=1

где а > 0 — параметр. Заметим, что построение кубического сплайна сводится к решению систем линейных алгебраических уравнений с трехдиагональной матрицей.

Рис. 2. Гарантированная оценка функции плотности вероятности

Таким образом, подобно описанному выше для точного вектора (z\,z2,... , zn) получаем оценку точности (13). Продифференцировав сплайн s, получаем аппроксимацию функции плотности вероятности и, используя плотности вероятности порядковых статистик, строим гистограмму второго порядка [6]. На рис. 2 представлена гистограмма второго порядка, приближающая треугольную плотность вероятности (точечная линия). Исходная выборка имеет размерность 7. Сплошной линией показано математическое ожидание гистограммы второго порядка.

В работе показано использование случайных интерполяционных многочленов и сплайнов для построения гарантированных оценок эмпирических функций распределения и функций плотности вероятности.

Список литературы / References

[1] Добронец Б.С. Приближения множеств решений параметрическими множествами // Журн. Сиб. федер. ун-та. Математика и физика. 2009. № 2(3). С. 305-311. Dobronets, B.S. Approximation of the sets of solutions by parametric sets // SibFU J. Mathematics & Physics. 2009. No. 2(3). P. 305-311. (In Russ.)

[2] Ш!арый С.П. Конечномерный интервальный анализ: Электронная книга. Новосибирск: ИВТ СО РАН, 2016. 617 с. Адрес доступа: http://www.nsc.ru/interval/Library/InteBooks

Shary, S.P. Finite-dimensional Interval Analysis. Novosibirsk: IVT SO RAN, 2016. 617 p. Available at: http://www.nsc.ru/interval/Library/InteBooks (In Russ.)

[3] Соболь И.М. Численные методы Монте-Карло. М.: Наука, 1973. 312 с. Sobol, I.M. Numerical Monte-Carlo methods. M.: Nauka, 1973. 312 p. (In Russ.)

[4] ШШарый С.П. Интервальный анализ или методы Монте-Карло? // Вычисл. технологии. 2007. Т. 12, № 1. С. 103-115.

Shary, S.P. Interval analysis or Monte-Carlo methods? // Comput. Technologies. 2007. Vol. 12, No. 1. P. 103-115. (In Russ.)

[5] Dobronets, B.S., Krantsevich, A.M., Krantsevich, N.M. Software implementation of numerical operations on random variables // SibFU J. Mathematics & Physics. 2013. No. 6(2). С. 168-173.

[6] Добронец Б.С., Попова О.А. Численный вероятностный анализ неопределенных данных. Красноярск: Сиб. федер. ун-т, 2014. 167 c.

Dobronets, B.S., Popova, O.A. The numerical probabilistic analysis of uncertainty data. Krasnoyarsk: Sib. Feder. Univ., 2014. 167 p. (In Russ.)

[7] Вентцель Е.С. Теория вероятностей. М.: Наука, 1969. 576 с. Wenttsel, E.S. Probability. Moscow: Nauka, 1969. 576 p. (In Russ.)

[8] Гнеденко Б.В. Курс теории вероятностей. М.: Наука, 1988. 448 с.

Gnedenko, B.V. Course of probability theory. Moscow: Nauka, 1988. 448 p. (In Russ.)

[9] Billard, L., Diday, E. Symbolic data analysis: conceptual statistics and data mining. John Wiley & Sons, 2006.

[10] Попова О.А. Гистограммы второго порядка для численного моделирования в задачах с информационной неопределенностью // Изв. Южного федер. ун-та. Техн. науки. 2014. № 6(179). С. 6-13.

Popova, O.A. Second order histogram for numerical simulation problems with information uncertainty // Izv. SFedU. Engineering Sci. 2014. No. 6(179). P. 6-13. (In Russ.)

[11] Dobronets, B.S., Popova, O.A. Numerical probabilistic analysis under aleatory and epistemic uncertainty // Reliable Computing. 2014. Vol. 19. P. 274-289.

[12] Добронец Б.С., Попова О.А. Численные операции над случайными величинами и их приложения // Журн. Сиб. федер. ун-та. Математика и физика. 2011. Т. 4, № 2. С. 229239.

Dobronets, B.S., Popova, O.A. Numerical operations on random variables and their application // SibFU J. Math. and Physics. 2011. Vol. 4, No. 2. P. 229-239. (In Russ.)

[13] Добронец Б.С., Попова О.А. Элементы численного вероятностного анализа // Вестн. Сиб. гос. аэрокосм. ун-та. им. акад. М.Ф. Решетнева. 2012. № 2(42). С. 19-23. Dobronets, B.S., Popova, O.A. Elements of a numerical probabilistic analysis // Vestn. Sib. Gos. Aerokosm. Un-ta im. Akad. M.F. Reshetneva. 2012. No. 2(42). P. 19-23. (In Russ.)

[14] Альберг Дж., Нильсон Э., Уолш Дж. Теория сплайнов и ее приложения. М.: Мир, 1972. 318 с.

Ahlberg, J.H., Nilson, E.N., Walsh, J.L. The theory of splines and their applications. New York: Acad. Press, 1967. 283 p.

[15] Дэйвид Г. Порядковые статистики. М.: Наука, 1979. 336 с.

David, H.A. Order statistics. 2rd Edition. New York: John Wiley, 1981. 360 p.

[16] Добронец Б.С., Попова О.А. Представление и обработка неопределенности на основе гистограммных функций распределения и p-boxes // Информатизация и связь. 2014. № 2. С. 23-26.

Dobronets, B.S., Popova, O.A. Representation and processing of uncertainty based on histogram distribution functions and p-boxes // Informatization and Communication. 2014. No. 2. P. 23-26. (In Russ.)

Поступила в 'редакцию 6 февраля 2017 г.

Application of numerical probabilistic analysis in interpolation problems

Popova, Olga A.

Institute of Space and Informatic Technologies SFU, Krasnoyarsk, 660041, Russia Corresponding author: Popova, Olga A. e-mail: OlgaArc@yandex.ru

The paper addresses the application of numerical probabilistic analysis for construction of function approximations under conditions of stochastic uncertainty. We introduced the definitions of random interpolation and random spline in this study. To define these concepts we use the probabilistic extensions as the base component for numerical probabilistic analysis. To construct these extensions the arithmetical operations for probability density functions of the random variables and numerical procedures for the probabilistic extensions have been applied. Lagrange interpolation polynomials and polynomial splines with input random data are discussed. To employ the numerical probabilistic analysis we propose the special class of the random Lagrange interpolating polynomials.

© ICT SB RAS, 2017

114

Q. A. Попова

We argue that our approach to uncertainty representation allows us to build reliable estimates for random functions. In the case of a random piecewise linear interpolation we assess the accuracy of the mathematical expectation and variance.

To use the numerical probabilistic analysis we proposed special class of the random cubic splines. For the construction of the random splines we solved the random system of linear algebraic equations.

Our study shows that the application of the random splines for approximation of distribution functions and probability densities and allows the reliable estimate. This approach is based on the properties of order statistics. Reliable estimates are represented as the histogram P-boxes and second order histograms.

To demonstrate our theory we use numerical examples to build the histogram P-boxes and the second order histogram. It is important to note that numerical results show the effectiveness of our techniques to small samples.

Keywords: numerical probabilistic analysis, functions of random variables, interpolation, verified bounds.

Received 6 February 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.