УДК 519.213
О ПРИБЛИЖЕНИИ СЛУЧАЙНЫХ ВЕЛИЧИН Р.С. Исмагилов
МГТУ им. Н.Э. Баумана, Москва, Российская Федерация e-mail: [email protected]
Работа посвящена наилучшей аппроксимации случайной величины с помощью некоторого набора случайных величин. Весьма употребительна аппроксимация посредством линейных комбинаций упомянутого набора. В настоящей статье этот прием несколько расширен с использованием также полиномиальных функций элементов этого набора. Если степени полиномов произвольны, то это приводит к аппроксимации посредством условного математического ожидания случайной величины относительно этого набора. Описаны линейные пространства случайных величин, в которых указанные методы аппроксимации приводят к одному и тому же результату.
Ключевые слова: случайная величина, аппроксимация, условное математическое ожидание, характеристическая функция, распределение.
ON APPROXIMATION OF RANDOM VARIABLES R.S. Ismagilov
Bauman Moscow State Technical University, Moscow, Russian Federation e-mail: [email protected]
The article deals with the best approximation of a random variable by a set of random variables. Approximation by means of linear combinations of the above set is rather common. In the article this approach is extended to use of polynomial functions of this set elements. If degrees of polynomials are arbitrary then it results in approximation by means of a conditional mathematical expectation of a random variable concerning this set. Linear spaces of random variables are described in which the specified methods of approximation result in the same result.
Keywords: random variable, approximation, conditional mathematical expectation, characteristic function, distribution.
Введение. Постановка задачи. Рассмотрим пространство с мерой (X, P) и соответствующее гильбертово пространство L2(X). Пусть даны функции f, f 1, • • • , fm. Простейший вариант классической задачи теории приближений состоит в наилучшей аппроксимации функции f линейной комбинацией функций f,i = 1, • • • , m. Здесь затронуты только приближения в гильбертовом пространстве; с общими принципами теории приближений можно ознакомиться, например, в работах [1-3]. Более специальным вопросам теории посвящены книги [4, 5]. Современное состояние теории освещено в работе [6]. Очевидное решение указанной простейшей задачи — это проекция функции f на линейную оболочку набора f, i = 1, • • • , m; условимся обозначать эту проекцию через proj(f |f 1, • • • , fm).
Рассмотрим следующий, более общий "механизм" приближения. Будем считать, что эти функции имеют конечные Lp нормы для всех
р > 1. Для аппроксимации функции f используем не только линейные комбинации функций = 1, ••• , т, но и произвольные функции, полученные как многочлены от функции /¿, г = 1, • • • , т. Более точно, зафиксируем целое число к, возьмем множество Рк, состоящее из всевозможных многочленов от т переменных с комплексными коэффициентами, имеющих степень < к (по совокупности переменных); рассмотрим величину йк ^) = т£ Ц/ — p(fl, ••• , ^)||,р £ Рк. Примем также ) = Ш ||f — p(fl, • • • , /т)|,Р £ ^Рк. Таким образом, здесь р пробегает совокупность всех многочленов от т переменных (произвольной степени). Ясно, что
в результате приходим к бесконечной цепочке приближений функции f (включая "финальное" приближение, приводящее к величине )). Возможно, рассмотрение этой цепочки для конкретных классов функций окажется интересным. Сделаем лишь скромный шаг в этом направлении: изучим условия, при которых все величины, указанные в (1), совпадают; другими словами, перечисленные способы аппроксимации не дают преимущества по сравнению с аппроксимацией посредством линейных комбинаций функций. (Читатель, возможно, сочтет, что случаи совпадения всех величин из формулы (1) отчасти "дискредитируют" указанные методы аппроксимации; однако анализ такой ситуации является достаточно содержательной задачей.)
Изложим точную постановку задачи. Начиная с этого места предположим, что указанная выше мера Р является вероятностной, т.е. Р (X) = 1. Будем пользоваться языком и традиционными обозначениями теории вероятностей (нам понадобятся лишь скромные сведения из этой теории; их можно почерпнуть из книг [7-10]). Таким образом, указанные выше функции f, f 1, • • • , fт — это случайные величины, имеющие конечные Ьр-нормы для всех р > 1. Наша цель — выяснить условия, при которых все величины йк^), к = 1, 2, • • • , и ) совпадают. Это условие равносильно тому, что
Изучим правую часть равенства (2). Для этого рассмотрим случайную величину М^• • • , — условное математическое ожидание случайной величины f относительно случайных величин г = = 1, ••• ,т. Напомним, что величину М ^ ••• , можно записать в виде • • • , и для любой случайной величины вида М/ь • • • ,1'т) выполняется равенство М(#(/ь • • • , ^Ж/ь • • • , = = М ••• здесь — борелевские функции. Оно озна-
чает, что М ^ ••• , есть проекция случайной величины f на
di(/) >•••> М/),
(1)
di(/) = М/).
(2)
замыкание линейного пространства всех случайных величин вида К/ 1, ••• , /т)) с конечной ¿2-нормой (Ь,(/\, ••• ,/т) — борелевская функция). Итак, правая часть равенства (2) — это расстояние между вектором / и указанным подпространством, а функция, на которой достигается это расстояние, — упомянутое условное математическое ожидание.
Левая часть равенства (2) — расстояние между вектором / и линейной оболочкой набора /1, ••• ,/т; это подпространство является частью подпространства, о котором только что шла речь. Следовательно, равенство (2) равносильно равенству
М (/1/1, ••• ,/т ) = РТ,(/1/1, ••• ,/т). (3)
Изучим случаи, когда равенство (3) имеет место. Целесообразно несколько расширить задачу, поставив ее следующим образом.
Задача. Охарактеризовать все конечномерные подпространства Ь с Ь2 (X), такие что выполняется равенство (3) для любых линейно независимых наборов /, /1, • • • , /т, взятых из подпространства Ь.
Отметим, что в таких подпространствах аналогичное условие также выполняется для линейно зависимых наборов /, /1, • • • , /т, поэтому можно исключить требование линейной независимости из формулировки задачи.
Решение задачи. Изложение результата. Прежде чем приступить к решению поставленной задачи, отметим один общеизвестный класс подпространств с указанным в ней свойством. Таковыми являются подпространства, полученные как линейная оболочка гауссова набора случайных величин, имеющих нулевые математические ожидания [8, 9].
В следующих двух теоремах описаны все подпространства с указанным свойством (и тем самым, дано решение поставленной выше задачи). Для описания подпространств указаны базисы в них; таким образом, решение свелось к характеризации базисов, которая особенно проста для случая ортонормированных базисов (теорема 1). Случай, когда базис не предполагается ортонормированным, рассмотрен в теореме 2.
Теорема 1. Пусть дано конечномерное подпространство ЬсЬ2(X) с ортонормированным базисом ,к = 1, ••• ,п. Тогда равносильны следующие условия:
1) для любого линейно независимого набора {/г, г = 1, • • • ,п} из подпространства Ь выполняется равенство
М (// ••• ,/п )= рта,ЯМ/2, ••• ,/п); (4)
2) распределение случайного вектора • • • , £п) инвариантно относительно любого ортогонального преобразования пространства И"
(т.е. Р((&, • • • ,£п) € Е) = Р((£ь • • • ,&) € Б(Е)) для любого боре-левского множества Е и любого ортогонального преобразования Б, действующего в пространстве И")/
п
3) характеристическая функция М(ехр(г ^ ¿к)) представима в
_ к=1
виде з(\/¿2 + • • • ¿П) (8 — функция одной переменной).
В теореме 1 использован ортонормированный базис в подпространстве Ь. В теореме 2 рассмотрено линейное пространство Ь случайных величин, в котором фиксирован произвольный базис , к = 1, • • • , п, в Ь (возможно, не ортонормированный). Рассмотрим квадратичную форму • • • , ¿п) = М(| ¿к^к|2) и характеристическую функ-
1<к<п п
цию Р(¿1, • • • ,^п) = м(ехр(^ ¿к^к)).
к=1
Теорема 2. Равносильны следующие условия:
1) для любого линейно независимого набора {/,г = 1, • • • , п} из пространства Ь выполняется равенство (4)/
2) характеристическая функция Р (¿1, • • • , ¿п) представима в виде
• • • , ¿п)), где 8 — функция одной переменной. Отметим, что теорема 2 следует из теоремы 1. Действительно, набор , к = 1, • • • , п, получается из ортонормированного набора с помощью линейного невырожденного преобразования. При этом аргумент £ = (¿1, • • • , ¿п) функций Ц и Р подвергается сопряженному линейному преобразованию, применяя которое к функциям, указанным в условии 3 теоремы 1, приходим к заключению теоремы 2.
Переходя к доказательству теоремы 1, начнем с простых фактов из теории вероятностей. Примем М(^1|^2, • • • , £п) = А(£2, • • • ,£п). Лемма. Справедливо равенство
д^/д^О, ¿2, ••• ,^п) = ¿М(А(6, ••• ,?п)ехр(г ^ ¿к ^к )) (5)
2<к<п
для всех ¿к.
Действительно, левая часть равенства (5) есть
гМ(6 ехЦ г ^ ¿к6)) .
2<к<п
Из приведенных выше свойств условного математического ожидания получаем, что эта величина совпадает с правой частью равенства (5). Лемма доказана. ►
Докажем теорему 1. Начнем с доказательства равносильности условий 2 и 3. При ортогональном преобразовании случайного вектора
(£ъ ••• ,£п) характеристическая функция М( ехр(г ^ £к)) подвер-
^ к=1 '
гается обратному преобразованию переменных. Поэтому инвариантность распределения указанного вектора равносильна инвариантности характеристической функции, а последнее равносильно тому, что эта функция представима в виде функции величины у/+ • • • Этим доказана равносильность условий 2 и 3 теоремы 1.
Докажем равносильность условий 1 и 2 теоремы 1. Пусть выполнено условие 1 теоремы 1. Применим это условие, взяв в качестве набора {/г, г = 1, • • • ,п} набор {£ь • • • , £п). Тогда правая часть равенства (4) равна нулю, откуда М (£11£>, ••• ,£п) = А(&, ••• ,£п) = 0. Из равенства (5) получаем, что дГ/дЬ1(0,12, ••• ,Ьп) = 0 для всех Ь2, • • • ,Ьп. Это равенство можно истолковать так: производная функции Г (¿1, • • • ,Ьп) вдоль вектора (1, 0, • • • , 0) равна нулю в любой точке вида (0,Ь2, ••• ,Ьп). Отметим, что указанные векторы (1, 0, ••• , 0) и (0,Ь2, ••• ,Ьп) ортогональны. Повторим это рассуждение, заменив набор {£1 ,£2, ••• ,£п} набором {С£1,А£2, ••• ,й£п}, где й — произвольная ортогональная матрица. Получим следующее: производная функции Г (¿ь ••• ,Ьп) вдоль произвольного вектора е равна нулю в любой точке х, такой что векторы е и х ортогональны. Возьмем произвольную кривую о ^ х(о),о е (0,1), такую что |х(о)| = т для фиксированного т. Тогда касательный вектор х'(о) ортогонален к х(о) и, согласно предыдущему выводу, производная функции вдоль вектора х'(о) равна нулю. Следовательно, функция Г(¿ь • • • ,Ьп) постоянна на указанной кривой. Таким образом, функция Г (¿1, ••• ,1п) = Г (¿) постоянна на любой сфере |£| = т. Тем самым, она зависит только от |£|, т.е. выполнено условие 3, а поэтому и равносильное условие 2. Доказано, что из условия 1 теоремы следует условие 2.
Пусть теперь выполнено условие 2 теоремы 1. Тогда выполнено и равносильное ему условие 3. Отсюда дГ/дЬ1(0,12, • • • ,Ьп) = 0 для всех Ь2, • • • ,Ьп. Таким образом, обе части равенства (5) равны нулю. Но правая часть есть преобразование меры Фурье - Стилтьеса, полученной умножением функции А(х2, • • • ,хп) на меру, задающую распределение случайного вектора {£2, ••• ,£п}. По теореме единственности для преобразования Фурье-Стилтьеса в Ип, определяем, что А(£2, ••• ,£п) = 0, т.е. М (£1|£2, ••• ,£п) = 0. Повторив изложенное для набора, полученного из набора (£^ £2, • • • ,£п) ортогональным преобразованием (условие 2 остается в силе и для этого набора), запишем следующее: если {^}, 1 < г < т — произвольная ортонормирован-ная система, то М (^1|^2, ••• ,уг) = 0. Этим доказано первое утверждение теоремы для ортонормированных наборов случайных величин. Чтобы доказать его для любой линейно независимой системы
{fi, i = 1, • • • , n}, заменим ее ортонормированным набором, полученным известным процессом ортогонализации, в котором первый вектор пропорционален вектору fl . Дальнейшие рассуждения вполне очевидны. Теорема доказана.
Замечания и выводы. Доказанная теорема также позволяет указать простейшие ортонормированные наборы случайных величин, таких, что в линейной оболочке этого набора наилучшая аппроксимация элемента при помощи линейных комбинаций заданных элементов совпадает с аппроксимацией посредством условного математического ожидания. Чтобы сформировать такой набор следует взять случайную точку, равномерно распределенную на n-мерной единичной сфере, и набор координат этой точки. Добавим, что характеристическая функция данного набора выражается через функции Бесселя. Согласно теореме, любой ортонормированный набор случайных величин, обладающий описанным свойством, получается как "смесь" описанных простейших наборов.
Работа выполнена при поддержке гранта РФФИ 11-01-00790а.
ЛИТЕРАТУРА
1. Axиезер Н.И.Лекции ио теории аппроксимации. М.: Наука, 1965. 408 с.
2. Колмогоров A.H., Фомин C.B. Элементы теории функций и функционального анализа. М.: Наука, 1972. 496 с.
3. Рисс Ф., Секефалъви-Надъ Б. Лекции ио функциональному анализу; иер. с венгерского. М.: Мир, 1979. 587 с.
4. Тихомиров В.М. Некоторые вопросы теории приближений. М.: Изд-во Московского Университета, 1976. 304 с.
5. Уолш Дж.Л. Интерполяция и аппроксимация рациональными функциями в комплексной области. М.: Изд-во иностранной литературы, 1961. 508 с.
6. Теория приближений. Международная конференция. Санкт-Петербург. 6-8 мая 2010г. Тезисы докладов. СПб: ММИ им. Л.Эйлера, ВВМ, 2010. 148 с.
7. Гихман И.И., Скороход A.B. Теория случайных процессов. Т. 1. М.: Наука, 1971. 665 с.
8. Гнеденко Б.В. Курс теории вероятностей М.: Наука, 1988. 448 с.
9. Ибрагимов ИЛ., Розанов ЮЛ. Гауссовские случайные процессы. М.: Наука, 1970. 384 с.
10. Ширяев A.H.Bероятность. М.: Наука, 1976. 640 с. REFERENCES
[1] Akhiezer N.I. Lektsii po teorii approksimatsii [Lectures on the theory of approximation]. Moscow, Nauka Publ., 1965. 408 p.
[2] Kolmogorov A.N., Fomin S.V. Elementy teorii funktsiy i funktsional'nogo analiza [Elements of the theory of functions and functional analysis]. Moscow, Nauka Publ., 1972. 496 p.
[3] Riesz F., Szokefalvi-Nagy B. Lecons d'Analyse Fontionelle. Budapest, Akademiai Kiado. 1952. (Russ. Ed.: Riss F., Sekefal'vi-Nad' B. Lektsii po funktsional'nomu analizu. Moscow, Mir Publ., 1979. 587 p. Eng. Ed.: Riss F., Sekefalvi-Nad' B. Functional analysis. New York, Ungar Publ., 1955).
[4] Tikhomirov V.M. Nekotorye voprosy teorii priblizheniy [Some problems in approximation theory]. Moscow, MGU Publ., 1976. 304 p.
[5] Walsh J.L. Interpolation and Approximation by Rational Functions in the Complex Domain. Paperback (Print). 3rd Ed. American Mathematical Society Puibl., 1935. 406 p. (Russ. Ed.: Uolsh Dzh L. Interpolyatsiya i approksimatsiya ratsional'nymi funktsiyami v kompleksnoy oblasti Moscow, Inostrannaya Lit. Publ., 1961. 508 p.).
[6] Teoriya priblizheniy [Approximation Theory]. SPb, Collect. Rep. Abstr., Int. Conf. of Euler Int. Math. Inst., VVM Publ., 2010. 148 p.
[7] Gikhman I.I., Skorokhod A.V. Teoriya sluchaynykh protsessov [The theory of stochastic processes]. Moscow, Nauka Publ., Vol. 1, 1971. 665 p.
[8] Gnedenko B.V. Kurs teorii veroyatnostey [Course on probability theory]. Moscow, Nauka Publ., 1988. 448 p.
[9] Ibragimov I.A., Rozanov Yu.A. Gaussovskie sluchaynye protsessy [Gaussian stochastic processes]. Moscow, Nauka Publ., 1970. 384 p.
[10] Shiryaev A.N. Veroyatnost' [The probability]. Moscow, Nauka Publ., 1976. 640 p.
Статья поступила в редакцию 20.01.2014
Раис Сальманович Исмагилов — д-р физ.-мат. наук, профессор кафедры "Высшая математика" МГТУ им. Н.Э. Баумана. Автор 60 научных работ в области функционального анализа.
МГТУ им. Н.Э. Баумана, Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5.
R.S. Ismagilov — Dr. Sci. (Phys.-Math.), professor of "Higher Mathematics" department of the Bauman Moscow State Technical University. Author 60 publications in the field of functional analysis.
Bauman Moscow State Technical University, Vtoraya Baumanskaya ul. 5, Moscow, 105005 Russian Federation.