Научная статья на тему 'Простое доказательство теоремы Маркова в обобщенной проблеме моментов'

Простое доказательство теоремы Маркова в обобщенной проблеме моментов Текст научной статьи по специальности «Математика»

CC BY
422
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОБЛЕМА МОМЕНТОВ / ТЕОРЕМА МАРКОВА / MOMENT PROBLEM / MARKOV THEOREM

Аннотация научной статьи по математике, автор научной работы — Мирошин Роман Николаевич

Проблема моментов заключается в отыскании границ некоторого интеграла по известным обобщенным моментам неотрицательной неизвестной функции, входящей множителем в подынтегральную функцию. Эти границы определяются по теореме А. А. Маркова. Приведенное в статье новое доказательство теоремы Маркова основано на процедуре решения так называемой изопериметрической задачи вариационного исчисления с помощью множителей Лагранжа, что позволило существенно доказательство сократить. Три примера иллюстрируют логику рассуждений. Библиогр. 9 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The simple proof of Markov theorem in the field of generalized moment proble

Present-day proof of classical Markov theorem dealing with both upper and low bounds of integrals is a very complicated one owing to large volume of preliminary knowledge. From the point of view of exploiting this theorem for the sphere of application in mechanics it is desirable for the proof to be easily available. In this paper the proof is based on the solution on an isoperimetrical variational problem with Lagrange factors. Necessary conditions of extremum of integral (Euler's equations) are zeroes of generalized polynomials with coefficients being Lagrange factors. These factors are eliminated with Cramer's rule of linear algebraic equations system. As a consequence the difference of initial integral and its extremal value is obtained. The elementary analysis of this difference makes it possible to select both the maximum and minimum of integral. The theorem is illustrated with examples.

Текст научной работы на тему «Простое доказательство теоремы Маркова в обобщенной проблеме моментов»

Сер. 10. 2009. Вып. 1

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

УДК 517.5 Р. Н. Мирошин

ПРОСТОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ МАРКОВА В ОБОБЩЕННОЙ ПРОБЛЕМЕ МОМЕНТОВ

Обобщенной проблемой моментов в одномерном варианте на конечном интервале [а, Ь] называется задача определения неубывающей функции Г(г) по п ее обобщенным моментам [1-3]

а = I щ(г)ЗГ(г), г = 0,1,...,п. (1)

•У а

В (1) интеграл понимается в смысле Стилтьеса, [а,Ь] - конечный интервал на вещественной оси, {по(г),..., пп(г)} - вещественные непрерывные в [а, Ь] функции, обладающие тем свойством, что обобщенный полином

п

Р (г) = ^ ащ(г) (2)

¿=0

имеет в [а, Ь] не более п корней. Это свойство (линейная независимость функций {п0(г),...,пп(г)}) справедливо тогда и только тогда, когда отличен от нуля определитель (выписываем только его ]-тую строку)

Д = ёе! \\по(1з), п^з),..., пп(гз )\Щ=о (3)

при любых го,г\,...,гп в интервале [а, Ь], среди которых нет равных [1-3]. Последовательность {по(г), ...,пп(г)} называется чебышевской системой функций. Не теряя общности, можно положить для чебышевской системы [1,2]

Д > о при а <го <г\ < ... <гп < ь, (4)

чем мы будем далее существенно пользоваться.

Проблеме моментов посвящено большое количество работ. По-видимому, наиболее полный ее исторический обзор приведен в [3]. С открытием обобщенных функций стало возможным в ее формулировке отказаться от интегралов Стилтьеса. Мы приступили к этой работе в монографиях [4, 5], имеющих своим предметом так называемую теорию локального взаимодействия, позволяющую полуэмпирическими методами вычислять силы и моменты, действующие на движущееся в сплошной среде тело. Обнаруженная нами связь этой теории с проблемой моментов дала возможность понять ее хорошее совпадение с экспериментом в ряде сплошных сред и открыла адекватный математический аппарат для решения актуальных механических задач. В частности, развеялся

Мирошин Роман Николаевич — доктор физико-математических наук, профессор кафедры гидроаэромеханики математико-механического факультета Санкт-Петербургского государственного университета. Количество опубликованных работ: 168. Научные направления: нелинейная динамика, механика сплошных сред, случайные процессы. E-mail: [email protected].

© Р. Н. Мирошин, 2009

туман загадочности, окутывающий хорошее совпадение с реальностью умозрительной формулы И. Ньютона для давления на поверхности выпуклого тела при гиперзвуковом его обтекании [6]. Таким образом, сфера применимости метода моментов расширилась на многие задачи механики сплошных сред. В многомерных задачах использовался метод моментов в связке с методом разделения переменных в проблеме отражения атомов разреженного газа от твердой поверхности [7]. Отметим также, что без доказательства основные идеи метода моментов на основе перехода к обобщенным функциям изложены в учебнике [8]. В настоящей статье с целью приблизить этот метод к быстрейшему усвоению студентами-механиками мы упрощаем доказательство центральной его теоремы (теоремы Маркова), которая излагается в середине монографий [1, 2] после хотя и интересных, но без которых можно обойтись, сведений о свойствах полиномов (2).

В переводе на современный язык А. А. Марков решал следующую задачу: требуется определить минимальное и максимальное значения (по Маркову, «предельные значения интеграла») функционала

I = Г п(г)/(г)л (5)

а

по заданным обобщенным моментам неизвестной неотрицательной функции /(г)

Сг = щ(г)/(г) ¿г, г = 0,1,...,п, (6)

а

где {иг(г)}П=0 - чебышевская система непрерывных в [а,Ь] функций, /(г) - обобщенная функция, а непрерывная в [а,Ь] функция 0,(г) такова, что определитель

Б = Б(г0,г1, ...,гп,г)= det\\п0(г^ ),щ(г^),.. .,пп(г^), Щ+ (7)

положителен при а ^ г0 <г1 < ■ ■■ < гп+1 ^ Ь.

Сформулированная задача - частный случай известной в вариационном исчислении изопериметрической задачи. Она решается отысканием функции /(г) = /е(г), для которой достигается экстремум вспомогательного функционала

. = I + (8)

где Хг — множители Лагранжа.

Используя (5), (6), функционал (8) запишем в виде

Л = \ Хгиг(г)] /(г)Л- (9)

■'а г=0

Очевидно, если по методу Эйлера представляем /(г) в виде

/е(г) + а ■ 5/(г),

где /е(г) - искомая функция, доставляющая экстремум а 5/(г) - ее вариация, то необходимое условие экстремума (уравнение Эйлера) примет вид

п

п(г) + ^ Ьщ(г) = о, (10)

г=0

а экстремальное значение вспомогательного функционала вследствие (10) равно нулю, т. е. по (8)

п

1е = (П)

¿=0

Индексом е здесь и далее отмечаем экстремальные значения.

В силу неотрицательности Б, уравнение (10) имеет не более (п + 1)-го вещественного корня. Поэтому(дабы избежать обращения в тождественный нуль функционала .) функции /е(г) следует искать среди тех, которые обращаются в нуль вне корней (10) и которые в корнях дают особенность типа источника, например среди функций типа

п

т = ]т а з(1 - ц), (12)

3 = 0

где - корни уравнения (10), а А3 таковы, что /е^) > 0. Назовем (12) пред-

ставлением /(¿). Взяв корнями произвольную последовательность чисел ¿о < ¿1 < < ••• < ¿п в [а, Ь], множители Лагранжа определяем, в силу (10), из системы линейных (относительно X¿) уравнений

п

) + Х) ^¿(¿3) = 0, 3 =0,1,...,п,

¿=0

по правилу Крамера [9, с. 192], т. е.

1

Д

(-)п-3+1

ёе1 \ \по&),..., и 3-1 (¿¿),пз+1^),..., Чп^г), ^¿¿)\\п=0. (13)

Д

(Определитель Д задан формулой (3); в силу (4), он положителен.) Исключая Хг в (10) по формулам (13), полагая в (7) ¿п+1 = * и раскладывая определитель Б по элементам последней строки, находим, что из (10) следует

п1 - ^ А^СО = - ^£(¿0, • • • (14)

¿=о

В силу (11) и (14),

р Ь р ь 1 р ь

1е= <,,..., (15)

•У а Л а ^ Л а

поскольку правая часть (11) получается интегрированием (14) с весом /(¿) в интервале [а, Ь]. В левой части (15) имеем функционал 1е, который является экстремальным, а в правой первое слагаемое есть функционал I для любой весовой функции /(¿), т. е.

1 Гь

Д

Осталось теперь оценить разность I—1е сверху и снизу. Определитель Б (¿о, ...,Ьп,Ь) положителен при а ^ ¿о < ••• < ¿п <Ь ^ Ь. Это обобщенный полином по ¿, имеющий своими нулями ¿о,...,гп,в промежутках между которыми он сохраняет знак. Нули ¿о,...^п

выбраны в представлении (12) произвольно. Если теперь сближать их так, чтобы длины интервалов, в которых Б отрицателен, т. е. длины интервалов ^п-1^п), ^п-3^п-2),..., стремились к нулю, полином Б(Ьо,.. .^п,Ь) окажется положительным, поскольку его слившиеся нули будут касаниями полиномом оси абсцисс сверху (гладкими, если существует производная в точке касания у полинома), и мы для такого представления (когда сливаются Ьп-\ с Ьп, Ьп-з с Ьп-2 и т. д.) получим неравенство

I > 1е. (16)

Эти представления называются [1, 2] нижними главными представлениями. На них I достигает минимума.

Если же сближать Ьп с Ь, Ьп-2 с Ьп-\ и т. д., т. е. аннулировать длины интервалов, в которых полином Б положителен, то для такого представления вместо (16) получим противоположное неравенство:

I < 1е.

Представления с указанными t¿ называются [1, 2] верхними главными представлениями (для них Ьп = Ь). Такие представления обеспечивают максимум функционалу I.

Осталось построить нижнее и верхнее главные представления. Общая их форма выглядит следующим образом [1, 2]:

т

Ш = - и), (17)

¿=0

где A¿ называются весами, t¿ - узлами, т ^ п.

Приходится отдельно рассматривать случаи четного п = 2у и нечетного п = 2у +1,

V = 0,1,...[1, 2].

При четном п = 2у интервалы отрицательности Б в представлении (12) суть (а^о), ^1^2), ^3^4), ..., (t2v ,t2v),

т. е. при стремлении длин этих интервалов к нулю узлами окажутся только точки а^1^з,...^2^-1, так что нижнее главное представление примет вид (17) с т = V. Подставив (17) в (6) и воспользовавшись определением ¿-функции

л ь ( / (х), а < х <Ь,

/ /(г)5^ - х)Л = I /(а)/2, х = а, (18)

Л I /(Ь)/2, х = Ь,

находим, что узлы и веса определяются системой алгебраических уравнений

V

Аоио/2 + Аз Щ ) = еА, г = 0,1,..., 2v,

3 = 1

которых столько же, сколько неизвестных, т. е. 2v +1.

Интервалы же положительности Б при п = 2v в представлении (12) суть

(^1), ^2^3), ..., ^2и-2^2и-1), (t2v ,Ь),

так что верхнее главное представление при г2г ^ г2г+1 запишется в виде (17) с т = V +1. Веса Лу и узлы Ьу отыскиваются из системы уравнений

УА пг{Ьу) + Лр щ(Ь) = сг, г = 0,1,..., 2v,

3 = 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

которых опять столько, сколько неизвестных (2v + 1).

В случае нечетного п = 2v +1 аналогичные рассуждения приводят для нижнего главного представления к формуле (17) с т = V, причем все узлы лежат внутри интервала (а, Ь) и вместе с весами находятся из системы уравнений

V

^Лу ) = сг, г = 0,1,...,2v +1. (19)

3=0

Уравнений (19) ровно столько же, сколько и неизвестных, т. е. 2v + 2. Для верхнего главного представления при п = 2v +1 в формуле (19) в число узлов попадают оба конца интервала [а, Ь], а веса и остальные узлы определяются в процессе решения системы уравнений

V

ЛоПг(а)/2 + ^2 Лу ) +Лv+lпi(Ь)/2 = сг, г = 0,1,...,2v +1. (20)

3 = 1

Уравнений и неизвестных и в (20) одинаковое количество, а именно, 2v + 2.

Таким образом, сравнительно просто доказывается теорема А. А. Маркова: верхняя и нижняя граница функционала (5) при заданных обобщенных .моментах (6) по чебышевской системе функций с положительным определителем (4) достигаются соответственно на верхнем и нижнем главных представлениях вида (17) при условии (7).

Методическое преимущество изложенного способа доказательства перед традиционным [1, 2] в том, что главные представления определяются естественным путем в процессе доказательства, а в традиционном сначала вводятся эти понятия, а потом, через много-много страниц, терпеливый читатель узнает, чем они полезны.

Продемонстрируем путь доказательства на примерах и рассмотрим п = 0,1, 2 (часто в механике этими моментами и ограничиваются, т. е. массой, статическими моментами и моментами инерции).

П р и м е р 1. Найдем экстремальные значения функционала (5) при единственном известном моменте со. По условию

А = по(и) > 0, Б(го,г) = по(го№г) -п(г)П(и) > 0, го <г. (21)

Вспомогательный функционал (9) с множителем Лагранжа Ао примет вид

з = I [П(г) +Аопо(г)]/(г)вг,

^ а

а уравнение Эйлера (10)

п(г) + Аопо(г) = 0.

Оно, в силу (21), может иметь не более одного вещественного корня. Исключаем множитель Лагранжа, считая корнем произвольное число ¿о из интервала [а, Ь]:

0(1о)

ио(Ьо)

В силу (11), экстремальное значение исходного функционала равно

/е = -с0А0 = I (22)

К ио^о)

где ](¿) - любая допустимая условиями теоремы Маркова функция. Так как из (21) следует, что

= (23)

ио(ъ) ио(г)

то, заменяя под интегралом в (22) 0^о) по формуле (23), имеем

/е = [Ь - — Г £>(*„, *)/(*)<**. (24)

■¡а ио(^о) ]а

Поскольку ио^о) = А по (21), формула (24) совпадает с (15) в частном случае п = 0.

Очевидно, > 0 при £ > ¿о, в силу (21), и Б(1о,1) < 0 при £ < ¿о. Поэтому,

когда ¿о = а, справедливо неравенство I е ^ I(нижнее главное представление), а когда ¿о = Ь, то 1е ^ I (верхнее главное представление). Верхнее представление задается формулой ¡+(1) = Ао6(Ь — ¿), причем узел Ао определяется, если подставить ее в со: ио(Ь)Ао/2 = со, - а нижнее главное представление ищется в виде = Аоб^ — а),

где ио(а)Ао/2 = со. В итоге по теореме Маркова

0(а) Г 0(Ь)

ио(а) а ио(Ь)

что очевидно, так как, в силу (21), 0(1)/ио^) - возрастающая функция.

П р и м е р 2. Пусть п = 1, т. е. задано два момента со,с1, а ищутся экстремальные значения интеграла (5) при условиях

А = ёе1 \\ио(1з),и(Ц)||1=о > 0, Б(1оММ)=&е1 \\ио(1з), 0(1^)||2=о > 0, (25) где а ^ ¿о < ¿1 < ¿2 ^ Ь. Вспомогательный функционал (8), (9) имеет вид

1 = I + со\о + с1\1 = I [П(г) +\оио(г) +\1щ(г)]/(г)¿г,

а

а уравнение Эйлера (10)

0(1) + Хоио^) + Х^^^) = 0.

Корней этого уравнения, в силу (25), не более двух. Обозначим их и выразим

множители Лагранжа Хо, Х1 через них по правилу Крамера, решив систему линейных алгебраических уравнений

0(1) + Хоио(¿) + Х1 и^) = 0, 0(1) + Хоио(¿) + Хщ^) = 0,

что дает

Ао = Ао/А, А1 = А1/А,

где Ао = \\п1(гу), П(уу, А! = - \\по(3), П(1у)||!=о.

Теперь заменим множители Лагранжа Аг в формуле (11) 1е = -Аосо — А!С! и, раскладывая второй определитель в (25) по элементам последней строки

в(го, г!, г) = по(г)Ао — п^А! + п(г)А, находим, что справедливо равенство (15):

1 гь

Ie = I--J (26)

Так как ,г!,г) > 0 в интервалах г € (г!, Ь) и г € (а,го), из (26) видим, что I ^ 1е, если го ^ г!, т. е. нижнее главное представление задается формулой ¡-(г) = Лоб (г — го), причем а < го < Ь. Узел го и вес Ло определяются однозначно из уравнений Лопо(го) = со, ЛоП!(го) = с!. Аналогичным образом, 1е ^ I на верхнем главном представлении, когда узлами оказываются концы интервала [а, Ь], т. е. ¡+(г) = Лоб (г — а) + а! б(Ь — г), где Ло и Л1 находятся из системы линейных уравнений

Лопо(а) + Л!П!(а) = 2со, Лопо(Ь) + Л!П!(Ь) = 2с!, решая которую получаем

д^ _ 2[с0М1(6) - с1и1(а)} ^ _ 2[с\ир(а) - с0и0(Ъ)] по(а)п!(Ь) — по(Ь)п!(а) ' по(а)п!(Ь) — по(Ь)п!(а)

Знаменатели в (27) положительны по свойству (4) чебышевской системы {по(г),п!(г)}, а чтобы ¡+(г) была неотрицательной, необходимы условия

соп!(Ь) — с!п!(а) ^ 0, с!по(а) — сопо(Ь) ^ 0. (28)

Условия (28) обеспечивают [1, 2] возможность произвольной паре чисел со,с быть моментами некоторой неотрицательной функции ](г) по чебышевской системе {по(г),п!(г)} в интервале [а,Ь].

Вычисляя теперь интеграл 1е на верхнем и нижнем главных представлениях с указанными выше узлами и весами и с использованием (18), по теореме Маркова имеем следующие границы для интеграла I:

с0 < ^ < [с0М1(6) - С1Ц1(а)]П(а) + [с1М0(а) - с0и0(Ь)]П(Ь) по(го) по(а)п!(Ь) — по(Ь)п!(а)

ПримерЗ. Пусть п = 2, т. е. заданы три обобщенных момента со, с!, с2, а нужно найти пределы для интеграла (5). В этом случае V =1 и при а ^ го <г! <г2 <г% ^ Ь предполагаем, что

А = det Цпо^у),пг3о > 0, Б^оммм) = Цпо(гз),п!(гу),п2(гу),^о > 0. (29)

Вспомогательный функционал (8), (9) имеет вид

2 , b

J = I + CiXi = Mt)+\ouo(t)+\1u1(t)+\2U2(t)]f (t)dt,

i=0 a

а уравнение Эйлера (10)

Q(t) + Xouo(t) + X1u1(t) + X2U2(t) = 0.

Так как корней этого последнего уравнения, в силу (7), не более трех, обозначим их to,ti,t2 и выразим множители Лагранжа Xi через них по правилу Крамера из системы трех линейных алгебраических уравнений

Q(ti) + Xouo(ti) + Xiui(ti) + X2u2(ti) =0, i = 0,1, 2.

После несложных выкладок, аналогичных примеру 2, находим экстремальное значение Ie функционала I:

1 rb

Ie = I--r / D{t0MM,t)f(t)dt. (30)

•J a

Слева в (30) - интеграл, легко вычисляемый по представлению f e(t) в виде (17), а справа - интегралы по любой функции f (t) ^ 0. Максимальное и минимальное значения правой части зависят от значения ее второго интеграла. Именно, в интервалах t е (t2,b] и t е (to, t1), в силу (29), D > 0, а в интервалах t G [a, to) и t G (t1,t2) соответственно D < 0. Поэтому, уменьшая длину интервалов предельным переходом ti ti+i, находим, что Ie ^ I при to = a, ti — t2, т. е. нижнее главное представление имеет вид

f-(t) = AoS(t - a)+AiS(t - ti), (31)

а верхнее главное представление, в силу Ie ^ I при to — ti, t2 = b, соответственно

f+(t)= AoS(t - ti)+AiS(b -1). (32)

Для узла ti и весов ao,Ai получаем систему трех уравнений (отличающихся для верхнего и нижнего главных представлений), если подставить (31) и (32) в интегральное представление (6) обобщенных моментов co, ci, C2 и взять интегралы, воспользовавшись (18). Границы для функционала (5) найдутся по теореме Маркова (из-за громоздкости соответствующих формул мы их не приводим).

Summary

Miroshin R. N. The simple proof of Markov theorem in the field of generalized moment problem.

Present-day proof of classical Markov theorem dealing with both upper and low bounds of integrals is a very complicated one owing to large volume of preliminary knowledge. From the point of view of exploiting this theorem for the sphere of application in mechanics it is desirable for the proof to be easily available. In this paper the proof is based on the solution on an isoperimetrical variational problem with Lagrange factors. Necessary conditions of extremum of integral (Euler's equations) are zeroes of generalized polynomials with coefficients being Lagrange factors. These factors are eliminated with Cramer's rule of linear algebraic equations system. As a consequence the difference of initial integral and its extremal value is obtained. The elementary analysis of this difference makes it possible to select both the maximum and minimum of integral. The theorem is illustrated with examples.

Key words: moment problem, Markov theorem.

Литература

1. Крейн М. Г., Нудельман А. А. Проблема моментов Маркова и экстремальные задачи. Идеи и проблемы П. Л. Чебышева и А. А. Маркова и их дальнейшее развитие. М.: Наука, 1973. 551 с.

2. Карлин С., Стадден В. Чебышевские системы и их применение в анализе и статистике. М.: Наука, 1976. 568 с.

3. Гродзенский С. Я. Андрей Андреевич Марков. 1856-1922. М.: Наука, 1987. 256 с.

4. Мирошин Р. Н., Халидов И. А. Теория локального взаимодействия. Л.: Изд-во Ленингр. ун-та, 1991. 276 с.

5. Мирошин Р. Н., Халидов И. А. Локальные методы в механике сплошных сред. СПб.: Изд-во С.-Петерб. ун-та, 2002. 304 с.

6. Мирошин Р. Н. Асимптотика по малому углу атаки коэффициента реакции осесим-метричного тела в теории локального взаимодействия // Аэродинамика: Сб. статей / Ред. Р. Н. Мирошин. СПб.: Изд-во НИИ химии С.-Петерб. ун-та, 2002. С. 120-129.

7. Мирошин Р. Н. О построении моделей функции рассеяния атомов газа поверхностью по коэффициентам обмена // Аэродинамика: Сб. статей / Ред. Р. Н. Мирошин. СПб.: Изд-во ВВМ, 2004. С. 114-125.

8. Мирошин Р. Н. Случайные процессы и поля. СПб.: Изд-во НИИ химии С.-Петерб. ун-та, 2003. 284 с.

9. Бронштейн И. Н., Семендяев К. А. Справочник по математике. М.: Наука; Лейпциг: Тойнбер, 1981. 718 с.

Статья рекомендована к печати проф. Е. И. Веремеем. Статья принята к печати 7 октября 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.