УДК 517.925, 521.135
H. Б. Мельников
ЛОКАЛИЗАЦИЯ НЕВЫРОЖДЕННЫХ БИФУРКАЦИЙ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ ОГРАНИЧЕННОЙ ЗАДАЧИ ТРЕХ ТЕЛ1
(кафедра оптимального управления факультета ВМиК)
Введение. Ограниченная задача трех тел (ОЗТТ) описывает движение тела пренебрежимо малой массы под действием ньютоновского притяжения двух других тел с массами 1 - д и д. С математической точки зрения ОЗТТ представляет интерес как простейший неинтегрируемый случай общей задачи п тел (см. [1, 2]).
Периодическими в ОЗТТ называют такие движения, при которых расстояния между телами периодически изменяются во времени. Ранее периодические решения ОЗТТ и их особенности изучались лишь для отдельных значений массового параметра ¡1 (см., например, [3, 4]). При ¡1 6 (0,1) возникает двухпараметрическое семейство периодических решений [5].
В работе сформулированы и доказаны условия, позволяющие локализовать бифуркации двухпа-раметрического семейства периодических решений. Полученные условия конструктивны: они используют последовательность краевых задач для уравнений в вариациях исходной системы. Этот подход позволил недавно значительно продвинуться в изучении колебаний спутника при его движении по эллиптической орбите [6]. Как отмечено в работе [6], локализация периодических решений, в которых происходят бифуркации, стандартными численными методами ньютоновского типа невозможна. Поэтому большинство авторов используют для этой цели приближенные методы (например, экстраполяцию).
Изложение построено следующим образом. От системы уравнений движения (п. 1) мы переходим к отображению Пуанкаре (п. 2). В п. 3 исследованы складки и сборки Уитни [7] множества неподвижных точек отображения Пуанкаре (им отвечают два основных механизма потери устойчивости). В п. 4 полученные результаты уточняются с учетом симметрии ОЗТТ. В п. 5 мы возвращаемся к исходной системе: условия, позволяющие локализовать складки и сборки, здесь выражены через решения уравнений в вариациях уравнений движения. Там же (п. 5) кратко обсуждаются возможные обобщения полученных результатов на случай общих гамильтоновых систем двух и полутора степеней свободы, зависящих от параметра.
I. Уравнения движения. Рассматривается плоская круговая ОЗТТ: орбиты двух массивных тел круговые, третье тело нулевой массы движется в плоскости их орбит. Уравнения движения во вращающейся (синодической) системе координат при стандартных соглашениях относительно нормировки переменных записываются в виде (см., например, [2])
х = 2у + £}х, у=-2х + £}у, (1)
ЩХ-,У) = \{х<1 +У2) + ~Г~ + г = \/(ж + /")2 + У2> р= л/{х -1 + ¡л)2 + у2.
Система (1) имеет первый интеграл — константу Якоби:
К = 2П(х,у)~ (¿2 + у2) (2)
и инвариантна относительно преобразования симметрии
(ж, у, X, у, г, ц) ^ (ж, -у, -х, у, -г, ц). (3)
2. Отображение Пуанкаре. Перейдем от фазового потока гамильтоновой системы в четырехмерном фазовом пространстве к двумерному отображению при помощи стандартной процедуры (см.,
1 Работа поддержана РФФИ, проект № 02-01-01067.
например, [1]). Каждое решение системы (1) в фазовом пространстве М4(ж, х, у, у) принадлежит трехмерной поверхности уровня константы Якоби (2). В окрестности неравновесного периодического решения системы (1) рассмотрим сечение этой трехмерной поверхности некоторой гиперповерхностью, трансверсальной потоку. Обозначим через Ф отображение фазовым потоком получившегося двумерного сечения в себя — отображение Пуанкаре системы (1).
Следуя [4], возьмем в качестве сечения гиперплоскость {у = 0}. Если выразить у из соотношения (2) с учетом у = 0, то Ф становится функцией координат (ж, х) и двух параметров К и ц. При заданных значениях параметров К 6 ( — оо, оо) и ¡1 6 (0,1) переменные (х,х) принимают значения в области Е:
2 , 2(1-д) 2fl
+ I , I + 1-Т-П > К-
\х + щ \х — 1 + щ
Поскольку система (1) гамильтонова (в пространстве координат и импульсов), нетрудно показать, что преобразование Ф(х,х,К, ц) сохраняет площади: det(£)(,,, ¿)Ф) = 1.
Периодическому решению системы (1) однозначно соответствует неподвижная точка отображения Пуанкаре:
X = Ф(Х,К,ц), X=(x,i)T. (4)
При этом периодическое решение изоэнергетически устойчиво тогда и только тогда, когда линейно устойчива соответствующая неподвижная точка. Линейная устойчивость определяется значением следа Тг матрицы монодромии неподвижная точка устойчива, когда |Тг| < 2, и неустойчива,
когда |Тг| > 2. Равенство задает границу областей неустойчивости на плоскости параметров (К,р). Периодические решения, для которых выполнено Тг = 2, назовем резонансными (первого порядка).
В работе ограничимся простыми периодическими решениями, которые отвечают неподвижным точкам (4). Кроме них существуют g-кратные периодические решения, которым отвечают неподвижные точки X = Фд(Х, К, fj,) итерированного отображения Ф. Для анализа бифуркаций д-кратных периодических решений необходимо рассмотреть резонансные периодические решения порядка q: Тг = 2 cos(2irp/q). При q > 2 они принадлежат области устойчивости |Тг| < 2 отображения Ф.
Множество всех неподвижных точек, в которых система (4) имеет полный ранг, обозначим М.. В силу аналитической зависимости решений системы (1) от начальных данных и параметра, вне притягивающих центров (—д, 0) и (1 — д,0), имеет место следующее утверждение.
Лемма. Множество М. С S X R X (0,1) является аналитическим подмногообразием, dim Л4 = 2.
Определение. Будем говорить, что условие типа равенства или неравенства выполнено в точке общего положения многообразия ЛЛ, если существует некоторое открытое, всюду плотное подмножество Л4о С М., в каждой точке которого выполнено данное условие.
3. Особенности проектирования. Обозначим через тг проектор (х,х,К,р) > (К,р).
Теорема 1. Особенность типа складки относительно отображения тг имеет место в точке общего положения многообразия ЛЛ тогда и только тогда, когда Тг^^ ^Ф) = 2.
Доказательство. Точками складки многообразия М. относительно отображения 7Г по определению называются те точки, в которых вырождается дифференциал (Ы. Это в свою очередь эквивалентно тому, что достигается условный экстремум К —у extr, fj, = const, или fj, —> extr, К = const.
Пусть для определенности fj, = const и s — произвольный параметр на кривой у(ц) = М. П П {¡1 = const}. Тогда, ограничивая (4) на получаем тождество X(s) = Ф(X(s), К(s), р), X(s) =
= (ж(в), i(s))T. Выделим в нем линейную часть:
dx „ ж
-T = DX Ф
as
В случае общего положения X' ф 0 (здесь и далее ' = d/ds). Отсюда следует, что К' = 0 тогда и только тогда, когда (Dx& — 1)Х' = 0, т.е. существует ненулевой собственный вектор дифференциала отвечающий собственному значению А = 1. Последнее в силу Det(i?x^) = 1 дает Тг(1?хФ) = 2.
'dX' " dK
. ds _ + . ds _
Замечание 1. В том случае, когда сечение у (pi) вырождается в точку: = 0, необходимо
рассмотреть у (К) = ЛЛ П {К = const}. Точки, где = 0 и И^Ф = 0, не принадлежат множеству
ЛЛ: в них падает ранг системы (1).
Обозначим через Т складку многообразия ЛЛ при проектировании 7Г.
Теорема 2. Особенность типа сборки относительно проектирования тг имеет место в точке общего положения многообразия ЛЛ тогда и только тогда, когда в этой точке сверх Тг^^^Ф) = 2 вырождены гессианы компонент отображения Пуанкаре: Det(.D^, ^ 0, i = 1,2, и выполнено
одно из условий: d [Тг(£)(а,^)Ф)] /dx = 0 или d [Тг(£)(а,^)Ф)] /dx = 0.
Доказательство. Сборка (X*,/i'*, д*) £ ЛЛ — это точка вырожденного экстремума К —у extr, ц = const или fj, —т- extr, К = const на ЛЛ. Фиксируем для определенности ¡1 = на ЛЛ. Тогда K'(s*) = 0 — условие экстремума K(s) вдоль кривой у(ц*) = ЛЛ П {// = //*}, параметризованной s, а коллинеарность векторов (X'(s*), K'(s*)) и (X"(s*), K"(s*)) — условие вырожденности экстремума. Вместе эти условия эквивалентны тому, что K'(s*) = K"(s*) = 0 и векторы X'(s*) и X"(s*) коллинеарны. Иначе говоря, в пределе при ¡1 —У происходит слияние двух последовательных невырожденных экстремумов (X (s\), К (si)) и (Х(в2), K(s2)) — максимума и минимума кривой у (д) и на их месте возникает точка перегиба (Х*,К*) = (X(s*), K(s*)) кривой у(//*). Следовательно, локально кривая 7(/i*) имеет вид кубической параболы:
dX(s„
X(s)=X(s*) +
ds
-(s - s*) + . .
K(s) = K(s*) +
1 d3K(s*)
s s*
+
3! ds3
В точке сборки (X*, .К*,//*) достигается максимум (минимум) обоих параметров К и ¡1 одновременно. Поэтому в окрестности сборки складка Т может быть параметризована одной из переменных (ж, ж) так, что выполнено одно из двух условий: d [Тг^^^Ф)] /йх = 0 или d [Тг^^^Ф)] /йх = 0. Кроме того, локально складка Т проектируется в прямой угол на плоскости ограниченный
прямыми, параллельными осям координат, так что точка (Х*,.К*,//*) проектируется в вершину угла. Получившаяся кривая тг(З-) имеет полукубическую точку возврата в окрестности (.К*,//*). Тангенс угла наклона полукасательной к тт(З-) в этой точке равен
dK dfi
dФ, dfi
dФ, dK
-l
(г = 1,2).
Теперь докажем неравенства для гессианов в точке сборки. Приравнивая нулю квадратичную часть выражения Х(й) — Ф (X (в), К (в), /л*) в точке 5 = 5*, получаем
D\Ф
dX
ds
dX
ds
+2D\KS
dX
ds
dK
ds
+ Db Ф
dK
ds
dK
ds
+ (DxФ - I)
d2X
ds2
+ DK Ф
d2K
ds2
= 0.
Отсюда вытекает, что К' = К" = 0, что в случае общего положения эквивалентно
'й2Х'
(ВХФ - I)
dX' 'dX' ~dX~
= о, D\Ф
ds ds ds
+ (£>ХФ - /)
ds2
= 0.
Но Х'(в*) || Х"(в*), и в случае общего положения X' ф 0, следовательно, Т)2ХФ[Х'][Х'] = 0. Таким образом, собственные значения матриц имеют разные знаки: ^ 0, г = 1,2.
4. Учет симметрии. Отдельно рассмотрим подмножество S С ЛЛ периодических решений, инвариантных относительно симметрии (3), его дополнение ЛЛ\Б обозначим через Л.
Однопараметрические семейства S П {// = const} симметричных периодических решений называются характеристиками. Поскольку 5c{i = 0}, характеристики целиком лежат в плоскости (ж,К). Бифуркации характеристик при ¡1 = 0,5 были исследованы в работе [4]. Это ответвления асимметричных периодических решений и экстремумы константы Якоби. Последнее означает, что характеристика не продолжается дальше экстремального значения константы Якоби. Нетрудно убедиться, что результаты [4] остаются верными при любом фиксированном значении параметра из интервала ¡1 £ (0,1).
Случаи ¡1 = 0 и ¡1 = 1 требуют специального рассмотрения из-за так называемых решений-отрезков, содержащих точки парных соударений г = 0и/) = 0 (см. [5, 8]).
Уточним условия складки и сборки теорем 1 и 2 в случае симметричных периодических решений. Для этого соотношение (4) запишем в виде
/(ж, х, К, ц) - х = fxАх + fiАх + ...,
д(х, х, К, ц) - х = дхАх + д^Ах + ... . (5)
Непосредственно проверяется, что в точках многообразия S выполнено равенство fx = дх. Следовательно, при ограничении на S условие Тг = 2 на след матрицы монодромии эквивалентно fx=gx = ±1 и fxgx = 0. При этом в точках общего положения функции fx и дх не обращаются в ноль одновременно.
Теорема 3. В точке общего положения многообразия S имеет место:
• складка относительно отображения тг тогда и только тогда, когда дх = 0;
• сборка относительно отображения тг тогда и только тогда, когда дх = 0 и дхх = 0 (fxx = О,
9хх = 0).
Доказательство. Анализ линейной части соотношений (5) при ¡1 = const показывает [4], что дх = 0 отвечает экстремуму константы Якоби, fx = 0 — пересечению семейств симметричных и асимметричных периодических решений.
Действительно, в случае общего положения кривая у(д) = М. П {// = const} имеет касательную, которая с учетом принятых обозначений (5) задается системой
(fx - 1 )dx + fj. dx + Sk dK = 0,
9x dx + (gx - 1) dx + gK dK = 0. (6)
В точке пересечения y{pi) П {x = 0} в силу симметрии (3) система (6) эквивалентна
(fx - 1 )dx + Sk dK = 0, fi dx = 0,
gx dx + gK dK = 0, (gx - 1) dx = 0.
Здесь возможны два случая.
1. Кривая y{pi) трансверсально пересекает плоскость х = 0. Тогда dx ф 0 в точке пересечения и, следовательно, fx = 0, дх = 1 из уравнений (6). Это означает, что кривая у(д) принадлежит многообразию Л. Точке пересечения у {pi) с плоскостью х = 0 отвечает симметричная орбита, в которой у(р) ответвляется от некоторой характеристики из множества S. В случае общего положения у(д) пересекает плоскость х = 0 под прямым углом.
2. Касательная (6) целиком лежит в плоскости dx = 0. Тогда в общем положении у(д) является характеристикой некоторого семейства симметричных орбит: у(д) С S. Поэтому дх = 0 равносильно тому, что рассматриваемая точка является точкой складки: fx = gx = 1.
Условия сборки теоремы 2 в симметричном случае заметно упрощаются. Поскольку каждая характеристика y{pi) = S П {¡1 = const} принадлежит {х = 0}, можем параметризовать ее переменной х в точках складки. Поэтому условие d [Тг^^^Ф)] /dx = 0 теоремы 2 с учетом fx = д± равносильно fxx = gxi = 0. При этом в силу D"^-д[Х'][Х'] = 0, где X' || (1, 0), обращается в ноль и дхх.
Замечание 2. Каждая простая периодическая орбита, инвариантная относительно симметрии (3), пересекает ось абсцисс под прямым углом ровно в двух точках, отстоящих на полпериода друг от друга. Поэтому в случае симметричных орбит вместо отображения за период достаточно рассмотреть отображение за полпериода [5]. Здесь сечение, отображаемое фазовым потоком, определяется соотношениями у = 0, х = 0. В результате получаем отображение Ф(х,К,р) на прямой, зависящее от параметров. Если обозначить
то, как нетрудно видеть,
fx = gx = AD + ВС, U = 2 BD, дх = 2 АС.
С учетом AD — ВС = 1 отсюда следует, что fx = 1, fx = 0 (fx = 1, дх = 0) в случае общего положения равносильно В = О (С = 0).
Замечание 3. На плоскости (х,К) могут существовать изолированные особенности дх = О, дк = 0 характеристик у(д) = <5 П{д = const}. В зависимости от знака гауссовой кривизны многообразия S особенность может быть эллиптического или гиперболического типа (ср. [6]).
Следствие. Складка относительно отображения тг в точке общего положения многообразия Л имеет место тогда и только тогда, когда fx-\-gx = 2. Сборка относительно отображения тг в точке общего положения многообразия Л имеет место тогда и только тогда, когда
(fix + 9хх)9х ~ {fхх + Яхх) - 1) = 0. (7)
Доказательство. В случае общего положения dx ф 0 и dx = —((«fa — 1) dx + дк dK)/gx, так что проекция ф(х, К) = /(ж(ж, К), ж, К) — ж(ж, К) = 0 кривой у(д) = Л П {// = const} на (ж, К) может быть параметризована ж. Тогда условие складки
dip dx
fx + gi-2 f (fx-1)
- + [ fk - дк
дх
дх
dK
dx
= 0
дает fx + gx = 2. Условие сборки d ф/dx = 0 равносильно (7)
5. Уравнения в вариациях. Условия теорем 1, 2 и следствия конструктивны, поскольку все участвующие в их формулировках производные отображения Пуанкаре Ф(х,х,К, ц) по переменным и параметрам представимы решениями уравнений в вариациях системы (1).
Уравнения в вариациях системы (1) первого порядка по начальным данным (ж(0), ж(0), у(0), у(0)) имеют вид
|=2 г) + + &хуг], т) = —2^ + + ЫууГ]. (8)
Обозначим
/6 б б ел б б б и
т V 2 т т
\т Ь т т)
фундаментальную матрицу системы первого порядка, отвечающей уравнениям (8) (аргумент £ для краткости здесь и далее опускаем). Пусть Ь(0) = I.
Теорема 4. Коэффициенты матрицы монодромии отображения Пуанкаре (4) имеют вид
L =
(9)
'6 + ^4 6-^4
где (£í,t]í) — базисные решения (9) уравнений в вариациях (8), вычисленные на решении системы (1) с начальными данными (жо, ¿о> 0, уо) такими, что К = 2Í7° — (¿q + и Í70 = Г2(жо, 0).
Доказательство. Фиксируем решение (ж (t), x(t), y(t), y(t)) системы (1) с начальными данными (жо, ¿о, 0, уо). Значения линейных возмущений (Аж, Ах, Ау, Ау) в момент t связаны с возмущениями начальных данных (Джо, Джо, Ayo, Ayo) в момент t = 0 при помощи фундаментальной матрицы (9):
/Ах\ /6 6 6 ц /Аж0\
Ах éi 6 6 L Аж0
А у Vi V2 V3 V4 Ayo
\АУ/
(10)
\Ау0/
Поскольку константа Якоби (2)
\т Ь т т/
первый интеграл системы (1), имеем Ду0 = (QxAx0 - х0Ах0)/у0.
Пусть £ — момент первого пересечения с гиперповерхностью у = 0. Тогда, подставляя последнюю формулу в (10), получим необходимое выражение для матрицы монодромии
Аналогичным образом из уравнений в вариациях более высокого порядка находятся старшие производные отображения Пуанкаре.
В заключение отметим, что утверждения теорем 1 и 2 не зависят существенным образом от специфики ОЗТТ и остаются справедливыми для гамильтоновой системы общего положения двух или полутора степеней свободы, зависящей от одного параметра. Для системы с двумя степенями свободы необходимо рассмотреть преобразование фазовым потоком автономной системы двумерного сечения изоэнергетической поверхности, как в настоящей работе. В случае системы полутора степеней свободы, как, например, в уравнении колебаний спутника при движении по эллиптической орбите [6], необходимо рассмотреть преобразование за период двумерного фазового пространства системы с периодическими коэффициентами.
Автор благодарен В. Ф. Борисову, Ф. П. Васильеву и М.И. Зеликину за полезное обсуждение.
СПИСОК ЛИТЕРАТУРЫ
1. Siegel С. L., M ose г J. К. Lectures on celestial mechanics. Berlin: Springer, 1971.
2. Арнольд В.И., Козлов В.В., Нейштадт А. И. Математические аспекты классической и небесной механики. Динамические системы // Итоги науки и техн. Совр. пробл. матем. Фундам. напр. М.: ВИНИТИ, 1985. 3. С. 5-304.
3. Hénon M. Exploration numérique du problème restrient. II: Masses égales, stabilité des orbites périodiques // Ann. Astrophys. 1965. 28. N 6. P. 992-1007.
4. Hénon M., Guyot M. Stability of periodic orbits in the restricted problem // Period. Orbits, Stability and Resonances, G.E.O. Dordrecht: Reidel, 1970. P. 349-374.
5. Мельников H. Б. Особенности 2£)-многообразия периодических решений ограниченной задачи трех тел // Тезисы докладов ААНЗ-2004. Екатеринбург: УрО РАН, 2003. С. 199-200.
6. Varin V. P. Degeneracies of periodic solutions to the Beletsky equation // Regular and Chaotic Dynamics. 2000. 5. N 3. P. 313-328.
7. Whitney H. On singularities of mappings of Euclidean spaces. I: Mappings of the plane into the plane / / Ann. Math. 1955. 62. P. 374-410.
8. Мельников H. Б. Сингулярные возмущения однократных порождающих орбит ограниченной задачи трех тел // Нелинейная динамика и управление. Вып. 4. М.: Физматгиз, 2004. С. 295-308.
Поступила в редакцию 09.04.04
УДК 517.977.58
Д. В. Камзолкин
МЕТОД ПРИБЛИЖЕННОГО ВЫЧИСЛЕНИЯ ФУНКЦИИ ЦЕНЫ
ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМ
ФУНКЦИОНАЛОМ
(кафедра оптимального управления факультета ВМиК)
1. Постановка задачи. Рассматривается управляемая система, описываемая обыкновенным дифференциальным уравнением
ж = /(ж,и) (1)
на отрезке времени [¿о,Т], где Т — фиксированный момент времени, х 6 Я" — фазовая переменная, и 6 Яр — управление. В начальный момент времени ¿о считается заданным начальное условие
ж(£0) = жо 6 Д".