Научная статья на тему 'Игровые модели оптимизации траекторий перехода в гравитационном поле'

Игровые модели оптимизации траекторий перехода в гравитационном поле Текст научной статьи по специальности «Математика»

CC BY
59
41
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Новоселов В. С.

Рассматриваются следующие две игровые модели оптимальной терминальной встречи суклонением в гравитационном поле: антагонистическая игра двух участников и убегание отдвух преследователей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Game models of the optimal trajectories for the transfer in a gravitational field

Two game models of an optimal terminal evasion of the rendezvous in a gravitational field aregiven.

Текст научной работы на тему «Игровые модели оптимизации траекторий перехода в гравитационном поле»

УДК 531.1:521.2:629.78

Вестник СПбГУ. Сер. 1, 2004, вып. 4

В. С. Новоселов

ИГРОВЫЕ МОДЕЛИ ОПТИМИЗАЦИИ

ТРАЕКТОРИЙ ПЕРЕХОДА В ГРАВИТАЦИОННОМ ПОЛЕ*

1. Успехи математической теории динамических игр [1-6] позволяют решать задачи выбора оптимальных переходов с использованием методов этого нового раздела математики. Имеющиеся публикации [7-9] предполагают близкое расположение граничных орбит и линеаризацию дифференциальных уравнений относительно движения. При этом используются алгоритмы решения необходимых условий экстремума на основе рекуррентных соотношений динамического программирования [10, 11]. Решение предлагается определять с помощью многократных вычислений последовательности позиций игры. Поэтому приходится применять упрощенные формулы представления траекторий движения [12]. Разработанная автором [13] методика аналитической оптимизации импульсных переходов может служить основой для построения игровых моделей с полной информацией, для которых применение нелинейных уравнений движения в гравитационном поле [14] является существенным. Надо при этом иметь в виду, что при решении задач перехода между неблизкими орбитами, многократное включение маршевого двигателя не может быть приемлемым. В предлагаемой работе в классе импульсных оптимальных переходов исследуются две игровые модели маневрирования [15] при оптимальном уклонении от терминальной встречи в гравитационном поле. Указанные модели обсуждались в работах автора [16, 17]. Предлагаемые решения могут быть обощенны на задачи сближения при ограниченных наблюдениях [18].

2. Своеобразие оптимизации переходов в гравитационном поле заключается в импульсном характере активного изменения скорости и в использовании длительных участков баллистического полета [14]. В качестве критерия оптимизациии служит величина расхода массы топлива, что равносильно минимизации суммы характеристических скоростей. Время игры, если не решается задача непосредственного сближения, должно быть порядка наибольшего периода обращения по орбитам игроков.

Для простоты рассмотрения изучаются компланарные переходы в центральном гравитационном поле. Пусть Xi,yi, zi, —фазовые переменные г-го участника игры. Они имеют следующий смысл: x — проекция скорости на радиус-вектор, y — трансверсаль-ная проекция скорости, z — величина радиус-вектора, — полярный угол, измеряемый от некоторого неподвижного направления. Динамика игры определяется нелинейными дифференциальными уравнениями [13]

Xi = yfz-1 - s¡2z-2 + [3i cos ф, in = -XiyiZ-1 + /3 sin ф,

Zi = Xi, фi = yi z-1. (1)

Здесь /3 — реактивное ускорение, т.е. величина расхода массы в единицу времени, отнесенная к единице массы тела и умноженная на постоянную эффективную скорость истечения, ф —угол наклона тяги к радиус-вектору. Через ж2 обозначена постоянная тяготения, умноженная на массу планеты. Условимся индексом «H» отмечать величины, относящиеся к моменту времени íh начала игры, а индексом «K»—величины в момент ík окончания игры.

* Работа выполнена при финансовой поддержке РФФИ (проект 02-01-01039).

© В. С. Новоселов, 2004

До начала игры точки, представляющие участников игры, обращаются по эллиптическим орбитам, фазовые переменные на которых можно определить как решение уравнений (1) при /3 = 0 в следующем виде:

• х 1 -i

х = seep 2 sm /, y = eep2z ,

.г = p(l + ecos/)-1, (fi = f + ш, z2f = sepi. (2)

Здесь f —истинная аномалия, e,p,w — три постоянные интегрирования: эксцентриситет, фокальный параметр и долгота перицентра, измеряемая от принятого неподвижного направления. Четвертая постоянная интегрирования, например, момент времени прохождения через перицентр, вводится при вычислении квадратуры в последнем уравнении системы (2). В короткие промежутки времени работы двигателя, длительностью которых пренебрегаем, г-ая точка получает конечное изменение скорости и начинает двигаться по новой баллистической траектории, также представляемой формулой (2). Игра заканчивается при достижении сближения всех участков по конфигурационным перемещенным

z¿ (tK ) = *K, <fi(tK ) = yK, (3)

где zK и yK заранее не фиксируется.

3. В качестве первой модели рассмотрим антагонистическую игру двух участников: преследуемого (игрок 1) и преследователя (игрок 2). Предполагается, что игрок 1 имеет ограниченный энергетический ресурс

tK

J filât = d, d> 0,

tH

являющийся суммой характеристических скоростей, и полностью его расходует в процессе игры. Выигрыш второго игрока или проигрыш первого игрока имеет разную цену в зависимости от расхода массы или суммы характеристических скоростей второго игрока. Первый игрок старается эту плату увеличить, а второй игрок уменьшить. Задача свелась к отысканию

tK

Фопт = max штФ, fcdt (4)

Рг,фг /32,'ф2 J

tH

при выполнении перечисленных выше условий. Если в момент окончания игры tK не будет выполнено условие (3), то второй игрок проигрывает. Если это условие выполняется, то он выигрывает с платой (4), а первый проигрывает, вынудив второго игрока заплатить эту плату.

Пусть эксцентриситеты начальных орбит игроков малы: ei = je[, e = ¡e2, где ¡ — безразмерный положительный параметр, а положительные величины el и e'2 порядка единицы. Для определенности полагаем pi > p2. Чтобы вынудить второго игрока затратить возможно больше энергии на преследование, первый игрок должен стремиться еще выше поднять свою орбиту. Терминальное множество (3) определяется значениями конфигурационных переменных, поэтому игрок 1 выбирает конечную орбиту, все точки которой наиболее удалены от начальной орбиты игрока 2. Он переходит на предельно допустимую для него по высоте круговую орбиту радиусом tk , которая к тому же будет отвечать продолжению выполнения технологической задачи, осуществляемой на начальной почти круговой орбите.

Второй игрок должен выполнить минимальный по расходу массы одноимпульсный компланарный полет между начальной эллиптической орбитой и конечной круговой орбитой радиусом г к. Траекториями первого и второго игроков будут дуги эллиптических орбит, близких к полуэллипсам типа Гомана. Однако ввиду предполагаемой ограниченности времени игры несколькими периодами обращения игроков возникает довольно трудная задача согласования фаз движения в момент окончания игры. Поэтому применям метод малого параметра.

При ц = 0 начальные орбиты игроков будут круговыми радиусов р - и р2, переходные орбиты — полуэллипсами Гомана [13, 14]. Удовлетворим условию ограниченности ресурса первого игрока: У-0- + У-2 = !, где УЦ и У-2 —характеристические скорости нулевого приближения первого и второго импульсов игрока 1. Учитывая явное представление характеристических скоростей [13], получаем условие

а/2сг^(1 +сг)~^(1 -сг-1) + - 1 = а,

-1 -1^7

а = гкРх , а = эз р\2 а.

График зависимости а(а) построен в книге [19] на стр. 70. При значениях 0 < а < 11.94, для которых перелет Гомана сохраняет оптимальность [14, 19], функция а(а) монотонно возрастает и принятому значению с! отвечает единственная величина г к.

Обозначим через цн и ц— полярные углы г-го игрока в момент времени Ьн ив момент старта, через а,^ = + г к) — большую полуось отвечающего ему эллипса Гомана. Приравняем умноженные на ж длительность движения игрока 1 по дуге начальной орбиты от до ц—, затем по полуэллипсу Гомана с полуосью а - и по дуге конечной круговой орбиты на угол ц— — ц— до точки встречи, соответствующей длительности движения игрока 2 по начальной орбите от цн до Ц— и по полуэллипсу Гомана с полуосью а2 до встречи с игроком 1. Будем иметь

3 3 3 3 3

{ч>1 ~Ч^)Р1 +7га1 + {ч>2 = {ч>2 -Ч>2)Р2 +тга|-

Отсюда получаем

(- -\ — ( - -\ — - н - н ( -

[гк-Р2)^2 = [г к-Р! ) VI +Р 1<Р1 -Р2¥2 +к[а%-а1). (5)

Величина ц— в рассматриваемом приближении не определяется. Заметим, что в работе [16] приводится неточное выражение для ц— (в правой части отсутствует последнее слагаемое).

Для уточнения радиуса конечной орбиты г к + 1^г'к и определения величины ц— запишем выражение поправок первого порядка [16, 20] суммы характеристических скоростей игрока 1

V/ + У2" = эз гк2 ^(1 + ^е) - ^г]^ г'к - жр^ - (1 + рг^)^ е[ сов/ф.

Здесь р = 2р- гк(р 1 + гк1, е = (гк — р-)(р - + гк1 —фокальный параметр и эксцентриситет эллипса Гомана первого игрока, —истинная аномалия его точки старта.

Поскольку весь энергетический ресурс игрока 1 был отнесен к нулевому приближению, принимаем У/ + У2, = 0. В результате находим

з

г'к = гкР\ 2 Хе'н с°8 /Г!

где величина

_ л/2(а+1)§ -cri(cr + 3) 3(7+1 -^(<7+ 1)1

положительна при 0 < а < 12. Поэтому наибольшему т'к отвечает значение f- = 0. Это означает, что игрок 1 стартует в своем перицентре, т. е. р— = Радиус конечной

орбиты игрока 1 получает дополнительное приращение 2Хе'н-

Как отмечалось, нулевое приближение одноимпульсного полета игрока 2 выполняется по дуге эллипса Гомана с полуосью a2. Поправки первого порядка к характеристической скорости, эксцентриситету и фокальному параметру перелета определяются формулами работ [13, 16, 20]. Преследователь оказывается в более выгодных условиях, если величина р—, определяемая формулой (5), будет близкой к о>2. По методике работы [13] можно в явном виде найти поправки второго порядка.

4. В качестве второй модели рассмотрим задачу убегания от двух преследователей в гравитационном поле. Преследуемый (игрок 1) обращается по эллиптической орбите и находится в вилке круговых орбит двух преследователей: точки 2 на высокой орбите и точки 3 на низкой орбите, фаза движения по которой может полагаться произвольной ввиду специального запуска второго дополнительного преследователя с поверхности планеты. Преследователи кооперативно действуют как второй игрок. Для радиусов их орбит принимаем условие Г2 > 5гз.

Динамика игры определяется уравнениями (2) и терминальным множеством (3) при i = 1, 2, 3. Как и в предыдущей задаче ресурс характеристических скоростей игрока 1 предполагается ограниченным величиной d > 0, недостаточной для выхода из кольца орбит преследователей. Критерием оптимальности служит суммарный энергетический расход двух преследователей

tK

Фопт = max min Ф, Ф = / (ß2 + ß3)dt (6)

ßi/фг /32,-ф2,13з'фз J

tH

в классе двухимпульсного перехода игрока 1 на круговую орбиту с радиусом, наиболее невыгодным для преследователей, которые по минимуму общего расхода характеристических скоростей совершат одноимпульсные полеты для жесткой встречи с игроком 1. Кроме приоритетного критерия (6) игрок 1 имеет вспомогательный критерий

tK

Фопт = max Ф, Ф = d - ß\dt > 0, (7)

А.Фч J

tH

который обеспечивает ему некоторую свободу маневрирования при непосредственном подлете преследователей.

Пусть £ = rK/2, где гк величина радиуса конечной орбиты игрока 1. На основании формулы (2.1) стр.28 работы [13] сумму характеристических скоростей преследователей формулы (6) запишем в виде

ф _ „,„ 2 | f2\ — i 1 \ | — 2/1 . fr,f(„ I —

Отсюда получаем

((^2£(г2+£2)-5 -1) + £ЕГз^(1-^2£(Г3 + £2Г^. (8)

1 ¿Ф _

ж А/2 d£

= r| (r2 + rK) 2 _ г2 (r3 -I- Гк) 2 ,

При г2 = гз уравнение с№ /¿£, = 0 приводится к виду

гК - ЗГ2Г3ГК - г2гз(г2 + гз) = 0, имеет единственный положительный корень

Гк = Г23Гд/3(Г21/3 + Гд/3). (9)

Знак второй производной

(12Я> _ 3у/2Г\/2Г\ d£2 (r2+fK)3/2 Vr2+rK r3

< 0

показывает, что величина (9) отвечает максимальному значению Ф формулы (8) при

е = гК/2.

Следует проверить выполнение условия г2 > г к > гз. Непосредственно из (9) имеем гк > гз. Условие гк < с помощью (9) приводится к виду а2/3 — а1/3 — 1 > 0, а = Г2Г31. Это соотношение выполняется при а > 2 + а/5. Было принято а > 5, хотя для выполнения указанного соотношения достаточно потребовать а > 4.24. Игрок 1 выбирает в качестве конечной траектории круговую орбиту радиусом гк = гк. Чтобы максимизировать вспомогательный критерий (7) он должен согласно теории оптимальных перелетов [14] стартовать в перицентре, если конечная орбита оказывется для него внешней, или в апоцентре, если указанная орбита будет внутренней.

Примем за начало отсчета углов луч, проведенный из притягивающего центра в точку старта игрока 1. Расстояние этой точки до центра планеты обозначаем т\. Начало игры Ьн счтается совпадающим с моментом старта игрока 1. Для определения углового положения точки старта первого преследователя (точки 2), как и в предыдущей задаче, приравняем умноженные на ж время движения игрока 1 по полуэллипсу типа Гомана с полуосью ах = ^(г 1 + г к) и по дуге конечной круговой орбиты на угол —соответственно суммарному времени движения точки 2 по ее начальной круговой орбите на угол — и по полуэллипсу Гомана с полуосью а,2 = \{г2 +гк). В результате будем

иметь з _ 3 _ 3 3

+ гй = - )г22 + тта22.

Поэтому получаем

2

+ Waf-aJ). (10)

Выражение (10) переходит в формулу (5), если в последней положить = 0,рн = 0, далее p2 заменить на и гк на r к, а также поменять знаки на обратные. Второй преследователь (точка 3) выбирает начальную фазу такой, чтобы в момент окончания игры tK оказаться в финишной точке (Гк, ук), где рк = + п, и чтобы эта точка совпала с апоцентром его переходного эллипса [14]. В работе [17] решалась задача окончания игры после нескольких предварительных обращений первого преследователя на первоначальной орбите.

Summary

V. S. Novoselov. Game models of the optimal trajectories for the transfer in a gravitational field.

Two game models of an optimal terminal evasion of the rendezvous in a gravitational field are given.

1

Литература

1. Красовский Н. Н. Игровые задачи встречи движений. М., 1970.

2. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М., 1974.

3. Петросян Л. А. Дифференциальные игры преследования. Л., 1977.

4. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М., 1978.

5. Петросян Л. А., Томский Г. В. Динамические игры и их приложения. Л., 1982.

6. Малафеев О. Л. О существовании обощенного значения динамической игры // Вестн. Ленингр. ун-та. 1972. № 19. С. 41-46.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Тынянский Н. Т., Жуковский В. И. Дифференциальные игры с ненулевой суммой (бес-коалиационный вариант) // Математический анализ (Итоги науки и техники). 1977. №15. С. 199-267.

8. Тынянский Н. Т., Жуковский В. И. Дифференциальные игры с ненулевой суммой (кооперативный вариант // Математический анализ (Итоги науки и техники). 1979. №19. С. 3-112.

9. Левченков А. Ю., Пашков А. Г., Терехов С. Д. Дифференциальные игры сближения двух динамических объектов с одним. Институт проблем механики АН СССР. Препринт №256. М., 1985.

10. Малафеев О. А. Ситуация равновесия в динамических играх // Кибернетика. 1974. №3. С. 111-118.

11. Беллман Р. Динамическое программирование. М., 1960.

12. Барсегян В. Р., Малафеев О. А. Об игровых задачах в центральном ньютоновском поле тяготения // Проблемы теории игр в общих системах. Межв. сб. научн. трудов. Якутск. 1988. С. 51-56.

13. Новоселов В. С. Аналитическая теория оптимизации в гравитационных полях. Л., 1972.

14. Охоцимский Д. Е., Сихарулидзе Ю. Г. Основы механики космического полета. М., 1990.

15. Баринов К.Н., Бурдаев М.Н., Мамон П. А. Динамика и принципы построения орбитальных систем космических аппаратов. М., 1975.

16. Новоселов В. С. Модель антагонистической игры в гравитационном поле // Математические методы оптимизации и управления в системах. Калинин. 1987. С. 10-25.

17. Новоселов В. С. Модель оптимизации убегания от двух преследователей в гравитационном поле // Динамика систем управления. Вопросы мех. и проц. управления. Л., 1989. Вып. 11. С. 7-10.

18. Новоселов В. С. Оптимизация кратковременно наблюдаемых орбит при слабом и импульсном паритетном управлении // Вестн. С.-Петербург. ун-та. Сер. 1. 2002. Вып. 1 (№1). С. 76-83.

19. Эскобал П. Методы астродинамики. М., 1971.

20. Новоселов В. С. Анализ возмущенных оптимальных орбит на основе фундаментального решения // Анализ и синтез систем управления. Вопросы мех. и проц. управления. Л., 1987. Вып. 10. С. 119-126.

Статья поступила в редакцию 11 марта 2004 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.