Научная статья на тему 'Численное решение одной дифференциальной игры качества в четырехмерном фазовом пространстве'

Численное решение одной дифференциальной игры качества в четырехмерном фазовом пространстве Текст научной статьи по специальности «Математика»

CC BY
134
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ФАЗОВОЕ ПРОСТРАНСТВО / ФАЗОВЫЕ ТРАЕКТОРИИ / ФАЗОВЫЕ КООРДИНАТЫ / ЧИСЛЕННОЕ РЕШЕНИЕ / БАРЬЕР / ТЕРМИНАЛЬНАЯ ПОВЕРХНОСТЬ / СИСТЕМА ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / DIFFERENTIAL GAME OF QUALITY / PHASE SPACE / PHASE TRAJECTORIES / PHASE COORDINATES / NUMERICAL METHOD / BARRIER / TERMINAL SURFACE / SYSTEM OF THE ORDINARY DIFFERENTIAL EQUATIONS / OPTIMUM CONTROL

Аннотация научной статьи по математике, автор научной работы — Блинова Е.С.

Рассмотрена дифференциальная игра в четырехмерном фазовом пространстве применительно к задаче об избежании столкновения двух автомобилей, предложенной Р. Айзексом. В отличие от более ранних вариантов, настоящее решение получено численно с использованием ЭВМ для случая, когда на уклоняющегося игрока действуют переменные в процессе игры силы: нормальная и тангенциальная к траектории. Использование квадратичных зависимостей нормальной и тангенциальной сил от скорости уклоняющегося игрока позволило разработать аппарат синтеза критерия оптимальности уклонения летательного аппарата. Достоверность полученных результатов подтверждена сравнением с известными аналитическим и численным данными игровых задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A differential game in four-dimensional phase space has been overlooked with respect to the problem of avoiding a collision between two vehicles, proposed by R. Isaacs. Unlike earlier versions, the present solution is obtained numerically using a computer for the case when the evader is influenced by the game variables: the normal and tangential to the trajectory forces. Use of square dependences of normal and tangential forces from the speed of the evading player allowed to develop the math procedures of criterion synthesis for an optimality of evasion of the aircraft. Reliability of the results is confirmed by comparison with the already known analytical and numerical data on game problems.

Текст научной работы на тему «Численное решение одной дифференциальной игры качества в четырехмерном фазовом пространстве»

СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ В КОСМИЧЕСКОЙ ОТРАСЛИ

ЧИСЛЕННОЕ РЕШЕНИЕ ОДНОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЫ КАЧЕСТВА В ЧЕТЫРЕХМЕРНОМ ФАЗОВОМ ПРОСТРАНСТВЕ

Е С. БЛИНОВА, асп. ФЭСТМГУЛ

ekaterina4likhacheva@gmail.com ФГБОУ ВПО «Московский государственный университет леса» (МГУЛ) Россия, 141005, Московская область, г. Мытищи, ул. 1-я Институтская, д.1

Рассмотрена дифференциальная игра в четырехмерном фазовом пространстве применительно к задаче об избежании столкновения двух автомобилей, предложенной Р. Айзексом. В отличие от более ранних вариантов, настоящее решение получено численно с использованием ЭВМ для случая, когда на уклоняющегося игрока действуют переменные в процессе игры силы: нормальная и тангенциальная к траектории. Использование квадратичных зависимостей нормальной и тангенциальной сил от скорости уклоняющегося игрока позволило разработать аппарат синтеза критерия оптимальности уклонения летательного аппарата. Достоверность полученных результатов подтверждена сравнением с известными аналитическим и численным данными игровых задач.

Ключевые слова: дифференциальная игра, фазовое пространство, фазовые траектории, фазовые координаты, численное решение, барьер, терминальная поверхность, система обыкновенных дифференциальных уравнений, оптимальное управление.

На современном этапе развития аэрокосмической отрасли важной и актуальной проблемой разработки сложных технических систем является синтез рациональных критериев эффективности, что во многом может определить судьбу проекта. В работе рассматривается научная задача об использовании аппарата дифференциальных игр качества для разработки упомянутых критериев. Представлена конфликтная ситуация, связанная со столкновением двух летательных аппаратов (в модельном случае - игра двух автомобилей) применительно к оптимальному уклонению в атмосфере Земли (рис. 1). Задача решается численно в 4-мерном фазовом пространстве, где скорость одного из игроков переменна.

Традиционно под дифференциальной игрой понимается конфликтная ситуация, которая может быть описана системой обыкновенных дифференциальных уравнений. В работе традиционный подход Айзекса, создателя теории дифференциальных игр, развивается применительно к задаче об оптимальном уклонении.

Рассмотрим движение игроков Р (перехватчик) и Е (уклоняющийся от столкновения игрок), пренебрегая силой тяжести. Скорость игрока Е переменна, и он движется под действием нормальной и тангенциальной сил, которые в общем случае зависят от величины w Игрок Р стремится минимизировать расстояние РЕ, а игрок Е - его максимизировать (рис. 1).

Целью решения настоящей дифференциальной игры стало построение барьера (границы зоны захвата и зоны избежания захвата) в четырехмерном фазовом пространстве, который разделяет области гарантированного уклонения и гарантированного захвата.

Объектом исследования стало движение двух игроков на плоскости в системе координат, связанной с одним из них.

Предметом работы является зависимость уклонения минимзирующего игрока от определяющих параметров задачи (начальная скорость, коэффициенты нормальной и тангенциальной сил).

Инструмент исследования - написанная автором данной статьи программа (на языке Fortran) численного решения дифференциальной игры качества в 4-мерном фазовом пространстве (система обыкновенных дифференциальных уравнений характеристик, дополненная основным уравнением платы).

Задачами исследования, необходимыми для достижения поставленной цели, стали:

1. Отработка постановки задачи дифференциальной игры качества в четырехмерном фазовом пространстве как развитие соответствующей 3-мерной игры двух автомобилей, предложенной Р. Айзексом.

2. Выбор численного метода решения дифференциальной игры; описание особенностей алгоритма решения и программной реализации для использования ЭВМ.

ЛЕСНОЙ ВЕСТНИК 3/2015

13

системный анализ, управление и обработка информации в космической отрасли

3. Верификация (тестирование, проверка) расчетной схемы и программы расчета на известных аналитических решениях.

4. Параметрические исследования и их обобщение в виде графиков зависимостей

Рис. 2. Схематизация дифференциальной игры в системе координат, связанной с минимизирующим игроком Fig. 2. The scheme of a differential game in a system of coordinates connected with the minimizing player

потерь скорости и динамики области перехвата, а также иллюстрация результатов расчета в виде поверхности барьера.

Результаты работы изложены на научно-технической конференции профессорско-преподавательского состава и аспирантов МГУЛ по итогам научно-исследовательской деятельности за 2012 г.

Постановка задачи для численного решения дифференциальной игры в четырехмерном фазовом пространстве

В качестве модельной выберем задачу о столкновении двух автомобилей. Игроки Р и Е движутся на плоскости, скорость каждого из них фиксирована (или ограничена), кривизна траекторий ограничена. Захват происходит при условии, что расстояние между двумя игроками становится меньше определенной наперед заданной величины l. Схема выбора геометрических координат представлена на рис. 1.

Минимизирующий игрок на автомобиле Р стремится столкнуться с игроком Е. Максимизирующий игрок Е стремится избежать столкновения. Настоящая дифференциальная игра была решена аналитически Айзексом в 3-мерном фазовом пространстве координат х, у, 9.

14

ЛЕСНОЙ ВЕСТНИК 3/2015

системный анализ, управление и обработка информации в космической отрасли

Система обыкновенных дифференциальных уравнений, описывающая «игру двух автомобилей» в трехмерном фазовом пространстве, предложенная Р. Айзексом, дополнена уравнением изменения скорости уклоняющегося игрока Е при квадратичной зависимости от его скорости тангенциальной и нормальной сил = -kC(2)wl и переписана с учетом зависимостей нормальной и тангенциальной сил

R = r2 = w22/N2,

N = кс/%д n2 = *с/Ч2,

Ri = i/^Cn(1), R2 = i/C®, где N1, N2 - нормальные силы игроков Р и Е;

Cn(1), Cn(2) - коэффициенты нормальных сил игроков Р и Е;

к - масштабирующий коэффициент для выделения безразмерных аэродинамических коэффициентов, учитывающих высоту полета, массу игроков и их характерную площадь;

Ст(2) - коэффициент тангенциальной силы игрока Е.

х = -wJcC^yy + w2sin0, у = w^kC^xy- w, + w2cos0 ,

0 = -w^C^q + w2kC(N2)\y, (1)

W, = -kC(2>w2,

где x и y - геометрические координаты (уклоняющегося игрока Е в системе координат, связанной с игроком Р);

w1 и w2 - скорости игроков Р и Е;

Rj и R2 - минимальные радиусы кривизны траекторий Р и Е;

9 - ориентация вектора скорости (w2) уклоняющегося игрока Е;

ф и ц - параметры управления движением игроков Р и Е, -1 < ф, ц < 1. система уравнений (1) описывает движение обоих игроков в четырехмерном фазовом пространстве в подвижной системе координат, связанной с игроком Р. Направление оси ординат совпадает с направлением вектора скорости игрока Р.

Область захвата (где игрок Р однозначно при оптимальном своем поведении (ф = орир(х)) сблизится с игроком Е на дистанцию \РЕ\ <1 = 1, а игра будет иметь плату (+1)) и область избежания захвата (при оптималь-

ном поведении (ф = ор/ф(х)) игрок Е обеспечит выполнение условия \ре\ у1 = 1, а игра будет иметь плату (-1)). На поверхности раздела предполагается, что игра имеет нулевую плату (нейтральный для игроков исход). Эта поверхность касается терминальной поверхности (в нашем случае цилиндра с радиусом l =1 и центром в точке Р) вдоль линии (при фиксированном w2 - в точке на геометрической плоскости), где выполняется условие | РЕ | = l = 1.

Для построения поверхности барьера (имеющего в каждой точке нормаль v = {vpVj.V3.V4 }г) достаточно найти траекторию (совокупность траекторий в четырехмерном фазовом пространстве), удовлетворяющую условию полупроницаемой поверхности

2Х/;(х,ф,ф) = 0

i

как основному уравнению дифференциальных игр.

В рассматриваемом случае основное уравнение (аналог функции Гамильтона, использующееся в работах Ф.Л. Черноусько [5] и Л.С. Понтрягина [7]) имеет вид

min9maxv

+v.

—Ly9 + w2sin0 +

.А ) ,

W, А

— Хф-Wj +W2COS0

А

+

+v.

f W, w, ^

— ф + —VI/

A V,

+v

. (2)

Непосредственное решение игры качества (построение барьера) получено с использованием системы уравнений характеристик в регрессивной форме 0

х = wxkC(^} у — w2 sin 0,

о

у = —W-JiC^Xф + w1-w2 cos 0 ,

0 = w^kC^Ф - w2kC(2>Vf ,

Н-! = kC{vwf, V! = ^фУ2, v2 = ^-q/v,,

K\ к\

О

V3 = V! cos 0 - v2 sin 0,

0 \I/V

v4 = Vj sin 0 + v2 cos 0 + ^ - 2kC[1>wxv4

^2

совместно с условием (2).

ЛЕСНОЙ ВЕСТНИК 3/2015

15

системный анализ, управление и обработка информации в космической отрасли

Таблица

Сходимость результатов от шага интегрирования по времени

The convergence of results from time integration step

Dt 0,1 0,08 0,05 0,02 0,01 0,005 0,001

Ду (Эйлер) 4,25200 7,102 % 4,18884 5,560 % 4,104855 3,444 % 4,02126 1,337 % 3,99325 0,632 % 3,97933 0,281 % 3,96819

Ду (Рунге-Кутт) 3,83354 3,291 % 3,85515 2,746 % 3,89616 1,712 % 3,93753 0,668 % 3,95143 0,317 % 3,95840 0,142 % 3,96401

W2 (Эйлер) 2,75904 0,6247 % 2,75487 0,4727 % 2,74982 0,2885 % 2,74493 0,1101 % 2,74334 0,0521 % 2,74254 0,0230 % 2,74191

W2 (Рунге-Кутт) 2,72985 0,4304 % 2,73207 0,3494 % 2,73602 0,2054 % 2,73957 0,0759 % 2,74069 0,0350 % 2,741224 0,0155 % 2,74165

Рис. 3. Терминальная поверхность и поверхности барьеров 4-мерного фазового пространства: вдоль оси симметрии цилиндра отложен угол 0

Fig. 3. Fig. 3. The terminal surface and the surface of the barriers of a 4-dimensional phase space: an angle 0 marked along the symmetry axis of the cylinder

Начальные условия для каждого из уравнений характеристик

х(0) = l sin sp /0) = l cos sp 0(o) = s2, w2(0) = s3, Vi(0) = sin Si, V2(0) = cos Si, v3(0) - определяется из параметрического уравнения функции платы,

V4(0) = 0.

Численное решение дифференциальной игры в четырехмерном фазовом пространстве

Для численного решения данной задачи была разработана программа на языке Fortran. Программа состояла из трех блоков расчета:

- фазовых координат в каждый момент времени,

- компонентов нормали к фазовой траектории,

- оптимальных траекторий ф и у как результата численного решения уравнения платы.

Настоящий метод идейно близок к методу локальных вариаций, предложенному Ф.Л. Черноусько.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В таблице представлены зависимости значений фазовых координат в точке окончания расчета в зависимости от шага интегрирования, полученные с использованием

16

ЛЕСНОЙ ВЕСТНИК 3/2015

системный анализ, управление и обработка информации в космической отрасли

Рис. 4. Терминальная поверхность и линия барьера для 4-мерного фазового пространства Fig. 4. The terminal surface and a barrier line for the 4-dimensional phase space

численных методов Эйлера и Рунге-Кутта 4 порядка точности.

Достоверность результатов численного расчета была подтверждена путем сравнения фазовых траекторий соответствующего аналитического решения с тем, что было полученно Айзексом. В качестве тестовой была выбрана двухмерная задача о «шофере-убийце».

Рассмотрим иллюстрацию результатов численных расчетов - терминальную поверхность и барьер.

Под барьером, согласно теории Айзекса, понимается некая сингулярная поверхность в пространстве фазовых координат, которая отделяет точки, для которых можно осуществить захват, от тех точек, для которых возможно избежать его. Терминальная поверхность, в данном случае поверхность цилиндра с радиусом l, ограничивает непосредственно область захвата, т. е. в случае попадания в нее точки Е игра заканчивается победой игрока Р.

Как результат численного решения дифференциальной игры качества в четырехмерном фазовом пространстве получена поверхность барьера. На рис. 3 представлены терминальная поверхность и поверхность барьера 4-мерного фазового пространства, где вдоль оси симметрии цилиндра отложен

угол 9 - угол ориентации вектора скорости уклоняющегося игрока Е. На рис. 4 схематично показаны зона перехвата, линия барьера, терминальная поверхность и зона гарантированного уклонения.

Выводы

Для дифференциальной игры на оптимальное уклонение в 4-мерной остановке получена система уравнений движения, функция платы, а также система уравнений характеристик с начальными условиями, учитывающие изменение скорости и маневренных характеристик одного из игроков в процессе уклонения.

Разработан алгоритм и программа решения 4-мерной дифференциальной игры на оптимальное уклонение, позволяющий устанавливать зависимости изменения фазовых координат редуцированной игры для различных маневренных возможностей игроков.

Для задачи оптимального управления получены показатель эффективности и схема синтеза соответствующего критерия эффективности.

Достоверность полученных результатов подтверждена сравнением с известными аналитическими решениями и сходимостью численного решения по сетке управляющих параметров.

ЛЕСНОЙ ВЕСТНИК 3/2015

17

системный анализ, управление и обработка информации в космической отрасли

Библиографический список

1. J. von Neumann, Morgenstem O., The theory of games and economic behavior, Princeton University Press, 1947.

2. Айзекс, Р. Дифференциальные игры / Р. Айзекс. - М.: Мир, 1967. - 480 с.

3. Лебедев, А.А. Основы синтеза систем летательных аппаратов / А.А. Лебедев. - М.: Машиностроение, 1987. - 224 с.

4. Аэродинамика летательных аппаратов. - М.: РДК ФГУП ЦНИИмаш. - 2002.

5. Черноусько, Ф.Л. Вариационные задачи механики и управление / Ф.Л. Черноусько, Н.В. Баничук. - М.: Наука, 1973. - 238 с.

6. Галактионов, А.Ю. Численный расчет аэродинамических характеристик скоростных летательных аппаратов оптимальной формы с малоинерционными органами

управления / А.Ю. Галактионов // XIII-я научно-техническая конференция Центрального аэрогидродинамического института им. Н.Е. Жуковского, 2012.

7. Понтрягин, Л.С. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гам-келидзе, Е.Ф. Мищенко. - М.:Наука, 1969. - 384 с.

8. Дмитриевский, А.А. Внешняя баллистика / А.А. Дмитриевский, Л.Н. Лысенко. - М.: Машиностроение, 2005. - 608 с.

9. Хейз, УД. Теория гиперзвуковых течений / УД. Хейз., Р.Ф. Пробстин. - М.: Издательство иностранной литературы, 1962. - 608 с.

10. Петров, К.П. Аэродинамика тел простейших форм / К.П. Петров. - М.: Физматлит, 1998. - 432 с.

11. Остославский, И.В. Динамика полета. Траектории летательных аппаратов / И.В. Остославский, И.В. Стра-жева. - М.: Машиностроение, 1969. - 500 с.

1.

2.

3.

4.

5.

6.

7.

8.

9.

10. 11.

THE NUMERICAL SOLUTION OF ONE DIFFERENTIAL GAME OF QUALITY IN A FOUR-DIMENSIONAL PHASE SPACE

Blinova E.S., gr. MSFU

ekaterina4likhacheva@gmail.com

Moscow State Forest University (MSFU), 1st Institutskaya st., 1, 141005, Mytischi, Moscow reg., Russia

A differential game in four-dimensional phase space has been overlooked with respect to the problem of avoiding a collision between two vehicles, proposed by R. Isaacs. Unlike earlier versions, the present solution is obtained numerically using a computer for the case when the evader is influenced by the game variables: the normal and tangential to the trajectory forces. Use of square dependences of normal and tangential forces from the speed of the evading player allowed to develop the math procedures of criterion synthesis for an optimality of evasion of the aircraft. Reliability of the results is confirmed by comparison with the already known analytical and numerical data on game problems.

Keywords: differential game of quality, phase space, phase trajectories, phase coordinates, numerical method, barrier, terminal surface, system of the ordinary differential equations, optimum control.

References

J. von Neumann, Morgenstem O., The theory of games and economic behavior, Princeton University Press, 1947.

Ayzeks R. Differentsial’nye igry [Differential games]. Moscow: Mir, 1967. 480 p.

Lebedev A.A. Osnovy sintezasistem letatel’nykh apparatov [Bases of synthesis of systems of aircraft], Moscow: Mashinostroenie. 1987. 224 p.

Aerodinamika letatel’nykh apparatov [Aerodynamics of aircraft] RDK FGUP TsNIImash., 2002.

Chernous’ko F.L., Banichuk N.V Variatsionnye zadachi mekhaniki i upravlenie [Variation problems of mechanics and management]. Moscow: Nauka, 1973. 238 p.

A.Yu. Galaktionov. Chislennyy raschet aerodinamicheskikh kharakteristikskorostnykh letatel’nykh apparatov optimal’noy formy s maloinertsionnymi organam i upravleniya [Numerical calculation of aerodynamic characteristics of high-speed aircraft of an optimum form with quick-response governing bodies]. XIII scientific-technical conference of the N.E. Zhukovsky Central Aerohydrodynamic Institute, 2012.

Pontryagin L.S., Boltyanskiy V.G., Gamkelidze R.V., Mishchenko E.F. Matematicheskaya teoriya optimal’nykh protsessov [Mathematical theory of optimum processes]. Moscow: Nauka, 1969. 384 p.

Dmitrievskiy A.A., Lysenko L.N. Vneshnyaya ballistika [Exterior ballastics]. Moscow: Mashinostroenie, 2005. 608 p.

Kheyz. U.D., Probstin R.F. Teoriya giperzvukovykh techeniy [Theory of hypersonic currents]. Moscow: Foreign Literature Publishing House, 1962. 608 p.

Petrov K.P. Aerodinamika telprosteyshikh form [Aerodynamics of bodies of the elementary forms]. Moscow: Fizmatlit, 1998. 432 p.

Ostoslavskiy I.V., Strazheva I.V Dinamikapoleta. Traektorii letatel’nykh apparatov [Dynamics of flight. Trajectories of aircraft]. Moscow: Mashinostroenie, 1969. 500 p.

18

ЛЕСНОЙ ВЕСТНИК 3/2015

i Надоели баннеры? Вы всегда можете отключить рекламу.