Научная статья на тему 'Численные эксперименты по анализу эффективности проекционного метода нелокального улучшения'

Численные эксперименты по анализу эффективности проекционного метода нелокального улучшения Текст научной статьи по специальности «Математика»

CC BY
74
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / OPTIMAL CONTROL PROBLEM / НЕЛОКАЛЬНОЕ УЛУЧШЕНИЕ / NONLOCAL IMPROVEMENT / ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ / NUMERICAL EXPERIMENT

Аннотация научной статьи по математике, автор научной работы — Бурлаков Иван Дмитриевич

В статье приводятся результаты численных экспериментов по анализу эффективности проекционного метода нелокального улучшения в нелинейных задачах оптимального управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Numerical experiments in effectiveness analysis of projection method for nonlocal improvement

The article presents the results of numerical experiments on the analysis of effectiveness of the projection method for nonlocal improvement in nonlinear optimal control problems.

Текст научной работы на тему «Численные эксперименты по анализу эффективности проекционного метода нелокального улучшения»

УДК 517.97

© И. Д. Бурлаков

ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ ПО АНАЛИЗУ ЭФФЕКТИВНОСТИ ПРОЕКЦИОННОГО МЕТОДА НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ

В статье приводятся результаты численных экспериментов по анализу эффективности проекционного метода нелокального улучшения в нелинейных задачах оптимального управления.

Ключевые слова: задача оптимального управления, нелокальное улучшение, вычислительный эксперимент.

© I. D. Burlakov

NUMERICAL EXPERIMENTS IN EFFECTIVENESS ANALYSIS OF PROJECTION METHOD FOR NONLOCAL IMPROVEMENT

The article presents the results of numerical experiments on the analysis of effectiveness of the projection method for nonlocal improvement in nonlinear optimal control problems.

Keywords: optimal control problem, nonlocal improvement, numerical experiment.

Введение

Рассмотрим задачу оптимального управления со свободным правым концом:

x (t ) = f ( x (t),u (t), t), x (to ) = Xo, (1)

и (t )eU, t e T = [to, ti ], (2)

t

Ф(и) = (p{x(t1)) +jF(x(t),u(t),t)dt ^inf, (3)

to

где x(t)e Rn - вектор состояния, и (t)e Rr - вектор управления. Множество V кусочно-непрерывных на T функции со значениями в выпуклом компактном множестве U с Rr рассматривается в качестве множества допустимых управлений. Промежуток управления T и начальное состояние x0 заданы.

Также предполагаются выполненными условия, которые гарантируют существование и единственность решения x(t,v), t eT системы (1)-(2)

для любого допустимого управления v(t) , t eT [3, 8].

В статье задача (1)-(3) решается с применением модифицированного проекционного метода нелокального улучшения управлений с дифференциально-алгебраической сопряженной системой [4, 6, 7], описание которого приводится далее в итерационном виде.

1. Итерационный вид проекционного метода нелокального улучшения с дифференциально-алгебраической сопряженной системой

Рассмотрим дифференциально-алгебраическую сопряженную систему

[4, 6]:

р (¿) = -Нх ( р ( г), х (Г), * ( г), г)- г (г) , (5)

) = ~Фх (х(0)"Ч , (6)

И (р (7), у (г ), * (7), 7)- И (р (7), х ((), * ((), 7) = (Их (р (г), х (Г), * (г), () + г (Г), у (г)-х (Г)), (7)

ЦУ (¿1 )) " Цх((1 )) = (<РХ (х(¿1)) + Ч,У (tl) - х(^ )) , (8)

где Н(р,х,и,() = {р,/(х,и,¿У}-Е(х,и,() - функция Понтрягина с сопряженной переменной р (7,и, V) . Величины г (7) и ч выражаются из соответствующих алгебраических уравнений (7) и (8) (возможно и не единственным образом) [4, 6]. Эта модификация позволяет получить [6] формулу приращения целевой функции в задаче (1)-(3) без остаточных членов разложений.

Далее введем проекционное отображение:

иа{р,х,7) = Ри (и (7) + аНи (р,х,и,7)) , 7е [¿0,¿1 ],

где и е V - допустимое управление, а> 0 - фиксированный параметр, Ри - оператор проектирования на множество и в евклидовой норме.

Тогда с помощью отображения иа дифференциальный принцип максимума (ДПМ) в задаче (1)-(3) для управления и eV представляется в виде:

и (¿) = иа( р (7, и, V), х (/, и ), (), 7е[>0, 71 ], а > 0. (4)

Для выполнения ДПМ достаточно проверить условие (4) хотя бы для одного а> 0.

Предположим, что р ((,и, V), 7е[(0, 71 ] - решение дифференциально-алгебраической сопряженной системы (5)-(8) для допустимых управлений и,V при * (() = и (() , х(7) = х(7,и), у (7) = х(7, V). То есть, решив эту

систему, можно однозначно определить отображение Р (и,V) = р (7,и,V), 7 е[(0,71 ] на множестве V х V (возможно, не единственным образом).

Решим проекционное отображение, применив метод проекционных возмущений [3], с параметром возмущения а> 0, равным параметру проектирования:

V (х) = Ри (и (х) + а(Ии (р (х, и, у), х (х, у), и (х), х) + 5 (х))), X еТ . (9) 5 (X) находится из алгебраического уравнения

И ( р (X, и, V ), х (X, V ), V (X), X)- И ( р (X, и, V ), х (х, V ), и (х), X ) = (Ии (р(X,и,V),х(X,V),и(X),X) + 5(X),V(X)-и(X)) . (10)

При а = 0 получается невозмущенное условие, которое имеет тривиальное решение V(X) = и (X), X е [х0, X1 ].

Процесс решения задачи (9)—( 10) в итерационном виде выглядит следующим образом:

/+1 (X)= Р (и0 {х)+а[Ии (р (X, и0, vk), х (х, Vк ), и0 (х), х) + 5 (X))), (11)

И (р (X, и0, / ), х (X, / ), vk (х),х)-И (р (X, и Vк ), х (X, Vк ), и0 (х),х ) =

= (ыи (р (х, и0, vk ), х [X, Vк ), и0 (X), х) + 5 (X), V* (X)- и0 (X)), X еГ, (12)

где и0 еУ - начальное приближение. При вычислении 5(х) из (12) необходимо учитывать некоторые условия, например, которые описаны в [8]. В случае линейной по управлению задаче (1)-(3) 5 (х) = 0 , х е Т . [3, 6].

Соответственно итерационный процесс расчета дифференциально-алгебраической сопряженной системы (5)-(8) представляется в форме:

рк+1 (X) = -Их (рк+1 (х), х0 (X),и0 (X), X) - г (X) , (13)

рк+1 (х1 ) = ~9Х (х0 (х1))- д , (14) И(рк (X),хк (X),и0(X),X)-И(рк (X),х0(X),и0(X),X) =

(Их (рк (X),х0 (X),и0 (х),х) + г(X),хк (X)- х0 (X)) , (15)

<р(хк (Х1)) - ср(х0 (Х1)) = (ух (х° (Х1)) + д,хк ) - х0 )) . (16) где рк (х) = р(X,и0,vk) , хк (х) = х(X,vk) .

Вычисляя г (х) и д из уравнений (15)-(16), также необходимо учитывать некоторые условия. Одни из способов их расчета приведены в [7, 8]. Если в задаче (1) - (3) /(х,и, х), ^(х,и, х) линейны по х, то из [4, 6] следует, что г{х^ = 0, а если х) линейна, то д = 0 .

2. Вычислительный эксперимент

Численные эксперименты по анализу вычислительной эффективности проекционного метода нелокального улучшения будем проводить на задаче о брахистохроне и задаче оптимального управления колебательными движениями маятника, которые известны в литературе в плане их численного решения тем или иным методом. В примерах вычисленные значения управляемых, фазовых и сопряженных переменных запоминались в узлах равномерной сетки с шагом дискретизации At = 103 на отрезке [t0, t1 ], в промежутке между узлами проводилась интерполяция полиномами разных степеней, включая подпрограмму из библиотеки IMSL языка Fortran PowerStation 4.0 [1]. Численный расчет задачи проводился до первого улучшения, далее строилась новая задача и итерационный алгоритм повторялся. В качестве критерия остановки выбиралось условие

ф(ик+1 )_Ф(uk< ф(uk)|'£, где £> 0 - заданная точность (в примерах

s = 104). Численное решение фазовых и сопряженных задач Коши осуществлялось методом Рунге-Кутта-Вернера пятого или шестого порядка точности с помощью библиотеки IMSL языка Fortran PowerStation 4.0 [1]. По количеству решенных задач Коши отдельно для фазовой и сопряженной системы проводится сравнительный анализ методов решения.

Пример 1. Задача о брахистохроне

Брахистохрона — кривая скорейшего спуска. В 1696 г. задача о ее нахождении была поставлена Иоганном Бернулли. Заключается она в следующем:

Среди плоских кривых, соединяющих две данные точки А и В, лежащих в одной вертикальной плоскости (В ниже А), найти ту, двигаясь по которой под действием только силы тяжести, сонаправленной отрицательной полуоси OY, материальная точка достигнет В из А за кратчайшее время.

Мы рассмотрим некоторый конкретный случай:

X1 (t) = u,

At )=

1 + u2

x1 (0) = 3, x2 (0) = 0, t e [0,2].

Ф(и ) = x2 (2) +1000 (x1 (2) -10)2 Функция Понтрягина:

• min.

H ( p, x, u, t ) = P1U + p2t

1 + u2

Градиенты:

Их ="0.5 р2

1 + и2

И = 0, Ии = р

ир2

уК1 + и 2) х1

Составим дифференциально-алгебраическую сопряженную систему (г2 (х) = 0, так как /(х,и,X), Е(х,и,X) линейны по х2):

р1 = ^Р^^'Х^- ' Г1 ^^ , ^^2 = ^

р1 (2) = -2000 (х1 (2) -10) - д1, р- (5 ) = -1, где г (X) определяется из уравнения:

И(рк (X),хк (X),и0 (X),X)-И(рк (X),х0(X),и0 (X),X) _ г1 (х )= хк (X )- (X ) "

- И^Р* (/), х0 (/), и0 (/), X). дi (X) определяются из уравнения:

_4>(хк (,1 ))-^(х0 ))

хк )-х0 к )

(х0)), i = 1,2,

к+1 г»

и = Р,

+ а[ |Ии (рк (х),хк (х),и0,х)с!х + 5

\\

//

|АиИ (рк (X), хк (X), и, X = Ц Ии (рк (X), хк (X), и0, X , ик - и М + 5 (ик - и0). т \т i

В качестве начального приближения возьмем управление и0 (X^ = 0 .

В таблице 1 приведены результаты, полученные А. Ю. Горновым (1-7 метод) и полученные рассматриваемым нами методом.

Таблица 1

Сравнительный анализ эффективности_

Метод Ф Число задач Коши

1 5.471632 100 005

2 5.271632 100 049

3 2.974932 100 036

4 2.974932 100 035

5 2.974932 100 014

6 5.271632 100 048

7 2.971671 1 612

ПМНУ (а = 104) 2.974895 17

ПМНУ (а = 106) 2.975505 2 267

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для а> 10 4 ПМНУ не сходится. Для других значений начального управления получаем похожие результаты. Например, для и0 (t^ = 100 и

а = 10 4 получаем значение функционала 2.974895, получившееся путем решения 21 задачи Коши.

Пример 2. Оптимальное управление колебательными движениями маятника

Рассматриваем нелинейную задачу [2, с. 140], [9], [10, с. 137-138, 243], [11, с. 113]:

Х1 (t) _ X2, x2 (t) = u - sin x1,

x1 (0) = 5, x2 (0) = 0, u (t)e[-1,1], t e [0,5].

Ф(и) = x' (5) + x22 (5) min.

Функция Понтрягина:

H (p, x,u, t) = p1 x2 + p2 (u - sinx1) .

Градиенты:

H1 =~P2 Cos x1 , Hx2 = Pb Hu = P2 .

Составим дифференциально-алгебраическую сопряженную систему (r2 (t) = 0, так как f (x,u, t), F(x,u, t) линейны no x2):

p1 = P2COs x1 - r1 (t) , p2 =-pl,

P1 (5) = "2x1 (5) " ?1, p2 (5) = "2x2 (5) " 42 , где r (t) определяется из уравнения:

n H(pk (t),xk (t),u0 (t),t) -H(pk (t),x0 (t),u0 (t),t) _

r1 (t)= xk (t)- x1 (t) "

- ЯЛ Рк (' ), X 0 ( ^ ), и и ( X ), X ) .

qi (X) определяются из уравнения:

* = хк (.1)-х° (<)--^ i = 12'

5 (X) = 0, так как задача линейна по управлению. В качестве начального приближения возьмем управление и0 (X^ = 0 .

В таблице 2 приведены результаты, полученные А. Ю. Горновым (1 -11 метод), и полученные рассматриваемым нами методом.

Таблица 2

Сравнительный анализ эффективности

Метод Ф Число задач Коши

1 11.904409 27 499

2 11.904409 80 466

3 11.904409 4 998

4 11.904589 100 048

5 11.907209 4 454

6 28.904409 100 146

7 11.904409 5 586

8 11.904410 100 076

9 11.904409 71 184

10 11.904409 28 919

11 11.904409 12 602

ПМНУ (а = 1) 11.909310 73

ПМНУ (а = 0.1) 11.909309 691

ПМНУ (а = 0.01) 11.909309 6 751

Для а > 1 ПМНУ не сходится.

Заключение

В статье представлены результаты сравнительной эффективности модифицированного проекционного метода нелокального улучшения управлений, проведенные по тестовым задачам (задача о брахистохроне, оптимальное управление колебательными движениями маятника). Вычислительные эксперименты иллюстрируют эффективность рассматриваемого нами подхода. Это можно наблюдать по количеству решенных задач Ко-ши, в разы отличающиеся от количества затрачиваемых другими методами.

В заключение можно отметить, что для решения дифференциально-алгебраических условий улучшения можно также применять вычислительно эффективные методы возмущений, описанные в работах [3, 5].

Литература

1. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека IMSL. - Москва: Диалог-МИФИ, 2001. - Ч. 3. - 368 с.

2. Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. - Новосибирск: Наука, 1997. - 175 с.

3. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. -260 с.

4. Булдаев А. С., Моржин О. В. Модификация метода проекций для улучшения нелинейных управлений // Вестник Бурятского госуниверситета. - 2010. - Вып. 9. - С. 10-17.

5. Булдаев А. С. Проекционные методы возмущений в задачах оптимизации управляемых систем // Известия Иркутского госуниверситета. -Сер. Математика. - 2014. - Т. 8. - С. 29-43.

6. Булдаев А. С., Моржин О. В. Улучшения управлений в нелинейных системах на основе краевых задач // Известия Иркутского госуниверситета. - Сер. Математика. - 2009. - Т. 2, № 1. - С. 94-106.

7. Булдаев А. С., Анхбаяр Г. Условия улучшения и оптимальности в задачах оптимизации нелинейных управляемых систем // Вестник Бурятского госуниверситета. - 2014. - Вып. 9(2). - С. 3-9.

8. Бурлаков И. Д. Анализ эффективности метода нелокального улуч-шения в задачах оптимального управления // Вестник Бурятского госуниверситета. - 2014. - Вып. 9(2). - С. 10-19.

9. Васильев О. В., Тятюшкин А. И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журн. вычисл. матем. и матем. физ. - 1981. - №6. - С. 1376-1384.

10. Горнов А. Ю. Вычислительные технологии решения задач оптимального управления. - Новосибирск: Наука, 2009. - 279 с.

11. Тятюшкин А. И. Численные методы и программные средства оптимизации управляемых систем. - Новосибирск: Наука, 1992. - 193 с.

Бурлаков Иван Дмитриевич, аспирант кафедры прикладной математики Бурятского государственного университета, тел. 8(3012)217-733.

Burlakov Ivan Dmitrievich, postgraduate student, Buryat State University, applied mathematics department.

i Надоели баннеры? Вы всегда можете отключить рекламу.