УДК 517.977
doi: 10.18097/1994-0866-2015-0-9-132-139
ЧИСЛЕННЫЙ ЭКСПЕРИМЕНТ ПО АНАЛИЗУ ЭФФЕКТИВНОСТИ ПРОЕКЦИОННОГО МЕТОДА НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ1
© Бурлаков Иван Дмитриевич
аспирант кафедры прикладной математики Бурятского государственного университета
Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а, e-mail: [email protected]
В статье рассматривается проекционный метод нелокального улучшения и приводится результат численного эксперимента по анализу эффективности этого метода в нелинейной задаче оптимального управления.
Ключевые слова: задача оптимального управления, нелокальное улучшение, вычислительный эксперимент.
NUMERICAL EXPERIMENT ON EFFECTIVENESS ANALYSIS OF THE PROJECTION METHOD FOR NONLOCAL IMPROVEMENT
Ivan D. Burlakov
Research Assistant, Department of Applied mathematics, Buryat State University
24a Smolina st., Ulan-Ude 670000, Russia
The article deals with the projection method of nonlocal improvement and the results of numerical experiments on effectiveness analysis of this method in the nonlinear optimal control problem.
Keywords: optimal control problem, nonlocal improvement, numerical experiment.
Введение
Рассмотрим задачу оптимального управления со свободным правым концом:
X = f (X (t), u (t), t), X (t0 ) = x0, (1)
u(t)eU, teT = [t0,tx], (2)
Ф(и ) = p(x (t1))+ [h F (x (t), u (t), t \dt ^ inf, (3)
j/0
где X (tRn - вектор состояния, u (tRr - вектор управления. Множество V кусочно-
непрерывных на T функций со значениями в выпуклом компактном множестве U С Rr рассматривается в качестве множества допустимых управлений. Промежуток управления T и начальное состояние X0 заданы.
Также предполагаем, что выполнены условия гарантирующие существование и единственность решения X (t, V) , t eT системы (1) - (2) для любого допустимого управления V (t), t eT [4].
Решать поставленную задачу (1) - (3) будем при помощи модифицированного проекционного метода нелокального улучшения управлений с дифференциально-алгебраической сопряженной системой. Этот метод приведем в итерационном виде, более подробно про него можно прочитать в книгах [3], [5], [6].
1. Проекционный метод нелокального улучшения
Как было сказано выше, рассматриваемый метод покажем в итерационном виде. Такой вид позволяет реализовать метод на компьютере, что может существенно облегчить расчет задачи.
1 Работа выполнена при финансовой поддержке РФФИ (проект 15-01-03680-а)
Проекционный метод нелокального улучшения использует дифференциально-алгебраическую сопряженную систему [5], [6], итерационный процесс расчета которой имеет вид:
pk+1 (t) = -Hx (pk+1 (t), x0 (t), u0 (t), t) - г(t), (4)
pk+l (t\ ) = -4>x (x0 (t))- q , (5)
H (pk (t), xk (t), u0 (t), t)-H (pk (t), x0 (t) ,u0 (t) ,t ) =
= ( Hx (pk (t), x0 (t), u0 (t), t) + г (t), xk (t)-x0 (t)), (6)
q>{xk (tx)) - p(x0 (i1)) = (x0 ft )) + q,xk (i1) - x0 (i1)) , (7)
где pk (t) = p{t,u0,uk j, xk (t) = x{t,uk j и H(p,x,u,t) = ^p,/(x,u,t)-F(x,u,t^ - функция Понтрягина с сопряженной переменной p (t, u, V) . Величины г(t) и q вычисляются из
соответствующих алгебраических уравнений (6) и (7) (возможно и не единственным образом) [5], [6]. Такая модификация сопряженной системы позволяет получить [6] формулу приращения целевой функции в исходной задаче, которая не содержит остаточных членов разложений.
Итерационный процесс решения проекционного отображения с параметром возмущения а> 0, который равен параметру проектирования (применяется метод проекционных возмущений [4]), принимает вид:
uk+1 (t) = P (u0 (t) + «(h(p(t,u0,uk),x(t,uk),u0 (t),t) + S(t))), (8)
где 5 ^ t^ находитсяиз алгебраического уравнения
H(p(t,u0,uk),x(t,uk),uk (t),tH[p{t,u0,uk),x{t,uk),u0 (t),t) =
= (hu (p (t, u0, uk), x (t, uk), u0 (t), t) + 5 (t), uk (t)-u0 (t)), t еГ . (9)
Если в задаче (1) - (3) /(x,u, t) и F(x,u, t) линейны no x, то из [5] и [6] следует, что г(7) ^ 0, t е Т, а если x) линейна, то q = 0 . Для задачи (1) - (3) линейной по управлению, полагаем s(t) = 0, t е Т [5], [6].
При вычислении s (t), г(t) и q можно применить условия описанные в [3], [7].
2. Вычислительный эксперимент
В примерах вычисленные значения управляемых, фазовых и сопряженных переменных запоминались в узлах равномерной сетке с шагом дискретизации At = 0.02 на отрезке [0,10] для первого примера и At = 0.01 на отрезке [0,5.115] для второго. Численный расчет задачи проводился до первого улучшения, далее строилась новая задача и итерационный алгоритм повторялся. В качества критерия остановки выбиралось условие o(uk+1 )_Ф(uk< o(uks , где
s > 0 - заданная точность. Численное решение фазовых и сопряженных задач Коши осуществлялось методом Рунге-Кутта-Вернера пятого или шестого порядка точности с помощью биб -лиотеки IMSL языка Fortran PowerStation 4.0 [2]. По суммарному количеству решенных задач Коши для фазовой и сопряженной системы проводится сравнительный анализ эффективности.
Теперь решим следующую задачу [1]:
.^1 ^ t ^ — u x2 , (t^ — u2,
x3 (t)= 2(u12 + u22 ),
x (0) = 0.1, x2 (0) = 1, x3 (0) = 0, u (t)e[-1,0], t e [0,10].
ф(ы) = 1 (xf (10) + x22 (10)) + x3 (10) ^ min.
Это билинейно-квадратичная задача с двумя управлениями.
Решение:
Введем необходимые конструкции. Функция Понтрягина для этого примера принимает следующий вид:
H (p, x,u, t) = p1u1 x2 + p2u2 +1 p3 (u12 + u22) .
Градиенты:
H = 0 , Hx2 = pu , H% = 0 , H1 = a x2 + p3u1 , Hu2 = p2 + p3u2 . Далее составляем дифференциально-алгебраическую сопряженную систему (4)-(7), где r1 (t) = r2 (t) = r3 (t) = 0, так как f (x, u, t) , F (x, u, t) линейны по x^ x2 и x3 :
pk+1 = 0, pk2+1 =~p{+y, [pk+1 =0,
pk+1 (10) = - x0 - q, p2k+1 (10) = - x20 - q2, pf (10) = -1,
V(xk (t1 ))-^(x° (t1)) / о (f ^ ■ 1k
qi = xk (0-x° (t1)--^ (t1 )), * =
q3 = 0 , так как <p( x) линейна по x3 . Находим управление (8)-(9):
uk+1 (t) = i (u0 (t) + «(h(p(t,u0,uk),x(t,uk),u0 (t),t) + 5(t))),
^ H(p(t,u0,uk),x(t,uk),uk (t),t)-H(p(t,u0,uk),x(t,uk),u0 (t),t) 5 ^ uk (t)- u0 (t)
-Hu (p(t,u0,uk),x(t,uk),u0 (t),t). Здесь xk (t) и pk (t) - решение фазовой и сопряженной системы, соответственно, на k-й итерации метода. При вычислении 5 (t), q применяются условия описанные в [3], [7]. В качестве
начального приближения возьмем управление щ' (t^ = 0, u° (t) = 1 [1].
В таблице 1 приведены результаты из [1] (1-3 метод, в книге [1] для решения задачи применялись стандартные градиентные методы и их модификации) и результат, полученный с помощью проекционного метода нелокального улучшения (ПМНУ) (Ф* обозначает наилучшее значение функционала). Полученные значения управляемых и фазовых траекторий изображены на рисунках 1, 2, 3, 4.
Рис. 3. Оптимальная траектория x1
Рис. 4. Оптимальная траектория x2
Таблица 1
Сравнительный анализ эффективности
Метод Ф Число задач Коши
1 0.04986 33
2 0.04692 41
3 0.048158 40
ПМНУ (a = 0.01) 0.048037 9
Дальнейшее уменьшение параметра а в ПМНУ приводит к ухудшению итогового значения функционала, хотя вычислительные затраты при этом не сильно меняются. Увеличение параметра а - к увеличению вычислительных затрат (возрастает количество решенных задач Коши) и падению точности значения функционала.
Следующей задачей рассмотрим задачу Цермело [9], [10, стр. 112-113]:
X (t) = cos (x3), < x2 (t) = sin (x3), x3 (t) = u,
x1 (0 ) = 0, x2 (0 ) = 0, x3 (0 ) = 0,
u (t)e [-0.5,0.5], t e [0,5.115].
Ф(и) = 5.115 +1000((x, (5.115)-4)2 +(x2 (5.115)-3)2 j min.
Решение:
Введем необходимые конструкции. Функция Понтрягина:
H (p, x,u, t) = p1cos (x3) + p2 sin (x3) + p3u .
Градиенты:
Hxi = 0, HX2 = ^ H3 ="Pisin (X3 ) + P2cos (X3 ) , Hu = Рз.
Составляем дифференциально-алгебраическую сопряженную систему (4)-(7):
Р 1 ="1,
Рг+1 =-Г2,
Р3+1 = Р1+1 sin (x30) - p2+1 cos (x30) - r3, pf+1 (5.115) = 2000(4 - X0) - q1, pk2+1 (5.115) = 2000(3 - x20) - q2, p3k+1 (5.115) = 0,
M H (Рк (t), xk (t), u0 (t )> t)-H (р' (t), x0 (t ), uu (t), t) H . 0 0 . 123 ri (t)=—-xk (t)-x0 (t)- "Hx< УР ^^x ^^u ^^t^ i = 1,2,3
(t1 ))"Hx° (t1)) / o ít Л ■ 12
qi = xk (t1)-x° (t1)--(t1)), * = U,
q3 = 0 , так как <¡p( x) линейна по x3 .
Находим управление (8)-(9) (s (t) = 0 так как задача линейна по управлению):
uk+1 (t) = Pu (u0 (t) + «H(p(t,u0,uk),x(t,uk),u0 (t),t)) , Здесь xk (t) и pk (t) - решение фазовой и сопряженной системы, соответственно, на k-й итерации метода. При вычислении r(t), q применяются условия описанные в [3], [7]. В качестве начального приближения возьмем управление u0 (t) = 0 .
В таблице 2 приведены результаты из [9] и результат, полученный с помощью проекционного метода нелокального улучшения (ПМНУ) (Ф* обозначает наилучшее значение функционала). Полученные значения управляемых и фазовых траекторий изображены на рисунках 5, 6, 7, 8.
Рис. 5. Оптимальная траектория x1
2
0 1,27875 2,5575 3,83625 5,115 -х2
Рис. 6. Оптимальная траектория х2
0,8 0,6 0,4 0,2 0
0 1,27875 2,5575 3,83625 5,115 -х3
Рис. 7. Оптимальная траектория х3
0,6 0,5 0,4 0,3 0,2 0,1 0
-0,1 0
1,27875 2,5575 3,83625 5,115
Рис. 8. Оптимальное управление u
3
1
0
и
Таблица 2
Сравнительный анализ эффективности
Метод Ф Число задач Коши
1 5.850061 100010
2 5.260061 100125
3 5.128061 100002
4 5.178061 100019
5 5.260061 100036
6 6.410061 100008
7 5.330061 100015
8 5.110066 100012
9 5.300061 51837
10 5.111361 59909
ПМНУ (а = 105) 5.115998 14501
Дальнейшее уменьшение параметра а в ПМНУ приводит к увеличению вычислительных затрат, например при а = 10 6 мы получаем, что итоговое значение равное 5.122384 получается при решении 75627 задач Коши. Увеличение же параметра а приводит к увеличению вычислительных затрат (возрастает количество решенных задач Коши) и падению точности значения функционала.
Заключение
Обычно для решения задач оптимального управления применяются градиентные методы, в которых релаксация по функционалу в общем случае обеспечивается лишь локально. Проекционный метод нелокального улучшения не гарантирует релаксацию функционала на каждой итерации, но компенсирует это отсутствием параметрического поиска. Нелокальное улучшение при поиске решения является существенным фактом повышения эффективности. Нелокальность обеспечивается фиксированностью параметра возмущения.
По решению данных примеров мы можем заметить, что проекционный метод нелокального улучшения эффективен по вычислительным затратам. При решении он затрачивает наименьшее количество задач Коши, при приемлемой точности полученного итогового значения функционала.
Дополнительно по анализу эффективности проекционного метода нелокального улучшения можно посмотреть в [7] и [8].
Литература
1. Антоник В. Г., Срочко В. А. Вопросы сравнительной эффективности методов градиентного типа в задачах оптимального управления. - Иркутск: Изд-во Иркут. гос. ун-та, 2003.
2. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека 1М8Ь. - М.: Диалог-МИФИ, 2001. - Ч. 3. - 368 с.
3. Булдаев А. С., Анхбаяр Г. Условия улучшения и оптимальности в задачах оптимизации нелинейных управляемых систем // Вестник Бурятского государственного университета. -2014. - Вып. 9(2). - С. 3-9.
4. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. - 260 с.
5. Булдаев А. С., Моржин О. В. Модификация метода проекций для улучшения нелинейных управлений // Вестник Бурятского государственного университета. - 2010. - Вып. 9. -С.10-17.
6. Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. -2009. - Т. 2, № 1. - С. 94-106.
7. Бурлаков И. Д. Анализ эффективности метода нелокального улучшения в задачах оптимального управления // Вестник Бурятского государственного университета. - 2014. -Вып. 9(2). - С. 10-19.
8. Бурлаков И. Д. Численные эксперименты по анализу эффективности проекционного метода нелокального улучшения // Вестник Бурятского государственного университета. Математика, информатика. - 2014. - № 2. - С. 59-66.
9. Горнов А. Ю. Вычислительные технологии решения задач оптимального управления. -Новосибирск: Наука, 2009. - 279 с.
10. Тятюшкин А. И. Численные методы и программные средства оптимизации управляемых систем. - Новосибирск: Наука. Сибирское отделение, 1992. - 193 с.
References
1. Antonik V. G., Srochko V. A. Vopmsy smvniternoi e//ektivnosti metodov gmdientnogo tipa v zadachakh optimal'nogo upmvleniya [Issues of Comparative Gradient-type Methods Effectiveness in Optimal Control Problems]. Irkutsk: Irkutsk State University publ., 2003.
2. Barten'ev O. V. Forimn dlya pm/essionalov. Matematicheskaya biblioteka IMSL [Fortran for Professionals. IMSL Mathematical Library]. Moscow: Dialog-MIFI, 2001. Part. 3. 368 p.
3. Buldaev A. S., Ankhbayar G. Usloviya uluchsheniya i optimal'nosti v zadachakh optimizatsii nelineinykh upravlyaemykh sistem [Conditions of Improve and Optimality in the Problems of Nonlinear Control Systems Optimization]. Vestnik Bu^atskogo gosudaгstvennogo univeгsiteta - Bulletin o/ Brnyat State Unwe^ty. 2014. V. 9(2). Pp. 3-9.
4. Buldaev A. S. Metody vozmushchenii v zadachakh uluchsheniya i optimizatsii upmvlyaemykh sistem [Methods of Perturbation in the Problems of Control Systems Improvement and Optimization]. Ulan-Ude: Buryat State University, 2008. 260 p.
5. Buldaev A. S., Morzhin O. V. Modifikatsiya metoda proektsii dlya uluchsheniya nelineinykh upravlenii [Modification of the Projection Method for Nonlinear Control Improvment]. Vestnik Bwy-atskogo gosudaгstvennogo univeгsiteta - Bulletin o/Bwyat State Univeгsity. 2010. V. 9. Pp. 10-17.
6. Buldaev A. S., Morzhin O. V. Uluchshenie upravlenii v nelineinykh sistemakh na osnove kraevykh zadach [Controls Improvement in Nonlinear Systems Based on Boundary-value Problems]. Izvestiya Fkutskogo gosudaгstvennogo univeгsiteta. Seriya Matematika - Pmceedings o/ the Fkutsk State Unive^ity. Series Mathematics. 2009. V. 2. No.1. Pp. 94-106.
7. Burlakov I. D. Analiz effektivnosti metoda nelokal'nogo uluchsheniya v zadachakh opti-mal'nogo upravleniya [Effectiveness Analysis of the Nonlocal Improvement Method in Optimal Control Problems]. Vestnik Bu^atskogo gosudaгstvennogo univeгsiteta - Bulletin o/Bwyat State Univeг-sity. 2014. V. 9(2). Pp. 10-19.
8. Burlakov I. D. Chislennye eksperimenty po analizu effektivnosti proektsionnogo metoda nelo-kal'nogo uluchsheniya [Numerical Experiments on the Efficiency Analyses of the Projection Method of Nonlocal Improvement]. Vestnik Bu^atskogo gosudaгstvennogo univeгsiteta. Matematika, In/oг-matika - Bulletin o/Brnyat State Univeгsity. Mathematics, Computeг Science. 2014. V. 2. Pp. 59-66.
9. Gornov A. Yu. Vychislitel'nye tekhnologii ^sheniya zadach optimal'nogo upmvleniya [Computing Technology for Solving Optimal Control Problems]. Novosibirsk: Nauka, 2009. 279 p.
10. Tyatyushkin A. I. Chislennye metody i pmgmmmnye s^dstva optimizatsii upmvlyaemykh sistem [Numerical methods and software for control systems optimization]. Novosibirsk: Nauka, Siberian Branch, 1992. 193 p.