МЕТОД УЛУЧШЕНИЯ В НЕКОТОРОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С МАЛОМ
ПАРАМЕТРОМ
Ни Минь Кань ([email protected])
Университет города Переславля Восточно-китайский педагогический университет
В настоящей работе мы будем показывать что метод улучшения может быть использован и в задачах близких к вырожденным и при этом он, стартуя с асимптотических приближений, порождает такую последовательность управлений, которая с одной стороны близка к асимптотическому приближению более высокого порядка, а с другой - приводит к строгому улучшению оценки субоптимальности.
Пусть требуется минимизировать функционал
где е > 0 -малый параметр, штрих означает транспонирование, а(х, ¿), Ь(х, ¿) - достаточно гладкие функции.
Здесь (1), (2) - п-мерный аналог простейшей вариационной задачи со свободным правым концом. При е = 0 эта задача является вырожденной, т.е. соотношения необходимых условий Эйлера здесь превращаются в систему конечных уравнений. Задача (1), (2) близкая к вырожденной имеет решение, аппроксимирующее, вообще говоря, разрывное решение предельной задачи, и относится к классу сингулярно возмущенных вариационных задач, т.к. вблизи точек разрыва траекторий вырожденной задачи траектория исходной возмущенной задачи аппроксимирует разрывы и имеет внутренние и внешние зоны быстрого изменения - зоны пограничного слоя. Предположим, что имеется некоторое допустимое
1. Постановка задачи
(1)
при ограничениях
х = и
х(0,е) = х0, х е Яп, и е Яп,
(2)
управление, в частности, построенное на основе вариационного анализа метод пограничных функций (так называемой прямой схемой). Итак, пусть имеем асимптотическое равномерное приближение n-го порядка
n
Xn(t,e) = ^ еi(xi (t) + Пгж(то) + Rix(n)),
i=0
t t - -где т0 = -, ti =-, причем
е е
lim nix(T0) = 0, lim ) = 0, i = 1,n,
то^+те тх^-те
и допускают, вообще говоря, экспоненциальные оценки и аппроксимируют решение на границе. Для простоты предполагаем отсутствие внутренних переходных слоев. В качестве допустимой траектории возьмем экспоненциально близкую к Xn(t, е)
n / T \
x0(t, е) = Xn(t,e) = £ е^ж - ,
n i=0 i е
и имеет место оценка ||ж(£,е) — ж0(£,е)|| < сега+1 при 0 < Т.
По методу улучшения попытаемся построить элемент улучшения ж1^, е). Приведем процедуру улучшения. Сначала преобразуем задачу (1), (2). Предварительно введем переменную ж1(^)
ж1(^) = У ^а(ж,£) + &'(ж,£)и + и'и^ (И
т.е. /е(и) = х1(Т). Затем введем переменную у = ж1(^) — ^(ж,£), дифференцируя которую получаем
у = а(ж, ¿) — ^¿(ж, ¿) + (Ь(ж, ¿) — ^Ж(ж, ¿))'и + — и'и.
Выбираем непрерывно дифференцируемую функцию ^(ж,£) так, чцобы имели место уравнения
^Ж(М) = &(ж,£), (3)
<^(ж(Т ),Т) = 0, (4)
Пусть имеет место условие
т dbi dbj . . — I. TT" = я , г>Э = 1'П.
dxj dxi
При выполнении условия I пфаффова система (3), (4) разрешима. В новых переменных исходная задача имеет вид
Ie(u) = y(T) —> min,
x = u, x(0) = x0, 62
y = -P (x,t) + - u' u, y(0) = 0,
где P(x, t) = -a(x, t) = -a(x, t) + (x, t).
Отбрасывая дифференциальные связи, определяем функционал [31]
Г T
L(x,y,u) = G(x(T),y(T)) — / R(x,y,u,t) dt,
J 0
rT 10
где
G(x(T), y(T) = Ф(Т, x(T), y(T)) — Ф(0, x0, y(0)) + y(T)
е2
R(x, y, u, t) = Фх(г, x, y)u — (—P(x, t) + — u'u) + Фt(t, x, y).
Нетрудно видеть, что L(x, y, u) = Ie(ii) для допустимой тройки (x, y, ii) и поэтому на допустимых элементах имеем
Ie(u1) <Ie(u),
если
L(x1,y1,u1) < L(x,y,u).
Задавая Ф(t, x, y) различными способами можно получить различные методы улучшения.
Пусть Ф^^,у) = Ф'^^ — y, где вектор-функция Ф^) пока не известна, т.е. рассмотрим процедуру улучшения первого порядка. Обозначим
гT
L(x,y) = sup L(x,y,u) = G(x(T),y(T)) — sup R(x,y,u,t)dt,
и J 0 и
тогда Ru = Ф — e2u = 0, и u1 = — ФШ, т.е. нашли элемент улучшения.
е2
Введем
Ä(x, y, t) = sup R(x, y, u, t) = тт^Ф'Ф + P (x, t) + Ф4 u 2е2
dG „ T ^ n öiR
и определяем Фт с помощью соотношения —— = 0 ^ Ф(Т ) = 0, —— =
dx dx
0 ^ Px(x,t) + Ф = 0.
Теперь для элемента улучшения x:(t, е) получаем
e2x: = -Px(x1,t), (5)
x:(0, е) = x0, x 1(T, е) = 0, (6)
используя u1 = —Ф^) и уравнение (2). Последняя краевая задача явля-е2
ется сингулярно возмущенной с одной стороны, а с другой - (5), (6) есть уравнение Эйлера для исходной вариационной задачи. Таким образом, элемент улучшения x1 может быть оптимальным.
Предположим теперь, что мы построили асимптотику решения задачи (5), (6) порядка (n + m) — Xn+m(t, е). Асимптотическое приближение (t,e) строится при определенных условиях, но мы все эти условия сведем к результирующим оценкам.
II. || x1(t, е) — Xra+m(t,e) ||< cen+m+1, p 0 < t < T, II n^x(r0) ||< ce-T0, i = 0,n + m,
II Rix(n) ||< ceT1, Вместо Xn+m теперь вводим допустимую траекторию.
n+m t
x1(t, е) = Xra+m(t, е) — J2 ег--).
г=° е
Для доказательства основного утверждения о том, что x1^^) является улучшением x0(t, е) нам требуется еще одно условие
III. Матрица Рхх(^е) является отрицательно определенной для всех t е [0, T] и x е Дга.
Теорема 1. При выполнении условий I — III и достаточно малых е > 0 имеем
Ie(u1) < Ie(ü°),
1
где u = x , u = x
0
Доказательство. Разложим Ь{х,у) в точке х1, учитывая соотношения для Ф{£)
гт ( 1 д2Я \
Ь{х,у) = Ь{х1,у) -]о ((2 (х1,у)Ах, Ах) + 0{||Ах||2)) ¿1 + о{||А||2)
Здесь Ах = х — х1. Аналогично разложим Ь{х0 ,у) по х в окрестности х0 и Ь(х1,у) в окрестности х1. Получаем
г т ( 1 д 2 Я \
Ь{х0,у) = Цх\у)— {-дЛ(х1,у)(х0 — х1),х0 — х1) ) ¿¿+0{б2(п+1))^
.)о у 2 дх2 )
дС
Ь{х1,у) = !{х1,у) + {дс {х1 {Т ),у{Т )),х1 — х1)
- д2К
1 -^^^{х1, у){х1 — х1,х1
0
Т.к.
и
то
— /0Т ({д^{х1,у),х1 — х1) + -{Ц{х1,у){х1 — х1,х1 — х1) + 0{е2(п+т))) ¿1.
+ 0{еп+т)
X1
+ 0{еп+т),
с1
+ 0{еп+т),
дС дС
дх х=х1 ""¡л дх
дК дЁ
дх х=х1 "7л дх
и следовательно
ь
х=х1 Ь
ь
- гт,
ь
х=ж1 2 ./0
/ {{Рхх{х\г){х0 — х1),х0 — х1)) ¿1 + 0{б2(п+т)) 0
Отсюда вытекает, что при достаточно малых е > 0
ь
г=с0 > Ь
т.е.
Так как х0, х1 являются допустимыми траекториями, то /е{м0) = Ь |х=с0 , /£{м1) = Ь |х=с1 ,
/£{й0) > Ци1),
1
х=ж
что и требовалось доказать.
Итак, метод улучшения позволяет, на основе асимптотических приближений, построить последовательность допустимых управлений, вдоль которой значения функционала строго убывают с ростом нормы приближения.
Работа выполнена при поддержке фонда Шанхайского е-института вычислительных наук Китая
ЛИТЕРАТУРА
1. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. -М.: Наука, 1973.
2. Васильева А.Б., Бутузов В.Ф. Асимптотические методы в теории сингулярных возмущений.-М.: Высшая школа, 1990.
3. Ни Минь Кань, Дмитриев М.Г. Контрастные структуры в простейшей векторной вариционной задаче и их асимптотика// Автоматика и телемеханика. 1998, № 5, С.41-52.