_____________УЧЕНЫЕ ЗАПИСКИ КАЗАНСКОГО УНИВЕРСИТЕТА
Том 153, кн. 4 Физико-математические пауки
2011
УДК 519.6
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ РЕШЕНИЯ
ОДНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
М. Г. Хасанов
Аннотация
Рассматриваются копечпо-разпостпые аппроксимации задачи оптимального управления правой частью линейного эллиптического уравнения при наличии ограничений па функцию состояния системы. Строятся итерационные методы для решения сеточной задачи. Приводятся теоремы об их сходимости. На основе вычислительных экспериментов производится оценка эффективности этих методов.
Ключевые слова: оптимальное управление, седловая задача с ограничениями, итерационные методы.
Введение
Конечно-элементные и конечно-разностные аппроксимации задач оптимального управления в правой части линейного эллиптического уравнения или граничного условия приводят к конечномерным седловым задачам большой размерности с ограничениями. Эти задачи возникают при использовании функции Лагранжа. При наличии ограничений лишь на вектор состояния у седловая задача преобразуется к включению с многозначным оператором относительно у или относительно А. Для решения этих включений можно использовать различные итерационные методы. Сходимость ряда таких методов обоснована в работе [1]. Однако теоретические оценки скорости сходимости либо отсутствуют, либо не дают точной информации об эффективности метода. Основная цель настоящей статьи это построение и сравнительный анализ эффективности итерационных методов решения сеточной аппроксимации одной задачи оптимального управления.
Решению задач оптимального управления посвящена обширная литература. Метод решения задач оптимального управления с ограничениями на управление с применением стратегии активного множества прямых и двойственных переменных был рассмотрен в работе [2]. Отметим, что в [3] предложен предобусловлен-ный метод Удзавы. который является эффективным для таких задач. В работе [4] предложен метод расширенного лагранжиана для решения задач оптимального управления с ограничениями как на состояние, так и на управление. Итерационные методы для решения седловых задач с ограничениями большой размерности предложены в [5].
В настоящей работе численно решена модельная сеточная задача конечноразностная аппроксимация на равномерной прямоугольной сетке задачи управления в правой части уравнения Пуассона с простыми ограничениями на вектор состояния. Построены итерационные методы для соответствующих включений относительно векторов и, у и А. Приведены известные результаты о сходимости итерационных методов и оценки скорости сходимости. Предложен новый итераци-
у
добусловливателем Ь и неполным обращением оператора —Ь + дв. где дв суб-
т
дифференциал индикаторной функции ограничений на у, т - параметр метода.
На основе анализа результатов численных экспериментов проведен сравнительный анализ методов и сделан вывод о наибольшей эффективности данного метода.
1. Постановка и аппроксимация задачи оптимального управления
Пусть Q С М2 - ограниченная область с кусочно-гладкой границей 8Q. Рассмотрим однородную задачу Дирихле для уравнения Пуассона:
—Ay = f + u, x £ Q, y(x) = 0, x £ dQ, (1)
где f - заданная функция, u - функция управления. Обобщенная постановка этой задачи определяется с помощью интегрального тождества
y £ V : j Vy • Vz dx = j(f + u)z dx Vz £ V. (2)
n n
Здесь V = Hq(Q) - пространство Соболева функций, имеющих обобщенные первые производные из L2(Q) и равных нулю на границе области, со скалярным произведением (y,z) = j Vy • Vz dx и нормой ||y|| = (y, y)1/2. Задача (2) однозначно n
разрешима при любой правой части f + u £ L2(Q) и справедливо неравенство устойчивости
||y||v < k||f + u|b2(n), k = const. (3)
Зададим множество ограничений
Yad = {y £ V : y(x) < 0.5 Vx £ Q}
и целевой функционал
Ау>и) = \ J (y - Vd)2 dx -\- i J u2 dx,
n
где у а £ Ь2(П) - заданная функция.
Теорема 1. Задача оптимального управления
шт 7 (у,и),
(у,«)ек (4)
К = {(у, и) : у £ Уаа,и £ Ь2(П) и выполнено (2)},
имеет единственное решение.
Доказательство. Множество К выпукло и замкнуто в Яо(П) х Ь2(П) в силу выпуклости и замкнутости Уаа и линейности уравнения состояния (2). Таким образом, К слабо замкнуто в ЖП) х Ь2(П). Функционал 7(у,и) коэрцитивен
по и равномерно по у: ,]{у^и) > - J и2 dx для каждого у £ Нд(0,), поэтому
п
Иш 7(у,и) ^ то равномерно относительно у. Пусть {уп,ип} £ К - минимизи-
рующая последовательность: J(yn,un) ^ J = inf J(y,u). Из условия коэрци-
(y,u)EK
тивпости J(y, u) следует, что ||un|| ^ C для каждого п. Далее, так как для решения y уравнения (2) справедливо (3), то ||yn|| ^ C для каждого п. Из ограниченной
{yn, un}
у, и подпоследовательность, сохраним за ней обозначение {уп,ип}. В силу непре-
К
{у, и} £ К. Функционал 7 слабо полунепрерывен снизу на Н(П) х Ь2(П), поэтому
7о = ИшЫ 7(уп,ип) > 7(у, и),
п—— ^
а значит, пара (у, и) является решением задачи оптимального управления (4). □
Рассмотрим конечно-разностную аппроксимацию задачи (2) в случае квадратной области П = (0,1) х (0,1). Аппроксимируем краевую задачу (1) конечноразностной схемой на равномерной сетке с шагом Н: ш = {ж^ = (гН,^’Н), 0 < г < п+ + 1, 0 < ] < п +1}. При аппроксимации целевого функционала будем использовать составную квадратурную формулу трапеций. В результате получим конечномерную задачу:
найти минимум функции J(у, и) = —1|у — у^Ц2 Л—|М|2 при ограничениях
^2 ( Уг~Ц У' I У I ^У'Ц УЦЛ-1 УЦ — 1) ./'/7 I ; -./ I -
y0j = у] 0 = %п+1 = уп+1] = 0,
у^- < 0.5, г, = 1, 2,. . ., п.
п
Выше использованы обозначения ||«У2 = Н2 «2, Ь - матрица сеточного опе-
i,j=1
ратора Лапласа с граничными условиями Дирихле, Е - единичная матрица, в -
у
в(у) = |0, ^ < 0.5,
[+то, Уij > 0.5.
Тогда сеточная задача оптимального управления примет следующий вид:
шт 7(у, и),
(у,«)ек (5)
К = {(у, и) : у* < 0.5, Ьу = / + и}.
Функция Лагранжа для (5) имеет вид
1 2 1 2 Цу,и,Х) = -\\у — у с1.\\~ + 6 {у) + ^1МГ + {\Ьу — и — /), (6)
и ее седловая точка (у, и, А) - решение следующей седловой задачи, которая эквивалентна конечномерной задаче управления [1, с. 81 82]:
Е 0 Ь
0 Е -Е . (7)
Ь -Е 0
Здесь
„ ([0, +то), уі = 0.5,
дв(у) = {д%)і,* = 1 ...п2} = ^’
I 0, уі < 0.5,
дв - субдифференциал функции в - многозначный монотонный оператор. Напомним, что его резольвента (Е+дв)-1- однозначный липшиц-непрерывный оператор. Задача (7) имеет единственное решение [3].
у и А
-Ь (Е + дв)-1(_ЬА + уа)+ А = _/. (8)
Аи
у
Ь2у + у + дв(у) э Ь/ + уа. (9)
в
руемой функцией
1п
^ = ^Е(^-°"5)+)2’ (10>
г=1
А у и
Ь-1(Е + Уве)(Ь-1(/ + и)) + и = Ь-1уа. (И)
Ауи
ственно. мы можем определить остальные векторы из соответствующих уравнений системы (7).
2. Итерационные методы решения конечномерной задачи оптимального управления
В данном разделе рассмотрены итерационные методы решения седловой задачи (??) и ее регуляризированного варианта. Приведены формулировки методов, результаты о сходимости и скорости сходимости (при их наличии), а также алгоритмы их реализации. Наряду с известными и ранее используемыми итерационными методами предложен новый алгоритм, основанный на двухступенчатой реализации одношагового итерационного метода для вариационного неравенства с Ь2 + Е
2.1. Предобус лов ленный метод Удзавы. Для решения (8) рассмотрим иредобусловленный метод простой итерации:
\к+1 \к
Ь2-----------Ь{Е + дв)-1{-ЬХк +Ус1)+Хк = -/. (12)
Т
Он совпадает с предобусловленным методом Удзавы для отыскания седловой точки функции Лагранжа (6). Реализация этого метода включает следующие шаги.
1. Вычисляем / = Ь-1/.
А0
Для к = 0,1, 2,...
Ак ик = Ак ук
ния с диагональным максимально монотонным оператором (Е + дв)ук э _ЬАк.
4. Вычисляем рк = Ь-1ик.
5. Решаем относительно V уравнение
ь- = (-ук+рк + 7).
Т
6. Перевычисляем Ак+1 = Ак + т«.
В [3] установлено, что итерационный метод (12) сходится при условии
2
0<т<^ТТ' (131
где kf = ----——, Am;n(L) = р- sin2 Щ- минимальное собственное число двумер-
Amin(L)
ного сеточного оператора Лапласа с условиями Дирихле на равномерной сетке. Кроме того, если функцию в заменить на регуляризированную функцию вЕ из (10), то метод (12) сходится при условии (13), а при оптимальном значении
І
г = г0
k2 + 1
справедлива оценка скорости сходимости
||Ак+1 — А||в < р1/2\\\к — А||в, Р=1-(1+£)^2 + 1). В=Ь2- (!4)
В случае отсутствия ограничений на состояние (в = 0) оптимальный параметр то и множитель р в оценке скорости сходимости (14) равны
1 к2
то = , о , , Р =
к2 +1 ’ г к2 + 1
2.2. Градиентный метод отыскания вектора управления. Пусть индикаторная функция в(у) = 1уаЛ (у) множества Уаа аппроксимирована дифференцируемой функцией 0е(у) с градиентом УвЕ{у) = -(у —0.5)+. Тогда можно
исключить векторы у и А из системы (7) и получить уравнение для вектора и:
РЕи = ^ , ч
Реи = Ь-1 (Е + Уве)(Ь-1(и + /))+ и. 1 ’
Применим для решения (15) двуслойный итерационный метод
Uk+1_uk
^ +Peuk = L-1yd. (16)
Он состоит состоит из следующих шагов.
ио
Для к = 0,1, 2,...
2. Для известного вектора управления ик находим ук - решение уравнения состояния Ьук = ик + /.
3. Находим сопряженное состояние Ак: Ак = —Ь-1(ук + Уве(ук) — у^).
4. Решаем относительно V уравнение
ь- = (-ук+рк + 7).
т
5. Перевычисляем
ик+1 = (1+ т )ик + тАк. (17)
В [3] установлено, что задача (15) имеет единственное решение, итерационный метод (16) сходится при
2е
0 < г < -ргг---------,
к2 (1 + е) + е
к
е
г = т0
k 2 (1 + є) + є
скорость сходимости характеризуется неравенством
£
1к+1 — и|| < р||ик — и||, р = 1 —
к2 (1 + £) + £ '
При отсутствии ограничений на состояние в задаче оптимального управления (2) (в = 0) оптимальный итерационный параметр то и множитель сокращения р
г к2
А^ + 1 ’ А^ + 1
2.3. Метод последовательной верхней релаксации(8011). Из последнего соотношения (7) имеем у = Ь-1(/ + А). Подставляя полученное выражение в первое соотношение (7). мы получаем задачу:
Ь2у + у + дв(у) э Ь/ + у^.
Таким образом, имеем конечномерное включение с положительно определенной матрицей Ь2 + Е, поэтому мы можем применить метод последовательной верхней релаксации БОИ для ее решения [1. с. 34]:
Ук+1 + 1к+1 = (^ - :) + I/ +
7к+1 е дв(ук+1).
Здесь ЦГг+я, - нижняя, верхняя треугольная и диагональная ча-
сти симметричной матрицы Ь2 + Е соответственно. При реализации этого метода выполняются следующие шаги.
уо
Для к = 0,1, 2,...
2. Вычисляем
Ь = — 1^ Е>Ь2+Еук — иЬ2+Еук + Ь/ + уа.
3. Решаем относительно ук+1 включение с нижней треугольной матрицей
+ и1-+Е^ Ук+1+1к+1 = ь, !к+1 € дв(ук+1).
Приближенное значение управления есть ик = Ьук — /. Данный метод сходится при ш е (0, 2) [1, с. 34].
2.4. Двухступенчатый метод с предобусловливателем Ь. В данном пункте приводятся описания двухступенчатого метода с предобусловливателем Ь
и полным обращением —Ь + дв. а также предлагаемого нового двухступенчатого
т1
метода с предобусловливателем Ь и неполным обращением —Ь + дв. Рассмотрим
т
Ь
ется точное либо приближенное решение включения ук+1 — ук
ЬУ------у_ + Щук+1} э ь/ + ^ _ ь2ук (18)
При реализации этого метода выполняются следующие шаги.
1. Задаем начальное приближение у0.
Для к = 0,1, 2,...
2. Вычисляем управление = Ьук — /.
3. Точно или приближенно решаем включение относительно ук+1
1 к
Ь---—Ь 7&+1 = г/й — уй — Ьик, 7й+1 е 90(уй+1) с помощью метода БОК.
т
который можно представить следующим образом:
3.1. Задаем начальное приближение ук+1’0 = ук.
Для в = 0,1,...
3.2. Вычислявм р = —Ьик + у^ — ук+1,я.
3.3. {^рь + П1^ук+1^1 +1к+1^1 = ^ -\^Вьук+1’° - иьук+1’° +р°,
где ^к+1,я+1 € д0(ук+1,я+1), В^, - диагональная, нижняя и верхняя тре-
угольная части матрицы Ь соответственно.
Рассмотрим случай полного обращения (18). В численных экспериментах производится 1000 внутренних итераций БОК (п. 3.1 3.3), такое количество достаточно для нахождения решения с очень большой точностью. Из теоремы, приведенной в [1, с. 30], следует сходимость данного метода.
Пусть А* и А* - максимальные и мшшальше собственные числа матрицы Ь
соответственно. Поскольку 0 < Е < — Ь и А< Ь2 < А*Ь, то А< Ь2 +
А*
+-Е < —|-А*^Ь. Поэтому теоретически оптимальный параметр то и множи-
тель сокращения нормы погрешности р равны соответственно [1, с. 30]:
о у—Ь А* — А*
т0 =------у------= <Э(/?2), Р=~г--------------= 1 — 0(Ь2).
А* + — + А* д; + л* + л*
А*
Ь
неполным обращением —Ь + дв включает в себя неточное решение (18). Поскольку
т1
двухступенчатый метод с предобусловлнвателем Ь и полным обращением —Ь + дв
т
сходится при т € (0; ей2), то при реализации варианта данного метода с неполным
обращением —Ь + дв необходимо задать параметр т € (0; т/,). Параметр т/, завит
сит от Н и количества внутренних итераций БОК. В численных экспериментах, где Н = 10-2, производится 10 внутренних итераций БОК, т = 1.2 • 10-5. Численные эксперименты, приведенные в п. 3, показали, что новый двухступенчатый метод с
предобусловлнвателем Ь и неполным обращением —Ь + дв дал приемлемое при-
т
блнженне за меньшее количество арифметических операций, поэтому он является наиболее эффективным для решения задачи (5) при п = 100.
2.5. Метод Дугласа —Рэкфорда. Для решения системы (9) данный метод состоит из следующих шагов.
у0
к = 0, 1, 2, . . .
2. Решаем включение относительно ук+1/2 :
ук+1/2 — ук
^--------У— + Ь2ук + ук + дв(ук+1/2) э ь/.
3. Решаем систему линейных алгебраических уравнений относительно ук+1:
ук+1 _ ук+1/2
-----У-----+ (Ь2 + Е)(ук+1 - ук) = 0. (19)
т
Матрица системы линейных уравнений в (19) есть Ь2 + ^1 И—^ля °^Ра_
щения указанной матрицы применялся метод сопряженных градиентов с предобу-Ь2
Метод Дугласа - Рэкфорда сходится при любом параметре т > 0, его оптималь-т
иый параметр тоР| = —. где т и М соответственно минимальное и максималь-М
ное собственные числа матрицы Ь2 + (1 + Е [1. с. 38].
3. Результаты численных экспериментов
В таблицы включены результаты расчетов, проведенных с помощью описанных
1 И ||2 1 И ||2
выше методов. Использованы следующие обозначения: Е = — 11уй 11^ к
номер итерации, у, и — компоненты точного решения (7).
Численные эксперименты были проведены при / = 20, у^ = 0. Было найдено у
не превосходящей 10-3, где норма невязки есть величина И|Ь2у + у + 7 _ Ь/И , 7 € д0(у). Для всех методов при проведении численных расчетов критерием окончания являлось выполнение неравенства | |и _ ик|| < 0.01. Дополнительным ограничением было максимальное число итераций: 70000 для метода БОК, 40000 для остальных методов.
Для методов Дуглас Рэкфорда, регуляризации было использовано теоретиче-
т
пеичатого метода с предобусловливателем Ь и неполным обращением —Ь-\-в
т
оптимальный параметр был найден на основе численных экспериментов. Для двухступенчатого метода с предобусловливателем Ь и с полным обращением —Ь + в
т
т
обращением —Ь + в. т
Трудоемкость одной итерации предобусловленного метода Удзавы и метода регуляризации не меньше трудоемкости трех внутренних итераций двухступенчатого
метода с предобусловливателем Ь и неполным обращением —Ь + дв в силу того.
т
что предобусловлеииый метод Удзавы включает в себя решение включений и двух Ь
В случае использовании метода БОК мы решаем вариационное неравенство с матрицей Ь2 + Е, у которой 11 диагоналей. Матрица вариационного неравенства, которое решается на каждой внутренней итерации двухступенчатого метода
Ь
одной внутренней итерации этого метода в 1.8 раза меньше, чем метода БОК.
Ь
щеиием — Ь + дв количество внутренних итераций равно 2000. то есть в 200 раз т
больше, чем в варианте данного метода с неполным обращением. С помощью чист
для варианта данного метода с полным обращением был близок к оптимальному. Из приведенных выше рассуждений и в силу результатов численных экспери-
и
Табл. 1
1 = 20, к = 10-2 , ^(у,и) = 44.1789
Метод ЗОИ., и> = 1.97 Двухступенчатый метод с предобуслов-ливателем Ь с неполным обращением — Ь + дв. и> = 1.98 т
к Р \\ук-у\\ \\ик — м|| к Р \\ук-у\\ \\ик — м||
1 195.98 0.36267 13.9456 1 195.98 0.36273 13.9679
2 194.0434 0.36251 13.8669 2 194.3562 0.36258 13.8793
3 192.9361 0.36238 13.8076 3 193.1083 0.36244 13.8036
4 192.1041 0.36226 13.7581 4 192.0452 0.36229 13.736
5 191.4129 0.36215 13.7149 5 191.1005 0.36215 13.6743
6 190.8097 0.36205 13.676 6 190.2407 0.362 13.6171
7 190.2682 0.36196 13.6403 7 189.4462 0.36186 13.5636
8 189.7731 0.36186 13.6072 8 188.7041 0.36171 13.513
9 189.3148 0.36177 13.5762 9 188.0056 0.36157 13.465
10 188.8867 0.36169 13.547 10 187.344 0.36142 13.4193
200 167.27 0.35288 11.9266 200 146.3481 0.33547 10.1945
52825 44.1789 0.00007 0.0099994 8457 44.1789 8.3173е-005 0.0099954
Табл. 2
1 = 20 к = 10-2 , ^(у,и) = 44.1789
Предобусловлеппый метод Удзавы. т = 1.8. А0 = 0 Градиентный метод отыскания вектора управления, є = 10~Б. т = 2 • 10~Б
к Р \\ук-у\\ \\ик — м|| Р \\ук-у\\ \\ик — м||
1 0 0.36287 9.3929 143.5489 0.38734 7.6928
2 0.10891 0.1552 9.319 143.5467 0.38733 7.6926
3 0.098385 0.10851 9.2813 143.5444 0.38733 7.6925
4 0.10924 0.12288 9.2428 143.5422 0.38732 7.6924
5 0.10903 0.098583 9.2049 143.5399 0.38731 7.6922
6 0.12149 0.11249 9.1667 143.5377 0.38731 7.6921
7 0.12668 0.097066 9.1291 143.5355 0.3873 7.692
8 0.14047 0.1069 9.0913 143.5332 0.38729 7.6918
9 0.14996 0.097002 9.0539 143.531 0.38729 7.6917
10 0.16541 0.10343 9.0165 143.5288 0.38728 7.6916
300 21.1177 0.056767 3.0148 142.8815 0.38534 7.6537
500 31.2662 0.04254 1.7005 142.4368 0.38401 7.6277
40000 43.9695 0.0013957 0.35539 77.0018 0.15788 3.2674
мы получили с помощью предложенного нами двухступенчатого метода с предо-
бусловлнвателем Ь и неполным обращением —Ь + дв затратив на это меньшее
т
количество арифметических операций, чем другими методами. Таким образом, предложенный в настоящей статье итерационный метод оказался наиболее эффективным для решения сеточной задачи (5) на сетке с количеством узлов по одному направленню равным 100.
Автор благодарен профессору А.В. Лапину за полезные замечания при работе над статьей.
Работа выполнена при финансовой поддержке РФФИ (проект Д*1' 10-01-00629).
Табл. 3
f = 20 h = 10-2., F(y,u) = 44,1789
Метод Дугласа Рэкфорда, т = 1.6 • 10 4 Двухступенчатый метод с предобуслов-ливателем L с полным обращением — L + дв. w = 1.98. т = 1.2 • 10-6 Т
к F \\ук-у\\ \\ик - м|| к F \\ук-у\\ \\ик -м||
1 194.1018 0.36192 13.9522 1 195.98 0.36265 13.9583
2 193.0127 0.36268 13.8563 2 194.2113 0.36244 13.8583
3 191.2617 0.36255 13.7189 3 192.7949 0.36222 13.7734
4 189.1669 0.36162 13.5637 4 191.5971 0.36201 13.6988
5 186.8248 0.35998 13.3976 5 190.5467 0.36179 13.6316
6 184.2797 0.35767 13.2234 6 189.6024 0.36158 13.5699
7 181.5571 0.35473 13.0423 7 188.7386 0.36136 13.5127
8 178.6751 0.3512 12.855 8 187.9383 0.36115 13.4591
9 175.649 0.3471 12.6618 9 187.1899 0.36093 13.4084
10 172.4923 0.34248 12.4632 10 186.4845 0.36072 13.3604
40000 44.1799 0.00047667 0.051959 5729 44.1789 9•10~ь 0.0099906
Summary
M.G. Khasanov. Comparative Analysis of Methods for Solving an Optimal Control Problem.
Approximation of a state-constrained optimal control problem with the right-hand side of a linear elliptic equation by the finite difference method is considered. Iterative methods for solving grid problems are built. Their convergent conditions are given. According to numerical results, analysis of their efficiency is done.
Key words: optimal control, saddle problem with constraints, iterative methods.
Литература
1. Jlanun, А.В. Итерационные методы решения сеточных вараицпоппых неравенств.
Казань: Изд-во Казан, ун-та, 2008. 132 с.
2. Bergouniuox М., Itu К., Kunisch К. Primal-dual strategy for constrained optimal control problems // SIAM J. Contr. Optim. 1999. V. 37, No 4. P. 1176 1194.
3. Лапин А.В., Хасанов М.Г. Решение задачи оптимального управления правой частью эллиптического уравнения при наличии ограничений па состояние // Учен, зап. Казап. уп-та. Сер. Физ.-матем. пауки. 2010. Т. 152, кп. 4. С. 40 56.
4. Bergouniuox М., Kunisch К. Augmented lagrangian techniques for elliptic state constrained optimal control problems // SIAM J. Contr. Optim. 1997. V. 35, No 5.
P. 1524 1543.
5. Gracer C., Kornhuber R. Nonsmoot.h Newton methods for set-valued saddle point problems // SIAM J. Numer. Anal. 2009. V. 47, No 2. P. 1251 1273.
Поступила в редакцию 23.06.11
Хасанов Марат Гумярович аспирант НИИММ им. Н.Г. Чеботарева Казанского (Приволжского) федерального университета.
E-mail: maratkhasanovS6Qgmail.сот