Серия «Математика»
2010. Т. 3, № 3. С. 28-40
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.97
Оптимизация гиперболических систем при интегральных ограничениях на гладкие управления *
A. В. Аргучинцев
Иркутский государственный университет
С. А. Авдонин
Университет г. Фэйрбэнкс, США
B. П. Поплевко
Иркутский государственный университет
Аннотация. В статье рассматривается задача оптимального управления гиперболической системой первого порядка в классе гладких управляющих воздействий, стесненных интегральными ограничениями. Для задачи получено неклассическое необходимое условие оптимальности, проведен численный эксперимент.
Ключевые слова: гиперболическая система, гладкое управление, необходимое условие оптимальности, специальная вариация управления.
В данной работе исследуется один специальный класс задач оптимального управления гиперболической системой, в которой начально-краевые условия определяются из управляемой системы обыкновенных дифференциальных уравнений. Эта задача рассматривается в классе гладких управляющих воздействий, стесненных интегральными ограничениями. Такие задачи возникают при моделировании ряда процессов химической технологии (расчет пусковых режимов химико-технологических объектов, переходов от одного стационарного режима к друго-му)[4]. Для такого рода задач неприменимы методы оптимального уп-
* Работа выполнена при финансовой поддержке РФФИ, проекты 08-01-00709, 08-01-98007 и Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг.
1. Постановка задачи
равления, использующие разрывные (игольчатые) вариации [6]. Необходимое условие оптимальности в классе допустимых гладких управлений для полулинейных гиперболических систем первого порядка основано на использовании специальных вариаций, обеспечивающих гладкость варьируемых управлений и выполнение ограничений [1, 2, 3]. Доказанное условие оптимальности служит основой для построения численных методов улучшения допустимого управления.
Пусть управляемый процесс {и, ж} подчинен следующей начальнокраевой задаче:
^ + Л(М)*&!> = f (*(М),М), (1.1)
ж(в,*) € (в,^) € П, П = 5 х Т, 5 = [в0,в1],Т =
Здесь ж(з,*) - п-мерная вектор-функция, А(з,*) - матрица п х п. Предполагаем, что система (1.1) записана в инвариантном виде, т. е. матрица А(з,*) - диагональная. Дополнительно введем предположение, что диагональные элементы аДз, *), г = 1, 2,..., п, матрицы коэффициентов знакопостоянны в П:
аДз,*) > 0, г = 1,2,...,т1; аДз, *) = 0, г = т1 + 1, т1 + 2,..., т2; аДз, *) < 0, г = т2 + 1, т2 + 2,..., п.
Составим две диагональные подматрицы: А+(з, *) размерности Ш1 х т1 и А-(8,*) размерности (п — т2) х (п — т2) из положительных и отрицательных диагональных элементов матрицы А соответственно. Из вектора состояния ж выделим два подвектора, соответствующих положительным и отрицательным диагональным элементам матрицы А:
ж+ = (ж1, ж2, . . . , жт1), ж = (жт2+1, жт2+2, . . . , жга).
Начально-краевые условия
ж(з, *0) = ж0(з), 8 € 5; ж-(81, *) = д(*), * € Т,
^ж 1(в0,*) = ^(ж+(в0, *), и(*), *) + М(*)ж-(80,*), * € Т (1.2)
ж+(30,*0) = (ж0(80)) + , ж-(31,*0) = (ж0^))-.
Здесь М(*) - матрица размерности т1 х (п — т2). Под допустимыми управлениями будем понимать непрерывно-дифференцируемые функции, удовлетворяющие интегральным ограничениям:
J Ф^-(и(*)) ^ ^, ] = 1, 2,...й, (1.3)
т
с дополнительным условием однородности подынтегральных функций
Ф^-(Ли) = ЛaФj(и), а > 1.
Целью задачи оптимального управления является минимизация функционала
3(и) = У ^(ж^,^), 5) ^ ^(ж(«, ^), 5, ^) (1.4)
5 П
Задача оптимального управления (1.1)—(1.4) рассматривается при следующих предположениях:
1) диагональные элементы аг(з,£), г = 1, 2,...,п матрицы А непрерывно дифференцируемы в прямоугольнике П;
2) вектор-функции д(£) и ж0^) непрерывны соответственно на Т и £;
3) вектор-функция д = д(ж+(з0, £), и(£), £) непрерывна по совокупности своих аргументов и имеет непрерывные и ограниченные частные производные по ж+ и и;
4) элементы матрицы М(£) непрерывны на Т;
5) вектор-функция /(ж, 5, £) непрерывна по совокупности своих аргументов и имеет непрерывные и ограниченные частные производные по ж;
6) скалярные функции ^ = <^(ж, 5), ^ ^(ж, 5, ^) непрерывны по
совокупности своих аргументов и имеют непрерывные и ограниченные частные производные по ж.
Отметим, что краевые условия, определяемые из системы уравнений (1.2), являются абсолютно-непрерывными на Т функциями. В рассматриваемом случае для любого допустимого управления существует единственное обобщенное решение начально-краевой задачи (1.1)—(1.2) из класса непрерывных в П функций, каждая компонента жДз, £) которого непрерывно-дифференцируема вдоль любой характеристики г-го семейства характеристик [5]. И справедливо вместо левой части системы (1.1) рассмотреть дифференциальный оператор
/^ж\ //^жА /йжг\ /йжга\ \
а \\ & )аЧ м )а’"'Ч V ’
где (^ж^/^)а - полная производная компоненты жДз, £) решения ж(з,£) вдоль соответствующего семейства характеристик.
2. Формула приращения
Исследование задачи проведем с использованием формулы приращения целевого функционала на двух допустимых процессах: базовом - {и, ж =
ж(з,£,и)} и варьируемом - {и = и + Аи;ж = ж + Аж = ж(«, £,и)}. Обозначим
А3 (и) = 7 (и) — 3 (и).
Очевидно, что
А3(и) = У А^(ж(з, ^), з) ^ + УУ А^(ж,^) (2.1)
5 п
Система в приращениях имеет вид:
/ ^Аж\ .
(-5Т) а = А/ (ж’м)’
Аж(з,£0) = Аж-(^1,£) = 0.
^Аж£) = А$(ж+ («0,£),и,£) + М(£)Аж-(з0,£), Аж+(80,£0) = 0. Здесь
А/(ж, 8, £) = / (ж, 8, £) — / (ж, 8, £),
Ад(ж+ (з0, £), и(£), £) = д(ж+(80, £), и(£), £) — д(ж+(з0, £), и(£), £),
Проделаем ряд достаточно стандартных операций, обычно используемых при выводе необходимых условий оптимальности первого порядка. В формуле (2.1)
- добавим нулевые слагаемые
У < р(£), ^Аж^£50,£) — Ад(ж+(з0, £), и, £) — М(£)Аж-(80,£) > ^£, т
Ц < ^(з, £)^^^£ж) — А/(ж,8,£) > ^^£,
п а
где ^(^,£), р(£) - некоторые, пока неопределенные, нетривиальные вектор-функции;
- применим формулы интегрирования по частям к слагаемым
I < Р(0, > л
т
. /^Аж\ , ,
< ^(^,£), —— >
\ /а
п
Получим:
А3(и) = У А^(ж(^,£1), 8) ^—
— < р(£1), Аж+(з0, £1) > — J < р, Аж+(з0, £) > ^£—
т
— J <р(£), Ад(ж+(80, £), и(£), £) + М(£)Аж-(з0,£) > т
+ У < 0(8,£1), Аж(з,£1) > — < 0(8,£0), Аж(з,£0) > ^—
— J < 0(«0, £), А(з0, £)Аж(з0, £) > — < ^(з1, £), А(з1, £)Аж(з1, £) > ^£—
т
— УУ < +А50, Аж(«, £) > ^«^—УУ <0(8, £), А/(ж, 8,£) > ^^—
п а п
— УУ А^ (ж, з,£)^з^£. п
Введем вспомогательные функции
Я(0, ж, 8, £) = (0, /(ж, 8, £)) — ^(ж, 8, £),
Л,(р, ж+(^0, £), ж-(«0, £), и(£), £) = (р(£),д(ж+(50, £), и(£), £) + М(£)ж-(80, £)). Заметим, что
АЯ(0, ж, 8, £) = Я(0, ж, 8, £) — Я(0, ж, 8, £),
АЛ,(р, ж+, ж-, и, £) = А~Л,(р, ж+, ж-, и, £) + А~+ Л,(р, ж+, ж-, и, £).
Представим приращения А~+ Л,(р, ж+, ж-, и, £), АЯ(0, ж, 8,£),
А^(ж(^, £1), 8) по формуле Тейлора первого порядка, выделив линейную часть относительно приращения Аж+ и Аж соответственно:
А~+ Л,(р,ж+ ,ж-,и,£) =< д^(р,ж^ж’+ ,и,£), Аж+(£) > +о^(||Аж+(£)||), АЯ(0,ж,в,*) =< дЯ(0,^жУ,5,£), Аж(8,£) > +он(||Аж(в,*)||),
А^(ж(в,£1),в) =< ^ ^ 1 ^ ;,Аж(в,£1) > +о^(||Аж(в,£1)||),
д^(ж(^, £1), 8) дж
дж
Потребуем, чтобы функции 0 = 0(8, £) и р = р(£) удовлетворяли сопряженной задаче:
(ж) А + А^0 = —Ях(0,ж,8,£), 0(8, £1) = —
д<^(ж(з, £1), 8)
0+^1, £) = 0, ^-(«0,= —[А-(§о,£)]-1Мтр, р = —Л,х+ — А+(§0, ^)0+(8о, ^), р(^) = 0.
Тогда формула приращения функционала примет следующий вид:
Д7(и) = — ^ Д~Л,(р(£), ж+^0, £), ж-^0, £), и(£), £) ^ + п, (2.2) т
где
П = У о^(| |Дж(«, ^1)11) ^ — JJ он(|| Дх(«, ^)||) ^£—
5 п
М||Дж+||)+ < Д^^ж+, Дж+(80,^) >]
т
Формула приращения (2.2) представляет собой удобный промежуточный результат при доказательстве необходимых условий оптимальности.
3. Специальная вариация управления
Дальнейший вариационный анализ исследуемой задачи основан на использовании неклассических вариаций, обеспечивающих гладкость допустимых управлений. Проварьированное управление будем строить по правилу
ие,ё(£) = А(£)и(£ + е£(£)), А(£) = (1 + е<5(£)) “. (3.1)
Здесь е € [0,1] - параметр, характеризующий малость вариации, £(£)
- дважды непрерывно-дифференцируемая функция, удовлетворяющая условиям
£0 < £ + £(£) < ^, £ € Т,
6^0) = Я(*1) = 0, (3.2)
|<*(*)| < 1, £ € Т. (3.3)
Выбор А(£) в форме (3.1) обеспечивает допустимость ие^(£), т. е. выполнение интегральных ограничений (1.3).
Утверждение 1. Пусть и(£) - допустимое управление, и функция £(£) удовлетворяет условиям (3.2)-(3.3). Тогда для всех е € [0,1] управление и£;г (£) является допустимым.
Доказательство. Действительно,
У Ф^(и£)г(£)) ^ = У Ф^-(А(£)и(£ + е£(£))) ^ =
тт
= | Аа(£)Фу(и(£ + е£(£))) ^ ^ У (1 + е£(£))Фу(и(£ + е£(£))) тт Сделаем замену переменной т = £ + е£(£). Тогда
^т = (1 + е<5(£))^£
и
J Фу(и£><5(£)) ^ = J Фу(и(т)) ^т = £,•, j = 1,2, ..к, тт что и требовалось доказать. □
Разложим функцию (1 + е£(£)) а в ряд по степеням е :
(1 + е6(£))а = 1 + 1 е£(£) + 4 —(— — 1)е2£2(£) + ... а 2! а а
... + (1 — 1) ■ ... ■ (1 — п + 1)еп<Г(£) + ...
п! а а а
С учетом того, что е € [0,1], для сходимости ряда при а > 1 требуется выполнение условия (3.3). Тогда приращение управления представимо в следующем виде:
Ди(£) = ие(£) — и(£) = А(£)и(£ + е£(£)) — и(£) =
= (1 + е<5(£)) а и(£ + е£(£)) — и(£) =
= [1 + 1 е£(£) + ^1 (1 — 1)е2£2(£) + ... ]и(£ + е£(£)) — и(£) = а 2! а а
= и(£ + е£(£)) — и(£) + 1 е£(£)и(£ + е£(£)) + о(е) =
а
= и(£)е£(£) + 1 и(£)е<5(£) + о(е).
а
Воспользуемся этим разложением при выводе формулы приращения целевого функционала, соответствующей вариации (2.2):
Д7(и) = — J (Ли, Ди) ^ + п1 =
т
1
а
т
—е ^(Ли, и(£))£(£) ^ — е-1 у (Ли, и(£))<5(£) ^ + П2
тт
-еУ (Ли,и(£))6(£) ^ и(^))5(^))||=Ло +
т
1 J<^и, и(^))*5(^)) ^ + П2-
+е — а т
Здесь
П1 = П - { о(||Ди(£)||) ^ т
П2 = П1 -^(Л«,о(е)) ^ о(|| Ди(^)||)
тт
Поскольку £(£0) = ^(^1) =0, а п2 ~ °(е), окончательный вариант формулы приращения имеет вид
Д7 (и) = -^у (<^и, ц/-(^)) - аа (йи,«ьжг) ^+о(е).
т
Отсюда следует
Теорема 1. Пусть процесс {и, х} является оптимальным в задаче
(1.1)-(14). Тогда всюду на отрезке Т выполняется условие
(Л«(р(£), ж+(£), х-(£), и(£), £), и(£))-
— (Лщ(р(^),х+ (^), х-(£),и(£),£),и), = 0,^ € Т. (3.4)
а
Замечание 1. Если в интегральные ограничения управления входят линейно (а = 1), то условие (3.4) запишется в более простой форме:
(Лщ*(р(£),ж+(£),х-(£),и(£),£),и) = 0, £ € Т.
При этом нет необходимости производить разложение ряд функции (1 + е5(£))а, а значит, и требовать выполнения условия (3.3).
Замечание 2. В рамках изложенной выше методики можно рассмотреть также комбинацию интегральных ограничений с односторонними ограничениями
и(£) > 0, £ € Т.
Полученное условие оптимальности представляет собой специфическое условие для гладких управлений. Его доказательство методом, основанным на исследовании формулы приращения целевого функционала, носит конструктивный характер, т. е. позволяет построить численные методы решения соответствующих задач оптимального управления и обосновать их сходимость.
4. Численный метод
Введем в рассмотрение скалярную функцию
ш(р(£), ж+(з0, £), ж-^, £), и(£), и(£), £) =
= (Лщ(р(£), ж+(з0, £), ж-(^, £), и(£), £), и(£))-
- — (Лщ (р(£), ж+ («о, £), ж- (81, £), и(£), £), и) *. а
Пусть задано начальное приближение из класса допустимых функций и0 = и0(£). Опишем к-ю итерацию метода, т. е. переход от ий (£) к иЙ+1(£), к = 0,1, 2,.... Для управления ий(£) вычисляются решения жй = жй(£), (£), ^)к = ^(з, £) - решения исходной и сопряженной систем гиперболических уравнений, строится (£) = ш(рй(£), ж+й(£), ж-й(£),
ий(£),иЙ(£),£). Если (£) = 0, £ € Т, то управление ий удовлетворяет
необходимому условию оптимальности, и алгоритм заканчивает свою работу. В противном случае выделим области
0+ = {£ € Т : ^(£) > 0},
О- = {£ € Т : ^(£) < 0}.
Определим дважды непрерывно-дифференцируемую функцию ^(£), удовлетворяющую условиям
[ > 0, £ € 0+,
^(£) = < < 0, £ € О-,
( 0, £ € 0+ и П-.
Построим однопараметрическое семейство управлений
и^ (£) = (1 + е5(£))иЙ (£ + е^ (£))
и решим задачу одномерной минимизации
еЙ : 7(и£) ^ ш1п, е € [0,1].
Следующее приближение находится по формуле
ий+1 = и^ ,к = 0,1, 2,...
Можно доказать, что последовательность управлений, генерируемая методом, является релаксационной:
3 (ий+1) < 7 (иЙ), к = 0,1, 2,...,
и сходится в смысле
^(иЙ) = J ^(£)шй(£)^£ ^ 0, к ^ то.
т
ОПТИМИЗАЦИЯ ГИПЕРБОЛИЧЕСКИХ СИСТЕМ б. Численный эксперимент
Пусть поставлена следующая задача оптимального управления:
SxM) _ ci _ _ci , . _ y(S t)
dt C1 ds = cix(s ;t) s + 2y(s ,t);
dy(s , t) dy(s , t) s + 2 . . c2 , ,
+ <*-= IT-x(s't> + s+2 y(s,t)’
Граничные условия:
dy(dr1 = cost --^2sint(x(s0lt) - y(s0lt))-
x(s^t) = esi cos t,
начальные условия:
x(s, t0) = es, y(s, to) = 0.
Приведенный ниже результат получен для следующих значений параметров:
3п
s € [0,1], t € [0, —], ci = 1, С2 = 3.
Аналитическое решение задачи:
x(s, t) = es cos t, y(s, t) = (s + 2) sin t,
при управлении u*(t) = 2 cos t. Ограничение на управление:
J u(t) dt = L.
T
Целью задачи поставим минимизацию функционала:
2
J(u) = J (x(s1;t) — esi cos t) +(y(s0,t) — 2 sin t) dt.
T
Для решения гиперболической системы получены конечно-разностные схемы. Критерием остановки служит одна из следующих ситуаций, полученных на k-й итерации метода: - достижение заданной точности по значению функционала; так как J(u*) = 0, то условием остановки может быть:
J(uk) < 10-3;
- выполнение с заданной точностью необходимого условия оптимальности для функции uk (t):
max |wk(t)| < 10-5;
- неулучшение значения функционала, полученного на предыдущей (к— 1)-й итерации, например:
3(ик) — 3(ик-1) > 10-6.
Поиск по параметру є Є [0,1] в задаче минимизации осуществлялся среди значений 1, 2, 22, 2з, ••• • Случай, когда найденное значение очень близко к нулю, соответствует неулучшению значения функционала на шаге метода. Для этой задачи функция 8 (і) определялась по следующему правилу:
(і — іо)(іі — і)и(і)
т =
(t1 — t0) max |w(t)|
(5.1)
teT
Функция §k(t), выбираемая по правилу (5.1), удовлетворяет условиям
(3.1)-(3.2). Значение константы L ~ —2 в интегральном ограничении на управление. Данная константа получена как значение интеграла для функции u*(t).
Начальное управление
u0 (t) = 2 cos t — 2 sin 6t cos 2t.
.. _/_v. uo UOBt
9 А ' ’I / \ кL \ / -- uk L\
щ. л \ / / \
К, А 1 \ ь
г 1 ...\.± *чл ' >= J Ї п \ 7
Т У ' !/ ■ >
1 Ч і
-2
-4
0.5
1.5
2.5
3.5
4.5
Рис. 1.
Алгоритм завершил свою работу на 77-й итерации. Выход осуществлен по неулучшению значения функционала. Функция ик (і) удовлетворяет неравенству |и>к(і)| < 0,0739. На рис. 1 видно, что полученное
с помощью метода управление приближено к оптимальному управлению. Проведенный численный эксперимент показал, что предложенный метод улучшения гладких управляющих воздействий, стесненных интегральными ограничениями в задаче оптимального управления начальнокраевыми условиями гиперболических систем, может эффективно использоваться для численного решения указанного типа задач.
Список литературы
1. Аргучинцев А. В. Задачи оптимального управления, возникающие при моделировании процессов химической ректификации / А. В. Аргучинцев, В. П. По-плевко // Изв. Иркут. гос. ун-та. Сер.: Математика. - 2009. - Т. 2, № 1. - С. 52-63.
2. Аргучинцев А. В. Оптимальное управление гиперболическими системами / А. В. Аргучинцев. - М. : Физматлит, 2007. - 168 с.
3. Аргучинцев А. В. Оптимизация одного класса гиперболических систем с гладкими управлениями / А. В. Аргучинцев, В. П. Поплевко // Изв. вузов. Математика. - 2009. - № 7. - С. 71-76.
4. Демиденко Н. Д. Моделирование и оптимизация систем с распределенными параметрами / Н. Д. Демиденко, В. И. Потапов, Ю. И. Шокин. — Новосибирск : Наука, 2006. - 551 с.
5. Рождественский Б. Л. Системы квазилинейных уравнений и их приложения к газовой динамике / Б. Л. Рождественский, Н. Н. Яненко. - М. : Наука, 1978. - 686 с.
6. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. - М.: Физматлит, 2000. - 160 с.
A. V. Arguchintsev, S. A. Avdonin, V. P. Poplevko
Optimization of hyperbolic systems with integral constraints for smooth controls
Abstract. An optimal control problem by first-order hyperbolic systems in a class of smooth controls is considered. Functions of controls are satisfied by integral constraints. A non-classic necessary optimality condition is given for the optimal control problem and the results of numerical experiments are given.
Keywords: hyperbolic systems, smooth control, necessary optimality condition, special variation of control function
Аргучинцев Александр Валерьевич, доктор физико-математических наук, заведующий кафедрой, Институт математики, экономики и информатики, Иркутский государственный университет, 664003, Иркутск, ул. К. Маркса, 1, тел.: (3952)20-13-07 ([email protected])
Авдонин Сергей Анатольевич, доктор физико-математических наук, профессор, отделение математики университета г. Фэйербэнкс, штат Аляска, США, University of Alaska at Fairbanks, p.o. Box 756660, Fairbanks, AK 99775-6660, USA ([email protected])
Поплевко Василиса Павловна, преподаватель, Институт математики, экономики и информатики, Иркутский государственный университет, 664003, Иркутск, ул. К. Маркса, 1, тел.: (3952)20-13-07 (vasilis [email protected])
Arguchintsev Alexander, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003, Phone: (3952)20-13-07 ([email protected])
Avdonin Sergei, University of Alaska at Fairbanks, p.o. Box 756660, Fairbanks, AK 9977-6660, USA ([email protected])
Poplevko Vasilisa, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003, Phone: (3952)20-13-07 ([email protected])