Научная статья на тему 'Нелокальный метод улучшения управлений в линейной по фазовой переменной волновой задаче'

Нелокальный метод улучшения управлений в линейной по фазовой переменной волновой задаче Текст научной статьи по специальности «Математика»

CC BY
69
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / ВОЛНОВОЕ УРАВНЕНИЕ / WAVE EQUATION / МЕТОД ХАРАКТЕРИСТИК / METHOD OF CHARACTERISTICS

Аннотация научной статьи по математике, автор научной работы — Курганова Наталья Викторовна, Терлецкий Виктор Анатольевич

В статье рассматривается задача оптимального управления с начально-краевыми условиями, где связь между управлением и состоянием определена волновым уравнением, линейным по фазовой переменной, а функции, определяющие терминальную и интегральную части целевого функционала, также линейны по фазовой переменной. Постановка задачи допускает произвольную комбинацию условий первого, второго и третьего рода на левой и правой границе области определения. Волновое уравнение не содержит в правой части первых производных от фазовой переменной. Кроме того, дифференциальный оператор уравнения имеет специальный вид. Эти два обстоятельства позволяют построить интегральный эквивалент исходной задачи в виде системы из одного интегрального уравнения для функции, являющейся решением задачи. Полученный интегральный эквивалент положен в основу определения обобщенного решения рассматриваемой задачи при произвольном фиксированном допустимом управлении. Выведены две равноправных формулы приращения целевого функционала, которые не содержат остаточных членов и, в этом смысле, являются точными. На их основе может быть построен эффективный метод улучшения целевого функционала по аналогии с тем, как это сделано для задач оптимального управления процессами, описываемыми обыкновенными дифференциальными уравнениями.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Курганова Наталья Викторовна, Терлецкий Виктор Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Non-local Method of Improving Controls in the Linear Phase Variable Wave Problems

In this paper an optimal control problem with initial-boundary conditions is considered, where the relations between the control and the state vector are determined by the wave equation, which is linear with respect to the phase variable. Also functions that define terminal and integral parts of the objective functional are linear with respect to the phase variable. The statement of the problem allows any combinations of boundary conditions of the first, second and third kinds on both left and right borders of the domain. The wave equation does not contain the first derivatives of the phase variable in the right side. In addition, the differential operator of the equation is of a special form. These two factors make it possible to build integrated equivalent of the original problem in the form of one integral equation with respect to the solution function. The resulting integral equivalent serves as the basis for the definition of a generalized solution of the problem for an arbitrary fixed admissible control. We derive two equal increments of the target functional formula that do not contain residual terms and are therefore accurate. On this basis effective methods of improving the functionality of the target can be built in a similar way as was done for optimal control of processes describable by ordinary differential equations.

Текст научной работы на тему «Нелокальный метод улучшения управлений в линейной по фазовой переменной волновой задаче»

Серия «Математика» 2015. Т. 13. С. 32—40

Онлайн-доступ к журналу: http://isu.ru/izvestia

ИЗВЕСТИЯ

Иркутского государственного университета

УДК 518.517

Нелокальный метод улучшения управлений в линейной по фазовой переменной волновой задаче *

Н. В. Курганова

Иркутский государственный университет В. А. Терлецкий

Иркутский государственный университет

Аннотация. В статье рассматривается задача оптимального управления с начально-краевыми условиями, где связь между управлением и состоянием определена волновым уравнением, линейным по фазовой переменной, а функции, определяющие терминальную и интегральную части целевого функционала, также линейны по фазовой переменной. Постановка задачи допускает произвольную комбинацию условий первого, второго и третьего рода на левой и правой границе области определения. Волновое уравнение не содержит в правой части первых производных от фазовой переменной. Кроме того, дифференциальный оператор уравнения имеет специальный вид. Эти два обстоятельства позволяют построить интегральный эквивалент исходной задачи в виде системы из одного интегрального уравнения для функции, являющейся решением задачи. Полученный интегральный эквивалент положен в основу определения обобщенного решения рассматриваемой задачи при произвольном фиксированном допустимом управлении. Выведены две равноправных формулы приращения целевого функционала, которые не содержат остаточных членов и, в этом смысле, являются точными. На их основе может быть построен эффективный метод улучшения целевого функционала по аналогии с тем, как это сделано для задач оптимального управления процессами, описываемыми обыкновенными дифференциальными уравнениями.

Ключевые слова: оптимальное управление, волновое уравнение, метод характеристик.

* Работа выполнена при финансовой поддержке РФФИ, грант 14-01-00564.

1. Введение

Качественный и конструктивный анализ линейных по фазовой переменной задач оптимального управления системами обыкновенных дифференциальных уравнений на основе нелокальных (без остаточных членов) формул приращения целевого функционала впервые подробно исследован в работе [3]. Плодотворность такой идеи объясняется по меньшей мере двумя обстоятельствами. Во-первых, на ее основе удается построить эффективные численные процедуры, в которых ценой улучшения допустимых управлений является всего одно интегрирование, правда, вообще говоря, разрывной задачи Коши. Во-вторых, соответствующие методы обладают особенностью улучшать экстремальные, удовлетворяющие принципу максимума, управления. Настоящая статья имеет своей целью распространение данного подхода к исследованию задач оптимального управления системами с распределенными параметрами.

Рассматривается управляемый процесс, в котором связь между управлением и состоянием описывается волновым уравнением не содержащим в правой части первые производные от фазовой переменной, как это могло бы быть в более общем случае [4]. Кроме того, в отличие от [4], дифференциальный оператор волнового уравнения позволяет получить эквивалентную этому уравнению систему, в которой в правых частях уравнений не содержатся первые производные от решения. В совокупности эти обстоятельства позволяют построить интегральный эквивалент исходной начально-краевой задачи в виде интегрального уравнения для функции, являющейся решением задачи, а не системы из четырех интегральных уравнений для этой функции и инвариантов Римана, как в [4].

Вывод интегрального уравнения, эквивалентного исходной задаче на гладких решениях, имеет несколько предназначений, в том числе и выходящих за рамки настоящей статьи. Во-первых, это уравнение ляжет в основу определения обобщенного решения исходной задачи и конструирования метода последовательных приближений, позволяющего установить существование и единственность так определенного обобщенного решения. Во-вторых, в случае независимости функции, стоящей в правой части волнового уравнения, от фазовой переменной, такое уравнение дает возможность для непосредственного вычисления решения исходной задачи, что является очень удобным средством для построения аналитических примеров, которые нам потребуются для иллюстрации теоретических результатов исследования задачи оптимального управления, базирующейся на волновом уравнении. В-третьих, интегральное представление решения будет весьма полезным и при составлении разностных схем для численного интегрирования поставленной задачи.

В статье выводятся две нелокальных формулы приращения целевого функционала, которые позволят сконструировать эффективные методы улучшения целевого функционала, основанные на идеях [3].

2. Постановка задачи

Пусть в области П = Б х Т, Б = (в0,вг), Т = (Ь0,Ь1) независимых переменных в, Ь связь между управлением и = и(в, Ь) и состоянием х = х(в, Ь) определена волновым уравнением

хц - к(з')(к(з')х3= !(х, и, в, Ь), (2.1)

в котором гладкая функция к(в) задана так, что выполняются ограничения 0 < к0 < к(в) < кж < а функция f линейна по состоянию

х, т. е.

f = af (и, в, Ь)х + bf (и, в, Ь). Для уравнения (2.1) поставим начальные

х(в,Ь0) = х0(в), х^в,Ь0) = х1(в), в е Б, (2.2)

и граничные

хг(вг, Ь) = дг(Ь), х3(вг, Ь) + ах(вг, Ь) = дг(Ь), г = 0,1, Ь е Т. (2.3)

условия, в которых функция х0 = х0(в) является абсолютно непрерывной, а функции х1 = хг(в) и дг = дг(Ь), г = 0,1, — измеримыми и существенно ограниченными, а именно, х0',хг е Ьж(Б), дг е Ьж(Т). Здесь х0' = х0'(в) — производная функции х0.

Будем считать, что распределенное управление и = и(в,Ь) является измеримой и существенно ограниченной функцией, удовлетворяющей почти всюду в области своего определения ограничениям типа включения

и(в,Ь) е и, (в, г) е П. (2.4)

Поставим задачу о нахождении минимума функционала

■](и) = У ф(х(в,Ьг),в)йв + JJ Ф(х,и,в,1)йвйЬ (2.5)

^ п

на решениях смешанной задачи (2.1)-(2.3) при допустимых управлениях (2.4). Функции ф и Ф, определяющие терминальную и интегральную части целевого функционала (2.5) будем также считать линейными по фазовой переменной х:

ф = а^(в)х + Ьр(в),

Ф = аф(и, в, г)х + Ьф(и, в, г).

Задачу оптимального управления (2.1)-(2.5) будем рассматривать, считая все функции а и Ь, определяющие линейные по х формы /, ф, Ф непрерывными по совокупности своих аргументов всюду в области их определения.

3. Обобщенное решение волновой задачи

В основу определения обобщенного решения задачи (2.1)-(2.3) при произвольном фиксированном допустимом управлении (2.4) положим ее интегральный эквивалент. Для вывода этого интегрального эквивалента прежде всего перепишем задачу (2.1)-(2.3) в виде системы дифференциальных уравнений первого порядка

Б±х = тт, Б±т± = /(х, и, в, г) (3.1)

с начальными

х(в, го) = х0(в), т±(в, го) = хг(в) т к(в)х°'(в), в е в, (3.2) и граничными

т+(вг ,г) + т-(вг,г) = 2дг (г),

т-(вг, г) - т+(вг, г) + 2к(вг)ах(вг, г) = 2к(вг)дг(г), г е т. (33)

условиями. Здесь дифференциальные операторы для произвольной гладкой в П функции х определяются равенствами В±х = х% ± кх3.

Путем непосредственной проверки можно убедиться в том, что некоторая непрерывная и дважды непрерывно дифференцируемая в области П функция х является решением задачи (2.1)-(2.3) тогда и только тогда, когда она вместе с функциями т± доставляет решение задаче (3.1)-(3.3). В то же время для дифференциальной задачи (3.1)-(3.3) с помощью метода характеристик [1], [2] можно построить интегральный эквивалент по схеме [5].

Введем в рассмотрение характеристики в = в±((,т; г) уравнения (2.1), определив их как решения обыкновенных дифференциальных уравнений

!=±ад

с начальными условиями в±(£,т; т) = £. При сделанных предположениях на функцию к можно утверждать, что функции в = в±(£,т; г) существуют и единственны.

Опуская технические подробности ввиду их громоздкости, приведем окончательный вид интегрального представления решения х в подобластях

Поо = {(£,т) е п' : в+(во,Ьо; Т) < £ < 8-(з1,1о; т)},

По = {(£,т) е п' : во <£< в+(во,Ьо; Т)},

где подобласть П' прямоугольника П определена равенством

П' = Б х (Ьо,Ь'), число Ь служит корнем уравнения в+(во,Ьо; Ь ) = вь

Если Ь' > то положим П' = П.

В подобласти Поо интегральный эквивалент дифференциальной задачи (2.1), (2.2) имеет вид

8-(8,г-,го)

х{8,г)- 2 2 У

в+^^о)

г 8-(8,г;т)

42/ I

tо 8+(в,г;т)

В подобласти Пю форма интегрального представления решения х существенно зависит от рода граничного условия на левой границе в = во прямоугольника П. В случае условия первого рода она выглядит следующим образом

И+(8,г) 8-(8,г;г0)

г „о,а\ля , 1 [ х1(пК . ,1 [[ /[П,т]

+ У «т>3+2 У т*>++ъ11Ш*1',г- (3-5)

го 8~(80,И+;г0) с(8,г)

Здесь С(в, Ь) = 01(в, Ь) + 02(в, Ь), где

О (в,Ь) = {(£,т) е Пю : в-(во,Ь+; Ьо) <£< в-(в, Ь; т), т е (Ьо,Ь+(в,Ь))},

С2(в, г) = {(£,т) е Пю : в+(в,Ь; т) < £ < в-(в,Ь; т), т е (1+(в,Ь),Ь)},

Ь+ = Ь+(в,Ь) - начало (при в = во) положительной характеристики, приходящей в точку (в,Ь). Аналогичные (3.5) соотношения имеют место для условий второго и третьего рода. Понятно, что для описания решения в подобласти П' прямоугольника П в зависимости от различных вариантов задания граничных условий необходимо получить еще пять соотношений типа (3.5). Не выписывая их здесь, укажем лишь, что каждый такой интегральный эквивалент получен. Показано, что все

они удовлетворяют дифференциальному уравнению (2.1), начальным и граничным условиям, заданным для решения х в соответствующих подобластях области П' и обладают непрерывной стыковкой на смежных границах.

На основе указанных интегральных эквивалентов, действуя по схеме работы [5], можно определить обобщенное решение х задачи (2.1)-(2.3) при произвольных допустимых управлениях и, доказать его существование, единственность и исследовать аналитические свойства. Перечислим результаты, которые потребуются в дальнейшем.

Во-первых, решение х является непрерывным в области П, а его частные производные хг и х3 измеримы и существенно ограничены в П. Более того, дифференциальный оператор Т>х = хц — к(в)(к(в)х3)«, имеющий смысл, вообще говоря, лишь для классического (непрерывного и дважды непрерывно дифференцируемого) решения, может быть корректно доопределен для обобщенного решения х, причем Vx €

Во-вторых, для обобщенного решения х уравнения (2.1) справедлива формула интегрирования по частям

г=г1

йв—

¿=¿0

ф^ЭхйвйЬ = J [фхг — фьх)]

П 5

— J [к2 фх3 — к(кф)« х] йЬ + !! 'В*фхйвй1,

(3.6)

«=«0

Т П

, в которой ф — произвольная функция из того же класса функций, что и обобщенное решение х, а сопряженный оператор в случае гладких функций ф определяется равенством Ъ*ф = фи — (к(кф)3)«.

4. Вывод формулы приращения целевого функционала

Пусть {и, х(и)} и {у, х(у)} — два произвольных допустимых процесса в задаче (2.1)-(2.5). Тогда приращение А3(и) = 3(у) — 3(и) целевого функционала (2.5) для произвольной функции ф = ф(в,Ь) можно записать в виде

А3(и) = ! А^(х(в, Ь\), в)йв + JJ(фVАх — АН(ф, х, и, в, Ь))йвйЬ, (4.1)

где Н = Н(ф, х, и, в, Ь) — функция Понтрягина,

Н = ф/(х, и, в, Ь) — Ф(х, и, в, Ь).

Применим формулу интегрирования по частям (3.6), введем в рассмотрение сопряженную задачу

D*ф = Hx($,x,u,s,t), (s,t) е П, 1

ф(s,ti) = 0, фt(s,ti) = <fix(x(s,ti),s), s е S, j (4.2)

ф^, t) = 0, t) + оф^, t) = 0, j

и, с учетом линейности функции Понтрягина H по фазовой переменной x, из (4.1) получим две равноправных формулы приращения целевого функционала:

AJ(и) = — JJ AvH(ф(и; s,t),x(v; s,t),u,s,t)dsdt, (4.3) п

AJ (и) = — JJ Av H (ф(v; s,t),x(u; s,t),u,s,t)dsdt, (4.4) п

Поясним. В формуле (4.3) решение ф = ф(щ s,t) сопряженной задачи (4.2) соответствует управлению u, а решение x = x(v; s,t) является решением задачи (2.1)-(2.3) при u = v. Наоборот, в формуле (4.4) решение ф = ф(v; s,t) находится при u = v, а решение x = x(u; s,t) исходной задачи (2.1)-(2.3) соответствует управлению u. Подчеркнем, что в обеих формулах (4.3), (4.4) под знаком интеграла стоит частное приращение функции Понтрягина по управлению. Это обстоятельство позволяет предложить эффективные способы улучшения целевого функционала, используя в качестве «нового» управления v функцию, максимизирующую функцию Понтрягина.

Предположим, что в рассматриваемой задаче (2.1)-(2.5) эта операция может быть реализована в аналитическом виде и введем в рассмотрение обозначение

u*(ф, x, s, t) = arg max H(ф, x, u, s, t). (4.5)

Тогда дальнейшее построение нелокальных численных методов решения задачи (2.1)-(2.5) проводится по схеме работы [3] и полностью основывается на формулах приращения (4.3), (4.4) и явном способе (4.5) нахождения максимизирующего функцию Понтрягина управления.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Годунов С. К. Уравнения математической физики / С. К. Годунов. - М. : Наука, 1979. - 392 с.

2. Рождественский Б. Л. Системы квазилинейных уравнений и их приложения к газовой динамике / Б. Л. Рождественский, Н. А. Яненко. - М. : Наука, 1978. -688 с.

3. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. - М. : Физматлит, 2000. -160 с.

4. Терлецкий В. А. Обобщенное решение нелинейного волнового уравнения с нелинейными граничными условиями первого, второго и третьего родов / В. А. Терлецкий, Е. А. Лутковская // Дифференц. уравнения. - 2009. - Т. 45, № 3. -С. 403-415.

5. Терлецкий В. А. Обобщенное решение одномерных полулинейных гиперболических систем со смешанными условиями / В. А. Терлецкий // Изв. вузов. Математика. - 2004. - № 12. - C. 75-83.

Курганова Наталья Викторовна, магистрант, Институт математики, экономики и информатики, Иркутский государственный университет, 664003, г. Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 (e-mail: navikur@gmail.com)

Терлецкий Виктор Анатольевич, кандидат физико-математических наук, доцент, Институт математики, экономики и информатики, Иркутский государственный университет, 664003, г. Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 (e-mail: vaterletskiy@gmail.com)

N. V. Kurganova, V. A. Terletsky

Non-local Method of Improving Controls in the Linear Phase Variable Wave Problems

Abstract. In this paper an optimal control problem with initial-boundary conditions is considered, where the relations between the control and the state vector are determined by the wave equation, which is linear with respect to the phase variable. Also functions that define terminal and integral parts of the objective functional are linear with respect to the phase variable. The statement of the problem allows any combinations of boundary conditions of the first, second and third kinds on both left and right borders of the domain. The wave equation does not contain the first derivatives of the phase variable in the right side. In addition, the differential operator of the equation is of a special form. These two factors make it possible to build integrated equivalent of the original problem in the form of one integral equation with respect to the solution function. The resulting integral equivalent serves as the basis for the definition of a generalized solution of the problem for an arbitrary fixed admissible control. We derive two equal increments of the target functional formula that do not contain residual terms and are therefore accurate. On this basis effective methods of improving the functionality of the target can be built in a similar way as was done for optimal control of processes describable by ordinary differential equations.

Keywords: optimal control, wave equation, method of characteristics.

References

1. Godunov S.K. Equations of mathematical physics. Moscow, Nauka, 1979. 392 p.

2. Rozhdestvenskii B.L., Yanenko N.A. Systems of quasilinear equations and their applications to gas dynamics. Moscow, Nauka, 1978. 688 p.

3. Srochko V.A. Iterative methods for solving the optimal control problems. Moscow, Fizmatlit, 2000. 160 p.

4. Terletskii V.A. and Lutkovskaya E.A. Generalized solution of a nonlinear wave equation with nonlinear boundary conditions of the First, Second, and Third Kinds. Differential Equations

5. Terletskii V.A. Generalized solution of semilinear hyperbolic systems with mixed conditions. Russian Mathematics (Iz. VUZ), 2004, vol. 12, pp. 75-83.

Kurganova Natalia Viktorovna, Undergraduate, Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 tel.: +7(3952)521282 (e-mail: navikur@gmail.com)

Terletsky Viktor Anatolievich, Candidate of Sciences (Physics and Mathematics), Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 professor, tel.: +7(3952)521282 (e-mail: vaterletskiy@gmail.com)

i Надоели баннеры? Вы всегда можете отключить рекламу.