Методы и задачи оптимального управления
УДК 517.977 ББК 65.050О-75
© А.В. Букина
Иркутский государственный университет, Иркутск E-mail annabukina @ mail. ru
Оптимальное управление моделью динамики лесных ресурсов 1
Рассматривается модель использования лесных ресурсов, в которой на жизненный цикл деревьев влияет их конкуренция за условия среды. Для соответствующей интегро-дифференциальной задачи оптимального управления с возрастной структурой получаются необходимые условия оптимальности в формах конечномерного и дифференциального принципов максимума. На их основе строится численный алгоритм улучшения допустимых управлений.
Ключевые слова: модель динамики лесных ресурсов, управляемая интегро-дифференциальная гиперболическая система, необходимые условия оптимальности, комбинированный метод.
© А. V. Bukina
Irkutsk State University, Irkutsk E-mail annabukina @ mail. ru
Optimal control of the model of dynamics of forest resources
The article deals with the model of use of forest resources, in which the competition for conditions of environment influences on the life cycle of trees. The necessary optimality conditions in the forms of finite dimensional and differential principles of maximum are deduced for the corresponding optimal control task. Numerical method, based on these conditions, is constructed.
Key words: model of dynamics of forest resources, controllable integro-differential hyperbolic system, necessary optimality conditions, combined method.
Введение
Проблема рационального использования лесных ресурсов может быть интерпретирована как задача оптимального управления. В рассматриваемой модели предполагается, что жизненный цикл каждого дерева подвержен влиянию условий окружающей среды и зависит от общего объема деревьев на некотором пространстве вокруг него. Объем деревьев, в свою очередь, определяется их возрастом. Таким образом, динамика леса описывается следующей интегро-дифференциальной задачей с возрастной структурой:
xt + xs =-m( p, s, t )x( p, s, t)- u1 (p, s, t )x( p, s, t), x( p, s, t0 ) = x0 (p, s), (1)
x( p, s0, t) = u2( p, t)
- в случае искусственных лесопосадок,
p+pi si
x(p, s0, t) = J J rx(p,%, t)dpd%
p-pisr
- если деляны зарастают естественным путем.
1 Работа выполнена при финансовой поддержке гранта ИГУ (проект 111-09-001/А1).
Здесь х(p, s, t) - плотность распределения деревьев с координатами на плоскости p = (p1, p2), возраста 5, на момент времени t, р є P = (р10 ,р11 )х(p20 ,p21), 5 є Б = ^, 5і), г є Т = (?о,^), т(р,5,г) - коэффициент естественной смертности:
’0’
р+Р2
т(р,ъ,г)= | |С(<£)х(р,&/К,
Р-Р2 5
р+р
где | | С(|)х(р,£, г)йрй% - количество кубометров леса на некотором пространстве
Р-Р 5
вокруг координаты р, К - максимально возможное количество кубометров на этом пространстве, С (5) - объем дерева возраста 5, и1( р, 5, г) - относительная скорость вырубки, и2(р,г) - плотность лесопосадок, 5г - возраст, с которого у деревьев появляются семена, г - коэффициент прорастания семян в почве.
Будем искать управления
и1 е [0,1], и2 е [и2\и22], доставляющие максимум функционалу
*0--"
(/(и1х) - си2 /(51 - 50))е ^йрйяйг, (2)
где f (и1х) - прибыль от вырубки, с - стоимость высаживаемых деревьев, X -коэффициент дисконтирования.
1. Постановка задачи
Задача (1)-(2) является частным случаем следующей задачи оптимального управления в общей форме
](и) = | |^(х(р,5,г1),р,5)^р^5 + |ЦФ(х, у, г, г, и, V, р, 5, г)йрйяйг^ шт, (3)
Р Б П
х{ + = f (х, у, г, г, и, р, 5, г),
У (р,5, г) = Л 8 (х(р, £, г ),г(р, £,, г ),г (р, £, г ),и(р, £, г), р, р, 5, £,, г ]4рй£,
Р 5
г (р,5, г) = | д(х( р, £, г ),и( р, £, г), р, 5, £, г )ё%,
5
г (р,5, г) = | к (х(р,5, г ),и(р,5, г), р, р, 5, г )^р, (4)
р
х( р, 5о, г) = Л I (х(р £ г), и(р £ г), v(p г) р,р, £ г )ф^,
РБ
х(р5, г0) = х0^,р,5).
Управления допустимы, если принадлежат следующим множествам функций
и={ие 1*и (П), (р,э,г)е и,(р,5,г)е П},
V={vе Ь1(РхГ), v(p,г)е У,(р,г)е РхТ}, (5)
W={wе (Рх5): w(p,s)е W, (р,5) е Рх5},
и е Я№, У е Ят, W е Я** заданы.
П = Рх5хТ = (р0,р1)х(50,51)х(г0,г1), у(р,5,г) е Я*у, г(р,5,г)е Я*г, г(р,5,г)е Я*г.
Функции у=у(х,р,5), ф=ф(x,у,г,г,u,v,p,s,г), вектор-функции f=f (х,у,г,г,и, р,5,г),
8=8 (х, г, г, и, р, р, 5,^, г), д = д(х, и, р, 5,^, г), к = к(х, и, р, р, 5, г), 1=1(х,и^,р,5г)
непрерывны вместе с производными по переменным х, у, г, г, по совокупности своих
аргументов в области их определения, I и х дифференцируемы по V и м, множества V, W выпуклы.
Интегральные компоненты позволяют учитывать влияние на динамику процесса общего состояния объекта по распределению характеристических признаков. Примерами различных приложений (3)-(5) служат модели в биологии, экологии, экономике [1-3]. В работе [4] для модификации данной задачи были получены необходимые условия оптимальности в формах вариационного и конечномерного принципов максимума.
2. Необходимые условия оптимальности
В силу разрывности правых частей и начально-граничных условий классических (гладких) решений задачи (3)-(5) не существует. Под обобщенным решением (3)-(5) будем понимать измеримые, существенно ограниченные вектор-функции х, у, г, г,
удовлетворяющие почти для всех (р,я,г)е П системе интегральных уравнений
х(р, я, г) = х(р, $($, г), г (я, г)) +
+
г
I I(х(р, с, т), у (р, С, т), г(р, С, т), г(р, С, т), и(р, С, т), р, с, Т)
г (я,г)
йт,
С, =*-г+т
где (.?(£, г), г (я, г)) - точка входа бихарактеристики £ = я - г + т, р е Р в область Б XТ. Если решение является гладким данная интегральная система эквивалентна исходной интегро-дифференциальной. На основе метода последовательных приближений были доказаны существование и единственность обобщенного решения. Вектор-функции х принадлежат пространству АС1(П) - измеримых и существенно ограниченных вектор-функций, абсолютно непрерывных вдоль бихарактеристик и имеющих почти всюду вдоль них производную:
й
Бх( р, я, г)
Скорость роста решения удовлетворяет оценкам
— х( р, я - г + т,т йт
||х( р, я, г)|| <
< м
х (м, р, я - г + г0),
|||/(0,и, V, р, р,£,г - я + я0 )||йрй£, я - я0 < г - г0
+
БР
+1 ||х0 (м, р,£)|| +|^(0,0,0,0, и,V, р,%,т)йт
где
+
г
х0 (м, р, £)|| + (0,0,0,0, и, V, р, £ т)йт
¥=¥(х,у,г,г,иV, р,я,г)= |||/(х,и^,р,р,£,г)|йрй^ + \I(х,у,г,г,и,р,я,г)|| +
БР
+ III к («г. и,р,р,я,£,г )|| йрй% +11\д(х,и,р,я,£,г)|| +11\к(х,и,р,р(я,г)\йр
Б Р
|| У (р, я, г )|| < м ||( к (0,0,0, и, р, р, я, £, г )|| +||д(0, и, р, я, £, г )|| +
БР
+ ||к (0, и, р, р, я, г )|| +1 |х(р, £, г )|| ]йрй%,
Р Б
т=г
Б
0
0
||г(р, я, г ^ < м | (| <?(°, и, р, г )|| +1| х( р,%, г ^ )й%,
Я
||г (р, я, г )|| < м Л к (0, и, р, р, я, г )|| +1| х(р, я, г )|| )ёр,
Р
константа М > 0 не зависит от входных данных х0, /, £, q, к, I задачи.
Получим для задачи (3)-(5) необходимое условие оптимальности управлений в форме конечномерного принципа максимума методом приращений. Прибавим к приращению функционала на двух допустимых процессах (и, V, м; х, у, г, г) и
(~ = и + Ди, - = V + Дv, м = м + Дм; - = х + Дх, - = у + Ду, - = г + Дг, - = г + Дг) очевидные нули, учитывающие фазовую задачу. Получим
А] (u,v,w)=| | Д^((х(р,я,гх ),р,я )dpds+^ (( у^Ах+в,Ау^+
3 Р п (7)
+ ,Аг)+(Л,Аг)')dpdsdt+jj (у(р,г),Ах(р,я0,г))йрйг- |ЦДИйрйяйг,
Т Р п
где у е АС1(П), в , 2, ^е (П), у(р, г) е (Р X Т) - пока произвольные вектор-
функции, у(р, я, г) е (П), в(р, я, г) е (П), 2(р, я, г) е Я*' (П), ^(р, я, г) е (П),
7(р, г) е Д7х (Р X Т), Н = Н(у, в, ^, 2,7, х, у, г, г, и, V, р, я, г) - аналог функции
Понтрягина:
Н = <у( р, я, г), f (х, у, г, г, и, р, я, г)) +
, £, г), # (х, г, г, и, р, р, £, я, г)) dрd% +
+|<^( р,^, г), q( х, и, р,%, я, г)) d% + |<2(р, я, г), к (х, и,р, р, я, г)) dр +
5 Р
+ |<7(Р, г ),1 (х, и, V, р, р, я, г )^р-Ф( х, у, г, г, и, V, р, я, г).
Р
В выражении (7) к слагаемому |Ц(y,DАx')dpdsdt применим следующую формулу
п
интегрирования по частям, которая справедлива в силу абсолютной непрерывности вектор-функций у и х,
DДx) dpdsdt = Ц«у( р, я, г1), Дх( р, я, г1)) - <у( р, я, г0), Дх( р, я, г0)) )^^я +
П
+
Д(<г( р , я1, г), Дх( р, я1, г)) - <у( р, я0, г), Дх( р, я0, г )))dpdt - ДО ^ Дх) dpdsdt.
ТР П
Проведем линеаризацию приращения функционала (7) по приращениям состояний и «удалим» слагаемые линейные относительно приращений посредством сопряженных вектор-функций, которые подчиним следующей задаче
Dу = Нх, (р,я,г)е П, у(р,я,г1) = -^х(х(р,я,гх),р,я), у(р,ях,г) = 0,
в(р, я, г) = Ну, ^(р, я, г) = Нг, 2(р, я, г) = Нг, (р, я, г) е П, у(р, г) = у(р, я0, г), (р, я, г) е П.
Перейдем к формуле приращения функционала
Д](и, V, м) = -Ц|(Д- Н + (Hv, Дv))dpdsdt -
П
- Я< хм (м, р, я)'у( р, я, г0), Дм( р, я)) dpds + п(Ди, Дv, Дм),
ЗР
П(Ди, Дv, Дм) = Цо^Ц Дх( р, я, г1), р, я)||)^^,у - Ш(< Д,Нх , Дх) + <Д - Ну, Ду) + <Д-- Нг, Дг) -
РЗ
+ <Д~-Нг, Дг) - он (|(Дх ^ ^ Дг)|) - <Ди-Н, Дv) - Он (||Д^|) + ох0 (||Дм||^рЖЛ.
П
Нетрудно видеть, что оценками приращений состояний относительно приращений управлений являются оценки (6), в которых вместо нулей стоят соответствующие состояния, а вместо параметров Г, х0, f, £, q, к, I - их приращения по управлениям. Из этих оценок следует, что на игольчатой вариации управления и и на вариациях управлений V, м, являющихся комбинациями игольчатой и слабой вариаций
, ч Гй-и(р,я,г), (р,я,г)е Пе,
Аи(рМ=и(рМ), (рл.)е пп,
А( = Н^(р,г)), (р,г)е Р Х^
^%( р,г), (р,г )е(Р х Т )х(Рв х Те),
А ( = Га(м-м(р,я)1 (р,я)е Ре х,
Ам( р,я=1м(р,я), (р,я)е(Р х 5 )х(Р х Зе),
П£ = Р£ х З£ хТ£ = (р - £,р)х (£- £,£) х (Т - £,Т), £ >0, ае [0,1],
нормы приращений состояний имеют порядок £ + а для всех (р, 8,1) е П. Поэтому на этих вариациях 7)(Ди, Дv, Дм) - о(£) + о(а) + £а. С учетом того, что производная неопределенного интеграла Лебега почти везде равна подынтегральной функции, получаем выражение
Д](и, V, м) = -£Д-Н(..., р,^,т) + а<| Ну (..., р, s,т)ds, V - v(р,т)) -
V '
СиЛ ™,У,Ъ) У \У,Ъ,
- а<х№ (м, р, #)>(р, £ г0), м - м(р, £)) + о(£) + о(а) + £а. (8)
Для достаточно малых £, а знак приращения целевого функционала определяется знаками слагаемых линейных относительно них, поэтому справедлива
Теорема. Оптимальные управления и (р,я,г), V (р,г), м (р,я) почти для всех (р,я,г)е п являются решениями задач
Н (у*,в*,ц*,2*у*, х*, у *, г *, г *, и *, V*, р, я, г) = тах Н (у*, в*, ц*,% у*, х*, у *, г *, г *, и, V*, р, я, г),
ыеи
.г * * * л* * * * * * * * чТ * ,
(|Яv\^ ,в ,^ ,2 у ,х ,у ,г ,г ,и ,V ,р,5,ґ)а$,V > =
,Г__,*_* */»** * * * * * * ,
тах<\Я„\у ,в ,ц ,Лу ,х ,у ,г ,г ,и ,V ,р,0<*,V>,
З
< х0„ (м*, р, я)у*( р, я, г0), м*) = тах < х0„ (м*, р, я) у/*( р, я, г0), м).
меШ
х*(р,я,г), у*(р,я,г), г*(р,я,г), г*(р,я,г), у*(р,я,г), в*(р,я,г), ц*(р,я,г), 2*(р,я,г), у* (р, г) - решения прямой и сопряженной систем при и = и *( р, я, г), V = v*(p, г),
м = м*(р, я).
В дополнительном предположении о дифференцируемости параметров задачи по и и выпуклости множества [/ справедлив дифференциальный принцип максимума, в котором, в отличие от конечномерного, условие для управления и имеет вид
<Ни(у*,в*,ц ,%у ,х*,у*,г*,г*,и*,V*,р,я,г),и*) =
и „* *.********
^ Л* *.********
= тах <ни \у ,в , ц , 2 7 , х , у , г , г , и , V , р, 5, ?), и >.
иеУ
3. Численный метод
Рассмотрим численный алгоритм поиска решения задачи, являющийся комбинацией метода на основе конечномерного принципа максимума и метода условного градиента. Подобный алгоритм приводился, в частности, в [5] для задач оптимального управления дифференциальными гиперболическими системами.
Шаг 0. Выберем произвольные допустимые управления и0 = и0(р, я, г), V0 = V0(р, г), м0 = м0(р, я), и положим к = 0 .
ттт 1 тт к к к к к к к
Шаг 1. По управлениям и , V , м построим решения х , у , г , г и /к ,вк ,Цк,% ,7 прямой и сопряженной задач. Определим вспомогательные управления из условий
ик(р5,І)= а^тах^Ик,и^, Vк(р,І)= а^тах( |\
иєи ' '
Ик = И\гк вк, цк ,2 ,ук, хк, ук, гк, Гк, ик, vk, р, 5, І), мк (р,5 )= arg тах( х0„ \мк, р, 5)' щк \ р, 5, іо), м).
Вычисляем функции
^к (р,Я,І)=(нк,ик (р,Я,І)-ик (р,5,і^, (р,5,і)є П,
(р,і=|Иkds,vk (р,і)-И (р,і^, (р,і)є РхТ,
^к (А5=(хМ)'Ук(р^^о),мк (р5)-мк (р5)), (р^)е 5хТ,
и их средние значения:
4 = |||^(р,5,і)йрйяйі/шєяП, 4 = ||(р,і)йрйі/\р1 - р0)\і1 -і0),
П ТР
4 = Л аз (р,я)Лр^ /\рі - ро)С*1 - 5о).
5Р
Если 4 = 0, 4 = 0, 4 = 0, то управления ик, Vі , м>к удовлетворяют
дифференциальному принципу максимума и подозрительны на оптимальность. Иначе переходим на следующий шаг.
Шаг 2. Строим двухпараметрические управления и^, vk£a, шкеа по правилам:
к, ч [ик (р, 5, І ) + а(ик (р, 5, і)-ик (р, 5, І)), (р, 5, І )еП к (є),
ua(P, 5 і ) = 1 к, ч , ч „ , ч
[и (р, 5, І), (р, 5, І)еП \ Пк (є),
к( )= (P, І) + а(^ (P, і)-^ ^ І )1 (P, і)є РТк (є)
^ І ) = V (р, і ), (р, І )є(р х Т) \ РТк (є),
:(p, 5) + а(мк (p, 5)- /(p, 5)), (p,5)є Р5к(є),
к / ч 1мк ( р, ^)+а(мк ( р, 5)-Vі ( р, 5Д ( р, 5) Є
( р, 5 ): , ,,,,,,
1мк (р, 5 ), (р, 5 )Є(Р X 5 ) \ Р5к (є),
пк(е)е п, РТк£)е РхТ, РЗк(£)е Рх5 - множества, мера которых линейно зависит от £ е (0,1) и которые удовлетворяют определяющим неравенствам
щк(р,я,г)dpdsdt > N4°£ Ц^2 (р,г)dpdt > N4°£
пк (£) РТк (£)
Ц^3 (p,s)dpds > *4°£ N > 0, °> 1;
Р54(£)
Шаги £к, ак определяются из условия
(е^ ак ) = аГ§ т1п ](ика^,меа I £ е (0,l), а е (0,1)-
Полагаем
ик+1 (p, ^ г) = ^ак (p, ^ г), vk+1 (p,г) = ^£как (P,г), мк +1 (P, я) = м£как (P, я)’ к = к +1 и переходим на шаг 1.
Пк (е), РТк (е), Р5к (е) удовлетворяют определяющим неравенствам, если их построить в виде объединения подмножеств, вписанных во множества
мк (в) = {( р, я, г) еП: $ (р, я, г) > в$к}, М к (в) = {( Р, г) е Р х Т: $ (р, г) > в$к},
М3к (в) = {(р, я) е Рх 5 : $(р, я) > в4}, ве (0,1).
Данный алгоритм является релаксационным и сходится к управлениям, которые удовлетворяют дифференциальному принципу максимума, если помимо уже наложенных ограничений параметры задачи липшицевы по управлениям, производные параметров задачи по управляющим и фазовым переменным липшицевы по этим переменным, целевой функционал ограничен снизу. Обоснованием этого служит оценка
3(и еа Уеа >^а )- 3 (и, V ^ ~а ДО|( НЫ , ^ - и )йрйяйг - а ДО Ж, ук - ук )йрЖ -
Пк(е) РТк (е) 5
- а ДО(xw'yk(p,s,t0), wk - wk)dpds + га2.
PSk (г)
Она следует из формулы (8) с учетом того, что
Axk (p, s, t)
а + га.
Если, как в рассматриваемой прикладной задаче, параметры линейны по и, приведенный алгоритм сходится и к конечномерному принципу максимума.
Для задачи (1)-(3) аналог функции Понтрягина и сопряженная система примут вид
Р+Р2 Р+Рі
Н(у, в, у,х, у,и1,и2,р, 8,1) = -уух-уи х + | |в(^)С (^)/К йрй% х + | у(р, г)йртх +
р-р2 ^ р-р1
где
+ (f (UlX) - сu2/(Sl - S0))e~л‘,
P+P2
y(P,s,t) = J JC(£)x(p,£,t)dpd£/K,
P-P2 S
p+p2 p+p1
¥i +¥s =Wy + ^il - J J0(£)C(s)/K dpd% - J y(p, t)dpr -
p -p2 S p -p1
P+P2 P+Pl
J J&(f)C(s)/K dpd£- J Y(p, t)dpr-fx (UlX)e
............... 1 )е
р-р2 5 р-р
у(р,8, ^) = 0, у(р,81,1) = 0, #(р,8,0 = -ух, в случае искусственных лесопосадок г = 0, если деляны зарастают естественным путем и2 = 0.
Литература
1. Feichtinger G. Optimality conditions for age-structured control systems / G. Feichtinger, G. Tragler, V.M. Veliov // Journal of Mathematical Analysis and Applications. -2003. -V. 288. -№ 1. P.47-68.
2. Almeder C. Solution methods for age-structured optimal control models with feedback // LSSC.- 2907.-V. 28.- P. 197-203.
3. Goetz R.U. The economics of competition between individuals in biological populations / R.U. Goetz, A. Xabadia // Journal of Vienna Institute of Demography. -2004.-URL: http://are.berkeley.edu/courses/envres\_seminar/f2004/SeminarGoetz.pdf.
4. Букина А.В. Необходимые условия оптимальности управления интегро-дифференциальной системой / А.В. Букина, В.А. Терлецкий // Известия вузов. Математика. -2009. -№11. - С.61-66.
5. Васильев О.В. Методы оптимизации и их приложения. / О.В. Васильев, В.А. Срочко, В.А. Терлецкий // Оптимальное управление. Ч.2. - Новосибирск: Наука, 1990. -151с.