Научная статья на тему 'Задача оптимального управления сингулярно возмущенной системой с запаздыванием при интегральных квадратичных ограничениях'

Задача оптимального управления сингулярно возмущенной системой с запаздыванием при интегральных квадратичных ограничениях Текст научной статьи по специальности «Математика»

CC BY
169
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИНГУЛЯРНО ВОЗМУЩЕННАЯ СИСТЕМА С ЗАПАЗДЫВАНИЕМ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ФУНДАМЕНТАЛЬНАЯ МАТРИЦА / SINGULARLY PERTURBED SYSTEM WITH DELAY / OPTIMAL CONTROL / FUNDAMENTAL MATRIX

Аннотация научной статьи по математике, автор научной работы — Гребенникова И. В.

Рассматривается задача управления по минимаксному критерию для сингулярно возмущенной системы с запаздыванием при неопределенных начальных условиях и интегральных квадратичных ограничениях на ресурсы управления. Предлагается процедура построения начального приближения управляющего воздействия в минимаксной задаче управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гребенникова И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Problem of Optimal Control for Singularly Perturbed System with Delay with Integral Quadratic Constraints

The control problem for the singularly perturbed system with delay with indeterminate initial conditions and integral quadratic constraints on the control resources according to the minimax criterion is considered. Procedure is proposed for construction initial approximation of control response for minimax problem of control.

Текст научной работы на тему «Задача оптимального управления сингулярно возмущенной системой с запаздыванием при интегральных квадратичных ограничениях»

МАТЕМАТИКА

УДК 517.977

ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМОЙ С ЗАПАЗДЫВАНИЕМ ПРИ ИНТЕГРАЛЬНЫХ КВАДРАТИЧНЫХ ОГРАНИЧЕНИЯХ

И. В.Гребенникова

Уральский федеральный университет, Екатеринбург E-mail: giv001 @mail.ru

Рассматривается задача управления по минимаксному критерию для сингулярно возмущенной системы с запаздыванием при неопределенных начальных условиях и интегральных квадратичных ограничениях на ресурсы управления. Предлагается процедура построения начального приближения управляющего воздействия в минимаксной задаче управления.

Ключевые слова: сингулярно возмущенная система с запаздыванием, оптимальное управление, фундаментальная матрица.

The Problem of Optimal Control for Singularly Perturbed System with Delay with Integral Quadratic Constraints

I. V. Grebennikova

The control problem for the singularly perturbed system with delay with indeterminate initial conditions and integral quadratic constraints on the control resources according to the minimax criterion is considered. Procedure is proposed for construction initial approximation of control response for minimax problem of control.

Key words: singularly perturbed system with delay, optimal control, fundamental matrix.

ВВЕДЕНИЕ

В данной работе рассматриваются динамические объекты, математическими моделями которых являются сингулярно возмущенные системы (с малым параметром при части производных) с постоянным запаздыванием (по состоянию). Рассматривается задача оптимального управления по минимаксному критерию в постановке [1,2] для сингулярно возмущенных систем с запаздыванием при неопределенных начальных условиях и интегральных квадратичных ограничениях на управляющие воздействия. Терминальный функционал качества зависит как от быстрых, так и от медленных переменных.

Формулируется и решается предельная задача управления сингулярно возмущенной системой с запаздыванием, минимаксная по форме, для которой специальным образом выбирается функционал качества. В основе предлагаемого метода лежат идеи выделения асимптотики ансамбля траекторий сингулярно возмущенной системы, предложенные А. Г. Кремлёвым в работе [3], но при отсутствии запаздывания и представления фундаментальной матрицы решений, разбитой на блоки в соответствии с размерностями быстрых и медленных пременных, в виде равномерно сходящейся последовательности [4]. При реализации метода используются результаты исследо-

ваний [1-8], а также аппарат выпуклого анализа [9]. Приводится начальное приближение оптимального решения (относительного малого параметра), при этом не требуется чрезмерных условий гладкости (дифференцируемость не выше первого порядка), ограничений на класс допустимых управлений.

1. ПОСТАНОВКА ЗАДАЧИ

Рассматривается управляемая сингулярно возмущенная система (с малым параметром д > 0 при части производных) с запаздыванием h > 0 (по состоянию):

dX(t)/dt = An(t)x(t) + Ai2(t)y(t) + Gi(t)x(t - h) + Bi(t, ^)u(t),

= A2i(t)x(t) + A22(t)y(t) + G2(t)x(t - h) + B2(t, ^)u(t), ( )

где t e T = [to, ti], x e Rn, y e Rm, Aj, Bi, Gi, = 1, 2, — матрицы соответствующих размеров с непрерывными элементами. Начальное состояние системы

x(t) = -0(t), to - h < t < to, x(to) = xo, y(to) = yo

точно неизвестно и заданы лишь ограничения xo e Xo, yo e Yo, где Xo, Yo — выпуклые компакты в соответствующих пространствах, -0(t) e ^(t), to — h < t < to, Ф^) — заданное многозначное отображение со значениями в виде выпуклых компактов (в Rn), непрерывное по t в метрике Хаусдорфа. Реализации управления u(t), t e T — измеримые по Лебегу функции, удовлетворяющие условию u(-) e P, P — слабо компактное выпуклое множество в L2(T). В данном случае

ti

P = {u(-) J u'(t)R(t)u(t) dt < A2}, A = const > 0,

to

R(t) — симметричная, положительно определенная матрица с непрерывными элементами; штрих — знак транспонирования. Считаем выполненным следующее предположение.

Предположение 1. Собственные значения As(t) матрицы А22(t) удовлетворяют неравенству: Re As(t) < -2c < 0 при t e T, c = const > 0.

Тогда [10, с. 69] при достаточно малых д (0 < д < ^o) фундаментальная матрица решений Y[t,r] системы дйу/^ = А22(t)y, Y[т,т] = Em, Em — единичная матрица m х m, при to < т < t < ti имеет оценку

|| Y[t,T]|| < co exp{-c(t - т)/д}, (2)

co > 0 — некоторая постоянная, || ■ || — евклидова норма.

Введем следующие обозначения: z' = (x',y'), Zo = Xo х Yo, Z(t, u(-), Zo, ^(-)), to < t < ti — множество (ансамбль) траекторий z(t, u(-),zoсистемы (1), исходящих из Zo, при некотором -0(-) e Ф(-) и фиксированном u(-) e P. Определим функционал J(■):

J(u(-)) = max ,(ti;u(-),zo,^(-))),

zoeZo

где : Rn+m ^ R — заданная выпуклая функция (с конечными значениями).

Задача 1. Среди управлений u(-) e P найти оптимальное uo = uo(■), доставляющее минимум функционалу J(u(-)) на множестве P:

eo(ti) = J(uo)= min J(u(-)).

Запишем систему (1) в виде

dz(t)/dt = A(t, д)z(t) + G(t, д)z(t - h) + B(t, д)и^), (3)

где матрицы А(^д),В(t,д),G(t,д) имеют следующий блочный вид:

аа^аа^), «нBii), <*.„=(х 0■

Пусть Z[t,т] — фундаментальная матрица решений системы (1) (при u = 0), причем Z[т, т] = En+m, Z[t,T] = 0 при т > t. Матрицу Z[£,т] представим в следующем блочном виде:

zм=(Z"[!,т] Ztl),

у Zu [t, т] Z22 [t, т] j

здесь Zu [t, т], Zi2[t, т], Z2i [t, т], Z22 [t, т] — матрицы с размерами соответственно n х n, n х m, m х n, m х m.

Решение задачи 1 при каждом фиксированном значении параметра ß > 0 описывается следующими соотношениями (используя [2, c. 73; 3, с. 62], но для системы с запаздыванием):

е0(t1 )= min max max max {l'z(t1; u(^),z0,"0(0) — =

u(-)ePieRn+m zoeZo

= max{x0(1,ß) | l e Rn+m} = X0(10,ß), (4)

X0(1,ß) = — h**(1) — p(—r(Sti,1,ß) | P),

to+h

h(1) = <p*(1) — p(1'Z[ti,t0] | Z0) — J p(((p'Z11M+ q'Zn[t,т])^(т)+(1/ß)(p'Z12[t,т] +

to

+q'ZiiM)Gi(т)) | Ф(т — h))dr, г(т; t,1,ß) = (p'Zll[t,т] + q'Z21 [t^B(т, ß) + (1/ß)(p'Zl2[t,т] + q'Z-^^^(т,д),

где l' = (p',q'), p e Rn, q e Rm; (l) — функция, сопряженная [9, c. 52] к ^(z); h**(1) = (co h)(1) — замыкание выпуклой оболочки [9, с. 65] функции h(l); p(s|X) — опорная функция множества X на элементе s. Оптимальное управление u0(^,ß) удовлетворяет условию минимума:

ti ti

min / г(т; t1,1°,д)и(т)^т = г(т; t1,10, д)и0(т, u(-)ePj J

to to

Полученные u0(-,ß), l0, е0(t1) зависят от параметра ß. Однако эти величины при ß ^ +0 могут не сходиться [5, с. 38] к соответствующим решениям задачи 1 для вырожденной системы (полученной из исходной при ß = 0).

Наряду с задачей 1, рассмотрим вырожденную задачу.

Задача 2. Среди управлений u(-) e P найти оптимальное u0 = u0(•), доставляющее минимум функционалу J0(u(^)):

e0(t1) = J0(u0)= min J0(u(^)),

u(-)eP

J0(uM) = max max ^(z0(t1; uM,x0,-0M)),

xoeXo ^(.)еФ(.)

где z0(t; u(^), x0,— решение вырожденной системы, полученной из (1) при ß = 0:

dx(t)/dt = A0(t)x(t) + G0(t)x(t — h) + B0 (t)u(t), (5)

y(t) = —A2"i1(t)Ai1 (t)x(t) — A-1 (t)Gi (t)x(t — h) — A2"21(t)ßi(t, 0)u(t), (6)

где t e T, A0(t) = An (t) — A12(t^1 (t)A^ (t), G0(t) = G1 (t) — A12(t)A2i1(t)Gi(t), BB0(t) = B^t, 0) — — A1i(t)A2-21(t)ßi(t, 0).

Прежде всего, проведем исследование для системы (3) при B1 (t,ß) = B1(t), B2(t, ß) = ^JßB2(t). Другие варианты обсудим уже на основе полученных результатов. При указанных условиях вырожденная система имеет вид: при t e T, x(t) = -0(t) e ^(t), t0 — h < t < t0, x(t0) e X0

dx(t)/dt = A0(t)x(t) + G0(t)x(t — h) + B1 (t)u(t), (7)

y(t) = —A---1 (t)A-1 (t)x(t) — A--21(t)G-(t)x(t — h). (8)

Пусть X[t,т] — фундаментальная матрица решений системы (7), (при u = 0), причем X[т,т] = En, X[^т] =0 при т > t.

Используя методы [2,3], но для системы с запаздыванием, получим следующие соотношения при каждом фиксированном значении параметра д > 0:

ео(*1) = шах{хо(р,д) | р е Япе Ят} = Хо(ро,до); (9)

хо(р,а) = - Л

где ^о(р,д) = (р,д)-р(ш'(¿о,Р, д) | Хо)- / р(ш'(т,р, д)£о(т)|Ф(т - , ш'(т,р, д) = в'^ьр, д) х

го

х X[¿1, т] - д'А-21 (¿^(^Х[¿1 - й,т], ,р, д) = р' - д'А-1 (¿1)^21 (¿1). Оптимальное управление ио(-) при т е Т есть

ио (т) = -ЛД_1(т )В1 (т)ш(т,ро,до) Предположение 2.Система (7) относительно управляема [11] на Т.

Предположение 3. Максимум в (9) достигается на векторе 1'0 = (Ро,9о) таком, что s' (¿1; Ро, до) = 0.

Тогда условие (10) определяет управление ио(-) е Р как некоторую измеримую на Т функцию, при этом найдется такой вектор хо е Хо, что ио(■) приводит траекторию го(■; ио(-),хона границу множества достижимости Ро(£15Р,жовырожденной системы,

*Ъ(*1 ,Р,хо= {г е Яп+т|г = го(¿1, и(-),жо,^(-)),и(-) е Р} (11)

t1

J w'(т,р, q)Bi(r)R-1 (т(т)w(T,p, q)dr

_to

w'(т,ро, qo)Bi (т)R (т)B1 (t)w(t,Po, qo)dT

/ ^

(10)

t

и

eo(ti ) = Jo (uo(-)) = max max ^(zo (ti; uo (■), xo,-0(-))).

xoeXo

Как уже отмечалось, решение (uo(-), 1o, eo(t1)) задачи 2 не дает даже начального приближения решения задачи 1. Но конструкция вырожденной системы (с некоторыми расширениями) будет использоваться в дальнейшем, поскольку с ней связаны асимптотические свойства траекторий исходной сингулярно возмущенной системы с запаздыванием. На основании же асимптотических свойств можно существенно упростить получение решения исходной задачи 1, если уже есть аналитический способ описания решения. Поэтому важное значение приобретают методы, позволяющие описать асимптотику ансамбля траекторий, множеств достижимости сингулярно возмущенной системы с запаздыванием, а также построить аппроксимацию оптимального управления и0(-,д), доставляющую оптимальное значение eo(t1) = J(u0(-,д)) с заданной точностью (относительно д).

В данной работе в основе предложенного способа определения требуемых приближений лежит возможность представления блоков Zj [t,T; д] (i,j = 1, 2) в виде пределов равномерно сходящихся на [to,t1] последовательностей Zi(,k)[t,T; д], k = 0,1, 2,..., при 0 < д < д0, д0 достаточно мало.

2. АППРОКСИМАЦИЯ РЕШЕНИЯ ЗАДАЧИ 1

В работе [4] приведены оценки для блоков Zj[£,т] (i,j = 1, 2), причем последние могут быть представлены в виде пределов равномерно сходящихся на T последовательностей (при 0 < д < д0, д0 достаточно мало):

t

z{k+1) [t,T] = X[t,T] - J(dz(0) [t,s]/ds)A-21(s)(A21 (s)z{f) [s,t] + G^Zg^s - h,T]) ds,

T

t

Z22+1)[t,T]= Y M + / Z21) [t,s]A12 (s)Y [s,T ] ds,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

z(2) М = I ZU1 MA12(s)Y[s,r] ds,

r(k)

z21} [t,r] = (1/ß) / Y[t,s](A2i(s)Z^ [s,r] + G2(s)Z^ [s - h,r]) ds, k = 0,1, 2,...;

rW

(k) I

причем Z(1) [t,r] = X[t,r], z22)[t,T] = Y[t,r].

Для задачи 1 соотношение (4) можно представить, используя [6, с. 10; 7, с. 68] в следующем виде:

е°(ti) = min max{p(p'Zii[ti,to] + q'Z2i[ti,to]|Xo)+ p(p'Zi2[ti,to] + q'Z22[ti,to]|Yo) + u(-)eP

ti

+ J[(p'Zii [ti, т] + q'Z2i[ti, т])Bo(t, ß) + (1/ß)q'Y[ti, т]B2(т, ß) - С(т, ti,p, q)^ (т)B2(т, ß)]u(r) dr+

to

t0+h

+ J p((p'Zii[ti,r]+ q'Z2i[ti,r])Go(r) - C(r,ti,p,q)A2-2i(r)G2(т)|Ф(т - h)) dr - (p,q)}, (12)

to

d ti

где Bo(t,ß) = Bi(t,ß) - Ai2(t)A22i(t)B2(t,ß), £(r,ti,p,q) = — [p'Zi2[ti, r] + (1/ß) / q'Y[ti,s]A2i(s) x

d

to+h

На основании теоремы А. Лебега [12, с. 259] при 0 < д < д0, До достаточно мало, для любых и(-) е Р(■), р е Лп, q е Лт справедливы оценки

to +h

p(C(r,ti,p, q)A2"2i(r)G2(t)|Ф(т - h))dr

< w(ß)[||p|| + N2 ||q||],

С(r, ti ,p, q)A22i (r)B2(r, ß)u(r)dr

(13)

< W(ß)[||p|| + Ni ||q||],

где <^(д) = о(1); N, Х2 > 0 — некоторые постоянные.

Построим начальное приближение доставляющее оптимальное значение е0(^1) = J(и0(-))

с точностью о(1) при д ^ +0. Из (12) следует

eo(ti) = min max < - h** (p,q) - [p'X[ti,r]+ q'z2i) [ti,r]]Bo(t, ß)u(r)dr+ u(-)£P j

to

+ J (1/ß)q'Y[ti,r]B2(r,ß)u(r) dr+

to

+ J [Ci(r,ti,p,q)Bo(r,ß) - C(r,ti,p,q)A22(т)B2(r,ß)]u(r)dr

to

(14)

где обозначено (т,р,q) = р'(^п[£, т] — [£, т]) + q/(^21 [£, т] — ^21[£, т]), причем для 0 < д < д0, функция Л,(1) = Л,(р, q) из (4) представима в виде

й(р, q) = ^(р, q) + о(1).

Используя оценку (12) из [4] и оценки (13), получим следующий результат.

t

t

t

t

t

t

Лемма. Существуют такие достаточно малое число д0 > 0 и постоянная N > 0, что для любых £0 < т < £ < 1\, р е Яп, д е Кт, 0 < д < д0, имеет место оценка:

||Мт,£,р,д)|| < д№(При + 1|д|| (со/с)(1 - е-с(^-т^)). (15)

Следующую задачу будем называть предельной [8].

Задача 3. Среди управлений и(т) е Р, т е Т, 5 > 0, удовлетворяющих условию {и(-),

<)} е Р(0), где

¿1 сю

2

Р(0) = |«(•),

найти и(0) = и(0)(■), = (■), доставляющие минимум функционалу J(0)(и(-),^(-)):

J и'(т)Д(т)и(т)^т + ^ v'(5)Д(£1 < А

¿0 0

J(0)(u(0),v(0)) = тт{^0)(и(-)^(-))|{и(-)^(-)} е Р(0)}, J(0)(u(•), v(•)) = тах {^(¿(£1; и(-), v(•),Жо, ^(-)))|®0 е Xе Ф(-)},

где

¿(£1; и(-), v(•),xо,^(•)) =

^ Х0 (£1)

-А-1 (£1)^21 (£1)Х0(£1) + ^2(£1)Х0(£1 - Н))+

со

+ /Ф0[£1,в]В2 (£ъдМв)^в

0

причем х0(-) = ж0(-;и(-),х0— решение (7), Ф0[£ьв] = ехр(А22(£1)в) — фундаментальная матрица решений уравнения йу(£)/^£ = А22(£1 )у(£), Ф0[£1, 0] = Ет. Предположение 4. 1. Для любого £ е Т

гапк{В2(£1, д), А22(£1 )В2(£1, д),..., А™-1 (£1)^2(^1, д)} = т.

2. Вектор (1(0))' = (р(0) , д(0)'), доставляющий максимум в

£(0) (£1) = тах{х(0)(р, д) | р е Дп, д е Дт} = Х(0)(р(0), д(0)), (16)

таков, что в'(£1; р(0) , д(0)) = 0, д(0) = 0.

¿1

Здесь х(0) (р, д) = -Н0* (р, д) - А(а0(р, д))1/2, <т0(р, д) = / ^'(т,р, д)В1 (т)Д-1(т)В1 (т)-Цт,р, д)^т +

¿0

со

+ / д'Ф0[£1,5]В2(£1,д)Д-1(£1 )В2(£1, д)Ф0[£Ь 0

При выполнении предположений 2 и 4 задача 3 разрешима [1, с. 110; 2, с. 76; 8], причем оптимальная пара этой задачи есть

и(0)(т) = -АД-1 (т)В1 (т)Цт,р(0),д(0))Мр(0),д(0)))-1/2, т е Т, (17)

v(0)(в) = -АД-1(£1 )В2(£1, д)Ф0[£1,в]д(0)К(р(0),д(0)))-1/2, в > 0, (18)

и доставляет функционалу J(0) значение J(0)(и(0), v(0)) = е(0)(£1), где е(0)(£1) определено в (16). Сравнивая предельную и вырожденную задачи, имеем неравенство е(0)(£1) < е0(£1). Пусть Р(£1, Р, ¿0, ^(')) — множество достижимости к моменту £ = £1 > £0 + Н для исходной системы (1) при г0 е , "0(-) е Ф, фиксированном и(-) е Р: Р(£ь Р, г0, ^(-)) = {г е Дп+т|г = ¿(£1 ,и(-), г0,-0(-)), и(-) е Р}, Р0(£1, Р, ж0,-0(-)) — множество достижимости (11) вырожденной системы (7), (8); р(0)(£1,Р,Х0,^(-)) = {г е яп+ш|г = г(£ьи(-)^(-),ж0{<),v(•)} е Р(0)}.

Тогда при 0 < д < д0 для 1 е Дп+т, ||1|| = 1, х0 е Х0, у0 е У0, е Ф(-) справедливы следующие соотношения (аналогично [5,7]):

р(1|Р(£1, Р, ¿0Ж-)) = р(1|Р(0) (£1,Р(0) ,Х0,^(-))+ о(1), р(1|Р(0) (£1, Р(0), Х0, ^(-)) > р(1|Р0(£1, Р, Х0,

Таким образом, для любых х0 € Х0, € Ф(-) выполняется включение

Р (0)(*ЬР(0) ,Х0 Э (¿1 ,Р,Ж0,^(-)). Рассмотрим управляющее воздействие (■) :

) = / "00),(;)' ч ¿0 -тЛ^ - а(д), (19)

(1/^и(0)((*1 - т)/д), ¿1 - а(д) < т - ¿1,

где а = а(д) € Л, а > 0, а ^ 0, а/д ^ при д ^ +0.

Пусть дк, к = 1,2,..., где 0 < дк < д0, есть некоторая сходящаяся к нулю последовательность чисел, ч^0(■) = ч^0^-), к = 1, 2,..., — соответствующая последовательность оптимальных (для задачи 1) управлений. В силу слабой компактности множества Р в пространстве ¿2(Т) можно выделить подпоследовательность ч|,0)(-), слабо сходящуюся к некоторой функции ч(0) (■) € Р. Обозначим г>0 (■) = -и0(-, д^.), V0 (в, д) = Л/дч0(^1 — Д5, д), 0 — 5 — 1/е < а(д)/д при 0 < д — д0, где е > 0 — произвольно выбранное число, д0 — достаточно мало.

Теорема. Пусть выполнены предположения 2, 4 и максимум в (16) достигается на единственном векторе Тогда верно следующее:

1) ч£.(■) слабо сходится к ч(0)(■) (17), (■) слабо сходится к г>(0)(-), где г>(0)(■) определено в (18) (5 € [0,1/е] для любого е > 0);

2) при 0 < д — д0, д0 — достаточно мало, справедливы соотношения

е°(^1, д) = У(ч0(■)) = 7(ч^-)) + о(1), е0(¿1, д) = е(0) (¿1) + о(1);

3) для ч^0) (■) (19), при € Ф(-)

р(^(¿1; ч0(-),^0,^(-))) — р(^(¿1; ч^0 (-),^0,^(-)))| — ^0(д),

^0(д) = о(1), 0 < д — д0, равномерно по всем I € Яп+т, VI = 1;

4) при д ^ +0 множество Z(¿1; ч0(-),^0сходится в хаусдорфовой метрике к выпуклому замкнутому ограниченному множеству

^(¿1; ч(0)(-)У0)(■), X,^(-)) = (5 € Лп+т|г = ¿(¿1; ч(0)(-)У0)(-),Ж0),®0 € Х0ЖО}. Доказательство. В (4) имеем

X0(1) = — Г* (I) — А(а0(I; д))1/2, (20)

¿1

а0 (г,д) = у [¿1 ,т; д]В (т,д)Л-1 (т)В'(т,д^' [¿1 ,т; д]^т.

го

Используя (14), получим

г.1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а0(¿,д) = У а'(¿1 ,т; д)Л-1 (т)а(^1 ,т; д)^т,

го

а'(^1, т; д) = (р'Х[¿1, т] + [¿1, т; д])В(т, д) + (1/д)д'Г [¿1, т]В(т, д)+ +С1(т, д; д)В0(т, д) — С(т, д; д)А-21(т)в2 (т, д),

где В(¿, д) = ^д£2(¿), В0(т, д) = В1(т) — ^12(т)А-21 (т)^(т). ^

Тогда, учитывая [7, лемма 1.2] и оценки (13), (15), имеем а0(I; д) = а0(р, д) + £(£; д), причем С(1, д) — ||1|| <^(д), <^(д) = о(1) при 0 < д — д0, откуда следует 2).

В силу оценок (2), (13), учитывая [7, лемма 1.2; 4, теорема 1] для любых ч(-) € Р, г>(з) = = Л/дч(^1 — дв), 5 € [0, а(д)/д), I' = (р',д') € Дп+т справедливо представление:

г1 ¿1 —а(^)

J г(т; ¿1,1,д)ч(т)^т = J ад'(т,р, д)В1 (т)ч(т)^т+

¿0 ¿0

+

д'У[£1, £1 - дв; д]В2(£1 - дв; д^(в)^в + ¿'(1, д),

(21)

причем |С(1,д)| < ||1|| ^'(д), где ^'(д) = о(1) при 0 < д < д0. Из предположения 4, единственности имеем

10 = 1(0) + 0(1). Тогда из слабой компактности Р получим 1). Неравенство 3) (а также 4) при оценке разности опорных функций указанных множеств) определяется на основании (21), свойств управления и0(■) и управления и°(-), определенного в (19). Теорема доказана.

Обсудим теперь другие возможные варианты разложений (по параметру д) коэффициентов В(£, д) системы (3).

1. В1 (£, д) = В1(£), В2(£, д) = <г(д)В2(£), <г(д) = о(у/д), 0 < д < д0. В этом случае (20) представимо

¿1 Л в виде а0(1,д) = / ш' (т,р,д)В (т)Д-1 (т)В1 (т)ш(т,р, д)^т+д), ¿1 (1,д) < ||1|| ¿1 (д), ^(д) = о(1)

¿0

при 0 < д < д0, и, следовательно, в предельной задаче 3 необходимо положить В2(-) = 0, v(•) = 0, т.е. решение предельной и вырожденной задач совпадают.

2. В1(£,д)= В (£),В2(£, д) = а(д)В2(£), а(д) = о(1), а(д)/^д ^ при д ^ +0.

Здесь уже могут нарушаться условия регулярности [2, с. 53], поскольку имеется «излишек» ресурсов управления по быстрой переменной. Тогда для (20) получим при 0 < д < д0

а0(1; д) = у ш'(т,р,д)В1(т)Д-1 (т)В1 (т)Цт,р,д)^т+

/ с

+ (а(д)/^д)2 I д'Ф0[£1 ,в]В2(£1)Д-1(£1 )В2(£1)Ф0[£1, в]д^в + дб(1,д) | + 6(1, д), где £2(1,д), ¿3(1,д) имеют порядок малости о(1). Соотношение (16) представимо в виде

(22)

е(0) (£1) = тах { р'

1/2

-Н**(р, 0) - Л / р'Х[£1 ,т]В1 (т)Д-1 (т)В1 (т)Х'[£1 ,т]р^т

(23)

При выполнении условий регулярности (максимум достигается на границе) в предельной задаче 3 следует положить 5'(£1;и(-)^(-),ж0,^(-)) = (х0(£1),0'), v(•) = 0, 1' = (р,0). Управление и^0)(■) определяется соотношением (19), причем для v(0)(в), определенного в (18), недостаточно знать лишь начальное приближение д(0) = 0, здесь следует найти более точно асимптотику, поскольку ||д01| = о(у/д/о"(д)). Параметр д ищем в виде д = ^у/д/^(д))д1 + о^^/д/ст(д)).

3. В1 (£,д) = В1(£),В2(£,д) = В2(£). Данный случай аналогичен 2, в (22) нужно положить ст(д) = 1, отмеченные особенности остаются в силе, причем в (23) В1(т) заменяется на В0(т, д) = = В1(т) - А12(т)А-21 (т)В2(т). Однако множество достижимости вырожденной системы (5), (6) становится неограниченным (по быстрым переменным). Здесь д следует искать в виде д = у/дд1 + о(Л/д).

Библиографический список

1. Красовский Н. Н. Теория управления движением. М. : Наука, 1968. 475 с.

2. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М. : Наука, 1977. 392 с.

3. Кремлёв А. Г. Асимптотические свойства ансамбля траекторий сингулярно возмущенной системы в задаче оптимального управления // Автоматика и телемеханика. 1993. № 9. С. 61-78.

4. Гребенникова И. В. Об итерационном методе построения оптимального управления сингулярно возмущенными системами с запаздыванием // Изв. Сарат. ун-та.

Нов. сер. 2009. Т. 9. Сер. Математика. Механика. Информатика, вып. 3. С. 14-22.

5. Гребенникова И. В. Аппроксимация решения в минимаксной задаче управления сингулярно возмущенной системой с запаздыванием // Изв. вузов. Математика. 2011. №. 10. С. 28-39.

6. Гребенникова И. В., Кремлёв А. Г. Об итерационном методе построения оптимального управления сингулярно возмущенными системами с запаздыванием при квадратичных ограничениях // Изв. Сарат. ун-та. Нов. сер. 2011. Т. 11. Сер. Математика. Механика. Информатика, вып. 3, ч. 1. С. 8-15.

г

г

7. Кремлёв А. Г., Гребенникова И. В. Об асимптотике ансамбля траекторий управляемой сингулярно возмущенной системы с запаздыванием // Новости научной мысли - 2006 : материалы науч.-практ. конф. Днепропетровск, 2006. T. 4. С. 65-69.

8. Кремлёв А. Г. Итерационный метод решения задач оптимального управления сингулярно возмущенными системами при квадратичных ограничениях // Журн. вычислительной мат. и мат. физики. 1994. Т. 34, № 11. С. 1597-1616.

УДК 519.6

ОДИН ПРЯМОЙ МЕТОД СТОХАСТИЧЕСКОЙ ОПТИМИЗАЦИИ

В. В. Колбин, М. В. Свищикова

Санкт-Петербургский государственный университет E-mail: vivakolbin@gmail.com, marsvi@mail.ru

Предлагается прямой метод стохастического программирования, основанный на пошаговом вычислении линейной аппроксимирующей программы.

Ключевые слова: стохастическое программирование, выпуклость, прямые методы.

9. Рокафеллар Р. Выпуклый анализ. М. : Мир, 1973. 492 с.

10. Васильева А. Б., Бутузов В. Ф. Асимптотические разложения решений сингулярно возмущенных уравнений. М. : Наука, 1973. 192 с.

11. Кириллова Ф. М. Относительная управляемость линейных динамических систем с запаздыванием // Доклады АН СССР. 1967. Т. 174, № 6. С. 1260-1263.

12. Натансон И. П. Теория функций вещественной переменной. М. : Наука, 1974. 468 с.

A Direct Method of Stochastic Optimization V. V. Kolbin, M. V. Svishchikova

A direct method is proposed for stochastic programming. On each step the method uses solving of the linear program which is the linear approximation of input stochastic programs.

Keywords: stochastic programming, convex, direct methods.

ВВЕДЕНИЕ

Целью данной работы является получение эффективного алгоритма решения следующей, часто возникающей в экономических моделях, задачи стохастического программирования.

Требуется минимизировать целевую функцию / общего вида при ограничениях двух типов

f (x, w) —» min,

g(x,w) < 0, H(w)x - h(w) < 0,

(1)

(2) (3)

где и = (и,..., иг)т € О С Яг — набор параметров задачи, О — пространство элементарных событий, / : О х Я+ ^ Я1, Я+ = {х | х > 0}, д : О х Я+ ^ Ят,

g =

( gi(x,w)\

\gm(x,w)/

, H =

(hii (w) ... hin (w)\

yhfci (w) ... hkn (w)

, h =

/hi (w)\

\hk (w) у

xi

x=

(4)

xn

Неравенства в (2) и (3) понимаются покомпонентно. Функции / и д предполагаются при любом значении набора и по х € Я+ выпуклыми и непрерывно дифференцируемыми.

В наборе и присутствуют параметры двух типов. В один тип входят такие случайные факторы, как спрос, погода, выход из строя оборудования и т.п. Они относятся к будущему. В другой — величины детерминированные, но известные неточно, такие как численность трудящихся, объем месторождения и т. п. Они относятся к прошлому или настоящему. Так же как и в первом типе, эти величины удобно трактовать как случайные с известными параметрами распределения.

Взаимосвязь между набором и и ограничениями (2) и (3) различна. Ограничения (3) должны выполняться при любой мыслимой реализации параметров (таково, например, ограничение числа пассажиров в такси). Иными словами, необходимо соблюдать при каждой случайной реализации условий задачи общие физические ограничения системы, которых нельзя нарушать вообще. Ограничения (2)

i Надоели баннеры? Вы всегда можете отключить рекламу.