Научная статья на тему 'Алгоритмический метод построения управлений нелинейным неопределенным объектом'

Алгоритмический метод построения управлений нелинейным неопределенным объектом Текст научной статьи по специальности «Математика»

CC BY
358
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
НЕЛИНЕЙНАЯ СИСТЕМА / ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / УРАВНЕНИЕ ГАМИЛЬТОНА ЯКОБИ АЙЗЕКСА / АЛГОРИТМИЧЕСКОЕ КОНСТРУИРОВАНИЕ / NONLINEAR UNCERTAIN DYNAMIC SYSTEM / DIFFERENTIAL GAMES / HAMILTON - JACOBI - ISAACS EQUATION / ALGORITHMIC DESIGN

Аннотация научной статьи по математике, автор научной работы — Афанасьев Валерий Николаевич

Проблема оптимального управления для класса нелинейных объектов с неконтролируемыми ограниченными возмущениями сформулирована в терминах дифференциальной игры. Для задач с квадратическим функционалом качества задача поиска оптимальных управлений сведена к необходимости нахождения решений скалярного уравнения в частных производных Гамильтона Якоби Айзекса. Показано, что поиск решений этого уравнения в темпе функционирования объекта осуществляется с помощью специальных алгоритмических процедур. Отмечено, что полученные результаты могут быть использованы при решении теоретических и прикладных задач, встречающихся в математике, механике, физике, биологии, химии, инженерных науках, управлении и навигации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of optimal control for a class of nonlinear objects with uncontrolled bounded disturbances is formulated in the terms of differential game. Special algorithmic procedures are implemented to find solutions to this equation in tempo operation of the facility. The results can be used to solve theoretical and practical problems encountered in mathematics, mechanics, physics, biology, chemistry, engineering sciences, management, and navigation.

Текст научной работы на тему «Алгоритмический метод построения управлений нелинейным неопределенным объектом»

нализ и синтез систем управления

УДК 517.977.8,517.977.58

АЛГОРИТМИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ УПРАВЛЕНИЙ

В.Н. Афанасьев

Проблема оптимального управления для класса нелинейных объектов с неконтролируемыми ограниченными возмущениями сформулирована в терминах дифференциальной игры. Для задач с квадратическим функционалом качества задача поиска оптимальных управлений сведена к необходимости нахождения решений скалярного уравнения в частных производных Гамильтона — Якоби — Айзекса. Показано, что поиск решений этого уравнения в темпе функционирования объекта осуществляется с помощью специальных алгоритмических процедур. Отмечено, что полученные результаты могут быть использованы при решении теоретических и прикладных задач, встречающихся в математике, механике, физике, биологии, химии, инженерных науках, управлении и навигации.

Ключевые слова: нелинейная система, дифференциальные игры, уравнение Гамильтона — Якоби — Айзекса, алгоритмическое конструирование.

ВВЕДЕНИЕ

Успешная реализация полученных теоретических результатов связана в ряде задач с решением уравнений в частных производных первого порядка. Подобные уравнения возникают при решении большого числа теоретических и прикладных задач в математике, механике, физике, биологии, химии, инженерных науках, управлении и др. Примерами служат уравнения Гамильтона — Якоби в теоретической механике [1], уравнение Беллмана в теории оптимального управления [2], уравнение Айзекса [3], уравнение эйконала в геометрической оптике [4], предельные уравнения Брюгенса и Хопфа в газовой динамике и гидродинамике [5] и многие другие.

Метод характеристик, предложенный в первой половине XIX в. О. Коши для решения краевых задач для таких уравнений, сводит интегрирование уравнений в частных производных первого

Работа выполнена при финансовой поддержке Программы «Научный фонд НИУ ВШЭ» в 2014/2015 гг.».

порядка к интегрированию системы обыкновенных дифференциальных уравнений. Этот метод основан на том, что график классического решения краевой задачи инвариантен относительно характеристик. Однако в случае нелинейного уравнения в частных производных гладкое решение существует лишь локально [6].

К обобщенному решению уравнений Гамильтона — Якоби и уравнений других типов в частных производных было обращено внимание многих математиков в 1950—1970-е гг. [7, 8]. Разработанные методы в основном опирались на интегральные методы и интегральные свойства обобщенных решений.

В начале 1980-х гг. было введено понятие вязкостного решения, существование которого доказывалось с помощью метода исчезающей вязкости [9]. Метод развивается и в настоящее время, внимание исследователей привлекают аналитические, конструктивные и численные методы построения вязкостных решений [10] и приложения теоретических результатов к решению различных прикладных задач.

1

0230307101

Другая известная концепция обобщенного решения на базе идемпотентного анализа предложена в работах В.П. Маслова и его учеников [11, 12]. С помощью соответствующего подхода, линеаризующего выпуклые задачи, исследуются уравнения Гамильтона — Якоби с выпуклым гамильтонианом и их приложения к задачам математической физики.

Задачи оптимального управления и дифференциальные игры так или иначе связаны с поиском решений уравнений Гамильтона — Якоби — Бел-лмана, Айзекса. Для решения уравнений такого типа разработаны конструктивные и численные (в том числе и сеточные) методы [13—15]. Важный результат теории минимаксных решений уравнений в частных производных первого порядка, лежащих в основе теории дифференциальных игр, заключается в доказательстве эквивалентности понятий минимаксного и вязкостного решений [16].

В рамках концепции минимаксного решения, имеющей свои истоки в теории позиционных дифференциальных игр [17, 18], разработанной научной школой Н.Н. Красовского, базирующейся на минимаксных оценках и операциях, были доказаны теоремы существования и единственности, корректности и содержательности понятия минимаксного решения для различных типов краевых задач уравнений в частных производных первого порядка.

Несмотря на имеющиеся теоретические результаты в этой области, проблема решений уравнения Гамильтона — Якоби — Айзекса в задачах дифференциальных игр с нелинейными неопределенными динамическими объектами в темпе их функционирования по-прежнему сохраняется и актуальна.

1. НЕЛИНЕЙНЫЙ ОПТИМАЛЬНЫЙ РЕГУЛЯТОР

1.1. Постановка задачи

Пусть детерминированная нелинейная система описывается обыкновенным дифференциальным уравнением

-|x(t) = fx) + gx(x)w(i) + g2(x)u(t), x(t0) = x0, y(t) = Cx(t).

(1.1)

Здесь х(?) е Яп — состояние системы; х е Ох, Х0 е — множество возможных начальных условий системы; у е Ят, т < п — выход системы; и е Яг управление; т е Як — возмущение; /(х), £х(х) и £2(х) — непрерывные матрицы-функции. Предполагается, что для всех х система (1.1) уп-

равляема и наблюдаема, ? е Я . Кроме того, будем полагать, что функции /(х), ^(х) и £2(х) достаточно гладкие, такие, что из любых точек (?0, х0) е Я+ х Ох выходило бы одно и только одно решение уравнения (1.1) х(?, ?0, х0) и был бы единственным соответствующий выход системы у(?) = Сх(?, х0).

Предполагается, что неконтролируемое возмущение ш(?), которое может быть как детерминированным, так и стохастическим, характеризуется отношением:

|w(t)| < c(x(t)), V t > 0,

(1.2)

где |шг(?)| < стг(х(?)), / = 1, к, ? > 0, стг(х(?)) > 0 для всех х(?) е Запишем отношение (1.2) в виде ш(?) е Ж

Рассматривая возмущение ш(?) как действие некоторого игрока, противодействующего успешному выполнению задачи управления, сформулируем задачу управления в терминах дифференциальной игры двух игроков и <5^. Организация управлений и(?) е и и ш(?) е Ж будет осуществляться с помощью принципа обратной связи по состоянию.

Таким образом, в настоящей статье проблема управления нелинейным неопределенным объектом (1.1) будет рассматриваться в рамках теории минимакса с неограниченным временем окончания переходного процесса.

Введем функционал качества дифференциальной игры

J(x, u, w) = lim j {yT(t)Qy(t) + uT(t)Ru(t) -

T — ж t

wT(t)Pw(t)}dt.

(1.3)

В функционале (1.3) симметрическая матрица Q, по крайней мере, положительно полуопределенная, матрицы Р и Я — положительно определенные.

Предположение 1.1. Ограничения на управляющие воздействия и(?) е и и ш(?) е Ж можно учесть при назначении в функционале качества положительно определенных матриц Р и Я. ♦

Пусть элемент ^ = (х(?), и(?), ш(?)), для которого выполнены все указанные условия и ограничения задачи, является допустимым управляемым процессом. Допустимыми элементами ^ = (х(?), и(?), ш(?)) в поставленной задаче будем считать функции

класса х(-) е Сх([?0, Т], Яп), и(-) е Сх([?0, Т], Яг),

Ц-) е СХ([?0, Т], Як).

Задача управления заключается в построении оптимальной стратегии с обратной связью для игроков и С^, т. е. в нахождении управляющего

воздействия ы(?), минимизирующего функционал вида (1.3) на объекте (1.1) при соответствующем противодействии «управления» ^(?).1.

1.2. Оптимальные уравнения дифференциальной игры

Предположение 1.2. Пусть Дх), ^(х) и £2(х) достаточно гладкие функции такие, что функция Г(х), определенная как

Откуда

Г(х) = тГ Бир /(х, ы, м>),

ие и ке Ш

(1.4)

дифференцируемая функция при любых допустимых стратегиях игроков <и, <5^ е Х2(0, да). ♦

Предположение 1.3. Функция Г(х), определенная как (1.4) локально липшицева в ♦

В общем случае (с заданным временем окончания переходного процесса), значение назначаемой функции х) есть решение задачи динамического программирования, связанное с дифференциальным уравнением первого порядка в частных производных Гамильтона — Якоби — Айзекса [2]

= 0,

д"^ + т1птах н{х, ы,

д? и к у дх( ?)

Г(Г, х(Т)) = 0, где Н — гамильтониан

Н{ х, Ы, } = 1 {уТ(?)0У(?) + ЫТ(?)Яы(?)

дх (?)

- Ч,Т«)т)} + {Ах) + ^(хМ?) + ^2(х)ы(?)|.

Для рассматриваемой задачи (с неограниченным интервалом временем переходного процесса) Г(?, х) = Г(х), т. е. д Г(х)/д? = 0.

Оптимальные управления, при выполнении условия учета ограничений на управляющие воздействия е Ж и ы(?) е и соответствующим назначением положительно определенных матриц Р и Я (предположение 1.1), определяются соотношениями

ы(') = ^ТТ (х)

= Р-1 *Т (х) II-

(1.5)

где вектор дГ(х)/дх определяется решением уравнения Гамильтона — Якоби — Айзекса:

^ Дх) + 1 хТСТ(?)ОСх(?) - 1 ^ X

дх (? )'

2 дх (?)

х^(х)Я ^Т(х) - ^(х)Р ^Т(х)]{д"^ } = 0 (1.6)

с граничным условием Г(0) = 0.

2.3. Условия существования оптимального решения

Предположение 1.4. Пусть матрица

П(х) = £2(х)Я_1 £2Т (х) - ^(х)Р"1 gT (х), (1.7)

по крайней мере, положительно полуопределенная. ♦

Исходная система с управлениями (1.1) определяется выражением

>=Д(х) - П(х){д-,.

х(?о) = х0, у(?) = С(х).

(1.8)

Теорема 2.1. Система (1.8) равномерно асимптотически устойчива, если и только если

1 Шх) П(х){дЩ}Т > д-х)Д(?, х), Ух * 0,

2 дх (?) ч/{дх (?)/ дх (?)

_1 т _1 Т

где П(х) = g2(x)Я g2 (х) - g1(x)P g1 (х) — по крайней мере, положительно полуопределенная матрица.

Доказательство. Из уравнения (1.6)

-д" }Т = -Р^(?) + д-х) gl(x) {д-х) }Т = 0 = 0,

дм<?)1 дх(?) ^ Ч дх(?)

дН ды ( ?)

=Яы(?)+g2(x) {Ц"}Т=

д - = -Р < 0,

д^2( ?)

д - = Я > 0.

ды2(?)

2 д-Т?п(х) = т/ + 2хГСг(ООСх(0,

2 дх (?) I дх (t) [ дх (t) 2

Откуда, так как хГСГ(0ОСх(0 > 0,

1д7(х) п(х) |дП7) 1г>д7(х) /(х). 2 ах (о дх (о [ ах( ^^ '

(1.9)

Определим требования к назначению матриц Р и Я, при которых предположение 2.4 истинно, т. е. матрица П(х), по крайней мере, положительно полуопределенная.

В соответствии со второй теоремой Ляпунова система (1.8) равномерно асимптотически устойчива, если выполняется условие

д)( х) дх ())

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лх) - П(х)

д V( х) дх ())

T-i

< -®,(|х|).

Здесь ш3(| х |) — скалярная неубывающая функция такая, что ш3(0) = 0 и ш3(|х|) > 0 при х ф 0. Назначим функцию

ш3(|х|) в виде ш3(|х|) = 2 хг(г) Сг0Сх(г), где 0 положительно полуопределенная матрица функционала качества (1.3). Тогда, учитывая выражения (1.8) и (1.9), получим

дПххх Лх) - 1 дПххх п(х) ]дЛх)

дх( t )'

2 дх( t) - 1 д V( х)

дх (t)

+ 2 хт(0СтОСх(0 -

П(х)

д V( х)

< 0.

2 dx(tу dx(t) Принимая во внимание уравнение (1.6), получаем

T

-xT (t)S(x)n(x)S(x)x(t) < 0. Последнее выполняется, если матрица n(x), по крайней мере, положительно полуопределенная.

Таким образом, при выполнении предположения 1.4 система (1.1) с управлениям (1.5) равномерно асимптотически устойчива, т. е. lim x(t) = 0. ♦

t О

Как видно из выражения (1.7), это свойство матрицы n(x) можно (при известных матрицах gx(x) и g2(x)) обеспечить назначением матрицы P с учетом границ возмущений |w(t)| < a(x(t)), V t > 0, т. е. в виде P = P(ct), и соответствующим выбором матрицы R.

2. АЛГОРИТМИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЙ

Основная трудность реализации управлений в виде (1.5) заключается в нахождении вектора д V(x)/dx(t), удовлетворяющего скалярному уравнению в частных производных (1.6). Один из возможных способов нахождения управления с помощью уравнения (1.6) заключается в применении метода, основанного на аппроксимации этого уравнения рядом Тейлора вблизи точки равновесия. Однако метод, основанный на представлении неравенства с частными производными с помощью аппроксимации возле точки равновесия, не позволяет получить более общие решения.

Предложим метод поиска вектора dV(x)/dx(t), основанный на применении метода алгоритмического конструирования [19]. Прежде всего, отметим, что уравнение Гамильтона — Якоби — Айзек-са (1.6) определяет динамическое соответствие вектор-функции dV(x)/dx(t) вектору состояния системы x(t). Другими словами, это уравнение в

каждый момент времени ? е [?0, T ] ставит в соответствие функцию ЗГ(х)/Зх(?), определяющую управление, состоянию системы х(?) е Определим функцию (1.4) в виде

Г(х) = /(?)х(?),

где функция у е Яп определяется решением уравнения

¥(х, у) = уТ(?)/(х) + 1 хТСТ(?)0Сх(?) -- 2 Ут(№)у(0 = 0.

Нетрудно видеть, что ЗГ(х)/Зх = у (?). Таким образом, исходная система (2.1) с управлениями

и(1) = -R 1 gf (x)y(i), w(t) = P"1 gf (x)y(i)

(2.1)

принимает вид

-|x(i) = /(x) - n(x)y(i),

x(to) = Xo, y(t) = C(x).

Развитие выпуклого и негладкого анализа в 1970-е гг. позволило применить к исследованию обобщенных решений уравнений в частных производных новые результаты и методы, основанные на обобщениях понятия дифференцируемос-ти. В начале 1980-х гг. М. Крэндалл и П.Л. Лионс ввели понятие вязкостного решения (viscosity solution) [9]. Введем одно из эквивалентных определений вязкостного решения.

Определение 2.1. Верхним вязкостным решением уравнения

Y(x, у) = yT(i)/(x) + 1 xTCT(0QCx(i) -

1- y2(t)n(x)y(i) = 0

(2.2)

называется непрерывная функция у(?), удовлетворяющая условию: если разность функций Г(х) — у (?)х(?) достигает локального минимума в точке (? *, х *) е О и в этой точке функция у(?) дифференцируема, то должно выполняться неравенство

Y(x, у) = y2(0/(x) + 2 x2C2(0QCx(i)

- 1 y2(t)n(x)y(i) < 0.

(2.3)

Нижним вязкостным решением уравнения (2.1) называется непрерывная функция у(?), удовлетворяющая условию: если разность функций Г(х) - у (?)х(?) достигает локального максимума в точке (? *, х *) е О и в этой точке функция у(?) дифференцируема, то должно выполняться неравенство

¥(х, у) = уТ(?)Дх) + 2 хТСТ(?)ОСх(?)

- 1 уТ(?)П(х)у(?) > 0.

(2.4)

Вязкостным решением называется функция, которая одновременно является верхним и нижним решением, т. е. при выполнении условия (2.2) или условия

уТ(?) = дГ(х)/дх. ♦

Для построения алгоритма перевода системы из состояния (2.3) или (2.4) в состояние, при котором выполняется условие (2.2), введем функцию Ляпунова

Гд(у, х) = 2 ^2(У, х).

Условие асимптотической устойчивости при таком назначении функции Ляпунова имеет вид

- *д(у, х) =

= ¥(х, у)

'д^(х, у) -х( ?) + д^(х, у) -у( ?)•

дх

ду

Назначим -у(?)/-? как

- Т(0 = -^(х,г).

< 0. (2.5)

(2.6)

Начальные условия для этого алгоритма оптимизации в общем случае определить достаточно сложно. Но для систем вида (1.1), уравнения, динамики которых отвечают некоторому дополнительному требованию, такие условия можно найти.

Для поиска начальных условий алгоритма (2.6) введем дополнительное предположение относительно правой части уравнения исходной системы (1.1).

Предположение 2.1. Без потери общности положим, что условие х = 0 е Ох есть точка равновесия системы при ы = 0, ц> = 0, так что /(0) = 0 и g1(x) * 0, g2(x) * 0, Ух е

При выполнении предположения 2.1, применяя метод «расширенной» линеаризации [20], исходную нелинейную систему (1.1) можно предста-

вить в виде наблюдаемой и управляемой модели системы [21]

х(?) = А(х)х(?) + ^(х)Ц?) + g2(x)ы(?), х(0) = х0, у(?) = Сх(?).

(2.7)

Как известно, такое представление исходной системы в общем случае не является единственным [20], но в настоящей работе вопрос о выборе подходящей модели вида (2.7) не рассматривается. Предполагается лишь, что пары (А(х), g1(x)) и (А(х), g2(x)) управляемы, а пара (А(х), С) — наблюдаема при всех х е Ох.

Определим вектор-функцию {д Г(х)/дх(?)} в виде

Т— \ = ^(х)х(')-

(2.8)

Тогда, заменяя вектор-функцию {д Г(х)/дх(?)} в уравнении Гамильтона — Якоби — Айзекса (1.6) на ^(х)х(?), получим

хТ(?){^(х)Дх) + АТ(х)^(х) - ^(х)П(х)^(х) + + СТ0С}х(?) = 0, х е Ох,

откуда получаем уравнение Риккати с параметрами, зависящими от состояния [3]:

^(х)А(х) + АТ(х)^(х) - ^(х)П(х)^(х) + + СТ0С = 0.

(2.9)

Управления (1.5) и система (1.8) соответственно с учетом выражения (2.8) имеют вид:

ы(?) = -Я-1 g2T (х)^(х)х(?), Ц?) = Р-1 gT (х)^(х)х(?),

-?х(?) = /(х)

П(х)^(х)х(?), х(?0) = х0,

У(?) = С(х).

Находя решение уравнения (2.9) при х = х0, т. е. алгебраического уравнения типа Риккати с матрицами А(х0), g1(x0) и g2(x0), содержащими постоянные параметры и матрицами Р и Я, при которых

матрица П^) = g2(Xo)Я"1 gT- ^^Р-1 gT(х0), по крайней мере, положительно полуопределенная, определяем начальные условия для у0 как у0 = ^(х0)х0, где положительно определенная матрица ^(х0) отыскивается решением алгебраического уравнения Риккати с постоянными параметрами

Я^^) + Л2^)^) - ^(х0)П(х0)^(х0) + + СТ0С = 0.

Для определения условий, при выполнении которых алгоритм обеспечит задачу управления, вернемся к рассмотрению условия (2.5). Подставляя выражение (2.6) в условие (2.5), получим

дУ(х, у)

ду

22 ^2(х, у) >

дУ (х, у - йх( 0ш(х у) дх йГ х,у)

х(?) е

Таким образом, алгоритм

= — JдУÍXlI)'T

йГ

(2.10)

й?уО = — } У(х, у), у(?0) =

в задаче стабилизации нелинейного неопределенного объекта может обеспечить эффектив-

— 1 Т

ное действие управлений ш(?) = Р (х)у(?), —1 т

и(?) = —Я £2 (х)у(?) в случае, когда выполняется условие (2.10).

Полученный результат сформулируем в виде теоремы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теорема 2.1. Управляемая система

)?х(?) = /х) + £х(хМ?) + ^(х)и(?), х(?0) = х0, у(?) = Сх(?), представимая в виде й

х(?) = А(х)х(?) + ^!(х)т(?) + £2(х)и(?), х(0) = х0, у(?) = Сх(?),

—1 Т

с управлениями ш(?) = Р ^ (х)у(?), и(?) =

т

= —Я ^2 (х)у(0, где у(?) есть решение уравнения

й-ЗЦ-Р = — У(х,У), У0 = ^(х0)х0,

У(х, у) = Ут(?)/(х) + 2 хТ(?)СТОСх(?) —

— 1 уТ(?)П(х)у(?),

и положительно определенная матрица ^(х0) есть решение уравнения Риккати

¿Ц,)^) + АТ(х0)^(х0) — ^(х0)П(х0)^(х0) + + СТОС = 0,

в котором матрица П(х0), по крайней мере, положительно полуопределенная, асимптотические устойчива, если выполняется условие

дУ(х, дХ

22 У2(х, Х) >

дУ(х, Х)йх(?)у(х Х) дх й) ' '

х(?) е О

3. ПРИМЕР КОНСТРУИРОВАНИЯ РЕГУЛЯТОРА НЕЛИНЕЙНОЙ СИСТЕМЫ

Рассмотрим объект

--х(г) = Дх) + Вм(г) + ^ш(г) + Мп(г), х(0) = х0,

где

Дх) =

х?(') х2( г) + х2( г) —х? (г) - хх (г)

В = | 10 0 1,

х(0) = I х1( 0) I = 1 1

х2( 0 )

1

п(г) — случайный процесс.

Представление этого объекта после проведения операции «расширенной линеаризации» будет иметь вид:

--х(0 = А(х)х(г) + Вм(г) + ^ш(г) + Мп(г). Здесь матрицы:

А(х) =

1 хх(0х*2(0 1 ^ —х?( г) -1 0

В = I 10 0 1

* = 11

Назначим функционал

м =1 1

/(х, м, м7) = Нш 1 | {уГ(г)6К0 + мт(г)Ям(г) -

т ^ » 2 о

- м>г(г)Ри<0№

Здесь 0 = I 10 0 I, Я = I 20 I, Р = I 10 I 0 10 ) \ 02 ) \ 01

Необходимое условие оптимальности управления, как это было показано выше (вязкое решение), имеет вид

^(у, х) = 1 [уг(г)А(х)х(г) + хг(г)Лг(х)у(0 - уг(г)Пу(0 +

+ хг(г)Сг0Сх(г)] = 0, где П = ВЯ-1ВТ - = 12,

или с учетом значений матриц А(х), В, 0 и Я

2 3

¥(у, х) = (х? (^(г) + х1(0)у1« - (х3 (г) + х^г)^« -

- 2 [ у? (г) + у2 (г) - 10 х? (г) + 10 х2 (г)] = 0.

Алгоритм

7*« = - "е,*

Y(t0) = £(хо)х(^) в рассматриваемом примере принимает вид

-^(О = -[х? (/)х2(/> + х2(0 - У1(/)]"(У, х),

) У2(<) = +[х3 (/) + х^) - У2«]"(У, х).

Начальные условия для этой системы определяются из условия у(0) = £(х(0))х(0), где положительно определенная матрица £(х(0)) есть решение уравнения

£(х)Л(х) + Аг(х)^(х) - £(х)ЯЯ-1Ят£(х) + <2 = 0

Рис. 3. Графики переходных процессов в системе с управлением на интервале 1 с: процесс х1(?) с начальным условием х1(?0) = 1 — сплошная линия; процесс х-(р) с начальным условием х^) = —1 — прерывистая линия

Рис. 1. График действующего возмущения

Рис. 2. Переходные процессы в системе на интервале 10 с при отсутствии управлений: процесс х1(?) с начальным условием х1(?0) = 1 — сплошная линия; процесс с начальным условием х^(?0) = —1 — прерывистая линия

Рис. 4. Графики управляющих воздействий и(7) и ^(7): сплошная линия — управление м(?); прерывистая линия — управление ш(?)

т

при х (0) = (1 -1). Таким образом, У1(0) = 4,2015, у2(0) = 2,8118.

Управления исходным объектом определяются соотношением

и(0 = -Я-1£ту(0, = Р-1^ту(0. (4.1)

На рис. 1 представлен график действующего возмущения, на рис. 2—4 показаны графики переходных процессов и управляющих воздействий.

Как видно из приведенных графиков (интервал управления 1 с), система стабилизируется с помощью алгоритмов вида (4.1).

ЗАКЛЮЧЕНИЕ

Предложенный метод построения регуляторов, основанный на понятии «вязкого решения», для

нелинейных неопределенных динамических систем в задаче стабилизации, как это следует из результатов проведенного математического моделирования, эффективно выполняет поставленную задачу. Метод основан на применении алгоритмического конструирования, т. е. на использовании в основе конструкции алгоритмов оптимизации необходимых условий оптимальности. Метод может быть применен для решения задач, в которых встречаются нелинейные уравнения первого порядка в частных производных (уравнения Гамильтона — Якоби, Беллмана, Айзекса, эйкональные уравнения).

ЛИТЕРАТУРА

1. Арнольд В.И. Математические методы классической механики. — М.: Наука, 1974.

2. Bellman R. Dynamic programming. — Princeton, NJ: Princeton Univ. Press, 1957.

3. Isaacs R. Differential Games. — N.-Y.: John Wiley and Sons, 1965.

4. Курант Р. Уравнения с частными производными. — Т. 2. — М.: Мир, 1964.

5. Рождественский Б.Л., Яненко Н.Н. Системы квазилинейных уравнений и их приложения к газовой динамике. — М.: Наука, 1978.

6. Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. — 3-е изд., испр. — М.: Едито-риал УРСС, 2004. — 552 с.

7. Самарский А.А. Введение в численные методы. — М.: Наука, 1982. — С. 269.

8. Бахвалов Н.С., Жидков Н.П, Кобельков Г.М. Численные методы. — М.: МГУ, 2003. — С. 630.

9. Crandall M.G., Ishii H., Lions P.L. A user's guide to viscosity solutions // Bull. Amer. Math. Soc. — 1992. — Vol. 27. — С. 1—67.

10. Cacace S., Cristini E., Falcone M.A. Local Ordered Upwind Method for Hamilton — Jacobi and Isaacs Equations / 18th World Conf. IFAC, Milano, Italy. 2011. — P. 6800—6805.

11. Колокольцов В.Н., Маслов В.П. Идемпотентный анализ и его применения в оптимальном управлении. — М.: Наука, 1994.

12. Маслов В.П., Самборский С.Н. Существование и единственность решений стационарных уравнений Гамильтона — Якоби и Беллмана. Новый подход // Доклады РАН. — 1992. — Т. 324, № 6. — С. 1143—1148.

13. Гусейнов Х.Г., Ушаков В.Н. О построении дифференциальных включений с предписанными свойствами // Дифференциальные уравнения. — 2000. — Т. 36, № 4. — С. 438—445.

14. Субботин А.И., Субботина Н.Н. Кусочно-гладкие решения уравнений с частными производными первого порядка // Доклады РАН. — 1993. — Т. 333, № 6. — С. 705—707.

15. Тарасьев А.М., Успенский A.A., Ушаков В.Н. Аппроксима-ционные схемы и конечно-разностные операторы для построения обобщенных решений уравнений Гамильтона — Якоби // Известия РАН. Техническая кибернетика. — 1994. — № 3. — C. 173—185.

16. Субботин А.И., Тарасьев А.М., Ушаков В.Н. Обобщенные характеристики уравнений Гамильтона — Якоби // Известия РАН. Техническая кибернетика. — 1993. — № 1. — С. 190—197.

17. Красовский Н.Н. Игровые задачи о встрече движений. — М.: Наука, 1970.

18. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона — Якоби. — М.: Наука, 1991.

19. Афанасьев В.Н. Управление неопределенными динамическими объектами. — М.: Наука, 2008. — 208 с.

20. Cimen T.D. State-Dependent Riccati Equation (SDRE) Control: A Survey // Proc. 17th World Conf. IFAC, Seoul, Korea. 2008. — Р. 3771—3775.

21. Афанасьев В.Н. Задача вывода и сопровождения нелинейного объекта по заданной траектории // Автоматика и телемеханика. — 2015. — № 1. — С. 3—20.

Статья представлена к публикации членом редколлегии

Е.Я. Рабиновичем.

Афанасьев Валерий Николаевич — д-р техн. наук, зав. кафедрой,

Московский институт электроники и математики

Национального исследовательского университета —

Высшей школы экономики, И [email protected].

Содержание сборника «Управление большими системами»,

2015, вып. 54

S Самков Л.М. Прогнозный проект космической инфраструктуры: баллистика и логистика. — С. 6—44. S Булгаков С.А., Хаметов В.М. Восстановление квадратично интегрируемой функции по наблюдениям с гаус-

совскими ошибками. — С. 45—65. S Поздяев В.В. Редукция двойственных форм в методе атомной оптимизации. — С. 66—85. S Затонский А.В., Янченко Т.В. Метод управления развитием социального ресурса региона на основе регрессионно-дифференциального моделирования. — С. 86—113.

Коновальчикова Е.Н. Модель наилучшего выбора с неполной информацией. — С. 114—133. Павлов Б.В., Волковицкий А.К. Аэроэлектроразведочные измерительные комплексы и пути повышения их эффективности. — С. 134—165. S Крупенев Д.С., Пержабинский С.М. Алгоритм оптимизации надежности электроэнергетических систем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с использованием математического ожидания двойственных оценок. — С. 166—178. S Резчиков А.Ф., Богомолов А.С., Иващенко В.А. Подход к обеспечению и поддержанию безопасности сложных систем на основе автоматных моделей. — С. 179—194.

Тексты статей доступны на сайте http://ubs.mtas.ru/

i Надоели баннеры? Вы всегда можете отключить рекламу.