Научная статья на тему 'Расчет опорной функции множества достижимости линейной управляемой системы с гарантированной оценкой погрешности'

Расчет опорной функции множества достижимости линейной управляемой системы с гарантированной оценкой погрешности Текст научной статьи по специальности «Математика»

CC BY
179
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Брусникина Н. Б.

Предлагается численный метод расчета значений опорной функции множества достижимости линейной управляемой автономной динамической системы, позволяющий дать гарантированную оценку погрешности вычислений, которая сходится к нулю с квадратичной скоростью и рассчитанной константой сходимости. Метод может быть использован в том случае, когда известна оценка числа переключений оптимального управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Расчет опорной функции множества достижимости линейной управляемой системы с гарантированной оценкой погрешности»

УДК 517.977.5

H. Б. Брусникина

РАСЧЕТ ОПОРНОЙ ФУНКЦИИ МНОЖЕСТВА ДОСТИЖИМОСТИ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ С ГАРАНТИРОВАННОЙ ОЦЕНКОЙ ПОГРЕШНОСТИ1

(кафедра системного анализа факультета ВМиК)

I. Введение. Решение многих задач управления связано с нахождением множеств достижимости динамических систем. К настоящему времени разработаны различные подходы к аппроксимации множеств достижимости, наиболее известными из которых являются эллипсоидальная и полиэдральная аппроксимации. Методы эллипсоидальной аппроксимации, основанные на аппроксимации отдельным эллипсоидом [1] или пересечением и объединением эллипсоидов, построенных на основе решения систем обыкновенных дифференциальных уравнений [2], дают возможность получить оценку расположения множества достижимости. В отличие от методов эллипсоидальной аппроксимации, методы полиэдральной аппроксимации, предложенные Л. С. Понтрягиным (см., например, предисловие Л. С. Понтрягина к книге [3]), направлены на аппроксимацию множества достижимости с любой степенью точности. Методы, основанные на идее Л. С. Понтрягина, используют измерение опорной функции множества достижимости. Несмотря на то, что было разработано несколько альтернативных подходов к построению полиэдральной аппроксимации множеств достижимости линейных динамических систем (см., например, [4, 5]), основным практическим средством полиэдральной аппроксимации остаются методы, использующие расчет опорной функции [6].

При реализации методов, основанных на расчете опорной функции, возникает два основных вопроса:

1) как выбрать направления, для которых осуществляется расчет опорной функции;

2) как рассчитать опорную функцию и какова точность этого расчета.

Оптимальные методы выбора направления описаны в [6]. В данной работе рассматривается второй вопрос. Л. С. Понтрягин предложил [3] для расчета опорной функции множеств достижимости использовать принцип максимума. Точность численного расчета опорной функции множеств достижимости линейных динамических систем на основе использования принципа максимума изучалась в работах [7, 8], где была доказана сходимость получаемой оценки к точному значению опорной функции. В настоящей работе предлагается новый численный метод расчета опорной функции множества достижимости на основе использования принципа максимума, позволяющий получить гарантированную оценку погрешности расчета опорной функции при условии знания числа переключений оптимального управления в задаче измерения опорной функции. Погрешность расчета опорной функции стремится к нулю с квадратичной скоростью по шагу временной дискретизации. Особенностью данной статьи является то, что в ней рассчитывается константа сходимости. Гарантированная оценка погрешности расчета опорной функции дает в принципе возможность использовать методы полиэдральной аппроксимации выпуклых компактных тел [6] для получения гарантированных внешней и внутренней оценок множества достижимости линейной динамической системы с любой заданной степенью точности.

В пункте 2 введены основные понятия, описан метод аппроксимации и сформулирован основной результат — гарантированная оценка точности измерения опорной функции. В пункте 3 приведено доказательство основного результата. В пункте 4 рассмотрены примеры конкретизации гарантированной оценки на основе использования известных результатов по оценке числа переключений.

2. Постановка задачи, описание метода. Рассмотрим автономную линейную управляемую систему вида

(х Е Ах + и, Ь £ [О, Г],

_ИО) е х0, 1 ]

1 Работа выполнена при финансовой поддержке РФФИ (проект № 04-01-00662), программой государственной поддержки ведущих научных школ (проект № НШ-1843.2003.1), программой фундаментальных исследований РАН "Математическое моделирование и интеллектуальные исследования" и программой фундаментальных исследований ОМН РАН № 3.

где ж 6 Я" — фазовая переменная, А — матрица размера га X га, II, Хо С Я" — выпуклые многогранники. Обозначим через управление, под которым будем понимать любую измеримую функцию, удовлетворяющую включению £ II почти всюду.

Как обычно, под множеством достижимости Х(Т) = Х(0,Т,Хо) системы (1) в момент времени Т будем понимать множество концов х(Т) всех траекторий ж(£), допустимых в силу системы (1).

п

Будем считать, что в линейном пространстве Я" заданы скалярное произведение (с, ж) = ^ с^,

¿=1

с, ж 6 Я", и соответствующие норма и расстояние. Обозначим через д{с, X) опорную функцию множества X С Я" в направлении с 6 Я", ||с|| = 1, т.е. д{с, X) = вир (с, ж). Пусть В = {Ь^-} £ ЯпХт —

хех

некоторая матрица, тогда под интегралом f В (в) ¿8 будем понимать матрицу размера га X то с элементами f Ьгу(в) йв, г = 1,..., га, ] = 1,... ,т.

Известно, что для расчета опорной функции д(с, X(Т)) множества достижимости Х(Т) системы (1) можно использовать принцип максимума Понтрягина [3]. Для этого сначала надо найти решение ф{Ь) сопряженной задачи

'ф = -А*ф, ь е [о,т], , .

ф(Т) = с, V)

которое может быть записано в виде Затем из условий

(и*(1),ф(1)) = тах(и,ф(1)), (3)

иеи

(х*о,ф(0))=тгх(х,'ф(0)) (4)

хех0

находятся оптимальные начальное состояние х£ и управления 0 ^ £ ^ Т. После этого значение

опорной функции д(с, X(Т)) задается величиной (с, х*(Т)), где

т

х*{Т) = елтх*0 + I еА{т~и*(8)(18. (5)

о

Заметим, что выбор оптимальной функции управления

и начального состояния Жо из условий (3), (4) может быть неоднозначным. Однако на значение опорной функции д(с, X(Т)) это не влияет.

Пусть задан вектор с £ Я", ||с|| = 1 и требуется найти аппроксимацию д(с, Х(Т)) значения опорной функции для множества Х(Т).

Метод оценки значений опорной функции множества достижимости Разобьем отрезок [О, Т] на N равных частей, узлы сетки обозначим ti = Иг, I = §,..., N .С помощью метода Рунге-Кутта 4-го порядка для системы дифференциальных уравнений

ГФ = -АФ, ¿6 [О,Г],

\ф(Т) = Е, { '

где Е £ ЯпХп — единичная матрица, найдем численную аппроксимацию матричной экспоненты Ф(^) = + ¿1 в узлах равномерной сетки г = О,...,^, где ¿1 — матрицы погрешности

в моменты времени Найдем векторы жо и , г = 0,..., N, из условий

^Ф= тах^Ф, (7)

/ф(0)жо, с\ = тах /ф(0)ж, с\ , (8)

\ / хЕХ0 \ /

используемых как аппроксимация условий (3), (4). Так как II и Хо — многогранники, то максимумы в (7), (8) достигаются в их вершинах и могут быть легко найдены. Далее, заменив интеграл в (5) суммой по методу трапеций, найдем

М к г 1

ж (Г) = Ф(0)жо + XI 2 Г^"1)^.'-! + ^¿К- • ¿=1

В качестве д(с, X(Т)) возьмем величину (с, х(Т)). Описание метода окончено.

Заметим, что выбор iit. и xq из условий (7), (8) может быть неоднозначным. Однако на значение д(с,Х(Т)) это не влияет.

Замечание 1. Метод трапеции используется для того, чтобы учитывать значения оптимального управления на обоих концах отрезка разбиения. Мы не используем требующих более гладкой подынтегральной функции методов аппроксимации значения интегралов, поскольку оптимальное управление u*(s) является кусочно-постоянной функцией [3], и, следовательно, функция eA(T~s^ и* (s) не имеет непрерывной производной.

Для множества X С R" рассмотрим следующую норму: ЦХ]^ = sup \х\. Для матрицы А будем

хех

рассматривать норму ||А|| = А = А(А) = / max А&, где А& — собственные числа матрицы А*А [9].

у l^k^n

Заметим, что А(—А) = А(А*) = А и ||Аж|| ^ А ||ж||.

Теорема 1. Пусть для некоторого с £ R", ||с|| = 1, оптимальное управление u*(t) задачи

(с,х(Т)) —т- max имеет на отрезке [0,Т] не более Хл — 1 точек переключений. Тогда N v x(T)ex(T)

\g(c,X(T))-g(c,X(T))\4: (XT + \\U\l, h2 + К^Х^ + Т (9)

где

к, = J^^+^+^aV + ^A^) 1 120к4

к ^ 1 — параметр метода Рунге-Кутта.

Следствие 1. Выбирая шаг сетки h настолько малым, чтобы выполнялось условие А/г ^ 1, получим оценку:

\g(c,X(T))-g(c,X(T))\^±eXTh2

Т X4

(АГ + ЗЛГх) ГЦ: + —e^dlXolli + Т {{U^h2

Замечание 2. Первое слагаемое в правой части (9) возникает за счет погрешности аппроксимации интеграла в (5), а второе — из-за погрешности аппроксимации системы дифференциальных уравнений (6). В данной работе используется метод Рунге-Кутта 4-го порядка, чтобы погрешность аппроксимации системы (6) не увеличивала коэффициент при /г2. Между тем можно использовать другие методы аппроксимации системы дифференциальных уравнений, например другие методы Рунге-Кутта, методы Адамса, метод неопределенных коэффициентов [10]. При этом если погрешность численной аппроксимации матричной экспоненты ^ е для любого I = О,...,^, то при условиях теоремы 1 будет справедлива оценка

\д(с,Х(Т)) - д(с,Х(Т))\ <С ±ехт(ХТ + 3^) \\U\l, к2 + (\\XoW, + Т ЦС/Ц^г.

3. Доказательство теоремы. Перед доказательством теоремы оценим погрешность аппроксимации матричной экспоненты, найденной с помощью метода Рунге-Кутта. Разобьем временной отрезок [О, Г] на N2 = кХ равных частей, где к ^ 1 — натуральное число. Пусть к2 = --шаг сетки,

з^ — Т — 3^21 3 = 0,..., Х2, — узлы равномерной сетки. Схема метода Рунге-Кутта 4-го порядка для нахождения решения Ф(£) = еА(т~^ системы дифференциальных уравнений (6) имеет вид

= + ^ (бА + 31г2А2 + 1г22А3 + ^-А4^ ] = 01...1Х21

где Фо = Е, Ф., = Ф^) — сеточная функция, полученная с помощью метода. Обозначим = Ф., — — — погрешность метода на ^'-м шаге.

Лемма 1. Для любого ] = Х2

\\Z-W < ^!_еТ(2А+5л2/г2 + |А^ + ^А4^)^ ii я1 \ 5, 2-

Доказательство этой леммы основано на достаточно простых выкладках, подобные схемы доказательств можно встретить во многих книгах (например, в [10]), посвященных численным методам.

Заметим, что так как /¿2 = = то спРавеДлива оценка

Zi

— \\ZNn_

N2-ik |

< ГД5 eT(2X+^x2h+^xSh2+^xihS)h4.

120 /с4

Доказательство теоремы. Рассмотрим произвольное направление с £ Я", ||с|| = 1. По свойствам аддитивности скалярного произведения и независимости переменных, по которым берется максимум, имеем (используются обозначения пункта 2):

т

д(с,Х(Т)) = (х*(Т),с)= шах (х,с)= шах ( еАТ + ( еА(т-*] и{з) ¿в, с) = + ,

хех{т) х0ех0,и{8)еи\ ] /

где

Jo = max

х0еХ0

Т

(елтх0,с), Jl = max ( / eA{-T~s^ u{s) ds, с).

u(s)eu\J /

Согласно [3] оптимальное управление — такая кусочно-постоянная функция, что выполняется

условие (3). Будем считать, что и*(Ь) непрерывна слева (см. рисунок). Пусть т^, ] = — 1,

точки скачков управления, то = 0, гд^ = Т и и*(в) = 5 £ (тj-l, г.,-], = 1,..., Л^. Заметим, что

Т т дг

П П 1 + . -

N

Обозначим Ji = 2 су, где Ф(^) = еА(т По свойству аддитивности

опорной функции

Ф(ti)ut.,cj ^ max (^еА(-т~иК, cj + max (¿iU, cj = cj + max (¿iU, cj ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где max

ueu

ZiU, с

<

Zi

где

ZiU*(ti),c

<

Zi

||?7||х. С другой стороны (см. (7)),

ЦС/Цг Откуда

Ф (ti)uti,c) - (еА{-т~^и*{и),с) | <С 1^1 \\U\l, .

Обозначим

дг = -

Тогда

N

■h~Yj9i ¿=i

<С NhKth4 IIС-ГЦх = ТКХ ||f/|li h\

Докажем, что

■К - Ji

<

Хе (ХТ + 3iVi)

12

\\и\\^ +TKl\\U\\lhi

(10)

Рассмотрим несколько случаев:

а) на отрезке оптимальное управление и*{£) не имеет переключений. Тогда для любого

£ £ и*{£) = и*(^_1) = = V. По аддитивности скалярного произведения

Согласно [11, с. 162]

h3

Отсюда

9г ~ { v

ds)c

а. 12

b) пусть на сегменте существует по крайней мере одна точка переключения. Число таких

отрезков не более чем N\. Обозначим через ji, ji номера первой и последней по времени точек переключения на [ti_i,ti), т.е. j 1 = min {j : Tj £ [ij_i, i«)}, J2 = max {j : Tj £ [¿¿_i,ij)}. Заметим,

l^j^JVi—1 l^j^JVi—1

что для момента переключения tj выполняется (yj-i,eA (Т_т->'с) = (vj,eA (Т_т->'с). По построению оптимального управления и выбору ji

Тогда

^ ll^lli ^eAT(rii — ti-i).

Аналогично

A'(T-rjl+j)\ _

) ~ <C ||[/||i AeAT(rJ1+J - rJ1+J_1)

c)- {vJ1+J,e

. A*(T-ril+i).

)| iC Iii AeAT(s — Tj1+j)

для любых 1 ^ ] ^ ]2 — < 5 < т^в том числе при в = ti, j = j2 — Таким образом,

путем несложных преобразований для любого в £ [¿¿_1,^] такого, что для некоторых 1 ^ ] ^ ]2 —

Т3г+3 < 8 < т31+3 + 1 имеем

<С ||^||1 АеАТ(в — ) для любого в £ [¿¿_1,^]. Аналогично

и*(и),еА^т~^с) - (и*(з),еА^т-^с) | <С \\U\l, Хехт(гг - з)

для любого в 6 Тогда по свойству интеграла {|//| ^ / |/|} имеем

¿.з+ I ¿.з- I ¿.з

<

1

£ • - к

<

ti- 1+2'

+

+

е

А'(т-и)\ _/*

4> — 1 +"

<

^НЕ/Ме^ I (8-и_1)<1.з+ I =\\и\\1Хехт^.

Следовательно,

N

£

¿=1,

л* - л

N

¿=1

+ гк1||[/||1/г4 <С

^ П11 * + 1И1 + 11^111 = - Т(АГ + ЗДГ1)

4

12

ЦС/Ц^^Г/^ЦС/Ц^4.

где

тах

хех0

где

Вектор ¿о определен из условия (8). По свойству аддитивности опорной функции

/Ф(0)жо, с) ^ тах (елтх, с) + тах (¿ох,с) , \ / х£Х0 х£Х0 \ /

^ П-ХГоМх . С другой стороны,

Ф(0)жо,с) ^ ([еАТ + ^0К,с), ^ П-ХГоМх . Таким образом,

' ' «С \\Х0\\, Кф4.

31 - ^Ф(0)5о,с Используя оценку (10), получим, что

\(х*(Т),с)-(х(Т),с)\ «С — (Ф(0)жо, с

Теорема доказана.

+

П ~ Л

<

«С \\Х0\\1К1к4 +

АеА1 (АТ + ЗЛ^)

12

ЦЩ^+ТКгЦиЦ^.

4. Примеры использования гарантированной оценки. Для некоторых классов линейных управляемых систем существуют оценки числа переключений оптимального управления Л^. Пусть II

является параллелепипедом с ребрами, параллельными осям координат, т.е. U = {dl- ^ Uj ^ d2, j = = 1,..., га} и для управляемой системы выполнено условие общности положения [3]. Тогда оптимальное по быстродействию управление в силу принципа максимума имеет вид

d1 + d2 d2 - d1 = ^P + signKe^-'M,.].

И число переключений j-й координаты функции управления на отрезке [О, Г] равно числу нулей функции (еА 'T_i'c)j на отрезке [О, Г]. Первый пример подобной оценки при множестве U = {d^ Uj ^ d2, j = 1,..., га} приведен в [3] для систем, у которых матрица А имеет только действительные собственные числа. В этом случае N\ ^ га.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Класс систем, в которых действительная матрица А имеет комплексные собственные числа, рассмотрен в работе [12]. Пусть uj — наибольшая мнимая часть собственных значений матрицы А, г\ — число действительных собственных чисел матрицы А, а 2гг — число комплексных собственных чисел

с учетом кратности. Пусть Г2 ^ 1, тогда N\ ^ га (Vi + (2Г2 — 1) + 1, где [ж]* — наименьшее

целое, превышающее ж, и имеем оценку

^+iy^\\u\\lh2 + Kl(\\x0\\l + T\\u\\l)h\

Оценки аппроксимации опорной функции можно выписать и для ряда представленных в работе [13] оценок числа переключений функции оптимального управления линейной задачи с произвольной матрицей А.

В заключение автор выражает благодарность А. В. Лотову за постановку задачи, помощь при разработке темы и плодотворное обсуждение результатов.

СПИСОК ЛИТЕРАТУРЫ

1. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М., 1988.

2. Kurzhanski A. B.,Valyi I. Ellipsoidal calculus for estimation and control. Birkhauser-Boston, 1996.

3. Понтрягин Л. С., Б о л т я н с к и й В. Г., Г ам к р е л и д зе Р.В.,Мищенко Е. Ф. Математическая теория оптимальных процессов. М., 1969.

4. Лотов A.B. Численный метод построения множеств достижимости для линейных управляемых систем с тазовыми ограничениями // ЖВМиМФ. 1975. 15. № 1. С. 67-68.

5. Костоусова Е.К. О полиэдральном оценивании областей достижимости линейных многошаговых систем // Автоматика и телемеханика. 1997. № 3. С. 57-68.

6. Лотов A.B., Бушенков В. А., Каменев Г. К., Черных О. Л. Компьютер и поиск компромисса. Метод достижимых целей. М., 1997.

7. Самсонов С. П. Численное решение линейной задачи оптимального управления с заданной точностью. Дис. ... канд. физ.-мат. наук. М., 1983.

8. ДюрковичЕ. Численный метод решения линейных задач быстродействия с оценкой точности // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 1982. № 3. С. 49-55.

9. Канторович Л. В., Акилов Г. П. Функциональный анализ. М., 1977.

10. Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы. М., 1987.

11. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. Т 2. М., 1962.

12. Haje к О. On the number of roots of exp-trig polynomials // Computing. 1977. 18. N 2. P. 177-183.

13. Смольникова И. А. Оценка сверху числа действительных нулей конечномерного семейства квазиполиномов на конечном отрезке // Вестн. Моск. ун-та. Сер. 1. Матем. Мех. 1977. № 2. С. 50-55.

^ Аелт | АГ + 3 12 1

га

г 1 + (2Г2 - 1)

Tu

Поступила в редакцию 04.04.05

i Надоели баннеры? Вы всегда можете отключить рекламу.