Научная статья на тему 'О квадратичной скорости сходимости схемы проектирования в задаче захвата точки семейством выпуклых тел'

О квадратичной скорости сходимости схемы проектирования в задаче захвата точки семейством выпуклых тел Текст научной статьи по специальности «Математика»

CC BY
99
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Киселев Ю. Н., Хабаров Н. В.

Рассматривается задача о быстрейшем захвате заданной точки yОRn семейством N(t) расширяющихся гладких выпуклых компактов, зависящих от времени t, и обсуждается вопрос об алгоритмах ее решения. Привлекается геометрическая конструкция проектирования точки y на выпуклое тело N(t). В непрерывной версии схемы проектирования поиск оптимального времени t* и оптимального единичного опорного вектора p* описывается в терминах некоторой задачи Коши. Для дискретной версии схемы проектирования дано обоснование квадратичной скорости сходимости последовательности пар (tk,pk) к оптимальной паре (t*,p*). Последнее утверждение составляет основное содержание статьи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On quadratic rate of convergence in the projection scheme for the capture problem of a point by a family of convex bodies

A quickest capture problem of a fixed point yОRn by the family N(t) of expanding smooth convex compact sets, depending on time t, is under consideration. Development of algorithms questions for solving this issue are discussed. The geometrical construction of projection of a point y onto convex set N(t) is used to solve the problem. In the continuous version of the projection scheme searching of the optimal time t* and the optimal normalized supporting vector p* is described in terms of some Cauchy problem. In the discrete version of the projection scheme quadratic rate of convergence of the sequence (tk,pk) to the optimal pair (t*,p*) is grounded. This statement presents the main result of the article.

Текст научной работы на тему «О квадратичной скорости сходимости схемы проектирования в задаче захвата точки семейством выпуклых тел»

О квадратичной скорости сходимости схемы проектирования в задаче захвата точки семейством

выпуклых тел

Киселев Ю.Н., Хабаров Н.В. (nkhabarov@mtu-net.ru) МГУ им. М.В.Ломоносова, факультет ВМиК

1 Введение

В линейной теории быстродействия [1] важную роль играют множества, состоящие из начальных состояний в фазовом пространстве, для которых время быстродействия равно заданному значению [2], [3]. Эти множества называются изохронами. Время быстродействия совпадает с моментом первого захвата пзохроной начальной точки. Такой подход восходит к работам Нейштадта, Итона [7], [8], см. также [4] - [6], [9], [10], [12]. Для гладких задач быстродействия опорный вектор к изохроне в начальной точке определяет начальное значение сопряженной переменной и, на основании принципа максимума Л.С.Поптрягипа [1], описывает оптимальное управление в явной форме в терминах суперпозиции градиента опорной функции области управления и оптимальной сопряженной переменной [2], [3].

Геометрическая конструкция изохроны использовалась в [2], там же предложен и исследован метод проектирования начального состояния на изохрону в линейной задаче быстродействия в начало координат

x{t) = Ax{t) + u{t), u(t)eU, х,иеШп, ж(0) = у, x(ti) = О, ti —^ min .

Область управления U считается гладким [2] выпуклым компактом из В.". О 6 int U. В [2] рассмотрены непрерывный и дискретный варианты метода проектирования на изохрону. Для дискретного варианта схемы проектирования обоснована квадратичная скорость сходимости [2]. В [4] рассмотрен метод потенциалов решения линейной задачи быстродействия, для которого доказана квадратичная сходимость. В данной статье исследуется метод проектирования в задаче захвата точки семейством гладких выпуклых монотонно расширяющихся компактов, непрерывно зависящих от времени. Основным результатом данной статьи является теорема о квадратичной скорости сходимости для дискретной версии схемы проектирования.

Отметим, что в этой статье операция проектирования считается элементарной, и алгоритм решения задачи захвата формулируется в терминах этой операции.

Новый подход к построению алгоритмов проектирования точки на гладкий выпуклый компакт на основе соприкасающихся эллипсоидов с приложениями к линейной задаче быстродействия и к задаче захвата точки семейством гладких выпуклых компактов предложен и исследован в [13] - [17]; этих вопросов в данной статье мы касаться не будем.

(1)

Электронный журнал "ИССЛЕДОВАНО В РОССИИ" 2069 http://zhurnal.ape.relcirii.ru/articles/2003/170.pdf

2 Постановка задачи. Формулировка предположений

Пусть у G R" - фиксированная точка, a N(t) - семейство выпуклых компактов в R", непрерывно зависящих от времени / G [0, Т]; непрерывность понимается в смысле метрики Хаусдорфа. Опорная функция компакта МсГ определяется [18] соотношением

а(М,р) = ma,x(x,p), рЕ R".

хеш

Опорная функция множества N(t)

cr(N(t),p) = та х(х,р) (2)

xeN(t)

зависит от времени t и векторного аргумента р G R", Для опорной функции (2) вводится более краткое обозначение

a(X(t),p) = e(t,p). (3)

Предположим, что с ростом времени t множества N(t) монотонно расширяются:

J4(t) С int H(i') V t, t' G [0, T], t < f', (4)

причем у ф N(0), у G intN(T). Условие (4) имеет место при выполнении неравенства

e't(t,p)> 0 Vp G § = {р : \р\ = 1}. (5)

Тогда существует момент времени /* G (().'/') такой, что

у i N(t) при t G [0, £*), ye dN(Q.

Момент времени /* решает экстремальную задачу

i^min t G [0, Т], (6)

- задачу быстрейшего захвата точки у семейством выпуклых тел Х( /). Пусть р* - единичный опорный вектор для множества N(t») в его граничной точке у. Будем рассматривать конструктивные методы вычисления оптимальной пары (/*./»*) на основе геометрической конструкции проектирования точки у на выпуклый компакт N(t), предполагая, что семейство выпуклых компактов Х( /) обладает определенными свойствами гладкости, а именно: опорная функция 0(t,p), см. (3), непрерывна по совокупности переменных (t,p) вместе с частными производными до второго порядка включительно (последнее при р ф 0), причем ранг гессиана

G(t,p) = e;p(t,p), рф О, (7)

равен п — 1. Градиент опорной функции (3) по аргументу р

at,p) = e!p(t,p), Рф о, (8)

определяет опорную точку множества N(t) в направлении вектора р ф 0. Кроме того, напомним, предполагается выполненным условие (5), которое влечет включения (4). Без ограничения общности можно считать, что 0 G intN(t) Vi G [0,Т]. Единичный

оптимальный опорный вектор р* при сделанных предположениях определяется единственным образом.

В рассматриваемую схему вкладывается линейная задача быстродействия (1), причем здесь в роли семейства множеств Х(/) выступают выпуклые компакты, ограниченные ¿-нзохронамн, а точка у есть начальное состояние управляемого объекта [2], [3].

Для решения экстремальной задачи (6) и вычисления оптимальных параметров (¿*,Р*) привлекается схема проектирования точки у на выпуклый компакт кото-

рая является аналогом схемы проектирования начального состояния на изохрону при решении линейной задачи быстродействия [2], [3]. Сначала эта схема описывается в непрерывной форме в терминах некоторой задачи Коши. Далее рассматривается дискретная форма этой схемы, в которой определяется последовательность пар к,Рк), сходящаяся к решению (/*./»*). Основным результатом статьи является утверждение о квадратичной скорости сходимости итерационной последовательности {1и-,Рк). В [2] аналогичный результат установлен для дискретной схемы проектирования в линейной задаче быстродействия для последовательности моментов времени //,.. последовательности расстояний г и и сформулирован для последовательности опорных векторов р

Проекция точки у на выпуклый компакт Л

7г (Л, у) = ащтш | о — у |

аел

есть точка компакта Л, наименее удаленная от проектируемой точки у.

3 Схема проектирования в непрерывной форме

Пусть

v(t)=nm),y) (9)

- проекция точки у на множество 3\T(t), а

r(t) = \v(t)-y I (10)

- расстояние от точки у до проекции v(t), 0 < / < /*: ясно, что r(t») = 0. Уравнение проектирования в статике (при фиксированном t) имеет вид

r(t)p(t) = y^Ç(t,p(t)), 0</</„ (И)

|p(í)| = l, (12)

где p(t) - единичный опорный вектор, параметризующий проекцию v(t) точки у на множество D\T(t): v(t) = Ç(t,p(t)), см. (8). Функции p(t),r(t) определяются задачей Коши

p(t) = [r(í)J + G(í,p(í))+p(í)p*(ír1-K(í,p(í)Mí)^CÍ(í,p(í))],

f(t) = -e't(t,p(t)),

P[U) - r(0) ' (13)

r(0) = I У 7г(3\Г(0), t/) I,

0 < t < u,

где G - гессиан (7), I - единичная матрица, обращаемая матрица в первом уравнении (13) невырождена. Соотношения (13) получаются из уравнений (11), (12). Пусть

(p(t),r(t)), ()</</,. (14)

- решение задачи Коши (13). Функция r(t) в силу предположения (5) монотонно убывает, а момент времени /* определяется условием /•(/* ) = 0. Задача Коши (13) дает принципиальное решение проблемы поиска пары (t*,p*): t* есть положительный корень уравнения r(t) = 0, а оптимальный опорный вектор р* = p{t)\t=u- Задача Коши (13) полезна при обосновании квадратичной скорости сходимости дискретной схемы проектирования, см. раздел 5. Образно говоря, непрерывная задача (13) является "несущей конструкцией "для дискретной схемы проектирования.

4 Дискретная форма схемы проектирования. Сходимость

Рассмотрим следующий дискретный итерационный процесс

Рк+1 = ~——, = И,(рк+1), к = 0,1,.... (15)

Гк

Здесь ттк = у(Ьь) = ^к,Рк+\), Тк = г(^), рк+\ = р(^), а t = Ь(р) есть положительный корень функции

9{Ьр) = 0{Ьр)-{у,р) (16)

относительно аргумента В начале итерационного процесса (15) выбирается момент

времени ¿о Е (0,£*) и по формулам (15) (при к = 0) вычисляются р\ = ^ '

¿1 = МР1); исходя из найденных рх, по формулам (15) (при к = 1) вычисляются р-2, ¿2 и т.д. Геометрический смысл метода (15) иллюстрирует рис. 1.

Рис. 1.

Геометрическая иллюстрация дискретной схемы: 7Гк = = Фк;Рк+Фк+1,Рк+1) - У ± Рк+1-

Утверждение. При сделанных предположениях процесс (15) сходится к оптимальной паре (¿*,р*); причем tk 1" t* при к —^ оо.

Справедливость этого утверждения следует из монотонности и ограниченности последовательности {tk} в рассматриваемом процессе (15). Заметим, что процесс (15) может сходиться за конечное число шагов; эту простую ситуацию в дальнейшем исключаем из рассмотрения, так что все расстояния = r(tk) > 0, а моменты tk < t*.

5 Обоснование квадратичной скорости сходимости

Пусть

p(t),r(t), о < / < /,. (17)

- решение задачи Коши (13), тогда, очевидно, параметры Pk+i, г и процесса (15) связаны с решением (17) равенствами

Рк+1 = p(tk), Гк = r(tk) > 0. (18)

Теорема 1 При сделанных выше предположениях процесс (15) сходится, к оптимальной паре (t*,p*) с квадратичной скоростью, т.е. существуют положительные числа С\, С-2, Сз и номер К та,кие, что при всех к > К выполняются неравенства

\tk+i — t*\ < C\\tk — i*|2, (19)

\Pk+i ^P*\< С2\рк^р* |2, (20)

Гк+i < С,г2к. (21)

Доказательство теоремы. Привлекая функцию (16), введем множество

£ = {реЕ"\{0}: g(t,p) = 0}. (22)

Положим

p(t,p) = -\/(t^Q2 + \p^p«\2. (23)

Для функции (16) имеют место равенства

g{t*,p*) = 0, g'p{t*,p*) = 0. (24)

Докажем сначала вспомогательные утверждения, сформулированные в леммах 1 и 2.

Лемма 1 Для, всех точек (t,p) из достаточно малой окрестности точки (t*,p*) при условиях

t<U, ре L(t) (25)

отношение р/\р^р* \ ограничено, где расстояние р определяется, формулой (23).

Доказательство леммы 1. Условие (25) влечет равенство

g(t,p) = 0. (26)

На основании (24), (26), применяя формулу Тейлора, имеем

0 = g(t,p) - g(t*,p*) = g't(t*,p*)(t - Q + g'Jt*,p*)*(p - p*) + R2, (27)

где остаточный член I>\ удовлетворяет условию

r'2 = о(р) при р -»■ 0. (28)

Из (27), (28) и второго равенства (24) следует, что

R

t,^t = — = р-е(р), (29)

£ #

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где е* = g't(t*,p*) > 0 - фиксированная константа, а

е(р) 0 при р -»■ 0. (30)

Принимая во внимание (23) и (29), получаем р2 = р2 - е2(р) + \ р — р* |2, откуда

J^f = Т^е\р)- (31)

Последняя дробь в силу (30) ограничена при р 0. что доказывает лемму 1. Замечание 1 В силу (30) и (31) существует число ро > 0 такое, что

\ 2

\—"—г I < 2 (32)

IР ~ Р* I /

0 < р < ро- (33)

Далее считаем, условие (33) выполненным.

Лемма 2 Для любой точки (t,p) при условиях (25) и (33) найдутся окрестность точки (t*,p*) и число С > 0 та,кие, что в этой, окрестности справедливо неравенство

\t-U\ <С\р^р,\'. (34)

Доказательство леммы 2. Запишем формулу Тейлора для функции (16)

g(t,p) = g(t*,p*) + {sft{t*,p*){t - и) +g'p{t*,p*)*(p-p*)} +

Ц {g!tt(t*,P*)(t - Q2 + 2g'b(U,p*)*(p - p*)(t - Q+ (35)

+ ip - p*)*g^p(t*,p*)ip - p*)} + -R3

с остаточным членом

R-з = °(p2) ПРИ P 0. (36)

Из (35) в силу равенств (24), (26) следует, что

(t„ - t) {2е* + g"t(t*,P*)(t* - i) + 2g't'p(t*-,p*)*(p ^ Р*)} = ^

= ip-p*)*g^p(t*,p*)ip-p*) + 2R3.

Из (37) следует соотношение

(р-р*\* ,,и ^ { р^р* \ ,о Дз ( р ^2

t ( lu^J ь ш

t.-t---\p-p.\- (38)

где

Дх = 0(р) при р 0. (39)

В силу (36) и (39) существует число р\ £ (0, ро] такое, что выполняются неравенства

Е3/р2 < 1/4, < (40)

при условии

о < р < Ръ (41)

Из (38) при условии (41) с учетом (32), (40), получаем неравенство

I , + 1 , |2

-Ц<-\Р^Р* | ,

£ #

где Л* = та,х q*g!! (t¡f ,p¡f)q > 0 - константа. Таким образом, последнее неравенство

I 9 1=1

показывает, что доказано неравенство (34) с константой ( = (Л» + 1)/е* > 0, верное при условии (41). Лемма 2 доказана.

Продолжим доказательство теоремы. В силу сходимости итерационной последовательности {1и-,Рк) к (¿*,Р*) при к оо существует номер К такой, что

Р&к,Рк)<Р1 У к > К.

В дальнейшем считаем, что к > К.

В процессе (15) имеет место равенство /•/, = р*к+^[у — ттк], которое, в силу представления проекции тгк = ц(7/,../)/,.. |). влечет выполнение соотношения

гк =р*к+1у^в(гк,рк+1). (42)

В ходе итерационного процесса (15) выполняется равенство (см. (16), (15))

Рк+\У ~ 0{Ь+1,Рк+1) = 0. (43)

Почленное вычитание равенств (42) и (43) дает выражение для расстояния

гк = в^к+1,рк+1) - 9{Ц,рк+1), которое можно записать в интегральной форме

tk+1

/•/,■ = I в'^,Рк+1)(И. (44)

Привлекая выражение для производной г(£) = —из задачи Коши (13) и условие г к = см- (18), запишем равенство

1

Гк-Гк+1= I (45)

!'к

Из соотношений (44) и (45) в силу равенства ри+г = Р^к), см. (18), можно получить следующее представление для гк+\

1

Гк+1 = Гк- / &гЦ,рЦ))(Н =

^ (46)

= /

tk

с интегрантом

т = (47)

удовлетворяющим условию

/*(**) = 0. (48)

В силу (48) = ¡к^п)^-^), тк е [^,^+1]. При к>К,ге [гк,и) имеет место оценка модуля производной функции (47)

|А(*)1<С1 (49)

с некоторой положительной константой сх, не завиясщей от к. Поэтому из (46), (48) и (49) получаем неравенство

4+1

Гк+1 < сх / {г - гкщ = - гк)2 = §дт|, ^^

^Тк = 1к+\ — д.

Из сделанных предположений вытекает существование положительных постоянных С и С+ таких, что

(' <0',(1.рк.1) <('. Ук>к,ге[гк,и],

С_ < < с+.

Формула (44) и первая двусторонняя оценка (51) влекут неравенства

(51)

Г А7, < /•, < С+АТк. (52)

Опираясь на неравенства (50) и (52), можно записать цепочку неравенств

(53)

В силу второго уравнения (13) имеем:

и

г(гк)-г(и) = I в'^рЦ))ей, (54)

Ьк

и, так как /•(//,.) = /•/,.. /•(/*) = 0, то формула (54) принимает вид

и

/•/,■ = I 0'^.,рЦ))

!'к

который, в силу второй оценки (51), влечет оценку

C-{U-tk)<rk<C+{U-tk). (55)

Используя (53) и (55), получаем:

t* — tfc+i Ь -JJ— ь 2qTгк Ь

< фг (С+(и - tk)f = Сф{и - tkY = (56)

= Cl(t* — tk)2-

В силу (56) можно утверждать, что первая оценка (19) теоремы получена с константой Ci = (ciC*)/(2C*).'

Далее имеем:

IР* ~Рк+1 I = I p{U) - p(tk) I =

и

fp(t)dt

tk

<J\p(t)\dt<c2-(t^tk), (57)

tk

где С2 = п1нх | /'(/ ) | - константа, не зависящая от номера к > К. Существование такой ЩккМ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

положительной константы С2 можно извлечь из первого уравнения задачи Коши (13).

Так как в процессе (15) д(1к,Рк) = 0, то в силу определения множества (22) имеем: Рк € £(//,). Поэтому, полагая в неравенстве (34) t = tk, р = рк, к > К, получаем неравенство

~ < С\р* -Рк |2, (58)

и теперь из (57) и (58) следует, что

\р* ~Рк+11 < С2С\р* -рк |2. (59)

Неравенства (53) и (59) означают, что доказаны оценки (20), (21) теоремы с константами ('■> = ('■>('. Сл = 7777т- Теорема доказана полностью.

Замечание 2 Из оценок (19) и (20) следует неравенство

р(ЫъРк+1)<Ср2^рк) с константой С = тах(С1, Су.

Работа выполнена в рамках Программы в Поддержку ведущих научных школ, проект НШ-1846.2003.1.

Список литературы

[1] Понтрягин Л. С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М,: Физматгиз, 1961.

[2] Киселев Ю.Н. Линейная теория быстродействия с возмущениями. I. - М.: Издательство МГУ, 1986.

[3] Киселев Ю.Н. Оптимальное управление. - М, Издательство МГУ, 1988.

[4] Киселев Ю.Н. Быстросходящиеся алгоритмы решения линейной задачи быстродействия // Кибернетика. 1990. N 6. С. 47-57, 62,

[5] Аввакумов С.Н., Киселев Ю.Н., Орлов М.В. Методы решения задач оптимального управления на основе принципа максимума Понтрягина // Труды МИЛН им. В.А. Стеклова. 1995. Т. 211. С. 3-31.

[6] Киселев Ю.Н.. Орлов М.В. Численные алгоритмы линейных быстродействий. // ЖВММФ, 1991. N 12. С. 1763-1771.

[7] Neustadt L. W. Synthesizing time-optimal control systems //J. Math. Anal, and Appl.

- 1960. 1, N 3-4. - pp. 484-493.

[8] Eaton J.O. An iterative solution to time optimal control // Ibid. - 1962. - 5, N 2. -pp. 329-344.

[9] Пшеничный Б.Н. Численный метод расчета оптимального по быстродействию управления для линейных систем // ЖВММФ, 1964, N 1, С. 52-60.

[10] Fujisawa Т., Yasuda Y. An iterative procedure for solving the time-optimal regulator problem //J. SIAM Control. 1967. Vol. 5, N4, pp. 501-512.

[11] Болтянский В.Г. Математические методы оптимального управления. - М,: Наука, 1968.

[12] Федоренко Р.П. Приближенные методы решения задач оптимального управления.

- М.: Наука, 1978.

[13] Киселев Ю.Н. Проектирование точки на выпуклый компакт. // Международная конференция по управлению "АВТОМАТИКА-2001", 2001. Т. 1. С. 30-31.

[14] Хабаров Н.В. Алгоритмы проектирования точки на гладкий выпуклый компакт с квадратичной скоростью сходимости // Тезисы докладов ВЗМШ. 2001. С. 269-270.

[15] Хабаров Н.В. Алгоритмы решения задач быстродействия с квадратичной скоростью сходимости // Тезисы докладов ВВМШ. 2001. С. 164-165.

[16] Хабаров Н.В. Алгоритм решения задачи быстродействия на основе проектирования конечного состояния на множество достижимости // Труды XXIV Конференции молодых ученых механико-математического факультета МГУ им М.В.Ломоносова. 2002. С. 182-184.

[17] Хабаров Н.В. Алгоритм решения задачи оптимального управления на основе соприкасающихся эллипсоидов // Материалы Воронежской весенней математической школы. 2002. С. 156-157.

[18] Благодатских В.И. Введение в оптимальное управление. - М,: Высшая школа, 2001.

i Надоели баннеры? Вы всегда можете отключить рекламу.