Научная статья на тему 'БИЛИНЕЙНАЯ ИНТЕРПОЛЯЦИЯ ПРОГРАММНОГО УПРАВЛЕНИЯ В ЗАДАЧЕ О СБЛИЖЕНИИ'

БИЛИНЕЙНАЯ ИНТЕРПОЛЯЦИЯ ПРОГРАММНОГО УПРАВЛЕНИЯ В ЗАДАЧЕ О СБЛИЖЕНИИ Текст научной статьи по специальности «Математика»

CC BY
4
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
управляемая система / задача о сближении / неопределенный постоянный параметр / билинейная интерполяция

Аннотация научной статьи по математике, автор научной работы — Александр Анатольевич Ершов

Рассматривается управляемая система, содержащая постоянный двумерный векторный параметр, приближенное значение которого сообщается управляющему лицу только в момент начала движения. Заранее известно лишь множество возможных значений этого неопределенного параметра. Для данной управляемой системы поставлена задача о сближении с целевым множеством в заданный момент времени. При этом считается, что управляющее лицо не имеет возможности проводить в режиме реального времени громоздкие вычисления, связанные с построением таких разрешающих конструкций как множества достижимости и интегральные воронки. Поэтому для решения этой задачи предложено заранее вычислить несколько «узловых» разрешающих управлений для значений параметра, представляющих собой узлы сетки, накрывающей множество возможных значений параметра. На тот случай, если в момент начала движения окажется, что значение параметра не совпадает ни с одним из узлов сетки, предполагается вычислять программное управление по формулам линейной интерполяции. Однако, данная процедура может быть эффективной только в том случае, если используется линейная комбинация управлений, соответствующих одному и тому же «поводырю» по терминологии метода экстремального прицеливания Н.Н. Красовского. Для возможности эффективного применения линейной интерполяции, для каждого узла сетки предложено построить по четыре «узловых» разрешающих управлений и, кроме того, использовать метод разделения управления на основное и компенсирующее. Вследствие применения последнего метода вычисляемое множество разрешимости оказывается несколько меньше фактического, но зато возрастает точность перевода состояния системы на целевое множество. В качестве примера рассмотрено нелинейное обобщение навигационной задачи Цермело.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «БИЛИНЕЙНАЯ ИНТЕРПОЛЯЦИЯ ПРОГРАММНОГО УПРАВЛЕНИЯ В ЗАДАЧЕ О СБЛИЖЕНИИ»

ISSN 2074-1871 Уфимский математический журнал. Том 15. № 3 (2023). С. 42-54.

УДК 517.977.12

БИЛИНЕЙНАЯ ИНТЕРПОЛЯЦИЯ ПРОГРАММНОГО УПРАВЛЕНИЯ В ЗАДАЧЕ О СБЛИЖЕНИИ

A.A. ЕРШОВ

Аннотация. Рассматривается управляемая система, содержащая постоянный двумерный векторный параметр, приближенное значение которого сообщается управляющему лицу только в момент начала движения. Заранее известно лишь множество возможных значений этого неопределенного параметра. Для данной управляемой системы поставлена задача о сближении с целевым множеством в заданный момент времени. При этом считается, что управляющее лицо не имеет возможности проводить в режиме реального времени громоздкие вычисления, связанные с построением таких разрешающих конструкций как множества достижимости и интегральные воронки. Поэтому для решения этой задачи предложено заранее вычислить несколько «узловых» разрешающих управлений для значений параметра, представляющих собой узлы сетки, накрывающей множество возможных значений параметра. На тот случай, если в момент начала движения окажется, что значение параметра не совпадает ни с одним из узлов сетки, предполагается вычислять программное управление по формулам линейной интерполяции. Однако, данная процедура может быть эффективной только в том случае, если используется линейная комбинация управлений, соответствующих одному и тому же «поводырю» по терминологии метода экстремального прицеливания H.H. Красовско-го. Для возможности эффективного применения линейной интерполяции, для каждого узла сетки предложено построить по четыре «узловых» разрешающих управлений и, кроме того, использовать метод разделения управления на основное и компенсирующее. Вследствие применения последнего метода вычисляемое множество разрешимости оказывается несколько меньше фактического, но зато возрастает точность перевода состояния системы на целевое множество. В качестве примера рассмотрено нелинейное обобщение навигационной задачи Цермело.

Ключевые слова: управляемая система, задача о сближении, неопределенный постоянный параметр, билинейная интерполяция.

Mathematics Subject Classification: 93С41

1. Введение

Одна из самых существенных проблем теории управления [1] заключается в том, что вычисление разрешающего программного управления (или позиционной стратегии в дифференциальных играх [2], [3]) зачастую связано с громоздкими вычислительными процедурами, которые невозможно произвести в режиме реального времени. В том случае, когда условия задачи полностью определены и заранее известны, длительное вычисление разрешающих конструкций не представляет проблемы, так как разрешающее управление можно построить до начала движения управляемой системы. Ситуация меняется при наличии некоторых неопределенностей в условиях задачи управления, которые невозможно

A.A. Ershov, Bilinear interpolation of program control in approach problem.

© Ершов A.A. 2023.

Исследование выполнено за счет гранта Российского научного фонда № 19-11-00105, https: / / rscf.ru / project /19-11-00105/.

Поступила 23 августа 2022 г.

выяснить до начального момента времени [4]- [7]. Например, согласно работе [8] решение задачи управления с неполностью известным начальным условием состоит из трех этапов:

1) сбор информации о системе,

2) применение этой информации для устранения неопределенности,

3) переход к активному управлению,

В этой схеме стоит обратить внимание на переход между вторым и третьим этапом: после устранения неопределенности вряд ли будет возможным осуществить мгновенное построение разрешающего управления во время уже начавшегося движения некоторой динамической системы.

Также можно рассмотреть, например, вполне естественную задачу, когда расположение целевого множества для динамической системы заранее неизвестно, но ситуация требует немедленной реакции, как только целевое множество обнаруживается в наблюдаемом фазовом пространстве.

Обобщая данные задачи, с помощью замены переменных можно любые неопределенности в начальном положении, параметре или расположении целевого множества свести к неопределенному многомерному параметру. Кроме того, в данной работе мы не будем затрагивать процесс идентификации неопределенного параметра, а сосредоточимся на быстром ответе в виде программного управления после того, как этот неопределенный параметр нам сообщили,

В качестве решения предлагается заранее построить разрешающие управления, соответствующие нескольким значениям постоянного векторного параметра, а для промежуточных значений параметра предлагается воспользоваться простыми формулами линейной интерполяции. Проблема заключается в том, что в общем случае линейная комбинация управлений, соответствующих разным «поводырям» (по терминологии метода экстремального прицеливания H.H. Красовского [9], [10]), не дает «хороших» результатов. Поэтому применяется более сложная схема на основе метода разделения управления на основное и компенсирующее,

В данной работе мы рассмотрим билинейную интерполяцию по двумерному векторному параметру, случай скалярного параметра был ранее рассмотрен в [11].

где ж(0) € Кга — начальное состояние, £ — время, х(Ь) Е Кга — фазовый вектор системы, и(Ь) — измеримая по Лебегу вектор-функция (вектор управляющих воздействий) со значениями из компакта Р с п и р — натуральные числа, а Е & — постоянный параметр, & — компакт из К2,

Предполагаем выполненными следующие условия, А. Вектор-функция f (Ь, х, и, а) определена, непрерывна на [10,Щ х Кга х Р х & и для любой ограниченной и замкнутой области П с [10,Щ х Яп найдется такая константа Ь = Ь(П) Е (0, то), что

||/(г,х{1),и,а) - f (1,х{2),и,а)Ц ^ Щх{1) - х{2)\\, (г,х{1),и,а) Е П х Р х &, г = 1, 2; здесь || • || — евклидовая норма вектора в Кга,

2. Постановка задачи Пусть на промежутке времени [¿0 (¿0 < $ < то) задана управляемая система

(2.1)

Замечание 2.1. Учитывая условие А, получаем, что модули непрерывности ш(3\8) = тах{Ц](I, х,и*,а) — /(1,х,и* ,а)Ц :

(Ь,х,и*,а), (Ь,х,и*,а) € И х Р х ^, Ци* — и*Ц С £}, 8 € (0, то),

= тах{Ц](I, х,и,а*) — /(1,х,и,а*)Ц :

(Ь,х,и,а*), (Ь,х,и,а*) € Б х Р х ^, |а* — а*1 С £}, 8 € (0, то), удовлетворяют предельным соотношениям ш(к\8) 0 щи 8 0 к = 3, 4.

B. Найдется такое 7 € (0, то), что

||/(г,х,и,а)\\ С 7(1 + ||ж||), (г,х,и,а) € [¿о, то) х Ега х Р х

Замечание 2.2. Под допустимым, управлением, и(Ь) мы понимаем измеримую по Лебегу на [10,Щ вектор-функцию со значениями из Р. Условий А и В достаточно, чтобы, каждому допустимому управлению и(£) соответствовало движение х(Ь), являющееся, решением системы, (2.1) в классе абсолютно непрерывных функций [12, §2.1]. При этом, производная х(£) понимается в обобщенном, смысле и для, нее выполняется, формула Ньютона-Лейбница (см., напр., [13, гл. 2, §4])-

Замечание 2.3. В силу условия В существует некоторая, достаточно большая область О С [Ь0, хЕга, в которой заведом,о содержатся всевозможные движения системы, (2.1) вместе со всем,и вспомогательными конструкциями для, построения разрешающих управлений. В дальнейшем будем всюду использовать именно эту область О и соответствующую постоянную Липшица Ь = Ь(О).

C. Вектограмма скоростей Р(Ь,х,а) = /(Ь,х,Р,а) = {/(Ь,х,и,а) : и € Р} — выпуклое множество в Мга для любых (Ь, х, а) € \Ъ0, 9] х Мга х

Обозначим через Вр(и,р) = {£ € : ||£ — и|| С р} — замкнутый шар в Р = Р(р) = Р — Вр(0,р) = {и € : и + Вр(0,р) С Р} — сужение множества значений управления,

О. При любых (¿,х,а) € [10,$] х Мга х ^ и любого непустого сужения Р множество Р(Ь, х, а) = /(Ь, х, Р, а) = {/(Ь, х,и,а) : и € Р} выпуклое,

Е. Пусть точки (Ь*,х*) и (х* ,Ь*) принадлежат области О, причем ¿* = ¿* + А, х* = х* + А • /(г*,х*,й,а), А > 0, и € Р(р(А)), а € Кроме того, задано не слишком большое число Аа > 0, Тогда можно задать функцию р(А) таким образом, что относительно вектора-компенсатора т из Вр(0, р(А)) и абсолютно непрерывной функции ж(-) разрешима задача

'х(Ь) = /(1,х(1),й + ,ш,а), Ь € (Ь*,Ь*),

— %*, ) — х

для любого значения 5 € В2(а, Аал/2). При этом зависимоеть и> = т(а) должна быть из класса С2(В2(а, Аал/2)) и для всех 5 € В2(а, Аау/2) удовлетворять неравенствам

д 2т

да\

С М2.

д 2т

да2

С М2.

д2w

да\да2

где постоянная М2 ^ 0 определяется видом функции / (• А и Ап.

С М2, )О

Замечание 2.4. Оптимальный численный метод для, вычисления функции т = и>(а) и достаточные условия его сходим,ости являются, нерешенными вопросами и могут быть предметом отдельного теоретического исследования. Для практического вычисления, вектора-компенсатора т можно предложить следующий алгоритм,. 1) В качестве начального приближения вектора-компенсатора т выбираем, = 0.

2) Каждому приближению Wk, к — 0,1, 2,..., сопоставляем невязку \\хк (t*) — х*\\, где сеточная, функция Хк (t) - численное решение задачи, Коши

(Х к (t) — f(t ,хк (t),u + wk ,а), t Е (t*, t*), \^хк (t *) — х*.

Решение задачи, Коши можно осуществлять м,етодом, Рунге-Кутта [Ц, гл. 8, §2], оптимальный порядок которого напрямую зависит от степени гладкости, функции f(•, •, •) по первой и второй переменной.

3) Выбор последующих приближений Wk, к — 1, 2..., можно осуществлять в соответствии с алгоритмам, покоординатного спуска [Ц, гл. 7, §3] по соответствующей невязке (либо простым перебором, из Вр(0, р(А))).

4) Условием, останова является, достаточно малое значение невязки \\хк(t*) — х*\\.

W х*

тически,, дополнением к условию Е является, предположение, что мм можем вычислять функцию w — w(a) с пренебрежимо малой погрешностью.

Кроме условий А, В, С, D, Е, оговорим информационные условия, в рамках которых осуществляется управление системой (2,1),

Будем предполагать, что в начальный момент времени t0 лицу, осуществляющему выбор программного управления u(t), сообщается некоторое приближенное значение а* Е L параметра а Е L с погрешностью, не превосходящей

\\а* — а\\ < Sa. (2.2)

Кроме того, задолго до момента начала движения tо, управляющему лицу известно само ограничение — компакт L и примерное положение х*(t0) начадьной точки х(t0) с погрешностью

\\х*(1о) — х(1о)\\ < 5Х. (2.3)

Дополнительным ограничением является то, что управляющее лицо не может произ-

о

построить и сохранить в ограниченном объеме памяти разрешающие программные управа

имея в распоряжении лишь информацию о L и х*(t0). Тем самым мы оговорили информационные условия.

Пусть М — некоторый компакт в Rn, представляющий собой целевое множество для системы (2.1). Сформулируем для системы (2.1) задачу о сближении с М.

Задача 1. Требуется, определить существование допустимого программного управления u(t), переводящего движение х(Ь) системы (2.1) в м,ом,ен,т $ в малую окрестность М

3. Алгоритм решения задачи 1 о сближении

Обозначим через отображение, которое «прореживает» множество, т.е. любо-

му ограниченному множеству А С Rfc, к Е N, оно сопоставляет конечное множество А — П(г)(А), состоящее по-возможноети из меньшего количества его точек и обладающее свойством:

d(A,A) ^ 6,

где d(A, А) — хаусдорфово расстояние между А и А. Способы построения такого «прореженного» множества А приведены в [15, с. 549].

Обозначим Р — Q(Au\P), где Аи > 0 — достаточно малая постоянная (выбранная из соображений оптимального соотношения между точностью и производительностью вычислений), Р — сужение управления из условия Е,

Введем отображение X: R х R х 2п х L м 2п, действующее по правилу:

X(A\t*, t*,X*,a)= [J {х + (t* - t*)f{t*,х,Р ,а)}

тех*

IJ Ц|{х + (f* - t*)f(t*,х,и,а)}.

хех*

{х + (t* - t*)t(t*,x,u,a)

хех* иеР

Теперь, после введения необходимых обозначений, сформулируем численный метод решения задачи 1 в виде двух алгоритмов. Первый алгоритм предназначен для вычислений, производящихся до начала движения системы, а второй алгоритм применяется непосредственно во время движения.

Алгоритм 3.1.

1) Выберем достаточно большое натуральное число N и введем, равномерное разбиение Г = {t0, t1, t2,..., U,..., tN = $} временного промежутка [t0,Щ с диаметром А = А(Г), который удовлетворяет соотношениям, А = ti+1 - U = N-1 ■ ($ - t0), i = 0, N - 1.

2) Обозначим через Аа > 0 достаточно малую постоянную, удовлетворяющую условию Е при А = А(Г)- Кроме того, из условия Е определяются, функция р(А) и сужение управления Р = Р(р(А)).

3) В качестве конечного подмножества L С L выберем, такое множество векторов

чтобы любое а G L было внутри «своего» квадрата,

с четырьмя вершинам,и = (а{^ ± Аа/2, а^ ± Аа/2).

4) Выберем, достаточно малую постоянную Ах > 0 и для, всех j = 1,Na определим, множества

Xo = {х^}, Xk (а^) = (A)(tk, tk-i,Xk-i,aW), к =1,TN.

При построении конечных множеств Xk(а(^), k = 1, N, j = 1,Na, для каждой точки хk'j) G Xk(a1-j)) м,ы, будем, запоминать «родительскую» точку х(к 1j) G Xk-1(a(^) и управление и(к'^ = const, для которых выполнено соотношение

хк'Я = х(к-1']) + А ■ ¡^к-1,х(к-1'з),и(к'з),а(з)).

5) Если для всех а^ G L расстояние

р(M,XN(а^)) = шт{||х - у|| : х G М,у G XN(а(^)} > Ал,

то мы заключаем, что разрешающее программное управление, переводящее движение системы (2.1) на целевое множество М в момент $ с приемлемой точностью, невозможно построить нашим методом, и завершаем, решение задачи о сближении. Если для всех а(^ G L расстояние

p(M,XN(а(з))) = шт{||х - у|| : х G М,у G XN(а(^)} ^ Ал,

то мы заключаем, что задача, 1 разрешима для, любого а G L, реализованного в си,стем,е. Если для некоторых а(G L расстояние

p(M,XN(а^)) = шт{||х - у|| : х G М,у G XN(а(^)} ^ Ал,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а, для других а(G L это неравенство не выполняется, то мы не сможем гаранти-

а

которое нам сообщат.

6) Для, каждого j = 1, Na выбираем, по одной точке х(м'^ G XXn (а() из ближайших к М. Будем считать, что если, наш, алгоритм не закончился, на, шаге 5), то р(х(м'^,М) ^ Ах, j = 1, Na. Далее, для каждого j = 1,Na будем обозначать через

Х(к'^) II и(к'3)

и иу

ли» нас к х(м'^.

именно те точки и те постоянные управляющие вектора, которые «приве-

7) Для каждого ] = 1,Ма и к = 1,М решаем в соответствии с замечанием, 2-4 по четыре краевые задачи относительно постоянных векторов-ком,пенса,торов п](к,з,±,±) € Вр(0, р(А)) и абсолютно непрерывных функций х(к'Э'±'± (Ь):

(1) = / (1,х

ж—^'(1к-1) = х(к-1'3), х(к'3'±'±)(1к)= х

л**), г € (и-1,и),

8) Каждому € ^ мы сопоставляем четыре кусочно-постоянных «узловых» управления,

и

* € [10,11),

(3'±'±)(1) = 4 й(к'з) + т(к'3'±'±), г € [гк-1,гк),

(3.1)

^ + т(м'3'±'±), г € -1,гм]

Замечание 3.1. В шаге 3) алгоритма 3.1 можно выбрать несколько меньшее множество ^, допуская при этом, что некоторые точки а € ^ будут располагаться, немного за пределами «своих» квадратов с вершинами а(^-'-), а(^+'-) и а(Э'++.

Однако при этом, мм должны потребовать, чтобы, во-первых, условие Е было выполнено в той же окрестности квадрата а(э~~")а(э~'+")а(Э'+~")а(Э'+'+\ а, во-вторых, для таких = с1с2а(^'-'-'') + (1 — с1 )с2а(Э'+~'') + с1(1 — с2)а(^'-'+') + (1 — С\)(1 — с2)а(^'+'+'') были выполнены

а

все включения,

сЛс2^и(к'3'-'-') + (1 — сл)с2^и(к'3'+'-') + С1(1 — С2)т(к'"'-'+') + (1 — сл)(1 — С2)т(к']'+'+') € Вр(0, р(А))

к = 1,М.

Алгоритм 3.2.

1) По полученному в момент Ь0 приближенному значению а* определяем соответствующее € ^ по тому распределению, которое было определено на шаге 3) алгоритма 3.1.

2) Представляем вектор а* в виде линейной комбинации векторов а(э~~'\ а(э~'+'\ а(3'+-')^ а(3'+'+,) следующим образом:

а

с1с2а

(з'-'-') + (1 — с1)с2а(]'+'-') + С1(1 — С2)а(з'-'+') + (1 — С1 )(1 — С2)а(з'+'+>

где 0 С с1 С 10 С с2 С 1 (кроме случая, описанного в замечании 3.1).

3) В качестве искомого разрешающего программного управления используем, функцию

й(г) = С1С2и(]'-'-')(г) + (1 — С1)с2и(]'+'-')(г)+С1(1 — С2)и(]'-'+')(г) + (1 — С1)(1 — С2)и

,(3'+'-')

— г^ )и(3' '

),,(3'+'+')

(I). (3.2)

),

4. Оценка погрешности

Лемма 4.1. Пусть постоянные с1,с2 € Е, точки Р1 = (х1,у1) и Р2 = (х2,у2) из Е2, функция / : Е2 ^ Ега, / € С2(Е2), все ее вторые частные производные ограничены некоторой постоянной т2 > 0, т.е.

д2!(х,у)

дх2

С Ш2,

д2! (х,у)

ду2

С Ш2,

д21 (х,у)

дхду

С т2.

Тогда

II ¡(С1Х1 + (1 - Сг)х2, С2У1 + (1-С2)У2) - СХС2!(хг, Ух) - (1 - С\)(Х2, уг)

- Сг(1 - С2 )!(хЪ У2) - (1 - Сг)(1 - C2)f(х2, У 2)1

3 3 3

£ 2 \ с2(1 - с2) I т2 (У 2 - У1)2+2 \ сг(1 - сг) с2 I т2(х2 - Хг)2 + 2 Сг(1 - Сг)(1 - С2)\т2(х2 - хг)

Доказательство. Разложив функцию ¡(^, г/) то первой переменной в точках хг и х2 в ряды Тейлора е остаточным членом в интегральной форме и подставив в эти разложения £ = сгхг + (1 - сг)х2, получаем равенства

¡(сЛхг + (1 - Сг)х2, г}) = ¡(хг + (1 - Сг)(х2 - хг), г})

С1Х1+(1 -Сг)х2

= /(хЬ Г]) + (1 -С\)(х2 -х1) • ^ + / (С ^ + (1 -С ^2 - ^ 9 ^

XI

¡(Сгхг + (1 - Сг)х2, г}) = ¡(х2 + Сг(хг - х2), г})

С1Х1+(1 -сг)х2

= ¡(х2, Г])+С1(х1 -х2+ J (С+ (1 -СОх2 - ^ ^ ^2 ^

из которых в свою очередь следует, что

\ ¡(сЛхг + (1 - Сг)х2, г/) - Сг¡(хг, г]) - (1 - Сг)1(х2, г])\

= \сЛ(¡(хг + (1 - Сг)(х2 - хг), г]) - ¡(хг, г/)) + (1 - сЛ)^(х2 + Сг(хг - х2))/(х2, г/)) \

Х2 С1Ж1 + (г-С1)ж2

сг(1 - Сг)(х2 - хг) I ^Цд^^ + сг / (сгхг + (1 - Сг)х2 - I)9 ^ ^ ^

Х1 Х1

с1х1+(г-с1)х2

[ д2¡ и, Г])

+ (1 - сг) (сгхг + (1 - Сг)х2 - Ь)—— ^

£ Сг(1 - сг)т2(х2 - хг)2 + Сгт (1 - ^^ - ^Г + (1 - е^^2 - ^

2

21Сг(1 - Сг)1т2(х2 - хг)2.

= г = 2

3

1 ¡( сгхг + (1 - Сг)х2, уг) - Cг¡ (хг, у г) - (1 - Сг)/(х2, Уг£ 21 сг(1 - сг)1т2(х2 - хг)2, (4,1)

3

1 ¡(Сгхг + (1 - Сг)х2, У2) - Сг/(хг, У2) - (1 - Сг)/(х2, У2£ 21сг(1 - сг)1т2(х2 - хг)2. (4.2)

Аналогично, разложив функцию ¡(сгхг + (1 -сг)х2, г/) по второму аргументу и подставив г] = с2уг + (1 - с2)у2, получаем неравенство

1 ¡(сЛхг + (1 - Сг)х2, С2Уг + (1 - с2)У2)

- С2 ¡ (Сгхг + (1 - Сг)х2, уг) - (1 - с2)}( Сг хг + (1 - сЛ)х2, У2) ^ (43)

3

£ 21 с2(1 - С2)1т2(У2 - Уг)2.

Используя неравенства (4,1), (4,2) и (4,3), оценим разность ||/(слХ1 + (1 - Сх)х2, с2у\ + (1 - С2)у2)

- СХС2! (Х1 ,ух) - (1 - С1)С2! (Х2,У1) - С1(1 - С2) / (Х1,У2) - (1 - С1)(1 - С2) / (Х2 ,У2)| ^ У/ (С1Х1 + (1 - СЛ)Х2,С2У1 + (1 - С2) У 2) - С2] (сЛХ1 + (1 - Сл)х2,У1)

- (1 - С2)! (СЛХ1 + (1 - СЛ)Х2,У2 )у

+ уС2](С1Х1 + (1 - СЛ)Х2,У1) - С1С2/(Х1,У1) - (1 - €1)02](х2,У1)у

+ 11 (1 - с2)! (С1Х1 + (1 - СЛ)Х2,У2) - С1(1 - с2)! (Х1,у2) - (1 - сл)(1 - с2)! (х2,У2)у

< 3 | С2(1 - С2) | Ш2(У2 - У1)2

3 3

+ 2 1 С1(1 - С1)С2 1 т2(%2 - )2 + 2 1 С1(1 - С1)(1 - С2) 1 т2(^2 - Х1 )2.

Следствие 4.1. Если в условии, леммы, ^.1 дополнительно ограничить 0 ^ с1 ^ 1, 0 ^ с2 ^ 1, то

Ц/(С1Х1 + (1 - СЛ)Х2, С2У1 + (1 - С2)У2)

С1С2] (Х1 ,У1) - (1 - 01)02] (Х2,У1) - С1(1 - С2)] (Х1,У2) - (1 - С1)(1 - С2(Х2 ,У2)Ц

^ 8т2^Р2 - Р1Ц2-

Теорема 4.1. Пусть система (2.1) удовлетворяет условиям А, В, С, Б, Е, о ее управление производится, в информационных условиях, перечисленных в разделе 2. И пусть при решении задачи 1 на, шаге 5) алгоритма 3.1 было установлено существование допустимого разрешающего управления, а за/тем, с помощью алгоритма, 3.2 было построено программное управление й(£), порождающее движение х(£). Тогда,

»(3)( 8 М2^1) + "(4)(**)

р(х(#),М) ^ Ах + 5хеь(^0) +-^-/-(е^-^ - 1у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. В соответствии с шагом 3) алгоритма 3,1 найдется такой номер 2 е {1, ...,Ма}, что

а* = с^а^'-'-^ + (1 - с^а^'-^ + С1(1 - с2)а(^'-'+') + (1 - С1 )(1 - с2)а(^'+'+'),

где 0 ^ с1 ^ 10 ^ с2 ^ 1.

Через х(1) обозначено движение системы (2,1), соответствующее управлению

й(г) = С1 с2и(з'-'-')(г) + (1 - С1 )с2и(з'+'-')(г) + С1(1 - с2)и(з'-'+')(г) + (1 - сл)(1 - С2)и(з'+'+')(г),

настоящему значению параметра а и начальному состоянию х^о). Отметим, что в наших обозначениях х(10) = х(10) — точное начальное состояние системы. По построению

р(х(д),М) ^ Ах. (4.4)

В наших обозначениях оценка (2,3) есть

Цх(1о) - х(1о)11 = Цх(1о) - х*(1о)11 ^ 5Х. (4.5)

В силу условия Е существует некоторый идеальный вектор-компенсатор е Вр(0, р(А)) такой, что состояние системы х(Ь0) под действием постоянного управления + на промежутке и при параметре а* переводится в точку х(11) по некоторой траектории х(Ь). (Для дальнейшего, обозначим через х(Ь) всю траекторию

системы (2,1), проходящую через точки х^о), х(Ь ..., х(Ьм) под действием соответствующего кусочно-постоянного управления й^) = й^'^ + Ь е [Ьк-1, tk), к = 1, Ж.)

Однако, согласно алгоритму 3,2, вместо идеального вектора-компенсатора т^1'^ используется вектор-компенсатор

ги(1'з) = С1С2т^'-'-') + (1 - С1)с2т(1'3'+'-') + сх(1 - с2)т(1'д'-'+') + (1 - С1)(1 - с2)т(1'3'+'+').

Благодаря тому что он является выпуклой комбинацией т(1'^'-'-\ т(1'3'+-) и

от также попадает в Вр(0,р(А)). В силу следствия 4,1 выполняется оценка

ч

- т^и £

Поскольку, согласно формулам (3,1) и (3,2)

й(г) = й(1']) +и>(1'л, ье ,к),

то

ч

1Ш -й(т = -т^и £ 8М2А1, г е [ъ,ь).

Аналогично, для каждого к = 1, N в силу условия Е существует некоторый идеальный вектор-компенсатор т^'^ е Вр(0, р(А)) такой, что состояние системы х(Ьк-1) под действием постоянного управления й(Ь) = й(к'^ + т^'^ на промежутке [Ьк-1, Ьк) и при а = а* переводится в точку х(Ьк) то траектории х({). Однако, по алгоритму 3,2 па промежутке \Ък-1, tk) мы используем управление

й(г) = у(к'з) + и)(к'д) = у(к'з) + С1С2т(1'д'-'-') + (1 - с1)с2т(1'д'+'-')

+ С1(1 - с2)т(1']'-'+') + (1 - сл)(1 - с2)и)(1'^+'+'\

для которого, в силу следствия 4,1 выполняется оценка

- _

1Ш -й(т = -т^ц £ -МА2, г е \tk-1,и), к = 1,ж. (4.6)

о

Иными словами, оценка (4,6) выполняется па всем отрезке [10,Щ.

Кроме того, напомним, что значение а* параметра а известно с погрешностью 8а (см. (2.2)).

Таким образом, учитывая (4.5), (4.6) и (2.2), получаем для Ь е следующую интегральную оценку рассогласования движений:

ит - хт £

х(t0)+ /(т,х(т),й(т),а)(1т - х( 10) - /(т,х(т),щ(т),а*)(т

to Ьо

I

£ 11х(и) - х(и)Ц + (||/(т,х(т),й(т),а) - /(т,х(т),й(т),а) + ¡(т,х(т),й(т),а)

Ьо

- ¡(т, х(т),и(т), а) + ¡(т, х(т),и(т), а) - ¡(т, х(т),и(т), а*)Ц)(т

г

£ 8Х + у Щх(т) - х(т)Ц(1т + ! и{3) (и(т) - й(т))(т - а*)(т

Ьо Ьо Ьо

I

£ 8Х + ЬI Цх(т) - х(тШт +(1 - и) •Ш(3)(8м2А1) +(г - и) •Ш(4)(8а).

Ьо

г

г

г

г

Отсюда в силу усиленной леммы Гронуолла [16, гл. 1, §2, с, 26] следует, что

ш(3)(3 М2аА + Ш(4)(6а) - х($)|| ^ 5хеь(°-0) +-^-/-- ^. (4,7)

Из (4,4) и (4,7) вытекает утверждение теоремы,

" □

Замечание 4.1. Для модифицированного алгоритма 3.1 в соответствии с замечанием 3.1 можно получить, используя лемму 4-1, более слабую оценку

р(х(#),М) ^ Ах + 8хеь^-1о)

+ -1-(3 (I ^2 (1 - С2) | + | С1(1 - С1)С2 | + | С1(1 - С1)(1 - С2) | )М2А1) + Ш(4)(8а)) .

5. Пример

В качестве примера рассмотрим нелинейное обобщение навигационной задачи Цермело, Пусть па промежутке времени [10,$] = [0, 2] задана управляемая система

'х(г) = в(х(г)) + и(г), г е (0,2),

х(0) = х(0) = (0, 0),

где £ — время, х(1) = (х1 (1),х2(1)) — фазовая переменная, вектор-функция в(х) = (в1(х), в2(х)) = (вт(ж2), соб^)), х(0 — начальное состояние системы, и(Ь) — измеримая по Лебегу вектор-функция со значениями из круга Р = {и = (и1,и2) : и\ + и2 ^ 1} и представляющая собой вектор управляющих воздействий.

Задача состоит в быстром предъявлении программного управления и(1), £ е ко-

торое бы переводило движение х(Ь) управляемой системы (5.1) из начальной точки х(0 в малую окрестность точки х(?\ координаты которой нам сообщат в начальной момент

Ь0 = 0. Однако, нам заранее известно, что х^) будет принадлежать кругу В(1, 2), ^^

В этом разделе мы продемонстрируем работу алгоритмов 3,1 и 3,2 по решению нашей задачи и смоделируем точность попадания движения системы (5,1) на целевое множество в конечный момент времени § = 2. Для упрощения будем считать все измерения точными, то есть 5а = 0 и 5х = 0,

Итак, для перевода неопределенности в целевом множестве в неопределенный параметр,

введем в рассмотрение постоянный параметр а = (а1,а2) = (^(х!) - 1), 1(х2) - 2)^ и

сделаем замену фазовой переменной £ = х - Ьа. После такой замены переменных система (5,1) примет вид

'&) = -а + ta) + и(1), г е (0, 2),

= х(0) = (0, 0).

Здесь целевым множеством будет точка £(^) = (1, 2), а неопределенный векторный параметр а принимает любое значение из ^ = В(0, 0), ц

Для такой преобразованной задачи выполним алгоритм 3,1,

1) Выберем N = 2, тогда Г = {10 = 0,Ь1 = 1,Ь0 = 2}.

у/2 3

2) Обозначим через Аа = ——. Определим «с за пасом» р(А) = -, тогда

8 4

1

Р(р(А)) = В2[(0,0),4

~ / л/2 л/2 \

3) Выберем ^ = {а(1) = (0, 0)}, Соответственно, = I ± —, ±— )

88

РИС. 1. Аппроксимации множеств достижимости Х1(а(1^) и Х2(а(1^).

4) Выберем Ах = — и построим аппроксимации множеств достижимости Х^а^) и

50

Х2(а(1^) (рис. 1).

5) Поскольку р(£,(/\ Х^а^)) < Ах, то продолжаем работу алгоритма 3.1.

6) Выбираем £('2,1 = (1.0015, 2), ближайший к £(/) из Х2(а(1)). Отмечаем, что £(0) = (0, 0),

Ф1 = (0,0^ = (0,й(21) = (0.16,0).

7) Для каждого к = 1, 2 и ] = 1 решаем в соответствии с замечанием 2.4 по 4 задачи

!

^^(г) = f(г),й(к'з) + ш(к'3'±'±),а(з'±'±)), г е (г— ,гк),

^^(г-) = 1(к-1,л, х(к^±)(1к) = 1(к,]).

Их решениями являются

т

(1,1,-,+) =

т

(1,1

т

т

(2,1 (2,1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т

-,-) =

-,+) = -,-) =

(-0.70185, 0.19243), (-0, 56727, -0,16393), т

(-0.09795, 0.23763), (-0.09828, -0.12595),

т

т

(1,1,+,+) (1,1,+,-) =

(2,1,+,+) (2,1,+,-)

(-0.3472, 0.17898), (-0.21275, -0.17465),

(0.26776, 0.5129), (0.24169, 0.13066).

8) По формуле (3.1) находим четыре «узловых» управления

и

(1,-,-)(г) =

и

(1,-,+)

и

(1,+,-)(г) =

и

(1,+,+)

(-0.56727, -0.16393), Ь е [0,1), (0.06172, -0.12595), Ь е [1, 2], (-0.70185, 0.19243), Ь е [0,1), (0.06205, 0.23763), Ь е [1, 2], (-0.21275, -0.17465), Ь е [0,1), (0.40169, 0.13066), Ь е [1, 2], (-0.3472, 0.17898), Ь е [0,1), (0.42776, 0.5129), Ь е [1, 2].

Тем самым действие алгоритма 3.1 завершено.

Далее, предположим, что в начальный момент времени = 0 нам были сообщены

координаты цели х(/) = ^1, Этим координатам соответствует параметр

а* = («1, «2) = (^) - 1), 1(4') - 2)В = (0,1 В.

Дня решения задачи о сближении выполним алгоритм 3.2. 1) По полученному а* выбираем единственный а(1 = (0, 0).

2) В соответствии с замечанием 3,1 представляем в виде невыпуклой линейной комбинации

а* = ^ (+ ) + (V'"- + -V^Y 2 \2 2 ) 2 \2 2 )

3) В качестве искомого разрешающего управления используем функцию

u(t) = ^(t) + ^(t) + ^^ ^(t) + ^^ Vb"> (t)

■(-0.55238, 0.25923), ге [0,1 ), (0.24764, 0.45250), Ье [ 1, 2].

( /)

Найденное программное управление переведет систему (2,1) в точку х* ) = (1.122, 2.492).

А=1

Аа = л/2/8, особенно с учетом того, что мы использовали невыпуклую линейную комбинацию для интерполяции. Ее величина свидетельствует о возможном выполнении условия

а

6. Заключение

Для простоты изложения в настоящей статье был рассмотрен случай двумерного параметра, однако принципиальных отличий от такой же задачи с постоянным векторным параметром произвольной размерности нет, за исключением определенных технических трудностей при формулировке и доказательстве аналога леммы 4,1, хотя оценка из следствия 4,1 справедлива для любой размерности. По сравнению с [11] было произведено значительное упрощение алгоритма: в новом алгоритме не вводится «обратное» время и не строятся дополнительные «узловые» разрешающие управления для точек внутри ячеек разбиения множества возможных значений параметра.

Заметим, что неудобно большая норма векторов-компенсаторов т(1'1'-'+") и т(1'1'+'+) в разобранном примере связана с большим расстоянием точки £(1'1) от настоящего движения £(1) системы (5,2), па преодоление которого ушло слишком много ресурсов управления, Решение этой проблемы может заключаться в замене метода Эйлера на метод Рунге-Кутта [17] при построении точек х^'^, а также в уменынении А, Однако, более существенной проблемой является непроверяемость условия Е в существующей формулировке, В связи с этим, дальнейшие исследования можно направить на нахождение достаточных условий, заменяющих условие Е, и примеров управляемых систем, для которых условие Е гарантированно выполняется. Также необходимо исследовать численные способы нахождения вычисления функции т = т(а) из замечания 2,4,

СПИСОК ЛИТЕРАТУРЫ

1. Э.Б. Ли, Л. Маркус. Основы теории оптимального управления. М.: Наука. 1972.

2. Н.Н. Красовский. Игровые задачи о встрече движений. М.: Наука. 1970.

3. Н.Н. Красовский, А.И. Субботин. Позиционные дифференциальные игры. М.: Наука. 1974.

4. V.M. Veliov. Parametric and functional uncertainties in dynamic system,s local and global relationship // Computer Arithmetic and Enclosure Methods, North-Holland, Amsterdam (1992).

5. А.Б. Куржанский. Управление и наблюдение в условиях неопределенности. М.: Наука. 1977.

6. А.А. Ершов, В.Н. Ушаков. О сближении управляемой системы, содержащей неопределенный параметр // Матем. сб. 208:9, 56-99 (2017).

7. V.N. Ushakov, A.A. Ershov, A.V. Ushakov. An Approach Problem, with an Unknown Parameter and Inaccurately Measured Motion of the System // IFAC-PapersOnLine 51:32, 234-238 (2018).

8. M.C. Никольский. Об одной задаче управления с неполностью известным начальным условием, II Прикл. матем. и информ. 51, 16-23 (2016).

9. С.С. Лемак. К вопросу о формировании позиционных ст,ра,т,егий дифференциальной игры в методе экстремального прицеливания H.H. Красовского // Вести. Моск. ун-та. Сер. 1. Матем., мех. 6, 61-65 (2015).

10. В.Н. Ушаков, А.Р. Матвийчук, Г.В. Паршиков. Метод построения разрешающего управления, задачи о сближении, основанный на притягивании к множеству разрешимости // Тр. ИММ УрО РАН. 19:2, 275^284 (2013).

11. A.A. Ершов. Интерполяция программного управления по параметру в задаче о сближении ff Пробл. матем. анал. 113, 17-27 (2022).

12. А. Брессан, Б. Пикколи. Введение в математическую теорию управления. М.-Ижевск: Институт компьютерных исследований. 2015.

13. С.Г. Михлин. Курс математической физики. М.: Наука. 1968.

14. Н.С. Бахвалов, Н.П. Жидков, Г.М. Кобельков. Численные методы. М.: Лаборатория Базовых Знаний. 2001.

15. В.Н. Ушаков, A.A. Ершов. К решению задач, управления с фиксированным моментом окончания II Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки. 26:4, 543-564 (2016).

16. П.И. Лизоркин. Курс дифференциальных и интегральных уравнений с дополнительными главам,и анализа,. М.: Наука. 1981.

17. А.О. Новикова. Построение множеств достижимости двумерных нелинейных управляемых систем пиксельным методом // Труды ИМИ. 50, 62-82 (2015).

Александр Анатольевич Ершов,

Институт математики и механики им. H.H. Красовского УрО РАН,

ул. Софьи Ковалевской, 16,

620108, г. Екатеринбург, Россия

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина,

ул. Мира, 19,

620002, г. Екатеринбург, Россия

E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.