Научная статья на тему 'Интегральные операторы восстановления фазового вектора динамических систем'

Интегральные операторы восстановления фазового вектора динамических систем Текст научной статьи по специальности «Математика»

CC BY
95
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы анализа
WOS
Scopus
ВАК
MathSciNet
Область наук

Аннотация научной статьи по математике, автор научной работы — Заика Ю. В.

В терминах функциональной зависимости получено описание наблюдаемых функций в нелинейных динамических системах, аналитических по фазовым переменным. При анализе базисности конечного числа интегральных операторов наблюдения развивается аналог принципа двойственности, известного в линейной теории наблюдения и управления. Рассмотрены также вопросы устойчивости базисов, учета структуры возмущений, методы приближений.In function dependence terms a description of observable functions in nonlinear analytical dynamical systems is obtained. An analogue of the duality principle in linear systems is developed for the nonlinear case.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интегральные операторы восстановления фазового вектора динамических систем»

Труды Петрозаводского государственного университета

Серия “Математика” Выпуск б, 1999

УДК 517.9, 62.50

ИНТЕГРАЛЬНЫЕ ОПЕРАТОРЫ ВОССТАНОВЛЕНИЯ ФАЗОВОГО ВЕКТОРА ДИНАМИЧЕСКИХ СИСТЕМ

Ю. В. Заика

В терминах функциональной зависимости получено описание наблюдаемых функций в нелинейных динамических системах, аналитических по фазовым переменным. При анализе ба-зисности конечного числа интегральных операторов наблюдения развивается аналог принципа двойственности, известного в линейной теории наблюдения и управления. Рассмотрены также вопросы устойчивости базисов, учета структуры возмущений, методы приближений.

Проблема наблюдения и прогнозирования фазового состояния динамических систем по неполной обратной связи относится к классу обратных задач. По ограниченной косвенной информации требуется восстанавливать неизвестное априори движение. Формально сюда включаются и задачи параметрической идентификации моделей. Механическую терминологию используем по традиции (подобные задачи возникают, например, и в нестационарной химической кинетике). Условно можно выделить два основных направления исследований: поиск критериев наблюдаемости и построение восстанавливающих (разрешающих) операторов. В теоретическом отношении наиболее удобным является дифференцирование выхода и применение критериев инъективности отображений из Мп вГ. Но в условиях реальной зашумленности измерений такой путь чреват потерей работоспособности алгоритма восстановления движения. Более корректным является применение интегральных восстанавливающих операторов. Основы соответствующего математического аппарата изложены в [1].

© Ю. В. Заика, 1999

Этот подход обобщен на нелинейный случай в [2, 3]. Данное сообщение содержит развитие результатов [2-4] для нелинейных систем, аналитических по фазовым переменным. Основное внимание уделяется качественному описанию метода, технические детали и громоздкие доказательства опущены.

Для упрощения изложения считаем динамическую систему стационарной вещественной аналитической, а измерения скалярными:

= /(*), у = д(х), /€С“(С/,Г), (1)

Начальные данные неизвестны. Заданы отрезок наблюдения [0,Т] и множество возможных конечных состояний С/т — {х(Т)} С и. В дальнейшем С/, С/т, С/,...— области в фазовом пространстве Мп. Задача наблюдения состоит в построении оператора, позволяющего по любым возможным (х(Т) £ С/т) реализациям обратной связи

у(-,х,Т) = д(х(-,х,Т)) : [О, Г] ->■ Ж1

однозначно определять неизвестный фазовый вектор х — х(Т) Е С/т-По х(Т) уже можно полностью восстанавливать траекторию движения. Запись у(-;х,Т) означает, что регистрируемая на [0,Т] функция времени у(-) однозначно определяется искомым неизвестным состоянием х в момент Т. Решения ж(-;ж,Т) дифференциального уравнения в (1) с данными Коши х(Т;х,Т) = х предполагаются продолжимыми на [0,Т] по смыслу задачи. Таким образом, необходима операция для систематического решения континуальной краевой задачи при вариациях начальных данных. Вопросов существования решения здесь нет, проблема в единственности и алгоритме восстановления. Более общая постановка: определять по у(-) значения <р(х(Т)) заданной функции (р : С/т —> Н1. В частности, можно рассматривать ц){(х) — Х{.

В дальнейшем удобно проводить аналогию с линейным случаем, когда (/, д) — (-Р, С?) (<ix/dt — Гх, у — С — матрицы

размерностей п х п и 1 х п) [1]. Если в сопряженной системе

ау!<и = + в'Щ), у(о) = о, (2)

построить управление &(•) из условия V{Т) — /г, то по у(-) вычисляется проекция неизвестного х(Т) на вектор Н:

Н,х(Т) = (к,у) = (к,у)Ь2 \ОДеМп.

Штрихом обозначаем транспонирование. Совокупность всех Н Е Мп, для которых по любой возможной реализации у(-) однозначно восстанавливается значение Н'х(Т), описывается множеством достижимости Пт — {У(Т)}. Для определенности считаем управления к(-) непрерывными на [О, Т] (нетрудно обобщить до к Е £2)-

Следуя работам [2 - 4] примем в качестве аналога сопряженной системы (2) линейное уравнение в частных производных

Когда задача линейна, т. е. (/, д) = (.Р, (?), имеем г>(£,ж) = У'(£)ж, где вектор-функция V(£) удовлетворяет (2). Поскольку Т, 11т фиксированы, то (3) достаточно рассматривать на пучке

из возможных (х(Т) Е 11т) интегральных кривых на [0,Т]. Единственным гладким решением (3) является функция

Гладкость в \¥ понимается в смысле у Е С1(\¥) (\¥ С — область): формулой (4) и(£, ж) задается и в открытой окрестности IV, точка (£,ж) играет роль начальных данных (£о,жо) (ж(^о5^о,^о) = ^о).

Смысл введения функции (4) и уравнения (3), которому она удовлетворяет, состоит в следующем. При £ = Т в (4) получим у{Т,х) = (к,у), х Е С/т- Это же соотношение получаем подстановкой в (3) вместо х решения ж(£;ж,Т) и интегрированием на [0,Т] тождества по £ (слева £(£, ж(£))). Значит, если мы хотим определять ”нелиней-ную проекцию” (р(х(Т)) по известной у(-) в форме интегрального оператора (к,у), то в (3) к нулевым начальным данным у(0,х) = О, х Е £/о, следует добавить условие у(Т,х) = </?(ж), х Е 11т> Задача построения интегрального оператора восстановления (р(х(Т)) = (к, у) эквивалентна граничной задаче, которую можно интерпретировать и как задачу управления: перевести фазовую точку г>(£, •):£/*—>■ М1 из нуля в (р(-) за время Т выбором к(-). Важно, что (3) линейно по паре (к, у). Исходная операторная постановка задачи наблюдения трансформируется в исследование уравнения. Эти рассуждения останутся в силе, если допускать нелинейные к^,у) (к,ку Е С((5),

у^,х) +ух(г,х) • /(ж) = к(г)д(х), у{0, ж) = 0. (3)

уг = {(г,х)\ * е [о,т], хещ = х(г-,ит,т)}

(4)

Э у^)) | х(Т) Е Лт }), считать /, д гладкими, а {к, у) — интегралом &(£,?/(£)) от 0 до Т. В правой части (3) будет к^,д(х)).

Определение 1. 1. Функцию <р : 11т —> М1 назовем наблюдаемой в подмножестве М С 11т, если существует функционал А из условия <р(х) = А(у(-;х,Т)), х £ М.

Наблюдаемость (полная) пары (/, д) эквивалентна наблюдаемости в 11т всех координатных функций (р^х) — ж*, г = 1 , п. Введем обозначения: Ф (М) — множество всех наблюдаемых в М функций (р : 11т ~> М1, Вт — {ъ(Т, •) : 11т —> М1 | к Е С[0,Т] } — множество достижимости из нуля за время Т сопряженной системы управления (3) (г?(Т, х) — ( к, у{'] ж, Т))), г > 1} — произвольная фиксированная полная в Ь2{0,Т) система допустимых &(•), г?*(Т, •) — соответствующий к — к{ элемент Вт-, И — символ функциональной оболочки:

Ф е 'Нм{Ф ь • • •, Фд} О ф(х) = Щ(ф1(х),.. .,фч{х)), х Е М.

По построению Вт С Ф(Пт) С Ф(М) УМ С ит.

Теорема 1. Для любого М с компактным замыканием в 11т можно указать такие к^,..., к{р, что Ф(М) = Чм{ ^ (Т, •),..., (Т, •) }.

Если М С М, то Ф(М) = ИКогда дополнительно известно, что область 11т ограничена и решения ж(-;ж,Т) (х — х(Т) Е £7 I) с1С/т) продолжимы на [0,Т], то можно считать М = 11т. Из теоремы следует взаимно однозначное соответствие

{г^(Т,ж), г/ = Т7р} = {(&»„, у(-; ж, Т)), г/ = Т7р} -В- у(-;х,Т), х £ М.

Поэтому вместо у(-) без потери информации об искомом х{Т) можно оперировать конечным набором моментов (к,у), вычисляя их в масштабе реального времени.

Без априорного ограничения к Е {к{^ > 1} результат усиливается.

Теорема 2. Существует такое семейство наборов из 2п +1 функций {г1 Е С[0,Т], г = 0,2 п}, для которых Ф (11т) - 'Нит{ы о, • • • }, где

Е Вт, ш5{х) = (гу,у(-,х,Т)), х Е иТ-

При этом Ф(М) = Нм{• • •} УМ С 11т и каждая rj представима равномерно сходящимся рядом на [0, Т] по элементам {к{, г > 1}.

Итак, общая форма интегрального оператора восстановления:

<р(х(Т)) = Н((го,у),...,(г2п,у))-

Доказательства основаны на результатах теории комплексных аналитических множеств [5, 6]. В частности, для справедливости теоремы 2 доказывается, что множество общих нулей функций

Д^(ж1,ж2) = г>,(Т,ж1) - Уг{Т,х2) = (£;;,?/(•;ж1,Г) -у(-;х2,Т)), г > 1,

в 11т х 11т совпадает с множеством общих нулей

АWj(x1,x2) = Wj(x1) — Wj(x2), (ж1, ж2) Е 11т х С/т, 3 = 0, 2п.

Отсюда {wj(x),j = 0,2п} 2/(-;ж,Т), ж Е С/т, вследствие полноты {&*, г > 1} в Ь2(0,Т).

Для интерпретации утверждений удобно перейти в (3) к операторной форме:

бу/яь = -АУ{г) + вк(г), У(о) = о, (5)

У{1) = «(*, АУ{1) = •)/(•), У{1) = щу, ■), В = д(.).

Если нет проблем с продолжимостью: решения ж(-;ж,£) с начальными данными (£, ж) = (£о,^о) £ [0,X1] х С/ определены на [0,£], то (5) — линейная система управления в С1 (II) (Сш(и)). Здесь предполагается, что допустимые фазовые кривые (ж(Т) Е С/т, £ Е [0,Т]) не покидают С/ С С/. Иначе придется учитывать зависимость области определения Щ фазовой точки V{Ь) = и(£, •) (как функции ж) от времени. В вычислительном отношении (3), (5) удобнее рассматривать на прямом произведении [0,Т] х С/.

Получаем полную аналогию с линейным случаем, если только заменить линейную зависимость функциональной: множество наблюдаемых в М С С/т ” нелинейных проекций” <р(х(Т)) описывается как функциональная оболочка конечного числа базисных в М элементов множества достижимости Вт — {У(Т)}.

Определение 2. 2. Базисом Вт в М С ит назовем такую конечную совокупность элементов Vj(T,^) Е Вт, 3 = 1,#, что все у(Т,-) Е Вт выражаются как функции базисных при ж ЕМ;

у(Т, ж) = Я„(г;1(Т,ж),.. .,уд(Т,х)), ж ЕМ.

Совершенно аналогично определяется базис (конечный) множества Ф (М). Базис Вт в М будет и базисом Ф(М). В теоремах 1, 2 элементы Viv (Т, •), Wj(-) образуют базис Вт в М, Ut соответственно (ивМ VM С М. VM С С/т)- Когда (/,д) — (F,G) наблюдаемость эквивалентна наличию в (2) Vi(T) из условия С{ Vi(T), г — 1, п } = Z)t = Здесь и далее С - символ линейной оболочки. Это эквивалентно {V({T)x, i = 1,п} ++ х Е Ut (Мп). Поэтому в нелинейном случае, когда ”коэффициенты V(T) не отделяются от ж”, под управляемостью в М С Ut сопряженной системы (3) естественно понимать свойство {vj(T,x), j — 1, <7 } х G М. Такое определение не зависит от выбора базиса Вт в М. Смысл: не линейная, а функциональная оболочка ^м{ Vj(T, •), j — 1 ,q} базиса образует множество всех функций аргумента х Е М. Как линейное пространство Вт конечномерно лишь в вырожденном случае конечномерности С{у(')\х(Т) Е С/т}, причем тогда dim Вт — dim£. Формально получаем обобщение принципа двойственности: (/, д) наблюдаема в М (3) управляема в М. При этом х(Т) Е М однозначно определяется по базисным моментам ц — (к,у) из системы уравнений вида v(T,x) — ц. Ограничения на управления типа \k(t)\ < к несущественны — по мере измерений y(t) можно вычислять (1к,у) и затем результат поделить на £.

Перейдем теперь к изучению структуры элементов множества Вт-Для (/,#) = (F,G) имеем Вт — С(1С), где С(К) — линейная оболочка столбцов матрицы управляемости /С = (G", F'G',..., F,n~1G'). В нелинейном случае аналогом столбцов матрицы управляемости сопряженной системы служат функции

Щд = д, Ь)+1д = (.L)g)xf : (/,<?) = (F,G) =* L)g(x) = GF*x.

В операторных терминах (3) L^g — АгВ : U —> М1. Если /, д в приложениях задаются элементарными функциями, то и L%^g таковые. Но сводить задачу наблюдения к решению в области Ut системы уравнений Ьг^д(х) — у(г\Т), i — 1,п, не будем по причине вычислительной некорректности такого подхода. Вместе с тем использование L^g для представления элементов Вт целесообразно.

Теорема 3. Пусть Т, Ut достаточно малы. Тогда возможны конечные представления

ъ(Т,х) = ^2,=осп(х) Цд(х), <л(х) = (к,л(-,х)),

I € [0,Т], X € ит, 7* е х ит), (*Х) Э [0,Т].

Малость 11т означает: выбираем произвольную (опорную) х Е II и считаем 11т достаточно малой окрестностью х. Лишь бы по смыслу задачи соответствующие решения х(-) были продолжимы на [0,Т]. Малость Т при установлении наблюдаемости несущественна в силу теоремы единственности для аналитических функций: у ^ ^

2/|[0Т]. При наличии у i = 0,8, двух различных общих нулей в

11т пара (/, д) заведомо неполностью наблюдаема в 11т. В отличие от линейного случая коэффициенты разложения элементов Вт по АгВ — Ьг^д являются функциями. В общем случае с постоянными коэффициентами возможно только бесконечное разложение

г?(Т, х) — соВ + с\АВ + С2А2В + ..., с* = (&, (т — Т)г)/И .

При этом (имеем дело со степенной проблемой моментов) сами ” столбцы матрицы управляемости” АгВ не принадлежат Вт, Вт зависит от Т > 0. Очевидное следствие: дифференцирование у(-) нельзя заменить интегральным оператором.

Теорема 4. Если область неопределенности 11т = {х(Т)} достаточно мала, можно выделить такие ,..., к{д, что:

1) элементы Уги (Т, х) = (к^,у) образуют базис Вт (Ф(С/т));

2) базис Вт образуют и (Т, х) = (к{и + , у) при доста-

точно малых возмущениях ||£^ \\ь1 < 3 (и = 1, д, х Е С/т).

Когда (/, д) наблюдаема в С/т, обеспечивается определенная устойчивость восстановления х(Т) к малым вариациям базисных к(-).

Предположим теперь, что движение подвержено неконтролируемым возмущениям £(£):

йх/М = /(ж) +ф)к(х), |£(*)|<£.

Пусть в (3) дополнительно у(Т,х) = (р(х), х Е С/т, ”направление возмущения” к : и —У Мп известно и выполнено

ух{Ь^х)Н{х) =0, t е [0,Т], ж Е С/

(относительно U см. после (5)). Тогда для любого возмущенного решения с х(Т) Е Ut и фазовой кривой в U на [0,Т] будет по-прежнему (р(х(Т)) = (к,у). В операторных терминах получаем линейное фазовое ограничение вида P(t)V(t) — 0 (vx(t,-) h(-) — 0). Для такой идеальной (к ф к(£(•))) в направлении h наблюдаемости нужно управлять не только конечным состоянием v(T, •), но и градиентом vx(t, •). Обратно, если к, (р фиксированы, то условие vxh 0 дает описание направлений /г, возмущения вдоль которых слабо влияют на точность интегрального оператора восстановления (р(х(Т)) « (к,у).

Теоремы 1, 2 верны и для нестационарных /(£,ж), g(t,x). Достаточно аналитичности (к, у) по данным Коши х — х(Т) Е Ut. Существенных изменений в теоремах 1-4 не потребуется при y(t) Е Мт, m > 1, к Е ^2- Но главное: если фиксирована, то класс линейных операторов (к, у) может оказаться слишком узким и следует использовать нелинейные весовые функции k(t, у). При решении задачи прогнозирования, когда измерения у(-) известны только на отрезке времени [0,Т*], Т* < Т, следует допустимые &(•, •) подвергать усечению k(t, •) =0, t > Т*. Возможен и обратный путь: выбираем &(•, •) и в силу (3) (справа k(t, g(t,x))) находим v(T, •) — ту компоненту (р(х(Т)), которая восстанавливается интегрированием k(t,y(t)) на отрезке времени [0,Т].

В заключение кратко о схемах приближений. Для (3) можно применять технику степенных рядов. В нестационарном случае считаем / = д - g(t,x), к - k(t,g(t,x)). Пусть 0 е UT, f(t, 0) = 0,

g(t, 0) = 0, k(t, 0) = 0. Приравнивая слева и справа коэффициенты однородных полиномов одинаковой степени по ж, последовательно получаем линейные конечномерные задачи управления. Управления — коэффициенты разложения k(t,y) по степеням у. В линейном приближении имеем (2). Для лексикографически упорядоченных коэффициентов разложения v(t, х) в степенной ряд по х получается аналогичная линейному случаю система вида (2). Только вектор V(t) и матрицы системы F', Gf будут бесконечномерными, F'(t) — нижняя блочнотреугольная. Можно ограничиться конечной подсистемой.

Вместо степенных можно использовать и другие базисные функции, ориентируясь на специфику нелинейности /, д. Аналитичность здесь необязательна. Выберем базисные ^i(x),..., фм{х), х Е U. Подбираем такие функции hj, j — 1, г, чтобы hj(t, g(t,x)) достаточно точно приближались линейными разложениями по базису х) с

коэффициентами buj(t). Аналогично приближаем <р(х) « (ж) + ... + с1кфм(х),

фих(х)/(г,х) « а1и(г)ф1(х) + ... + ами(г)фм(х).

Ищем к, V в форме линейных комбинаций /^-(£, ?/) и фи(х) соответственно с коэффициентами kj(t), После подстановки в сопря-

женную систему и приравнивания коэффициентов при фи (ж) получаем задачу У(Т) « с? = (с?1,..., б?лгУ для 7У-мерной линейной системы вида

(5) (У = {^}, к = {к^}, А = {а,ц}, В = {Ь^}). В итоге

гт

<р(х(Т)) « / к^Щ^у^М.

./о ^=1

На проблему можно посмотреть и с позиций общей теории приближенного решения линейных граничных задач. Возьмем любую гладкую функцию г?о(£,ж), удовлетворяющую граничным условиям (0, ж) = 0, Уо(Т, ж) = </?(ж), ж Е и (уо = ^(х)/Т). Определим

у = 170(£, х) + а^!^, ж) + ... + алг^лг(£, ж), и*(0, ж) = г^(Т, ж) = О

(в частности, г?* = £(£ — Т)0{(£)'ф{(х)). Аналогичным образом:

Щ,у) = (£, 2/) + ... +/?м&м(*,2/)-

Подставляя функции и(£, ж), к^,у) в сопряженное уравнение, получаем невязку Д(£, ж; «1,... ,/?м)- Ее нужно минимизировать по параметрам а*, /^-. Линейность по (й,г?) позволяет применять классические проекционные методы.

Обычно измеряется часть фазовых координат: ?/*(£) = ж*(£), г = =

1,ш. Формально этого можно добиться заменой или добавлением переменных. В слабых предположениях гладкости в сопряженной системе справа &(£, Ж1,..., жш) и можно перейти к задаче = 0, г?(О, •) = О, г?(Т, •) = (/? (в частности, (р = Xj, j Е {ш + 1,..., п}). Здесь Х> — линейный дифференциальный оператор второго порядка (г^ + УХ/)Х{, г = тп + 1,..., п. В качестве весовой функции &(£, 2/1,..., ут) в интегральном операторе наблюдения будет (выражение в скобках).

Подчеркнем, что исходная задача — нелинейная обратная, а в итоге пришли к прямым методам решения линейного уравнения, хотя

и распределенного (следствие построения операций наблюдения для области фазового пространства).

Resume

In function dependence terms a description of observable functions in nonlinear analytical dynamical systems is obtained. An analogue of the duality principle in linear systems is developed for the nonlinear case.

Литература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[1] Красовский H. H. Теория управления движением. М.: Наука, 1968.

[2] Кирин Н. Е. К теории методов оценивания в динамических системах// Вопросы механики и процессов управления. JL: Изд-во ЛГУ, 1986. Вып. 8. С. 118-125.

[3] Кирин Н. Е., Исраилов И. Оценочные системы в задачах теории управления. Ташкент: Фан, 1990.

[4] Заика Ю. В. Задача наблюдаемости нелинейных систем// Кирин Н. Е. Методы оценивания и управления в динамических системах. СПб.: Изд-во СПбГУ, 1993. С. 85-143.

[5] Эрве М. Функции многих комплексных переменных. М.: Мир, 1965.

[6] Чирка Е. М. Комплексные аналитические множества. М.: Наука, 1985.

Петрозавозаводский государственный университет, математический факультет,

185640, Петрозаводск, пр. Ленина, 33

i Надоели баннеры? Вы всегда можете отключить рекламу.