Труды Петрозаводского государственного университета
Серия “Математика” Выпуск б, 1999
УДК 517.9, 62.50
ИНТЕГРАЛЬНЫЕ ОПЕРАТОРЫ ВОССТАНОВЛЕНИЯ ФАЗОВОГО ВЕКТОРА ДИНАМИЧЕСКИХ СИСТЕМ
Ю. В. Заика
В терминах функциональной зависимости получено описание наблюдаемых функций в нелинейных динамических системах, аналитических по фазовым переменным. При анализе ба-зисности конечного числа интегральных операторов наблюдения развивается аналог принципа двойственности, известного в линейной теории наблюдения и управления. Рассмотрены также вопросы устойчивости базисов, учета структуры возмущений, методы приближений.
Проблема наблюдения и прогнозирования фазового состояния динамических систем по неполной обратной связи относится к классу обратных задач. По ограниченной косвенной информации требуется восстанавливать неизвестное априори движение. Формально сюда включаются и задачи параметрической идентификации моделей. Механическую терминологию используем по традиции (подобные задачи возникают, например, и в нестационарной химической кинетике). Условно можно выделить два основных направления исследований: поиск критериев наблюдаемости и построение восстанавливающих (разрешающих) операторов. В теоретическом отношении наиболее удобным является дифференцирование выхода и применение критериев инъективности отображений из Мп вГ. Но в условиях реальной зашумленности измерений такой путь чреват потерей работоспособности алгоритма восстановления движения. Более корректным является применение интегральных восстанавливающих операторов. Основы соответствующего математического аппарата изложены в [1].
© Ю. В. Заика, 1999
Этот подход обобщен на нелинейный случай в [2, 3]. Данное сообщение содержит развитие результатов [2-4] для нелинейных систем, аналитических по фазовым переменным. Основное внимание уделяется качественному описанию метода, технические детали и громоздкие доказательства опущены.
Для упрощения изложения считаем динамическую систему стационарной вещественной аналитической, а измерения скалярными:
= /(*), у = д(х), /€С“(С/,Г), (1)
Начальные данные неизвестны. Заданы отрезок наблюдения [0,Т] и множество возможных конечных состояний С/т — {х(Т)} С и. В дальнейшем С/, С/т, С/,...— области в фазовом пространстве Мп. Задача наблюдения состоит в построении оператора, позволяющего по любым возможным (х(Т) £ С/т) реализациям обратной связи
у(-,х,Т) = д(х(-,х,Т)) : [О, Г] ->■ Ж1
однозначно определять неизвестный фазовый вектор х — х(Т) Е С/т-По х(Т) уже можно полностью восстанавливать траекторию движения. Запись у(-;х,Т) означает, что регистрируемая на [0,Т] функция времени у(-) однозначно определяется искомым неизвестным состоянием х в момент Т. Решения ж(-;ж,Т) дифференциального уравнения в (1) с данными Коши х(Т;х,Т) = х предполагаются продолжимыми на [0,Т] по смыслу задачи. Таким образом, необходима операция для систематического решения континуальной краевой задачи при вариациях начальных данных. Вопросов существования решения здесь нет, проблема в единственности и алгоритме восстановления. Более общая постановка: определять по у(-) значения <р(х(Т)) заданной функции (р : С/т —> Н1. В частности, можно рассматривать ц){(х) — Х{.
В дальнейшем удобно проводить аналогию с линейным случаем, когда (/, д) — (-Р, С?) (<ix/dt — Гх, у — С — матрицы
размерностей п х п и 1 х п) [1]. Если в сопряженной системе
ау!<и = + в'Щ), у(о) = о, (2)
построить управление &(•) из условия V{Т) — /г, то по у(-) вычисляется проекция неизвестного х(Т) на вектор Н:
Н,х(Т) = (к,у) = (к,у)Ь2 \ОДеМп.
Штрихом обозначаем транспонирование. Совокупность всех Н Е Мп, для которых по любой возможной реализации у(-) однозначно восстанавливается значение Н'х(Т), описывается множеством достижимости Пт — {У(Т)}. Для определенности считаем управления к(-) непрерывными на [О, Т] (нетрудно обобщить до к Е £2)-
Следуя работам [2 - 4] примем в качестве аналога сопряженной системы (2) линейное уравнение в частных производных
Когда задача линейна, т. е. (/, д) = (.Р, (?), имеем г>(£,ж) = У'(£)ж, где вектор-функция V(£) удовлетворяет (2). Поскольку Т, 11т фиксированы, то (3) достаточно рассматривать на пучке
из возможных (х(Т) Е 11т) интегральных кривых на [0,Т]. Единственным гладким решением (3) является функция
Гладкость в \¥ понимается в смысле у Е С1(\¥) (\¥ С — область): формулой (4) и(£, ж) задается и в открытой окрестности IV, точка (£,ж) играет роль начальных данных (£о,жо) (ж(^о5^о,^о) = ^о).
Смысл введения функции (4) и уравнения (3), которому она удовлетворяет, состоит в следующем. При £ = Т в (4) получим у{Т,х) = (к,у), х Е С/т- Это же соотношение получаем подстановкой в (3) вместо х решения ж(£;ж,Т) и интегрированием на [0,Т] тождества по £ (слева £(£, ж(£))). Значит, если мы хотим определять ”нелиней-ную проекцию” (р(х(Т)) по известной у(-) в форме интегрального оператора (к,у), то в (3) к нулевым начальным данным у(0,х) = О, х Е £/о, следует добавить условие у(Т,х) = </?(ж), х Е 11т> Задача построения интегрального оператора восстановления (р(х(Т)) = (к, у) эквивалентна граничной задаче, которую можно интерпретировать и как задачу управления: перевести фазовую точку г>(£, •):£/*—>■ М1 из нуля в (р(-) за время Т выбором к(-). Важно, что (3) линейно по паре (к, у). Исходная операторная постановка задачи наблюдения трансформируется в исследование уравнения. Эти рассуждения останутся в силе, если допускать нелинейные к^,у) (к,ку Е С((5),
у^,х) +ух(г,х) • /(ж) = к(г)д(х), у{0, ж) = 0. (3)
уг = {(г,х)\ * е [о,т], хещ = х(г-,ит,т)}
(4)
Э у^)) | х(Т) Е Лт }), считать /, д гладкими, а {к, у) — интегралом &(£,?/(£)) от 0 до Т. В правой части (3) будет к^,д(х)).
Определение 1. 1. Функцию <р : 11т —> М1 назовем наблюдаемой в подмножестве М С 11т, если существует функционал А из условия <р(х) = А(у(-;х,Т)), х £ М.
Наблюдаемость (полная) пары (/, д) эквивалентна наблюдаемости в 11т всех координатных функций (р^х) — ж*, г = 1 , п. Введем обозначения: Ф (М) — множество всех наблюдаемых в М функций (р : 11т ~> М1, Вт — {ъ(Т, •) : 11т —> М1 | к Е С[0,Т] } — множество достижимости из нуля за время Т сопряженной системы управления (3) (г?(Т, х) — ( к, у{'] ж, Т))), г > 1} — произвольная фиксированная полная в Ь2{0,Т) система допустимых &(•), г?*(Т, •) — соответствующий к — к{ элемент Вт-, И — символ функциональной оболочки:
Ф е 'Нм{Ф ь • • •, Фд} О ф(х) = Щ(ф1(х),.. .,фч{х)), х Е М.
По построению Вт С Ф(Пт) С Ф(М) УМ С ит.
Теорема 1. Для любого М с компактным замыканием в 11т можно указать такие к^,..., к{р, что Ф(М) = Чм{ ^ (Т, •),..., (Т, •) }.
Если М С М, то Ф(М) = ИКогда дополнительно известно, что область 11т ограничена и решения ж(-;ж,Т) (х — х(Т) Е £7 I) с1С/т) продолжимы на [0,Т], то можно считать М = 11т. Из теоремы следует взаимно однозначное соответствие
{г^(Т,ж), г/ = Т7р} = {(&»„, у(-; ж, Т)), г/ = Т7р} -В- у(-;х,Т), х £ М.
Поэтому вместо у(-) без потери информации об искомом х{Т) можно оперировать конечным набором моментов (к,у), вычисляя их в масштабе реального времени.
Без априорного ограничения к Е {к{^ > 1} результат усиливается.
Теорема 2. Существует такое семейство наборов из 2п +1 функций {г1 Е С[0,Т], г = 0,2 п}, для которых Ф (11т) - 'Нит{ы о, • • • }, где
Е Вт, ш5{х) = (гу,у(-,х,Т)), х Е иТ-
При этом Ф(М) = Нм{• • •} УМ С 11т и каждая rj представима равномерно сходящимся рядом на [0, Т] по элементам {к{, г > 1}.
Итак, общая форма интегрального оператора восстановления:
<р(х(Т)) = Н((го,у),...,(г2п,у))-
Доказательства основаны на результатах теории комплексных аналитических множеств [5, 6]. В частности, для справедливости теоремы 2 доказывается, что множество общих нулей функций
Д^(ж1,ж2) = г>,(Т,ж1) - Уг{Т,х2) = (£;;,?/(•;ж1,Г) -у(-;х2,Т)), г > 1,
в 11т х 11т совпадает с множеством общих нулей
АWj(x1,x2) = Wj(x1) — Wj(x2), (ж1, ж2) Е 11т х С/т, 3 = 0, 2п.
Отсюда {wj(x),j = 0,2п} 2/(-;ж,Т), ж Е С/т, вследствие полноты {&*, г > 1} в Ь2(0,Т).
Для интерпретации утверждений удобно перейти в (3) к операторной форме:
бу/яь = -АУ{г) + вк(г), У(о) = о, (5)
У{1) = «(*, АУ{1) = •)/(•), У{1) = щу, ■), В = д(.).
Если нет проблем с продолжимостью: решения ж(-;ж,£) с начальными данными (£, ж) = (£о,^о) £ [0,X1] х С/ определены на [0,£], то (5) — линейная система управления в С1 (II) (Сш(и)). Здесь предполагается, что допустимые фазовые кривые (ж(Т) Е С/т, £ Е [0,Т]) не покидают С/ С С/. Иначе придется учитывать зависимость области определения Щ фазовой точки V{Ь) = и(£, •) (как функции ж) от времени. В вычислительном отношении (3), (5) удобнее рассматривать на прямом произведении [0,Т] х С/.
Получаем полную аналогию с линейным случаем, если только заменить линейную зависимость функциональной: множество наблюдаемых в М С С/т ” нелинейных проекций” <р(х(Т)) описывается как функциональная оболочка конечного числа базисных в М элементов множества достижимости Вт — {У(Т)}.
Определение 2. 2. Базисом Вт в М С ит назовем такую конечную совокупность элементов Vj(T,^) Е Вт, 3 = 1,#, что все у(Т,-) Е Вт выражаются как функции базисных при ж ЕМ;
у(Т, ж) = Я„(г;1(Т,ж),.. .,уд(Т,х)), ж ЕМ.
Совершенно аналогично определяется базис (конечный) множества Ф (М). Базис Вт в М будет и базисом Ф(М). В теоремах 1, 2 элементы Viv (Т, •), Wj(-) образуют базис Вт в М, Ut соответственно (ивМ VM С М. VM С С/т)- Когда (/,д) — (F,G) наблюдаемость эквивалентна наличию в (2) Vi(T) из условия С{ Vi(T), г — 1, п } = Z)t = Здесь и далее С - символ линейной оболочки. Это эквивалентно {V({T)x, i = 1,п} ++ х Е Ut (Мп). Поэтому в нелинейном случае, когда ”коэффициенты V(T) не отделяются от ж”, под управляемостью в М С Ut сопряженной системы (3) естественно понимать свойство {vj(T,x), j — 1, <7 } х G М. Такое определение не зависит от выбора базиса Вт в М. Смысл: не линейная, а функциональная оболочка ^м{ Vj(T, •), j — 1 ,q} базиса образует множество всех функций аргумента х Е М. Как линейное пространство Вт конечномерно лишь в вырожденном случае конечномерности С{у(')\х(Т) Е С/т}, причем тогда dim Вт — dim£. Формально получаем обобщение принципа двойственности: (/, д) наблюдаема в М (3) управляема в М. При этом х(Т) Е М однозначно определяется по базисным моментам ц — (к,у) из системы уравнений вида v(T,x) — ц. Ограничения на управления типа \k(t)\ < к несущественны — по мере измерений y(t) можно вычислять (1к,у) и затем результат поделить на £.
Перейдем теперь к изучению структуры элементов множества Вт-Для (/,#) = (F,G) имеем Вт — С(1С), где С(К) — линейная оболочка столбцов матрицы управляемости /С = (G", F'G',..., F,n~1G'). В нелинейном случае аналогом столбцов матрицы управляемости сопряженной системы служат функции
Щд = д, Ь)+1д = (.L)g)xf : (/,<?) = (F,G) =* L)g(x) = GF*x.
В операторных терминах (3) L^g — АгВ : U —> М1. Если /, д в приложениях задаются элементарными функциями, то и L%^g таковые. Но сводить задачу наблюдения к решению в области Ut системы уравнений Ьг^д(х) — у(г\Т), i — 1,п, не будем по причине вычислительной некорректности такого подхода. Вместе с тем использование L^g для представления элементов Вт целесообразно.
Теорема 3. Пусть Т, Ut достаточно малы. Тогда возможны конечные представления
ъ(Т,х) = ^2,=осп(х) Цд(х), <л(х) = (к,л(-,х)),
I € [0,Т], X € ит, 7* е х ит), (*Х) Э [0,Т].
Малость 11т означает: выбираем произвольную (опорную) х Е II и считаем 11т достаточно малой окрестностью х. Лишь бы по смыслу задачи соответствующие решения х(-) были продолжимы на [0,Т]. Малость Т при установлении наблюдаемости несущественна в силу теоремы единственности для аналитических функций: у ^ ^
2/|[0Т]. При наличии у i = 0,8, двух различных общих нулей в
11т пара (/, д) заведомо неполностью наблюдаема в 11т. В отличие от линейного случая коэффициенты разложения элементов Вт по АгВ — Ьг^д являются функциями. В общем случае с постоянными коэффициентами возможно только бесконечное разложение
г?(Т, х) — соВ + с\АВ + С2А2В + ..., с* = (&, (т — Т)г)/И .
При этом (имеем дело со степенной проблемой моментов) сами ” столбцы матрицы управляемости” АгВ не принадлежат Вт, Вт зависит от Т > 0. Очевидное следствие: дифференцирование у(-) нельзя заменить интегральным оператором.
Теорема 4. Если область неопределенности 11т = {х(Т)} достаточно мала, можно выделить такие ,..., к{д, что:
1) элементы Уги (Т, х) = (к^,у) образуют базис Вт (Ф(С/т));
2) базис Вт образуют и (Т, х) = (к{и + , у) при доста-
точно малых возмущениях ||£^ \\ь1 < 3 (и = 1, д, х Е С/т).
Когда (/, д) наблюдаема в С/т, обеспечивается определенная устойчивость восстановления х(Т) к малым вариациям базисных к(-).
Предположим теперь, что движение подвержено неконтролируемым возмущениям £(£):
йх/М = /(ж) +ф)к(х), |£(*)|<£.
Пусть в (3) дополнительно у(Т,х) = (р(х), х Е С/т, ”направление возмущения” к : и —У Мп известно и выполнено
ух{Ь^х)Н{х) =0, t е [0,Т], ж Е С/
(относительно U см. после (5)). Тогда для любого возмущенного решения с х(Т) Е Ut и фазовой кривой в U на [0,Т] будет по-прежнему (р(х(Т)) = (к,у). В операторных терминах получаем линейное фазовое ограничение вида P(t)V(t) — 0 (vx(t,-) h(-) — 0). Для такой идеальной (к ф к(£(•))) в направлении h наблюдаемости нужно управлять не только конечным состоянием v(T, •), но и градиентом vx(t, •). Обратно, если к, (р фиксированы, то условие vxh 0 дает описание направлений /г, возмущения вдоль которых слабо влияют на точность интегрального оператора восстановления (р(х(Т)) « (к,у).
Теоремы 1, 2 верны и для нестационарных /(£,ж), g(t,x). Достаточно аналитичности (к, у) по данным Коши х — х(Т) Е Ut. Существенных изменений в теоремах 1-4 не потребуется при y(t) Е Мт, m > 1, к Е ^2- Но главное: если фиксирована, то класс линейных операторов (к, у) может оказаться слишком узким и следует использовать нелинейные весовые функции k(t, у). При решении задачи прогнозирования, когда измерения у(-) известны только на отрезке времени [0,Т*], Т* < Т, следует допустимые &(•, •) подвергать усечению k(t, •) =0, t > Т*. Возможен и обратный путь: выбираем &(•, •) и в силу (3) (справа k(t, g(t,x))) находим v(T, •) — ту компоненту (р(х(Т)), которая восстанавливается интегрированием k(t,y(t)) на отрезке времени [0,Т].
В заключение кратко о схемах приближений. Для (3) можно применять технику степенных рядов. В нестационарном случае считаем / = д - g(t,x), к - k(t,g(t,x)). Пусть 0 е UT, f(t, 0) = 0,
g(t, 0) = 0, k(t, 0) = 0. Приравнивая слева и справа коэффициенты однородных полиномов одинаковой степени по ж, последовательно получаем линейные конечномерные задачи управления. Управления — коэффициенты разложения k(t,y) по степеням у. В линейном приближении имеем (2). Для лексикографически упорядоченных коэффициентов разложения v(t, х) в степенной ряд по х получается аналогичная линейному случаю система вида (2). Только вектор V(t) и матрицы системы F', Gf будут бесконечномерными, F'(t) — нижняя блочнотреугольная. Можно ограничиться конечной подсистемой.
Вместо степенных можно использовать и другие базисные функции, ориентируясь на специфику нелинейности /, д. Аналитичность здесь необязательна. Выберем базисные ^i(x),..., фм{х), х Е U. Подбираем такие функции hj, j — 1, г, чтобы hj(t, g(t,x)) достаточно точно приближались линейными разложениями по базису х) с
коэффициентами buj(t). Аналогично приближаем <р(х) « (ж) + ... + с1кфм(х),
фих(х)/(г,х) « а1и(г)ф1(х) + ... + ами(г)фм(х).
Ищем к, V в форме линейных комбинаций /^-(£, ?/) и фи(х) соответственно с коэффициентами kj(t), После подстановки в сопря-
женную систему и приравнивания коэффициентов при фи (ж) получаем задачу У(Т) « с? = (с?1,..., б?лгУ для 7У-мерной линейной системы вида
(5) (У = {^}, к = {к^}, А = {а,ц}, В = {Ь^}). В итоге
гт
<р(х(Т)) « / к^Щ^у^М.
./о ^=1
На проблему можно посмотреть и с позиций общей теории приближенного решения линейных граничных задач. Возьмем любую гладкую функцию г?о(£,ж), удовлетворяющую граничным условиям (0, ж) = 0, Уо(Т, ж) = </?(ж), ж Е и (уо = ^(х)/Т). Определим
у = 170(£, х) + а^!^, ж) + ... + алг^лг(£, ж), и*(0, ж) = г^(Т, ж) = О
(в частности, г?* = £(£ — Т)0{(£)'ф{(х)). Аналогичным образом:
Щ,у) = (£, 2/) + ... +/?м&м(*,2/)-
Подставляя функции и(£, ж), к^,у) в сопряженное уравнение, получаем невязку Д(£, ж; «1,... ,/?м)- Ее нужно минимизировать по параметрам а*, /^-. Линейность по (й,г?) позволяет применять классические проекционные методы.
Обычно измеряется часть фазовых координат: ?/*(£) = ж*(£), г = =
1,ш. Формально этого можно добиться заменой или добавлением переменных. В слабых предположениях гладкости в сопряженной системе справа &(£, Ж1,..., жш) и можно перейти к задаче = 0, г?(О, •) = О, г?(Т, •) = (/? (в частности, (р = Xj, j Е {ш + 1,..., п}). Здесь Х> — линейный дифференциальный оператор второго порядка (г^ + УХ/)Х{, г = тп + 1,..., п. В качестве весовой функции &(£, 2/1,..., ут) в интегральном операторе наблюдения будет (выражение в скобках).
Подчеркнем, что исходная задача — нелинейная обратная, а в итоге пришли к прямым методам решения линейного уравнения, хотя
и распределенного (следствие построения операций наблюдения для области фазового пространства).
Resume
In function dependence terms a description of observable functions in nonlinear analytical dynamical systems is obtained. An analogue of the duality principle in linear systems is developed for the nonlinear case.
Литература
[1] Красовский H. H. Теория управления движением. М.: Наука, 1968.
[2] Кирин Н. Е. К теории методов оценивания в динамических системах// Вопросы механики и процессов управления. JL: Изд-во ЛГУ, 1986. Вып. 8. С. 118-125.
[3] Кирин Н. Е., Исраилов И. Оценочные системы в задачах теории управления. Ташкент: Фан, 1990.
[4] Заика Ю. В. Задача наблюдаемости нелинейных систем// Кирин Н. Е. Методы оценивания и управления в динамических системах. СПб.: Изд-во СПбГУ, 1993. С. 85-143.
[5] Эрве М. Функции многих комплексных переменных. М.: Мир, 1965.
[6] Чирка Е. М. Комплексные аналитические множества. М.: Наука, 1985.
Петрозавозаводский государственный университет, математический факультет,
185640, Петрозаводск, пр. Ленина, 33