УДК 517.9
Вестник СПбГУ. Сер. 10, 2004, вып. 4
Н. В. Смирнов
СИНТЕЗ РЕЛЕЙНОГО МНОГОПРОГРАММНОГО РЕГУЛЯТОРА ДЛЯ ЛИНЕЙНЫХ СИСТЕМ
1. Введение. Проблемы построения программных управлений и стабилизации программных движений представляют собой два наиболее важных направления развития математической теории управления. Фундаментальные результаты по теории линейных управляемых систем, изложенные в работах [1-5], нашли широкое применение в самых разных областях техники и вошли в программы университетских курсов. Вместе с тем интерес к линейным моделям не исчезает до сих пор, возникают новые постановки задач [6, 7]. Одной из таких задач является проблема построения многопрограммных управлений, впервые сформулированная в [8]. Изложим кратко ее суть. Рассмотрим линейную управляемую систему
х = Ах + Ви + Г(*), (1)
где х - п-мерный вектор фазового состояния; и - г-мерный вектор управлений; А и В - постоянные, вещественные матрицы соответствующих размерностей; Е(£) - вещественная, непрерывная вектор-функция, заданная при £ € (—оо, +оо).
Задача 1 [8] (Многопрограммная стабилизация). Требуется построить управление
и = и(х, £), (2)
которое реализует заданные программные движения
¿ = (3)
при программных управлениях
и; = и; (г), (4)
Кроме того, необходимо, чтобы программные движения (3) при управлении (2) были асимптотически устойчивы по Ляпунову. Число программных движений N не связано с размерностью системы (1) и размерностью пространства управлений.
Замечание!.. В рамках данной задачи не рассматриваются методы построения программных управлений. Для определенности будем полагать, что каждое управление и программное движение х^(£), ] = 1, ./V, являются ограниченными функциями времени и строятся как решение задачи по переводу системы (1) из заданного начального состояния х^о при t = Ьо ъ заданное конечное состояние х_д при £ = ¿о + Т. Таким образом, если систему (1) замкнуть программным управлением из (4), то она будет иметь соответствующее частное решение х^) = Xj(t,to,T,Xjo, ^Xjl) из семейства (3), отвечающее выбранным начальным и конечным данным. Другими словами, для каждой пары и<7(£), х_Д£) имеет место тождество по £ на интервале, где эти функции определены:
х,(£)=Ах,(£)+Ви,(£)+Г(£).
© Н. В. Смирнов, 2004
Задачу 1 решает следующая теорема.
Теорема 1 [8]. Пусть выполнены следующие условия:
1) система
х = Ах + Ви
при и = Сх может иметь сколь угодно большой запас устойчивости, получающийся путем выбора постоянной матрицы С;
2) программные движения (3) различимы при Ь>Ьо>0, иначе говоря,
¿п£||хг-х;|| >0, г фу,
тогда существует управление (2), реализующее программные движения (3), при этом каждое из этих программных движений будет асимптотически устойчиво по Ляпунову.
Полное доказательство теоремы 1 можно найти в работе [9]. Управление (2) имеет следующее представление:
/
и(х, = X) ( (*) + С (х " (*)) -з=1 4
_2Мг) £ (5)
4=1,гфз (**(*) -*«(*)) '
где
р(х,£)= Т7 (х-х^))2 —
В формулах (5), (6) и далее по тексту выражения х»(£)) {x—xj(i)), (х^)— х*(£))2
означают скалярное произведение и скалярный квадрат соответствующих векторов. Для управления (5) и скалярных функций (6) выполнены очевидные свойства:
и (х,- (г), ¿) = и, (¿), Рэ (ъ (£), г) = 1, ^ (х* (г), ¿) = о,
Система (1), замкнутая управлением (5), (6), с учетом свойств (7) представляет собой многопрограммный автомат, способный реализовать произвольное программное движение из семейства (3) в зависимости от выбора начальных данных и обеспечить его асимптотическую устойчивость.
2. Постановка задачи релейной многопрограммной стабилизации. Если поставить вопрос о реализации управления (5), (6) в конкретной прикладной задаче, то мы сразу столкнемся с проблемой непрерывного получения информации о векторах отклонений Уj{t) = х(£) — Xj (£) для всех программных движений Xj(t) из семейства (3). Эта проблема исчезает, если построить дискретный или релейный регулятор вместо непрерывного. Дискретное многопрограммное стабилизирующее управление было предложено в работе [10].
Рассмотрим замкнутую систему (1), (5), (6) и некоторое ее программное движение из семейства (3). Индексом к фактически выделяется одно программное движение из заданного набора Х1(£), ..., хдг(£), т.е. то движение, которое необходимо
(
реализовать и стабилизировать в конкретной ситуации. Вместе с тем работа системы управления должна быть универсальна по отношению к исходному семейству (3) и зависеть лишь от начальных данных выбранного движения.
Далее по тексту, в громоздких выражениях и там, где это не мешает пониманию сути преобразований, мы будем опускать аргумент Ь у векторных функций х^-, хк, и^, У к--- ■
Для хь в [9] была построена система в отклонениях
ук = (А + ВС)у* + С(£,у*), (8)
N
0&ук) = 0к(Ь,ук)+В
¿=1, зфЪ
г=1,г^' \ 3 Ч /
Ч/ +С(У* +х* -х,)-
х(2 Е
(хц, - х{)ук
+ 9 к (уа)^ +Вик9к(Ук)-
Скалярная функция дк(ук) представляет собой сумму слагаемых, порядок которых по компонентам вектора ук не меньше двух.
Заметим, что в силу ограниченности функций и7(£), э = 1, N, имеет место
следующее свойство функции С(£,у*):
Шп ЕМ=0 (10)
ЦуИНо \\ук\\
равномерно по £ > 0. Это означает, что для системы (8), (9) выполнено основное условие теоремы Ляпунова об устойчивости по линейному приближению [11].
Далее, если ввести формальное обозначение \к = Су*, то систему (8), (9) можно переписать так:
У к = Аул +Ву* + С(*,ул>у*). (11)
Определение 1 [12]. Управление Vй у) будем называть допустимым релейным управлением, если оно представимо в виде у) = (г»^(¿,у),... у))Т,
У?&у)=тт(аг(^у)), (12)
где о"г(£, у) - управляющие сигналы; гп{ - неотрицательные постоянные параметры, характеризующие абсолютную величину управляющих воздействий; функции <¿>¿(04) определяют знак управляющих воздействий и удовлетворяют соотношениям
У)) = ыёп{<Тг(г,у)), |<г<(*,у)| > ЫЫ*> У))1<1, М*,У)\ <Ь,
и > 0, г = 1 ,г.
Таким образом, функции у>»(о»(£>у)) вне промежутков [—1{, 1{] заданы точно, а внутри их они могут быть заданы произвольно, лишь бы выполнялись условия существования решений замкнутой системы.
Задача 2 (Релейная многопрограммная стабилизация). Для системы (11) требуется построить допустимое релейное управление (12), т.е. указать алгоритм поиска значений параметров /¿, при которых система (11), замкнутая управлением
(12), будет обладать следующим свойством: все ее решения, выходящие в момент ¿о из ¿-окрестности начала координат = {у* | Цу^Ц < попадают в ^-окрестность йе = {ук | \\Ук\\ < £} и в дальнейшем в ней остаются. Кроме того, необходимо указать ограничения на вектор нелинейности С(£,у*;,ук) в правой части системы (11), при выполнении которых это возможно.
Решение задачи 2 позволит указать алгоритм построения релейного многопрограммного стабилизирующего управления в виде, аналогичном (5), (6), что и является конечной целью данной работы.
3. Синтез релейного многопрограммного регулятора. Прежде всего отметим, что для любого к система линейного приближения в (11) одна и та же:
у = Ау + Ву, (13)
где у, V - формальные обозначения для векторов фазовых переменных и управлений соответственно.
Для системы (13) построим релейное стабилизирующее управление Vя(¿, у) [3, 12]. При этом будем полагать, что она стабилизируема непрерывным управлением в виде линейной обратной связи V = Су, т.е. по известному алгоритму [3] найдена матрица С, которая обеспечивает асимптотическую (а следовательно, и экспоненциальную) устойчивость замкнутой системы
у = (А + ВС)у. (14)
В этом случае существуют две положительно-определенные квадратичные формы и(у) = утУу и ги(у) = ут\Уу, связанные соотношением
<Му)
дХ
и удовлетворяющие неравенствам
= -Цу)
(14)
а1||у||2 < и(у) < а2||у||2, ЬхИуП2 < Чу) < Ъ2\\у\\\
в которых 01,02,61,62 - положительные постоянные. Будем считать, что положительно-определенная матрица ^^ зафиксирована, а матрица V найдена из матричного уравнения Ляпунова. Таким образом, квадратичные формы построены, а константы 01,02,61,62 определены.
Замкнем систему (13) релейным управлением Vя и перепишем в эквивалентном виде:
у = (А + ВС)у + В(уд-Су). (15)
Продифференцируем квадратичную форму г»(у), в силу системы (15), с учетом представления (12) для Vй:
<Му)
= -т(у) + 2утУВ(уд - Су) = -Цу) - 2]Г<7ДуМу),
(15) г=1
где введены обозначения
Ыу),.-.,*г(у)) =-2утУВ, (16)
(в!(у),... ,вг(у))Т = (тцр^о^(у)),... ,тгу>г((Тг(у)))Т - Су. Введем вспомогательные постоянные величины
пчо = <
Ыа2^2гп(о] .
^ г=1 '
1о = Ъ\а\£
Здесь С{ - г-я строка матрицы С.
Теорема 2. Пусть V = Су - непрерывное управление, стабилизирующее систему (13). Тогда управление (12), б котором вектор <г(у) = (01 (у),..., сгГ(у)) задается соотношением (16), при т,{ > тпю и и < 1о решает задачу релейной стабилизации для заданных е и 5.
Теорема 2 является следствием теоремы 5.3 (см. [12, с. 95]). Далее будем использовать построенные квадратичные формы г» (у) и ю(у) для синтеза релейного стабилизирующего управления в нелинейной системе (11). Замкнем ее релейным управлением Vй(уй) и перепишем в следующем эквивалентном виде:
ук = (А + ВС)ук + В(ул(ук)-Сук) + С(Ьук,ул(ук)). (17)
Продифференцируем квадратичную форму г>(у), в силу системы (17), с учетом представления (12), (16) при га* > т*о, к < 1о-
¿ь(ук)
(17) = + 2УлУВ(уДЫ - Су*) + 2уГга(*,уьУя(ук)). (18)
<И
Рассмотрим вспомогательную функцию
М^Ук) = «(у*) - 2у1УС^,ук,у*(ук)).
В силу положительной определенности квадратичной формы ю(ук) и свойства (10) существует постоянная ук > 0 такая, что для всех ук € = {у* | Цу^Ц < 7*} выполнено неравенство
«>*(*,У*) > М1У*Ц2»
где Ьк - некоторая положительная постоянная. Приведенные рассуждения справедливы для любого к = 1, N. При этом матрицы Уи¥ квадратичных форм одни и те же, так как система линейного приближения (13) общая для всех к. Введем обозначения Ь* = тт{&1,... 7* = тт{7ь... ,7^},
¿о = Ь*а 1£2 ( 4а2 ^ т»0 ] .
^ г=1 '
Теперь можно сформулировать основной результат.
Теорема 3. Пусть V = Су - непрерывное управление, стабилизирующее систему (13), и 6 < 7*\/а1/а2, тогда управление вида (12), (16), построенное для Ь*, решает задачу релейной стабилизации для каждой из систем (11) при к = 1, N.
Доказательство теоремы 3 не представляет труда и может быть проведено так же, как доказательство теоремы 5.3 [12]. В отличие от случая системы линейного приближения (13), необходимо построить оценку сверху для полной производной (18) с учетом сделанных предположений и обозначений. При этом роль квадратичной формы w(yк) будут играть функции wk(t,yfc), к = 1,N.
Теорема 4. Пусть выполнены условия существования непрерывного многопрограммного стабилизирующего управления (5): 1) программные движения (3) различимы при t > to > 0, т.е. inf¿>o ||x¿ \xj|| > 0, i ф j; 2) система х = Ах + Bu полностью управляема. Тогда существует релейное многопрограммное управление, реализующее программные движения (3) и обеспечивающее их релейную стабилизацию.
Замечание 2. Теорема 4 является следствием теорем 1, 3. Обозначим релейное стабилизирующее управление, построенное для систем (11), через Vй. Теорема 3 дает достаточные условия его существования. Если эти условия выполнены, то для S из теоремы 3 релейное многопрограммное управление может быть представлено в виде N
u(x,t) = ¿(и,-(£) + vf (t,x - x,(¿))•
.■_i (xAt)-Xi(t)) J
i=l,i& {Xj(t)-Xi(t))
где величины pj(x.,t) задаются формулами (6).
Замечание 3. Рассмотрим линейную нестационарную управляемую систему
х = A(i)x + B(i)u + F(i), (19)
в которой х - n-мерный вектор фазового состояния; и - r-мерный вектор управлений; элементы (пхп)- и (пхг)-матриц A(i), B(t) непрерывны при i > 0; F(i) - вещественная, непрерывная вектор-функция, заданная при t > 0. Утверждения теорем 2-4 остаются верны для системы (19), если их условия дополнить требованием ее стабилизируемости в сильном смысле [12].
Summary
Smimov N. V. Synthesis of a relay multiprogrammed regulator for linear systems.
The problem of relay multiprogrammed stabilization for linear controlled systems is considered. The theorem on sufficient conditions of existence of relay multiprogrammed control and on its representation is proved.
Литература
1. Калман P.E. Об общей теории систем управления // Труды I Междунар. конгресса ИФАК. М., 1961. Т. 2. С. 521-546.
2. Зубов В. И. Математические методы исследования систем автоматического регулирования. Л., 1959. 324 с.
3. Зубов В. И. Лекции по теории управления. М., 1975. 495 с.
4. Красовский Н. Н. Теория управления движением. М., 1968. 475 с.
5. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., 1969. 384 с.
6. Поляк Б. Т., Щербаков П. С. Возможные подходы к решению трудных задач линейной теории управления // Труды III Междунар. конференции «Идентификация систем и задачи управления». М., 2004. С. 23-63.
7. Валашевич Н. В., Габасов Р., Кириллова Ф. М. Численные методы программной и позиционной оптимизации линейных систем управления // Журн. вычисл. математики и мат. физики. 2000. Т. 40, № 6. С. 838-859.
8. Зубов В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. 1991. Т. 318, № 2. С. 274-277.
9. Смирнов Н. В., Смирнова Т.Е. Стабилизация семейства программных движений билинейной нестационарной системы // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 1998. Вып. 2 (№ 8). С. 70-75.
10. Smirnov N. V. Discrete multi programmed stabilization of linear systems // Proc. Ninth Intern. Workshop "Beam Dynamics &: Optimization". St. Petersburg, Russia, 2002. P. 328-332.
11. Ляпунов A.M. Общая задача об устойчивости движения. М.; Л., 1935. 386 с.
12. Смирнов Е.Я. Стабилизация программных движений. СПб., 1997. 307 с.
Статья поступила в редакцию 19 октября 2004 г.