Научная статья на тему 'Субоптимальное управление линейными системами со структурными и параметрическими ограничениями'

Субоптимальное управление линейными системами со структурными и параметрическими ограничениями Текст научной статьи по специальности «Математика»

CC BY
111
37
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Удовенко Сергей Григорьевич

Предложен алгоритм синтеза цифровых регуляторов, учитывающий структурные ограничения на матрицу обратной связи. Рассмотрена возможность субоптимального управления стохастическими объектами с дополнительными ограничениями на переменные состояния.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Субоптимальное управление линейными системами со структурными и параметрическими ограничениями»

процесса и дает возможность проследить за ее вариациями при воздействии на процесс факторов, быстро изменяющихся во времени.

Литература: 1. Дикарев В. А. Точки эргодичности и сходимость к финальным вероятностям. Харьков, 1994. 7с. Деп. в ГНТБ Украины 17.10.94, №2017-Ук 94. 2. Дикарев В. А. Точки фокусировки и теоремы о существовании предельных вероятностей. Харьков, 1995. 11 с. Деп. в ГНТБ Украины 28.02.95, №526-Ук 95. 3. Дикарев В. А. Точки фокусировки и стабилизация неоднородных марковских процессов. Харьков, 1995. 9 с. Деп. в ГНТБ Украины 28.02.95, №533 — Ук 95. 4.Веприк А. Е, Герасим С. Н, Дикарев В. А., Родзинский А. А. Методы и алгоритмы фокусировки распределений марковских процессов.

Харьков, 1997.158 с. 5. Ландау Л. Д, Лифшиц Е.М. Электродинамика сплошных сред. М.: Наука, 1977. 532 с. 6. G. G. Lorentz, Some new functional spaces, Ann. of Math., 51 (1950). P. 37-55. 7. Дикарев В.А. Теоремы вложения для одного класса функциональных пространств. Докл. АН, СССР. Т. 168, N6 (1966). С. 1239-1241.

Поступила в редколлегию 12.05.98 Рецензент: д-р физ.-мат. наук, проф. Руткас А.Г. Дикарев Вадим Анатольевич, д-р физ.-мат. наук, профессор кафедры прикладной математики ХТУРЭ. Научные интересы: случайный анализ и его приложения. Адрес: 310164, Украина, Харьков, пр. Ленина, 14, тел. 33-57-03,40-94-36 .

УДК 681.513.7

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ СО СТРУКТУРНЫМИ И ПАРАМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ

УДОВЕНКО С.Г.

Предложен алгоритм синтеза цифровых регуляторов, учитывающий структурные ограничения на матрицу обратной связи. Рассмотрена возможность субоптимального управления стохастическими объектами с дополнительными ограничениями на переменные состояния.

Введение

Методы оптимального управления линейными системами при квадратичном критерии качества и заданных переменных состояния зачастую основаны на решении дискретного уравнения Риккати. Однако на практике такой подход не всегда является эффективным в силу следующих причин:

— как правило, не все переменные состояния системы доступны наблюдению;

— оценка недостающей информации о состоянии системы с помощью наблюдателя Люенбергера или фильтра Калмана существенно усложненяет расчеты на каждом такте управления;

— синтез многосвязных регуляторов требует определения большого числа обратных связей, задающих структуру управления;

— при ограниченной априорной информации о параметрах объекта необходимо применять адаптивные методы оценивания, что, в сочетании с трудоемкой многошаговой процедурой поиска оптимальных управлений, приводит к значительным вычислительным трудностям;

— в ряде практических случаев возникает необходимость соблюдения различных ограничений на переменные состояния.

Эти обстоятельства существенно ограничивают возможность применения стандартных методов оптимального управления с квадратичным функционалом качества, определяя целесообразность синтеза субоптимальных цифровых регуляторов [1].

На практике возникает необходимость такого синтеза для детерминированных и стохастических систем при наличии различных структурных и параметрических ограничений.

1. Субоптимальное управление детерминированной системой

Рассмотрим многомерную дискретную систему, уравнения состояния которой представлены в виде

x(k+1)=Ax(k)+By(k); (1)

u(k)=-Gx(k)=-GCy(k), (2)

где для переменных состояния, управления и выхода принимаются условия

x(k)eRn, u(k)eRm, y(k)eRl, а матрицы A, B, C и G имеют соответствующие размерности.

Оптимальным будем считать управление u*(k), минимизирующее на бесконечном интервале квадратичный функционал

J=Z[xT(k)Qx(k)]+uT(k)Ru(k)], (3)

где Q — положительно полуопределенная матрица размерности (nxn); R—положительно полуопределенная матрица размерности (mxm). Преобразуем уравнение системы к виду

x(k+1)=(A-BG)x(k). (4)

Представим матрицу обратной связи G суммой подматриц G0 и G1, где G0 — подматрица, отдельные элементы g0ij которой содержат предписанные постоянные значения (остальные элементы являются нулевыми); G1 — подматрица, отдельные элементы g1ij которой рассчитываются в соответствии с алгоритмом оптимизации (остальные элементы являются нулевыми).

Множество индексов (i, j), соответствующих ненулевым элементам g1ij, обозначим символом Q. При этом

g1ij=gij, если (i,j)eQ; g1ij=0, если (ij)eQ; (5)

g0ij=0, если (i,j)eQ; g0ij=const, если (i,j)gQ. (6)

Введя обозначение

K(G)=ZxT(k)[Q+GTRG]x(k), представим функционал (3) в виде

J=0,5tr[K(G)X(0)XT(0)], (7)

так как для симметрических матриц

xT(k)Kx(k)=tr[kx(k)xT(k)].

Для оптимизации системы с известными параметрами вместо (7) целесообразно использовать функционал

РИ, 1998, № 2

53

Jo=0,5tr[K(G)Xo], (8)

где X0 — ковариационная матрица вектора начальных условий x(0) с нулевым математическим ожиданием.

Определение матрицы G, соответствующей минимальному значению функционала J0, является задачей нелинейного программирования. Для ее решения используем градиентный метод с квадратичной интерполяцией оценки длины шага [2]. В процессе вычислений формируется такая последовательность Gj, для которой

0,5tr[K(Gi+i)Xo]<°,5tr[K(Gi)Xo], где Gi — значение матрицы G на i-й итерации. На каждом шаге предлагаемой процедуры для соответствующей Gi определяется градиент

Vi=(RGi-BTK(Gj))LC-T. (9)

Здесь K(Gi) и L — решения соответствующих матричных уравнений

(A-BGi)TK(Gi)+K(Gi)(A-BGi)+Q+GiTRGi=0; (10) L(A-BGi)T+(A-BG)L+Xo=0, (11)

учитывающих структурные ограничения (5) и (6) на матрицу обратной связи G.

Сформируем матрицу Fi, ненулевые элементы которой соответствуют тем элементам градиентной матрицы Vi, для которых (i,J) єО. Для Fi определим матрицу сопряженных градиентов F^:

Fic=Fi, если i=k(ro+2), k=0,1,2,...r, F^F^Fm, если i^k(ro+2),

где Xi=Z/j2k/Z/j2k0; Zjk, /jk0 - элементы матриц Fi и FM соответственно; со — число элементов множества О.

Минимизацию функционала J0 осуществим в направлении матрицы Fic:

Gi+i=Gi-yiFic . (12)

Здесь Yi — длина шага поиска на i-й итерации. Для определения величины Yi, существенно влияющей на сходимость алгоритма, используем квадратичную интерполяцию функции J0(Gi-YiFic)=J0(i) по известным значениям J0(0) и J0(i-1). При этом оптимальное значение Yi составит:

Y i = ОД

tr[FiTFic ]72_ і

J0 (i-1) +Y i-1tr[FiT Fic ] - J0 (°)

(13)

Обобщим алгоритм пересчета матрицы обратной связи на i-й итерации. Пусть задана постоянная часть Gc общей матрицы Gi. Тогда для определения элементов gij, в соответствии с ограничениями структуры (5) и (6), требуется последовательно выполнить следующие операции:

1. Определение Vi, Fi, Fic .

2. Проверка неравенства

!/jk!max<e; j=1,2,...,m; k=1,2,...,r; (14)

є — малое положительное число.

При выполнении (14) вычисления прерываются и в качестве искомых элементов gij выбираются соответствующие элементы матрицы Gi-1. В противном случае осуществляется следующий шаг алгоритма.

3. Определение Yi в соответствии с (13).

4. Проверка неравенства

J0(GAiFic)<0. (15)

При выполнении (15) принимаем Yi:=0,5Yi и повторяем шаг 4. В противном случае переходим к следующему шагу.

5. Определение Gi+1 в соответствии с (12) и переход к (і+1)-й итерации.

Очевидно, что эффективность алгоритма во много зависит от удачного выбора начальных значений G0 и Х0. При отсутствии априорной информации о законе управления целесообразно принять G0=0; Х0= 1. Следует отметить, что решение, получаемое по рассмотренному алгоритму без ограничений на структуру матрицы обратной связи, совпадает с решением соответствующего дискретного уравнения Риккати.

2. Субоптимальное управление стохастической системой

Рассмотрим задачу субоптимального управления стохастическим линейным объектом, динамика которого описывается в пространстве состояний ARMA-моделью вида

H0z(k)=A0u(k)+B0x(k-1)+e(k), (16)

где zT(k)=[yT(k); xT(k)], k-дискретное время; u(k) и y(k) — значения на k-м шаге векторов управления и выхода соответственно; x(k) — вектор переменных состояния объекта; e(k) — случайная векторная составляющая с нулевым математическим ожиданием и ковариационной матрицей Re=M{e(k)eT(k)}; H0, Ao и B0 — матрицы коэффициентов модели.

Предположим, что не все переменные состояния доступны для измерения, но по информации о входном и выходном сигналах процесса можно получить оценки этих переменных. Это обусловливает возможность синтеза цифрового регулятора с обратной связью по состоянию с использованием стандартных текущих измерений d(k)={u(k), y(k)}. При этом связь между x(k) и d(k) определяется уравнением выхода, которое может быть выделено из исходной модели (16):

y(k)=D0x(k)+C0u(k), (17)

где D0, C0 — матрицы коэффициентов.

Зачастую зависимость x(k) от d(k) является однозначной и определяется фиксированными значениями матриц D0 и C0. В этом случае модель (1) может быть существенно упрощена и приведена к следующему виду:

x(k+1)=Ax(k)+Bu(k)+e(k), (18)

где A и B — матрицы параметров объекта, определенные в соответствии с уравнениями (16) и (17).

Такое представление модели объекта является удобным для решения задачи синтеза самонастраивающегося цифрового регулятора при наличии ограничений на переменные состояния. [3].

В отличие от описанного в предыдущем разделе детерминированного случая функционал качества представим в виде

J(k)=M{xT(k+1)Qx(k+1)+uT(k)Ru(k)} (19)

при ограничениях: uT(k)Ru(k)<u2(k),

M {xT(k+1)Qx(k+1)}<x2(k+1), где Q и R — положительно определенные весовые матрицы. Определение вектора управляющих воздействий сведем к задаче оптимизации

minmaxL(k)=minmax{J(k)+X(1,k)(uT(k)Ru(k)-u2(k))+

u(k) ^(k) u(k) ^(k)

+X(2,k)M{xT(k+1)Qx(k+1)-x2(k+1)}}, (20)

где X(1,k), X(2,k) — неотрицательные неопределенные множители Лагранжа.

54

РИ, 1998, № 2

Седловой точке лагранжиана L(k) соответствует управляющее воздействие

u*(k)=-(BT(1+X(2,k))QB+(1+X(1,k))R)1BT(1+

+X(2,k))QAx(k), (21)

или, с учетом обозначений,

Q(k+1)=(1+X(2,k))Q; R(k)=(1+X(1,k))R, u*(k)=-(BTQ(k+1)B+R(k))-1BTQ(k+1)Ax(k), (22) где матрицы критерия Q(k+1) и R(k) являются перестраиваемыми, причем их уточнение производится в двух дополнительных контурах адаптации.

В случае неизвестных параметров A и B объекта

(18) алгоритм необходимо дополнить контуром адаптивной идентификации, основанной на процедуре байесовского оценивания моментов функции условного распределения вероятностей, косвенно связанных с идентифицируемыми матрицами [4].

Адаптивный локально-оптимальный алгоритм управления в этом случае приобретает вид

u*(k)=-BT(k)(1+X(2,k)QB(k)+(1+X(1,k)R)BT(k)(1+ X(2,k))QA(k) *x(k), (23)

X(1,k+1)=X(1,k)+X(1,k)p(1,k)u-2(k)(||u(k)||2R-u2(k)),

0<p(1,k)<1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X(2,k+1)=X(2,k)+X(2,k)p(2,k)x-2(k+1)(||A(k)x(k)+ +B(k)u*(k)||2Q-x2(k+1)), 0<p(2,k)<1, Алгоритм (23) несложно распространить на случай, когда энергетические ограничения наложены на каждую из переменных состояния объекта x(i,k), i=1,2,... ,s и на приращения управлений u(j ,k) ,j=1,2,..., r, т.е. u2(j,k)<U2(j,k); A(k)x(k) + B(k)u(k))2= x02(k+1)<x2(k+1).

Сформируем векторы ограничений x(k+1)=(x(1,k+1), x(2,k+1), ..., x(s,k+1))T, u(k)=(u(1,k),u(2,k), ..., u(r,k))T и лагранжиан

Lo(k)=||A(k)x(k)+B(k)u(k)||2Q+||u(k)||2R+||A(k)x(k)+ +B(k)u(k)||2Л2-||x(k+1)||2Л2+||u(k)||2Лl-||u(k)||2Лl, (24) где Л2 и Л2 — (sxs) и (rxr) — диагональные матрицы неотрицательных множителей Лагранжа. Для нахождения параметров алгоритмов управления и настройки множителей Лагранжа воспользуемся процедурой Эрроу-Гурвица-Удзавы. При этом u*(k)=-(BT(k)(1+Л(2,k))B(k)+R+Л(1,k))-1BT(k)(Q+ +Лk(2,k))A(k)x(k),

M1,k+1j)=k(1,k,j)+X(1,k,j)H-(1,k,j)u-2(j,k)(||uo(j,k)* *||2R-u2(j,k)), 0<p(1,k,j)<1, (25)

X(2,k+1)=X(2,k,x)+X(2,k)p(2,k)x-2(k+1)(||A(k)x(k)+ +B(k) Au* (k)| 12Q -x2(k+1)), 0<p(2,k)<1.

Как видно, в алгоритме (25) перестраиваются все элементы весовых матриц Q и R.

В ряде практических задач необходимо контролировать не энергетику сигналов, задаваемую квадратичными неравенствами, а соблюдение позиционных ограничений вида

umin<u(k)<umax(umin(j)<u(j,k)<umax(j),

xmin<A(k)x(k)+B(k)u(k)<xmax,

(xmin<x0(k+1)<xmax, xmto(x)<x0(k+1)<xmax).

Тогда, формируя лагранжиан

Lo(k)=||A(k)x(k)+B(k)u(k)||2Q+||u(k)||2R+ЛlT(umm-

-u(k))+Л2T(u(k)-umax)+Л3T(xmin-A(k)x(k)-B(k)u(k))+

+Л4T*A(k)x(k)+B(k)u(k)-xmax) (здесь Лі-Л4 — векторы настраиваемых множителей соответствующих размерностей) и оптимизируя его по u(k), ЛДф), i= 1, 2, 3, 4, получаем алгоритм вида

u*(k)=-(BT(k)QB(k)+R)-1(BT(k)(QA(k)x(k)+0.5^* *(4,k)-^3,k)))+0.5^(2,k)^(1,k))), Л(1,k+1)=[Л(1,k)+ц(1,k)(umin-uo(k))], Л(2,k+1)=[Л(2,k)+ц(2,k)(u*(k)-umax)], (26)

Л(3,k+1)= [\(3,k)+p(3,k)(xmin-A(k)x(k)-B(k)u*(k))], Л(4,k+1)=[Л(4,k)+ц(4,k)(A(k)x(k)-B(k)u*(k)-xmax)], где [Л]=max{0, Л} покомпонентно.

Необходимо заметить, что регулирование матриц Q и R в дополнительных контурах адаптации аналогично смене регуляторов на каждом такте управления. Это улучшает условия работы идентификаторов и устраняет необходимость подачи в канал управления пробных возмущений.

В ряде задач ограничения на фазовые переменные могут задаваться в виде систем линейных уравнений, например, M{Fx(k+1)}=f, где F-(sxs) — матрица, f— (sx1) — вектор.

При синтезе регулятора с нулевой матрицей Q рассмотренного ранее функционала качества необходимо в этом случае определить седловую точку лагранжиана

L(k)=M{uTR(k)u(k^T(Fx(k+1)-f)}, (27)

где Л-(8*1) — вектор неопределенных множителей Лагранжа.

Эта задача сводится к решению системы уравнений Куна-Такера:

V(u(k))L(k)=2R(k)u(k)+BTFTA=0,

V^(k))L(k)=FAx(k)+FBu(k)-f=0.

Закон управления при этом имеет вид u*(k)=-R-1(k)BTFT(FBR-1(k)BTFT)-1(FAx(k)-f). (28) Эта зависимость приобретает ясный физический смысл при единичной матрице F. В этом случае требуется обеспечить совпадение (или максимальную близость) компонент вектора состояний x(i,k+1) с компонентами внешнего задающего сигнала f(i) при минимуме энергетических затрат на управление. При этом

u*(k)=-R-1(k)BT(BR-1BT)-1(ax(k)-f), (29)

или (в адаптивном варианте) u*(k)=-R-1 (k)BT(k)(B(k)R-1BT(k))-1 (A(k)x(k)-f). (30)

Очевидно, что в одномерном случае (30) совпадает с известным адаптивным регулятором с минимальной дисперсией [1].

И, наконец, если F представляет собой векторстроку, т.е.

M{ ZF(i)x(i,k + 1)} = f, то

i =1

u*(k)=-(R-1(k)BTFT(FA(k)x(k)-f))/

/ (FB(k)R-1(k)BT(k)*FT), (31)

или (в адаптивном варианте)

u*(k)=-(R-1(k)BT(k)FT(FA(k)x(k)-f))/(FB(k)R-1*

*(k)BT(k)FT). (32)

РИ, 1998, № 2

55

Заключение

Предложенные алгоритмы позволяют осуществить субоптимальное управление линейными системами при наличии различных типов ограничений. В случае детерминированного управления синтезируемый регулятор может учитывать специфические требования к структуре матрицы обратной связи. При этом используются лишь классические методы решения матричных уравнений, что позволяет реализовать алгоритмы оптимизации и для систем высокого порядка. Численная реализация алгоритмов, предложенных для субоптимального управления стохастическими объектами, требует незначительного усложнения стандартных вычислительных процедур. Однако учет параметрических ограничений, характерных для многих практических приложений, существенно расширяет возможность применения синтезированных регуляторов.

Литература: 1. Изерман Р. Цифровые системы управления. М.: Мир, 1984. 544 с. 2. HejdaI, Murgas J. Riesenie LQ problemu pri zadanej strukture riadenia // Automatizace/ 1987.N8. S. 214-216. 3. Бодянский E.B., Манжак Е.Л., Удовенко С.Г. Алгоритмы адаптивного управления с ограничениями на фазовые переменные // Радиоэлектроника и информатика. 1997. N1. С. 65-67. 4. Бодянский E.B., Удовенко С.Г. Субоптимальное управление стохастическими процессами. X.: Основа, 1997. 140 с.

Поступила в редколлегию 21.05.98 Рецензент: д-р физ.-мат. наук, проф. Яковлев С.В. Удовенко Сергей Григорьевич, канд. техн. наук, доцент кафедры ЭВМ ХТУРЭ. Научные интересы: идентификация и оптимизация стохастических систем. Увлечения: иностранные языки, поэзия. Адрес: 310726, Украина, Харьков, пр. Ленина, 14, тел. 38-38-74.

УДК 621.317.377[088.8]

МЕТОД ИЗМЕРЕНИЯ ЧАСТОТЫ ГАРМОНИЧЕСКИХ СИГНАЛОВ, ОПТИМАЛЬНЫЙ ПО МИНИМУМУ СРЕДНЕКВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ

ЧИНКОВ B.H., ЯКОВЛЕВ м.ю.

Рассмотрен оптимальный по помехозащищенности метод измерения частоты гармонических сигналов, основанный на цифровой обработке сигнала по критерию минимума среднего квадратического отклонения. Он позволяет уменьшить время измерения, исключить одну из доминирующих составляющих инструментальной погрешности измерения и повысить универсальность создаваемых частотомеров. Предложены алгоритмы цифровой обработки сигнала и принцип построения цифрового вычислительного частотомера. Проведены оценки помехозащищенности полученного метода и методической погрешности, а также его сравнительный анализ с известными методами.

В настоящее время в перспективных разработках в области частотно-временных измерений предпочтение все больше отдают электронно-счетным частотомерам, основанным на методе последовательного или дискретного счета [1]. Такие частотомеры обладают наиболее высокими метрологическими характеристиками, но их существенным недостатком является низкая помехозащищенность. Она обусловлена используемым в них методом измерения, содержащим операцию выделения моментов перехода сигнала через фиксированный уровень, чаще всего через нуль. В этом случае при наличии помех в сигнале или в тракте измерительного прибора возникает дополнительная погрешность результата измерения, которая объясняется смещением или появлением побочных (“паразитных”) моментов перехода сигналов через нуль. Для повышения помехозащищенности электронно-счетных частотомеров в них применяют входные фильтры либо проводят статистическую обработку многократных наблюдений.

Но и тот и другой путь заметно увеличивают время измерений, что особенно существенно для низких и инфранизких частот, где даже минимальное время измерений, равное одному-двум периодам, может оказаться недопустимо большим.

Повышают оперативность измерения частоты ме -тоды, основанные на получении нескольких (двухтрех) отсчетов мгновенных значений гармонического сигнала и их последующей обработке [2]. К сожалению, они также имеют низкую помехозащищенность и большие инструментальные погрешности.

Оптимальный метод должен обеспечивать высокую помехозащищенность при заданном времени измерения. Этого можно достигнуть максимальным использованием для определения параметров сигнала (в данном случае частоты) всей содержащейся в нем информации, т.е. всех некоррелированных отсчетов мгновенных значений сигнала. Такой метод обеспечит и максимальную оперативность — наименьшее время измерения при заданной помехозащищенности.

Одним из них является метод определения частоты гармонического сигнала, основанный на критерии среднего квадратического отклонения (СКО).

Для аддитивной гауссовой помехи, некоррелированной с сигналом, использование этого метода приводит к минимуму дисперсии оценки при заданном уровне помехи и, следовательно, обеспечивает высокую помехозащищенность в результате применения при формировании оценки параметров всех некоррелированных мгновенных значений сигнала на временном интервале измерения. Этот временной интервал, в отличие от известных методов, может быть не кратным периоду сигнала и даже меньше периода. Кроме того, в предлагаемом методе измерения отсутствует операция выделения периода сигнала, что позволяет исключить одну из доминирующих составляющих инструментальной погрешности измерения.

Отметим, что для других видов помех предлагаемый метод не является оптимальным. Однако если помеха высокочастотна, то за счет фильтрации при интегрировании она в той или иной степени будет подавляться.

56

РИ, 1998, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.