2010
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика
№ 2(11)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.2
М.Ю. Киселева, В.И. Смагин
УПРАВЛЕНИЕ С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ С УЧЕТОМ ЗАПАЗДЫВАНИЯ ПО УПРАВЛЕНИЮ
Рассматривается задача синтеза прогнозирующего управления, построенного на основе слежении за выходом системы, с учетом запаздывания по управлению. При решении задачи управления с прогнозирующей моделью учитываются ограничения, накладываемые на состояние объекта и на управление. Прогнозирование осуществляется на основе вычисления оценок состояний объекта, построенных с использованием экстраполятора Калмана. Критерием качества является выпуклая квадратичная функция.
Ключевые слова: прогнозирующее управление, запаздывание, экстраполя-тор Калмана.
Одним из современных формализованных подходов к синтезу систем управления, базирующихся на математических методах оптимизации, является теория управления динамическими объектами с использованием прогнозирующих моделей - Model Predictive Control (MPC).
Этот подход начал развиваться в начале 60-х годов XX века для управления процессами и оборудованием в нефтехимическом и энергетическом производстве, для которых применение традиционных методов синтеза было крайне затруднено в связи с исключительной сложностью их математических моделей. В последнее время область применения MPC значительно расширилась, охватывая технологические отрасли [1] и экономику при управлении производством [2, 3], при решении задач управления запасами [4] и портфелем ценных бумаг [5].
Основным достоинством MPC-подхода, определяющим его успешное использование в практике построения и эксплуатации систем управления, служит относительная простота базовой схемы формирования обратной связи, сочетающаяся с высокими адаптивными свойствами. Последнее обстоятельство позволяет управлять многомерными и многосвязными объектами со сложной структурой, оптимизировать процессы в режиме реального времени в рамках ограничений на управляющие и управляемые переменные, учитывать неопределенности в задании объектов и возмущений. Кроме того, возможен учет запаздываний, поскольку зачастую решение об управлении принимается в момент времени t - h, а реализация этого решения происходит в момент времени t.
Результаты настоящей статьи обобщают работу [6] на случай запаздываний по управлению.
1. Постановка задачи
Пусть имеется объект, который в пространстве состояний описывается системой линейных разностных уравнений вида
х+1 = А + ви -к + ^, хо = хо; (!)
у = нх + V; ()
у = ^, (3)
где xt е Rn - состояние объекта; ut е Rm - управление (ut = й(, t = -к, -к+1,..., -1,
й - заданные значения); yt е Rp - выход; уt е Rг - наблюдение; к - величина запаздывания.
Далее будем полагать, что случайные возмущения wt и шумы измерения V не коррелированны между собой и подчиняются гауссовскому распределению с нулевым средним и с соответствующими ковариациями
М} = Щл, М{уЛт } = Щ,к
где 5t к - символ Кронекера.
Ограничения на векторы состояния и управления зададим в виде
а1 < 5^ < а2 ; (4)
ф1 (Х/) < ^й-к < ф2(Х/), (5)
где 51 и 52 - структурные матрицы, состоящие из нулей и единиц и определяющие компоненты векторов X/: и и, на которые накладываются ограничения; а1, а2, ф1(х() и ф2(х/) - заданные постоянные векторы и вектор-функции соответствующих размерностей.
Задача состоит в том, чтобы по наблюдениям ^ определить стратегию управления, при которой вектор выхода системы у. будет близок к заданному вектору
у/ с учетом ограничений (4), (5).
2. Построение прогнозирующего управления
Поскольку случайные возмущения wt и шумы измерения имеют гауссовское распределение, то можно синтезировать алгоритм оптимального прогнозирования поведением объекта и вектором выхода, используя экстраполятор Калмана [7]. Пусть хи и уи - оценки состояния и вектора выхода в момент времени /,
вычисляющие информацию с/-го момента времени,/ < /. Тогда
х/+1|/ = Ах/|/-1 + Ви/-к + к/ (У/ - Нх/|/-1 ), у+1|/ = Gxt+1|/ , к' = ар/н т ( нрн т + V)-1,
Р/+1 = ж+арА - аР/Нт (щнт + V)-1 нрА , Ро = Рхо. (6)
Указанное выражение для Р{ известно как разностное уравнение Риккати с дискретным временем, Р^ - начальное значение дисперсионной матрицы.
Из уравнений (6) можно построить прогнозируемые оценки вектора состояния и вектора выхода системы для моментов t+2,..., t+N:
Xt+i+1\t = A Xt+,\t + But-h+it , xi|0 = x0 , i = 1N ; ()
yt+,\t = G Xt+,\t , i = 1N • ()
Здесь ut-h+i\t - управление, используемое для прогнозирования, ut-h+i - действующее управление в момент t+i, N - горизонт прогнозирования.
Используя уравнение (7), запишем следующие соотношения:
Xt + 2|t = AXt+1t + But —h+1|t , xt+3\t = Axt+2\t + But—h+2\t = A(Axt+1\t + But—h+1t) + But— h+2\t = A2-^t+lt + ABut—h+1\t + But—h+2\t ,
*,+# = А'-1 х+ц, + £ А]-к-1вЩ-^ ' = 2,Ж . (9)
£=1
Аналогично может быть представлено и уравнение (8). Важно заметить, что каждый прогнозируемый вектор выхода - это функция только от начального состояния х(щ и будущих управляющих сигналов и-Й+1-|»:
ум|» = & хм»,
у + 21» = + 21» = °(АХ»+11» + ВиI-Й+1|» ) = °АХ» +1|» + °ВИ-Й+Ш ,
У+y\t
= GA]—1X
t+1\t
j—1
+ G £ Aj—k—1 Bm, к=1
t—h+k\t
j = 2, N •
(10)
Приведенные уравнения для прогнозируемых векторов состояния и выхода могут быть записаны в векторно-матричной форме. Для этого введем следующие обозначения:
■ En - " G "
xt+1t " yt+1\t" Mt—h+1jt A GA
XXt = , Y = , Ut —h = , ^ = A2 , Л = 2 A G
_ Xt+N\t _ _yt+N\t _ Mt —h+N\t
_ AN—1 _ — A G 1 1
- 0 0 0 ... 0" " 0 0 0 .. . 0"
B 0 0 - 0 GB 0 0 •• • 0
р = AB B 0 - 0 , Ф GAB GB 0 •• • 0 ,
B — • ^ A B — • ^ A 1 ... B 0 gan— 2 B GAN—3 B - GB 0
(11)
где Еп - единичная матрица размера п*п. Тогда прогнозирующая модель (9), (10) примет вид
X,= РП,-й ,
Yt= Лх+т+ ф^—h
(12)
3. Синтез прогнозирующего управления
Для решения поставленной задачи в качестве целевой функции используется
критерий
у+к к Ущс + —к+ кк иг—к+к
(13)
где матрицы С > 0 и Б > 0 - весовые матрицы.
В случае, когда желаемая отслеживаемая траектория управления у+к не известна для к > 0, целесообразно считать у+к = у. Это означает, что заданный уровень устанавливается постоянным в течение всего времени прогнозирования. Преобразуем целевую функцию (13). Введем вектор
У+1
уг+N
Тогда с учетом (12) получим
1 N 2 1|Г -||2
2 ^^||Уг+к!г — уг|| = — ^к|с =
2 к=1 с 2
1
= 2и— кФТСФ^—к + и]—ь[ФТСЛХ^ — ФТС¥(] + с, .
Здесь с1 - постоянная составляющая, которая не зависит от и-к и х,+1, вид
С =
(14) а С имеет
Аналогично
1 N
2 И
2 к=1
г—к+ш иг—к+к—1!г
" С 0 : 0
0 С : 0
_ 0 0 : С
2
Б 1 иТ 2 г нБи{—
,Би, —к + с2
(15)
где с2 - постоянная, не зависящая от иг-к+к (к = 1, N), Б представляется в виде
" 2Б —Б 0 ! 0
—Б 2Б —Б \ 0
Б =
—Б 2Б —Б 0 —Б 2Б
Таким образом, с учетом (14), (15) целевая функция запишется следующим образом:
^ (г) = 2 и^и,—к + и*А/+сз;
(16)
где сз есть линейная комбинация с и с2, а матрица ^ и вектор / определяются соотношениями
^ = ФтСФ + В, / = Г
КІ+1|,
Вы
і-к
о
Г = [фтСЛ -ФтС] .
Аналитическое решение данной задачи без учета ограничений с использованием формул векторно-матричного дифференцирования [8]
т 4 - т й гг АХВ _ т т ё 1г АХ в
получится из условия
уАу = гг Ауу
ёХ
= АтВт
ёХ
= ВА
дП,
д/
= 0:
і-к
дП-к дП, -к
2 П]-к¥П,-к + Пт-к/ + с
гТ
=1 д»г Щ ^.) +М±/> = ] + / = 0. (17)
2 диг—к диг—к 2
В силу симметричности матрицы Е уравнение (17) можно представить в виде
ЕЦ-* + / = 0.
Решение этого уравнения определяется выражением
П*-к =-(ФТСФ + В)-1(ФтСЛх,+1, -ФтСУ,)-
^ Вы,-к Л о
V 0 ,
что позволяет наити оптимальное прогнозирующее управление
Ы*-к+1|, = (Еп 0 •” 0)П*-к .
о
3. Моделирование управления экономической системы
В качестве примера рассмотрен вариант экономической системы [3, 6], предназначенной для производства, хранения и поставок товаров потребителям:
Ъ+1 = АЪ + Фг—к +^, ?0 = ^
Хг+1 = 2г+ВЬ—к —Фг—к +Сг, Х0 = z0, (18)
где е В?, д,,г - количество товаров /-го типа у потребителя в момент времени г
(г = 1, Т, / = 1,5); - количество товаров /-го типа на складе производителя; -
объем производства товаров /-го типа; ф^ - объем поставок товаров /-го типа; к -величина запаздывания (целое число), - векторные гауссовские случайные
последовательности с характеристиками М{ ^ } = 0, М{ } = 0, М{^^ } = Е5г к,
М{<^Ск } = к, М{^} = 0; А и В - матрицы, определяющие динамику производства и потребления. В модели (18) случайные векторы ^учитывают ошибки, возникающие из-за погрешностей при задании модели.
В каждый момент времени ґ должны выполняться ограничения
гтт < ^ < ^тах, 0 < Юґ_й < Ютах, 0 < ф»_й < 2г.
(19)
Переменные и рассматриваются как управляющие воздействия, и их значения при t = -к, -к+1,..., -1 заданы. Задача состоит в том, чтобы по наблюдениям определить стратегию управления производством, хранением и поставками товаров, обеспечивающую количество товаров у потребителя ць близкое к заданному вектору д , с учетом ограничений вида (19).
Модель экономической системы (18) сводится к модели (1) при п = 25 с ограничениями (4), (5), если ввести следующие обозначения:
, Щ_к = Ч _к" , А = " А 0 " , В = " Е, 0" , ^ = г' , W = "Е 0"
_ 7 _ _к _ _ 0 Е,_ __ Е, В _ _Сґ _ _ 0
«1 = ^тт, «2 = ^тах, ^ = [0 Е, ] , ф^Х ) = 0 , ^ =
Е, 0
0 Е,
ф2(X ) =
Оптимизационная задача решается на каждой итерации для прогнозированных значений вектора состояния. При решении задачи минимизации критерия (16) численно с использованием системы МаІЇаЬ [9] необходимо преобразовать ограничения к векторно-матричному виду. Тогда ограничение на объем производства ю( _к+\ _ к < ютах для расширенной системы определяется неравенством
Яіиґ_я < Ею„
ограничение на объем поставки фґ
< 7
к+і\ґ _к — _к+і\ґ_ к
запишется в виде
^2^_к < ^1^Хґ_к+1\ґ_к + ^1Р^_2к Так как Юґ_к+і \ ґ_к > 0 и Фґ_к+і\ґ_к > 0, то
и - к > 0.
Ограничения 71
*ґ+і\ґ < 7тах
^ґ+і\ґ > 7т1П задаются неравенствами
Кіриґ_к < Е7тах _ЪЧЪ+и-
_Я1Риґ_к < _Е7тіп + ^і^ІГґ+і\ґ .
(20)
(21)
(22)
(23)
(24)
В (20), (21), (23), (24) матрицы Я1, Я2, Е выражаются следующим образом:
"0 Е, 0 0 0 0 " " Е, 0 0 0 0 0 " " Е,'
ъ = 0 0 0 Е, • 0 0 , Ъ = 0 0 Е, 0 • 0 0 , Е = Е,
_ 0 0 0 0 Е,_ _ 0 0 0 • Е 0_ _ Е, _
Моделирование проведено для следующих исходных данных:
А =
' 0,75 0 '
_0,25 0,9
В =
0,3 0,1' 0,2 0,8
0,1'
0,1
0,8 0,2 0 1
®тах 0,7 , 70 = 0,2 , ?0 = 0 , ч = 2
X =
7 =
тіп
7
к =1, N=8, Н = Е4, W = 0, V = ^{0,0005; 0,0005; 0,0005; 0,0005}.
Результаты численного моделирования приведены в виде графиков переходных процессов на рис. 1 - 3.
ф1, *1
Рис. 1. Динамика изменения количества товаров у потребителя
ф2, *2
0,4
0,3
0,2
0,1
0
Рис. 2. Динамика изменения количества товаров на складе и объемов поставок
1,5
*1
1 2 -
; Хф1 .*1 шт 0,5 /Ф2
: /*2 ш^п
0 -■
) 5 10 15 20 25 0 5 10 15 20 25
Рис. 3. Процессы изменения объемов производства товаров
Моделирование экономического объекта подтвердило работоспособность алгоритма. Показано, что цель достигается, ограничения на переменные управления и состояния в условиях запаздывания в контуре управления выполняются.
Заключение
Получено решение задачи синтеза прогнозирующего управления выходом дискретного объекта, с запаздыванием по управлению с учетом ограничений в форме неравенств. Для вычисления прогнозируемых значений используется экст-раполятор Калмана.
ЛИТЕРАТУРА
1. Camacho E.F., Bordons C. Model predictive control. London: Springer-Verlag, 2004. 405 p.
2. Параев Ю.И. Решение задач об оптимальном производстве, хранении и сбыте товара // Изв. РАН. Теория и системы управления. 2000. № 2. C. 103 - l07.
3. Перепелкин Е.А. Прогнозирующее управление экономической системой производства, хранения и поставок товаров потребителям // Экономика и математические методы. 2004. Т. 40. № 1. С. 125 - 128.
4. AggelogiannakiE., DoganisPh., SarimveisH. An Adaptive Model Predictive Control configuration for Production-Inventory Systems // International Journal of Production Economics. 2008. V.114. P. 165 - 178.
5. Домбровский В.В., Домбровский Д.В., Лященко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2006. № 12. C. 71 - 85.
6. Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник ТГУ. Управление, вычислительная техника и информатика. 2009. № 2(7). C. 24 - 30
7. Браммер К., Зиффлинг Г. Фильтр Калмана - Бьюси. М.: Наука. 1972. 200 с.
8. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3 - 15.
9. Смагин В.И. Пакет прикладных программ Matlab 5.3: учеб. пособие. Томск: Изд-во Том. ун-та, 2006. 123 с.
Киселева Марина Юрьевна
Смагин Валерий Иванович
Томский государственный университет
E-mail: kiselevamy@gmail.com; vsm@mail.tsu.ru Поступила в редакцию 19 декабря 2009 г.