ЭЛЕКТРОННЫЙ НАУЧНЫЙ ЖУРНАЛ «APRЮRI. CЕРИЯ: ЕСТЕСТВЕННЫЕ И ТЕХНИЧЕСКИЕ НАУКИ»
УДК 681.511.22
№ 2 2016
СООТНОШЕНИЯ ОПТИМАЛЬНОСТИ В ДИСКРЕТНОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧЕ УПРАВЛЕНИЯ
Афонин Виктор Васильевич
кандидат технических наук Мордовский государственный университет им. Н.П. Огарёва
Саранск
Аннотация. В данной статье рассматриваются соотношения оптимальности в дискретной линейно-квадратичной задаче управления. Соотношения оптимальности связывают между собой параметры объекта (матрицы А, В), функционала (матрицы Q, R) и регулятора (K).
Ключевые слова: дискретная система; функции MATLAB; квадратичный функционал; скалярное управление; матрицы объекта управления; весовые матрицы функционала.
THE RATIO OF OPTIMALITY IN DISCRETE LINEAR-QUADRATIC CONTROL PROBLEM
Afonin Victor Vasilievich
candidate of technical sciences Ogaryov Mordovia State University, Saransk
Abstract. This article discusses the optimal ratio in a discrete linear-quadratic control problem. The optimum ratio is associated with each other object parameters (matrix A, B), functional (matrix Q, R) and the regulator (K).
Key words: discrete-time systems; MATLAB functions; quadratic functional; scalar control; matrix management facility; the weight of the functional matrix.
В данной статье рассматривается задача определения соотношении оптимальности в дискретной линейно-квадратичной задаче управления. Подход к решению опирается на работы [1-3], в которых приводятся соотношения оптимальности в случае непрерывной линейно-квадратичной задачи управления. Модель объекта управления описывается разностными уравнениями. Дискретные задачи управления достаточно актуальные [4; 8]. Примеры решения задач схемотехники можно найти в [5-7].
В качестве среды и языка программирования выбран MATLAB R2015b, хотя можно использовать и более ранние версии.
Постановка задачи
Рассмотрим вполне управляемый объект управления, математическое описание которого дано в пространстве состояний в виде следующего векторного разностного уравнения:
Х[(к + 1 )Та] = А аХ[к Та] + Ва и[ кТа], ( 1 )
где Та - период дискретизации, или шаг квантования, Х[кТ] -п-мерный вектор состояния, И[кТ] - скалярный вектор управления, Аа -матрица состояния, матрица действительных чисел размера п*п, Ва -матрица входа, матрица действительных чисел размера п*1, к = 0, 1, 2, ... - номер шага квантования.
В силу того, что шаг квантования входит в обе части уравнения (1), то его обычно опускают, поэтому описание объекта управления в дальнейшем будем представлять в виде
[ ] [ ] [ ] ( )
Программный расчет матриц уравнения состояния в системе MATLAB дается, например, в [4]. Предполагается, что на управления
2
щ(к), ] = 1 ,2 ,. . .,г ограничения не наложены. Управление должно быть выбрано так, чтобы при произвольном начальном условии Х[0 ] минимизировать квадратичный функционал вида
00
! = У Хт [к]((Х[к] + ит[к] Ии[к],
(3)
где Q - симметрическая положительно-полуопределенная матрица действительных чисел размера пхп, Я - симметрическая положительно-определенная матрица действительных чисел размера гхг, Т - символ транспонирования.
Задача (1), (3) - это задача оптимальной стабилизации [8]. Решение задачи (1), (3) имеет вид [9]
где Р - (пхп) симметрическая положительно-определенная матрица, решение дискретного уравнения Риккати
ЛТаРАа -Р- (Л таРВа)(ВТРВа)(ВТРВа + И)-^Р ВТ) + (( = 0. (5 )
Коэффициент оптимального линейного регулятора в (4) обозначим через К
[ ] ( ) [ ]
( )
К = - (ВТР Вт + И )- 1 вТр В,
а-
( )
С учетом введенного обозначения (6) перепишем (4) в виде
где -
[ ] [ ]
постоянная матрица оптимального регулятора размера 1хп.
3
( )
Предполагается, что все переменные состояния доступны для измерения, а система (1) полностью управляема по Калману.
Объект (2), замкнутый на оптимальное управление (7), имеет следующее описание:
Х[к + 1 ] = (Л d - BdK)X[k]. (8)
В (8) собственные числа матрицы Ad - BdK будут располагаться в круге единичного радиуса комплексной плоскости корней, дискретная система (8) является асимптотически устойчивой [8].
Если к дискретной системе (8) приложить внешнее воздействие, которое обозначим П[к], то получим описание системы управления в виде
Х[к + 1 ] = (Ad - BdK)X[к] + BdÜ[k]. (9)
Равенство (9) можно записать в виде
Х[к + 1 ]= AdX[к] - BdKX[k] + BdП[к]. (1 0 )
Соответственно, в (10) результирующее входное воздействие имеет
вид
[ ] [ ] П[ ] ( )
Получим аналитическое соотношение оптимальности, подобное тому, которое приводится в работах [1-3].
Теорема. Для задачи (1), (3) с решением (4) справедливо следующее соотношение:
R = BTdSTQSBd + (Bd - BTdSTKTBTd)R(Bd - BdKSBd). (1 2 ) где ( ) .
Доказательство. В силу того, что оптимальная система (8) устойчивая, то при к — оо решение системы (9) будет стремиться к установившемуся значению, поэтому получим, Х[к + 1 ] = Х[к]. Следовательно, можно записать
Х[к] = (А т-ВтК)Х[к] + Вт и[ к]. Последнее равенство разрешим относительно вектора состояния:
Х[ к]-(Ат-ВтК)Х[ к] = Вт и[к]; [Е-(Ат-ВтК)]Х[к] = Вти[к]; [Е - (А т - ВтК)]-1 [Е - (А т - ВтК)]Х[к] = [Е - (А т - ВтК)]-1 В тЩк];
Х [к] = [Е-(Ат-ВтК)]-гВтП[к];
В последнем соотношении обратную матрицу обозначим через 5, т.е.
Б=[Е-(Ат- ВтК)]-1, (13)
где Е - единичная матрица размера пхп.
С учетом (13) будем иметь следующее выражение относительно вектора состояния:
Х[к]=БВтП[к ]. (14)
Соответственно, транспонируя обе части (14), получим
Хт[к] = ПТ[к]вТ5Т. (15)
Транспонируем обе части равенства (11):
ит[к] = ПТ[к]вТ-ХТ[к]КТвТ. (16)
В заданный квадратичный функционал (3) подставим значения векторов (11), (14)-(16) и выполним эквивалентные преобразования:
XT[k]QX[k] + UT[k]R U[k] = = UT[ k]BTST Q SBdU[k ] + ( UT[ k]BT - XT[ k]KTBT)R(Bd U[ k]-BdKX[ k]) =
= UT[k]BTdST QSBd U[k] + ( UT[k]BT - UT[k]BTdSTKTBT)R(BdU[k]-BdKSBTU[k]).
Вынесем за скобки UT[k] V[k], получим следующее выражение:
U [ ] [ ( ) ( )] U[ ] ( )
Поскольку в заданном функционале (3) между UT[k] и U[k] находится весовая матрица R, то с учетом (17), получаем
R = BdSTQSBd + (BT - bTst KT BT)R(B d - BdKSBd). ( 1 8 )
Полученное соотношение (18) завершает доказательство теоремы.
Очевидно, выполнение (18) связано с численными расчетами обратных матриц и алгебраическими операциями над матрицами. Все это может привести к определенным погрешностям. Кроме того, для дискретных систем заметное влияние оказывает шаг квантования.
Результаты численного эксперимента
Приведем численные расчеты, выполненные в системе MATLAB. В качестве исходных матриц дискретной системы принимаются матрицы, которые получаются в результате преобразования непрерывной системы по библиотечной функции c2d (convert model from continuous to discrete time). Матрицы состояния и входа непрерывной системы фор-
мируются по случайным законам randn(n) и rand(n,r), где n - размерность вектора состояния, r = 1 - размерность матрицы входа. Матрица выхода определена как матрица единиц, C = ones(2,n). Матрица обхода D принята нулевой. С помощью функции ss (convert model to state space) формируется объект, непрерывная линейная стационарная система управления, которая затем преобразуется в дискретную систему с помощью функции c2d. Извлечение матриц дискретной системы осуществляется с помощью функции dssdata. Расчет матрицы обратной связи выполняется с помощью функции dlqr. Весовую матрицу Q задавали с помощью функции галереи матриц: Q = gallery('toeppd', n). Для повторяемости результатов использована функция rng, например, rng(123).
Пример 1.
Размерность вектора состояния: 3 Размерность вектора управления: 1 R = 0.1230
Расчетное соотношение Rd = 0.1230720083 Оптимальное значение шага квантования: 0.0137861964 Максимальная абсолютная ошибка |R - Rd|: 0.0000720083 Евклидова норма norm(R - Rd): 0.0000720083 Пример 2.
Размерность вектора состояния: 16 Размерность вектора управления: 1 R = 0.1230
Расчетное соотношение Rd = 0.1230026893 Оптимальное значение шага квантования: 0.0002880094 Максимальная абсолютная ошибка |R - Rd|: 0.0000026893 Евклидова норма norm(R - Rd): 0.0000026893
Для примера 1 изменение нормы и расчетного соотношения в зависимости от шага квантования показано на рис. 1.
Пример 3.
Размерность вектора состояния: 19 Размерность вектора управления: 1 R = 10.1230
Расчетное соотношение Rd = 10.1194795020 Оптимальное значение шага квантования: 0.0023365746 Максимальная абсолютная ошибка ^ - Rd2|: 0.0035204980 Евклидова норма norm(R - Rd): 0.0035204980
0.18 г 0.16 -
«
Ь 0.14 -
■с ОС
0.12 -
0.1 -0
0.08
Рис. 1. Зависимость соотношения [ЗД и нормы от шага квантования Пример 4.
Размерность вектора состояния: 8 Размерность вектора управления: 1 R = 4.1230
Расчетное соотношение Rd2 = 4.1224364378 Оптимальное значение шага квантования: 0.0130644159 Максимальная абсолютная ошибка ^ - Rd2|: 0.0005635622
1 "Г 1 1 1 1 —1 1 —11 _| Г" 1 1 -г 1 - 4-д Т- . —1 1 ----1 1 1 4_ _|
1 —1 —' 1 1 1 1 -1 1 1 1 и 1 1 1 Л 1 1 1 1 Х- Л 1 1 1 1
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
т
Евклидова норма norm(R - Rd): 0.0005635622
Заключение. В статье было выполнено доказательство соотношения оптимальности в дискретной линейно-квадратичной задаче управления. Полученное соотношение - формула (18) аналитически связывает между собой параметры линейного стационарного объекта управления (матрицы Ad,Bd), весовые матрицы квадратичного функционала ( Q,R) и матрицу оптимального регулятора (К). Числовые расчеты показали справедливость полученного соотношения, но в тоже время оказывается, что результат может зависеть от шага квантования, от выбора весовых матриц квадратичного функционала.
Список использованных источников
1. Афонин В.В. Анализ и синтез систем управления для линейных и нелинейных объектов на основе разделения движений: дис. ... канд. техн. наук. Ленинград, 1984. 174 с.
2. Афонин В.В., Мурюмин С.М. Соотношения оптимальности в линейно-квадратичной задаче управления // Журнал Средневолжского математического общества. 2014. Т.16. № 2. С. 118-120.
3. Афонин В.В. Определение соотношения оптимальности в линейно-квадратичной задаче управления с обобщенным функционалом // APRIORI. Серия: Естественные и технические науки. 2016. № 1 [Электронный ресурс]. Режим доступа: http://apriori-journal.ru/seria2/ 1-2016/Afonin.pdf (Дата обращения: 28.03.2016).
4. Афонин В.В., Федосин С.А., Иконников С.Е. Основы теории управления: лабораторный практикум. Саранск: Изд-во Мордов. ун-та, 2008. 244 с.
5. Дубровин В.С., Зюзин А.М. Аналого-цифровой аддитивный формирователь сигнала треугольной формы. Патент на полезную модель: RUS 81859 24.11.2008.
6. Дубровин В.С., Никулин В.В. Аналого-цифровые способы формирования ортогональных сигналов // Методы и средства управления технологическими процессами: МСУТП-2007 матер. IV Междунар. конф. 2007. С. 234-237.
7. Дубровин В.С. Особенности применения корректирующих блоков для повышения линейности сигналов треугольной формы в функциональных генераторах // Журнал научных и прикладных исследований. 2016. № 2. С. 123-128.
8. Куо Б. Теория и проектирование цифровых систем управления: пер. с англ. М.: Машиностроение,1986. 448 с.
9. Медведев В.С., Потемкин В.Г. Control System Toolbox. MATLAB 5 для студентов. М.: Диалог-МИФИ, 1999. 287 с.