Соотношения оптимальности в дискретной линейно-квадратичной задаче управления

Афонин Виктор Васильевич

ЭЛЕКТРОННЫЙ НАУЧНЫЙ ЖУРНАЛ «APRЮRI. CЕРИЯ: ЕСТЕСТВЕННЫЕ И ТЕХНИЧЕСКИЕ НАУКИ»

УДК 681.511.22

№ 2 2016

СООТНОШЕНИЯ ОПТИМАЛЬНОСТИ В ДИСКРЕТНОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧЕ УПРАВЛЕНИЯ

Афонин Виктор Васильевич

кандидат технических наук Мордовский государственный университет им. Н.П. Огарёва

Саранск

Аннотация. В данной статье рассматриваются соотношения оптимальности в дискретной линейно-квадратичной задаче управления. Соотношения оптимальности связывают между собой параметры объекта (матрицы А, В), функционала (матрицы Q, R) и регулятора (K).

Ключевые слова: дискретная система; функции MATLAB; квадратичный функционал; скалярное управление; матрицы объекта управления; весовые матрицы функционала.

THE RATIO OF OPTIMALITY IN DISCRETE LINEAR-QUADRATIC CONTROL PROBLEM

Afonin Victor Vasilievich

candidate of technical sciences Ogaryov Mordovia State University, Saransk

Abstract. This article discusses the optimal ratio in a discrete linear-quadratic control problem. The optimum ratio is associated with each other object parameters (matrix A, B), functional (matrix Q, R) and the regulator (K).

Key words: discrete-time systems; MATLAB functions; quadratic functional; scalar control; matrix management facility; the weight of the functional matrix.

В данной статье рассматривается задача определения соотношении оптимальности в дискретной линейно-квадратичной задаче управления. Подход к решению опирается на работы [1-3], в которых приводятся соотношения оптимальности в случае непрерывной линейно-квадратичной задачи управления. Модель объекта управления описывается разностными уравнениями. Дискретные задачи управления достаточно актуальные [4; 8]. Примеры решения задач схемотехники можно найти в [5-7].

В качестве среды и языка программирования выбран MATLAB R2015b, хотя можно использовать и более ранние версии.

Постановка задачи

Рассмотрим вполне управляемый объект управления, математическое описание которого дано в пространстве состояний в виде следующего векторного разностного уравнения:

Х[(к + 1 )Та] = А аХ[к Та] + Ва и[ кТа], ( 1 )

где Та - период дискретизации, или шаг квантования, Х[кТ] -п-мерный вектор состояния, И[кТ] - скалярный вектор управления, Аа -матрица состояния, матрица действительных чисел размера п*п, Ва -матрица входа, матрица действительных чисел размера п*1, к = 0, 1, 2, ... - номер шага квантования.

В силу того, что шаг квантования входит в обе части уравнения (1), то его обычно опускают, поэтому описание объекта управления в дальнейшем будем представлять в виде

[ ] [ ] [ ] ( )

Программный расчет матриц уравнения состояния в системе MATLAB дается, например, в [4]. Предполагается, что на управления

2

щ(к), ] = 1 ,2 ,. . .,г ограничения не наложены. Управление должно быть выбрано так, чтобы при произвольном начальном условии Х[0 ] минимизировать квадратичный функционал вида

00

! = У Хт [к]((Х[к] + ит[к] Ии[к],

(3)

где Q - симметрическая положительно-полуопределенная матрица действительных чисел размера пхп, Я - симметрическая положительно-определенная матрица действительных чисел размера гхг, Т - символ транспонирования.

Задача (1), (3) - это задача оптимальной стабилизации [8]. Решение задачи (1), (3) имеет вид [9]

где Р - (пхп) симметрическая положительно-определенная матрица, решение дискретного уравнения Риккати

ЛТаРАа -Р- (Л таРВа)(ВТРВа)(ВТРВа + И)-^Р ВТ) + (( = 0. (5 )

Коэффициент оптимального линейного регулятора в (4) обозначим через К

[ ] ( ) [ ]

( )

К = - (ВТР Вт + И )- 1 вТр В,

а-

( )

С учетом введенного обозначения (6) перепишем (4) в виде

где -

[ ] [ ]

постоянная матрица оптимального регулятора размера 1хп.

3

( )

Предполагается, что все переменные состояния доступны для измерения, а система (1) полностью управляема по Калману.

Объект (2), замкнутый на оптимальное управление (7), имеет следующее описание:

Х[к + 1 ] = (Л d - BdK)X[k]. (8)

В (8) собственные числа матрицы Ad - BdK будут располагаться в круге единичного радиуса комплексной плоскости корней, дискретная система (8) является асимптотически устойчивой [8].

Если к дискретной системе (8) приложить внешнее воздействие, которое обозначим П[к], то получим описание системы управления в виде

Х[к + 1 ] = (Ad - BdK)X[к] + BdÜ[k]. (9)

Равенство (9) можно записать в виде

Х[к + 1 ]= AdX[к] - BdKX[k] + BdП[к]. (1 0 )

Соответственно, в (10) результирующее входное воздействие имеет

вид

[ ] [ ] П[ ] ( )

Получим аналитическое соотношение оптимальности, подобное тому, которое приводится в работах [1-3].

Теорема. Для задачи (1), (3) с решением (4) справедливо следующее соотношение:

R = BTdSTQSBd + (Bd - BTdSTKTBTd)R(Bd - BdKSBd). (1 2 ) где ( ) .

Доказательство. В силу того, что оптимальная система (8) устойчивая, то при к — оо решение системы (9) будет стремиться к установившемуся значению, поэтому получим, Х[к + 1 ] = Х[к]. Следовательно, можно записать

Х[к] = (А т-ВтК)Х[к] + Вт и[ к]. Последнее равенство разрешим относительно вектора состояния:

Х[ к]-(Ат-ВтК)Х[ к] = Вт и[к]; [Е-(Ат-ВтК)]Х[к] = Вти[к]; [Е - (А т - ВтК)]-1 [Е - (А т - ВтК)]Х[к] = [Е - (А т - ВтК)]-1 В тЩк];

Х [к] = [Е-(Ат-ВтК)]-гВтП[к];

В последнем соотношении обратную матрицу обозначим через 5, т.е.

Б=[Е-(Ат- ВтК)]-1, (13)

где Е - единичная матрица размера пхп.

С учетом (13) будем иметь следующее выражение относительно вектора состояния:

Х[к]=БВтП[к ]. (14)

Соответственно, транспонируя обе части (14), получим

Хт[к] = ПТ[к]вТ5Т. (15)

Транспонируем обе части равенства (11):

ит[к] = ПТ[к]вТ-ХТ[к]КТвТ. (16)

В заданный квадратичный функционал (3) подставим значения векторов (11), (14)-(16) и выполним эквивалентные преобразования:

XT[k]QX[k] + UT[k]R U[k] = = UT[ k]BTST Q SBdU[k ] + ( UT[ k]BT - XT[ k]KTBT)R(Bd U[ k]-BdKX[ k]) =

= UT[k]BTdST QSBd U[k] + ( UT[k]BT - UT[k]BTdSTKTBT)R(BdU[k]-BdKSBTU[k]).

Вынесем за скобки UT[k] V[k], получим следующее выражение:

U [ ] [ ( ) ( )] U[ ] ( )

Поскольку в заданном функционале (3) между UT[k] и U[k] находится весовая матрица R, то с учетом (17), получаем

R = BdSTQSBd + (BT - bTst KT BT)R(B d - BdKSBd). ( 1 8 )

Полученное соотношение (18) завершает доказательство теоремы.

Очевидно, выполнение (18) связано с численными расчетами обратных матриц и алгебраическими операциями над матрицами. Все это может привести к определенным погрешностям. Кроме того, для дискретных систем заметное влияние оказывает шаг квантования.

Результаты численного эксперимента

Приведем численные расчеты, выполненные в системе MATLAB. В качестве исходных матриц дискретной системы принимаются матрицы, которые получаются в результате преобразования непрерывной системы по библиотечной функции c2d (convert model from continuous to discrete time). Матрицы состояния и входа непрерывной системы фор-

мируются по случайным законам randn(n) и rand(n,r), где n - размерность вектора состояния, r = 1 - размерность матрицы входа. Матрица выхода определена как матрица единиц, C = ones(2,n). Матрица обхода D принята нулевой. С помощью функции ss (convert model to state space) формируется объект, непрерывная линейная стационарная система управления, которая затем преобразуется в дискретную систему с помощью функции c2d. Извлечение матриц дискретной системы осуществляется с помощью функции dssdata. Расчет матрицы обратной связи выполняется с помощью функции dlqr. Весовую матрицу Q задавали с помощью функции галереи матриц: Q = gallery('toeppd', n). Для повторяемости результатов использована функция rng, например, rng(123).

Пример 1.

Размерность вектора состояния: 3 Размерность вектора управления: 1 R = 0.1230

Расчетное соотношение Rd = 0.1230720083 Оптимальное значение шага квантования: 0.0137861964 Максимальная абсолютная ошибка |R - Rd|: 0.0000720083 Евклидова норма norm(R - Rd): 0.0000720083 Пример 2.

Размерность вектора состояния: 16 Размерность вектора управления: 1 R = 0.1230

Расчетное соотношение Rd = 0.1230026893 Оптимальное значение шага квантования: 0.0002880094 Максимальная абсолютная ошибка |R - Rd|: 0.0000026893 Евклидова норма norm(R - Rd): 0.0000026893

Для примера 1 изменение нормы и расчетного соотношения в зависимости от шага квантования показано на рис. 1.

Пример 3.

Размерность вектора состояния: 19 Размерность вектора управления: 1 R = 10.1230

Расчетное соотношение Rd = 10.1194795020 Оптимальное значение шага квантования: 0.0023365746 Максимальная абсолютная ошибка ^ - Rd2|: 0.0035204980 Евклидова норма norm(R - Rd): 0.0035204980

0.18 г 0.16 -

«

Ь 0.14 -

■с ОС

0.12 -

0.1 -0

0.08

Рис. 1. Зависимость соотношения [ЗД и нормы от шага квантования Пример 4.

Размерность вектора состояния: 8 Размерность вектора управления: 1 R = 4.1230

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Расчетное соотношение Rd2 = 4.1224364378 Оптимальное значение шага квантования: 0.0130644159 Максимальная абсолютная ошибка ^ - Rd2|: 0.0005635622

1 "Г 1 1 1 1 —1 1 —11 _| Г" 1 1 -г 1 - 4-д Т- . —1 1 ----1 1 1 4_ _|

1 —1 —' 1 1 1 1 -1 1 1 1 и 1 1 1 Л 1 1 1 1 Х- Л 1 1 1 1

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08

т

Евклидова норма norm(R - Rd): 0.0005635622

Заключение. В статье было выполнено доказательство соотношения оптимальности в дискретной линейно-квадратичной задаче управления. Полученное соотношение - формула (18) аналитически связывает между собой параметры линейного стационарного объекта управления (матрицы Ad,Bd), весовые матрицы квадратичного функционала ( Q,R) и матрицу оптимального регулятора (К). Числовые расчеты показали справедливость полученного соотношения, но в тоже время оказывается, что результат может зависеть от шага квантования, от выбора весовых матриц квадратичного функционала.

Список использованных источников

1. Афонин В.В. Анализ и синтез систем управления для линейных и нелинейных объектов на основе разделения движений: дис. ... канд. техн. наук. Ленинград, 1984. 174 с.

2. Афонин В.В., Мурюмин С.М. Соотношения оптимальности в линейно-квадратичной задаче управления // Журнал Средневолжского математического общества. 2014. Т.16. № 2. С. 118-120.

3. Афонин В.В. Определение соотношения оптимальности в линейно-квадратичной задаче управления с обобщенным функционалом // APRIORI. Серия: Естественные и технические науки. 2016. № 1 [Электронный ресурс]. Режим доступа: http://apriori-journal.ru/seria2/ 1-2016/Afonin.pdf (Дата обращения: 28.03.2016).

4. Афонин В.В., Федосин С.А., Иконников С.Е. Основы теории управления: лабораторный практикум. Саранск: Изд-во Мордов. ун-та, 2008. 244 с.

5. Дубровин В.С., Зюзин А.М. Аналого-цифровой аддитивный формирователь сигнала треугольной формы. Патент на полезную модель: RUS 81859 24.11.2008.

6. Дубровин В.С., Никулин В.В. Аналого-цифровые способы формирования ортогональных сигналов // Методы и средства управления технологическими процессами: МСУТП-2007 матер. IV Междунар. конф. 2007. С. 234-237.

7. Дубровин В.С. Особенности применения корректирующих блоков для повышения линейности сигналов треугольной формы в функциональных генераторах // Журнал научных и прикладных исследований. 2016. № 2. С. 123-128.

8. Куо Б. Теория и проектирование цифровых систем управления: пер. с англ. М.: Машиностроение,1986. 448 с.

9. Медведев В.С., Потемкин В.Г. Control System Toolbox. MATLAB 5 для студентов. М.: Диалог-МИФИ, 1999. 287 с.

Соотношения оптимальности в дискретной линейно-квадратичной задаче управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Афонин Виктор Васильевич

Похожие темы научных работ по математике , автор научной работы — Афонин Виктор Васильевич

THE RATIO OF OPTIMALITY IN DISCRETE LINEAR-QUADRATIC CONTROL PROBLEM

Текст научной работы на тему «Соотношения оптимальности в дискретной линейно-квадратичной задаче управления»