Научная статья на тему 'Линейно-квадратические дискретно-непрерывные системы с управляемыми коэффициентами'

Линейно-квадратические дискретно-непрерывные системы с управляемыми коэффициентами Текст научной статьи по специальности «Математика»

CC BY
54
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНО-НЕПРЕРЫВНЫЕ СИСТЕМЫ / МАГИСТРАЛЬНЫЕ РЕШЕНИЯ / МЕТОД ГЛОБАЛЬНОГО УЛУЧШЕНИЯ / ОПТИМАЛЬНЫЙ СИНТЕЗ УПРАВЛЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Расина Ирина Викторовна, Батурина Ольга Владимировна

Рассматривается частный случай дискретно-непрерывных систем (ДНС): линейно-квадратические по состоянию ДНС с управляемыми коэффициентами. Для указанного класса систем строится аналог метода глобального улучшения Кротова, последняя итерация которого дает решение в форме приближенно-оптимального синтеза управления. Полученный результат можно трактовать как развитие теории аналитического конструирования оптимальных регуляторов (АКОР) применительно к ДНС. Приводится иллюстративный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Линейно-квадратические дискретно-непрерывные системы с управляемыми коэффициентами»

УДК 517.977

И. В. Расина, О. В. Батурина

Линейно-квадратические дискретно-непрерывные системы с управляемыми коэффициентами

Аннотация. Рассматривается частный случай дискретно-непрерывных систем (ДНС): линейно-квадратические по состоянию ДНС с управляемыми коэффициентами. Для указанного класса систем строится аналог метода глобального улучшения Кротова, последняя итерация которого дает решение в форме приближенно-оптимального синтеза управления. Полученный результат можно трактовать как развитие теории аналитического конструирования оптимальных регуляторов (АКОР) применительно к ДНС. Приводится иллюстративный пример.

Ключевые слова и фразы: дискретно-непрерывные системы, метод глобального улучшения, оптимальный синтез управления, магистральные решения.

Введение

Наряду с традиционными исследованиями в теории оптимального управления наблюдается постоянный интерес к моделям управления системами неоднородной структуры, систематические исследования которых начаты еще в 1960-е-1970-е гг. В различных публикациях эти системы фигурируют под разными названиями: системы переменной структуры [1], дискретно-непрерывные системы [2], логико-динамические системы [3,4], импульсные системы [5], гибридные системы [6, 7]. Однако для подобных систем классические методы оптимального управления непосредственно неприменимы. Один из возможных подходов к исследованию задач оптимального управления для систем неоднородной структуры состоит в обобщении для

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований: проекты 14-31-50894 мол_нр «Разработка и исследование алгоритмов оптимизации линейных динамических систем с управляемыми коэффициентами», 15-01-01923 А «Конструктивные методы оптимизации управления системами неоднородной структуры». © И. В. Расина( , О. В. Батурина( , 2015

© Институт программных систем имени А. К. Айламазяна РАН, 2015 © Институт проблем управления имени В. А. Трапезникова РАН, 2015 © Программные системы: теория и приложения, 2015

них достаточных условий оптимальности Кротова [8]. В [9] сформулированы общие условия оптимальности для абстрактной динамической системы как многошаговой, операторы которой на разных шагах допускают различную интерпретацию. В [2,10-12] предложена и развита математическая модель дискретно-непрерывной системы (ДНС) в виде конкретизации указанной абстрактной модели [9], применимая для широкого класса задач управления неоднородными процессами, и для нее получен аналог достаточных условий Кротова для непрерывных и дискретных систем. Как и в случае однородных систем, получение закона управления в форме синтеза для ДНС при численной реализации вызывает серьезные трудности, связанные с «проклятием размерности». Для преодоления этих сложностей в теории управления принято разделять задачу управления на два больших этапа:

(1) поиск оптимальной (либо вообще некоторой желаемой) временной программы управления,

(2) построение приближенно оптимального синтеза управления с обратной связью в окрестности этой программы с целью ее реализации на основе упрощенной модели объекта, допускающей аналитическое или близкое к нему достаточно простое решение.

Соответствующее направление, связанное с решением задачи (2), получило интенсивное развитие как теория аналитического конструирования оптимальных регуляторов (АКОР) в работах А.М. Лето-ва [13,14], Р. Калмана [15] и в ряде других публикаций, где исходная модель заменяется неким линейно-квадратическим приближением.

В данной работе рассматривается модель линейно-квадратиче-ской ДНС как частный случай общей модели [12], и для нее строится аналог метода глобального улучшения управления [12], позволяющий получить решение в форме приближенно-оптимального синтеза. В отличие от работ [13, 14] предлагается линейно-квадратическое приближение функций Кротова-Беллмана и обобщенного лагранжиана Кротова в окрестности реализуемой программной траектории, как для итерационного поиска оптимальной программы, так и для приближенно-оптимального синтеза в ее окрестности, который автоматически находится по окончании итерационного процесса. Полученный результат можно рассматривать как развитие теории АКОР для ДНС в рамках иного подхода к задачам АКОР, предложенного в [16]. В заключение приведены результаты вычислительных экспе-

риментов на методическом примере.

1. Линейно-квадратические дискретно-непрерывные процессы и основные конструкции

Рассматриваемая модель ДНС представляет собой двухуровневую управляемую систему. На верхнем уровне фигурирует дискретная модель

(1) х°(к + 1) = х°(к) + -а(к,и)1х12 + Ъ(к,и), х0 е М,

(2) х(к + 1)= А(к,и)х(к) + В(к,и), х е Мт(к),

к е К = [кг, кг + 1,..., кр}, и е и(&, х) с Мг(к),

где к — номер шага (этапа), не обязательно физическое время, и(к,х) — заданное при каждом к и х множество, а(к,и), Ь(к,и) — заданные функции, А(к,и), В(к,и) — матрицы размеров т(к) х т(к), т(к) х 1 соответственно.

На некотором подмножестве К' с К, кр е К' действует непрерывная система нижнего уровня

(3) Xс0 = 1 ас(г,ис)1хс12 + ъс(г,ис), хс0 е М,

(4) хс = Ас(г,ис)хс + вс(г,ис), Xе е Мп(к),

Ь е Т (г) = [Ъ(г),1р(г)],

Xе е хс(г,г) с Мп(к), ис е ис (г,г,хс) с Мр(к), г = (к,х),

ас(1,ис), Ъс(Ъ,ис) — заданные функции, Ас(Ь,ис), Вс(Ь,ис) — матрицы размеров п(к) х п(к), п(к) х 1.

Оператор правой части (1) имеет вид

х(к + 1) = в(к)хс(к,гР), к е К',

хс(Ь[) = £(к)х, где через в обозначены матрицы соответствующих размеров. Здесь г = (к, х) — совокупность переменных верхнего уровня, играющая на нижнем уровне роль параметров.

Решением этой двухуровневой системы считается набор т = (х(к),и(к)), где при к е К': и(к) = тс(к), тс(к) е ~Ос(г(к)), (называемый линейно-квадратическим дискретно-непрерывным процессом), где тс(к) — непрерывный процесс (хс(к,Ь), ис(к,1)), Ь е Т(^(^)), а &с(г) — множество допустимых процессов тс удовлетворяющих

указанной дифференциальной системе (3)-(4) при кусочно-непрерывных ис{к,Ь) и кусочно-гладких хс{к,Ь) (на каждом дискретном шаге к).

Будем рассматривать для модели (1)-(4) задачу оптимального управления как задачу о минимуме функционала I = х0{кр) на множестве О решений т при фиксированных к[ = 0, кр, х (к[) и дополнительных ограничениях х{к) € Х{к).

В общем случае достаточные условия оптимальности для такой задачи получены в [12]. Функции Кротова р, зададим в виде

<р = фт {к)х + 1 хта{к)х — х°,

Vе = фсТ(к,г)хс + 1 хсТас (к,г)хс — хс0,

где ф{к), фс{к,Ь) — вектор-функции, а &{к), ас{к,Ь) — матрицы соответствующих размеров. При этом основные конструкции общих достаточных условий для рассматриваемой задачи имеют вид:

С = фт {кр )х + 1 хта{кр )х, К = фт{к + 1){А{к,и)х{к) + В{к,и)) — х0{к)—

— 1 а{к, м)|ж|2 — Ь{к, и) +

1 т

+ - {А{к, и)х{к) + В{к, и))т а{к + 1) {А{к, и)х{к) + В{к, и)) —

— фт{к)х — 1 хта{к)х,

сс = —фт{к + 1)в{к)хс{к,гР) — 1{в{к)хс{к,гР ))т а{к)в{к)хс{к,гР)+

+ фт{к)х + 1 хта{к)х + Фст{кр )хс{к,гр) — фст {к£ )£{к)х+

+ 1 хст{к,гР )ас {к,гР )хс{к,гР) — 1{^{к)х)тас{к,гт )ф)х, Кс = хст{фс + ас{к,г)){Ас{г,ис)хс + Вс{г,ис))—

— 1 ас{г,ис)1хс12 — Ъс{г,ис) + Ф стхс + 1 Хст & с{к,г)хс,

ь = с — £ д + £

К\К'\й^ К'

Сс — I КСА

Здесь Ь — обобщенный лагранжиан, который на множестве О, как показано в [12], совпадает с исходным функционалом I. В соответствии с общей процедурой [12] решение поставленной задачи сводится к исследованию на экстремум введенных конструкций по указанным аргументам при каждом к, Ь.

2. Метод глобального улучшения

В работах [17,18] был предложен метод глобального улучшения управления, его аналог для ДНС получен в работе [12], а модификации для линейных ДНС и билинейного случая в [19, 20]. Для однородных процессов один из возможных подходов к реализации указанного метода дан в [21]. Рассмотрим далее его модификацию для класса линейно-квадратических ДНС (1)-(4), но предварительно укажем исходные предпосылки.

Предположим, что X(k) = Шт(к), Xc(z,t) = Шп(к), t/ = т (z), tp = -&(z), ki, xi и kp — заданы, xcF G Rn(fc).

Задан элемент то1 G D и требуется найти элемент то11 G D такой, что I (то11) < I (то1). Функции <р (к,х (к)) ,<fc (z,t,xc) найдем из условий:

(5) R (к,х(к),и1 (к)) ^ min,

X

(6) G (х) ^ max,

(7) Rc (z, t, xc (к, t), ucl (к, t)) ^ min,

(8) Gc (z,Zc(tF,z)) - j Rc(z(k),t,ic(t,z),ucl(k,t))dt ^ max,

T(z)

где xc(t, z) — результат операции в (7). Минимизация и максимизация производится по областям, где ожидается прохождение улучшенной траектории. Такие области, как правило, известны в практических приложениях.

Эти условия могут быть выполнены неоднозначно и оставляют значительную свободу выбора функций р и Если потребовать, чтобы левые части в этих условиях не зависели от х, хс, то получится дискретно-непрерывная цепочка относительно р, описываемая

уравнениями типа Беллмана, не содержащими операции поиска максимума по и, ис и, следовательно, линейными относительно

(9) <р {к,х) = у (к + 1(к,х {к) ,и1{к))) , к € К\К'\^,

(10) у {кР,х) = —^ {х), <р° = —Нс {г,г,хс,^гхс),

Нс (г,г,хс,ис1,р) = рт!с (г,г,хс,ис1) ,

(11) {г,1р,хср) = <р {к +1,9 {г,хср)),

(12) у {к,х) = {г,т {г) {г)), к € К',

которая разрешается в порядке следования от кр к к[. Пусть

й{k,x)=arg тах Д {к,х {к) ,и {к)),

иеи(к,х)

IIе {z,t,xc)=arg тах В° {г,Ь,хс,ис). исеис(г,г,хс)

Тогда из заданной дискретно-непрерывной системы и начальных условий при полученных управлениях находятся функции х11{к), хс11 {к, Ь) и программы управлений:

и11 {к) = и (к,х11 {к)) , ис11 {к,г) = йс (к,г,хи{к),хс11{к,г)) ,

т.е. элемент т11. Повторяя итерационно эти операции, получим улучшающую последовательность {т8}.

Теорема 1. Для элементов т1 и т11 справедливо неравенство I (т1) > I (т11).

Доказательство. Покажем, что I (тп) — I (т1) < 0. Имеем I (т11) — I (ш1) = Ь (т11, ^, Vе1) — Ь (т1, ^ ,^с1) = = С {х11^1) — С {х1,?1) — ^ (Я (к,х11 {к) ,у11 {к),у1) —

К\К'\ кР

— К (к, х1 {к), и1 {к),^)) + ^ (Сс (г11 {к), у1, Vе1) —

К'

— сс (г1 {к), Vе1)) — I (Кс (г11{к), г, Xе11{г), и011{г), <рс1) —

— Кс (г1{к),г,хЛ{г), ис1 {г),^, )) аъ = Аг — А2 + Аз — А4. где Аг = С (ж1 ^ — С (ж1) < 0 в силу условия (6).

При этом

Д2 = ^ (К (к, х11 (к) ,ип (к) ,<р1) - К (к,х1 (к) У (к) У)) = К\К'\кр

= ^ (К (к, х11 (к) ,и11 (к) - Я (к, х11 (к) У (к) ,<р1)) + К\К'\кР

+ ^ (К (к, X11 (к) ,и1 (к),ср1) - К (к,х1 (к) ,и1 (к) У)) > 0 К\К'\ кР

согласно (5). Далее имеем

Дз = £ {Сс (г11 (к), р1, У) - Сс (г1 (к), У <рс1)) < 0

К'

и

Д4 = I (г11(к),г,хс11 (г),ис11(г),^1,^с1) -

-Кс (г1(к),г,хс1(г),ис1(г),^1,^с1)) аъ = = I (Кс (г11(к),г,хс11 (г),ис11(г),^1,^с1) -

-Кс (г11(к),г, хс11(г),ис1(г), <р\ ^с1)) аъ+

+ I (Кс (г11(к),г,хс11(г),ис1(г),^1,^с1) -

Т(г)

-Кс (г1(к),г,хс1(г),ис1(г),^1,^с1)) ¿г > о

в силу условий (7), (8). Тогда

I (т11) - I (т1) = Д1 - Д2 +Д3 - Д4 < 0.

Вернемся к исходной задаче и рассмотрим соотношения (9)—(12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

более подробно. Из указанных равенств получаем:

13) ф{кр ) = 0, а{кр )=0,

14) ф{к) = Ат{к, и1 )'ф{к + 1) + Ат{к, и1 )а{к + 1)В{к, и1),

15) (г{к)= Ат{к,и1 +1)А{к,и1) — а{&У)£, & € К\К',

16) фс = Аст{г,ис1 + асВс{г,ис1),

17) ст с = — а^,«01 )Я + а сАст{г,ис1),

18) Фс{к,гр ) = вт{к)ф{к), ас{к,гР ) = вта{к)в,

19) Ф{к)= £,тф°{к +1,^), а{к)= £тас{к +1,^% к € К'.

Замечание 1. Если уравнения (1), (3) содержат линейные слагаемые:

х°{к + 1) = х°{к) + а°{к,и)х + 1 а{к,и)1х12 + Ъ{к,и),

хс0 = ас0{г, ис)хс + 1 ас{г, ис)1хс12 + ъс{г, ис),

где аР{к,и), ас0{Ь,ис) — вектор-функции строки, то уравнения для ф, фс примут вид:

ф{к) = —Еа0т + Ат{к, и1 )ф{к + 1) + Ат{к, и1 )а{к + 1)В{к, и1),

фс = —Еас0т + Аст{г, и01 )фс + Вст{г, иА)ас.

Нетрудно видеть, что выражения для поиска функций и, йс пополнятся дополнительными слагаемыми.

Таким образом, алгоритм метода состоит из следующих этапов:

1. Задается элемент ТО.

2. Справа налево решаются системы уравнений (13)—(19) относительно вектор-функций ф, фс и матриц а, ас.

3. Находятся функции и, йс из условий

u(k,x) = arg max \ф(к +1)т) В(к,и) — Ь(к,и)+

ueU(k,x) V /

+ - (А(к)х(к) + В(к, и))т <г(к + 1)(А(к)х(к) + В(к,и)),

йс (z,t,xc) = arg max ((фc(k,t) + ас(k,t)xc)TBc(t,uc) — bc(t,uc)).

uceUc(z,t,xc) V /

4. Полученные управления подставляются в исходную ДНС. Тем самым находится элемент ТО1.

Подчеркнем тот факт, что управления и, йс зависят от переменных состояний верхнего и нижнего уровней линейно-квадратическим образом, т.е. дают решение в форме приближенного синтеза оптимального управления. Такую форму решения можно рассматривать как один из видов АКОР для ДНС. При этом, в отличие от традиционной задачи АКОР, которая получается при линейно-квадратической аппроксимации исходной нелинейной задачи по состоянию и управлению, здесь рассматривается аппроксимация только по состоянию, а управление остается нелинейным, ограниченным исходным множеством, что позволяет использовать имеющиеся ресурсы управления полностью.

Процесс итераций заканчивается при выполнении условия

1^+1 - I <£,

где е — заданная точность вычислений.

Заметим, что если функционал ограничен снизу, то построенный итерационный процесс сходится по функционалу. Действительно, в силу теоремы 1 алгоритм генерирует монотонную по функционалу улучшающую последовательность, которой соответствует монотонно убывающая числовая последовательность 18 = I(те), сходящаяся, как известно из анализа, к некоторому пределу I*.

Пример 1. Рассматривается нелинейная задача:

х1 = (х2)2(х2 - 1)2 + (г - 1)х2 + х2и, х2 = и, ж1(0) = 0, х2(0) = 0,

М< 2, 0 < г < 2, I = х1(гР) ^ М, гр =2.

Эта задача при предположении, что управление не ограничено, сводится к производной задаче (первого порядка) [22-24]:

(20) у=(х2)2(х2 - I)2 + (г - 1)х2, у = х1 - 1(х2)2,

I = {ур+2,(х1)2) ^ ш,

которая решается непосредственно минимизацией правой части и функционала по новому управлению. Нетрудно видеть, что правая часть указанного уравнения — выпуклая функция по переменной х2 и, следовательно, ее минимум достигается в стационарной точке.

а) г = 0.4, б) г = 1, в) г = 1.4,

хтт = -0.6629404488 х2тп = 0, 1 х2тп = -0.0305372597

Рис. 1. Графики х2 для некоторых £

Рис. 2. Идеальная магистраль и начальное приближение

Для его поиска при фиксированном Ь с некоторым шагом на отрезке [0, 2] находился минимум функции (х2)2(х2 — 1)2 + (I — 1)х2. На рис. 1 представлены графики х2 для некоторых значений Непосредственно из выражения функционала следует, что его минимум достигается на управлении х2р = 0. Тем самым получается идеальное магистральное решение исходной задачи с кусочно-непрерывной функцией х2(Ь) в качестве управления. Это решение модифицируется естественным образом — заменой в окрестностях точек разрыва решениями уравнения х2 = и при |м| < 2. Получается кусочно-гладкая функция х2(Ь), используемая далее как начальное приближение в итерационной процедуре минимизации функционала (рис. 2).

Производится тейлоровская линейно-квадратическая аппрокси-

2

мация исходной системы по х2 в окрестности траектории текущей в-й итерации:

(21) х1 = а{г) + ъ{г){х2 — х2{г)) + 1ф){х2 —х2{г))2 + х2и, х2 = и, жх{0)=0, х2{0) = х20, |м|< 1, 0 <г< 2,

а{г) = {х2)2{х2 — 1)2 + {г — 1)х2,

ъ{г) = 2х2{Х2 — 1){2х2 — 1) + г — 1, ф) = 2{{2х2 — 1)2 +2х2{х2 — 1)).

Преобразованная система допускает аналогично исходной нелинейной переход к производной системе с использованием того же преобразования у = х1 — 1 {х2)2:

(22) у = а{1) + Ъ{1){х2 — х2М) + \ф){х2 — х23{1))2.

Если присоединить уравнение х2 = и, то получится удобная запись системы (21) в новых переменных {у, х2), где управление входит лишь в одно уравнение.

Для последовательного улучшения приближенного магистрального решения представим его как дискретно-непрерывный процесс, предполагая, что его структура по итерациям не меняется. Будем рассматривать tр {к) как дискретное управление и1. В данном случае К' = К\кр = 0,..., 4. Векторы переменных верхнего (дискретного) уровня обозначим через х, и, а нижнего (непрерывного) уровня — через хс, ис. Будем иметь:

х1{к + 1)=и1, х1{к) Ки1 Ки^, к € К', и1^ = 2, х1{0) = 0. При к = 2, 4:

=х2{к), х}2 =х3{к), = ЬО{хс2 — х22®) + 2ф){хс2 — х?®)2, хс2 =ис, Ь€ [х1{к), и1 {/г)], х2{к + 1) = дср{к), х3{к + 1) = хс^°{к), 1ис1< 2.

При к = 1, 3:

Чс! = х2(к), г € [х1(к), и1(к)\,

чс = ътхс2 - хс2(к,г)) +1 ф)(хс2 - х22(г))2, 1 2

х2(к + 1) = дср(к) - - {хс2(к)) , х3(к + 1)= и2(к),

2

ъ(г) = 2х2(х2 - 1)(2х2а - 1) + г - 1, ф) = 2((2х2а - 1)2 +2x2(*2 -1)).

Переменная хс1(к,Ь) находится по формуле хс1 = дс + а + хс2 - и2, а(1) = (х22)2(х22-1)2 +(Ъ- 1)х22. Здесь переменная дс введена с целью преобразования линеаризованной модели к виду, рассмотренному в теории.

Заданы начальные условия и минимизируемый функционал:

ж1(0)=0, х2(0) = 0, ж3(0) = х3, I = х2(5).

Обратим внимание, что на разных этапах используются разные непрерывные системы: на четных этапах — исходная преобразованная система, а на нечетных — производная.

Соответствующая ДНС для сопряженных переменных ф, фс, а, ас имеет следующий вид.

При к = 2, 4: ф(5) = 0, а(5) =0, ф = (ф1, ф2,ф3), фс = (фс1, фс2), а, ас — матрицы размера 3 х 3, 2 х 2, £ = (0,1,1),

ф(к)= Сфс (к + 1,Ь), а(к)= £Тас(к + 1,1! %

'/.с Т^ггл гл I _с/п 1 \Т

Ф с(к,1Р) =

010 0 0 1

ф(к), ас(к,гр ) =

&с = -сЕ

"0 1 0"

0 01

г(к)

00 10 01

При к = 1, 3:

фс = -Ъ, &с = -с, фс(к,гр ) = ф2(к), ас(к,гр ) = а22(к), ф(к)= £фс(к +1,1!), а(к)= ^Тас(к +1,1!)£, С =(0, 1, 0).

Здесь а22 — элемент матрицы а.

Управляющие воздействия находятся по приведенным ниже формулам.

Таблица 1. Изменение функционала по итерациям

№ итерации Значение функционала

0 -0.285436

1 -0.296333

2 -0.300289

3 -0.300284

При к = 2, 4:

и1 (к, х) = argшax(ф1 (к + 1)и1 +

+ ^(и1, Яр (к), х%)а(к + 1)(и1, дср (к), х*2)т, ис (г,г,хс) = ^тах(фс + ас(дс,хс2))Т(дс,ис)т(фс+ + ас(дс, хс2)), 1ис1< 2,

где дс = Ъ(г)(хс2 -хС2(к, г)) + 2ф)(хс2 -х^2(г))2.

При к = 1, 3:

и1 (к, х) = argшax(ф1(к + 1)и1 + ^(и1, сСр(к)-

- 2(хС2(к))2,и2)а(к +1)(и1, Чср(к) - 2(хС2(к))2,и2)Т), и2 (к, х) = argшax(ф3(к + 1)и2 + и1, дср(к)-

- 2(хр (к))2, и2)а(к +1)(и1, Чср(к) - 2(хС2(к))2,и2)Т), ис (х,1,хс) = хс2 = ащшах(-Ь(г)(хс2 - хс2(г))-

- \ф)(хс2 -хс2(г))2).

Расчеты проводились предложенным в работе алгоритмом. В качестве начального приближения использовалась траектория, приведенная на рис. 2. Решение получено за 3 итерации. Соответствующие управления и траектория х2(1) приведены на рис. 3, 4. Изменение функционала по итерациям дано в таблице 1.

Для сравнения эта же задача в исходной постановке без преобразования к ДНС и специального выбора начального приближения была решена тем же методом при начальном приближении управления и(Ь) =0 на всем заданном отрезке времени. Близкое решение

-начальная

итерация

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-последняя

итерация

при и(()=0

0.5

1 1.5

Г

2

0

Рис. 3. Управление на начальном приближении и на итерациях

Рис. 4. Траектория х2 на начальном приближении и на итерациях

со значением функционала I = -0.302669 получено за 85 итераций. Траектория и управление также приведены на рис. 3, 4 и носят аналогичный характер.

3. Заключение

Таким образом, в работе предложена математическая модель линейно-квадратической по состоянию ДНС с управляемыми коэффициентами, для которой дана конкретизация общих достаточных условий оптимальности и построен метод глобального улучшения

управления с линейно-квадратическими функциями Кротова. Доказана теорема об улучшаемости начального приближения.

Этот метод особенно эффективен для вырожденных задач оптимального управления с магистральными решениями, широко распространенных на практике. Это подтверждается проведенными вычислительными экспериментами на тестовом примере. Найденное начальное приближение в магистральной форме дало значительный эффект по сравнению с традиционным случайным выбором начального приближения из множества допустимых управлений.

Список литературы

[1] С. В. Емельянов (ред.). Теория систем с переменной структурой, Наука, М., 1970 t 21.

[2] В. И. Гурман. «К теории оптимальных дискретных процессов», Автоматика и телемеханика, 1973, №6, с. 53-58 t 21, 22.

[3] С. Н. Васильев, «Теория и применение логико-управляемых систем», Труды 2-ой Международной конференции «Идентификация систем и задачи управления», SICPRO'03, 2003, с. 23-52 t 21.

[4] А. С. Бортаковский, «Достаточные условия оптимальности управления детерминированными логико-динамическими системами», Информатика. Сер. Автоматизация проектирования, т. 2—3, ВНИИМИ, М., 1992, с. 72-79 t 21.

[5] Б. М. Миллер, Е. Я. Рубинович, Оптимизация динамических систем с импульсными управлениями, монография, Наука, М., 2005, 429 с. t 21.

[6] J. Lygeros. Lecture Notes on Hybrid Systems, University of Cambridge, Cambridge, 2003, 70 pp. t 21.

[7] A. J. Van der Shaft, H. Schumacher. An Introduction to Hybrid Dynamical Systems, Springer-Verlag, London, 2000, 176 pp. t 21.

[8] В. Ф. Кротов, В. И. Гурман. Методы и задачи оптимального управления, Наука, М., 1973, 448 с. t 22.

[9] В. Ф. Кротов. «Достаточные условия оптимальности для дискретных управляемых систем», ДАН СССР, 172:1 (1967), с. 18-21 t 22.

[10] В. И. Гурман, И. В. Расина. «Дискретно-непрерывные представления импульсных решений управляемых систем», Автоматика и телемеханика, 2012, №8, с. 16-29 t 22.

[11] И. В. Расина. «Дискретно-непрерывные модели и оптимизация управляемых процессов», Программные системы: теория и приложения, 2011, №5(9), с. 49-72, URL http://psta.psiras.ru/read/ psta2011_5_49-72.pdf t 22.

[12] И. В. Расина. «Итерационные алгоритмы оптимизации дискретно-непрерывных процессов», Автоматика и телемеханика, 2012, №10, с. 3-17 t 22, 24, 25.

[13] A.M. Летов. «Аналитическое конструирование регуляторов, II», Автоматика и телемеханика, 21:5 (1960), с. 561-568 4 22.

[14] А. M. Летов. Динамика полета и управление, Наука, M., 1969, 360 с. t 22.

[15] R. Kalman. "Contributions to the theory of optimal control", Bul. Soc. Mech. Ma,t., б (1960), pp. 102-119 t 22.

[16] В. И. Гурман, И. В. Расина. «Улучшение и приближенно-оптимальный синтез управления в окрестности опорной траектории», Автоматика и телемеханика, 2011, №12, с. 24-37 t 22.

[17] В. Ф. Кротов, И. Н. Фельдман, «Итерационные методы решения экстремальных задач», Моделирование технико-экономических процессов, Изд-во Mосковского экономико-статистического института, M., 1978, с. 22-35 t 25.

[18] В. Ф. Кротов, И. Н. Фельдман. «Итерационный метод решения задач оптимального управления», Изв. АН СССР. Техн. киберн., 1983, №2, с. 160-168 t 25.

[19] И. В. Расина, О. В. Батурина. «Оптимизация линейных по состоянию дискретно-непрерывных систем», Автоматика и телемеханика, 2013, №4, с. 80-90 t 25.

[20] И. В. Расина, О. В. Батурина. «Оптимизация управления в билинейных системах», Автоматика и телемеханика, 2013, №5, с. 102-113 4 25.

[21] В. И. Гурман, Е. А. Трушкова. «Приближенные методы оптимизации управляемых процессов», Программные системы: теория и приложения, 2010, №4(4), с. 85-104, URL http://psta.psiras.ru/read/ psta2010_4_85-104.pdf t 25.

[22] В. И. Гурман, M. К. Ни. «Вырожденные задачи оптимального управления, I», Автоматика и телемеханика, 2011, №3, с. 36-50 " 29.

[23] В. И. Гурман, M. К. Ни. «Вырожденные задачи оптимального управления, II», Автоматика и телемеханика, 2011, №4, с. 57-70 29.

[24] В. И. Гурман, M. К. Ни. «Вырожденные задачи оптимального управления, III», Автоматика и телемеханика, 2011, №5, с. 32-46 29.

Рекомендовал к публикации

д.т.н. В. И. Гурман

Об авторах:

Ирина Викторовна Расина

г.н.с. Исследовательского центра системного анализа Института программных систем им. А. К. Айламазяна РАН,

д.ф.-м.н., специалист в области моделирования и управления гибридными системами, автор и соавтор более 100 статей и 5 монографий.

e-mail: irinarasina@gmail.com

Ольга Владимировна Батурина м.н.с. Института проблем управления им. В. А. Трапезникова РАН, к.ф.-м.н., область научных интересов — дискретно-непрерывные системы, методы улучшения управления.

e-mail: ol.baturina@mail.ru

Пример ссылки на эту публикацию:

И. В. Расина, О. В. Батурина. «Линейно-квадратические дискретно-непрерывные системы с управляемыми коэффициентами», Программные системы: теория и приложения, 2015, 6:1(24), с. 21-37. URL http://psta.psiras.ru/read/psta2015_1_21-37.pdf

Irina Rasina, Olga Baturina. Linear quadratic discrete-continuous systems with controllable coefficients.

Abstract. It is considered a special case of discrete-continuous systems (DCS): linear-quadratic DCS w.r.t. state variables with controllable coefficients. For this class of systems a prototype of Krotov iterative global improvement method is constructed. Its last iteration gives a solution in the form of approximate optimal control synthesis. The obtained result can be treated as development of optimal analytical controllers design theory with application to DCS. A visual example is considered. (In Russian).

Key Words and Phrases: discrete-continuous system, global improvement method, optimal control synthesis, turnpike solutions.

Sample citation of this publication

Irina Rasina, Olga Baturina "Linear quadratic discrete-continuous systems with controllable coefficients", Program systems: theory and applications, 2015, 6:1(24), pp. 21-37. (In Russian.)

URL http://psta.psiras.ru/read/psta2015_1_21-37.pdf

© I. V. Rasina(1, O. V. Baturina(2, 2015

© Ailamazyan Program System Institute of RAS(1, 2015

© ICS V. A. Trapeznikov of RAS(2, 2015

© Program systems: Theory and Applications, 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.