Научная статья на тему 'Метод улучшения дискретно-непрерывных систем на основе сужения класса допустимых управлений'

Метод улучшения дискретно-непрерывных систем на основе сужения класса допустимых управлений Текст научной статьи по специальности «Математика»

CC BY
83
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИБРИДНЫЕ СИСТЕМЫ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ВЫРОЖДЕННЫЕ ЗАДАЧИ / ПРОИЗВОДНАЯ СИСТЕМА / HYBRID SYSTEMS / OPTIMAL CONTROL / SUFFICIENT OPTIMALITY CONDITIONS / MATHEMATICAL MODEL / DEGENERATE PROBLEMS / DERIVED SYSTEM

Аннотация научной статьи по математике, автор научной работы — Расина Ирина Викторовна, Даниленко Ольга Владимировна, Гусева Ирина Сергеевна

Рассматривается один из классов широко распространенных на практике систем неоднородной структуры: дискретно-непрерывные системы (ДНС). Для них строится модификация метода глобального улучшения, при условии сужения множеств допустимых управлений, что позволяет не использовать для учета ограничений на управления метод штрафов. Приводится иллюстративный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method for Improving Discrete-Continuous Systems Based on Restriction of the Class of Admissible Controls

The article deals with one of the widely applied classes of heterogeneous systems discrete-continuous systems. A modification of the global improvement method with restriction of the sets of admissible controls is constructed. This allows not to use the penalty method to account restrictions on controls. We give an illustrative example.

Текст научной работы на тему «Метод улучшения дискретно-непрерывных систем на основе сужения класса допустимых управлений»

УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ

УДК 519.977.5

doi: 10.18101/2304-5728-2017-3-10-20

МЕТОД УЛУЧШЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНЫХ СИСТЕМ НА ОСНОВЕ СУЖЕНИЯ КЛАССА ДОПУСТИМЫХ УПРАВЛЕНИЙ1

© Расина Ирина Викторовна

доктор физико-математических наук, доцент, главный научный сотрудник Институт программных систем им. А. К. Айламазяна РАН Россия, 152021, Ярославская область, Переславский район, с. Веськово, ул. Петра Первого, 4а E-mail: [email protected]

© Даниленко Ольга Владимировна

кандидат физико-математических наук, старший научный сотрудник Институт проблем управления им. В. А. Трапезникова РАН Россия, 117997, г. Москва, Профсоюзная, 65 E-mail: [email protected]

© Гусева Ирина Сергеевна

кандидат физико-математических наук, старший преподаватель Бурятский государственный университет Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: [email protected]

Рассматривается один из классов широко распространенных на практике систем неоднородной структуры: дискретно-непрерывные системы (ДНС). Для них строится модификация метода глобального улучшения, при условии сужения множеств допустимых управлений, что позволяет не использовать для учета ограничений на управления метод штрафов. Приводится иллюстративный пример.

Ключевые слова: гибридные системы; оптимальное управление; достаточные условия оптимальности; математическая модель; вырожденные задачи; производная система.

Введение

Как показала практика, существует целый класс управляемых процессов, который не может быть описан одной системой дифференциальных уравнений на рассматриваемом периоде времени. Для таких процессов характерна смена описаний в терминах управляемых дифференциальных систем, т. е. неоднородность структуры описания. Примерами могут слу-

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты 15-01-01915 А, 15-01-01923 А, 15-07-09091 А).

жить космические перелеты с одной планеты на другую, развитие биологических популяций, движение роботов, процессы химического производства. Подходы к построению их математических моделей и исследованию, а также используемая терминология весьма разнообразны. В литературе они фигурируют как системы переменной структуры [1], дискретно-непрерывные системы [2], логико-динамические системы [3; 4], импульсные системы [5], гибридные системы [6]. Одна из возможных схем исследования задач оптимального управления для систем неоднородной структуры состоит в обобщении для них достаточных условий оптимальности Кротова [8; 9]. В [2; 10-12] предложена математическая модель дискретно-непрерывной системы (ДНС), применимая для широкого класса задач управления неоднородными процессами, получены достаточные условия оптимальности типа Кротова и построен аналог метода глобального улучшения управления [12], позволяющий получить решение в форме приближенно-оптимального синтеза.

В данной работе предлагается модификация указанного метода, основанная на параметрическом сужении множеств допустимых управлений, что позволяет не использовать для учета ограничений на последние метод штрафов, а свести задачу к параметрической минимизации функционала.

1. Модель дискретно-непрерывной системы

Пусть задана абстрактная дискретная управляемая система [9]

х{к + \) = /{к,х{к)Лк)\ кеК = {к1,к1+\,...,кР}, (1) где к — номер шага (этапа), не обязательно физическое время, х и и — соответственно переменные состояния и управления, / — оператор. Все указанные объекты — произвольной природы (возможно, различной) для различных к, и {к, х), — заданное при каждом к их множество,

к^кр — начальный и конечный шаги соответственно. На некотором подмножестве К' с К , кР <£К\ действует непрерывная система нижнего уровня

хс=^ = г(2,(,х%ис), (еТ(2) = [(1(2)М^)1 (2)

хс е Xе(г,0 с Жи(Ч ис е ис (г,^,хс) с г = (к,х,ий).

Оператор правой части (1) имеет вид /[к, х,и) = в (г, ус), где

Г(2) = (гс : и = ф), х; = 4(2), ((Р,хср)е Гр(г)}.

Здесь 2 = {к,х,иа^ —совокупность переменных верхнего уровня, играющих на нижнем уровне роль параметров, иа — переменная управления произвольной природы, (1 = т(г), хсг = ^(г) — заданные функции г.

Решением этой двухуровневой системы считается набор

11

т = (х{к), и(к)) , где при кеК':

и(к) = {и'1 (к),тс(к)), тс(к) е Вс (г(£)) (называемый дискретно-непрерывным процессом), где тс(к) — непрерывный процесс (хс(к^), ис(к,ф, teT(z(k)), а Ос(г) — множество допустимых процессов т°, удовлетворяющих указанной дифференциальной системе (2) с дополнительными ограничениями при кусочно-непрерывных ис(к,() и кусочно-гладких хс(к.1) (на каждом дискретном шаге к). Совокупность элементов т, удовлетворяющих всем вышеперечисленным условиям, обозначим через В и назовем множеством допустимых дискретно-непрерывных процессов.

Для модели (1), (2) рассматривается задача о поиске минимума на £)

функционала / = 1<(х(к1 )) при фиксированных к1= 0, кР=К, х(к7) и дополнительных ограничениях

х(к)еХ(к), /еГ(г,(), (3)

Х(к), Xе (г.!) — заданные множества.

Заметим, что модель (1), (2) удобна для представления неоднородных управляемых процессов. Ее нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. Взаимодействие с каждой подсистемой нижнего уровня осуществляется через границу этой подсистемы и соответствующего непрерывного процесса у°.

2. Достаточные условия улучшения и оптимальности управления

Достаточные условия оптимальности для такой модели получаются по аналогии с условиями Кротова для дискретных и непрерывных систем следующим образом. Из ограничений множеств И и I) исключаются дискретная цепочка и дифференциальная система и вводятся

функционалы <р (к, х), <рс (г,!, хс ^ . Последний можно рассматривать как

параметрическое семейство функций от аргументов хс с параметром г ,

которые считаются непрерывными и по крайней мере непрерывно-

дифференцируемыми по этим аргументам, где г = {к,х{к^,иа [к^.

Кроме того, рассматривается обобщенный лагранжиан по аналогии с лагранжианами Кротова для дискретных и непрерывных систем:

Ь = С(х{кЕ))~ 2 «(*)) +

К\К'Хкр

+^{Сс{2{к1Г{2{к)))- J Rc{z{k\ty{Kt\uc(Kt))dt\

К' T{z(k))

G(x) = F(x) + q>(kF,x)-(p(kI,x(kI)), R(k,x,u) = q>(k + l,f(k,x,u))-(p(k,x),

Gc(zy) = -(p(k + l,e(zy)) + (p(k,x) + (pc(z,tp,xcp)-

Rc (z, t, x\ uc) = q>pc (z, t, x\ uc) + q>°t (z, t, xc). ¡uc (z, t) = sup {Rc (z, t, xc, uc) : xc g Xе (z, t), uc gUc(z, t, xc)}, Г (z) = inf {Gc (z, f) -,f g r(z), xc g Xc(z,tp)},

\_fsuP {R(k,x,u):xeX(k),ueU(k,x)}, teK\K', ^ '\-mf{lc(z):xGX(k),udGUd(k,x)}, ksK\ / = inf {G (x) :x g Г n X (/Г)}. Здесь <pc — градиент (pc в пространстве (xc), T — знак

X

транспонир ования.

Справедливы следующие утверждения.

Теорема 1. Для любого элемента да g D и любых (р,(рс имеет место оценка

I(m) - infI < А = I(m) -1.

D

Пусть имеются два процесса да1 gD и да11 е£ и функционалы <р и (рс, такие, что < = I {т1^ и да11 G /) .

Тогда /(да11) < /(да1).

Теорема 2. Пусть имеются последовательность дискретно-непрерывных процессов {ms}<^D и функционалы (p. q>°, такие, что:

1) ¡лс (г, /J — кусочно-непрерывна при каждом z;

2) R (к, хД к), us( к)) ц (к) ,к g

4) Gc(zsy)-r(zs)^0,keK';

5)G(x,(tF))->/.

Тогда последовательность {ms} — минимизирующая для / на D . Доказательство обоих утверждений дано в [12].

13

3. Метод улучшения

При построении метода будем отталкиваться от задачи улучшения

элемента: по заданному элементу да1 е /) требуется найти элемент я?" е /). такой, что справедливо неравенство /(да11) </(да1). При этом данную задачу будем решать в окрестности элемента да1. Для того чтобы траектории х(к) и хс (к,I) не вышли за пределы окрестности, введем дополнительные условия: | и—и1 (к) |< с^, | ис — ил (к, I) \< а2.

Предположим, что хс [к, ^ ) = £ (к, , кпкр,х{к1) —

фиксированы, ограничения на переменные состояния отсутствуют и подсистемы нижнего уровня не зависят от ий, а используемые конструкции достаточных условий оптимальности таковы, что справедливы все нижеследующие операции. Рассмотрим приращение функционала Ь , которое представим в виде:

г л

АЬ*сИ = АС- £ М + Е АС}С-

К\К'\кр К' ^ Г(г) ^

При этом в выражениях для АН и АМС ограничимся первыми производными лишь по переменным состояния. Имеем

Л1*ахтЛх- ^ (^тАх + АиК) +

+ £ Ах-

К'Чср V Хр Х/

| (ясст Дхс + ЩТАх + АиСЯс) Л|,

г(*

где Ах = х - х1, Ахс = хс - хл, АхсР = хР - хР, Ах'} = хР - х^1,

А Я = Я(к,+ Аи)-Я(к^,х,и1), А Я = х,хс,и& + Аис)~

и

-Я(к^,х,хс,иА), Аи = и- и1, Аис = ис -иА.

Здесь первые производные функций /?, С, /?с, (У подсчитаны при и = и\к\ х = х\к\ хс = хс\к^\ ис =ис\к^).

Зададим функции <р,(рс в виде: (р = у/т

<р° = Лт (к,/)х(к) + ц/сТ {к^хс где у/, у/% Л —вектор-функции,

подлежащие определению. Тогда

АЬ*сИ = (Рх+ч/(кР))тАх- £ (((Нх(к,\1/(к + \\и(к),х(к))+\1/(к)У Ах +

К\К'\кр

+Н{к,ц/{к +1 \и1 + Аи,х{к))-Н(к,у/(к +1 ),и\х(к))) +

+£((-#, x,y/(k + l),xcF, х;) + у/(к))т Ах +

К'

+1)Ar + 1т (к, tp)Ах - Ат {к, t{ )Ах + у/сТ (к, tF)AxcF - у/сТ {к, t{) Ахс{) -

Xj

- J ((Я + Нсх У Ах + (\j/c + Нсс У Ахс + Нс {к, t, Л,у/с,ucl + Аис, х(к), хс) -

T(z)

-Hc(k,t^,y/c,ucl,xc)))dt). Здесь

Н(к,у/(к + 1),и(к), х(к)) = у/т(к +1 )/(к, х(к),и(к)), к е К\К'\kF и Н(к,w(k +1),xcF,х;) = у/т(к + \)в(к,х,xcF,хс,), к g К', Нс(к, х, Л(к, t), y/c(k,t),uc,xc) = y/cTfc (к, t,x,uc,xc) + Лтх.

Будем выбирать функции у/,у/с, Л, так, чтобы выполнялись условия: щ(кр) = -Fx, W(k) = Hx(k,W(k + l),u(k),x(k)), к GK\K'\kp, (4)

у, (к) = Hx(к,у/(к+ \),xF,xcI)-ex0Tcw(k +1) + Л(к,t;),к g К', (5)

xi

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

л(к,^)=еж(кмл=-щ, (6)

Wc(k,tF) = H с,ц/с = -Нсс. (7)

Хр X

Выбор приращений управлений А и и Аис будем проводить исходя из приведенных ранее достаточных условий улучшения и оптимальности, а также с учетом требований | Au \< ах, \ Аи° \< а2 и

и1 + Aug U, ucl + А ис g Uc.

4. Алгоритм

Таким образом, алгоритм метода включает в себя следующие этапы.

1. Задаются управления и1 g U, ucl g Uc. Находится решение

исходной ДНС. Тем самым определяется элемент ш1.

2. Справа налево решается ДНС относительно сопряженных переменных у/,у/с, Л.

3. Находятся Au, Ali из условий:

А и = &щтгхН(к,цг(к+ Х),и1 + Аи,х(к)),\ и1 +А и \<ах,

Аис = axgmaxHc(k,x^(k,t),\i/c(k,t),ucl +Аис,хс),\ucl +Аис \<а2.

4. Решается исходная ДНС и вычисляется функционал для различных

* >!<

значений ах,а2. Находятся значения ах,а2, при которых он достигает минимума, и соответствующие им управления иа* = w1 + An, uf2 = ucl + An' . Переход к пункту 1.

Вычисления заканчиваются при выполнении условия

| /(/??л ) - /(/??л |) |< 8, где г — заданная точность вычислений.

Пример 1. Экономический рост с учетом инноваций. Рассмотрим модификацию известной однопродуктовой модели экономического роста:

К = 1- 5К, П = р(\-А)у(К)а-Вг,К>0,0<а<1, (8) где К — основной капитал, А, В — коэффициенты прямых и

фондообразующих затрат, соответственно, 8 — коэффициент амортизации, / — инвестиции, р — индекс цен, П — накопленный доход при отсутствии инновационных затрат, у — коэффициент фондоотдачи.

Предполагается, что коэффициент прямых затрат А поэтапно уменьшается за счет активных инноваций (реконструкция, модернизация оборудования и т. п.):

А(к + 1)-А = (А(к)-А)(а-и), 0<и<а-Ь, Ь<а, А(0) = Ао,

к — номер этапа, А — наименьшее достижимое значение А (мировой уровень), и — управление величиной инновационного изменения, требующее пропорциональных затрат 1)н. Продолжительности этапов будем считать постоянными и равными (для простоты).

Ставится задача: максимизировать суммарный по всем этапам накопленный доход за вычетом инновационных затрат, т. е. минимизировать функционал

кр-1

/=2>#(*)-П(Г),

о

где Т — общий период (горизонт) планирования.

Система (8) имеет неограниченное линейное управление и может быть заменена эквивалентной производной системой [7] (первого порядка):

4=р(1-А(к))уКа-ВЗК, £ = П + ВК. Представим задачу как задачу для ДНС, предполагая, что инновации вводятся поэтапно. Введем обозначения:

к-1

хс =£, х1(к) = хс(11(к)\ х2(к) = А(к), х\к) = ^Г>и(к),ис = К.

о

На каждом этапе будем иметь

х\к +1) = хс (к)\ х2(к + \) = А+(х2 (к) - А)(а - и),

х3(к + \) = х3(к) + Пи,

хс = р(1 - х2 (к))у(К)а -В8К,

х1 (0) = х3(0) = 0, х2(0) = Ад. В итоге функционал принимает вид

I = -xl(kp) + x3 (кр ) + Вис (/,, (кр — 1)) —> inf.

Заметим, что значение uc(tp(kp —1)) не зависит от значений других слагаемых, т. е. задача сводится к минимизации функционала

J= min I = х\кр)-х\кр) (приэтом ис(tp(kp-1)) = 0).

uc(tp(kp-\))>0

Выпишем основные конструкции метода, необходимые для проведения расчетов. Нетрудно видеть, что в данном случае множества К и К' совпадают. Имеем:

Нс=у/с(р( 1-х2(к))у(К)а -В5К) + А V(к) + ЯУ(к) + ЯУ (к),

Н = I//1 (к +1 )хс(1,(к)) + цг(к +1 )(А+(х\к) - А)(а-ч)) + у/(к +1 )(х'(к) + />»),

У = 0, y/c(k,tp) = y/1(k + l\ Я>=-Я\ X\k,tF) = 1,

Я2 = ру/су(К)а -Я2, X2(k,tp) = О, Я3 = -Я3, Ä3(k,tp) = 0,

y/\k) = Я1 (k,tj), у/2(к) = у/2(к +1 )(а-и) + Х2(к,tj),

у3(к) = у3(к + \) + Х3(к^1 у\кр) = 1, у2(кр) = 0, w\kp) = ~ 1-Приращения управлений верхнего и нижнего уровней находятся из условий

А и = argmax#(&,t//1(£ + l),t//2(& + l),t//3(£ + l),wI + Au, х\к),х2(к), х3(&), | и1 + Au |< ccj,

AÄ" = arg max Нс {к, х\х2 ,х3, Я1 (к, О, Я2 (Л, О, Я3 (к, t), у/с (к, t),К1 + АК, хс),

\К1+Ж\<а2.

Конкретные расчеты проводились описанным выше алгоритмом для различных начальных управлений и следующих числовых данных:

Т = 20, р = 1, 8 = 0,05, Д, = 0,5, А = 0,25, В = \,у = Ъ, а = 0,8,

а = 0,99, Ъ = 0,9,0 < К <5,0 <и <0,09, К1 =1,5,и1 =0,05. и для нескольких вариантов значений удельных инновационных затрат

£> = 0,6,15 .

В таблице 1 представлены результирующие значения функционала при D = 6 на первых итерациях процедуры улучшения для и и К, наилучшие результаты были получены при осх = 0,07, ос2 = 2.

На рис. 1 представлен график управления и, полученного на первых трех итерациях. На рис. 2 — график управления К на нулевой и первой итерациях.

Таблица 1

Значение функционала на различных итерациях

К1 К11

и1 -41,7880 -51,7176

и11 -43,0562 -53,1948

иш -43,4362 -54,0770

Таблица 2 Конечное значение функционала для различных £)

£> = 0 £ = 6 £> = 15

-58,4618 -54,0770 -49,3028

0.09< и О.ОЪ 11111 I I I

; V V V V ч —•— и II и I и

—■—

0.06

0.051 0.04 0.03 0.02 0.01 0 -0.01 1 -

» 4 * 4 > *

У Ч. У ч У 1 1 0

1 ! I У 5 7 к 1

Рис. 1. Графики дискретного управления

КП

---- ■ к1

1 1 1

О 2 4 6 8 10 12 14 16 г 18 20

Рис. 2. Графики непрерывного управления

Малое количество итераций, потребовавшихся для расчетов, — следствие упрощения, получаемого при переходе к эквивалентной производной системе первого порядка на нижнем уровне. В итоге получили, что на оптимальном режиме активные инновации производятся с максимальной интенсивностью на начальных этапах и не производятся на конечных этапах. При этом значение основного капитала К скачкообразно возрастает, что реализуется в исходных терминах соответствующими разовыми инвестициями.

Заключение

Построен метод улучшения управления для дискретно-непрерывных систем на основе аналога достаточных условий оптимальности В. Ф. Кротова с использованием сужения множеств допустимых управлений, позволяющего не использовать для учета ограничений на управления метод штрафов. Сформулирован его алгоритм. Метод аппробирован на экономическом примере. Результаты расчетов подтверждают его работоспособность.

Литература

1. Теория систем с переменной структурой / под ред. С. В. Емельянова. М.: Наука, 1970. 592 с.

2. Гурман В. И. К теории оптимальных дискретных процессов // Автоматика и телемеханика. 1973. № 6. С. 53-58.

3. Васильев С. Н. Теория и применение логико-управляемых систем // Идентификация систем и задачи управления: труды II Междунар. конф. (БКРЯСОЗ). 2003. С. 23-52.

4. Бортаковский А. С. Достаточные условия оптимальности управления детерминированными логико-динамическими системами // Информатика. Сер. Автоматизация проектирования. 1992. Вып. 2-3. С. 72-79.

5. Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями. М.: Наука, 2005. 429 с.

6. Lygeros J. Lecture Notes on Hybrid Systems. Cambridge, University of Cambridge. 2003. 84 c.

7. Гурман В. И. Вырожденные задачи оптимального управления. М.: Наука, 1977. 304 с.

8. Кротов В. Ф. Гурман В. И. Методы и задачи оптимального управления. М.: Наука, 1973. 448 с.

9. Кротов В. Ф. Достаточные условия оптимальности для дискретных управляемых систем // ДАН СССР. 1967. Т. 172, № 1. С. 18-21.

10. Гурман В. И., Расина И. В. Дискретно-непрерывные представления импульсных решений управляемых систем // Автоматика и телемеханика. 2012. №8. С. 16-29.

11. Расина И. В. Иерархические модели управления системами неоднородной структуры. М.: Физматлит, 2014. 160 с.

12. Расина И.В. Итерационные алгоритмы оптимизации дискретно-непрерывных процессов // Автоматика и телемеханика. 2012. № 10. С. 317.

METHOD FOR IMPROVING DISCRETE-CONTINUOUS SYSTEMS BASED ON RESTRICTION OF THE CLASS OF ADMISSIBLE CONTROLS

Irina V. Rasina

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Dr. Sci. (Phys. and Math.), Chief Researcher,

Ailamazyan Program Systems Institute, 4a Petra Pervogo St., Veskovo 152021, Pereslavl District, Yaroslavl Oblast, Russia

Olga V. Danilenko

Cand. Sci. (Phys. and Math.), Senior Researcher, Trapeznikov Institute of Control Sciences 65 Profsoyuznaya St., Moscow 117997, Russia

Irina S. Guseva

Cand. Sci. (Phys. and Math.), Senior Lecturer,

Buryat State University, 24a Smolina St., Ulan-Ude 670000, Russia

The article deals with one of the widely applied classes of heterogeneous systems — discrete-continuous systems. A modification of the global improvement method with restriction of the sets of admissible controls is constructed. This allows not to use the penalty method to account restrictions on controls. We give an illustrative example.

Keywords: hybrid systems; optimal control; sufficient optimality conditions; mathematical model; degenerate problems; derived system.

i Надоели баннеры? Вы всегда можете отключить рекламу.