Научная статья на тему 'Метод улучшения управления первого порядка для дискретно-непрерывных систем'

Метод улучшения управления первого порядка для дискретно-непрерывных систем Текст научной статьи по специальности «Математика»

CC BY
82
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
CONTROL IMPROVEMENT / DISCRETE CONTINUOUS SYSTEMS / SUFFICIENT OPTIMALITY CONDITIONS / ДИСКРЕТНО-НЕПРЕРЫВНЫЕ СИСТЕМЫ / ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ / УЛУЧШЕНИЕ УПРАВЛЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Расина Ирина Викторовна, Фесько Олесь Владимирович

Рассматривается метод улучшения управления для дискретно-непрерывных систем (ДНС) как модификация более сложного метода второго порядка, построенного ранее. Предлагаемый метод дает решение в форме приближенно-оптимального линейного синтеза управления. На иллюстративном примере проводится его сравнение с градиентным методом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Расина Ирина Викторовна, Фесько Олесь Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

First order control improvement method for discrete continuous systems

An improvement method for discrete continuous systems as a modification of the second order method is considered. The proposed method gives the solution in the form of approximate linear synthesis of optimal control. An example is given to illustrate the comparison with the gradient method. (In Russian). (in Russian).

Текст научной работы на тему «Метод улучшения управления первого порядка для дискретно-непрерывных систем»

ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ т. 9, №3(38), с. 65-76

УДК 517.977

И. В. Расина, О. В. Фесько

Метод улучшения управления первого порядка для дискретно-непрерывных систем

Аннотация. Рассматривается метод улучшения управления для дискретно-непрерывных систем (ДНС) как модификация более сложного метода второго порядка, построенного ранее. Предлагаемый метод дает решение в форме приближенно-оптимального линейного синтеза управления. На иллюстративном примере проводится его сравнение с градиентным методом.

Ключевые слова и фразы: дискретно-непрерывные системы, достаточные условия оптимальности, улучшение управления.

Введение

В теории оптимального управления описан целый класс управляемых процессов, для которого характерна с течением времени смена описаний в терминах управляемых дифференциальных систем. Подходы к построению их математических моделей и исследованию, а также используемая терминология, весьма разнообразны и широко представлены в литературе: системы переменной структуры [1], дискретно-непрерывные системы [2], логико-динамические системы [3,4], импульсные системы [5], гибридные системы [6,7]. Одна из возможных схем исследования задач оптимального управления для таких систем состоит в обобщении для них достаточных условий оптимальности Кротова [8,9]. Так, в [2,10-12] предложена математическая модель дискретно-непрерывной системы (ДНС). Это двухуровневая модель, в которой нижний уровень представляет собой описания однородных непрерывных процессов на отдельных этапах, а верхний уровень (дискретный) связывает эти описания в единый процесс и управляет функционированием всей системы в целом с целью обеспечения минимума функционала.

Для такой модели получены достаточные условия оптимальности типа Кротова и построены методы улучшения управления [12]. Один из таких методов предложен в [13]. Это метод второго порядка, сложность которого состоит в необходимости решения на каждой итерации для

© И. В. Расина, О. В. ФЕсько, 2018

© Институт программных систем имени А. К. Айламазяна РАН, 2018 © Программные системы: теория и приложения (дизайн), 2018

сопряженных переменных системы векторно-матричных уравнений типа Риккати. Как известно, такая система может и не иметь решения, что требует дополнений алгоритма. Заметим, что к достоинствам метода следует отнести следующий факт: на последней итерации получается решение в форме приближенно-оптимального линейного синтеза управления.

Однако, если положить в сопряженной системе матрицы равными нулю, то получается метод улучшения первого порядка, также дающий решение в форме приближенно-оптимального линейного синтеза управления и не связанный с необходимостью решения матричных уравнений Риккати. Этот метод принципиально отличается от градиентного для ДНС [14] и до сих пор не рассматривался.

Цель работы: ликвидировать указанный пробел и провести сравнение предложенного метода с градиентным на иллюстративном примере.

1. Модель дискретно-непрерывной системы

Пусть задана абстрактная дискретная управляемая система [9]:

(1) х(к +1) = /(к,х(к),и(к)), к е К = {к/1к1 + 1,...,кр},

где к — номер шага (этапа), не обязательно физическое время, х и и — соответственно переменные состояния и управления, / — оператор. Все указанные объекты — произвольной природы (возможно, различной) для различных к, и(к,х) — заданное при каждом к и х множество, к/, кр — начальный и конечный шаги соответственно. На некотором подмножестве К' С К, кр £ К' действует непрерывная система нижнего уровня

(2) хс = — = /с (М,хе,ие), * е т (г) = [4/(г),*р(г)],

г = (к, х, и*) , хс е Хс(г,*) С М"(к),

ис е ис (г,*,хс) С Здесь ис (г,**,хе) — заданное множество.

Оператор правой части (1) имеет вид / (к, х, и) = в (г, 7е), где

7е = (*/, х?, *р, хр) е Ге(г), Ге(г) = {7е : */ = т(г), х/ = £(г), (*р, хр) е Гр(г)}.

Здесь г = (к, х, и*) — совокупность переменных верхнего уровня, играющих на нижнем уровне роль параметров, и* — переменная управления произвольной природы, */ = т(г), х? = £(.г) — заданные функции г.

Решением этой двухуровневой системы считается называемый дискретно-непрерывным процессом набор

т = {х{к), и {к)),

где при к € К': и{к) = (иа{к), тс{к)), тс{к) € Бс {г{к)),

тс{к) — непрерывный процесс {хс{к,^), ис{к,г)), г € Т{г {к)), Юс{г) — множество допустимых процессов тс, удовлетворяющих на каждом дискретном шаге к указанной дифференциальной системе (2) с дополнительными ограничениями при кусочно-непрерывных uc{k,t) и кусочно-гладких хс{к,г). Совокупность элементов т, удовлетворяющих всем выше перечисленным условиям, обозначим через Ю и назовем множеством допустимых дискретно-непрерывных процессов.

Для модели (1), (2) рассматривается задача о поиске минимума на множестве Ю функционала I = Г {х {кр)) при фиксированных к/ = 0, кр = К, х {кц) и дополнительных ограничениях

(3) х{к) € Х{к), хс € Хс {г, г),

Х{к), Хс {г, г) — заданные множества.

Заметим, что модель (1), (2) удобна для представления неоднородных управляемых процессов. Ее нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний — связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. Взаимодействие с каждой подсистемой нижнего уровня осуществляется через границу этой подсистемы и соответствующего непрерывного процесса 7с.

2. Достаточные условия улучшения и оптимальности управления

Достаточные условия оптимальности для такой модели получаются по аналогии с условиями Кротова для дискретных и непрерывных систем следующим образом. Из ограничений множеств Ю и Юс исключаются дискретная цепочка и дифференциальная система и вводятся функционалы ф {к,х) и фс {г,г,хс). Последний можно рассматривать как параметрическое семейство функций от аргументов г, хс с параметром г, которые считаются непрерывными, и по крайней мере, непрерывно-дифференцируемыми по этим аргументам, где г =

(к, х (к), и* (к)) . Кроме того, рассматривается обобщенный лагранжиан по аналогии с лагранжианами Кротова для дискретных и непрерывных оистем:

Ь = С (х (кр)) - £ Д(к,х(к),и(к))

+ £ (се(г(к),7 е(г(к)))

К'

Де(г(к), *, хе(к, *), ие(к, *))Л

Т(г(Й))

С (х) = Д (х) + ф (кр, х) — ф (к/, х (к/)),

Д (к, х, и) = ф (к + 1, / (к, х, и)) — ф (к, х),

Се (г, 7е) = —ф (к + 1, в (г, 7е)) + ф (к, х)

+ фе (г,*р,хр) — фе (г,*/, х/),

Де (г, *, хе, ие) = фХТ/е (г, *, хе, ие) + ф? (г, *, хе) .

^ (г, *) = вир {Де (г, *, хе, ие) : хе е Хе(г, *), ие е ие (г, *, хе)},

Iе (г) = {Се (г, 7е) : 7е е Г(г), хе е Хе(г, *р)},

вир{Д (к, х, и) : х е Х(к), и е и (к, х)}, * е К\К', — М{Iе (г) : х е X (к), и* е И (к, х)}, к е К',

1 = М{С (х) : х е Г П X (К)}. Здесь фХс — градиент фе в пространстве (хе), X — знак транспониро-

'X

вания.

Справедливы следующие утверждения.

Теорема 1. Для любого элемента т е О и любых ф, фе имеет место оценка

I(т) — МI < А = I(т) — 1.

Пусть имеются два процесса, т1 еБ и т11 е Е и функционалы ф и фе, такие что Ь (т11) < Ь (т1) = I (т1) , и т11 е Б. Тогда I(т11) < I(т1).

Теорема 2. Пусть имеются последовательность дискретно-непрерывных процессов {тя} С Б и функционалы ф, фе, такие что:

(1) (г,*) — кусочно-непрерывна при каждом г;

(2) Д (к, хя (к) , и (к)) ^ ^ (к), к е К;

[ {яс {гс,г,хС {г) ,иС {гс)) — ¡лс {га,г)) ¿г ^ о, к € К',г € Т {гс);

(4) Ос {гв,1с) — 1с {гс) ^ 0, к € К';

(5) с {хс {гр)) ^ I.

Тогда последовательность {тс} — минимизирующая для I на Ю. Доказательство обоих утверждений дано в [10,11,13]. 3. Метод улучшения первого порядка

При построении методов, как правило, отталкиваются от задачи улучшения элемента, которая состоит, по существу, в построении некоторого оператора ш : Ю ^ Ю, такого что I{ш{т)) < I{т) (монотонного по функционалу) [15].

В [13] построен метод улучшения второго порядка, содержащий в сопряженной системе векторно-матричные уравнения относительно первых и вторых производных функций ф {к, х), фс {г, г, хс) и дающий решение в форме приближенного линейного синтеза управления на обоих уровнях. Сами функции ф {к,х), фс {г,г,хс) задаются в виде

ф = фТ {к) х {к) + 1ахт {к) а {к) Ах {к),

фс = фсТ {к, г) хс {к, г) + 1ахсТ {к, г) ас {к, г) Ахс {к, г)

+ 1ахт {к) Л {к, г) Ахс {к, г) + 1ахсТ {к) Лт {к, г) Ах {к),

где ф и фс — вектор-функции, а, ас и Л — матрицы, Ах = х — х1, Ахс = хс — хс1 . Дополнительная сложность метода состоит в необходимости решения матричных уравнений типа Риккати для матриц а, ас.

Если в построенном методе положить матрицы а, ас, Л равными нулю, то получим метод улучшения первого порядка. Основные уравнения метода для этого случая имеют вид:

(4) ф {кр) = —аГх, фс {к,гр) = Ысх%,

(5) ф = — Нх* + Нх*ис Ниаи" Нит ,

(6) ф {к) = Нх — НхиН-1Ни, к € К\К'\кр,

гЬр (к)

(ТНхс, + £фс {к,гт) — I нс¿г, к € К'. >11(к)

(7) ф {к) = Нх + аТНх* + £фс {к, гI) — Г

Лг

При этом

(8) Аиа (к) = — (ЯИИ)-1 (ЯИ + ЯжтИАх(к)),

(9) Аиа (к,*) = — (Я^)-1 (ЯV + ЯеТ„сАх(к) +

+ ЯеТ0„0Ахе(к,*)) .

Здесь

(10)

Я Гфт (к +1) /(к, х(к), и(к)) — 2 (1 — а) |Аи (к) |2, к е К\К'\кр Я = \ фт (к +1) в (к, х (к), х/,хр) к е К',

и

(11) Яе = феТ/е(к,х(к),хе,ие) — 1 (1 — а) |Аие(к)|2,

Аи = и — и1, Аие = ие — ие1, а е [0,1] — весовой коэффициент. Предполагается, что хе (к, */) = £ (к, х (к)).

Нетрудно видеть, что получающийся при этом метод первого порядка принципиально отличается от градиентного метода. Формулы для приращений управляющих воздействий зависят от приращений состояний верхнего и нижнего уровней. Таким образом, как и в методе второго порядка, решение является приближенно оптимальным линейным синтезом.

3.1. Алгоритм метода

Как уже указывалось выше, метод предназначен для решения задачи улучшения, которая состоит, по существу, в построении некоторого оператора ш : Б ^ Б, такого что I(ш(т)) < I(т) (монотонного по функционалу) [15]. При некотором заданном начальном элементе то такой оператор генерирует улучшающую, в частности, минимизирующую последовательность {тя} : тя+1 = ш(тя).

В целом, получается следующая итерационная процедура.

1. «Слева направо» просчитывается ДНС (1), (2) при и = ия(к), ие = и^(к,*) и заданных начальных условиях, получается соответствующая траектория (хя(к), х£(к, *)).

2. Задается значение регулятора а.

3. «Справа налево» разрешается ДНС (4) - (7) относительно вектор-функций ф и -0 е.

4. Просчитывается «слева направо» исходная ДНС (1), (2) при и* = и*(к) + Аи, ие = и^(к,*) + Аие, где Аи, Аие находятся по формулам (8), (9). Вычисляются тя+1 и I(тя+1).

Процесс итераций заканчивается, когда |!8+1 — !8| ~ 0 с заданной точностью.

Как и в [13], имеет место следующее утверждение.

Теорема 3. Пусть для ДНС (1), (2) построена указанная итерационная процедура и функционал I ограничен снизу. Тогда она генерирует улучшающую последовательность элементов {тя} е Б, сходящуюся по функционалу, т.е. существует число I*, такое что I* < I(тя), I(тя) ^ I*.

4. Пример

Рассмотрим работу метода на примере системы, динамика которой включает в себя два этапа.

1-ый этап:

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и 2 = х1х2 1

x i — (x 1) (x 2 — u) , x 2 — x iX 2 + ~u ,

x1(0) — —1, x2(0) — —1, t € [0, 2].

2-ой этап:

x 1 — (x1 — t)2 + u2, t € [2, 3]. Функционал имеет вид: I — xf(3) ^ min.

Построим ДНС. Нетрудно видеть, что K — 0,1, 2. Поскольку оба этапа связаны через переменную хЦ, то она и играет роль x, а дискретный процесс верхнего уровня принимает вид:

x(0) — x1(0, 0) — —1, x(1) — x1 (0, 2), x(2) — x1 (1, 3),

I — x(2), x1(1, 2)— x(1), ^ — x(1). Основные конструкции имеют вид:

H2(0, t, x1, x2, u, ф2, Ф2) — Ф1 ((^i)2(x2 — u)2) +

+ Ф2 (x?x2 + 3u3) — 1(1 — a)|Au|2,

H2(1,t,x1,u, ф 2) — ф1 ((x1 — t)2 + u2) — 1(1 — a)|Au|2.

Начальное управление: u1 — 0.5, I1 — 1.98. Результаты и сравнительный анализ представлены на рис. 1, 2 и таблице 1.

Как видно из таблицы и графиков, градиентный метод потребовал вдвое больше итераций.

Заметим, что при других начальных управлениях u1 — —1, 0, 1 принципиальных изменений не произошло, результат был получен в обоих методах за то же число итераций.

Рис. 1. Переменные состояния: х1 (слева) и х2 (справа)

Рис. 2. Графики управлений: метод 1-го порядка (слева), градиентный метод (справа)

ТАБЛИЦА 1. Значения функционала в ходе вычислений

Номер итерации Метод 1-го порядка Градиентный метод

0 1.98 1.98

1 1.85 1.92

2 1.88

3 1.85

Заключение

Таким образом, в работе предложен метод улучшения управления первого порядка для ДНС как модификация более сложного метода второго порядка. Указанный метод принципиально отличается от широко распространенного на практике градиентного метода. На последней итерации метод дает решение в форме приближенно-оптимального линейного синтеза управления. Приведен иллюстративный пример.

[1 [2 [3

[4

[5 [6 [7 [8 [9 [10

[11

[12

[13 [14

Список литературы

С.В. Емельянов (ред.). Теория систем с переменной структурой, Наука, М., 1970, 592 с. t65

B.И. Гурман. «К теории оптимальных дискретных процессов», Автоматика и телемеханика, 1973, №6, с. 53-58. url 66

C.Н. Васильев. «Теория и применение логико-управляемых систем», Труды 2-ой Международной конференции «Идентификация систем и задачи управления», SICPRO'03 (Москва, 2003), с. 23-52. t65

А.С. Бортаковский. «Достаточные условия оптимальности детерминированными логико-динамическими системами», Информатика. Сер. Автоматизация проектирования, 1992, №2-3, с. 72-79. t65 Б.М. Миллер, Е.Я. Рубинович. Оптимизация динамических систем с импульсными управлениями, Наука, М., 2005, 429 с. t65 J. Lygeros. Lecture notes on hybrid systems, University of Cambridge, Cambridge, 2003, 70 p. t65

A.J. Van der Shaft, H. Schumacher. An introduction to hybrid dynamical systems, Springer-Verlag, London, 2000, 176 p. t65

B.Ф. Кротов, В.И. Гурман. Методы и задачи оптимального управления, Наука, М., 1973, 448 с. t65

В.Ф. Кротов. «Достаточные условия оптимальности для дискретных

управляемых систем», ДАН СССР, 172:1 (1967), с. 18-21. url 66 66 В. И. Гурман, И. В. Расина. «Дискретно-непрерывные представления импульсных процессов в управляемых системах», Автомат, и телемех., 2012, №8, с. 16-29. url 6'6 69

И.В. Расина. «Дискретно-непрерывные модели и оптимизация управляемых процессов», Програ,м.мные системы: теория и приложения, 5:9 (2011), с. 49-72. url 66 69

И. В. Расина. «Итерационные алгоритмы оптимизации дискретно-непрерывных процессов», Автомат, и телемех., 2012, №10, с. 3-17. url;

^65

И.В. Расина. Иерархические модели управления системами неоднородной структуры, Физматлит, М., 2014, 160 с. 65 69 71

К.Н. Габелко. «Последовательное улучшение многоэтапных процессов»,

Автоматика, и телемеханика, 1974, №1, с. 72-80. url 66

[15] В.И. Гурман. «Абстрактные задачи оптимизации и улучшения», Программные системы: теория и приложения, 5:9 (2011), с. 14-20. (um)

Тб9,70

Рекомендовал к публикации д.ф.-м.н. А. М. Цирлин

Пример ссылки на эту публикацию:

И. В. Расина, О. В. Фесько. «Метод улучшения управления первого порядка для дискретно-непрерывных систем». Программные системы: теория и приложения, 2018, 9:3(38), с. 65—76.

10.25209/2079-3316-2018-9-3-65-76 (URL) http: //psta.psiras . ru//read/psta2018_3_65-76 .pdf

Ирина Викторовна Расина д.ф.-м.н., г.н.с. Исследовательского центра системного анализа Института программных систем им. А. К. Ай-ламазяна РАН, специалист в области моделирования и управления гибридными системами, автор и соавтор более 100 статей и 5 монографий

JM 0000-0001-8939-2968 e-mail: [email protected]

Олесь Владимирович Фесько

к.т.н., н.с. ИЦСА Института программных систем им. А.К. Айламазяна РАН

[Dm 0000-0002-9329-5754 e-mail: [email protected]

Об авторах:

UDC 517.977

Irina Rasina, Oles Fesko. First order control improvement method for discrete continuous systems.

Abstract. An improvement method for discrete continuous systems as a modification of the second order method is considered. The proposed method gives the solution in the form of approximate linear synthesis of optimal control. An example is given to illustrate the comparison with the gradient method. (In Russian).

Key words and phrases: discrete continuous systems, sufficient optimality conditions, control improvement.

2010 Mathematics Subject Classification: 49M30

References

[1] S.V. Yemel'yanov (red.). Theory of systems with variable structures, Nauka, M., 1970 (in Russian), 592 p.f65

[2] V. I. Gurman. "Theory of optimum discrete processes", Autom. Remote Control, 34:7 (1973), pp. 1082-1087. |gl1 66

[3] S.N. Vasil'yev. "Theory and application of logically controlled systems", Trudy 2-oy Mezhdunarodnoy konferentsii "Identifikatsiya sistem i zadachi upravleniya", SICPRO'03 (Moskva, 2003), pp. 23-52 (in Russian). 65

[4] A.S. Bortakovskiy. "Sufficient conditions for optimality of deterministic logic-dynamic systems", Informatika. Ser. Avtomatizatsiya proyektirovaniya, 1992, no.2-3, pp. 72-79 (in Russian). 65

[5] B.M. Miller, Ye.Ya. Rubinovich. Optimization of dynamic systems with impulse control, Nauka, M., 2005 (in Russian), 429 p.f65

[6] J. Lygeros. Lecture notes on hybrid systems, University of Cambridge, Cambridge, 2003, 70 p.f65

[7] A.J. Van der Shaft, H. Schumacher. An introduction to hybrid dynamical systems, Springer-Verlag, London, 2000, 176 p. 65

[8] V.F. Krotov, V.I. Gurman. Methods and problems of optimal control, Nauka, M., 1973 (in Russian), 448 p.f65

[9] V.F. Krotov. "Sufficient conditions for the optimality of discrete control systems", DAN SSSR, 172:1 (1967), pp. 18-21 (in Russian).f65 66

[10] V.I. Gurman, I.V. Rasina. "Discrete-continuous representations of impulsive processes in the controllable systems", Automation and Remote Control, 73:8 (2012), pp. 1290-1300. 66 6g

[11] I.V. Rasina. "Discrete-continuous models and optimization of control processes", Program Systems: Theory and Applications, 5:9 (2011), pp. 49-72 (in Russian), url

1*65,69

© I. V. Rasina, O. V. Fesko, 2018

© Ailamazyan Program Systems Institute of RAS, 2018

© Program Systems: Theory and Applications (design), 2018

DOI 10.25209/2079-3316-2018-9-3-65-76^^^^^^^^^^^^^^^^^^^^^! lY&Jj1

[12] I.V. Rasina. "Iterative optimization algorithms for discrete-continuous processes", Automation and Remote Control, 73:10 (2012), pp. 1591-1603. d ' 66

[13] I.V. Rasina. Hierarchical models of control of heterogeneous structure systems, Fizmatlit, M., 2014 (in Russian), 160 p. 65 69 71

[14] K.N. Gabelko. "Successive improvement of multi-stage processes", Avtomatika i telemekhanika, 1974, no.l, pp. 72—80 (in Russian), gl 66

[15] V.I. Gurman. "Abstract problems of optimization and improvement", Program Systems: Theory and Applications, 5:9 (2011), pp. 14-20 (in Russian), .url: 69 70

Sample citation of this publication:

Irina Rasina, Oles Fesko. "First order control improvement method for discrete continuous systems". Program Systems: Theory and Applications, 2018, 9:3(38), pp. 65-76. (In Russian). 10.25209/2079-3316-2018-9-3-65-76

url http://psta.psiras.ru//read/psta2018_3_65-76.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.