ШБН 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ № 5(9), 2012, с. 83-89 УДК 517.97
О. В. Фесько
Алгоритм вычисления оценок приближенно оптимальных управлений простой структуры
Аннотация. В статье предлагается алгоритм вычисления априорной оценки, позволяющей судить о качестве приближенно оптимального управления, полученного в результате поиска кусочно-постоянного и кусочно-линейного управлений для задач оптимального управления [1]. Приводятся результаты вычислительных экспериментов нахождения оценок на основе достаточных условий оптимальности.
Ключевые слова и фразы: оптимальное управление, оценка управления.
Введение
При использовании различных численных методов решения задач оптимального управления крайне важное значение представляет собой возможность получения количественной оценки найденного приближенного управления, позволяющей судить о точности, близости к точному оптимуму. Такую возможность открывают достаточные условия оптимальности Кротова [2].
В работе [1] рассматривалась задача оптимального управления вида
х(Ъ) = /(і,х(і),и(і)), х(Ьі) = хі, і Є \рі,Ьр] ,
(1) и(і) Є Ии = {и(і)[и < и(ї) < и} ,
Р(х(Ьр)) ^ тіп,
где х = (х\,...,хп)т Є К", хі(ї), і = 1,п — кусочно-гладкие. Управ-
'-Ір)
кусочно-линейному
,,2г\ 4. „.,2г+1 „.,2і
ление и = (иі,... ,ир)т Є К принадлежит одному из двух классов:
= ( (и;2г+1 - w‘2г) г - (пи!2г+1 - ті+1^2^) ^ ^ ^
и\Ь) — - - , І Є [Ті ,ТІ+
(п+1 - п)
© О. В. Фесько, 2011
© Программные системы: теория и приложения, 2011
или кусочно-постоянному и(Ъ) = t € [г*,г*+1], г = 0,т, где т — число моментов переключений при разбиении
= то <Т1 < Т2 < ... < тт+1 = Ьр.
На параметры управления наложены ограничения типа
гшг € Ж = {и)г\и < гшг < й} .
Задача (1) была сведена к задаче условной конечномерной минимизации функции многих переменных С{и),т). Процесс решения полученной задачи состоит в поочередном применении численных алгоритмов: метода Рунге-Кутта для решения задачи Коши и комбинации метода Ньютона с модифицированным методом градиентного спуска для минимизации многоэкстремальной функции С{^л, т) [3, 4]. Требуется количественно оценить полученное при использовании данного подхода приближенное управление.
1. Переход к дискретной системе управления
В силу рассматриваемых классов управлений непрерывную задачу (1) можно свести к дискретной задаче оптимального управления.
Введем множество индексов К = {0, 1, .. . ,т +1} для моментов переключений = То < Т1 < тч ... < тт+1 = Ьр, где т — число моментов переключений. В случае кусочно-постоянного управления и{Ь) = w{k), Ь € [т]~,Т}~+1], к € К, эквивалентная непрерывной задаче (1) дискретная задача примет вид
.г {к + 1) = ^ {к, г{к), т{к)), к € {0,1,. .. ,т + 1} ,
(2) г{0) = го = Х[, т{к) € Ш = {т{к)\и < т{к) < Щ ,
Р {х{т + 1)) ^ шш,
где функция ц {к, г{к),1л{к)) — решение задачи Коши %{0 = / {£,х{0,ш{к)), £ € [тк■.Тк^
х{тк) = г{к),
взятое в точке £ = Тк+1.
Для случая кусочно-линейного управления и{Ь) = т1{к) + т2{к)1, t € [тк,Тк+\], эквивалентная дискретная задача будет выглядеть как
г {к + 1) = г/ (к, г{к),т1{к),т2{к)) , к € {0, 1, ... ,т +1} ,
(3) г{0) = го = XI, -ш{к) € Ш,
Р {г{т + 1)) ^ шш,
где функция ц {к, г(к),т1 (к),т2(к)) — решение задачи Коши
%(0 = / (С,х(^),т1(к) + ы2(к)£) , £ е [тк,тк+1 ],
х(тк) = г(к),
взятое в точке £ = Тк+1.
2. Формулы оценок Кротова
Пусть (S (к), w (к)) — допустимое решение задачи (2). Для любой функции р (k,z) построим оценочную функцию Кротова [5,6]:
Д (z, w,p>) = F (z (m + 1)) — inf (F (z) + w (m + 1, z) —
zeR™
m
— p (0, zo)) + sup (p (к, ^ (к, z, w)) — p (к, z)) =
t=0weW’
(4)
= F (z (m + 1)) — inf (F (z) + p (m + 1,z)) +
zeR"
m
+ У sup (p (k + 1, ^ (k, z, w)) — p (к, z))+
t=iweW’
zeRn
+ sup p (1, ^ (0, zq,w)).
wEW
Пусть (z (k) ,i!j1 (k),w2(k)) —допустимое решение задачи (3). Оценочная функция Кротова имеет вид
Д (z, w1, w2, p) = F (z(m + 1)) — inf (F (z) + p (m + 1, z) —
V T / z£R"
m
— p (0, zq)) + sup (p (к,ц {k, z,w1 ,w2')') — <p (k,z)) =
sup \^, 4\^, -6, 'u'1 "*’2''
fc—Q w1 ,'w2 EW, zE R^
= F {z {m + 1)) — inf {F {z) + p {m + l,z)) +
+ sup (p (k + 1,1] {к, z,w1 ,w2 )) — V {k,z)) +
k=1 w1 ,w2EW,
zERn
+ sup p (l,q (0,zQ,w1,w2)) .
w\w2EW
z
z
Если функция <^(к, г) удовлетворяет условиям (схема Беллма-на [2])
^ (к,г) = вир ^ (к + 1,^ [к, г, IV1 ,ш2^ ,
(6) w1,w2EW
<р (т + 1, г) = —Р (г), к € {0, 1,. .. ,т + 1} , то формула оценки принимает вид
Д (г, го1 ,гг2, = Р (г (т + 1)) + <р (0, х0) .
3. Алгоритм вычисления оценок
Для вычисления оценок Кротова был разработан алгоритм, реализованный в виде компьютерной программы. Алгоритм представлен на рис. 1 и состоит из следующих шагов:
Шаг 1: Задание параметров задачи: начального состояния системы хх; ограничений г < г < ~2 на область изменения фазовых переменных; допустимого управления и, которое требуется оценить; ограничений на управление и, и; моментов переключений т, шага к для построения сетки по управлению.
Шаг 2: Вычисление допустимых траекторий г и функционала качества Р(г), соответствующих заданному допустимому управлению.
Шаг 3: Построение сетки по управлению.
Шаг 4: По сетке рекурсивно разрешается цепочка относительно функции Кротова р(к,г).
Шаг 5: Вычисление оценки.
Шаг 6: Завершение работы программы.
Инициализация ^(°) = го,
г0,г,г,й,м,г7,
т, к г (к + 1) = g {k,z^k^,l^^k^
Построение сетки по управлению
\и,и+Ъ,...,й-Ъ,й}
Вычисление оценки
Ь = Р(г) + <р(0,20)
Завершение работы
Рекурсивный расчет ф ( 0 , я 0 ) по формулам
ф( к, я ) = тахф( к +1, g ( к, я, и )),
ф( т +1, я ) = -Е ( я )
Рис. 1. Вычислительная схема нахождения оценки
4. Вычислительный эксперимент
Рассмотрим непрерывную задачу оптимального управления х 1(1) = и(Ь), Ь € [0, 2],
(7) х2(ь) = и2(г) + х1(г), ж(0) = (1, 0)т, К*)| < 2,
с терминальным критерием качества
(8) Р (х(2)) = х2(2) ^ шт .
Используя предложенный алгоритм, найдем оценку приближенно оптимального управления для случая кусочно-постоянных и кусочно-линейных управляющих функций.
Кусочно-постоянное управление. Приближенное решение поставленной задачи на множестве кусочно-постоянных управлений имеет вид: х = (х1,х2) = (0.24; 1.009), управление й характеризуется параметрами (100,101) = (—0.61; —0.14), значение функционала Р(х(Ьр)) составило 1 .009.
Задача (7), (8) в дискретном виде будет выглядеть как
г1 (к + 1) = т(к) + г1(к),
г2 (к + 1) = 4т2(к) + т(к)г1(к) + г\(к) + г2(к),
г(0) = (1, 0)т, к € {0,1, 2} , ^ (г(2)) = г2(2) ^ шт .
Построив сетку по управлению {—2, —2 + 0.1, . . . , 2 — 0.1, 2} и рекурсивно разрешив цепочку (6), имеем
Д(0,и, у) = Р(0(2)) + <р(0, г0) = 1.009 — 1.009 = 0.
Судя по результатам, на указанной сетке приведенное приближенное решение оптимально.
Кусочно-линейное управление. В работе [4] для рассматриваемого примера было приближенно найдено оптимальное в классе кусочно-линейных разрывных функций управление с одной точкой переключения в Т\ = 1. Полученное решение: X = (XI, Х2) = = (0.29; 0.96), параметры управления (100,1)1 ,'й>2,'йз) = (—0.92; —0.21; —0.25; —0.01), а ^(г(гР)) = 0.96.
Чтобы оценить это управление, проведем дискретизацию задачи (7)(8):
^ (к + 1) = wo(k)k + 0.5wo(k) + ^(к) + (к),
?2 (к + 1) = 0.38т‘2(к) + то(к)^(к)к + 2.66то(к)т\(к)к+
+ г\(к) + 1.25т"^(к)к + 0.33то(к)^ (к) + (к)г\(к)+
+ 1.25-Ш1 (к)то(к) + 1.33то(к)к2 + 1.33гш‘2(к) + г2(к),
г(0) = (1, 0)т, к € {0, 1, 2} , ^ (г(2)) = г2(2) ^ шт .
Возьмем сетку по управлению с шагом к = 0.1: {—2, —2 + 0.1,..., 2 — 0.1, 2}. Рекурсивно разрешая цепочку (6), находим оценку
Д(г, и, ф) = Р(2(2)) + ф0, го) = 0.96 — 0.96 = 0.
В качестве теста оценим точность произвольного допустимого управления й с параметрами (йо,й1,й2,йф) = (—0.5; —0.1;0.2; 0.6). На той же сетке полученная оценка составила
Д(2, и, ф) = ^(2(2)) + ф0, г0) = 1.71 — 0.96 = 0.75.
Вычислительный эксперимент позволяет сделать вывод: на указанной сетке полученное приближенное решение оптимально.
Заключение
В работе выведены формулы вычисления оценок на основе достаточных условий оптимальности Кротова, приведена алгоритмическая схема расчета. Написана программа подсчета оценок, которая может использоваться как для поиска начального управления при решении различных задач оптимального управления на начальном этапе, так и для непосредственной оценки полученного допустимого решения, которое было найдено одним из приближенных методов.
Список литературы
[1] Фесько О. В. Алгоритм поиска кусочно-линейного управления с нефиксированными моментами переключений // Вестник БГУ, 2011, № 9, с. 52—56 ^], 4
[2] Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973. |[], 2
[3] Фесько О. В. Программным комплекс поиска оптимальных управлений на, множествах простой структуры // Параллельные вычислительные технологии (ПаВТ’ 2011) // Труды международной научной конференции. — Челябинск : Издательский центр ЮУрГУ, 2011, с. 712
[4] Фесько О. В. Параллельный алгоритм оптимизации динамических систем на множестве кусочно-линейных управлений // Вестник БГУ, 2010, № 9, с. 79-87 t[], 4
[5] Гурман В. И. Принцип расширения в задачах управления. М. : Наука: Физ-малит, 1985. ^2
[6] Трушкова Е. А. Оценка приближенно оптимальных решений на основе преобразований модели объекта // Вестник БГУ, 2011, № 9, с. 47-51 ^2
O. V. Fesko. Algorithm for computing a priori estimates the rough optimal simple controls.
Abstract. The algorithm for computing a priori estimates that let us to estimate approximate optimal piecewise constant and piecewise linear controls [1] is offered. The results of computational experiments are introduced.
Key Words and Phrases: optimal control, control estimation.
Образец ссылки на статью:
О. В. Фесько. Алгоритм вычисления оценок приближенно оптимальных управлений простой структуры // Программные системы: теория и приложения : электрон. научн. журн. 2011. № 5(9), с. 83-89.
URL: http://psta.psiras.ru/read/psta2011_5_83- 89.pdf