Научная статья на тему 'О приближенном решении задач оптимального управления со свободным временем'

О приближенном решении задач оптимального управления со свободным временем Текст научной статьи по специальности «Математика»

CC BY
205
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СО СВОБОДНЫМ ВРЕМЕНЕМ / СПЛАЙНОВАЯ ИНТЕРПОЛЯЦИЯ УПРАВЛЕНИЯ / ПОДВИЖНАЯ СЕТКА / ФОРМУЛЫ ПРОИЗВОДНЫХ

Аннотация научной статьи по математике, автор научной работы — Чернов Андрей Владимирович

Предлагается метод сведения задач оптимального управления как с фиксированным, так и со свободным временем к задаче математического программирования сравнительно небольшой размерности. Основная идея предлагаемого подхода состоит в конечномерной аппроксимации искомого управления путем разрывной сплайновой интерполяции с подвижной сеткой. Устанавливается дифференцируемость и приводятся формулы производных функций, возникающих при переходе к конечномерной задаче. Приводятся примеры численной реализации предлагаемого подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON APPROXIMATE SOLUTION OF FREE TIME OPTIMAL CONTROL PROBLEMS

A method is suggested of reducing fixed/free time optimal control problems to a mathematical programming problem of a comparatively small dimension. The basic idea of the suggested approach consists of a finite-dimensional approximation of a desired control by a discontinuous spline interpolation with a floating mesh. The differentiability of the functions arising in the transition to a finite-dimensional problem is set up and the formulas of their derivatives are given. Numerical examples of the suggested method are presented.

Текст научной работы на тему «О приближенном решении задач оптимального управления со свободным временем»

Матем атика

Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 6 (1), с. 107'—114

УДК 517.957+517.988+517.977.56

О ПРИБЛИЖЕННОМ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

СО СВОБОДНЫМ ВРЕМЕНЕМ

© 2012 г. А.В. Чернов

Нижегородский госуниверситет им. Н.И. Лобачевского

chavnn@mail.ru

Птступила в ркдакцию 25.06.2012

Предлагается метод сведения задач оптимального управления как с фиксированным, так и со свободным временем к задаче математического программирования сравнительно небольшой размерности. Основная идея предлагаемого подхода состоит в конечномерной аппроксимации искомого управления путем разрывной сплайновой интерполяции с подвижной сеткой. Устанавливается дифференцируемость и приводятся формулы производных функций, возникающих при переходе к конечномерной задаче. Приводятся примеры численной реализации предлагаемого подхода.

Ключквые слтва: задачи оптимального управления со свободным временем, сплайновая интерполяция управления, подвижная сетка, формулы производных.

Введение

Как отмечено в [1], «проблема синтеза оптимального управления для сложных динамических систем аналитически неразрешима и сопряжена с принципиальными и вычислительными трудностями». Поэтому актуальной является разработка таких численных методов оптимизации, которые: 1) позволяли бы алгоритмически разделять проблему оптимизации и проблему решения (для текущего управления) управляемой начально-краевой задачи (НКЗ); 2) позволяли бы оптимизировать нелинейные динамические системы; 3) были бы применимы к задачам с варьируемой областью; 4) были бы достаточно простыми в описании и реализации; 5) позволяли бы использовать готовые математические пакеты; 6) позволяли бы учитывать специфику задачи для упрощения расчетов; 7) позволяли бы использовать информацию из принципа максимума (если таковая доступна) для сужения сферы поиска; 8) при своей общности и универсальности в сравнении с известными алгоритмами, специально разработанными для решения простых линейных задач, не давали бы существенного увеличения количества итераций; 9) обеспечивали бы устойчивость в работе и сходимость (или, по крайней мере, существенное уменьшение целевого функционала) из любого разумного начального приближения. Вообще говоря, некоторые из этих запросов трудно совместить. В частности, если говорить о пунктах 2) и 3), существует обширная литература, касающаяся линейной задачи быстродействия для сосредоточенных систем, значительно меньше - для распределенных систем

(укажем, например, [2]), и почти нет работ, посвященных приближенному решению аналогичных задач для нелинейных распределенных систем. Учитывая современный уровень развития вычислительной техники, сегодня можно считать, по-видимому, что для прикладников главными из этих требований являются 2), 4), 5) и 9). Поэтому не случайно, что при оптимизации сложных динамических систем зачастую используется метод конечномерной аппроксимации всей задачи управления (как самого управления, так и управляемой системы; см., например, [3]), который позволяет свести исходную задачу бесконечномерной оптимизации к задаче математического программирования. Суть его заключается в разностной аппроксимации управляемой системы с достаточно мелким шагом разбиения. Но такой подход приводит к большой размерности редуцированной (конечномерной) задачи. В данной статье предлагается подход, который позволяет существенно снижать размерность редуцированной задачи и при этом единообразно решать задачи как с фиксированной, так и с варьируемой областью. В целях простоты изложения рассматривается случай сосредоточенной системы. Тем не менее, излагаемые результаты допускают обобщение на случай распределенных систем, которые могут быть сведены к функционально-операторному уравнению [4,5]. Основная идея предлагаемого подхода родственна идее метода конечных элементов (успешно применяемого физиками и инженерами для численного решения НКЗ, связанных с распределенными системами). Подобно тому как в методе конечных элементов искомое решение представляется в виде

сплайна, так же и мы предлагаем представлять в виде сплайна искомое управление, но при трех существенных отличиях. Во-первых, в методе конечных элементов сплайн (традиционно) должен быть непрерывным; управление же естественно искать в виде разрывного сплайна: область независимых переменных разбивается на простые подобласти (конечные элементы), и на каждой из них искомое управление представляется в виде некоторого полинома (в данной статье речь идет о полиномах нулевой или первой степени, то есть о кусочно-постоянной либо о линейной сплайновой интерполяции). Условие непрерывной стыковки полиномов не требуется. Количество элементов разбиения (а в общем случае и степень полиномов) можно существенно уменьшить, если (из принципа максимума) доступна информация о структуре оптимального управления и, в частности, информация о количестве точек (линий, поверхностей) переключения. Во-вторых, конечные элементы естественно предполагать не фиксированными, а подвижными. Это, собственно, и позволяет существенно уменьшить их число. В-третьих, область изменения независимых переменных может быть не фиксирована. Например, если она представляет собой отрезок [0;Т] с подвижным правым концом Т, то текущее Т можно получить как сумму длин конечных элементов и эти длины трактовать как управляющие переменные. Существенным условием для нашего подхода является предположение о том, что целевой функционал, а также функционалы, задающие ограничения, при фиксированной области ПсRn изменения независимых переменных могут быть представлены в виде функционала, зависящего только от управления: ^и] = F[хи,и], где и еD - управление, хи -отвечающее ему (единственное) решение управляемой задачи Коши (или вообще НКЗ), D - множество измеримых управлений, принимающих значения в некотором ограниченном множестве пространства Я5; F: X1 х D ^ Я -заданный функционал, удовлетворяющий некоторым естественным требованиям, X - некоторое лебегово пространство функций на П. Такое представление позволяет отдельно решать управляемую задачу для текущего управления любым приемлемым способом (в частности, использовать для этого подходящие математические пакеты). В результате описанной выше сплайновой интерполяции искомого управления функционал ^и] исходной задачи обращается в функцию нескольких переменных. Основной результат, который мы представляем в данной статье, заключается в том,

что при некоторых естественных требованиях упомянутая функция оказывается дифференцируемой и удается получить формулы для ее частных производных. Поэтому для решения редуцированной задачи математического программирования можно использовать стандартные численные методы конечномерной условной оптимизации (и, в частности, готовые математические пакеты). Если количество точек переключения в оптимальном управлении невелико, то и размерность редуцированной задачи тоже будет невысока.

1. Основные обозначения и соглашения

Пусть 1, 5 е N - заданные числа, т = I; а , Ре Я5, 0е Я1 - заданные векторы;

D = {и е Ь! [0;+<»):и(?) е[а;Р] для п.в. г е[0;+ю)}-множество допустимых управлений; f(г,Е,и): [0;+!) х Я1 х Я5 ^ Ят - заданная функция, непрерывно дифференцируемая по переменным Е е Я£, ие Я5 и вместе с производными измеримая по г е [0;+<»), непрерывная по {Е; и}е Я1 х Я5. Рассмотрим управляемую систему

х' = /(г,х,и), г е[0;+!), х е АС1 [0;+!), и е D; _

х(0) = 0.

Здесь АС1 [0;+<») - пространство функций, принадлежащих АС1 [0;Т] для любого фиксированного Т > 0 ; АС[0;Т] - пространство функций, абсолютно непрерывных на [0;Т], наделенное нормой ||х||АС[0;Т]=| х(0)| +|х'||ч[0.Т]. Норму вектор-функции понимаем как норму ее модуля; модуль вектора - как сумму модулей компонент. Положим Пт =[0;Т]. Перечислим основные предположения.

F1)УТ е Я+п, х е Ь!(ПТ), и е Ь!(ПТ) имеем: f (., х(.),и(.)) е Ь (Пт );

F 2) УТ е Я+, х е Ь! (Пт ), и е ЬКПт ) суперпозиция / (.,х(.),и(.)) е (ПТ);

F 3) функция /и (г, ^ и) = /и(г,Е) не зависит от и и непрерывна;

F 4) УТ е Я+, х е Ь! (ПТ) имеем / (., х(.)) е е ьг (П т );

в) У Т е Я+ существует константа у(Т) > 0, такая, что управляемая задача Коши (1) имеет

единственное решение х[и, Т] е С(ПТ У для всех и е D и при этом ||х[и,Т]|| . < у(Т).

II ! (ПТ )

Достаточные условия выполнения предположения Н) можно найти в [4,5]. При каждом Т > 0 будем рассматривать функционал

Т

/ [и] = / [и](Т) = ^ (г, хи (г), и(г )^г,

0

где функция F(г,Е,и): [0;+!) х Я1 х Я5 ^ Я

удовлетворяет таким же условиям, как каждая компонента вектор-функции /. Управляемая задача Коши (на каждом отрезке [0;Т] ) представима интегральным уравнением х = 0 + А[/(.,х,и)](г), г е [0;Т],

х е Ь![0;Т],

где А : Ь1[0;Т] ^ Ь^ [0; Т] - лигкйбый тграги-

г

чкггый тпкраттр (ЛОО), А[ z](г) = ^(т^т.

0

Поскольку время Т > 0 мы считаем свободным, то управляющими наборами являются пары {и;Т}е D х Я+ . Положим у = у[и,Т]е АС1 [0;Т]

- решение сопряженного уравнения

V = А*[(/')* у + (^')*].

Здесь = /Хх,и) и т.д.; А*: Ь![0;Т] ^

^ Ь! [0;Т ] - оператор, сопряженный к оператору

Т

А : Ь1[0;Т] ^ Ь^[0;Т], то есть А*^](г) = jz(т)dт.

г

Для дальнейшего отметим, что по нашим предположениям функции /и (г, Е, и ), Fи' (г, Е, и) не зависят от , в частности,

F (г, Е,и ) = Ф0 (г, Е) + (Ф(г, Е),и). (2)

2. Кусочно-постоянная сплайновая интерполяция

Предположим, например, что из анализа принципа максимума нам известно, что оптимальное управление и* в некоторой оптимизационной задаче, связанной с исходной задачей Коши и содержащей функционал /[и](Т) (как

целевой или задающий одно из ограничений), является кусочно-постоянным и имеет не более (V -1) точки переключения на оптимальном

промежутке [0; Т*]. В таком случае имеет смысл для каждого текущего Т разбивать отрезок [0;Т ] только на V (или чуть большее количество в случае проблем со сходимостью)

промежутков [0;Т] = |^|[тг-1; т, ].

1=1

Соответственно будем рассматривать управляющие перемен-ные двух типов. Управляющие переменные первого типа будем

обозначать hi е Я, , = 1, V . Управляющие

переменные второго типа будем обозначать ю, е[а;Р], i =1, V . Упорядоченные наборы управляющих переменных первого типа будем обозначать h. Аналогичный смысл будет иметь обозначение 5. Для единообразия всегда будем считать, что к0=0, т0=0, юу+1=0. Кроме того, будем полагать

Т = Т[к] = ]Гк,2, т, = т, [к] = .

,=1 ,=1

С каждой парой {к; 5} будем соотносить кусочно постоянное управление

и(г)= к-, г е [т1-1[к ]; т, [к ]);

[0, г > т [к ].

В результате функционал /[и] обращается в функцию / {к; 5} V- (1 + 5) переменных.

Замечание. Мы используем квадраты к2 вместо к, чтобы избавиться от ограничений к > 0 в редуцированной задаче. Чтобы избавиться от ограничений ю, е [а; Р], достаточно в указанной выше формуле для и(г) взять вместо ю, вектор с компонентами У+ + У- б^ю, ), 7 = 1,5, где у+ =(а + Р)/2,

у- = (Р - а)/2. Это в любом случае имеет смысл сделать, поскольку сокращает количество ограничений в редуцированной задаче сразу на 2v 5. Мы не делаем этого выше, только чтобы упростить изложение.

Положим Г(г ) = Г[и,Т](г) = у"[и,т ](г) х

х /и (г, х„ (г)) + F:(г, х„ (г)).

Пользуясь формулой (1), удается показать, что функция / {к; 5} непрерывно дифференцируема по всем переменным и при этом справедливы следующие формулы для частных производных (см. (2)):

а/

Эю,.

т, [к ]

|г(г^г, , = 1,V

(3)

т,-1[

У = {Ф 0(Т, хи (Т)) +

ал,.

+ (Г* (т,), ю, ) + £ (Г*(т,) -Г*(т,-,), ю , )}2к,

т, = т, [к ], , = 1, V .

(4)

Задачу, которая отличается от исходной задачи оптимизации

J0 [u](T) ^ min, u е D,

[и](Т) < 0, , = 1,к; [и](Т) = 0, , = к +1,ц,

тем, что каждый из функционалов [и](Т) =

Т

= (г, хи ,u)dг, , = 0, ц , заменяется соответст-

0

вующей функцией многих переменных {к;5}

по описанной выше процедуре, мы называем ркдуциртванбтй задачкй математического программирования.

Формулы (3), (4) позволяют (по крайней мере, формально) использовать для решения оптимизационной задачи численные методы условной оптимизации функций многих переменных до первого порядка включительно. Изложенный подход особенно легко применяется в том случае, когда управляемую задачу для каждого управления принятой структуры можно решить аналитически.

3. Применение к линейной задаче быстродействия

Рассмотрим в качестве тестовой задачи линейную задачу быстродействия [6]:

= х, х[ = х, х\ = и,

25 2 35 3 (5)

х( 0) = 0;

/0[и](Т) = Т ^ шт, Т >0,

и е D = {и е Ья [0;+!) :| и(г) |< 1}, (6)

/1[и](Т ) = х1[и](Т ) = 16,

/[ [и](Т) = х, [и](Т) = 0, , = 2,3.

Как отмечено в [6, глава III, §27], данная задача «использовалась рядом авторов в качестве теста, на котором отрабатывались предлагаемые ими методы приближенного решения». Связано это с тем, что (см. там же) при решении этой задачи различными методами возникают определенные трудности, которые не так легко преодолеть. В частности, в [6, глава III, §27] для ее решения используется некоторая специальная модификация метода сведения к так называемой П-системе [6, глава II, §14]. Указанная модификация существенно увязывается с видом данной конкретной задачи, поскольку (помимо того, что используется вид оптимального управления, диктуемый принципом максимума) требует подбора весовых коэффициентов в некоторой норме (а правила этого подбора не алгоритмизируются). Кроме того, успешная реализация метода требует достаточно хорошего начального приближения. Наконец, сам по себе метод П-систем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(7)

имеет ряд существенных ограничений, что значительно сужает сферу его применения (подробнее см. [6, глава II, §14]). При выборе начального значения T = 4.33 (помимо значений некоторых других параметров) и при фиксированном шаге сетки 0.01 упомянутая модификация метода П-систем позволяет в [6, глава III, §27] решить задачу (5)-(7) за 12 итераций и требует решения некоторой задачи Коши (включающей как исходную систему, так и сопряженную систему) порядка ста раз, а также решения (методом Ньютона) системы нелинейных уравнений на каждой итерации. Значение времени быстродействия получается T = 8 .

Конкретизируем для задачи (5)-(7) предлагаемый подход и приведем результаты его численной реализации. В соответствии с [7] можно ожидать, что оптимальное управление принимает лишь два значения -1, 1 (собственно говоря, это следует из анализа принципа максимума) с числом переключений, равным количеству уравнений системы, то есть трем. Поэтому возьмем v = 4, считая управление постоянным

на каждом промежутке [xj-1; t,), i =1,4. Целевой функционал преобразуется в функцию пе-

^ 4

ременных h : J0{h} = ^Д2. Соответствующие

i=1

частные производные вычисляются очевидным образом. Вместо параметров ю,, i =1,4, будем использовать sin ю,. Это позволяет снять условие принадлежности отрезку [—1;1]. С учетом интегральных представлений

T

Jj [u](T) = Xj (T) = jx2 (T)dT,

0

T

J2 [u](T) = x2 (T) = Jx3 (x)dx,

0

T

J3[u](T) = x3(T) = Ju(x)dx,

0

а также аналитического решения сопряженной системы формулы частных производных для

соответствующих функций Jj {h; ю} для j = 1,3, i =1,4 принимают вид

J - [(T — ,i)3 — (T — ,ы )3], Ti - £hj,

Эю,. 6 jf j

J = — ^ [(T — t, )2 — (T — t,—1)2],

Эю, 2

dJ3 Г 1 1,2

----= cosra,It,. — t, ,1 = h, cosra,;

l L l l —1 J l l ~

= {Я, (Т) + (т,)sinю, +

эл,

+ £ [Ч, ^ ) - Ч (тк-1 )]^ПЮ к }2к,;

к=,+1

^(т^-^-^2, ВД = Т-т, ВД = 1,

Я,(Т ) = х2(Т), Я2(Т) = х3(Т), Я[ (Т) = 0. Аналитическое выражение решения системы (5) через управление (с учетом интегрирования по частям) дает

Smю

3(Т ) = £/»>

1 4

х2(Т)=х3(Т )Т - - 2[т-2 - т2-1]sinю,,

2 ,=1

Т2 1 4

х1 (Т) = х2 (Т)Т - х3 (Т)^ + ТХ![т3 - т3-1 ]SІnЮ,,

2 6М

откуда получаем выражения {к;5} , , =1,3.

Редуцированная задача:

/0{к; 5} ^ шin, к е Я4, Юе Я4,

/1{к; Ю} = 16, /2{к; Ю} = /3{к; Ю} = 0. Приведем результаты численного решения редуцированной задачи SQP-методом. Выбирая

начальные значения к 1 = 0.5, , =1,4 (что соот-

4

ветствует времени Т = ~^к2 = 1), находим ре-

,=1

шение за 30 итераций, при этом вычислений функций (то есть решений задачи Коши, если бы она решалась численно) - 254; см. таблицу

1. Здесь 8 - точность выполнения ограничений. На последнем шаге: т = {0;2;4.0312;6;8},

бшю = {1;-1;-1;1}.

Отметим, что для решения именно линейных задач быстродействия разработаны и более со-

временные методы, нежели тот, который использовался в [6, глава III, §27], см., например, [8] (там же см. дальнейшую библиографию). Согласно результатам численных экспериментов, приведенным в [8], соответствующие цифры, вообще говоря, сопоставимы с [6, глава III, §27]. Однако метод [8] обладает некоторыми преимуществами.

4. Кусочно-линейная сплайновая интерполяция

Пусть задано число V е N. Так же, как и раньше, будем рассматривать управляющие переменные двух типов. Управляющие переменные первого типа будем обозначать к, е Я ,

, = 1, V . Управляющие переменные второго типа

будем обозначать ю , ={ю(1);ю(2)} е [а;Р]2,, = 1, V . Соответствующие наборы переменных обозначим к , Ю . Кроме того, будем полагать

Т = %, т, = т,[к ] = ^, т0 = 0

,=1

и,[ю; т-, т] (ґ) =_ \ [(®(2) - ю ,(1))t +

т- ].

т.. - X,

+ Ю(1) X - Ю(2) X,

С каждой парой {А; ю} будем соотносить кусочно-линейное управление М(ґ) = |и,[ю;т,-1,т,](ґ), ґє[х,.-1[А];т,[А]), , = 1,V;

|0, ґ > Т [А ].

В результате функционал J[u] обращается в функцию V- (1 + 2s) переменных, которую будем обозначать J {А; ю}. При сделанных предположениях данная функция имеет частные производные по всем переменным, которые определяются формулами1 (см. (2)):

Таблица 1

X

Итер. Т 8 Итер. Т 8 Итер. Т 8

1 1.004 16 11 8.0289 0.53399 21 8 8.4505е-005

2 197.6111 15.9804 12 7.8283 0.83413 22 8 0.00012472

3 1.0468 15.9761 13 7.8758 0.51912 23 8 1.3343е-006

4 168.1172 0.27226 14 7.9231 0.28451 24 8 1.3728е-006

5 8.4621 0.26524 15 7.9607 0.1314 25 8 1.2456е-006

6 8.3881 0.26515 16 7.9977 0.006327 26 8 1.095е-006

7 8.1662 0.74715 17 8.0002 7.5555е-005 27 8 8.9936е-007

8 8.1273 0.76457 18 8.0002 4.1869е-005 28 8 7.6278е-007

9 8.1272 0.7645 19 8.0001 6.0988е-005 29 8 1.7095е-007

10 8.0299 0.54166 20 8.0001 8.2054е-005 30 8 1.7364е-008

а/ 1

дга(1) к2

а/ 1

5га(2) А2

і

|г(ґ)(х, - ґ)dt;

Ч-1 х,

|г(ґ )(ґ -Xl-1)dt;

(8)

а/

— = 2А, [®0(Т, х[и, Т ](Т)) +

оА,

ю(1) -ю(2)

- х , )М—,--Ч- +

+ Г Г(ґ )(ґ -х,-^-

(х, -х'-1)

+ Г(х,.)ю(2) + ]Г{Г(х-Г(ху-1)ю(^1' -

І=,+ 1

Г с

I Г(ґ)Лґ-

-}].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х І-1

[и] = |(х[и](ґ) - Хґ))2 Л

Т = Т, фиксирован, то в рамках нашего подхода мы должны ввести ограничение:

/2{Ъ} -]ГА2= Т,. (12)

,=1

Итак, оптимальное управление будем искать в виде

и(ґ) =

и, (ґ) = - V )ґ +

+vlх,- щ хl-l], ґ є [х,-1/х,),, =1,V,

0, иначе,

где х, = , Х0 =0, Vi = si

V = Sinю(1), щ = sinю(2),

І=1

(9)

Из формул (8), (9) видно, что указанные производные непрерывны по совокупности

переменных, и, таким образом, функция / {к; Ю} непрерывно дифференцируема.

5. Применение к задаче о прокладке трассы

Рассмотрим вариант математической постановки известной задачи о прокладке трассы:

а переменные ю(1), ю(2) е Я , , =1, V , считаем управляющими. Тогда непосредственным вычислением получаем:

г 1 ,-\

х[и,Т](г) = |и(т)<* = -+ vj)(т, - т,-1) +

, г - т,-1

2(щ. - vi)(ґ + х,-1) + vi х, - щ х,-1

ґ є [х,-1 / х,). В частности,

1 ,

х(т ) = ^2 £(Ч + V-)(х І ^-^

2 І=1

1

/1-х(Т )-1 £<щ + ^)(х І-х і-1).

І=1

/1[и] = х[и](Т) = р, u(t) є [-1;1] Уґ є [0;Т], (10)

(11)

[х'(г ) = и (г), г е (0;Т ], [х(0) = 0.

Далее мы будем считать, что Т = Т* = 2, Р = 1, у(г) = (5 /12) -г(г - 0.8)(г -1), г е Я. Сразу оговоримся, что совершенно аналогично можно рассмотреть случай свободного «времени» Т . Отличие состоит лишь в том, что в редуцированной задаче будет одним ограничием меньше (см. (12) далее). В задаче со свободным «временем» применение нашей схемы дает Т* =2.1218. Из анализа принципа максимума для задачи (10), (11) следует, что оптимальное управление на некоторых участках отрезка [0;Т ] будет совпадать с функцией у (г). В соответствии с этим естественно использовать кусочно-линейную сплайновую интерполяцию искомого управления. Возьмем V =10 и поло-

V

жим Т = считая переменные к, е Я ,

,=1

, = 1, V , управляющими. Поскольку параметр

Тем самым, целевой функционал /0[и] обращается в некоторую функцию /0{к; Ю} тридцати переменных. Исходная задача преобразуется к виду

/0{к;Ю} ^ шт, /1{к;Ю} = Р,

/2{А} = Т,, А єRv, ЮєR2v.

(13)

Задачу (13) можно решать любым численным методом до первого порядка включительно. При использовании метода первого порядка здесь понадобится знание производных функций /0{к;Ю} , /1{к;Ю}, /2{к}. Производные

функций /1{к;Ю}, /2{к} вычисляются совершенно очевидным образом. При этом нетрудно убедиться в том, что полученные выражения согласуются с общими формулами (8), (9). Вычисляя частные производные целевой функции

/0{к; Ю} по формулам (8), (9), получаем:

а/ 0 = _[_

Оу,. А2

I У(ґ)(х, - ґ)Лґ;

х

X

х І-х І-1

х, - х,-1

X

3 = Эщ к.

1 т,

- | ^(г)(г -т,-1)^г,

дЗ0 дЗ0 (1)

---— =---------^СОЭЮ \

Эю(1) Эу.

аз аз.

0 -‘~0^ю(2);

Эю(2) Эщ.

I I

аз -

= 2к, [(3{к; Ю} - у(Т ))2 +

ак,

I

| у(г )(г - xf-l)dг -

(т,-т,-1)

,-1

V

+ У(т, )щ, + ^ Мт, )щ, - У(т,-1)у, -

j = ,+1

}],

Т

где у(г) = 2 |[х(т) - y(т)]dт. Приведем резуль-

г

таты численного решения редуцированной задачи (13) SQP-методом. Выбирая начальные

значения к = л/0.2 , , = 1,10 (что соответствует

10

времени Т = ^к2 = 2), Ю = 0 , при использова-

,=1

нии SQP-метода в собственной реализации находим решение за 92 итерации; число вычислений функций (то есть решений задачи Коши, если бы она решалась численно) - 651. На последнем шаге (см. рис. 1; здесь пунктиром изображен график функции у(г) , а сплошной линией - оптимальная траектория, найденная программой): 30 = 0.042397 , 8 = 2.3028 -10-6, т = {0;0.2326;0.5255;0.8553;0.9901;1.0027; 1.0045;1.0514;1.6079;2;2},

V = {0.2553;-0.0289;-0.1164;0.0077;0.3193; 0.6598;0.9408;1;1;0.9751},

щ = {0.1502;-0.0990;-0.0896;0.0796; 0.4294;0.7628;0.9811;1;1;0.9696}.

При этом оптимальное управление обнаруживается с пренебрежимо малой погрешностью уже на сорок девятой итерации при достаточно высокой точности выполнения ограничений.

Работа выполнена при финансовой поддержке Минобрнауки РФ в рамках гос. задания на оказание услуг в 2012-2014 гг. подведомственными вузами (шифр заявки 1.1907.2011) и при поддержке ФЦП «Научные и научнопедагогические кадры инновационной России» на 20092013 годы (проект НК-13П(9)).

Рис. 1. Задача о прокладке трассы Примечания

1. Мы предполагаем здесь, что к Ф 0. В случае к, = 0 все поименованные далее производные равны нулю.

Список литературы

1. Габасов Р., Кириллова Ф.М. Оптимальное

управление в режиме реального времени // Вторая Международная конференция по проблемам управления. Пленарные доклады. М.: Институт

проблем управления, 2003. С. 20-47.

2. Васильев Ф.П., Иванов Р.П. О приближенном решении задачи быстродействия в банаховых пространствах при наличии ограничений на фазовые координаты // Ж. вычисл. матем. и матем. физ. 1971. Т. 11. № 2. С. 328-347.

3. Албу А.В., Албу А.Ф., Зубов В.И. Вычисление градиента функционала в одной задаче оптимального управления сложной динамической системой // Ж. вычисл. матем. и матем. физ. 2011. Т. 51. № 5. С. 814-833.

4. Чернов А.В. Об одном мажорантном признаке тотального сохранения глобальной разрешимости управляемого функционально-операторного уравнения // Изв. вузов. Математика. 2011. № 3. С. 95-107.

5. Чернов А.В. О мажорантно-минорантном признаке тотального сохранения глобальной разрешимости управляемого функционально-операторного уравнения // Изв. вузов. Математика. 2012. № 3. С. 62-73.

6. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 487 с.

7. Хайлов Е.Н. Об аналитической параметризации множества управляемости в линейной задаче управления // Матем. заметки. 1988. Т. 44. № 3. С.405-406.

8. Александров В.М. Итерационный метод вычисления в реальном времени оптимального по быстродействию управления // Сиб. журн. вычисл. матем. 2007. Т. 10. № 1. С. 1-28.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т

,-1

+

+

т

ON APPROXIMATE SOLUTION OF FREE TIME OPTIMAL CONTROL PROBLEMS

A. V. Chernov

A method is suggested of reducing fixed/free time optimal control problems to a mathematical programming problem of a comparatively small dimension. The basic idea of the suggested approach consists of a finite-dimensional approximation of a desired control by a discontinuous spline interpolation with a floating mesh. The differentiability of the functions arising in the transition to a finite-dimensional problem is set up and the formulas of their derivatives are given. Numerical examples of the suggested method are presented.

Keywords: free time optimal control problems, control spline interpolation, floating mesh, derivative formulas.

i Надоели баннеры? Вы всегда можете отключить рекламу.