Научная статья на тему 'Вычислительное сравнение методов градиентного типа в задачах оптимального управления'

Вычислительное сравнение методов градиентного типа в задачах оптимального управления Текст научной статьи по специальности «Математика»

CC BY
96
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
задача оптимального управления / процедуры улучшения / квазиградиентные процедуры / вычислительный эксперимент

Аннотация научной статьи по математике, автор научной работы — В А. Срочко, В А. Срочко, Н В. Мамонова

Оценка эффективности итерационных методов во многом определяется результатами вычислительного эксперимента по решению характерных тестовых и прикладных задач. Статья содержит информацию по численной реализации типовых градиентных методов в сравнении с предложенными авторами модификациями для приближенного решения задач прикладного содержания, известных по литературе (химическая технология, электротехника).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The numerical comparison of gradient methods in optimal control problems

The efficiency of iterative methods is essentially estimated by the results of virtual experiment benchmarks solving. This paper deals with the numeric implementation of standard gradient methods in comparison with modifications of approximate solutions for the well-known applied problems (chemical technology, electrical engineering).

Текст научной работы на тему «Вычислительное сравнение методов градиентного типа в задачах оптимального управления»

Серия «Математика»

Том 1 (2007), № 1, С. 275-290

Онлайн-доступ к журналу: http://isu.ru/izvestia

ИЗВЕСТИЯ

Иркутского государственного университета

УДК 517.977

Вычислительное сравнение методов градиентного типа в задачах оптимального управления *

В. А. Срочко

Иркутский государственный университет, Иркутск В. Г. Антоник

Иркутский государственный университет, Иркутск Н. В. Мамонова

Байкальский государственный университет экономики и права, Иркутск

Аннотация. Оценка эффективности итерационных методов во многом определяется результатами вычислительного эксперимента по решению характерных тестовых и прикладных задач. Статья содержит информацию по численной реализации типовых градиентных методов в сравнении с предложенными авторами модификациями для приближенного решения задач прикладного содержания, известных по литературе (химическая технология, электротехника).

Ключевые слова: задача оптимального управления, процедуры улучшения, квазиградиентные процедуры, вычислительный эксперимент.

Введение

К настоящему времени усилиями многих исследователей определились основные классы итерационных методов оптимального управления:

- методы принципа максимума (вспомогательная задача на максимум функции Понтрягина, игольчатое варьирование управлений);

- методы градиентного типа (вспомогательная задача дифференциального принципа максимума в линейной или проективной форме, слабое варьирование управлений);

- методы улучшения на основе принципа расширения (линейно-квадратичная аппроксимация функции Кротова, регуляризация целевого

* Работа выполнена при финансовой поддержке РФФИ, проект 05-01-00187

функционала как способ варьирования управлений);

- методы дискретизации (конечно-разностная аппроксимация задачи, применение методов математического программирования);

- опорные, корректирующие и адаптивные методы поиска программных и позиционных управлений (кусочно-линейная аппроксимация исходной задачи, асимптотическая коррекция решения линеаризованной задачи);

- методы глобальной оптимизации в невыпуклых задачах специальной структуры (необходимые и достаточные условия оптимальности, разрешающие наборы, улучшение стационарных управлений).

На этом обширном и многогранном итерационном поле градиентные методы (процедуры слабого варьирования) не теряют своей актуальности, сохраняют хорошую репутацию и являются стандартным инструментом численного решения задач оптимального управления. Техника их построения и анализа на вариационном уровне достаточно отработана и вполне соответствует конечномерным аналогам в математическом программировании. Однако, в целях повышения эффективности численного решения имеется необходимость более глубокой адаптации градиентной технологии к задачам оптимального управления. Специфика этих задач уже не в первый раз позволяет внести нетривиальные изменения в сложившиеся структуры итерационных процедур и выявить дополнительные резервы повышения качества того или иного метода.

Оценка эффективности итерационных методов во многом определяется результатами вычислительного эксперимента по решению характерных тестовых и прикладных задач. Данная статья содержит информацию по численной реализации предлагаемых методов и модификаций для приближенного решения ряда задач прикладного содержания, известных по литературе (химическая технология, электротехника). Предварительно была проведена алгоритмическая и программная проработка методов (схема численного интегрирования дифференциальных уравнений, выбор констант, стратегия поиска параметров варьирования, условия остановки, компьютерная программа и т.д.). Конечная цель эксперимента состояла, как обычно, в сравнении различных методов (предлагаемых и известных) по некоторым показателям, характеризующим процесс и качество решения задачи (эволюция уменьшения функционала, рекордное значение функционала и соответствующее число задач Коши, итоговые реализации управления и фазовых траекторий). Результирующая картина расчетов не является однозначно определенной, однако доминирующий вывод связан с нетривиальным преимуществом разработанных методов в сравнении с известными процедурами (наилучшее значение функционала, затраты на решение).

ВЫЧИСЛИТЕЛЬНОЕ СРАВНЕНИЕ МЕТОДОВ ГРАДИЕНТНОГО ТИПА 277 1. Постановка задачи

Рассмотрим задачу на минимум целевого функционала

Ф(и) = ip(x(t{)) + / F(x, u, t)dt ^ min, (1.1)

jt

относительно фазовой системы

X = f (x,u,t), x(t0) = x0 , (1.2)

в классе допустимых управлений

V = {и £ Lr00(T) : u(t) £ U , t £ T} . (1.3)

Здесь t - независимая переменная, u(t) £ Rr - управление, x(t) £ Rn -фазовое состояние.

Предположим, что в задаче (1.1)-(1.3):

1) функция ^(x) дважды непрерывно-дифференцируема на Rn, инте-грант F (x, u, t) и вектор-функция f (x, u, t) непрерывны по совокупности своих аргументов на Rn x U x T вместе с производными по переменной x до второго порядка включительно;

2) существуют непрерывные производные Fu(x,u,t), fu(x,u,t) на множестве Rn x U x T;

3) множество U С Rr - выпуклое замкнутое множество.

Будем считать, что каждому допустимому управлению u £ V соответствует единственное, абсолютно-непрерывное решение x(t,u), t £ T задачи Коши (1.2). Пару (u(t), x(t,u)), t £ T назовем допустимой в задаче (1.1)-(1.3), если u £ V, а x(t, u) - соответствующая фазовая траектория.

Определим необходимые конструкции для задачи (1.1)-(1.3). Введем в рассмотрение сопряженную переменную ф £ Rn и образуем функцию Понтрягина

H (ф, x, u, t) = (ф, f (x, u, t)) — F (x, u, t).

Определим сопряженную задачу

ф = —Hx(ф,x,u,t) , ф(ь) = —Vx(x(ti)). (1.4)

Сформулируем необходимые условия оптимальности в задаче (1.1)-(1.3).

Пусть (u(t),x(t,u)) - допустимая пара, x(t,u) - решение сопряженной системы (1.4) при u = u(t), x = x(t,u). Будем использовать обозначения

Hu[t, u] = Hu(^(t, u), x(t, u), u(t), t), t £ T ;

Pu(•) - оператор проектирования на множество U в евклидовой метрике.

Дифференциальный принцип максимума: для оптимальности управления u(t), t € T в задаче (1.1)-(1.3) необходимо, чтобы

u(t) = Pu(u(t)+ a Hu[t,n]), t € T, a > 0 . (1.5)

Условие стационарности: для оптимальности управления u(t) € int U, t € T в задаче (1.1)-(1.3) необходимо, чтобы

Hu[t,u] =0 , t € T. (1.6)

Отметим, что вектор-функция Hu[t,u] есть антиградиент функционала Ф на управлении u(t).

Перейдем к описанию процедур улучшения допустимых управлений в поставленной задаче [1]-[4].

2. Процедуры улучшения 2.1. Процедуры улучшения в задаче вез ограничений

Рассмотрим задачу (1.1)-(1.3) без ограничений на управление, когда U = Rr. Отметим, что в этом случае условием оптимальности управления u(t), t € T является соотношение (1.6).

Приведем общую схему процедуры слабого улучшения:

1) по заданному управлению u € V найдем соответствующие траектории x(t, u) и u);

2) образуем семейство управлений

Ua(t) = u(t) + a s(t), t € T, a > 0; (2.1)

3) найдем значение параметра a > 0 из условия улучшения: $(ua) <

Ф(п).

Укажем конкретные варианты функции s(t) в (2.1):

- первая процедура слабого улучшения

s(t) = Hu[t, u] ;

- вторая процедура слабого улучшения (П02))

g(t)

s(t) =

МП!«'

где д(Ь) = {Ни[Ь,и], Ни[Ь,и]) — функция невязки.

Опишем общую схему модифицированной процедуры: 1) по допустимой паре (и(Ь),х(Ь,и)) найдем сопряженную траекторию

ф(Ь,и);

2) сформируем а-параметрическое семейство управлений

иа(Ь,х) = и(Ь) + а в(х,Ь) , х € Еп , Ь € Т, а> 0; (2.2)

3) найдем траекторию ха(Ь), Ь € Т как решение задачи Коши для фазовой системы

Х = /(х,иа(Ь,х),Ь), х(Ь0) = х0 вместе с управлением

Уа(Ь) = иа(г,ха(г)) , Ь € Т ;

4) параметр а > 0 будем искать из условия улучшения Ф(г>а) < Ф(и). Конкретизируем варианты выбора функции в(х,Ь) в (2.2):

- .модифицированная процедура первого порядка (Щ)

в(х, Ь) = Ни(ф(Ь, и),х, и(Ь), Ь);

- модифицированная процедура второго порядка (П2)

в(х, Ь) = Ни(р(Ь, и, х),х, и(Ь),Ь),

где

р(Ь, и, х) = ф(Ь, и) + Ф(Ь, и)(х — х(Ь, и)),

а (п х п) симметричная матричная функция Ф(Ь, и) является решением матричной задачи Коши

Ф = —/х[Ь,и]ТФ — Ф/х[Ь,и] — Нхх[Ь,и] ,

Ф(Ь) = —фхх(х(Ь1,и)).

Сформулируем общий результат о возможности улучшения для указанных процедур: если базовое управление и(Ь) не является стационарным, то Ф(-ш) < Ф(и) для малых а > 0, где и> = иа V уа.

2.2. Проективные методы улучшения в задаче с ограничениями

Рассмотрим задачу (1.1)-(1.3) в исходной постановке (и - выпуклое, замкнутое множество). В рамках данной задачи естественно использовать операцию проектирования на множество и. При этом базовым условием оптимальности является дифференциальный принцип максимума (ДПМ) в проективной форме (1.5).

Общая схема процедур проектирования: 1) пусть (и(Ь), х(Ь,и)), Ь € Т - допустимая пара в задаче (1.1)-(1.3), ф(Ь,и), Ф(Ь,и) - решения векторной и матричной сопряженных систем,

р(Ь, и, х) = ф(Ь, и) + Ф(Ь, и)(х — х(Ь, и)), х € Кп

- вспомогательная вектор-функция;

2) для а > 0 определим процедуру варьирования

иа(Ь,х) = Ри(и(Ь) + ав(х,Ь)); (2.3)

3) найдем решение ха(Ь), Ь € Т фазовой системы

Х = /(х, иа(Ь, х), Ь), х(Ь0) = х0 вместе с управлением ьа(Ь) = иа(Ь,ха(Ь)), Ь € Т;

4) определим задачу поиска параметра а условием улучшения функционала

Ф(уа) < Ф(и) , а> 0.

Приведем варианты функции в(х,Ь) в (2.3):

- метод проектирования первого порядка

в(х, Ь) = Ни(ф(Ь, и),х, и(Ь), Ь);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- метод проектирования второго порядка

в(х, Ь) = Ни(р(Ь, и, х),х, и(Ь),Ь).

Сформулируем основное утверждение о локальном уменьшении целевого функционала — если управление и € V не удовлетворяет ДПМ в задаче (1.1)-(1.3), то проективные методы первого и второго порядка обеспечивают локальное улучшение: для малых а > 0

Ф(Уа) < Ф(и).

2.3. Квазиградиентные процедуры в задаче с выпуклым и компактным ограничением на управление

Рассмотрим задачу (1.1)-(1.3) при дополнительном условии ограниченности множества и. Иначе говоря, множество и предполагается выпуклым компактом в Кг.

Пусть и(Ь), Ь € Т - допустимое управление с траекториями х(Ь,и), ф(Ь, и) фазовой и сопряженной систем. Используя антиградиент Ни[Ь, и] функционала Ф на управлении и € V, сформулируем соответствующее условие оптимальности.

Дифференциальный принцип максимума:

для оптимальности управления и € V в задаче (1.1)-(1.3) необходимо, чтобы

и(Ь) = а^шах {Ни[Ь,и],у), Ь € Т.

v£U

Укажем типовую схему метода условного градиента (МУГ):

1) по допустимой паре (и(Ь), х(Ь,и)) найдем решение ф(Ь,и) сопряженной задачи Коши;

2) сформируем вспомогательное управление

■и(Ь) = а^тах (Н^Ь,^^), Ь € Т ; ш^и

3) построим выпуклую комбинацию управлений

иа(Ь) = и(Ь) + а(у(Ь) — и(Ь)) , Ь € Т;

4) параметр а найдем из условия: Ф(иа) < Ф(и), а € [0,1]. Перейдем к описанию квазиградиентной схемы улучшения допустимых управлений в задаче (1.1)-(1.3):

1) пусть (и(Ь),х(Ь,и)) - допустимая пара, ф(Ь,и), Ф(Ь,и) - соответствующие решения векторной и матричной сопряженных систем;

2) образуем вспомогательное (максимизирующее) управление

ь(Ь,х) = ащтах (в(х,Ь)^), х € Еп , Ь € Т ; (2.4)

ш^и

3) сформируем семейство управлений с параметром а

иа(Ь, х) = и(Ь) + а(у(Ь, х) — и(Ь)) , Ь € Т ;

4) решая задачу Коши

х = /(х,иа(Ь,х),Ь), х(Ь0)= х0 , найдем фазовую траекторию ха(Ь), Ь € Т вместе с управлением ьа(Ь) =

иа ха (Ь)), Ь € Т;

5) задача поиска параметра а € [0,1] определяется требованием улучшения целевого функционала: Ф(г>а) < Ф(и).

Как и прежде, конкретный вид процедур улучшения связан с выбором функции в(х,Ь) в (2.4):

- первый метод условного квазиградиента (МУК-1)

з(х, Ь) = Ни(ф(Ь, и),х, и(Ь), Ь);

- второй метод условного квазиградиента (МУК-2)

з(х, Ь) = Ни(р(Ь, и, х),х, и(Ь),Ь).

3. Вычислительный эксперимент

Перейдем на уровень численных расчетов по реализации предлагаемых методов и модификаций в сравнении с известными вариантами и между собой. Были использованы конкретные задачи с различными особенностями, известные по литературе в плане их численного решения с помощью тех или иных методов. В разделе 3.1 рассмотрены задачи без ограничений на управление, для решения которых были апробированы представленные выше процедуры градиентного и квазиградиентного спуска. Раздел 3.2 содержит задачи с ограничениями, в рамках которых проведена сравнительная реализация методов условного квазиградиента вместе с процедурой проектирования.

Полученные результаты сравнительной эффективности достаточно корректны, поскольку расчеты проводились фактически по одной программе, т. е. в идентичных условиях. В качестве единицы трудоемкости методов традиционно использована задача Коши для системы п уравнений, т. е. критерием эффективности при прочих равных показателях является число задач Коши, необходимое для приближенного решения задачи данным методом. При этом в качестве условия остановки методов для каждой задачи использовалась оценка по невязке соответствующего условия оптимальности с единой константой в правой части.

3.1. Задачи вез ограничений на управление Задача 1. [6], [7]

1 Г з

Ф(и) = х1(3) + х22(3) + - [10(х1(Ь) + х2(Ь)) + и2(Ь)]М

2 .] о

1 ( ь ) + х2\Ь)) + и \ь ¡\и,Ь —► ШШ ,

0

13 5 1

х 1 = — х\ + — х2 - хги - - и , 6 12 8

50 8 х2 =--3 х1 - 3 х2 ,

х1(0) = 0.15 , х2(0) = 0 , Ь € [0, 3] .

Это билинейно-квадратичная задача без ограничений на управление, которая моделирует экзотермический процесс в химическом реакторе с непрерывным перемешиванием продукта.

Здесь безразмерные фазовые переменные х1, х2 характеризуют температуру и концентрацию начального продукта реакции, безразмерное управление и описывает интенсивность процесса внешнего охлаждения. Функционал качества характеризует среднее квадратичное отклонение текущего состояния (х1(Ь), х2(Ь), и(Ь)) от желаемого стационарного (магистрального) режима х(Ь) = 0, и(Ь) = 0.

В данной задаче: функция Понтрягина

н = Ф1(г3 Х1 + Х2 - Ххп -1 и) + 50 XI - 8 Х2) - 1(ю(х21 + х2)+ и2); о 12 8 3 3 2

первая сопряженная система

13 50

Ф1 =--7Т + иф1 + — ф2 + 10X1 ,

о3

5 8 Ф>2 = -12 Ф1 + 3Ф2 + 10X2 ,

Ф1(3) = -2X1(3), Ф2(3) = -2X2(3); вторая сопряженная система

Ф11 = (2и - 3)фи + —0— Ф12 + 10 ,

Т 5 т Л 50 т

Ф12 = - 12 Ф11 + (2+ и)Ф 12 + 3Ф22 ,

5 1о

Ф22 = Ф12 + ТГ Ф22 + 10 , о3

Ф11(3) = Ф22(3) = -2, Ф12(3)=0; градиент функционала определяется производной

-Ни = Ф1^1 + 1) + и.

8

Решение задачи проведено с помощью процедур слабого улучшения

и Пд, а также модифицированной процедуры 2-го порядка П2. Поиск параметра варьирования а > 0 производился по способу половинного деления (ао = 1; а^+1 = ^аи, к = 0,1,...) Условие окончания процедуры а-поиска:

Ф(иак) < ш\и{Ф(иак_1), ф(и)}, Ф(иак+1) > Ф(иак), к = 1, 2,...

(аи — итоговое значение параметра, половинное деление до тех пор, пока функционал уменьшается. )

Условие остановки метода: 5о(и) = /0 д(Ь)М < е, е = 10-2. Шаг интегрирования дифференциальных систем Н = 0.006. Начальное управление и0(Ь) = 0.

Результаты расчетов отражены в таблице I. (Ф* — наилучшее расчетное значение функционала, N — общее число задач Коши для фазового и сопряженных уравнений, М — количество итераций).

Таблица I.

Ф* N M

П0 0.93091 219 27

П0 0.93049 111 14

П2 0.93031 153 20

Выводы. По вычислительным затратам наилучший результат убе-

(2)

дительно показала процедура П0 . Модификация П2 обеспечивает наилучшее значение функционала. Стандартный метод п0те) в данном случае проигрывает по всем показателям.

Задача 2. [7]

1 1 Г10

&(u) = -(xj(10) + x2(10)) + - (uj(t) + u2(t)) dt ^ min,

2 2 J 0

x 1 = u1x2, x 2 = u2,

xi(0) = 0.1; x2(0) = 1; t € [0,10].

Это билинейно-квадратичная задача с двумя управлениями.

В данной задаче: функция Понтрягина

H = ^jUjx2 + 02U2 - 7^(и\ + u2);

первая сопряженная система

■01 =0, 02 = -ф1Щ,

^1(10) = -x1(10), 02(10) = -x2(10), вторая сопряженная система

l 11 =0, l 12 = -u1^11, 1if 22 = -2щ! 12, фц(10) = -1, i12(10) = 0, '22(10) = -1;

градиент функционала определяется производными

HUi = 01x2 - u1, HU2 = 02 - u,2-

Решение задачи проводилось с помощью процедур п0х), п02), П2. Кроме того была использована модификация первого порядка

П1 : ua(t,x) = u(t) + aHu(0(t,u),x,u(t),t).

Подбор параметра а > 0 проводился аналогично предыдущей задаче. Шаг интегрирования Н = 0.02, параметр остановки е = Ю-2, начальное управление пЦЬ) = 0, ь^) = 1.

Результаты расчетов отражены в таблице II.

Таблица II.

ф» N M

П0 0.04986 33 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П0 0.04766 19 4

П1 0.04692 31 6

П2 0.048158 30 7

(2)

Выводы. Эффект модификаций П0 , Щ, П2 в сравнении со стандартным градиентным методом П0 вполне очевиден как по итоговым

значениям функционала, так и по вычислительным затратам. Наилуч-

(2)

ший результат по затратам дает модификация П0 . Процедура Щ реализует наилучшее значение функционала. Следует отметить «скромный» результат по модификации П2.

Задача 3. [8]

f 5

Ф(и) = \ (x2(t) + x2(t) + u2(t)) dt ^ min, J 0

X1 = x2,

X 2 = —x1 + (1 — xf)x2 + u,

xi(0) = 1.5; x2(0) = 1.5; t € [0, 5].

Это нелинейная задача без ограничений на управление.

В данной задаче: функция Понтрягина

H = ф1x2 + ф2(—Xl + (1 — x2)x2 + и) — (x2 + x2 + и2);

первая сопряженная система

Ф1 = Ф2 + 2Xlф2X2 + 2xi,

Ф2 = —Ф1 — Ф2 + Ф2X2 + 2X2, ф1(5) = 0, Ф2 (5) = 0, вторая сопряженная система

Ф 11 = 2 + 4(1 — X1)X2^12 — 2ф2X2 + 2,

Ф12 = (1 + 2(1 - xi)x2)^11 - (1 - Ж1)2Ф12 + + (1 + 2(1 - Х1)Х2)Ф22 + 202(1 - Х1), Ф22 = -2Ф12 - 2(1 - Х1)2Ф22 + 2, Фгз(5) = 0, i, j = 1, 2; градиент функционала определяется производной

Hu = 02 - 2u.

Решение проводилось с помощью процедур По, Щ, П2. Шаг интегрирования h = 0.01, параметр остановки е = 10-2, начальное управление u0(t) = 1.

Результаты расчетов отражает таблица III. Таблица III.

ф» N M

п0 8.78665 278 35

п0 8.78651 246 34

П1 8.78665 278 35

П2 8.78499 198 25

Выводы. В данной задаче абсолютный приоритет имеет процедура П2. Модификация По2 предпочтительнее стандартного варианта По^.

3.2. Задачи с ограничениями на управление Задача 4. [5]

Ф(и) = -Хз(1) ^ min,

Х1 = — (k1 (и) + k2(u) + k3(u))x1, Х1(0) = 1, Х2 = k1(u)x1 - к4(u)x2, х2(0) = 0,

Х3 = k4(u)x2 - k5(u)x3, x3(0) = 0.

u(t) € [0, 823], t € [0,1].

Это линейная по состоянию задача с ограничениями на управление, которая связана с оптимизацией некоторого химического аппарата. Система дифференциальных уравнений описывает реакции, протекающие в смеси трех веществ, Xi(t), i = 1, 2, 3 — их концентрации. Интенсивности реакций зависят от температуры u(t), играющей в данной задаче роль управления. Первое вещество, концентрация которого X1(t), есть сырье, второе — промежуточный продукт, третье — окончательный результат.

Функции ki(u) имеют характерный для химической кинетики вид

E■ 1 1 ki(u) = Ci(658 --)], i = 1,...,5 R 658 u

ВЫЧИСЛИТЕЛЬНОЕ СРАВНЕНИЕ МЕТОДОВ ГРАДИЕНТНОГО ТИПА 287 Значения постоянных

Сг = 1.02, С2 = 0.93, Сз = 0.386, С4 = 3.28, С5 = 0.084, К = 1.9865,

Ег = 16000, Е2 = 14000, Ез = 15000, Е4 = 10000, Е5 = 15000.

В данной задаче: функция Понтрягина

Н = -фг(кг(и) + к,2(и) + кз(и))хг + ф2(кг(и)хг - к4(и)х2)+

+Фз(к4(и)х2 - к5(и)хз);

сопряженная система

фг = фг(кг(и) + к2(и) + кз(и)) - ф2кг(и), фг(1) = 0, Ф 2 = ф2к4(и) - фзкА (и), ф2(1)=0,

Ф з = фзкб(и), Фз (1) = 1;

градиент функционала определяется производной

з

Ни = -фгхг(^2 Лг(и)) + ф2х1йг(и)-

г=1

-ф2X2d4(u) + фзх2й±(и) - фзхзй5(и),

где ^(и) = ^ = тЪ кг(и), г = 1,..., 5.

Максимизирующее управление ДПМ имеет вид

и*(ф,х,1) = ьтв£зН»(ф,хМ1))у = { 823, > 0.

Следует отметить, что в данной задаче методы принципа максимума фактически не реализуемы: условие максимума функции Н по управлению аналитически не разрешается.

Задача была решена двумя методами градиентного типа: стандартным методом условного градиента (МУГ) и метод условного квазиградиента 1-го порядка (МУК - 1)

Процедура а-поиска: метод половинного деления. Начальное управление и°(Ь) = 600, шаг интегрирования Н = 0.005, параметр остановки е = 10-5 по невязке ДПМ.

Результаты расчетов отражает таблица IV.

Выводы. Безусловное преимущество модификации МУК - 1 вполне очевидно как по затратам (215 задач Коши против 876), так и по значению функционала.

Задача 5. [8]

г- 0.05

Ф(и) = / (х1 + к1и1 + к2и2 + кзиз) № ^ шш, 0г

В. А. СРОЧКО, Таблица IV.

ф* N

МУГ -0.43620 876

МУК - 1 -0.43682 215

х1 = х2,

2П 2П

XX2 = —ах2 — Ь[и1 вш^х^ + и2 8т(2х1 +--) + и3 8ш(2х1--)],

3 3

х1(0)= п/3; х2(0) = 0;

щ(г) е [0,16], г = 1,2, з, г е [0,0.05].

Значения параметров: к = 0.001, г = 1, 2, 3; а = 50, Ь = 1000.

Это задача оптимального управления шаговым электродвигателем. Здесь х1 — положение вала двигателя, х2 — его скорость, управления и1,и2,из соответствуют квадратам токов в обмотках. Функционал Ф(и) отражает требование стабилизации электродвигателя (приведение положения вала к нулю при минимальных энергозатратах).

В данной задаче: функция Понтрягина

2П 2П

Н = ф^2 — 02(ах2 + Ь[и1 8т(2х1) + и2 8ш(2х1 + —)+ из 8т(2х1 — —)]) —

33

—(х"2 + ки + к2и2 + кзиз); первая сопряженная система

■ 2п 2п

гр 1 = 2Ьр2[и1 ео8(2х1) + и2 ео8(2х1 + —) + и3 ео8(2х1 ——)] + 2х1,

33

гр 2 = —р1 + ар2, р1(г1) = 0, М^) = 0.

вторая сопряженная система

■ 2п 2п

Ф11 = АЬФ^щ сов(2х1) + и2 сов(2х1 + —) + из сов(2х1 —:т)} —

33

2п 2п

—4Ьр2[и1 81п(2х1) + и2 81п(2х1 + —) + из 81п(2х1--—)} + 2,

33

■ 2п

Ф12 = 2ЬФ22[и1 со8(2х1) + и2 Со8(2х1 + —) +

3

+из со8(2х1 — —)] — Ф11 + Ф12а, 3

Ф 22 = —2Ф12 + 2аФ22

Щ(ti) = 0, i,j = 1, 2; градиент функционала определяется производными

Hu1 = -ф2Ъsin(2xi) - ki, 2п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Hu2 = -фъЬ sin(2xi + —) - k2,

3

2п

Низ = -ф2Ъ sin(2xi - —) - k3. Максимизирующее управление имеет вид

U*(é2Xl) = f 0 Hui (^2,Х1) < 0 i = 123 иг №,X1) = ^16, HUi(Ф2Х1) > 0. i = 1j 2 3

Решение задачи было проведено с помощью методов МУГ, МУК -1. Кроме того был использован метод условного квазиградиента 2-го порядка (МУК - 2):

ui(t, х, а) = ui(t) + a(v*(t, x) - ui(t)), i = 1,2,3,

v*(t,x) = u*(p2 (t,u,x),xi), 2

P2(t,u, x) = ^2(t, u) + J2 Ф2j (t,u)(xj - xj (t,u)).

j=1

Начальное управление u0(t) = 1, шаг интегрирования h = 0.00025, параметр а ищется методом половинного деления из условия монотонного убывания функционала, параметр остановки е = 10_7. Результаты расчетов отражает таблица V.

Таблица V.

Ф* N

МУГ 0.00817 617

МУК - 1 0.00988 410

МУК - 2 0.00792 287

Выводы. Первая модификация (МУК - 1) предпочтительнее стандартного варианта по затратам, однако проигрывает по значению функционала. Безусловный приоритет имеет в данном случае МУК - 2.

Список литературы

1.

Антоник В.Г., Срочко В.А. Метод проекций в линейно-квадратичных задачах оптимального управления // Журн. вычисл.матем. и мат.физики. — 1998. — Т. 38, № 4. — С. 564-572.

2. Мамонова Н.В., Срочко В.А. Итерационные процедуры решения задач оптимального управления на основе квазиградиентных аппроксимаций // Изв. ВУЗов. Математика. — 2001. — № 12. — С. 55-67.

3. Срочко В.А. Итерационные методы решения задач оптимального управления. — Москва: Физматлит, 2000. — 160 с.

4. Срочко В.А. Модернизация методов градиентного типа в задачах оптимального управления // Изв. ВУЗов. Математика. — 2002. — № 12. — С. 66-78.

5. Федоренко Р.П. Приближенное решение задач оптимального управления. — Москва: Наука, 1978. — 408 с.

6. Aganovic Z, Gajic Z. The successive approximation procedure for finite - time optimal control of bilinear systems // IEEE Transactions on Automatic Control. — 1994. — Vol.39, № 9. — P. 1932-1935.

7. Hofer E.P., Tibken B. An iterative method for the finite-time bilinear - quadratic control problem // Journ. Optimiz. Theory and Applications. — 1988. — Vol.57, № 3. — P. 411-426.

8. Jones D.I., Finch J.W. Comparison of optimization algorithms // Intern. Journal of Control. — 1984. — Vol.40, № 4. — P. 747-761.

V. A. Srochko, V. G. Antonik, N. V. Mamonova The numerical comparison of gradient methods in optimal control problems

Abstract. The efficiency of iterative methods is essentially estimated by the results of virtual experiment benchmarks solving. This paper deals with the numeric implementation of standard gradient methods in comparison with modifications of approximate solutions for the well-known applied problems (chemical technology, electrical engineering).

i Надоели баннеры? Вы всегда можете отключить рекламу.