Нелокальное улучшение управлений нелинейными дискретными системами

Моржин Олег Васильевич

УДК 517.977

О. В. Моржин

Нелокальное улучшение управлений нелинейными дискретными системами

Аннотация. Статья посвящена подходу к нелокальному улучшению в общих нелинейных задачах оптимального управления для дискретных систем на основе фундаментальной теории В.Ф. Кротова и фазовой регуляризации (термин В.А. Срочко). Сформулированы достаточные условия нелокального улучшения, в том числе в регуляризованной форме. Представлены алгоритмы улучшения, использующие специальные дискретно-алгебраические краевые задачи с максимизирующим и проекционным отображениями для функции Гамильтона, а также алгоритм, строящий последовательность приближений в пространстве управлений. Приведены примеры улучшения «обычных» процессов и процесса, удовлетворяющего дискретному принципу максимума.

Ключевые слова и фразы: дискретные управляемые системы, нелокальное улучшение управлений, достаточные условия и методы улучшения.

Математическое моделирование объектов с наилучшими по возможности свойствами (подъем ракеты на максимально возможную высоту, максимизация массы продукта химической реакции) опирается на теорию и методы оптимального управления динамическими системами (дифференциальными, дискретными, непрерывно-дискретными, логико-динамическими) [20].

Рассматривается дискретная задача оптимального управления:

ti-i

(1) I(m) = F(x(ti)) + ^ f0 (t,x(t),u(t)) ^ inf,

t=to

(2) x(t + 1) = f (t,x(t),u(t)), x(t0) = x0,

(3) u(t) G U С Rr, t G {t0,t0 + 1, ...,t1 - 1},

Работа выполнена при финансовой поддержке РФФИ (проекты №№ 08-01-00945-a, 09-01-00170-а, 09-01-90203-Монг-а).

где ж(£) = (ж1 (£),..., жп(£)) —значение функции состояния при дискретном аргументе £ € {¿о,¿о + 1, ...,¿1}, «(¿) = (и (¿), ...,иг(¿)) —значение управляющей функции при £ € {¿о,¿о + 1, ...,¿1 — 1}; моменты ¿о, ¿1 и состояние хо заданы; т = (ж(-),м(-)) —дискретный процесс.

В качестве допустимых управляющих функций и функций состояния будем рассматривать дискретные функции, удовлетворяющие соотношениям (1)—(3). Через Б обозначим множество допустимых дискретных процессов.

В рамках оптимизационной задачи будем рассматривать задачу улучшения заданного процесса управления т1 = (х1,«1) € Б: требуется вычислить процесс т11 € Б такой, что I(т11) < I(т1).

В общем случае под решением задачи (1)—(3) понимается последовательность {тк} € Б, к = 0,1, 2,..., на которой целевой функционал стремится к своему инфимуму (вообще говоря, к глобальному). Если в улучшающей последовательности {тк} (к = 0,1, 2,..., N) некоторый процесс представляет результат, ощутимый с практической точки зрения по сравнению с предыдущим, то в этом смысле под решением задачи оптимального управления можно приближенно понимать этот процесс.

Первый дискретный аналог принципа максимума Л.С. Понтряги-на для линейных по состоянию систем был получен в 1959 г. Л.И. Ро-зоноэром [24]. Им же высказано сомнение в возможности перенесения результата на нелинейные системы. А.Г. Бутковским [6] в 1963 г. построен пример, в котором функция Гамильтона имеет лишь локальный максимум. Впоследствии было показано, что локальный принцип максимума также не всегда имеет место.

Достаточные условия, при которых для дискретных систем справедлив принцип максимума, установлены А.И. Пропоем [21]. Затем Р. Габасовым [8] проведено детальное исследование достаточных условий, при которых для дискретных систем справедлив принцип максимума. В этих работах получила развитие идея Л.И. Розоноэра [24] о том, что глобальность принципа максимума непосредственно связана со строением вектограммы дискретной системы.

Р. Габасовым и Ф.М. Кирилловой в работе [9] были сформулированы необходимые условия оптимальности для разностной аппроксимации непрерывной системы в форме принципа квазимаксимума. Было показано, что с уменьшением шага аппроксимации принцип квазимаксимума переходит в принцип максимума Л.С. Понтрягина.

Таким образом, принцип квазимаксимума позволяет связать условия оптимальности для дискретных и непрерывных процессов.

Указанные результаты по теории необходимых условий оптимальности дискретных процессов детально и в развитии изложены в монографиях Р. Габасова и Ф.М. Кирилловой [10], А.И. Пропоя [22], Б.Ш. Мордуховича [18].

По теории дискретного принципа максимума укажем также на недавние публикации [23,25].

Развиваемая автором методика базируется на другом направлении в теории управляемых дискретных систем: на достаточных условиях оптимальности В.Ф. Кротова [14]. Это направление развито в работах В.Ф. Кротова и В.И. Гурмана [11]. Систематическое изложение дано в монографиях [12,16,29], включая распространение результатов на непрерывно-дискретные задачи.

В рамках теории В.Ф. Кротова поиск разрешающей функции (Кротова) в линейном и линейно-квадратическом по состоянию приближениях дал возможность построить итерационные методы улучшения 1-го и 2-го порядков [1,12,13,15,17,29] в общих нелинейных задачах оптимального управления для дифференциальных и дискретных систем.

Также в трудах В.Ф. Кротова и учеников был обозначен подход к нелокальному улучшению на основе достаточных условий оптимальности с точным заданием разрешающей функции в определенных классах задач. Основной характеристикой нелокального улучшения полагаем точный учет приращения целевого функционала (без остаточных членов разложений по переменным состояния и управления). Впоследствии в работах [2,3,5,26] В.А. Срочко, А.С. Булдаева и учеников были разработаны родственные результаты к улучшению в дифференциальных системах с позиций теории необходимых условий: точные формулы приращения целевого функционала и процедуры нелокального улучшения для линейных, линейно-квадратических и полиномиальных по состоянию задач оптимального управления (в том числе с терминальными ограничениями) с использованием специальных сопряженных систем и краевых задач.

В работах [26,27] В.А. Срочко и учеников для частных классов задач разработан подход к повышению эффективности методов нелокального улучшения, названный В.А. Срочко фазовой регуляризацией—в отличие от известной из работ А.Н. Тихонова [7,28] регуляризации задач по управлениям. Идея состоит в построении специального

целевого функционала, состоящего из суммы исходного и регуляри-зующего функционалов. Последний содержит квадраты расстояний между значениями текущей и улучшаемой фазовых траекторий с регулируемыми параметрами.

Естественным представляется развитие подхода к нелокальному улучшению применительно к общим нелинейным непрерывным и дискретным задачам.

В статье [19] автора впервые показано, что для построения методов нелокального улучшения в общих нелинейных непрерывных и дискретных задачах при использовании специальных сопряженных систем достаточно линейной функции Кротова ^(¿,ж) = (р(2),ж).

1. Основные конструкции

Конструкции теории В.Ф. Кротова [29] для задачи (1)—(3):

*1-1

Ь(т) = С(ж(^)) — Д(2, ж(2), и(2))Л,

*=*0

С(ж) = Д (ж) + ^(¿1, ж) — ^(¿о, жо),

Д(2, ж, и) = у>(2 + 1, /(¿, ж, и)) — ^(¿, ж) — /о(2, ж, и).

Функционал Ь(т) представляет собой обобщенный лагранжиан такой, что для любых ^(¿, ж) и т € Б оказывается Ь(т) = I(т). Рассматривается приращение ДД = Д1Д + Д2 Д, где

Д1Д = Д(2, ж, и) — Д(2, ж, и1^)), Д2Д = Д(2, ж, и1^)) — Д(2, ж1^), и1^)). Далее, величины ДС и Д2Д представляются в виде ДС = (С^ж^)), Дж(^)), Д2Д = (Дж(г, ж^),«1^)), Дж^)).

Функция ^(¿,ж) задается линейной по ж: ^(¿,ж) = (р(2),ж), где р(2) — некоторая функция, 2 € {¿о + 1, ¿о + 2, ...,¿1}.

При этом

С(ж) = Д (ж) + (р(^ 1), ж) — (^(¿о), жо),

Д(2, ж, и) = у>(2 + 1, ж(2 + 1)) — ^(¿, ж) — /о(2, ж, и) =

= (р(г + 1), / (¿, ж, и)) — / °^, ж, и) — (р(г), ж) =

= н (г,р(г +1), ж, и) — (р(г),ж),

где Н(¿,р, ж, и) = (р, /(¿, ж, и)) — /о(2, ж, и) —функция Гамильтона.

Будем искать x и p при каждом t так, чтобы AG = 0 и A2R = 0, полагая

Fx(x(il) = Fx(xI(ti)) + q.

Hx(t,p(t + 1), ж, u1 (t)) = Hx(t,p(t + 1),xI(t), uI(t)) + r(t),

Имеем

A2Й = (HB(t,p(t + 1), x(t), uI(t)) - p(t), Ax(t)} =

= (Hx(t,p(t + 1),xI(t),uI(t)) + r(t) -p(t), Ax(t)} = 0.

Отсюда получаем дискретно-алгебраическую сопряженную систему для определения p(t):

(4) p(t) = H*(t,p(t + 1),xI(t),uI(t)) + r(t), p(ti) = -Fx(xI(ti)) - q,

(5) H(t,p(t + 1), x, uI(t)) — H(t,p(t + 1), xI(t), uI(t)) =

= (Hx(t,p(t + 1),xI(t),uI(t)), Ax(t)} + (r(t), Ax(t)},

(6) F(x(ti)) - F(xI(ti)) = (Fx(xI(ti)), Ax(ti)} + (q, Ax(ti)}.

Градиент Hx(t,p(t), ж, uI(t)) в случае линейной по x функции Гамильтона не зависит от x и, следовательно, переход к xI(t) и поправка r(t) не нужны. В этой ситуации определяем r(t) = 0. Аналогично, если рассматривается линейный по x терминант, градиент Fx(a;(ti) не зависит от x и определяется q = 0. Таким образом, в линейных по x задачах (1)-(3) дискретно-алгебраическая сопряженная система (4)-(6) переходит в стандартную сопряженную систему дискретного принципа максимума [10,20,22] на управлении u = uI.

В результате имеем

Aß(t, x, u) = H(t,p(t + 1), x, u) - H(t,p(t + 1), x, uI(t))

и следующую формулу приращения функционала I(m) = L(m) на процессах mI, m Є D: ti-i

(7) AI(m) = - (H(t,p(t + 1), x, u) - H(t,p(t + 1), x, uI(t))) .

t = to

Следует отметить, что формула (7) точная в смысле отсутствия остаточных членов разложений в ряд Тейлора по x, u. Эта характерная особенность формул приращения в разрабатываемой автором методике [19]. В работе [4] А.С. Булдаевым для непрерывных процессов формула приращения и сопряженная система получены

без применения конструкций В.Ф. Кротова в результате преобразования приращения функционала в силу системы. Связь двух выводов состоит в том, что, как и функция Понтрягина, конструкции В.Ф. Кротова содержат функции /о(£, ж, и), /(¿, ж, и), а задание функции ^(¿, ж) = (р(^;),ж) позволяет перейти к терминам сопряженных систем.

Формулу приращения (7) преобразуем далее, положив Н(¿,р^ + 1), ж, и) — Н(¿,р^ + 1), ж, и1(^)) =

= (н„(г,р(г + 1),ж,м(г)), Ди(г)),

где Ди(2) = и(2) — и^), 2 € {¿о, ¿о + 1, ...,¿1 — 1}, значения м(2) неизвестны, а и(2) соответствует процессу т € Б.

В случае линейной по и функции Гамильтона имеем

Н(¿,р^ + 1), ж, и) — Н(¿,р^ + 1), ж, ^(¿)) =

= (Н^р^ + 1), ж), Ди(*)),

где Н1^,р, ж) = Ни(2,р, ж, и). Формула приращения (7) в этом случае принимает форму

*1-1

(8) Д1 (т) = — ^ (Н^р^ + 1),ж^)), Ди(^).

* = * 0

Для нелинейной по и функции Гамильтона, аналогично ситуации с .ДЦж^), Н^^р^ + 1), ж, и^)), полагаем градиент

Н„(г,р(г + 1),ж, «(¿)) = Н„(г,р(г + ^ж,^^)) + ф),

t € {¿о,¿о + 1, ...,¿1 — 1},

где «поправка» ¿(¿) заранее не известна, и позже будет указан способ ее нахождения.

Резюмируя, запишем преобразованную формулу приращения (7):

*1-1

(9) Д1 (т) = — ^ (Н„(г,р(г + 1), ж(^), ^(¿)) + ¿(¿), Ди(^).

* = *0

Величина ¿(¿) удовлетворяет уравнению

(10) Н(¿,р^ + 1), ж(^), и(^) — Н(¿,р^ + ^ж^и^)) =

= (Ни^р^ + 1), ж(^;), и^)), Ди^)) + (¿(¿), Ди^)),

которое добавляется к системе (4)-(6).

Таким образом, рассматриваются два типа сопряженных систем:

(4)—(6) при использовании формулы приращения (7) и (4)—(6), (10) при реализации формулы приращения (9).

2. Модификация основных конструкций на основе функционала с фазовым отклонением

Предлагается модифицировать основные конструкции за счет введения целевого критерия со специальным функционалом, содержащим фазовое отклонение с параметрами 71,72 > 0:

ti-i

(11) I7(m1, m) = I(m) + 711|Ax(ii)||2 + 72 ^ ||Ax(t)||2 ^ inf .

t = to

В работах В.А. Срочко [26, 27] для непрерывных линейно-квадратичных по состоянию задач такой подход называется фазовой регуляризацией, в отличие от регуляризации по управлениям в смысле

А.Н. Тихонова [7,28].

Обозначаем F7(x(t1)) = F(x(t1)) + 71|Ax(t1)|2. Имеем

FY (x!(t1)) = Fx(x! (t1)),

F7(x(t1)) - F7(x1^)) = F(x(t1)) + 71|Ax(t1)|2 - F(x1^)).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для вспомогательной задачи оптимального управления (11), (2),

(3) вводится модифицированная функция Гамильтона

H7 (t,p7, x, u) =

= (p7,/(t,x,u)) - /0(t,x,u) - 72||Ax||2 = H(t,p7,x,u) - 72IIAx||2. Вычисляем

H7(t,p7, x, u) = Hx(t,p7, x, u) - 272 Ax,

H7(t,p7, x1, u1) = Hx(t,p7, x1, u1),

H7(t,p7,x,u!) - H7(t,p7,x!,u!) =

= H(t,p7, x, u1) - 72||Ax||2 - H(t,p7,x!,u!).

Функция p7(t) удовлетворяет модифицированной дискретно-алгебраической сопряженной системе

( ) p7 (t) = Hx(t,p7 (t + 1),xI(t),uI(t)) + r7 (t),

p7(t1) = -Fx(xI(t1)) - q7,

Н(4,р7(4 + ^хфУф) - 72||Дж(£)||2-

(13) -Н (4,р7 (4 +1),ж1(£),м1 (4)) =

= (Нж(4,р7(4 + 1),ж1(4),м1(4)), Дж(4)) + (г7(4), Дж(4)),

(14) ^(х(41)) + 71||Дх(^1)1|2 - ^(х1(41)) =

( ) = (^(х^)), Дж^)) + <97, Дж^)),

где г е {¿0 + 1, ...,¿1 - 1,41}.

По аналогии с (7) запишем формулу приращения для модифицированного функционала (11) на процессах ш1,ш11 е Б в терминах решения сопряженной системы (12)—(14):

Д/7(т1, т11) = /7(т1, т11) - /7(т1, т1) =

*1-1

= - ^ (Н7(4,р7(4 + ^ж"^),«"^))-*=*0

-Н7(4,р7(4 + 1), *”(*), м^)))¿4 :

*1-1

= - (Н(4,р7(4 + 1), (4), ^(4)) - Н(4,р7(4 + 1), жII(t), м^))).

*=*0

С другой стороны, по определению функционала (11) имеем

*1-1

Д/7(т\ mII) = /(тп) + 71 || Дж^^) ||2 + 72 || Джп (4) ||2 - /(т^).

*=*0

Приравняв два представления для Д/7(mI,mII), приходим к записи приращения исходного функционала в терминах модифицированного функционала:

*1-1 (

ДЬ(тп) = Д/(mII) = - ^ (Н(4,р7(4 + 1), жII(t), мII(t)) —

*=*0

(15) -Н (4,р7 (4 + ^а^),«^))) -

*1-1

-пНДа^)!!2 - 72 £ ||Джп(*)||2.

*=*0

Как показывает формула (15), модификация дает возможность регулирования убывания исходных функционалов за счет параметров

71, 72 > 0.

3. Достаточные условия нелокального улучшения

Напомним общее достаточное условие В.Ф. Кротова.

Теорема 1 (общее достаточное условие улучшения). Для того, чтобы для заданного процесса т^ е В процесс тп был лучше, достаточно существования такой функции у>(4, х), при которой

G(xII(t1)) - С^^)) < 0,

Д(4, хп(4), иП^)) - Д(4, х^), и^)) > 0 Ш е {40, 40 + 1,. .., 41 - 1} и на множестве {4о,4о + 1, ...,41 - 1} существует непустое подмножество, на котором разность ДД(4, хп, ип) > 0.

Таким образом, требуется невозрастание функции С(х) и неубывание функции Д(4, х, и) при каждом 4 на процессе тп по сравнению с заданным улучшаемым процессом т1 при условии, что найдется непустое подмножество из {4о, 4о + 1, ...,41 - 1}, где функция Д(4, х, и) строго возрастает.

Получим достаточные условия улучшения типа условия В.Ф. Кротова, но в терминах выведенных в разделе 1 конструкций.

Теорема 2 (достаточное условие улучшения в дискретной задаче в терминах решения сопряженной системы (4)—(6) и формулы приращения (7)). Для того чтобы процесс тп е В был лучше процесса т^ е В, достаточно выполнения условий:

(1) дискретно-алгебраическая сопряженная система (4)—(6) имеет решение рп(4) на процессе тп;

(2) приращение

Н+ 1), х^У^)) - Н(4,^ (4 +1), хп(4), и^))

неотрицательно Ш е {4о,4о + 1, ...,41 - 1} и положительно на непустом подмножестве из {4о,4о + 1, ...,41 - 1}.

Сопряженная система второго типа (4)—(6), (10) и формула приращения (9), использующая градиент функции Гамильтона по и, позволяют сформулировать следующую форму достаточного условия.

Теорема 3 (достаточное условие улучшения в дискретной задаче в терминах решения сопряженной системы (4)—(6), (10) и формулы приращения (9)).Для того чтобы процесс тп е В был лучше процесса т^ е В, достаточно выполнения условий:

(1) уравнение (10) при и = ип разрешимо относительно ¿(4) в каждый момент 4 е {4о, 4о + 1, ..., 41 - 1} и дискретно-алгебраическая система (4)—(6) имеет решение рп(4) на процессе тп;

(2) функция (Ни^рП^), хп(4), м^)) + ¿(4), Д^^)) неотрицательна Ш е {4о,4о + 1, ...,41 - 1} и положительна на непустом подмножестве из {4о,4о + 1, ...,41 - 1}.

Для вспомогательной, регуляризованной задачи (11), (2), (3) конструкции В.Ф. Кротова:

Д7(4,х,м) = <£>(4 + 1, /(4,х,м)) - ^(4,х) - /о(4, х, м) - 72 ||Дх||2,

С7(х) = В(х) + ^(41,х) - ^(4о,хо) + 71||Дх||2.

Имеем

Д7(4, хп(*), м^)) - Д7(4, х\ uI) =

= Н(4,р7(4 + 1), хп(*), м^(4)) —

Н (4,р7 (4 + ^х”^),^^)) + 72||Дхп (4)|2 Ш е {4о, 4о + 1, ...,41 - 1},

С7(х^!)) - С7(х^)) = ^НДхИ^Н2,

где в общем случае 71, 72 > 0, а можно полагать 71, 72 > 0.

Фазовая регуляризация усиливает достаточное условие, изложенное в теореме 2.

Теорема 4 (регуляризованное достаточное условие улучшения в дискретной задаче на основе сопряженной системы (12)—(14) и формулы приращения (15)). Для того чтобы процесс тп е В был лучше процесса т^ е В, достаточно выполнения условий:

(1) модифицированная дискретно-алгебраическая сопряженная система (12)—(14) при заданных 71,72 > 0, не равных нулю одновременно, имеет решение р7 п(4) на процессе тп;

(2) приращение

Н(4,р7 "(4 + 1),xII(í),uII(í))--H (4,р7 ”(4 + 1),хп(4),^^)) + 72ЦДхИ^Ц2

неотрицательно Ш е {4о,4о + 1, ...,41 - 1} и положительно на непустом подмножестве из {4о,4о+1,...,41 -1} и/или Дх^) =0 с 71 > 0.

4. Алгоритмы расчета нелокального улучшения управления

4.1. Алгоритм улучшения на основе краевой задачи с максимизирующим отображением. Для реализации теоремы 2 рассмотрим алгоритм улучшения, использующий краевую задачу с максимизирующим отображением.

Опишем шаги алгоритма.

1. Задается процесс m1 G D, который необходимо улучшить.

2. Образуется максимизирующее отображение

u* (t, p, x) = arg max H(t, p, x, u), uGU

и подставляется в фазовую систему (1) вместо u:

(16) x(t + 1) = f (t, x(t), u*(t,p(t + 1),x(t))), x(to) = x0.

Соотношения (16) совместно с сопряженной системой (4)-(6) образуют дискретно-алгебраическую краевую задачу, вообще говоря, для уравнений с разрывными по x, p правыми частями.

3. Разрешая алгебраические уравнения (5) и (6) относительно r(t) и q некоторым однозначным образом, получаем вспомогательную краевую задачу:

x(t + 1) = f (t, x(t), u*(t,p(t + 1), x(t))), x(t0) = x0, p(t) = Hx(t,p(t + 1),x!(t),u!(t)) + r(t,p(t + 1),x(t)), p(ti) = -Fx(x!(ti)) - q(x(ti)), где t G {to + 1,..., ti — 1} и r(t,p, x), q(x) —зависимости, полученные в результате разрешения соответствующих алгебраических уравнений.

4. Находим решение (xn,pn) или, в общем случае набор решений {(xn,pn)} вспомогательной краевой задачи. Этому набору соответствует набор управляющих функций, определяемых по формуле

un(t) = u*(t,pn(t + 1),xn(t)), t G {to, to + 1, ...,ti — 1}.

Отметим неоднозначность разрешения алгебраических уравнений относительно r(t) и q. Одной из возможных практических рекомендаций для однозначного разрешения этих уравнений является выражение i-й компоненты вектора r(t) (или q) при условии Axj(t) = 0 (соответственно ÄXj(ti) = 0) с обнулением всех остальных компонент, где i G 1, n.

Теорема 4 обеспечивает усиление изложенного алгоритма. За исключением вопроса о задании параметров Yi,Y2 регуляризованный алгоритм по существу совпадает с данным, поэтому не приводится.

Представленный алгоритм используется в примерах 1, 2 в следующем разделе статьи.

4.2. Алгоритм улучшения на основе краевой задачи с проекционным отображением. Для реализации достаточного условия улучшения, выраженного в теореме 3, образуем проекционное отображение

(17) ма(4,р,х) = Ри (м^) + а (Н„(4,р, хУ (4)) + ¿(4))) ,

где величина ¿(4) в каждый момент 4 удовлетворяет уравнению (10), аргумент 4 е {4о,4о + 1, ...,41 - 1}, а > 0 — параметр проектирования.

Управление м(4), фигурирующее в уравнении (10) и формуле приращения (9) заранее не известно, поэтому в уравнение (10) вместо м подставляется само отображение ма:

Н(4,р(4 + 1), х(4), ма(4,^(4 + 1), х(4)))-

(18) -Н (4,р(4 + ^х^У^)) =

= (Н„ (4,^(4 + ^х^У^)) +¿(4), м“^,^ + 1), х(4)) - м^)).

В результате, уравнение (18) не содержит неизвестную функцию м(4), но, важно отметить, является нелинейным относительно ¿(4), поскольку эта величина участвует в формуле (17).

Согласно свойству проекции [7] справедливо неравенство

(Ни^р, х, м^)) + ¿(4), ма(4,р, х) - м^)) >

1 2

> — ||м“(4,р, х) - uI(t)|| , а> 0, 4 е {4о,4о + 1, ...,41 - 1}, а

с учетом которого получаем оценку уменьшения целевого функционала на процессах т, mI е В в зависимости от параметра проектирования а > 0:

*1-1 (

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Д/(т) = - £ (Н„(£,£>(£ + ^х^У^)) + ¿(4),

*=*0 )

(19) ма (4,^(4 + 1),х(4)) - м^)) <

1 *1 2

<----£ ||м“(4,р(4 +1),х(4)) - uI(t)|| .

а *=*0

Опишем шаги алгоритма.

1. Задается процесс т^ е В, который необходимо улучшить.

2. Образуется проекционное отображение м“(4,р, х), которое подставляется вместо м в фазовую систему (1):

(20) х(4 + 1) = /(4, х(4), м“^,^ + 1),х(4))), х(4о) = хо.

Соотношения (20) и сопряженная система (4)—(6), (18) образуют дискретно-алгебраическую краевую задачу.

3. В результате разрешения алгебраических уравнений (5), (6),

(18) относительно г(4), ц и ¿(4) некоторым однозначным образом, получаем зависимости г(4,р, х), ц(х), ¿(4,р, х) и образуем ^“(4,^, х) как м“(4,р, х) при ¿(4) = ¿(4,р, х). Приходим к вспомогательной краевой задаче

х(4 + 1) = /(4, х(4), й“ (4,^(4 + 1), х(4))), х(4о) = хо, р(4) = Н* (4,^(4 + ^У^У^)) + г(4,р(4 + 1),х(4)), р(41) = -^ХУ^)) - ц(х(41)).

4. Находим, вообще говоря, набор решений {(хп,рп)} вспомогательной краевой задачи, которому соответствует набор управляющих функций, определяемых формулой

м^) = м^УУ + 1),хп(4)), 4 е {4о,4о + 1, ...,41 - 1}.

В отличие от краевой задачи с максимизирующим отображением м*(4,р, х), здесь краевая задача содержит настроечный параметр а, дающий возможность влиять на разрешимость краевой задачи без фазовой регуляризации, что проиллюстрировано в примере 2.

Так как ¿(4,р, х) определяется через м“(4,р, х), то реализация отображения м“^,^, х) может оказаться затруднительной. Это обстоятельство инициировало разработку проекционного алгоритма, который действует в пространстве управлений и будет представлен далее.

Прежде чем перейти к проекционному алгоритму, отметим немаловажный на практике класс задач улучшения, для которого реализация проекционного отображения существенно упрощается — это случай линейных по м задач. В этой ситуации ¿(4) = 0 и алгебраические уравнения (10), (18) не рассматриваются.

4.3. Проекционный алгоритм расчета улучшающего управления. Рассмотрим алгоритм, на итерациях которого будем строить последовательность управлений {мк}, к = 0,1,..., обеспечивающую по идее вычисление управления мп, при котором имеет решение краевая задача улучшения (20), (4)—(6), (10). Для улучшаемого допустимого управления мI вычисляется соответствующее решение xI

фазовой системы. Если улучшаемое управление u1 не удовлетворяет дискретному принципу максимума, то полагаем u(0) = u1. Далее формируется итерационный процесс, на k-й итерации которого осуществляются следующие этапы (k e {0,1,...}).

1. Для приближения u(k) вычисляется фазовая траектория x(k).

2. Рассматривается система

p(k)(t) = Hx(t,p(k)(t + 1),xI(t),uI(t)) + r(k)(t),

p(k)(ti) = -Fx(xI(t1)) - q(k),

H(t,p(k)(t + 1), x(k)(t), uI(t)) — H(t,p(k)(t + 1), xI(t),uI(t)) =

= (Hx(t,p(k)(t + 1), xI(t), uI(t)), Ax(k)(t)) +

+ (r(k)(t), Ax(k)(t)),F(x(k)(ti)) — F(xI(ti)) =

= (Fx(xI(ti)), Ax(fc)(ti)) + (q(k), Ax(fc)(ti)).

Некоторым однозначным образом разрешаются алгебраические уравнения и находятся зависимости r(k)(t,p(k)), q(k). Также определяется ___________k

функция d (t). Тем самым приходим к вспомогательной системе p(k)(t) = Hx (t,p(k)(t + 1),xI(t),uI(t)) + r(k)(t,p(k)),

p(k)(ti) = —Fx(xI(ti)) — q(k).

3. Разрешив вспомогательную систему (21), находим функцию pk(t), t e {to + 1, ...,ti — 1,ti}.

4. Очередное приближение строится по формуле

u(k+i)(t) =

(22) = Pu (uI(t) + a(H„(t,p(k)(t + 1), x(k) (t), uI(t)) + d(k)(t))) ,

a > 0, t e {to, to + 1,..., 11 — 1}.

На практике при достаточно малом значении параметра a > 0 итерации алгоритма можно продолжать, пока происходит улучшение, или «до первого улучшения».

Данный алгоритм применен в примере 3 для расчета улучшающего управления в нелинейной по x, u задаче с ограничением на управление.

5. Примеры нелокального улучшения дискретных процессов

Пример 1. Улучшить управление uI(t) = 0 в задаче I = x(2) ^ inf,

ж (і + 1) = (ж(і))2 + и(і), ж(0) = 2, |и(і)| < 1, ¿о = 0, ¿і = 2.

На управлении м!(і) = 0 при і Є {0,1} имеем ж!(1) = 4, ж!(2) = 16,

I (т1) = 16.

Применение алгоритма, основанного на краевой задаче с максимизирующим отображением. Функция Гамильтона

Н = р(і + 1) ((ж(і))2 + и(і)) , і Є {0,1}.

Имеем

Нх = 2рж, Н„ = р, м*(і,р(і + 1),ж(і)) = signp(t + 1),

Н(і,р(і + 1),ж(і), и1 (і)) = р(і + 1)(ж(і))2,

Н(і,р(і + 1),ж!(і), и1 (і)) = р(і + 1)(ж!(і))2,

Нх(і,р(і + 1),жІ(і),иІ(і)) = 2р(і + 1)ж!(і).

Дискретно-алгебраическая краевая задача вида (16), (4)—(6): ж (і + 1) = (ж(і))2 + signp(t + 1), ж(0) = 2,

р(і) = 2р(і + 1)жІ(і) + г(і), р(2) = -1, г(і)Дж(і) = р(і + 1) (Дж(і))2 , і Є {0,1}.

Выражаем г(і,р(і + 1), ж(і)) = р(і + 1)Дж(і).

Вспомогательная краевая задача вида ():

ж (і + 1) = (ж(і))2 + signp(t + 1), ж(0) = 2,

р(і) = р(і + 1) (ж(і) + жІ(і)) , р(2) = -1, і Є {0,1}. Предполагаем, что р(1) < 0. Тогда

ж(1) = 3, ж(2) = 8, Дж(1) = -1.

Проверяем гипотезу: действительно,

р(1) = р(2) (ж(1) + жІ(1)) = -7 < 0.

Управление иІІ(і) = signp(t + 1) = -1, і Є {0,1}, при котором значение I(тп) = 8 < I(тІ) = 16. Очевидно, вычислен абсолютно оптимальный процесс. □

Пример 2. (улучшение неособого процесса, удовлетворяющего дискретному принципу максимума). Улучшить процесс тІ = (0, 0) в невыпуклой задаче [ , с. 111-113], [ , с. 137-138]:

2 ( )

I = (и2(і) - ж2(і)) ^ ІМ,

4=0

ж(і + 1) = ж(і) + и(і), ж(0) =0, і0 = 0, і і = 3,

и(і) Є Д, і Є {0,1, 2}.

Функция Гамильтона и ее производные:

Н = р(і + 1) (ж(і) + и(і)) - и2(і) + ж2(і),

Нж = р(і + 1) + 2ж(і), Ни = р(і + 1) - 2и(і).

Сопряженная система дискретного принципа максимума

р(і) = р(і + 1) + 2ж(і), р(3) = 0

на процессе тІ имеет решение рІ(і) = 0. Поэтому на паре р = рІ, ж = жІ функция Гамильтона

Н(і,рІ(і + 1), жІ(і), и(і)) = -и2(і)

принимает максимальное значение, равное нулю, при и(і) = иІ(і) =

0, і Є {0,1, 2}. Причем, процесс тІ не является особым в смысле дискретного принципа максимума.

Применение алгоритма, основанного на краевой задаче с отображением

иа (і,р(і + 1), ж(і)) = а (р(і + 1) + ¿(і)), а > 0,

где ¿(і) удовлетворяет уравнению вида (10) V і Є {і о, і о + 1, ...,іі - 1}. Дискретно-алгебраическая краевая задача вида (20), (4)-(6), (18):

ж (і + 1) = ж(і) + а (р(і + 1) + ¿(і)), ж(0) = 0,

р(і) = р(і + 1) + г(і), р(3) = 0,

г(і)ж(і) = ж2(і), и(і) (р(і + 1) - и(і)) = (р(і + 1) + ¿(і)) и(і). Находим зависимости

г (і,р(і + 1), ж(і)) = ж(і),

— а

¿(і) = -и(і), (і,р(і + 1), ж(і)) =-------р(і + 1),

а+1

а

й“ (і,р(і + 1), ж(і)) = —— р(і + 1).

а+1

Вспомогательная краевая задача:

а

ж(£ + 1) = ж(£) +-----р(£ + 1), х(0) = 0,

а + 1

р(г) = р(£ + 1) + ж(£), р(3) = 0.

Выражаем р(£ + 1) = р(£) — ж(£) и преобразовываем краевую задачу:

а

ж(£ + 1) = ж(£) +----[р(£) — ж(£)1, х(0) = 0,

а + 1

р(г + 1) = р(^) — ж(£), р(3) = 0.

К полученной краевой задаче применим популярный метод пристрелки, введя начальное условие р(0) = а с параметром а € Д. Производя последовательные вычисления в разностных уравнениях «слева-направо», получаем выражения для значений функций ж(£), р(£) и м(£) в зависимости от параметров а и а, представленные в таблице 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 1.

і ),а 4-( а) а)

0 0 а а а +1

1 аа а а

а + 1 (а + 1)2

2 а2 а + 2аа а а а (1 — а — а2)

(а + 1)2 а +1 (а + 1)3

3 2а2а + 3аа (а + 1)3 а(1 — а — а2) (а + 1)2 -

Условие ртт (3; а, а) = 0 выполняется при а = 0 или а2 + а — 1 = 0. Поскольку при а = 0 улучшение не происходит, то, положив а = 0,

решаем уравнение относительно а > 0. Находим а = ---------+------- > 0.

тт/ \ а тт/ ч —1 + л/5

Управление и(і; а, а) = -------гРтт(і + 1; а, а) при а = - ----:

а + 1 2

итт(0; а) = ----а, итт(1; а) = (^~-^а, итт(2; а) = 0.

^ ' 75+1 , (75+1)2 ,

Аналогично определяем фазовую траекторию:

жп(0; а) = 0, жп(1; а) = ---1 а, жп(2; а) = (у^ ( 1)(Л'//5+ 3)а.

V 5 + 1 (V 5 + 1)2

Вычисляем значение I(т11) = —Са2 < I(т1) = 0, где С к 0.3, при параметре пристрелки а = 0.

Применение модифицированного алгоритма на основе краевой задаче с максимизирующим отображением п7*. Вводится вспомогательный целевой функционал

2

/7(т1, т) = 7х(Дж(3))2 + ^ (п2(4) — ж2(4) + 72(Дж(£))2) ,

4=0

где 71,72 > 0. Функция Гамильтона вспомогательной задачи:

Н7 = р7(4 + 1) (ж(4) + п(4)) — п2(4) + ж2(4) — 72(Дж(4))2.

Зависимость п7*(£,р7(4 + 1),ж(4)) = -р7(4 + 1).

Дискретно-алгебраическая краевая задача вида (16), (4)-(6):

ж (4 + 1) = ж(4) + 1р7 (4 + 1), ж(0) = 0, р7 (4)= р7 (4 + 1)+ г7 (4), р7 (3) = —97, г7 (¿)ж(£) = (1 — 72)ж2(4), д7 ж(3) = 71 ж2(3).

Разрешаем алгебраические уравнения:

г7 = (1 — 72) ж(4), 97 = 71ж(3).

Вспомогательная краевая задача:

ж (4 + 1) = ж(4) + 1р7 (4 + 1), ж(0) = 0,

р7 (4) = р7 (4 + 1) + (1 — 72)ж(г), р7 (3) = —71ж(3). Преобразуем вспомогательную краевую задачу:

ж(4 + 1) = ж(4) + 2 [р7(4) + (72 — 1)ж(4)] , ж(0) = 0, р7 (4 + 1) = р7 (4) + (72 — 1)ж(4), р7 (3) = —71ж(3).

Для решения полученной краевой задачи воспользуемся методом пристрелки. Вводится начальное условие р7(0) = а, где а € К — параметр, и рассматривается задача Коши при £ € {0,1, 2}:

ж(г + 1) = х(£) + 2 [р7(£) + (72 - 1)х(£)] , х(0) = 0,

р7(£ + 1) = р7(£) + (72 - 1)х(£), р7(0) = а.

Решение задачи Коши находится аналитически. В таблице 2 представлены формулы для вычисления значений функций жп(£; 72, а),

р7П(£; 72, а) и и11 (£; 72, а) = — р7П(£ + 1; 72, а) в последовательные моменты времени.

Таблица 2.

£ жп(£; 72, а) )а 2 4-( р мп(£; 72, а)

0 0 а а 2

1 а 2 а (72 + 1)а 4

2 (72 + 3)а 4 (72 + 1)а 2 (112+112—8)а

3 (1 2 3 5 ) \8 7'2 + 412 + 8; а (1 ^ + 72 — 1) а —

С учетом краевого условия р7П(3; 72, а) = —71ЖП(3; 72, а) получаем соотношение

(23) (1722 + 72 — 1) а = —71 (1722 + 372 + 8) а.

По таблице 2 видно, что при а = 0 получается улучшаемый процесс. Потребуем, чтобы а = 0.

13 5

Заметим, — 72 +— 72 +— > 0 ¥72 > 0. Если в (23) параметр 71 > 0,

8 4 8

то для истинности соотношения (23) нужно, чтобы при условии а = 0

было справедливо неравенство — 7! + 72 — — < 0. Отсюда выводится

условие 72 € [0, а/5 — 2). При 72 =0 имеем допустимое значение

2

71 =5.

При yi = 0 с учетом требования a = 0 заключаем, что краевое условие будет выполняться только при Y2 = V5 — 2.

Если одновременно yi =0 и Y2 =0, т.е. модификация отсутствует, то для справедливости соотношения (23) нужно, чтобы a = 0, что означает отсутствие улучшения.

Исходный функционал I на процессе, описанном в таблице, превращается в функцию

z(y2, a) = “8“ ^8y4 + y3 + 4 y2 — 3y2----g”^ , a = 0, Y2 e С0, ^ — 2] •

2 3Г

Например, при yi = _ и Y2 =0 имеем I(m11) = — —a2, a = 0.

5 64

л/б

Если yi =0 и Y2 = V5 — 2, то I(m11) = —— a2, a = 0. □

Пример 3. Улучшить управление u!(0) = 0, м!(Г) = 5 [22, с. 228] в задаче, известной по книгам [22,29]:

I = —x2(2) ^ inf,

xi(t + Г) = xi(t) + 2u(t), xi(0) = 3,

X2(t + Г) = — x2(t) + X2(t) + u2(t), X2(0) = 0,

|u(t)| < 5, t e {0, Г}, t0 = 0, t1 = 2.

Имеем х1(Г) = 3, x1(2) = Г3, x2(1) = —9, x2(2) = 7, I(m1) = —7.

В данной задаче функция Гамильтона

Н = pi(t + Г) (xi(t) + 2u(t)) + p2(t + Г) (—x1(t) + X2(t) + u2(t)) •

Если pi, р2-сопряженные переменные в дискретном принципе максимума, то в момент t = 0 на значении м*(0) = —2 оптимального управления функция Гамильтона достигает своего минимума, а в момент t = Г на значениях м*(Г) = ±5-максимума.

В книге [22, с. 226-230] применяется метод возможных направлений, в монографии [29, с. 246-247]—метод 2-го порядка, в котором разрешающая функция <^>(t, x) берется линейно-квадратической.

Применение проекционного алгоритма. Образуем разностные уравнения вида (4):

НЖ1 = pi(t + Г) — 2p2(t + T)xi(t), Hx2 = P2 (t + Г),

Pi(t) = Pi(t + Г) — 2p2(t + ^xi(t) + ri(t), pi(2) = 0,

P2(t) = p2(t + Г)+ r2(t), p2(2) = Г.

Составляем уравнение на г(і) типа (5):

Н(і,р(і + 1), ж(і), м!(і)) =

= рі(і + 1) (хі(і) + 2иІ(і)) + Р2(і + 1) (-ж2(і) + Х2(і) + (м!(і))2) ,

Н (і,р(і + 1),жІ(і),иІ(і)) =

= рі(і + 1) (жі(і) + 2иІ(і)) + р2(і + 1) (-(жі(і))2 + ж2(і) + (иІ(і))2) , Н(і,р(і + 1), ж(і), иІ(і)) — Н(і,р(і + 1), ж1 (і), иІ(і)) =

= рі(і + 1)Джі(і) + р2(і + 1) (—ж2(і) + (жі(і))2 + Дж2(і)) ,

Нх(і,р(і + 1),жІ(і),иІ(і)) =

= (рі(і + 1) — 2р2(і + 1)жі(і), Р2(і + 1))Т , рі(і + 1)Джі(і) + Р2 (і + 1) ( —жі(і) + (жі(і))2 + Дж2(і)) =

= (рі(і + 1) — 2р2(і + 1)жі(і)) Джі(і) + Р2(і + 1)Дж2(і)+

+гі (і)Джі(і) + Г2(і)Дж2(і),

— (Джі(і))2 Р2(і + 1) = гі(і)Джі(і) + Г2(і)Дж2(і). Составляем уравнение на ¿(і) типа (10):

Н(і,р(і + 1), ж(і), и(і)) — Н(і,р(і + 1), ж(і), иІ(і)) =

= 2рі(і + 1)Ди(і) + р2(і + 1) (и2(і) — (адІ(і))2) =

= Ди(і) [2рі(і + 1) + р2(і + 1) (и(і) + иІ(і))] ,

Н„(і,р(і + 1),ж(і), иІ(і)) = 2рі(і + 1) + 2р2(і + 1)иІ(і),

(Ди(і))2 р2(і + 1) = Дм(і)й(і), ¿(і) = Ди(і)р2(і + 1). Образуется дискретно-алгебраическая система рік)(і) = Рік)(і + 1) — 2р2к)(і + 1)жік)(і) + г(к)(і), Рік)(2) = 0, р2к)(і) = р2к)(і +1) +г(к) (і), р2к)(2) =1,

— (Джі_к)(і)^ р2&)(і + 1) = г(к)(і)Джі_к)(і) + г(к)(і)Дж2к)(і), ¿(к)(і) = Дм(к)(і)р2к)(і + 1), і Є {0,1}, к > 0.

При начальном приближении и(0)(і) = мІ(і) имеем г(0)(і) = 0, д(0) = 0, ¿(0)(і) = 0, I(т(0)) = —7. Зафиксировав а = 0.12, вычисляем последовательные приближения, следуя (22):

I (т(і)) = —18.0592, I (т(2)) = —0.8334, I (т(3)) = —18.9930.

Управление и(3)(0) = -2.0483, м(3) (1) = 5 приближенно можно считать оптимальным. □

Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В данной статье показано, что для построения методов нелокального улучшения в общих нелинейных дискретных задачах при использовании специальных сопряженных систем достаточно линейной функции Кротова ^(¿,ж) = (р(£),ж). Представлены алгоритмы улучшения, базирующиеся на решении краевых задач с максимизирующим и проекционным отображениями, а также проекционный алгоритм, действующий в пространстве управлений и не основанный на решении краевой задачи.

В отличие от общего подхода В.Ф. Кротова, где для задач со свободным правым концом предусматривается априорное задание функции <£>(£, х) как решения линейного уравнения в частных производных либо как линейно-квадратической с помощью векторно-матричной присоединенной системы, здесь функция Кротова задается в линейной форме и окончательно ищется совместно с улучшающим элементом.

Для повышения эффективности подхода проведена модификация основных конструкций за счет фазовой регуляризации (термин

В.А. Срочко) с параметрами 71,72 > 0.

Представленные примеры иллюстрируют достаточно высокую эффективность разрабатываемой методики. Хотя требует более детального изучения вопрос о неоднозначности разрешения алгебраических уравнений относительно величин г(£), д, ¿(¿), а также вопрос об автоматизации задания и пересчета параметров проектирования, регуляризации, пристрелки.

Список литературы

[1] Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск : Наука, 1997.— 175 с. |[], 5

[2] Булдаев А. С. Процедуры нелокального улучшения управления в квадратичных по состоянию задачах управления // Изв. РАН. Теория и системы управл., 2003, № 2, с. 76—85. |[]

[3] Булдаев А. С. Проекционные процедуры нелокального улучшения линейно управляемых процессов // Изв. вузов. Матем., 2004, № 1, с. 18—24. |[]

Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Изв. Иркутского гос. ун-та. Сер. матем., 2009. 2, № 1, с. 94-107. |1

Булдаев А. С., Трунин Д. О. Нелокальное улучшение управлений в линейных по состоянию системах с терминальными ограничениями // Автоматика и телемеханика, 2009, № 5, с. 7-12. Т[]

Бутковский А. Г. О необходимых и достаточных условиях оптимальности для импульсных систем управления // Автоматика и телемеханика, 1963. 24, № 8, с. 1056-1064. Т[]

Васильев Ф. П. Методы оптимизации. М. : Факториал-Пресс, 2002.— 824 с.

Т[], 2, 4

Габасов Р. К теории необходимых условий оптимальности особых управлений // Докл. АН СССР, 1968. 183, № 2, с. 300-302. Т[]

Габасов Р., Кириллова Ф. М. К вопросу о распространении принципа максимума Л.С. Понтрягина на дискретные системы // Автоматика и телемеханика, 1966, № 11, с. 46-51. Т[]

Габасов Р., Кириллова Ф. М. Качественная теория оптимальных процессов.

М. : Наука, 1971.— 508 с. Т[], 1

Гурман В. И. К теории оптимальных дискретных процесов // Автоматика и телемеханика, 1973, № 7, с. 53-58. Т[]

Гурман В. И. Принцип расширения в задачах управления. 2-е изд. М. : Наука. Физматлит, 1997.— 288 с. Т[]

Гурман В. И., Батурин В. А., Расина И. В. Приближенные методы оптимального управления. Иркутск : Изд-во Иркутского ун-та, 1983.— 180 с. Т[], 5

Кротов В. Ф. Достаточные условия оптимальности для дискретных управляемых систем // Докл. АН СССР, 1967. 172, № 1. Т[]

Кротов В. Ф. Вычислительные алгоритмы решения и оптимизации управляемых систем уравнений. I; II // Изв. АН СССР. Техн. киберн., 1975, № 5; 6, с. 3-15; 3-13. Т[]

Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973.— 448 с. Т[]

Кротов В. Ф., Фельдман Н. Н. Итерационный метод решения задач оптимального управления // Изв. АН СССР. Техн. киберн., 1983, № 2, с. 160-168.

Т[]

Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и управления. М. : Наука, 1988.— 360 с. Т[]

Моржин О. В. Нелокальное улучшение нелинейных управляемых процессов на основе достаточных условий оптимальности // Автоматика и телемеханика, 2010 (в печати). Т[], 1

Пантелеев А. В., Бортаковский А. С. Теория управления в примерах и задачах. М. : Высшая школа, 2003.— 583 с. Т[], 1

Пропой А. И. Об одной задаче оптимального дискретного управления // Докл. АН СССР, 1964. 159, № 6, с. 1232-1235. Т[]

Пропой А. И. Элементы теории оптимальных дискретных процессов. М. : Наука, 1973.— 256 с. Т[], 1, 5

[23] Пухликов А. В. Дискретный принцип максимума // Докл. РАН, 1998. 360, № 6, с. 747-749. |[]

[24] Розоноэр Л. И. Принцип максимума Л.С. Понтрягина в теории оптимальных систем. I; II; III // Автоматика и телемеханика, 1959. 20, № 10; 11; 12, с. 1320-1334; 1441-1458; 1561-1578. |[]

[25] Смелов В. В. Алгебраический аспект дискретного принципа максимума // Докл. РАН, 2008. 423, № 2. |[]

[26] Срочко В. А. Итерационные методы решения задач оптимального управления. М. : Физматлит, 2000.— 160 с. |[], 2

[27] Срочко В. А., Душутина С. Н., Пудалова Е. И. Регуляризация принципа максимума и методов улучшения в квадратичных задачах оптимального управления // Изв. вузов. Матем., 1998, № 12, с. 82-92. |[], 2

[28] Тихонов А. Н. О методах регуляризации задач оптимального управления // Докл. АН СССР, 1965. 162, № 4, с. 763-765. |[], 2

[29] Krotov V. F. Global methods in optimal ^ntrol theory. New York : Marcel Dekker, 1996.— 385 p. T[], 1, 5

O. V. Morzhin. Nonlocal improving controls of nonlinear discrete systems. Abstract. The article is devoted to an approach for nonlocal improvement in general nonlinear optimal control problems with discrete systems on basis of the fundamental theory by V.F. Krotov and the state regularization (this term is by V.A. Srochko). The sufficient conditions of nonlocal improvement are formulated, including the regularized form. There are some improvement algorithms, which use special discrete algebraic boundary value problems with maximizing and projecting mappings for Hamilton’s function, and also an algorithm for construction the sequence of approximations in the space of controls. There are examples of improving "ordinary" processes and process, which satisfies the discrete maximum principle.

Key Words and Phrases: discrete control systems, nonlocal improvement of controls, sufficient conditions and improvement methods.

Поступила в редакцию 26.02.2010. Образец ссылки на статью:

О. В. Моржин. Нелокальное улучшение управлений нелинейными дискретными системами // Программные системы: теория и приложения : электрон. научн. журн. 2010. № 1(1), с. 21-44. URL: http://psta.psiras. ru/read/psta2010_1_21-44.pdf (дата обращения: 25.03.2010)

Нелокальное улучшение управлений нелинейными дискретными системами Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Моржин Олег Васильевич

Похожие темы научных работ по математике , автор научной работы — Моржин Олег Васильевич

Nonlocal improving controls of nonlinear discrete systems

Текст научной работы на тему «Нелокальное улучшение управлений нелинейными дискретными системами»