Научная статья на тему 'Использование Парето- и l-оптимальности при решении некоторых классов задач оптимального управления'

Использование Парето- и l-оптимальности при решении некоторых классов задач оптимального управления Текст научной статьи по специальности «Математика»

CC BY
344
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Финансы: теория и практика
Scopus
ВАК
RSCI
Область наук
Ключевые слова
ПАРЕТО-ОПТИМАЛЬНОСТЬ / L-ОПТИМАЛЬНОСТЬ / ВЫПУКЛЫЙ КОНУС / ФУНКЦИОНАЛ / ГЕНЕРАТОРЫ КОНУСА / PARETO-OPTIMALITY / L-OPTIMALITY / CONVEX CLOSED SET / DIMENSION MATRIX / FUNCTIONAL / CONE GENERATORS

Аннотация научной статьи по математике, автор научной работы — Киселёв Виктор Вадимович

Многие практические задачи хозяйственной деятельности и ряд важных вопросов экономической теории связаны с определением наилучшего, оптимального варианта решения. Адекватная экономическая теория должна отражать процесс непрерывного развития экономической системы, поэтому необходимо рассматривать экономические модели, в которых все экономические переменные зависят от времени, и иметь математический аппарат, позволяющий находить оптимальные значения этих переменных. Таким математическим аппаратом является теория оптимального управления. Классическая теория оптимального управления рассматривает модели, в которых поведение системы описывается системой дифференциальных уравнений, задан функционал, определяющий цель управления и множество ограниченных управляющих воздействий. Важным инструментом решения таких задач является принцип максимума Понтрягина. Но применение принципа максимума приводит ко многим вычислительным проблемам. Для решения некоторых классов вычислительных проблем используется понятие оптимальности по Парето. Более широким понятием является понятие L-оптимальности. Показано, что множество L-оптимальных решений может быть шире или у́же множества Парето-оптимальных. В данной статье выделены классы задач, которые удобно решать с использованием Паретои L-оптимальности. Приведен пример быстрого решения задачи управления рекламной деятельностью.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Pareto-optimality and L-optimal for solving some classes of optimal control problem

Many practical problems of economic activities and a number of important issues of economic theory are connected to the choice of optimal solution. An adequate economic theory should reflect the process of continuous development of the economic system; therefore, it is necessary to consider the economic models in which all economic variables depend on time, and to have a mathematical tool that allows to find optimal values of these variables. The theory of optimal control is a mathematical tool for just such a purpose. The classical theory of optimal control considers models in which the behavior of the system is described by a set of differential equations while the functional is given to define the purpose of control and a variety of the limited control actions is set. An important tool for solving such problems is the Pontryagin principle of maximum. However, the use of the maximum principle leads to many computational problems. That is why the concept of Pareto optimality is used to solve certain classes of computational problems. The broader concept is a L-optimality, its definition was introduced in P.L. Yu (Cone. Cone convexity, cone extreme points, and non-dominated solutions in decision problems with multi-objectives // Optim. Theory Appl. 1974. Vol. 14. № 3). It shows that a plurality of L-optimal decisions can be wider or narrower than the set of Pareto-optimalities. The article highlights the classes of problems that are easy to solve using the Paretoand L-optimality. The solution of advertising management problem is given for illustration purposes.

Текст научной работы на тему «Использование Парето- и l-оптимальности при решении некоторых классов задач оптимального управления»

МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ЭКОНОМИКИ

УДК 519.85(045) JEL C61

ИСПОЛЬЗОВАНИЕ ПАРЕТО- И Л- ОПТИМАЛЬНОСТИ ПРИ РЕШЕНИИ НЕКОТОРЫХ КЛАССОВ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

КИСЕЛЁВ ВИКТОР ВАДИМОВИЧ,

кандидат технических наук, доцент, доцент Департамента анализа данных, принятия решений и финансовых технологий, Финансовый университет, Москва, Россия E-mail: bars46@gmail.com

АННОТАЦИЯ

Многие практические задачи хозяйственной деятельности и ряд важных вопросов экономической теории связаны с определением наилучшего, оптимального варианта решения. Адекватная экономическая теория должна отражать процесс непрерывного развития экономической системы, поэтому необходимо рассматривать экономические модели, в которых все экономические переменные зависят от времени, и иметь математический аппарат, позволяющий находить оптимальные значения этих переменных. Таким математическим аппаратом является теория оптимального управления. Классическая теория оптимального управления рассматривает модели, в которых поведение системы описывается системой дифференциальных уравнений, задан функционал, определяющий цель управления и множество ограниченных управляющих воздействий. Важным инструментом решения таких задач является принцип максимума Понтрягина. Но применение принципа максимума приводит ко многим вычислительным проблемам. Для решения некоторых классов вычислительных проблем используется понятие оптимальности по Парето. Более широким понятием является понятие Л-оптимальности. Показано, что множество Л-оптимальных решений может быть шире или уже множества Парето-оптимальных. В данной статье выделены классы задач, которые удобно решать с использованием Парето- и Л-оптимальности. Приведен пример быстрого решения задачи управления рекламной деятельностью.

Ключевые слова: Парето-оптимальность, Л-оптимальность, выпуклый конус, функционал, генераторы конуса.

PARETO-OPTIMALITY AND Л-OPTIMAL FOR SOLVING SOME CLASSES OF OPTIMAL CONTROL PROBLEM

V.V. KISELEV

PhD (Economics), Associate Professor of the Analysis, Department of Decision Making Theory and Financial Technologies, Financial University, Moscow, Russia E-mail: bars46@gmail.com

ABSTRACT

Many practical problems of economic activities and a number of important issues of economic theory are connected to the choice of optimal solution. An adequate economic theory should reflect the process of continuous development of the economic system; therefore, it is necessary to consider the economic models in which all economic variables depend on time, and to have a mathematical tool that allows to find optimal values of these variables. The theory

of optimal control is a mathematical tool for just such a purpose. The classical theory of optimal control considers models in which the behavior of the system is described by a set of differential equations while the functional is given to define the purpose of control and a variety of the limited control actions is set. An important tool for solving such problems is the Pontryagin principle of maximum. However, the use of the maximum principle leads to many computational problems. That is why the concept of Pareto optimality is used to solve certain classes of computational problems. The broader concept is a A-optimality, its definition was introduced in P.L. Yu (Cone. Cone convexity, cone extreme points, and non-dominated solutions in decision problems with multi-objectives // Optim. Theory Appl. 1974. Vol. 14. № 3). It shows that a plurality of A-optimal decisions can be wider or narrower than the set of Pareto-optimalities. The article highlights the classes of problems that are easy to solve using the Pareto-and A-optimality. The solution of advertising management problem is given for illustration purposes. Keywords: Pareto-optimality, A-optimality, convex closed set, dimension matrix, functional, cone generators.

Существующие в настоящее время динамические модели экономики представляют собой формальное описание множеств вариантов развития экономической системы, или траекторий экономики, удовлетворяющих тем или иным требованиям [1].

ИСПОЛЬЗОВАНИЕ Л- ОПТИМАЛЬНОСТИ

Будем рассматривать следующую задачу. Поведение системы описывается уравнением:

x = l (x) + Bu = f (x, u), x e X с RN , u eU с RM.

Задано начальное условие х(0) = х0. Здесь X— некоторое выпуклое открытое множество, V — выпуклое замкнутое множество. В = В( — матрица размерности N х М, причем В > 0 на [0, Т].

Требуется минимизировать функционал

T

J F (x, t )dt.

Пусть

xN+1 = 1 = fN+1, xN+1 (0) = 0,

xo = F = f0, x0(0) = 0. Запишем систему сопряженных уравнений [2]:

f=-! ,' ™ ,0=-i.

Теперь принцип максимума можно записать так [3]:

0 = ^ (" ^ ^ + £ +

1_ г'=1

N

= + Еф/. + + тах (ф,Ви ).

/=1

Пусть Л — выпуклый конус, вектор-функция g(u) определена на множестве V.

Определение 1 [4]. Вектор иЛе V называется Л-оптимальным, если не существует такого вектора ие V, что g(u) - g(Uл) е Л, g(u) * g(Uл).

Множество всех Л-оптимальных точек на V будем обозначать Vл.

Замечание. Если все координаты вектор-функции g(u) желательно максимизировать на множестве V, тогда Парето-оптимальность — это Л-оптимальность для конуса

Л = {{. > 0,, = } и оптимальность по Слейтеру, если

Л = {{ > 0,, = }.

Множество точек, оптимальных по Парето, будем обозначать V а множество точек, оптимальных по Слейтеру, VС.

Определение 2. Конус Л* называется многогранным, если его можно представить в виде

Л* = |^ = £а,И,, а, > 0, И, е ЯМ,, = Ц1.

Векторы И{,, = 1, Ь называются генераторами конуса.

Теорема 1. Если множество значений функции ф(0 ограничено на [0, Т] и принадлежит некоторо-

му выпуклому конусу Л* [данное предположение, в частности, выполнено, если множество значений ф(0 — выпуклое и не содержит начало координат], тогда

тах (ф,Би) = тах (ф, Би)

иеи ' иеиЛ 4 '

для конуса

Л = {{,г)> 0, г еЛ*}. Доказательство. Выражение

ванного и е и с Ям и х2 > х1, х1, х2 е X выполняется Ф(х2, и) > Ф(х1, и).

Пример. Функция Е(хр х2) = х2 - 8тх1 определена при 100 < х1 < 100, 100 < х2 < 100. Д анная функция монотонна по группе переменных х2 и Л-монотонна для конуса

Л = {г е Я2|(а1, г) > 0,(а2, г) > 0,а1 = = (10,1), а 2 = (-10,1)}.

Теорема 2. Рассматривается задача оптимального управления

max (cp,Bu )

ueU V '

означает, что оптимальное управление в каждый момент времени следует выбирать так, чтобы максимизировать скалярное произведение (ф, Би), которое в фиксированный момент времени можно рассматривать как линейную свертку координат вектора Би с весами ф, по условию ф е Л*. Доказательство того, что максимум линейной свертки при данных условиях достигается на множестве Л-оптимальных решений, приведено в работе [4].

Замечание. Для практических вычислений всегда можно выбрать выпуклые многогранные конуса Л* и Л2, такие, что Л* с Л* с Л2,. Из этих вложений следует: Л1 з Л з Л2 и иЛ с иЛ с и.

Далее рассмотрим возможность использования понятия Л-монотонности для сокращения количества вычислений.

Определение 3. Пусть Л с Ям — выпуклый конус, размерность конуса равна М. Скалярная функция Ф(и), и е Vс Ям называется строго Л-возрастающей (Л-неубывающей) на множестве V, если из и1 - и2 е Л, и1, и2 е V, Л-выпуклый конус, следует Ф(и1) > Ф(и2) (Ф(и1) > Ф(и2)).

Определение 4 [4]. Пусть Л — фиксированный выпуклый конус, Л с Ям+м, функция Ф(х, и) определена и непрерывна на выпуклом множестве V = и и X. Если для любых и1, и2 из множества и с Ям таких, что и2 е и1 + Л, и1 Ф и2 и любом фиксированном х из X с Ям выполняется неравенство Ф(х, и2) > Ф(х, и1) (Ф(х, и2) > Ф(х, и1)), то будем говорить, что функция Ф(х, и) строго Л-монотонна (Л-монотонна) по группе переменных и.

Определение 5. Функция Ф(х, и) определена и непрерывна на выпуклом множестве V = и и X. Данная функция называется неубывающей по группе переменных х, если для любого фиксиро-

T

| F (х, u)dt

^ max,

х = (х^),..., хы^)), и = (и^),...,им (^)), х = /(х,и), х(0) = х0, и е и, х е X.

Здесь и, X — выпуклые множества, функции Е(х, и) и Ах, и) являются неубывающими по х и Л-неубывающими по и,/(х, и) > 0 в области определения. Тогда

max

ueU

1 1 I F(х, u)dt = max I F(х, u )dt,

J ueU. J

где иЛ — множество Л-оптимальных решений.

Доказательство. В данной задаче для любых t1, t2 e [0, T] таких, что t2 > tj и любого u e U выполняется неравенство x(^ + At2) > x(^), поскольку

x(tj + At) = x(tj) + f (x(tj), u(tj))At + o(At)

иfx(tj), u(tj))At> 0. Функция f(x, u), Л-монотонна по группе переменных u, поэтому [6]

max

ueU

f (x, u ) = max f (x, u ).

(1)

Отсюда следует: max x(t1 +At) = max{x(t1) + f (x(t1), u (t1))At +

ueU ueU

o(At)} = max{x(t1) + f (x(t1), u (t1)) At + o(At)}.

ueU

В момент времени 0

maxF(x0,u) = maxF(x0,u).

ueU \ ' ueU. V '

В момент времени А( в силу равенства (1) и свойств функции Е выполнено

тах ¥ (х(А1), u (А1)) = тах ¥ (х(А1), u (А1)).

uеV uеVл

Аналогичные равенства можно записать в моменты времени 2 Д1, ..., пД1. Поскольку в любой момент времени

тах ¥ (х, u) = тах ¥ (х, u),

uеV uеVд

то можно записать

| ¥ (х, u )& = тах | ¥ (х, u )Л.

тах

uеU

ИСПОЛЬЗОВАНИЕ ПАРЕТО-ОПТИМАЛЬНОСТИ ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Частный случай теоремы 2 можно сформулировать так.

Следствие теоремы 2. Если задача оптимального управления имеет вид

| ¥ (х, u ')&

^ тах,

х = (х^),..., XN (1)), u = (^(1),..., Uм (1)),

х = /(х,u), х(0) = х0, u еV,х е X.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь V, X — выпуклые множества, функции ¥(х, п) и /(х, u) являются неубывающими по х и неубывающими по u, /(х, u) > 0 в области определения. Тогда

тах

uеV

I ¥(х, u = тах I ¥(х, u,

J uеV„ J

х = /м),

х2 = /2 (U2),

хк = /к К X

хк+1 = /к+1 ( х,1),

XN = fN ( х,1).

Задано х(10) = х0, u е Vс ^^ , здесь V — выпуклое множество.

Т

Требуется минимизировать интеграл I ¥ (х, 1) Л.

0

Полагаем ^+1 =1 = ^+1, ■%+!(0) = 0 х0 = ¥ = fo, х0(0) = 0.

Для исходной системы можно записать систему сопряженных уравнений

дф = -Еф / Ф =-1 ^ = 0 дг £ фдх,' ф0 1 я

Далее будем рассматривать расширенные векторы / е Д^2, фе ^+2.

Теорема 3. Если известно, что ф1(1) > 0, ф2(1) > 0, ..., фк(1) > 0, то для принципа максимума верно следующее равенство:

тах(ф /) = max(ф, /).

uеV uеVc

Доказательство. Запишем детально принцип максимума:

где VП — множество Парето-оптимальных решений.

Следствие. Если в условиях теоремы 3 множество V является параллелепипедом

V = К,¿1]х...х[а ,Ьм],

тогда вектор ub> (Ь1, ..., Ьм) задает оптимальное управление в любой момент времени.

ЧАСТНЫЙ СЛУЧАЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Рассмотрим частный случай задачи оптимального управления, когда правые части исходной системы дифференциальных уравнений имеют

вид: fl(ul),Л^Х fk(uk),Л+^х Мх 0.

max(ф, /) = тах £ ф1/1 =

uеV uеV ,-=0

Г к N+1 |

= тах Г ф0/0 + Е ф,/, + Е ф,/, Г =

^ I ,=1 ,=к+1 ]

N+1 | к |

= фсЛ + Е ф,/! + тах ] Е ф,/! г.

В каждый момент времени выражение

к

тах{Е фг/г}

uеV ■ л

— линейная свертка с неотрицательными весовыми коэффициентами ф. Поэтому можно записать

max{X Pif } = max{X P;f }.

ueU

ueUr

d P f 8f

= -p0 -p

dt 8x 8x

= Po - PI -a

РЕШЕНИЕ ЗАДАЧИ ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОЙ ПОЛИТИКИ ОБЛАСТИ РЕКЛАМНОЙ ДЕЯТЕЛЬНОСТИ

Ниже приводится решение задачи, сформулированной в книге [5]. Выбрать оптимальную политику в области рекламной деятельности, которая стимулирует объем продаж данного продукта за некоторый период времени при следующих условиях: скорость изменения объема продаж уменьшается пропорционально объему продаж и увеличивается пропорционально уровню рекламной деятельности в той части рынка, которая еще этим продуктом не насыщена. Задача имеет вид

I S(t)dt ^ max,

t ИО}

x0(t) = x1 dt,

0

x0 = -xi = f0, x0(0) = 0,

x, = -ax +bu I 1---

1 1 1 M

х1(0) = х°, 0 < и < и. Запишем систему сопряженных уравнений:

1

b • u M

(3)

= P0 +Pi -B,

где

S = -aS + bA| 1 -S ,, M J

S (О = 50, 0 < Л(Г) < Л,

где 5" — объем продаж; А — уровень рекламной деятельности; М — емкость рынка; ^ а, Ь, 50, А — заданные положительные параметры.

Пусть - ¿0 = Т, х 1 = 5, А (О = и, Л = и, тогда сформулированную выше задачу можно переписать так:

В = a +---u;

M

поскольку а > 0, Ь, М, и — неотрицательные числа, то 5 > 0.

Из первого уравнения следует ф0(0 = С0; используя формулу граничного условия, можно записать:

ф0(Т) = -1 = С0 =фс(^).

Получим условия для нахождения оптимального управления:

m ax(P f) = rn iK( /¿P0 + f1P1) =

0<u<U 0<u<U

= max(-1-(-x1) + | -ax1 + bu 1 \ \-P =

= x - ax P + max bu I 1 —- l-p;

1 m 0<u<U ^ M J

поскольку по условию задачи b > 0, — < 1, то

M

u* = UsigP1, где

sigP1 = •

[1 при P1 > 0 [0 при P1 < 0.

Подставим оптимальное управление в выражение, определяющее В:

В=

a при P1 < 0 bU

a +--при p > 0.

M1

Заметим, что *(Вф1 - 1) = ёВфу

Теперь уравнение (3) можно переписать в виде

*(Вф1-1) = ВЛ. (Вф1-1)

d P0 = P 8f0 P 8f1

dt

= -P^Ti-It1 = -Pc -0-p -0 = 0, (2)

8x

8x

Проинтегрируем это уравнение:

ln |Bp1 -1 = Bt - c,

это эквивалентно

Так как ф^Т) = 0, то eBTc = 1 или BT = c, т.е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[Вф1 -1 = eBt-c при Вф1 -1 > 0; (4)

[-(Вф1 -1) = eBt-c при Вф1 -1 < 0. (5)

Из граничного условия следует фДТ) = 0. Запишем выражения для ф1.

Из уравнения (4) следует:

/ ВТ-с . 1\

ф1(Т) = ^ * 0.

В

Из уравнения (5) следует:

ф1 =

(-eBt-c +1) B '

ф1 =

(1 - eB( t)) B

Поскольку ф1 > 0 при 0 < 1 < Т и ф = 0 при 1 = Т, то теперь можно записать оптимальное уравнение:

ы* = Vпри 0 < 1 < Т.

Выше было приведено классическое решение задачи. Если использовать теорему 1, то решение можно получить значительно проще и быстрее. Поскольку ф(1) > 0 на интервале [0, Т), то Л* = = (У IУ > 0}, тогда Л = (г | г у > 0}. Отсюда следует, что г > 0 и V = V, это означает, что по теореме 1

u* = Vпри 0 < 1 < Т.

ЛИТЕРАТУРА

1. ЛагошаБ.А, Апалькова Т.Г. Оптимальное управление в экономике: теория и приложения. М.: Финансы и статистика, 2008.

2. Математические методы в экономике и финансах / под. ред. В.М. Гончаренко. М.: КНОРУС, 2016.

3. Ванько В.И., Ермошина О. В., Кувыркина Г.И. Вариационное исчисление и оптимальное управление. М.: МГТУ им. Баумана, 2001.

4. Kiselev V.V. Application of the Л-Monotonicity to the Search for Optimal Solutions in Higher-Dimensional Problems. Journal of mathematical science, 2016, vol. 216, no. 5, pp. 667-673.

5. Интрилигатор М. Математические методы оптимизации и экономическая теория. М.: Айрис Пресс, 2002.

6. Киселёв В. В. Использование Л-монотонности по группе переменных для снижения размерности задачи // Обозрение прикладной и промышленной математики. 2008. Т. 15. Вып. 2. C. 312-313.

7. Yu P.L. Cone convexity, cone extreme points, and nondominated solutions in decision problems with multiobjectives // Optim. Theory appl, 1974, vol. 14, no. 3.

REFERENCES

1. LagoshaB.A., Apalkova T. G. Optimal'noe upravlenie v jekonomike: teorija i prilozhenija [Optimum control in economy: theory and applications]. Moscow, Finansy i statistika, 2008 (in Russian).

2. Matematicheskie metody v jekonomike i finansah [Mathematical methods in economy and finance] / ed. VM. Goncharenko. Moscow, KNORUS, 2016 (in Russian).

3. Wanko V.I., Yermoshina O. V., Kuvyrkin G.I. Variacionnoe ischislenie i optimal'noe upravlenie [Calculus of variations and optimum control]. Moscow, MGTU im. Baumana, 2001 (in Russian).

4. Kiselev V.V. Application of the Л-Monotonicity to the Search for Optimal Solutions in Higher-Dimensional Problems. Journal of mathematical science, 2016, vol. 216, no. 5, pp. 667-673 (in England).

5. IntriligatorM. Matematicheskie metody optimizacii i jekonomicheskaja teorija [Mathematical Optimization and Economic Theory]. Moscow, Airis Press, 2002 (in Russian).

6. Kiselev V.V. Ispol'zovanie Л-monotonnosti po gruppe peremennyh dlja snizhenija razmernosti zadachi [Application of the Л-monotonicity with respect to a group of variables for the reducing of the dimension of a problem]. Review of the applied and production mathematics — Obozrenie prikladnoj i promyshlennoj matematiki, 2008, vol. 15, no. 2, pp. 312-313 (in Russian).

7. Yu P. L. Cone convexity, cone extreme points, and nondominated solutions in decision problems with multiobjectives. Optim. Theory appl, 1974, vol. 14, no. 3 (in England).

i Надоели баннеры? Вы всегда можете отключить рекламу.