Научная статья на тему 'Обратная задача оптимизации и задача Лагранжа'

Обратная задача оптимизации и задача Лагранжа Текст научной статьи по специальности «Математика»

CC BY
645
99
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Зыкина Анна Владимировна

Для одной содержательной задачи строится обратная задача оптимизации, решение которой заменяется решением обобщенной задачи Лагранжа по методу последовательных приближений. В рассмотренных случаях разрешимости обратной задачи сходимость метода обеспечивается некоторым специальным приемом выбора величины шага.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обратная задача оптимизации и задача Лагранжа»

УДК 519.95

Á. В. ЗЫКИНА

Омский государственный технический университет

ОБРАТНАЯ ЗАДАЧА ОПТИМИЗАЦИИ И ЗАДАЧА ЛАГРАНЖА_

Для одной содержательной задачи строится обратная задача оптимизации, решение которой заменяется решением обобщенной задачи Лагранжа по методу последовательных приближений. В рассмотренных случаях разрешимости обратной задачи сходимость метода обеспечивается некоторым специальным приемом выбора величины шага.

Введение

Рассматривается обратная задача оптимизации в постановке [1]:

для исходной параметрической задачи математического программирования (МП) найти параметры и отвечающие им оптимальные решения задачи МП, удовлетворяющие некоторым условиям.

Заданы выпуклые замкнутые множества X с К" и УсГ в конечномерных эвклидовых пространствах Для хеХ и уеУ вводятся следующие функции:

— <7,(х,у) — скалярная функция, выпуклая либо по совокупности переменных (х,у), либо по переменной х При любом фиксированном у;

— д2{х,у) — векторная функция, каждая скалярная функция которой выпукла по совокупности переменных;

~ 9э(х'У): д4(*,у) — векторные функции, каждая скалярная функция которых выпукла по переменной у. при любом фиксированном х.

Рассматривается параметрическое семейство задач МП по параметру у е У

пИп{д,(х,у)\д2(х,у)<0,хеХ} (1)

х

Тогда обратная задача оптимизации состоит в нахождении параметров у е У, для которых оптимальное решение х = х' = х(у ) задачи МП (1) при у = у Удовлетворяет условиям

д3(х,у)=0, д4(х,у)>0. (2)

Содержательно задача (1) характеризует выбор оптимальных внутренних параметров х функционирования некоторой большой экономической, инженерной, вычислительной или другой системы при воздействии на эту систему некоторых внешних факторов, характеризующихся внешними параметрами у. Задача (2) характеризует балансовые соотношения, при которых система функционирует стабильно и эффективно.

Обратные задачи оптимизации можно рассматривать как специальные задачи известных классов за-Аач, а именно, нелинейные операторные уравнения, ИгРы л лиц с равновесием по Нешу, иерархические игры с равновесием, реализующим принцип гарантированного результата и другие. Однако критический обзор возможных подходов к решению обратных задач оптимизации показывает невозможность, либо неэффективность использования известных методов Решения [1].

В связи с этим представляется актуальной разработка новых подходов к решению обратных задач.

Постановка задачи

Рассмотрим сложную систему, функционирование которой задается характеристиками

Р(х) = (/,(х),...,их))е^,

зависящими от внутренних параметров системы х е R" ■ Каждый вектор характеристик F(x) оценивается вектором внешних параметров у е Л"1 + и с помощью квадратной матрицы Р задаются допустимые характеристики

F(x)<Py (3)

Требуется выбрать такие внешние параметры у , для которых внутренние параметры системы х =х(у ) задают допустимые характеристики (3) с минимальной суммарной оценкой yTF(x).

Балансовые соотношения, характеризующие эффективную работу системы, состоят в том, что характеристики с ненулевыми оценками используются на пределе допустимости, и наоборот, характеристики, имеющие запас допустимости, получают нулевые оценки.

Математически это означает, что для каждой координаты F(x) выполняются классические условия дополняющей нежесткости между ограничением (3) на координату F(x) и соответствующей координатой оценки, а именно, для ненулевой оценки у, > 0 соответствующее í-e ограничение (3) на характеристику выполняется как равенство, и строгому ограничению неравенству для í-й характеристики (3) соответствует нулевая оценка у, = 0.

Математическая модель для решения поставленной задачи задает обратную задачу (1), (2) с множествами X = Я", У = /у е Я™ | у £ в следующем виде.

Рассмотрим параметрическое семейство задач МП по параметру уеУ

min{yTF(x)\F(x)-Py< 0} (4)

х

Тогда обратная задача оптимизации состоит в нахождении параметров уеУ, для которых оптимальное решение х = х = х(у') задачи МП (4) с параметрами у = у' удовлетворяет условиям

yT(F(x)-Py) = Q,y>0 (5)

Обобщенная задача Лагранжа

Зафиксируем в задаче (4) вектор параметров у е Y и запишем функцию Лагранжа

Цх,у, X) = yTF(x) + XT(F(x)-Py),

где Xе Rm - Х>0 - вектор множителей Лагранжа. Тогда необходимые условия Куна-Таккера для задачи (4) запишутся в следующем виде [2]

yTVF(x) + XTVF(x) = О,

XT(F(x)-Py) = 0-

Здесь VF(x) — матрица Якоби, строками которой являются градиенты функций fl(x),...,fjx).

Для выпуклых функций fjx),...,fjx), задающих векторную функцию F(x), задача (4) при фиксированном векторе параметров у е Y является задачей выпуклого программирования. В этом случае при выполнении условий регулярности необходимые условия Куна-Таккера являются достаточными, и решение задачи (4) для любого вектора параметров у е Y можно заменить решением обобщенной задачи Лагранжа:

yTVF(x) + XTVF(x) = 0 F(x)-Py<0, \>0, XT(F(x)-Py) = 0.

(6)

(7)

(8)

Следовательно, обратную задачу (4), (5) с выпуклыми функциями Цх),...,{т(х) можно заменить задачей (6)-(8) с параметрами у, удовлетворяющими условиям (5).

Выберем параметры у равными множителям Лагранжа Л. Тогда обобщенная задача Лагранжа (6)-(8) запишется так

XTVF(x) = 0, F(x)-PX<0, ^>0, XT(F(x)-PX) = 0.

(9) НО) (11)

зволяет предложить новый метод для решения поставленной задачи.

Рассмотрим условия (10)-(11) обобщенной задачи Лагранжа относительно переменных Л при фиксированном значении х е X • в этом случае получаем линейную задачу дополнительности [3,4] 1СР(Р,д) со значением д = Р(х)

РЛ >F(x), Л>0, ЛТРЛ = ЛТР(х).

(12) (13)

При этом условие (5) для параметров ув обратной задаче есть условие (11) для обобщенной задачи Лагранжа, где у = Л.

Таким образом, решая обобщенную задачу Лагранжа (б)-(8) с параметрами у = Л, в случае ее разрешимости мы получим решение обратной задачи (4), (5).

Итерационный метод для обратной задачи

Итак, если исходная задача (4) является задачей выпуклого программирования при каждом фиксированном значении вектора параметров у е V и выполняются условия регулярности, то решение обобщенной задачи Лагранжа (9)-(11) дает решение обратной задачи (4), (5). Заметим, что для выпуклости задачи (4) при фиксированном значении вектора параметров у е V достаточно выпуклости функций Цх),...,[^(х). Для выполнения условий регулярности достаточно либо линейности, либо строгой выпуклости функций

ц*).....и*)-

Классическим методом для решения обобщенной задачи Лагранжа (9)-( 11) является метод множителей Лагранжа [2]. Однако специфика задачи (9)-(11), появившаяся в результате замены произвольного параметра у е К на вектор множителей Лагранжа л, по-

Основная теорема в теории линейных задач дополнительности утверждает [5], что задача (12)-(13) имеет единственное решение А для любого вектора правых частей ц=Р(х) тогда и только тогда, когда матрица Римеет положительные главные миноры (в этом случае говорят, что матрица Р является Р-мат-рицей). Утверждение теоремы справедливо и для матриц Р с положительно определенной симметризацией [5].

Первым итерационным методом, предложенным для решения линейных задач дополнительности, является алгоритм дополнительного ведущего преобразования Лемке [6], являющийся аналогом симплекс-метода. При этом решение задачи линейного программирования с неотрицательной матрицей при помощи методаЛемке в 2-3 раза эффективнее обычного симплекс-метода [3).

Для решения обобщенной задачи Лагранжа (9)-(11) применим следующий итерационный процесс.

Пусть задана произвольная начальная точка х° е Я" и пусть точка х* уже найдена. Одна итерация метода состоит в следующем.

Для заданной точки хк условия (10), (11 (обобщенной задачи Лагранжа (9)-(11) определяют линейную задачу дополнительности (12)-( 13) по параметру Я*

РЛк > Р(хк), :лк> о. ,(Лк)тРЛк =(Лк)тР(хк). (14)

Находим Лк = Л"(хк) как решение линейной задачи дополнительности (14) и определяем

Т1к =-( Л" )тУР(хк).

Если окажется, что т)к = 0, то обобщенная задача Лагранжа (9)-(11) решена и значит, получено*' = х* решение обратной задачи (4), (5).

Если 77* * 0 , то выбираем а* >0 и делаем итерационный переход в следующую точку

к к к х =х +а V •

В случае разрешимости обобщенной задачи Лагранжа (9)-(11) предлагаемая итерационная схема является сходящейся при определенных условиях на выбор величины шага а" 17|.

Разрешимость обратной задачи

Для разрешимости обратной задачи (4), (5) необходима разрешимость задачи выпуклого программирования (4) при заданном значении параметра у. Для разрешимости задачи выпуклого программирования (4) необходима, прежде всего, непустая допустимая область при данном значении параметра у

Ху = {Р(х)-Руй О}*0.

Достаточным условием разрешимости задачи выпуклого программирования может быть одно из следующих двух условий:

1. Допустимое множество Ху является компактным множеством.

2. Целевая функция д^(х,у) = утР(х) является ограниченной функцией на допустимом множестве Ху.

Достаточное условие разрешимости обратной задачи (4), (5) кроме указанных условий для разрешимости задачи выпуклого программирования (4) включает еще и выполнение условий (5) для заданного параметра у и соответствующего ему оптимального решения х = х(у).

Таким образом, получить в общем виде необходимые и достаточные условия разрешимости обратной задачи (4), (5) сложно. Но поскольку решение обратной задачи (4), (5) в случае ее разрешимости и регулярности совпадает с решением обобщенной задачи Лагранжа (9)-(11), то в связи с этим исследуем разрешимость обратной задачи (4), (5) как задачи Лагранжа (9)-(11).

Рассмотрим возможные ситуации, обеспечивающие необходимые и достаточные условия разрешимости обратной задачи (4), (5) как задачи Лагранжа (9)-(11).

1. Совместная система неравенств

Р(х)< 0. (15)

Для совместной системы неравенств (15) при любых функциях Цх),...,{т(х) с положительно определенной матрицей Р линейная задача дополнительности (12)-(13) имеет тривиальное решение я = о и, следовательно, обратная задача (4), (5) имеет нулевое оптимальное значение и множество оптимальных решений X', совпадающее с решением системы неравенств (15)

X =^х е Я" | Р(х)<0} ■

2. Линейный случай несовместной системы неравенств (15).

Пусть Р(х) = Нх + д, где Н — матрица тхп, д — вектор соответствующей размерности. Тогда для любой матрицы Н и вектора длинейная задача дополнительности (12)-(13) имеет единственное решение Л = X * 0 с любой положительно определенной матрицей Р и, следовательно, обратная задача (4), (5) разрешима с единственным, соответствующим заданной матрице Р, вектором параметров у = Я [7]. Множество оптимальных решений X' обратной задачи определяется системой неравенств

X' ={хеЯ"\Р(х)<РХ}. (16)

3. Нелинейный случай несовместной системы неравенств (15).

Пусть заданы положительно определенная матрица Я, строго выпуклые функции Цх).....¡т(х) иком-

пактные множества уровней

М! ={хе.Яя\[1(х)<,а}л = \,...,т.

Тогда линейная задача дополнительности (12) - (13) имеет единственное решение д = X 0 и> следовательно, обратная задача (4), (5) разрешима с единственным вектором параметров у = X . Множество оптимальных решений X' обратной задачи определяется системой неравенств (16).

Выбор величины шага ак

В численных методах оптимизации, как правило, выбор вектора направления цъ релаксационного

процесса является определяющим. При этом выбор величины шага ак вдоль направления основан на некоторых заранее оцененных параметрах. В лучшем случае величина шага находится из условия минимума целевой функции в данном направлении (например, в методе наискорейшего спуска для задачи классической оптимизации [2]). Чаще же всего выбор величины шага предоставляется интуиции программиста, реализующего численные расчеты по алгоритму. Результатом такой численной реализации являются проблемы так называемого зигзагообразного движения и, как следствие, медленной сходимости итерационного процесса. Такая проблема существует и в методе последовательных приближений для нахождения решения обобщенной задачи Лагранжа (9)-(11).

Для решения обозначенных проблем используется подход, который позволяет осуществить выбор ак на каждой итерации [7]. Идея этого подхода состоит в том, что вопрос о выборе величины шага решается путем сравнения поведения специально выбираемой функции вдоль приближенной траектории метода и ожидаемого ее поведения вдоль «идеальной» траектории.

Для этих целей исследуется функция ||т7/х^||= =||С,7Р('х ))ТХ(х)\\ вдоль решения «идеальной» траектории х(а) при начальных условиях х(0)=хп ■

Положительная определенность матрицРи х) обеспечивает монотонность функции 11 (ЧР( х))т Х(х) 11 вдоль траектории х{а) и сходимость Х(х(а)) и х(а) к паре X их' решения задачи (9)-(11).

В качестве величины шага ак вдоль приближенной траектории метода предлагается использовать решение задачи одномерной минимизации выбираемой функции от направления т)к

ЬкМ(^р(хкптхк\\.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Этот выбор обоснован тем, что критерием завершения итерационного процесса построения решения является равенство нулю направления цк.

Достоинство предложенного подхода состоит в том, что при численной реализации алгоритма обеспечивается, с одной стороны, конечность величины шага а" накаждой итерации метода и, с другой стороны, монотонное приближение к искомому решению [8].

Заключение

Два мощных современных инструмента в оптимизации — обратные задачи и задачи дополнительности впервые использованы для решения теоретически и численно сложной обобщенной задачи Лагранжа.

Новизна полученных результатов представляет интерес как с содержательной стороны для моделируемой практической задачи, так и с формальной точки зрения на получаемые математические конструкции.

Специфика содержательной задачи позволила учесть условия для обратной задачи как условия дополняющей нежесткости для обобщенной задачи Лагранжа.

Выбор же параметров у, равных множителям Лагранжа х, привел к тому, что образовавшаяся математическая конструкция содержит линейную задачу дополнительности, аппарат д\я исследования и решения которой позволил предложить новый метод для решения поставленной задачи.

Библиографический список

1. Антипин A.C. Обратная задача оптимизации: постановка задачи и подходы кее решению // Обратные задачи математического программирования. — М.: ВЦ РАН. 1992.

2. Карманов В.Г. Математическое программирование: Учеб.пособие. М.:ФИЗМАТЛИТ, 2000.

3. Берщанский Я.М., Мееров М.В. Теория и методы решения задачдополнительности//Автоматикаителемеханика. — 1983. — №6. - С,5-31.

4. ПоповЛ.Д. Введение втеорию, методы и экономические приложения задач о дополнительности. — Екатеринбург: Изд-во Урал, ун-та, 2001. — 124 с.

5. Cottle R.W., Pang J.S., Stone R.T. The linear complementarity problem. — Boston: Academic press, Inc., 1992.

6. Cottle R.W., DantzigG.B. Complementary pivot theory of mathematical programming // Linear Algebra and Its Applications. — 1968.-№1.-P.103-125.

7. Зыкина A.B. Построение обобщенного решения линейной системы неравенств. // Оптимизация. Сб. науч.тр. Новосибирск, ИМ СО АН СССР, 1988. Вып.43(60). С.11-25.

8. Зыкина А.В. Проблемы численной реализации алгоритма нахождения обобщенного решения// Росс.конф. "Дискретный анализ и исследов.операций": Новосибирск: Йздат.института математики, 2002. С. 166.

ЗЫКИНА. Анна Владимировна, кандидат физико-математических наук, доцент кафедры «Автоматизированные системы организации информации и управления».

Российские научные журналы

Журнал "Вестник Московского университета. Серия 1. Математика. Механика"

является периодическим научным изданием, отражающим тематику важнейших направлений теоретических исследований по математике и механике в МГУ имени М.В.Ломоносова. На его страницах печатаются оригинальные статьи, посвященные конкретным научным вопросам по всем основным направлениям теоретических и прикладных исследований, например: математическому анализу, теории функций, функциональному анализу, алгебре, геометрии, топологии,

дифференциальным уравнениям, уравнениям математической физики, теории вероятностей, случайным процессам, математической статистике, оптимальному управлению, теории чисел, математической логике, теории алгоритмов, дискретной математике, математической кибернетике, вычислительной математике, теоретической механике,

прикладной механике и управлению движением, гидродинамике, аэромеханике, газовой и волновой динамике, теории упругости, теории пластичности, механике композитов.

Учредителями журнала "Вестник Московского университета. Серия 1. Математика. Механика" являются Московский государственный университет имени М.В.Ломоносова и механико-математический факультет МГУ.

Издателем журнала является Издательство Московского университета.

Адрес редакции:

103009, Москва, ул. Б. Никитская, 5/7.Тел. 203-31-28.

В течение года выходит шесть выпусков. Индекс по каталогу "Газеты и журналы" агентства "Роспечать" -70992. Подписка оформляется в почтовых отделениях РФ.

Начиная с первого номера 1969 года журнал "Вестник Московского университета. Серия 1. Математика. Механика" переводится на английский язык. Английская версия журнала выпускается издательством А1-lerton Press, Inc. (США) под названиями: "Moscow University Mathematics Bulletin" - для статей по математике и "Moscow University Mechanics Bulletin" - для статей по механике.

i Надоели баннеры? Вы всегда можете отключить рекламу.