Математические структуры и моделирование 2002, вып. 9, с. 1 17
УДК 519.6
ФЕЙЕРОВСКИЕ ИТЕРАЦИОННЫЕ ПРОЦЕССЫ ДЛЯ НЕСОБСТВЕННЫХ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
И.И. Еремин, И.М. Соколинская
In this article, we consider the Fejer’s methods of solving the intrinsic (having a solution) and non-intrinsic (having no solution) linear optimization problems of 1-st, 2-nd and 3-rd types. The method is based on the reduction of mentioned problems to consistent and inconsistent systems of linear inequalities. For these systems, we construct the various variants of Fejerian processes which are converging to a solution or quasi-solution of the linear inequalities system. We discuss some aspects concerned to constructing of the iterative Fejerian mappings and the iterative sequences generated by them.
1. Введение
Основным методом решения задач линейного программирования (ЛП) является симплекс-метод. Он показал свою эффективность для задач ЛП средней размерности (несколько сотен и даже тысяч переменных и ограничений), решаемых на ^-процессорных вычислительных машинах при небольших k, например при k < 10, и достаточно мощных процессорах. При больших размерностях задач ЛП (десятки и более тысяч переменных и ограничений) возникает необходимость их решения на многопроцессорных машинах (при значениях для k -сотни и тысячи процессоров) на основе принципа распараллеливания. Однако опыт решения больших задач показывает (это подкрепляется и теоретическим анализом [2]), что эффективность конечных методов, в частности симплексметода, падает с ростом числа задействованных процессоров в силу нарастания числа обменных операций. Это обстоятельство и порождает ограничения на использование симплекс-метода для решения больших задач ЛП. Определенный оптимизм можно связывать с использованием итерационных методов, дающих решение как предел итерационной последовательности, генерируемой тем или иным итерационным оператором. Известен широкий класс релаксационных методов фейеровского типа [1,3], которые являются хорошими кандидатами для использования в указанных целях. Фейеровские методы отличаются простотой итерации, задаваемой формулюю, удобны для массового распараллеливания
© 2002 И.И. Еремин, И.М. Соколинская
E-mail: ermii@imm.uran.ru, isok@csu.ru
Институт математики и механики УрО РАН, Челябинский государственный университет
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты 00-15-96041, 01-01-00563)
вычислительного процесса, дают возможность реализации счета при эволюционном состоянии исходных данных задачи, т.е. ее информационной составляющей, Некоторый экспериментальный материал на этот счет имеется в [4].
В статье рассматриваются фейеровские методы для решения задач ЛП с акцентом на несобственные задачи, применительно к которым метод превращается в аппроксимационно-оптимизационный,
В работе будут использованы следующие обозначения:
Rn - n-мерное евклидово пространство;
R+ := {х єНга | xT =[ xi,...,xn ] > 0};
а+ = max {а, 0}, a eR - поле действительных чисел;
х+ = [х+,... ,х+ ]т - положительная срезка вектора х;
Arg... - оптимальное множество выписанной вслед Arg оптимизационной задачи или ее номера; если система неравенств, то Arg... - множество
ее решений;
arg... - конкретный элемент из Arg...;
opt... - оптимальное значение оптимизационной задачи;
|х| - евклидова норма вектора х Є Rn;
FM - класс M-фейеровеких отображений;
FM - класс непрерывных M-фейеровеких отображений; rank A - ранг матрицы A;
{рк(х0)}к - процесс (или последовательность), порождаемый отображением р(х) Є {Rn — Rn} согласно рекуррентному соотношению: хк+і = р(хк), х0 -начальный элемент процесса,
2. Краткие сведения о фейеровских и слабо фейеровских отображениях ([1], гл. II)
Пусть р Є {Rn — Rn}, M С R Отображение р называется М-фейеровеким, если
Р(У) = У) |Р(х) - у\ < |х - У1, Vу Є М, Vх Є М.
Класс M-фейеровеких отображений обозначим через FM. Отображениє р(-) Є {Rn — Rn} называется слабо М-фейеровским, если в выше приведенном определении неравенство "<" заменить на Некоторые свойства фейеровских отображений:
1, Если р(-) Є FM и итератор р(х) непрерывен, т.е, р(-) Є FM, то
{рк(хо) =: хк}к - -> х Є M (i)
при произвольном начальном х0 Є Rn, m
2, Если pj(■) Є FM., j = 1,...,m и M0 = f| Mj = 0, то j=i
m р(х) := aj pj(х) Є fm0 > j=i aj > 0, m La = 1. j=i (2)
2
Следовательно, если V j: Mj = M, то <^(x) Є FM.
3, Если (■) Є FM., j = l,...,m, то
m
j j ■ ■ ■ A?m(x) Є fm0 , Mo = П Mj = 0; (з)
j=i
(ji,..., jm) - любая перестановка индекеов {l,..., m},
4, Если FM = 0, то M автоматически выпукло и замкнуто,
5, Если <^(-) - слабо фейеровекое отображение с множеством неподвижности M = 0, то <fa(x) := ax + (l — a)tp(x) Є FM, а Є (0, l). В частности, если отображение ^(-) является нераеширяющим, т.е. \<^(x) — <^(y)\ < |x — y\, Vx, y Є R,n, и M - множество его точек неподвижности, то ax + (l — a)<p(x) Є FM. Примером нерасширяющего отображения может служить операция проектирования на выпуклое замкнутое множество M С Rn,
Примеры M-фейеровеких отображений:
l0. Пусть M - выпуклое замкнутое множество из Rn и PrM (x) - оператор метрического проектирования на M. Тогда <^(x) := PrM (x) Є FM. Как уже было отмечено, <^(x) является нерасширяющим.
2°, Пусть H = {x \ l(x) := (a,x) — a = 0} a = 0 и <^(x) = x — Л
l+(x)
Л Є (0, 2) Тогда <^(-) Є FH. Оператор <^(x) реализует проектирование на H с
релаксацией Л,
3°. Пусть P = {x > 0 \ l(x) := (a, x) — a < 0} тогда <^(x) :=
' . l+(x) ■
x — Л ,, a
Є FD
4°, Пусть M = {x \ l(x) := (aj ,x) — bj < 0, j = l,...,m} V j : aj = 0;
m m
<^(x) = x — (Л/8) £ l+(x)aj 8 := ^ ||aj||2, Л Є (0, 2). Тогда: j=i j=i
если M = 0, to <£(•) Є FM;
m
если M = 0, to <£(•) Є F_, M = {x \ ▽ d(x) = 0}, где d(x) = ^ l+2(x),
j=i
5°, Пусть H := {x \ Ax = b} и строчки матрицы A линейно независимы. Тогда
<^(x) := PrH(x) = x — AT(AAT)-1(b — Ax) (4)
и <^(-) Є FH. Формула (4) хорошо известна из линейной алгебры.
3. Базовый фейеровский процесс
Если M - множество решений некоторой системы линейных неравенств, то относительно этой системы формально можно конструировать отображения ^(•) Є FM, то сходимость процеееа {^fc(x0)}k гарантируется только при условии M = 0. Мы хотим выделить го всех способов конструирования <^(-) базовый
3
способ, нацеленный на возможность использования его для построения сходящихся итерационных процессов в ситуации несовместности системы, т.е. когда М = 0, Предел же последовательности, порожденной базовым отображением, должен давать квазирешение этой системы. Этот же процесс может быть приспособлен к нахождению квазирешений несобственных задач ЛП (посредством сведения задачи ЛП к системе линейных неравенств).
Будем исходить из системы линейных неравенств и уравнений, а также одного включения:
lj(x) := (aj, x) — bj < 0, j Є J<; |
li(x) := (ai, x) — bi = 0, i Є J=; > (5)
x Є M0.
Система может быть как совместной, так и несовместной. Множество М0 предполагается выпуклым и замкнутым. Положим
^(x)
x — (А / 5)
Е Rjl+(x)aj + Е Rili(x)ai I ,
jeJ< ieJ=
(6)
А Є (0, 2), lk(x) = (ak,x) — bfc, k Є J := J< U J=, 5 = ^ Rk\ak\2, {Rk > 0}kej
fceJ
- параметры. Пусть
i>(x) := PrMQp(x), ^a(x) := (1 — a)^(x) + ax, (7)
a Є (0,1), Под базовой, конструкцией фейеровекого оператора и базовым фейе-ровским процессом будем понимать фа (x) и
{'ФІ (xo)}k, (8)
соответственно. Повсюду ниже x0 - произвольный начальный элемент процесса. Процесс (8), порождаемый оператором фа^) при произвольном начальном x0 Є R”, сходится к некоторой точке x, являющейся решением системы (5) в случае ее совместности; в случае же несовместности x является некоторым аппроксимационным квазирешением. Вопросы сходимости процесса (8) и содержательного смысла предельной точки этого процесса будут рассмотрены ниже.
Пусть d(x) = Rjl+2(x) + Rili2(x) M := Arg min d(x) = 0, p(x) -
—/ j ^—/ жЄМ0
J< J=
согласно (6),
Теорема 1. Пусть отображение фа^) задано согласно (7) и М = 0. Тогда ф„(.) Є Fs. ■
Следствие 1. Так как фа^) непрерывно, то согласно п. 1 раздела 2 процесс (8) сходится к некоторой точке x Є М. В частности, если, М = Rn и система, (5) совместна, то процесс (8) сходится к одному из ее решений. ■
Доказательству теоремы 1 предпошлем ряд лемм.
4
Лемма 1. (Она хорошо известна] см., например, [3], стр. 188). Пусть M - выпуклое замкнутое множество из R”, p Є M и p := PrM (p). Тогда, (p — p,x — p) < 0 V x Є M. Верно и обратное утверждение. ■
Лемма 2. Для любых x и у из R” справедливо неравенство
|PrM(x) — PrM(У)| < |x — У\, (9)
т.е. PrM (x) является, оператором, нерастяжения
(ем,, например, [1], гл, II). ■
Лемма 3. Пусть Pj := {x \ l,(x) := (aj,x) — bj < 0} aj = 0 p,(x) =
l+(x)
j 4 ' . ^ \ г- (о o\ (Л r- j? q0
x — Aj Ї 412 ' ap Aj Є (0, 2). Тогда pj(■) Є Fp (см. n. 30 раздела 2) и
\ a , \
\Pj(x) — Pj(У)\ <\x — y\
для, любых x и у из R”. Проверяется, непосредственно.
(10)
li(x)
\ai\2 j
Замечание. Если Pi = {x \ li(x) = 0} и pi(x) = x — A P a,-, то свойство нерастяжения для pi также выполняется.
Пусть M - выпуклое замкнутое множество из R”.
Лемма 4. Отображение фД), заданное согласно фД) := PrM p(x), p(x) -согласно (6), является, оператором, нерастяжения.
Доказательство. Отображение (6) можно записать в виде:
і \ ( \ lj(x) ^ і V"1 ( \ li(x) А
p(x) = aj I x — A -—— ■ a, І + аД x — A -—- ■ an ,
jeJ< ' j V Iі! /
Rk \ ak \
0 = ^2 Rj\aj\2 + Ri\ai\2, k Є J< U J= . Следовательно
где ak
о
jJ< i&J=
ak = 1. Опираясь последовательно на леммы 2 и 3, будем иметь:
keJ<UJ=
\PrMp(x) — PrMp(y)\ < \p(x) — p(y) \ =
= \Y1 aj(p,(x) — p,(y)) + Y1 ai(pi(x) — 'pi(y))\ <
j&J<
i&J=
<Y1a,\p,(x) — p,(y)\ + ai\'pi(x) — pi(y)\ <
jJ< iJ=
<Y1a,\x — y\ + Y1 ai\x — y\ = (X!a, + Y1 ai I \x — y\ = \x — y\,
jeJ< i&J=
что и требовалось. 5
peJ< iJ=
5
Отображение (7) перепишем в следующей форме
p(x) = x — (Л/ 28) у d(x), (11)
где d(x) и 8 уже были введены, у _ символ градиента.
Лемма 5. Пусть f (ж) - выпуклая дифференцируемая функция и у f (x) = 0. Тогда при достаточно малом а > 0: f (x — а у f (x)) < f (x) (известный факт из м,атем,атического анализа). ■
Лемма 6. Пусть x Є M0 и M = Arg min f (x) = 0. Тогда,
xeMo
x Є M PrM (x — y у f (x)) = x, y > 0. (12)
Доказательство. Докажем "^=", т.е. достаточность правого соотношения в (12), Если уd(x) = 0, то x Є Arg mind(x), Но так как x Є M0, то x Є
___ (x)
Arg min d(x), т.е, x Є M. Пусть теперь уd(x) = 0, Обозначим p := x — yу f (x)).
xeMo
По лемме 1: (p — PrM(p), x — PrM(p)) < 0 Vx Є M0, или (x — yу f (x) — x, x — x) = —Y^f(x),x — x) < 0 Vx Є Mo- Так как f(x) выпуклая функция, то из полученного неравенства вытекает 0 < ^f(x),x — x) < f(x) — (x), Vx Є M0, или f (x) > f (x), Vx Є M0, т.е, x Є Arg min f (x),
xCM0
Докажем "=^", т.е. необходимость правого соотношения в (12), Если уd(ж) = 0, то доказываемое соотношение выполняется очевидным образом, ибо x Є M0, Пусть уf (x) = 0, Тогда p := x — y у f (x) Є M0. Если это не так, то при любом а Є (0,1) pa := (1 — x)x + ap = x — aY у f (x) Є M0, Но тогда в силу леммы 5 при достаточно малом a: f (pa) < f (x), Так как pa Є M0, то получилось противоречие с тем, что x Є Arg min f (x^^aK, p Є M0.
xeMo
Рассмотрим множество N := {x | f (x) < f (x)}, Так как M0 П N0 = 0
(N0 := {x | f (x) < f (x)), то по теореме отделимости существует гиперплоскость H := {x | (h, x — x) = 0} c h = 0 разделяющая M и N, при этом можно считать, что h - внешняя нормаль к N в точке x, поэтому (h, x — x) > 0 V x Є M0, Так как f (x) - выпуклая гладкая функция, то h = Y0 у f (x) Y0 > 0. Предыдущее неравенство можно переписать в виде: ((x — Y0 у f (x)) — x, x — x) < 0 Vx Є M0,
'------V-----'
p
По лемме 1: x - проекция точки p на M0^e, PrMo (x — Y0 у f (x)) = x. Заметим, что выполнимость или невыполнимость этого соотношения не зависит от значения величины y0 > 0,
Лемма 6 доказана полностью, ■
Перейдем к доказательству теоремы 1, По существу, оно вытекает из леммы 6 и п, 5 раздела 2, Действительно, пусть x Є M и x Є M. Согласно лемме 6: ^(x) = x, а потому и ^«(x) = x (напомним: ^(x) = PrM p(x), p(x) - согласно (6)),
лемма 4
Далее, |^(x) — x| = |^(x) — ^(x)| < |x — x|. Отсюда вытекает (согласно п, 5 раздела 2): |^«(x) — x| < |x — x|.
Теорема 1 доказана. 6
6
Замечание. Если M0 := R”, то, очевидно, фа(х) = ^а(х) := (1 — а)^(х) + ах, причем фа(-) Є F~. На самом деле уже само отображение ^(х) является M-фейеровским, т.е. <^(-) Є Действительно, положив Л' = Л/ 1-а, будем иметь: Дх) = (1 — а) [х — (Л' / Д у d(x)] +а х, при этом Л' Є (0, 2) при а < 1 — Л / 2.
4-------V-------'
^0 (x)
Так как оператор <^0(х) - нерастягивающий, то опять-таки в силу п. 5 раздела 2:
^(х) = (1 — а)Ы0 + ах Є Fw
4. Фейеровский процесс для решения задачи линейного программирования
Пусть
L : max {(c, х) | Ах < b, х > 0} (13)
- разрешимая задача - III:
L* : min {(b, u) | ATu > c, u > 0} (14)
- двойственная к L,
Задачам L и L* поставим в соответствие систему линейных неравенств
Ах < b, х > 0 ; (15)i і
S : ATu > c, u > 0 ; (15)2 (15)
(c, х) = (b, u) , (15)з j
называемую симметрической. В теории ЛП хорошо известен следующий факт: Arg S = Arg L х Arg L*. (16)
В (16): Arg S - множество решений системы S,
Если
^і(х) Є fm1 , Mi := Arg(15)i;
^2(u) Є Fm2> M2 := Arg(1%
^3 Дщ^Р^ (x,u), H = Arg(15)3
Дщ^^Рін (17)
то Дхщ) Є і^Д'Де M = Arg S, т.е, Дхщ) является непрерывным фейеровекпм отображением относительно множества Arg L х Arg L*. Следовательно (в силу и. 1 раздела 3):
{^(хоЩо)^ ^ [х,u] Є ArgS. (18) 7
7
Что касается выбора отображений ^(x) и <^2(x), то это можно делать разными способами, в частности базовым способом, изложенными в разделе 3, а именно:
m \
<pi(x) = X - (\/5i)Y, 1+(x)aj,
з=і
'62(u) = u - (X/62) ^ h+(u)hi
[c, -bГ;
(19)
i=1
/ \ г ]T (c,x) (b, u) г j,iT
^3(x,u) = [x, u]T -
|c|2 + |b|2
выше |hi} - столбцы матрицы A, hi(u)
X Є (0, 2), [x, u]T
x
u
[c, -b]T =
ci (hi,u) 61 ^ ^ |aj | ; 62
j=1
c
b
£|hi!2
i= 1
Заметим, что вид отображений <^Д) и <^Д) будет меняться в зависимости от того, в какой форме записана исходная задача линейного программирования. Если, например, задача L задана в канонической форме
min {(c, x) | Ax = b, x > 0}, (20)
то двойственная к ней будет иметь вид
max {(b,u) | ATu > 0}, (21)
а отображения <^Д), <^Д) и ^(x,u) соответственно примут вид:
m '
^1(x) = x - (X/61^^ j(x)aj,
j=1
^2(u) = u - (X/62) J^[(hi,u) - ci]+hi, > ^
^3(x,u) = PrH (^1(x),^+(u)).
Вид <^3(x,u) формулы проектирования на H сохраняется,
В связи с тем, что основные ограничения в (20) записаны в форме системы линейных уравнений Ax = b, пусть с множеством решений Н1; то <^Д) можно сконструировать, исходя из операции проектирования на Н1, аналогично (4):
PrHi (x) = x - AT(AAT) (b - Ax) (23)
(в предположении, что rank A = n), Полагая ^1(x) = PrHi (x), заключительный итерационный оператор <^(x, u) будет иметь ту же форму, что и в (22),
Случай задания отображения <^(x,u) применительно к задаче (20) в форме
^(x,u,v) := РгДо(x,u+,v+) (24)
где Но - множество решений системы
Ax = b, AT u + v = c, (c, x) = (b, u), (25)
8
рассматривался в работе [4], посвященной численным экспериментам решения задач ЛП большой размерности на многопроцессорных вычислительных машинах.
5. Базовый аппроксимационно-фейеровский процесс для несобственной задачи ЛП 1-го рода
Если исходная задача ЛП неразрешима, т.е. по принятой терминологии является несобственной, то ее соответствующая симметрическая система S является несовместной (верно и обратное). Для этой задачи в этом случае можно ввести понятие квазирешения через определение квазирешения системы S, Поясним это для случая задания задачи ЛП в форме
L : max {(c, x) | Ax < b}. (26)
Двойственной к ней будет
L* : min {(b, u) | ATu = c, u > 0}. Симметрической системой S является
Ax < b, ATu = c, u > 0,
(c, x) = (b, u).
Если L - несобственная задача ЛП 1-го рода, т.е,
M := {x | Ax < b} = 0, M* := {u | ATu = c, u > 0} = 0,
(27)
(28)
то, введя
H
x
u
ATu = c, (c, x) = (b,u)
d(x,u) = |(Ax — b)+|2 + | (—u)+12,
можно сформировать задачу
min {d(x,u) | u Є H} (29)
- как аппроксимационную для несовместной системы (28),
Если u Є Arg (29), то x и будем называть квазирешением системы (28),
а вместе с тем и квазирешением задачи (26), Если последняя разрешима, то x - обычное ее решение. Для (29) можно записать фейеровекое отображение относительно множества Arg (29) по стандарту из раздела 3, но применительно к системе (28):
^(x,u)
x
u
(А / 2 Д ▽ x,u d(^ u),
^(x,u) = PrH ^(x,u),
9
фа{х, u) = (1 — а) Ф(ж, и) + а
x
и
(30)
где Л Є (0, 2) 6 = ^2 К'|2 + m а Є (0,1).
j=i _
В соответствии с теоремой 1 фа(х,и) являєтея M-фейеровеким непрерывным отображением относительно M = Arg(5.4), Следовательно, процесс
(Д (хо,ио)}к
сходится к некоторому вектору
х
и
, при этом по определению
X - квазирешение задачи (26), и - квазирешение задачи (27),
Операция PrH(•), фигурирующая в определении ф(х,и) и входящая, следовательно, в формулу (30), может быть записана согласно соотношению (23) с заменой матрицы A на матрицу
A
0 AT '
cT —bT ’
а вектор b (из (23)) - на
с
0
6. Аппроксимационно-фейеровский процесс для несобственной задачи ЛП 2-го рода
Рассмотрение вопроса соотнесем к задачам (26)-(28). Ситуация нееобетвенно-ети 2-го рода соответствует тому, что M = 0, M* = 0, где смысл символов M и M* тот же, что и в разделе 5, Систему (28) разобьем на две части:
ATи = с, и > 0; (31)
Ax + v = b, v > 0, (с,x) = (b,и); (32)
выше система Ax < b заменена на Ax + v = b, v > 0 - обычная перезапись системы неравенств, если в этом есть необходимость. Положим, d^^jv) = |ATи — с|2 + |(—и)+|2 + |(—v)+|2, H0 - множество решений системы (32), В силу предположения о непуетоте M имеем: Н0 = 0, В согласии с базовой конструкцией фейеровекого отображения V’a(-) из раздела 3, реализованного для НЗ ЛП 1-го рода в разделе 5, соответствующим отображением для рассматриваемого случая НЗ ЛП 2-го рода будет отображение
фа (x, и, v) = Pr„
x
и
v
(Л / 26) ▽x,u,v d(x, и, v)
n
здесь Л Є (0, 2) 6 = ^2 N2 + 2m.
i= 1
(33)
10
Процесс, порожденный отображением (33), будет сходиться к некоторому вектору [ x,u,v]T, при этом x - квазирешение задач и (26), u - квазирешение задачи (27),
7. Фейеровский процесс для НЗ ЛП 3-го рода
В предыдущих разделах 5 и 6 мы апеллировали к нееовмеетноети симметрической системы S, поставленной в соответствие исходной задаче ЛП, которая предполагалась либо НЗ ЛП 1-го рода, либо 2-го, Аппроксимационная суть, соотнесенная системе S, заключалась в формировании ее совместной подсистемы из уравнений и квадратичной функции невязки d(x) для оставшихся ограничений этой системы. Понятно, что эта операция неоднозначна, что является весьма полезным обстоятельством, ибо во всяком конкретном случае, т,е, в случае конкретного формата задачи (например, формата транспортной задачи, блочного формата и т.д.), указанная операция выделения подсистемы может быть увязана е потребностью простой и эффективной численной реализации итерационного шага, порождаемого итерационным оператором, К этому следует еще добавить, что построение итогового фейеровского итерационного оператора будет зависеть от конкретного вида исходной задачи ЛП, Всякий раз при построении нужного фейеровского отображения необходимо все это учитывать.
Для рассмотрения НЗ ЛП 3-го рода возьмем задачу ЛП, ей двойственную, и систему S в формате (13)-(15),
Так как итоговое итерационное отображение 'фа(-) формируется из фрагментов Дх), ф(х) = PrM Дх), а они в свою очередь - из M, d(-) и 5, то, формируя аналоги отображений фа(-) применительно к системе (15), мы в рассматриваемых ниже вариантах будем приводить лишь вид множества M, функции невязки d(-) и числа 5,
Вариант 1. Mi :=
х
u
(c,x) = (b,u) >, d1(x,u) = |(Ax — b)+|2 + | (c —
ATu)+12 + |(—x)+|2 + |(—u)+|2, 5i = ^2 K' I2 + ^2 I hi |2 + m + n.
j=i
i= 1
Вариант 2. M2 :=
x
u
v
I ATu — v = c, (c, x) = (b, u) >, d2(x, u, v) = |(Ax —
b)+|2 + |(—x)+|2 + |(—u)+|2 + |(-v)+|2, 52 = ^2 IajI2 + m + 2n.
j=i
Вариант 3. M3 :=
x
u
v
I Ax — w = b, (c, x) = (b, u) >, d3(x, u, w) = I(c —
ATu)+I2 + I(—x)+I2 + I(—u)+I2 + I(—w)+I2, 5з = ^2 I hi 12 + 2m +
n.
i=1
11
Вариант 4. M4 := Rn, d4(x,u) = \(Ax—b)+\2+ \(c—ATu)+12+ \(—x)+\2+ \(—u)+\2,
m n
Ф = ^2 \aj\2 + ^ \hi\2 + m + n,
j=i i=i
Последний вариант годится как для разрешимой задачи, так и для неразрешимой любого рода неразрешимости (1-го, 2-го или 3-го),
8. Приближенный метод решения разрешимой задачи ЛП, основанный на ее редукции к задаче минимизации кусочно-квадратичной выпуклой функции
Нам безразлично, в какой форме представить исходную задачу ЛП, но для простоты последующего формульного текста запишем ее в виде
L : min {(c, x) \ Ax < b}. (34)
Известен результат по методам штрафных функций [3, теорема 20,2]: Задача (34) асимптотически по R = [ R1,... ,Rm ] > 0 эквивалентна задаче
min (c, x) + У Rj if (x) j , (35)
T,e, задача (35) приближает (как по аргументу, так и по значению) задачу (34),
при этом тем точней, чем больше число min R?-, На самом деле имеются оценки
(j)
для соответствующих уклонений, но приводить их не будем. Результат верен и для нелинейной целевой функции в задаче (34),
Пусть до - некоторая нижняя оценка для opt (8.1), т,е, (c, x) > До, Vx Є M := {x \ Ax < b}, В конкретных задачах такую оценку получить не составляет труда. Именно в силу того, что (c, x)-д0 > 0 для всех допуетимых x, задачу (34) можно записать в эквивалентном виде:
min {[(c, x) — д0 ]2 \ x Є M}. (36)
Применив к ней приведенный выше метод квадратичных штрафных функций, получим задачу
m
null {i2 (x) + Rjif (x)} > (37)
где i0(x) = (c, x) — д0. Так что задача (37) приближенно решает исходную задачу (34), Но минимизируемая функция в задаче (37) является частным случаем
для функции d(x) го раздела 3, так что для поиска точки из Arg min d(x) можно
(x)
применить фейеровский процесс
{fk ыь,
(38)
12
в котором
Ax) = x - (Л /8) ▽ d(x), Л Є (0, 2), 8 = \c\2 + ^2 \aj\2>
j=i
m
d(x) = [ (c, x) - Yo ]2 + Rjif (x),
j=i
{m
[(c, x) - Yo]c + ^ Rj if (x)aj j=і
Если x - предел сходящейся последовательности, порождаемой процессом (37) при произвольном x0 Є R™, то x решает приближенно задачу (34), и тем точней, чем больше числа Rj > 0 j = 1,..., m. Посксшьку x Є Arg min d(x),
(x)
to yd(x) = 0, а потому признаком останова вычислительного процесса может служить выполнимость неравенства \ ▽ d(xk)\ < є, є - наперед заданное положительное число,
9. Декомпозиционные методы построения фейеровских отображений применительно к системам линейных неравенств
Как уже отмечалось (см, раздел 4), решение задачи ЛП сводится к решению системы линейных неравенств S с матрицей коэффициентов, имеющей блочну структуру. Если взять в качестве исходной задачи задачу (13), то системой является (15) с матрицей коэффициентов перед переменными x^ и уд
Построение отображения (17) было основано на декомпозиционном принципе, учитывающем блочную структуру матрицы A Ниже этот вопрос рассмотрим подробнее применительно к канонической системе линейных уравнений и неравенств
Ax = b, x > 0 (39)
при разных вариантах блочноети матрицы A (в скобках заметим, что символ A в данном контексте не следует связывать с символом A в предыдущих записях),
Вариант 1. Пусть матрица A разбита на горизонтальные подматрицы Ap
13
Со S
(40)
что соответствует разбиению системы (39) на подсистемы
ЛіХ = 6і, x > 0, i =1 (41)
Пусть Hi = {x | Ліх = Ьі}, Тогда
^(x)
Е
i=1
a PrH (x)
Є F,,
где M = {x > 0 | Лх < Ь} (ем, п, 2 и 5° го раздела 2). На сам ом деле <^(х) непрерывно, поэтому ^)) Є FM, что дает
{^k(x°)}к ^ x Є M.
Целесообразность разбиения системы (39) на подсистемы можно связать е проблемой преодоления трудностей, связанных с обращением матрицы AAT (ем, формулу проектирования (4) на H = {x | Лх = Ь}), При разбиении системы (39) на подсистемы (41) нужно будет обращать матрицы AiAT меньших размеров, К тому же само разбиение, учитывающее структуру матрицы A, может быть нацелено именно на эффективность указанных обращений.
Вариант 2. Пусть
A :=
Ai
An
A°
тогда система (39) имеет вид
Ліхі = Ьі , i = 1,..., n,
A°x = Ь°, xT = [x1,... , xn] > 0
(42)
и Hi := {Xі | ЛіХі = 6і} cRni, H° = {x | A°x = 6°}.
Если подсистемам Aixi = 6і, i = 1,..., n, A°x = b° соотнесяи <^ф) Є FH.
и <p°(x) Є Fh0, то
^(х) := ^+(^1(x1 ),...,^n(xn)) Є FM ,
причем выбор отображений {^і}П=° может осуществляться разными способами, например, ^i(xi) = PrH(Xі) i = 1,...,n; ^°(x) = PrHo(x).
14
Вариант 3. Рассмотрим матрицу
А і
An
Bi
Bn
и ей соответствующую систему
Aixг + Вгх° = Ьг, i = 1,,n, xT = [ x1,..., xn, х0 ] > 0.
Подсистеме Агхг + Вгх0 = Ьг поставим в еоответствие ^г(хг,х°) Є FH (хг,х0), где Нг = {[хг, х° ] | Агхг + Вгх° = Ьг}, Обозначим через Xі алгебраический след
П
вектора ^г(хг,х°) в Rni - как подпространство пространства (^Rni) х Rn°
І= 1
исходной переменной xT = [x1,...,xn,x°], (Х°)г - аналогичный след в Rn°, Образуем отображение
^(х)
Х
, Х
1
n
n
Ё(Х°)г
Оно является непрерывным М-фейеровеким [5],
10. Вычислительные аспекты применения фейеровских отображений
Обсудим некоторые вопросы эффективных реализаций фейеровских процессов, соотнесенных задачам поиска решения, либо системы линейных неравенств, либо задачи линейного программирования. Остановимся просто на системе линейных неравенств
Ах < Ь ~ lj(x) := (aj, x) — bj < 0, j = 1,..., m, (44)
поскольку задачи ЛП сводятся к таким системам. Будем предполагать М := {Ax < Ь} = 0, В разделе 9 мы уже обсуждали вопрос об учете структуры матрицы А при построении фейеровекого итерационного отображения <^(-) Є Fm. Несомненно, эффективность вычислительного процесса, порождаемого отображением <^(-), зависит от разумного учета особенностей структуры матрицы А, Но это только одна сторона дела. Само генерирование итерационной последовательности допускает большое число модификаций, основанных на иных соображениях. Пусть выбрано для системы (44) базовое отображение
m
^(x) = x — (А/^ l+(x)aj Є FM.
j=i
15
Для k < m введем
k k
Уk(x) = x - (X/Sk) ^ l+(x)aj, Sk = |aj|k
j=і j=і
- это отображение, соотнесенное подсистеме lj (x) < 0 j = 1,, k. При больших значениях m (тысячи и десятки тысяч) целесообразней счет вести согласно соотношению
Xk+1 = ykk (xk), (45)
при этом yk (x) = y(x) и tk = 1 при k > m,
В процессе (45) предусмотрены по крайней мере два обстоятельства:
1) на шаге с номером k (при k < m) итерация yk (xk) выполняется для подсистемы из k неравенств, что сокращает число арифметических и логических операций, необходимых для подсчета yk (xk);
2) так вычисляемые yk(•) можно повторить несколько, пусть tk, раз, до обес-
k
печения, например, условия 1+ (xk) < £■ После этого срабатывает интегриро-
j=і
ванная итерация (45),
При такой тактике перехода от xk к xk+1 подсчет Sk+1 ведется рекуррентно:
Sk+1 = Sk + |ak+2|2-
При описанной организации счета факт сходимости итерационной последовательности {xk} к решению системы (44) сохраняется.
Заметим, что рекуррентное соотношение (45) пригодно и для решения бесконечных систем линейных неравенств ( [1], стр, 106),
Что касается скорости сходимости рассмотренных фейеровских процессов применительно к совместным системам линейных неравенств, пусть это будет (44), то ее можно охарактеризовать скоростью по геометрической прогрессии, понимаемой в смысле
|xk+i - M|< 0 |xk - M|, Vk, 0 Є (0,1); здесь |x — M| := inf |x — y\. Оценки для 0 были даны в работе одного из авторов
y£M
( [1], стр. 68).
По фейеровским методам проводились вычислительные эксперименты на многопроцессорной вычислительной машине МВС-100/1000 с применением методов распараллеливания (см, [2-4]), Решались задачи ЛП с числом переменных n < 4000 и числом ограничений m < 1000, В основу метода был положен итерационный процесс zk+1 = Pr+ (zk) для системы Az = b, z > 0, к которой редуцировалась задача ЛП, Результаты экспериментов были удовлетворительными, Эксперименты планируется продолжить.
16
Литература
1. Еремин И.И., Мазуров В.Д. Нестационарные процессы математического программирования. М.: Наука, 1979. -205 с. (гл. II).
2. Попов Л.Д. Вопросы реализации м,ет,одов ЛП в траспьютерных сетях / Сб.: «Ал-горитмві и программнвіе средства параллелвнвіх ввічислений». Екатеринбург: Изд-во УрО РАН, 1995. N.1. С.148-156.
3. Еремин И.И. Теория линейной оптимизации. Екатеринбург: Изд-во УрО РАН, 1999. -312 с.
4. Бердникова Л.Д., Попов Л.Д. О применении декомпозиции при реализации фейе-ровских м,ет,одов решения больших систем линейных неравенств на МВС-100 / Сб.: «Алгоритмы и программные средства параллелвнвіх вычислений». Екатеринбург: Изд-во УрО РАН, 2000. N.4. С.51-62.
5. Еремин И.И. Синтез фейеровских отображений с несовпадающими пространствами их образов // ДАН. 2001. Т.378, N.l. С.11-13.
17