УДК 519.8
Вестник СПбГУ. Сер. 1. 2013. Вып. 1
О РЕШЕНИИ ОДНОЙ МНОГОМЕРНОЙ ЭКСТРЕМАЛЬНОЙ ЗАДАЧИ В ТРОПИЧЕСКОЙ МАТЕМАТИКЕ
Н. К. Кривулин
С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, [email protected]
1. Введение. Разработка математических методов и вычислительных процедур решения многомерных экстремальных задач является одним из важных направлений линейной тропической (идемпотентной) математики [1-6]. Рассматриваемые задачи обычно состоят в минимизации линейных или нелинейных функционалов, заданных на конечномерных полумодулях над идемпотентными полуполями, и могут иметь дополнительные ограничения, наложенные на множество допустимых решений в форме тропических линейных уравнений и неравенств. Среди рассматриваемых в литературе проблем имеются идемпотентные аналоги задач линейного программирования [6], а также их обобщения с нелинейной целевой функцией [7-13]. Кроме того, известны решения для задач, в которых как целевая функция, так и ограничения оказываются нелинейными [14].
Многие экстремальные задачи формулируются и решаются в терминах какого-то одного полуполя, например классического полуполя Rmax,+, как в работах [6, 7]. Некоторые задачи, например в работах [9-13], исследуются в более общей постановке, для которой полуполе IRmax,+ оказывается частным случаем. Решение ряда задач [6, 7] осуществляется при помощи итеративной вычислительной процедуры, которая позволяет находить некоторое решение, если решения существуют, или заключить, что решений нет, в противном случае. Для других задач известны точные решения, полученные в замкнутой форме [8-13]. Следует заметить, однако, что существующие подходы обычно предлагают одно или несколько частных решений, но не дают исчерпывающего решения проблемы в случае, когда имеется целое множество решений.
В настоящей статье рассматривается многомерная экстремальная задача, которая является обобщением задач, исследованных в работах [8-13]. Предварительные результаты анализа задачи были представлены в [15, 16]. Ниже на основе применения и дальнейшего развития методов и техники решения, предложенных в работах [8-13, 17], получено общее решение задачи в замкнутой форме, которая представляется весьма удобной как для последующего анализа, так и для разработки эффективных вычислительных процедур и их программной реализации.
2. Предварительные результаты. В этом разделе приводятся основные факты, обозначения и результаты из [9, 10, 17], на которые опирается материал, представленный в статье. Дополнительные детали и подробное изложение теории можно найти в работах [1-6].
2.1. Идемпотентное полуполе. Пусть множество X является замкнутым относительно двух операций, сложения, ®, и умножения, 0, и содержит соответствующие нейтральные элементы, ноль, 0, и единицу, 1. Будем предполагать, что
© Н. К. Кривулин, 2013
82
(X,0,1, ®, 0) является коммутативным полукольцом, в котором сложение идемпо-тентно, а умножение обратимо. Такое полукольцо, в котором для любого x из Х+ = Х\{0} существует обратный по умножению x-1, обычно называют идемпо-тентным полуполем.
Обозначение степени с целым показателем используется как обычно для записи кратных произведений. Предполагается, что определена также степень с рациональным показателем, то есть рассматриваемое полуполе является алгебраически замкнутым.
Ниже при записи выражений знак операции умножения 0, как всегда, опускается. Обозначение степени используется только в смысле идемпотентной алгебры.
Идемпотентное сложение естественным образом индуцирует частичный порядок на полуполе. Предполагается, что этот частичный порядок может быть продолжен до линейного порядка, а потому полуполе считается линейно упорядоченным. Далее знаки отношений понимаются в смысле указанного линейного порядка.
Примеры линейно упорядоченных алгебраически замкнутых идемпотентных полуполей включают
Rmax,+ = (R и {-сю}, -то, 0, max, +), IRmin,+ = (R U {+то}, +TO, 0, min, +),
Rmax,x = (R + и {0}, 0,1, max, x), Rmin,x = (R + U {+то}, +ю, 1, min, x),
где R обозначает множество вещественных чисел, R+ = {x 6 IR |x > 0}.
2.2. Идемпотентный полумодуль. Рассмотрим декартово произведение X", элементы которого будем представлять как векторы-столбцы. Вектор, все компоненты которого равны 0, называется нулевым вектором и обозначается 0. Операции сложения двух векторов ® и умножения вектора на скаляр 0 определяются обычным путем покомпонентно на основе скалярных операций, заданных на X. Множество X" с векторными операциями ® и 0 образует идемпотентный полумодуль над X.
Вектор называется регулярным, если он не имеет нулевых компонент. Множество всех регулярных векторов порядка n над X + обозначается X +.
Для любого ненулевого вектора-столбца x = (xj) 6 X" определен вектор-строка x- = (x-), где x- = x-1, если xi = ©, и x- =0 в противном случае, i = 1,...,n.
2.3. Алгебра матриц. Для матриц с элементами из X операции сложения и умножения двух матриц подходящего размера, а также умножения матрицы на скаляр выполняются по обычным правилам с использованием скалярных операций, определенных на X. Матрица, которая состоит из одних нулей, называется нулевой и обозначается символом 0.
Рассмотрим множество квадратных матриц X"x". Матрица, у которой равны нулю все недиагональные элементы, называется диагональной. Диагональная матрица с диагональными элементами, равными 1, является единичной матрицей и обозначается I. Целая степень матрицы вводится как обычно для записи кратного произведения.
По отношению к операциям сложения и умножения матриц множество X"x" является идемпотентным полукольцом с единицей.
Для любой матрицы A = (aij) ее след вычисляется по формуле
"
tr A = an.
i=1
83
Матрица является разложимой, если путем одновременной перестановки строк и столбцов она может быть приведена к блочно-треугольной нормальной форме. В противном случае матрица называется неразложимой.
Нормальная форма матрицы А € Xпхп имеет вид
/ Аи 0 . . 0 \
А21 А22 0
А =
V Ая1 АЯ2 . А88 )
(1)
где Ац —неразложимая или нулевая матрица порядка Hi, а Aij —произвольная матрица размера ni х Hj для всех j < i, где i = l,...,s и ni + ■ ■ ■ + ns = n.
2-4- Спектр матрицы. Любая матрица А € Жпхп задает в полумодуле Жп линейный оператор с определенными спектральными свойствами.
Если матрица А является неразложимой, то она имеет только одно собственное число
п
X =0trVm(Am). (2)
m=1
Собственные векторы неразложимой матрицы А не имеют нулевых координат. Пусть матрица А является разложимой и имеет форму (1). Все собственные значения матрицы А находятся среди собственных чисел Xi диагональных блоков Аii, i = l,...,s. Число X = Xi ® ■ ■■ ® Xs всегда является собственным для А. Это собственное число вычисляется по формуле (2) и называется спектральным радиусом
А.
2.5. Линейные неравенства. Предположим, что А € Xтхп и d € Xm — заданные матрица и вектор. Найдем все решения х € Xп линейного неравенства
Ах < d. (3)
Пусть матрица А = 0 имеет нулевой столбец. Тогда соответствующая координата вектора х может принимать любое значения, а остальные координаты находятся из неравенства, полученного из (3) путем вычеркивания указанных столбца и координаты. Если матрица не имеет нулевых столбцов, то справедливо следующее утверждение.
Лемма 1. Вектор х является решением неравенства (3) с матрицей А, у которой нет нулевых столбцов, и вектором d =0 тогда и только тогда, когда
х < (d- А)-.
Пусть имеются квадратная матрица А € Жпхп и вектор b € Хп. Рассмотрим задачу нахождения регулярных решений х € X + линейного неравенства
Ах ® b < х. (4)
Для решения неравенства применим подход на основе использования функции Tr(А), которая любой квадратной матрице А ставит в соответствие число
п
Tr(А) = 0 tr Ат.
m=1
84
Для каждой матрицы A введем матрицу
A* = I ф A ф---ф An-1.
Рассмотрим матрицу A в нормальной форме (1). Определим матрицы
/ 0 .......... © \
D = { An . "). T = A21
V ® Ass ) V As1 ^^-s, s — 1 0 )
которые задают блочно-диагональную и нижнюю блочно-треугольную части разложения A в форме
A = D ф T. (5)
Если матрица A является неразложимой, то полагаем D = A и T = ©.
Теорема 1. Пусть x —общее регулярное решение неравенства (4) с матрицей A в форме (5). Тогда справедливы следующие утверждения:
1) если Tr(A) < 1, то x = (D*T)*D*u для любого u G X + такого, что u > b;
2) если Tr(A) > 1, то регулярных решений неравенство не имеет.
3. Многомерные экстремальные задачи. Ниже приводятся примеры многомерных экстремальных задач, сформулированных в терминах идемпотентной алгебры. Задачи состоят в минимизации линейных или нелинейных функционалов, заданных на конечномерных полумодулях над идемпотентными полуполями, и могут включать дополнительные ограничения, которые накладываются на множество допустимых решений в виде линейных уравнений и неравенств.
Пусть A и B обозначают заданные матрицы, а p и q — заданные векторы. Сначала рассмотрим идемпотентный аналог задач линейного программирования, который изучался в [6]. Эта задача формулируется в терминах полуполя RmaXj+ и состоит в нахождении вектора х, который обеспечивает
min pT х,
Ax < Bx.
Для решения задачи используется подход, который позволяет при помощи итерационной вычислительной процедуры найти одно из решений, если задача имеет решения, или установить, что решений нет, в противном случае.
На основе развития указанного подхода в [7] предлагается вычислительный алгоритм решения задачи с нелинейной целевой функцией, которую можно записать в виде
T / T \-1
min pT x(qT x) 1, Ax < Bx.
85
Имеется ряд задач, для которых решения могут быть получены в явном виде в замкнутой форме. В частности, в [13] такие решения предлагаются для задачи
min (x-p ® q-x),
Ax < x.
В [8-11] рассматривается задача нахождения регулярных решений x, при которых достигается
min x Ax.
Для получения решений задачи в замкнутой форме используется подход на основе результатов спектральной теории линейных операторов в идемпотентной алгебре.
Ниже рассматривается задача с общей целевой функцией, которая включает целевые функции двух последних задач как частные случаи. При условии, что в задаче нет дополнительных ограничений, в явном виде получено общее решение задачи.
4. Экстремальная задача с общей целевой функцией. Пусть имеется матрица A G Xnxn, а также векторы p, q € Xn. Рассмотрим задачу
min (x-Ax ф x-p ф q-x). (6)
хеж+
Частные случаи этой задачи возникают в различных приложениях, включая оценку скорости роста вектора состояний стохастических динамических систем с синхронизацией событий [8, 10] и решение задач размещения одиночных объектов с метрикой Чебышёва и прямоугольной метрикой [11, 12].
4.1. Решение задачи. Полное решение задачи можно представить в виде следующего результата.
Теорема 2. Пусть даны матрица A в форме (1) со спектральным радиусом X, вектор p и регулярный вектор q. Положим Д = (q-p)1/2 и р = X ® Д = 0.
Введем матрицу Aм = p-1A и представим ее в виде Aм = Dм ф Т^, где
Dм —диагональная, а Т^ —нижняя треугольная части A^. Определим матрицу
в = D ти)* d;.
Тогда справедливо равенство
min (x-Ax ® x-p ® q-x) = р, xEX+
где минимум достигается тогда и только тогда, когда
x = Bu
для любого регулярного вектора и такого, что
p-1p < и < p(q-B)-.
Доказательство. Покажем, что X и Д являются оценками снизу целевой функции в (6), а затем найдем все регулярные векторы x, при которых эта функция достигает значения р = X ф Д. Чтобы проверить, что нижней оценкой является X, запишем
x-Ax ф x-p ф q-x > x-Ax.
86
Для нулевой матрицы А имеем тривиальную оценку Л = 0. Предположим, что матрица A = 0 является неразложимой и Л — ее единственное собственное число. Возьмем произвольный собственный вектор хо и заметим, что при всех x G X + выполняется хх- > (х-хо)-1/, а также х-хо = 1. Следовательно,
х-Ах = х-Ахх-х0 > х-Ах0(х-х0)-1 = Лх-х0(х-х0)-1 = Л.
Рассмотрим произвольную матрицу А в форме (1). Заметим, что компоненты любого вектора х G X + разбиваются на части х1,..., х8 в соответствии с разбиением матрицы А на блочные ряды. Применяя результат для неразложимых матриц, имеем
s s s s
х-Ах = ф (D х-Архj > ф х-Ацхi > ф Лг = Л.
i=1 j=1 i=1 i=1
Теперь покажем, что Д = (q-p)1/2 также является нижней оценкой для целевой функции. Имеем неравенство
х-Ах ® х-р ® q-х > х-р ® q-x.
Возьмем любой вектор х G X + и обозначим
r = х-р ® q-x.
Из последнего равенства вытекают два неравенства:
r > q-x, r > х-р.
Умножение первого неравенства справа на r-1 х- дает
х- > r-1 q-хх- > r-1q-.
После подстановки во второе неравенство имеем r > r-1 q-p = r-1 Д2, откуда следует
х-р ® q~ х = r > Д.
Объединяя полученные результаты, приходим к заключению, что х-Ах ® х-р ® q~ х > Л ® Д = р.
Найдем все регулярные решения уравнения
х-Ах ® х-р ® q-х = р.
Учитываем, что х-Ах ® х-р ® q-х > р для всех х G Х+; тогда множество решений уравнения совпадает с множеством решений неравенства
х-Ах ® х-р ® q-х < р,
которое, в свою очередь, равносильно системе двух неравенств
х-Ах® х-р < Р,
87
q x < p.
Возьмем первое неравенство системы и умножим его на p-1x слева. Будем иметь A№x ® p-1p < p-1xx-Ax ® p-1xx-p < х, откуда следует неравенство
A^x ® p-1p < x.
В силу того, что из полученного неравенства путем умножения слева на px-сразу получается первое неравенство системы, эти неравенства являются эквивалентными.
Заметим, что Tr(AM) = Tr(p-1 A) < Tr(X-1 A) < 1. Применяя к полученному неравенству теорему 1, находим общее решение первого неравенства системы в виде
x = (d; t^)*d; и = Би,
где и — любой регулярный вектор такой, что
и > p-1p.
Подстановка этого решения во второе неравенство ведет к неравенству q-Би < p, решение которого с помощью леммы 1 дает
и < p(q-Б)-.
Объединяя неравенства для вектора и, окончательно приходим к решению в виде х = Ви, р гр <и< p(q~B)~. □
4-2. Частные случаи и обобщение задачи. Пусть в задаче (6) матрица A является неразложимой. В этом случае имеем D№ = AM, T№ = 0 и Б = A* . Утверждение теоремы 2 принимает следующую форму.
Следствие 1. Пусть даны неразложимая матрица A с собственным числом X, вектор p и регулярный вектор q. Положим Д = (q-p)1/2, р = X ® Д = 0 и введем матрицу A№ = p-1A. Тогда справедливо равенство
min (x-Ax ® x-p ® q-x) = р,
xEX+
где минимум достигается тогда и только тогда, когда
x = A* и №
для любого регулярного вектора и такого, что
p-1p < и < p(q-A№)-.
88
В частности, если A = 0, то A* = I и р = Д. Множество решений задачи определяется тогда двойным неравенством
Д-1р < x < Дq,
что совпадает с результатом в [13].
Предположим, что вектор q в задаче (6) не является регулярным. В этом случае в неравенстве
q-Bu < р,
которое появляется при доказательстве теоремы 2, матрица q-B может иметь нулевой столбец, что не позволит прямо применить лемму 1.
Для решения указанного неравенства заметим, что матрица q-B представляет собой вектор-строку. Пусть J = supp(q-B) —множество индексов ненулевых компонент этого вектора. Обозначим через (q-B)j и uj подвекторы, составленные из координат векторов q-B и u с индексами из J. Тогда решением неравенства будет любой регулярный вектор u такой, что все компоненты с индексами из J удовлетворяют ограничению uj < p(q-B)-, а все остальные компоненты могут принимать произвольные значения.
Опираясь на приведенные рассуждения, приходим к выводу, что ограничения на вектор q в условиях теоремы 2 теперь можно ослабить.
Теорема 3. Пусть даны матрица A в форме (1) со спектральным радиусом X, а также векторы p и q. Положим Д = (q-p)1/2 и р = X ® Д = 0.
Введем матрицу A* = p-1A, которую представим в виде A* = D* ® Т*, и
матрицу B = (D*Т*)*D*. Определим множество индексов J = supp(q-B).
Тогда справедливо равенство
min (x-Ax ® x-p ® q-x) = р,
xEX+
где минимум достигается тогда и только тогда, когда
x = Bu
для любого регулярного вектора u такого, что
р-1р < u, uj < p(q-B)-.
Нетрудно видеть, что если р = 0 или q = 0, то соответственно нижняя или верхняя граница для вектора u исчезает. В частности, справедливо следующее утверждение.
Следствие 2. Пусть дана матрица A в форме (1) со спектральным радиусом X = 0.
Введем матрицу A\ = X-1A, которую представим в виде A\ = D\ ® Т\, а
также матрицу B = (D*T\)*D*. Тогда справедливо равенство
min x-Ax = X,
где минимум достигается тогда и только тогда, когда
x = Bu
для любого регулярного вектора u.
89
Этот результат дает полное решение задачи оптимизации функционала x Ax, для которой ранее были найдены частные решения в работах [8, 9, 11].
Литература
1. Baccelli F., Cohen G., Olsder G. J., Quadrat J.-P. Synchronization and linearity: An algebra for discrete event systems. Chichester: Wiley, 1993. 514 p.
2. Kolokoltsov V.N., Maslov V.P. Idempotent analysis and its applications. Dordrecht: Kluwer, 1997. 324 p.
3. Golan J. S. Semirings and affine equations over them: Theory and applications. New York: Springer, 2003. 250 p.
4. Heidergott B., Olsder G. J., van der Woude J. Max-plus at work: Modeling and analysis of synchronized systems. Princeton: Princeton University Press, 2006. 213 p.
5. Litvinov G. L. The Maslov dequantization, idempotent and tropical mathematics: A brief introduction // J. Math. Sci. 2007. Vol. 140, N3. P. 426-444. E-print arXiv:math.GM/0507014
6. Butkovic P. Max-linear systems: Theory and algorithms. London: Springer, 2010. 272 p.
7. Gaubert S., Katz R.D., Sergeev S. Tropical linear programming and parametric mean payoff games // J. Symbolic Comput. 2012. Vol. 47, N 12. P. 1447-1478. E-print arXiv:1101.3431
8. Krivulin N. K. Evaluation of bounds on the mean rate of growth of the state vector of a linear dynamical stochastic system in idempotent algebra // Vestnik St. Petersburg Univ. Math. 2005. Vol. 38, N2. P. 42-51.
9. Krivulin N. K. Eigenvalues and eigenvectors of matrices in idempotent algebra // Vestnik St. Petersburg Univ. Math. 2006. Vol. 39, N2. P. 72-83.
10. Кривулин Н. К. Методы идемпотентной алгебры в задачах моделирования и анализа сложных систем. СПб.: Изд-во С.-Петерб. ун-та, 2009. 256 с.
11. Krivulin N. An algebraic approach to multidimensional minimax location problems with Cheby-shev distance // WSEAS Trans. Math. 2011. Vol. 10, N6. P. 191-200. E-print arXiv:1211.2425
12. Krivulin N. K. An extremal property of the eigenvalue of irreducible matrices in idempotent algebra and solution of the Rawls location problem // Vestnik St. Petersburg Univ. Math. 2011. Vol. 44, N 4. P. 272-281.
13. Krivulin N. A new algebraic solution to multidimensional minimax location problems with Cheby-shev distance // WSEAS Trans. Math. 2012. Vol. 11, N7. P. 605-614. E-print arXiv:1210.4770
14. Tharwat A., Zimmermann K. One class of separable optimization problems: Solution method, application // Optimization. 2008. Vol. 59, N5. P. 619-625.
15. Krivulin N. Solution to an extremal problem in tropical mathematics // Tropical and Idempotent Mathematics: International Workshop / G. L. Litvinov, V. P. Maslov, A. G. Kushner, S. N. Sergeev (Eds.). Moscow, 2012. P. 132-139.
16. Krivulin N. A complete closed-form solution to a tropical extremal problem // Advances in Computer Science: Proc. 6th WSEAS European Computing Conference (ECC’12). WSEAS Press, 2012. P. 146-151. E-print arXiv:1210.3658
17. Krivulin N. K. Solution of generalized linear vector equations in idempotent algebra // Vestnik St. Petersburg Univ. Math. 2006. Vol. 39, N 1. P. 16-26.
Статья поступила в редакцию 20 сентября 2012 г.
90