Сер. 10. 2009. Вып. 3
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
УДК 519.6 Н. К. Кривулин
О РЕШЕНИИ ОДНОГО КЛАССА ЛИНЕЙНЫХ ВЕКТОРНЫХ УРАВНЕНИЙ В ИДЕМПОТЕНТНОЙ АЛГЕБРЕ *)
1. Введение. Многие приложения идемпотентной алгебры [1-6] приводят к необходимости решения в некотором идемпотентном полукольце векторного уравнения
Ах = Ь,
где А и Ь - заданные матрица и вектор; х - вектор неизвестных. Примеры таких практических задач в области сетевого планирования, управления производством и исследования надежности систем можно найти, например, в работах [1, 2, 7].
Учитывая, что указанное уравнение может рассматриваться как выражение линейной зависимости между векторами, методы его анализа и решения представляют не только практический, но и теоретический интерес. При этом особое значение приобретает разработка способов представления решений в компактной векторной форме, которая будет удобной как для решения формальных задач, так и для алгоритмической и программной реализаций вычислений, включая расчеты с применением векторных и параллельных вычислительных систем.
Задача решения уравнения и ее связь с линейной зависимостью векторов рассматривались Н. Н. Воробьевым [1, 2] и Р. А. Кунингхайм-Грином [3]. Дальнейшее развитие эти вопросы получили в ряде других работ, включая [4, 8-10].
Для решения уравнения с матрицей, все элементы которой ненулевые, в [1, 2] предложен метод разрешающих покрытий, опирающийся на анализ подмножеств строк некоторой приведенной матрицы. На основе данного метода в терминах разрешающих покрытий множества строк определены условия существования решения и описана процедура нахождения всех решений. Получено выражение для максимального решения, которое записывается в виде х = А- <8> Ь, где А- обозначает псевдообратную матрицу для А в исходном полукольце (эта матрица названа автором экстремально обратной), <8> - знак операции умножения в некотором двойственном полукольце.
Развитие теории и методов решения уравнений в работе [3] было направлено, в частности, на преодоление трудностей, которые возникают при решении уравнений с матрицей, имеющей нулевые элементы. На случай таких матриц была распространена операция вычисления псевдообратной матрицы (которая здесь называется сопряженной). Впервые найдено условие существования решений уравнения в виде равенства
Кривулин Николай Кимович — кандидат физико-математических наук, доцент кафедры статистического моделирования математико-механического факультета Санкт-Петербургского государственного университета. Количество опубликованных работ: 65. Научные направления: исследования операций, математическое моделирование, идемпотентная алгебра. E-mail: [email protected].
+ ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00808).
© Н. К. Кривулин, 2009
A(A- <g) b) = b, где <g) - знак операции умножения в двойственном полукольце, а также условие единственности решения. Предложена вычислительная процедура выявления линейной зависимости векторов.
В работах [4, 8, 9] сначала определяется подрешение уравнения как любой вектор x, для которого Ax ^ b. Вводится операция \ вычисления остатка от деления A на b таким образом, чтобы выражение A \ b означало максимальное подрешение уравнения Ax = b. Показано, что в случае, когда обычное решение уравнения существует, оно может быть записано в терминах двойственного полукольца, т. е. выполняется равенство A \ b = A- <g> b. В [4, 9] для уравнения Ax ® d = b даны необходимое и достаточное условия существования подрешения в виде неравенства d ^ b, которое является лишь необходимым условием существования обычного решения.
Подход, основанный на использовании некоторого аналога определителя матрицы, который называется доминантом, был предложен в [10]. Разработан метод решения уравнений при помощи правила Крамера с заменой определителя на доминант. Для применения этого метода, однако, требуется выполнение существенных ограничений, которым должны одновременно удовлетворять матрица A и вектор b.
В настоящей работе представлены некоторые новые результаты, которые опираются на работы [11, 12]. Предлагается подход, при котором решение уравнения Ax = b сводится к анализу расстояния между векторами в соответствующем метрическом пространстве. Выбирается метрика, для вычисления которой достаточно выполнения основных бинарных операций полукольца, дополненных операцией обращения. Это позволяет представить последующие результаты в компактной векторной форме в терминах исходного полукольца, а также дать полученным результатам простую и наглядную геометрическую интерпретацию на плоскости в декартовой системе координат.
В работе сначала дается обзор некоторых понятий и обозначений идемпотентной алгебры, на которые опирается дальнейшее изложение. Рассматривается векторный полумодуль над идемпотентным полуполем, на котором вводится метрика. Затем находится общее выражение для вычисления расстояния от заданного вектора до линейной оболочки векторов, а также определяется вектор оболочки, который оказывается ближе всего к заданному вектору. Эти результаты используются для выяснения условий существования и единственности решения уравнения Ax = b, а также для представления общего решения. В заключение рассматриваются решение смешанной системы, которая состоит из уравнений и неравенств, а также решение уравнения Ax ® d = b.
2. Предварительные результаты.
2.1. Идемпотентное полукольцо. Пусть X - числовое множество, на котором заданы две операции: сложение ® и умножение ®. Будем предполагать, что (X, ®, ®) является коммутативным полукольцом с нулем и единицей, в котором сложение идем-потентно, а каждый ненулевой элемент имеет обратный по умножению. Такое полукольцо часто называют полуполем.
Обозначим нулевой и единичный элементы символами 0 и 1. Пусть X+ = X \ {0}. Тогда для всякого x G X+ существует обратный элемент x-1. Для любых x,y G X+ стандартным путем вводят степень xy, а также полагают, что x0 = 1, 0y = 0.
Далее в выражениях знак операции умножения <g>, как обычно, опускается. Обозначение степени используется в смысле идемпотентной алгебры. Однако при записи показателя степени для простоты применяются обычные арифметические операции.
В силу идемпотентности сложения, на X определено отношение ^ линейного порядка так, что x ^ y тогда и только тогда, когда x ® y = y. Ниже знаки операций
отношения понимаются в смысле указанного линейного порядка. Заметим, что в соответствии с этим порядком для любого x G X выполняется x ^ 0. Предполагается, что множество X можно дополнить элементом ж таким, что x ^ ж для всякого x G X.
К полукольцам рассматриваемого типа относятся
Rmax,+ = (R и {-ж}, max, +), Rmin,+ = (R U {+ж}, min, + ),
Kmax,x = (R+ и {0}, max, x), Rmin,x = (R+ U {+ж}, min, x),
где R - множество всех вещественных чисел; R+ = {x G R|x > 0}.
В полукольце Rmax,+ нулем является -ж, а единицей - число 0. Для каждого x G R существует обратный элемент x-1, равный —x в обычной арифметике. Для любых x,y G R определена степень xy, значение которой соответствует арифметическому произведению xy. Отношение порядка имеет обычный смысл. Максимальным элементом служит +ж.
В Rmin,x нулем является +ж, единицей - число 1. Обратный элемент и степень имеют обычный смысл. Отношение ^ определяет порядок, обратный по отношению к обычному линейному порядку на R+. Роль элемента ж играет число 0.
Ясно, что все полукольца Rmax,+, Rmin,+, Rmax,x и Rmin,x изоморфны друг другу.
2.2. Метрика. На полукольце X можно ввести функцию расстояния р следующим образом. Для любых x, y = 0 определим
p(x, у) = y-1x ® x-1y.
Учитывая, что функция р принимает значения на интервале [1, ж), естественно положить p(x,y) = 1, если x = y = 0. Наконец, удобно считать, что p(x,y) = ж, если один из аргументов x или y равен нулю, а другой отличен от нуля.
В полукольце Rmax,+ для всех x,y G R функция р совпадает с обычной метрикой p(x,y) = Ix — y|. В силу изоморфизма полуколец Rmax,x, Rmin,+ и Rmin,x полукольцу Rmax,+, в каждом из них функция р порождает некоторую функцию расстояния. Например, в полукольце Rmax,x имеем
р!^,у) = log(y-1x ф x-1y).
Легко проверить, что для каждого из полуколец функция р^,у) = y-1x ф x-1y обладает всеми свойствами метрики, за исключением, быть может, множества значений, которые она принимает. Эта функция с точностью до соответствующего изоморфизма является метрикой для всякого полукольца, изоморфного Rmax,+.
Ниже в качестве метрики будем использовать функцию р для всех рассматриваемых полуколец, опуская для простоты дополнительные преобразования изоморфизма.
2.3. Алгебра матриц. Для любых матриц A,B G Xmxn и C G Xnxl, а также числа x G X обычным путем определяются сложение и умножение матриц, а также умножение матрицы на скаляр
n
{А ф B}ij = {A}ij ф {B}ij, {BC}ij = {B}ik {C }kj, {xA}ij = x{A}ij .
k=1
Матрица, все элементы которой равны нулю, называется нулевой и обозначается символом 0. Если в каждой строке матрицы имеется по крайней мере один ненулевой элемент, то она называется регулярной.
Как обычно, квадратная матрица называется диагональной, если все ее недиагональные элементы равны нулю. Матрица I = diag(1,..., 1) является единичной.
Для любой регулярной матрицы А = (а^-) € Хтхп определена псевдообратная матрица А- = (а-) € Хп
с элементами
Г„-1
0,
, если о^і = 0, если о^і = 0.
Рассмотрим произвольный вектор х = (х\,...,хп)Т € Хп. Носителем вектора х называется множество вирр(х) = {г\х^ = 0,1 ^ г ^ п}. Для любых векторов х и у с общим носителем из покомпонентного неравенства х ^ у следует х > У .
Для любых векторов х, у € Х+ справедливо неравенство
ху > (у х) I.
(1)
При у = х оно принимает вид хх ^ I. Применяя (1), нетрудно проверить, что для любой матрицы А € Хтхп и вектора х € Х+ справедливо неравенство
(2)
3. Полумодуль над идемпотентным полуполем. Рассмотрим декартово произведение Хт, где X - идемпотентное полуполе. Для любых векторов а, Ь Є Хт, где а = (оі, ..., от)Т, Ь = (Ь1,..., Ьт)Т, и числа х Є X определены операции
а ® Ь = (оі ® Ьі,...,от ® Ьт )Т, ха = (хоі, ..., хот)Т.
Множество векторов Хт с указанными операциями образует полумодуль, нулевым элементом которого является вектор 0 = (0,..., 0)т.
Для полумодуля К^пах + геометрическая иллюстрация операций сложения векторов и умножения вектора на скаляр на плоскости в обычной декартовой системе координат приведена на рис. 1.
Рис. 1. Сложение векторов (слева) и умножение вектора на скаляр (справа) в
При геометрическом сложении двух векторов на плоскости применяется следующее «правило прямоугольника». Суммой двух векторов является вектор, которому соответствует правая верхняя вершина прямоугольника, построенного на пересечении перпендикуляров, проведенных из концов векторов к координатным осям.
оц =
Умножение в КПах + вектора а на число х эквивалентно вычислению а+х в обычных обозначениях, где х = (х,..., х)т.
Рассмотрим произвольную систему векторов аі,...,ап Є Хт. Обозначим через врап(аі,..., ап) = {хіаі ® ■ ■■ ® хпап\хі, ...,хп Є X} линейную оболочку векторов системы. На рис. 2 представлена линейная оболочка векторов аі, а2 Є КПах +, которая имеет форму полосы, ограниченной параллельными прямыми, проходящими через концы векторов аі и а2.
Рис. 2. Линейная оболочка двух векторов в
Вектор Ь Є Хт линейно зависит от векторов аі,..., ап, если его можно представить в виде разложения (линейной комбинации) Ь = хіаі ® ■■■ ® хпап с коэффициентами х1,...хп Є Х. Определив матрицу А = (а1,...,ап) и вектор х = (х1 ,...,хп)Т, это разложение можно записать в форме Ь = Ах.
Если вектор Ь линейно зависит от системы аі,...,ап, но не зависит от любой ее подсистемы, то такая система называется минимальной системой, порождающей Ь.
Предложение 1. Представление любого вектора в виде разложения по векторам его минимальной порождающей системы является единственным.
Доказательство. Предположим, что имеется два разложения вектора Ь по векторам его минимальной порождающей системы аі,..., ап
Ь = хіаі ® ■■■ ® хпап = хіаі ® ■■■ ® х'пап,
причем хі = хі для некоторого і = 1,...,п. Пусть, для определенности, хі < хі. Имеем неравенства Ь ^ хіаі > х'іаі, откуда вытекает, что величина х'іаі не влияет на значение Ь и ее можно отбросить. Следовательно, вектор Ь является линейной комбинацией векторов аі,..., аі-і, аі+і,..., ап, что противоречит условию. □
Система аі,..., ап называется линейно зависимой, если хотя бы один из векторов системы линейно зависит от других, и линейно независимой - в противном случае.
Введем на полумодуле Хт метрику р. Для любых а, Ь Є Хт \ {0} при условии, что вирр(а) = яирр(Ь), определим
р(а, Ь) = р(оі ,Ьі)= ф (Ь-1Оі ® о-іЬі) = Ь-а ® а-Ь.
ієвирр(а) ієвирр(а)
Положим р(а, Ь) = ж, если вирр(а) = вирр(Ь), и р(а, Ь) = 1, если а = Ь = 0.
Заметим, что в полумодуле R™ax + функция р для всех a, b Є Rm совпадает с обычной ж-метрикой
рж(а, b) = max \bi - a,i\.
i^i^m
4. Расстояние от вектора до множества векторов. Расстояние между вектором b и множеством векторов S, заданных на одном и том же полумодуле, определяется величиной
p(S, b) = inf р(а, b).
к ' aeS '
Пусть имеется произвольная система векторов ai,...,an Є Xm. Введем матрицу A = (ai,.. .,an) и линейную оболочку A = span(ai,. ..,an).
Рассмотрим задачу определения расстояния от произвольного вектора b Є Xm до линейной оболочки A, а затем расстояния от b до множеств
Ai = {a Є A\a < b}, A2 = {a є A\a > b}.
В силу того, что каждый вектор a єA можно представить в виде a = Ax, где x Є Xn, получаем
р(А, b) = min p(Ax, b).
xexn
Пусть b = 0. Учитывая, что A всегда содержит нулевой вектор, имеем p(A, b) = 1. Кроме того, Ai = {0} и A2 = A, откуда следует, что p(Ai, b) = p(A2, b) = 1.
Допустим, что в системе векторов ai,...,an есть нулевой вектор. Очевидно, что удаление такого вектора из системы оставит множество A без изменений. При A = 0 выполняется p(A, b) = 1, когда b = 0, и p(A, b) = ж - в противном случае.
Далее будем считать, что b = 0 и ai = 0 при всех i = 1,...,п.
Предположим, что вектор b = 0 имеет нулевые координаты. Наряду с матрицей A рассмотрим матрицу А, которая получается из A путем применения следующей процедуры. Введем множества индексов I = {i\bi = 0} и J = {j\a.¿j > 0,i Є I}. Определим элементы матрицы A = (aij-), исходя из условия
{0, если i Є I и j Є J, aij, в противном случае.
Нетрудно видеть, что у матриц Ai и A могут различаться только столбцы, имеющие ненулевые элементы на пересечении со строками, которые соответствуют нулевым координатам вектора b. В матрице Ai все элементы таких столбцов, которые не лежат на пересечении с указанными строками, приравниваются к нулю.
Будем называть матрицу Ai согласованной с вектором b.
Заметим, что при условии b >0 выполняется равенство Ai = A, т. е. исходная матрица и полученная из нее матрица, согласованная с b, совпадают.
Покажем, что задачи определения расстояния от b до линейных оболочек столбцов матриц A и Ai эквивалентны в смысле следующего утверждения.
Предложение 2. При всех x Є Xn выполняется p(Ax, b) = p(Ax, b).
Доказательство. При b > 0 справедливость утверждения очевидна.
Предположим, что вектор b = 0 имеет нулевые координаты. Значение величины p(Ax, b) конечно тогда и только тогда, когда supp(Ax) = supp(b). Это условие равносильно выполнению равенства aii^i ® ■ ■■ ® ainxn = 0 всякий раз, когда bi = 0.
Для выполнения последнего равенства необходимо положить Xj = 0 для всех индексов j таких, что a,ij = 0 хотя бы для одного индекса i, для которого bi = 0. Ясно, что тогда величина p(Ax, b) < ж не изменится при замене матрицы A на A.
Наконец, нетрудно проверить, что из условия supp(Ax) = supp(b) следует выполнение условия supp(Ax) = supp(b) и наоборот. □
Заметим, что полученный результат позволяет ограничиться изучением только таких задач, в которых матрица A и вектор b оказываются согласованными.
Пусть матрица A и вектор b согласованы. При условии, что матрица A - регулярная, определим величину A(A, b) = (A(b- A)-)-b. Если матрица A не является регулярной, то положим A(A, b) = ж.
4.1. Вектор с ненулевыми координатами. Допустим, что координаты вектора b отличны от нуля. Покажем, что тогда для определения минимума величины p(Ax, b) достаточно рассмотреть только те векторы x, которые не имеют нулевых координат.
Предложение 3. Для любого вектора b > 0 выполняется
p(A, b) = min p(Ax, b). x>0
Доказательство. Рассмотрим вектор у = Ax, на котором достигается минимум величины p(Ax, b). Если у вектора у есть нулевые координаты, то supp(y) = supp(b), откуда следует, что p(Ax, b) = ж при всех x, включая x > 0.
Предположим, что у = (yi,..., ym)T > 0, и допустим, что вектор x имеет нулевую координату, например Xj = 0. Введем множество I = {i\aij > 0} = 0 и определим число є = min{aij1yi\i Є I} > 0. Заметим, что при замене Xj = 0 на Xj = є координаты вектора у не меняются. Следовательно, при определении минимума p(Ax, b) можно ограничиться исследованием множества векторов x > 0. □
Следующие утверждения раскрывают смысл величины A(A, b), введенной выше.
Лемма 1. Для любой матрицы A и вектора b > 0 выполняется
р(А,Ь) = у/А(А,Ь).
Если Д(Д b) < оо; то минимум р(Ах, b) достигается при х = Д(Д Ь)(Ь~А)~.
Доказательство. Утверждение леммы верно, если матрица A не является регулярной. Действительно, в этом случае supp(Ax) = supp(b) для любого x, откуда следует, что p(A, b) = ж.
Пусть A - регулярная матрица. Обозначим A = A(A, b) = (A(b-A)-)-b. Возьмем произвольный вектор Ax Є A, где x > 0, и рассмотрим величину r = p(Ax, b).
Имеем равенство r = b-Ax ® (Ax)-b, из которого вытекают два неравенства:
r ^ b-Ax, (3)
r ^ (Ax)-b. (4)
Умножая неравенство (3) на x- справа и применяя (1), приходим к неравенствам
rx- ^ b-Axx- ^ b-A, откуда следует x ^ r(b-A)-, а затем (Ax)- ^ r-1(A(b-A)-)-.
Теперь из неравенства (4) получаем r ^ r-1 (A(b-A)-)-b = r-1A, а потому всегда выполняется неравенство r ^ A1/2.
Осталось проверить, что r = A1/2, если x = A1/2(b-A)-. Действительно, при таком значении вектора x имеем
r = A1/2b-A(b-A)- ф A-1/2(A(b-A)-)-b = A1/2 0 A1/2 = A1/2.
Заметим, что вектору x соответствует вектор у = A1/2A(b-A)- Є A. □
На рис. 3 представлены примеры взаимного расположения множества А и вектора Ь для полумодуля
Рис. 3. Линейная оболочка А и вектор Ь в К^ах^ при разных Д
Найдем расстояния от вектора Ь до множеств А1 и А2.
Лемма 2. Для любой матрицы А и вектора Ь > 0 выполняется
р(А1, Ь) = р(А2, Ь) = Д(А, Ь).
Если Д(А, Ь) < ж, то минимум р(Ах, Ь) при условиях Ах € А1 и Ах € А2 достигается соответственно при х1 = (Ь-А)- и х2 = Д(А, Ь)(Ь-А)-.
Доказательство. Введем обозначение Д = Д(А, Ь). Так же, как при доказательстве леммы 1, нетрудно проверить выполнение равенства р(А1, Ь) = р(А2, Ь) = Д, если матрица А не является регулярной.
Покажем, что это равенство сохраняется в случае регулярной матрицы А.
Из неравенства Ах = а ^ Ь с помощью умножения на х- справа и применения неравенства (1) получим А ^ Ахх- ^ Ьх-. Умножая последнее неравенство на Ь-слева, приходим к неравенству Ь-А ^ х-, откуда следует, что х ^ (Ь-А)-.
Тогда для любого вектора Ах € А1 имеем р(Ах, Ь) = (Ах)-Ь ^ (А(Ь-А)-)-Ь = Д. Ясно, что р(Ах1, Ь) = Д, если х1 = (Ь-А)-.
Рассмотрим произвольный вектор Ах € А2. Применяя (2) и учитывая, что Ах ^ Ь, получим р(Ах, Ь) = Ь-Ах ^ (А(Ь-А)-)-Ах ^ (А(Ь-А)-)-Ь = Д. Осталось проверить, что подстановка х2 = Д(Ь-А)- дает р(Ах2, Ь) = ДЬ-А(Ь-А)- = Д.
Заметим, что при условии Д < ж минимум расстояния от Ь до множеств А1 и А2 достигается соответственно на векторах у1 = А(Ь-А)- и у2 = ДА(Ь-А)-. □
Геометрическая иллюстрация полученного результата для полумодуля К;тах + дана на рис. 4.
Следствие 1. Для любой матрицы А и вектора Ь > 0 решение неравенства Ах < Ь имеет вид х < (Ь-А)-.
Доказательство. Проверим, что неравенства Ах ^ Ь и х ^ (Ь-А)- равносильны. Из доказательства леммы 2 ясно, что из первого неравенства следует второе.
Рассмотрим неравенство х ^ (Ь-А)-. С учетом (2) имеем Ах ^ А(Ь-А)- ^ Ь. □
4.2. Произвольный ненулевой вектор. Исследуем расстояние между линейной оболочкой А и произвольным вектором Ь = 0. Достаточно рассмотреть только случай, когда матрица А согласована с Ь.
Д > 1 / / 1 Л2
/ У 2 a2 / Jf /
/ Vl b
Ai y' ai Д
Рис. 4. Множества A1, A2 и вектор b в К;тах,+ при разных Д
Лемма 3. Для любой матрицы A, согласованной с вектором b = 0, выполняется
Р(Л, Ь) = (А,Ь).
Если Д(Д Ь) < оо; то минимум р(Ах, Ь) достигается при х = \JД(Д Ь)(Ь~ А)~.
Доказательство. Случай, когда b > 0, был рассмотрен в лемме 1. Пусть вектор b = 0 имеет нулевые координаты. Положим I = {i\bi = 0} и J = {j\aij > 0,i Є I}.
Зафиксируем значения Xj = 0 для всех индексов j Є J. Теперь можно исключить из рассмотрения компоненты вектора b и строки матрицы A с индексами i Є I, а также столбцы A с индексами j Є J. Вычеркивая указанные элементы, получим некоторую новую матрицу A' и новый вектор b'.
Обозначим линейную оболочку столбцов матрицы A через A и заметим, что вектор b' не имеет нулевых координат. Тогда, применяя лемму 1, находим
р(АЬ)=р(Л',Ъ>) = ^А(А',Ь>).
Минимум расстояния р(А'х'^Ъ') достигается при условии х' = \J Д(^4/, Ъ')(Ъ'~ А')~, где х' - некоторый вектор, размерность которого меньше, чем п.
Матрица A отличается от A' только дополнительными ненулевыми строками и столбцами. Нетрудно видеть, что из регулярности (нерегулярности) одной матрицы следует регулярность (нерегулярность) другой и наоборот.
Пусть матрицы A и A' являются регулярными. Учитывая, что вектор b был получен из b путем удаления нулевых координат, легко проверить, что
Д(Д, b') = (A'(b'- A')-)-b' = (A(b-A)-)-b = A(A, b).
Наконец, вектор x отличается от х' только дополнительными нулевыми координатами, откуда следует, что p(Ax, b) имеет минимум при х = лЩаЩ(ъ-а)-. □
Применяя ту же схему доказательства, нетрудно проверить справедливость следующих утверждений.
Лемма 4. Для любой матрицы A, согласованной с вектором b = 0, выполняется
p(Ai, b) = p(A2, b) = Д^, b).
Если Д(А, Ь) < ж, то минимум р(Ах, Ь) при условиях Ах е А1 и Ах е А2 достигается соответственно при х1 = (Ь-А)- и х2 = Д(А, Ь)(Ь-А)-.
Следствие 2. Для любой матрицы А и вектора Ь = 0 решение неравенства Ах < Ь имеет вид х < (Ь-А)-.
Из представленных доказательств вытекает, что Д(А, Ь) ^ 1. Равенство
Д(А, Ь) = 1 означает, что Ь еА, в то время как неравенство Д(А, Ь) > 1 - что Ь €А. Другими словами, справедливо следующее утверждение.
Лемма 5. Вектор Ь принадлежит линейной оболочке столбцов согласованной с ним матрицы А тогда и только тогда, когда Д(А, Ь) = 1.
При этом Ь = Ах, где х = (Ь-А)-.
5. Решение уравнений и неравенств. Покажем, как полученные результаты могут быть применены для решения уравнений и неравенств.
Пусть заданы некоторая матрица А е Хтх” и вектор Ь е Xm. Рассмотрим задачи решения относительно х е X” уравнения
Ах = Ь (5)
и неравенства
Ах ^ Ь. (6)
Далее будем считать, что в уравнении (5) и неравенстве (6) матрица А является согласованной с вектором Ь.
Решение хо является максимальным, если х ^ хо для любого решения х.
Если матрица А имеет нулевой столбец, например а, то решение уравнения (5), очевидно, эквивалентно решению уравнения, полученного из (5) при условии удаления координаты XI вектора х вместе с вычеркиванием столбца а¿. Каждому решению полученного уравнения будет тогда отвечать множество решений исходного уравнения, соответствующих всем возможным значениям х^ е X. Ясно, что аналогичные рассуждения справедливы и в отношении неравенства (6).
Пусть А = 0. Тогда при Ь = 0 решением уравнения становится любой вектор х е X”, а при Ь = 0 - решений нет. Решением неравенства является любой х е X”.
При Ь = 0 уравнение и неравенство имеют тривиальное решение х = 0. Если у матрицы А нет нулевых столбцов, то это решение единственное.
Далее будем предполагать, что вектор Ь и все столбцы матрицы А - ненулевые.
Заметим, что, в силу следствия 2, решение неравенства (6) всегда существует и может быть записано в виде х ^ (Ь-А)-.
5.1. Существование и единственность решения уравнения. Справедливо следующее утверждение.
Теорема 1. Уравнение (5) имеет решение тогда и только тогда, когда выполняется условие Д(А, Ь) = 1.
При этом х = (Ь- А)- является максимальным решением. Если столбцы матрицы А образуют минимальную систему, порождающую Ь, то других решений нет.
Доказательство. Условие существования решения и вид частного решения прямо вытекают из леммы 5. Результат следствия 2 указывает на то, что это частное решение - максимальное. Единственность следует из предложения 1. □
Заметим, что вычисление значения Д(А, Ь) требует 2п2 + 4п операций <8>-умно-жения и обращения, а также 2п2 + п операций ©-сложения. Решение х = (Ь- А)-может быть получено за п2 + 2п операций ^-умножения и п2 операций ©-сложения.
Случай единственного решения уравнения для полумодуля КПах + представлен на рис. 5 слева. Справа показаны два примера, в которых уравнение имеет более одного
решения. В первом случае вектор Ь линейно зависит от одной части столбцов матрицы А и не зависит от другой. Во втором случае столбцы, от которых зависит Ь, сами являются линейно зависимыми.
Рис. 5. Примеры решений уравнения в Ктах,+
Назовем псевдорешением уравнения (5) решение уравнения
Ах = у/А(А, Ь)А(Ь~А)-,
которое, очевидно, всегда существует и равно хо =
Ясно, что при Д(А, Ь) = 1 псевдорешение превращается в решение. Кроме того, из леммы 4 следует, что среди всех векторов линейной оболочки столбцов матрицы А псевдорешение обеспечивает минимум расстояния до вектора Ь в смысле метрики р.
Если разрешимость уравнения (5) не гарантируется, то в качестве х можно взять его псевдорешение, которое, с одной стороны, совпадает с решением, если оно существует, а с другой - минимизирует невязку правой и левой частей уравнения.
Предположим, что Д(А, Ь) > 1, т. е. уравнение (5) не имеет решений. В этом случае может представлять интерес определение таких векторов х1 и х2, которые, являясь оптимальными с точки зрения невязки обоих частей уравнения, в то же время обеспечивают выполнение соответствующих неравенств Ах ^ Ь и Ах ^ Ь.
Опираясь на лемму 4, нетрудно понять, что такие векторы имеют вид
х1 = (Ь-А)-, х2 = Д(А, Ь)(Ь-А)-.
Заметим, что при Д(А, Ь) = 1 векторы х1 и х2 совпадают.
5.2. Общее решение уравнения. Сначала докажем вспомогательное утверждение. Предположим, что вектор Ь линейно зависит от некоторого подмножества столбцов матрицы А. Обозначим через I множество индексов таких столбцов. Введем матрицу О/ = diag(gl (I), ...,дп(1)), где д^(1) = 0, если г е I, и д^(1) = 1, если г £ I.
Предложение 4. Если Ь е врап(а*\г е I), то любой вектор х = (Ь-А © ьТО[)-, где V е X”, является решением уравнения (5).
Доказательство. Ясно, что условие Ь е врап(а*\г е I) равносильно равенству Ь = ф х*а*, которое выполняется, если выбрать х* = (Ь а*) для всех г е I.
Для всех г е I положим х* = (Ь-а*©V*)- ^ (Ь-а*)-, где V* е X. Заметим, что тогда
Ь ^ хга%.
Для вектора х = (х1,...,хп)Т выполняется Ь = х1а1 © ■■■ © хпап, откуда следует, что х является решением (5). Записывая все такие решения в векторной форме с использованием матрицы О1, приходим к требуемому результату. □
Рассмотрим множество I такое, что Ь е врап(а*\г е I) и Ь е врап(а*\г е I') для всех I' С I. Это означает, что набор индексов I определяет подмножество столбцов матрицы А, которое образует минимальную порождающую Ь систему векторов.
Обозначим через I множество всех таких наборов индексов. Очевидно, что I = 0 только тогда, когда уравнение имеет решение.
Для каждого I е1 так же, как раньше, определим диагональную матрицу О].
Теперь, опираясь на предложение 4, нетрудно проверить справедливость следующего утверждения.
Теорема 2. Пусть уравнение (5) разрешимо. Тогда его общим решением является семейство решений
хТ = (Ь-А © vTОт)-, V е X”, I е1. (7)
Рассмотрим частный случай, когда семейство решений сокращается до одного мно-
жества решений. Пусть столбцы матрицы А линейно независимы. Тогда существует только одно подмножество столбцов, которое образует минимальную систему для Ь, и одна матрица О. Общее решение принимает вид х = (Ь-А © vTО)-, V е X”.
Если указанное подмножество совпадает с множеством всех столбцов матрицы, то О = 0, а общее решение сводится к единственному решению х = (Ь-А)-.
5.3. Решение смешанной системы уравнений и неравенств. Рассмотрим систему относительно неизвестного вектора х е X”
Ах = Ь, (8)
Сх ^ й, (9)
где А и С - регулярные матрицы, а Ь и й - векторы подходящего размера.
Обозначим через I произвольный набор индексов, который определяет минимальную порождающую Ь систему столбцов матрицы А. Пусть I - множество всех таких наборов индексов. Определим множество I = {I е 1\ё-с* ^ Ь-а*,г е I} С I, где а* и с* - столбцы с индексом г матриц А и С соответственно.
Лемма 6. Система (8), (9) имеет решение тогда и только тогда, когда выполняются условия Д(А, Ь) = 1 и I = 0. При этом общим решением является семейство
хг =(Ь-А © й-С © vTО];)-, V е X”, I е1.
Доказательство. Ясно, что для разрешимости системы необходимо и достаточно существование решения х уравнения (8) такого, что х ^ (й-С)-.
Уравнение (8) имеет решение, если только Д(А, Ь) = 1. Общее решение уравнения принимает вид (7). Рассмотрим решение, которое отвечает произвольному набору индексов I е I. Таким решением является множество векторов х с координатами х* = (Ь-а*)-, если г е I, и х* = (Ь-а* © V*)- при всех V* е X, если г е I.
Среди векторов этого множества найдутся решения неравенства (9) только тогда, когда (Ь-а*)- ^ (й- с*)- для всех г е I. Отбирая только те наборы I, для которых это условие выполняется, получим множество И.
Осталось заметить, что каждому множеству I е I соответствует решение системы (8), (9) в виде множества векторов х с координатами х* = (Ь-а*)-, если г е I, и х* = (Ь-а* © й-с* © V*)- при всех V* е X, если г е I. □
5.4. Решение уравнения Ах © й = Ь. Рассмотрим задачу решения относительно х е X” уравнения
Ах © й = Ь, (10)
где А - регулярная матрица, а Ь и й - векторы подходящего размера.
Ниже будем предполагать, что й ^ Ь. Очевидно, что при нарушении этого условия уравнение решений не имеет.
Введем множества индексов Д = {г\с1* < Ь*} и ^ = {г\с1* = Ь*}.
Обозначим через А1 и А2 подматрицы, составленные из строк матрицы А с индексами из множеств Д и І2 соответственно. Аналогичным образом определим векторы Ь1, Ь2, й,1 и й,2, составленные из координат векторов Ь и й.
Нетрудно видеть, что тогда уравнение (10) равносильно системе
А1 х = Ь1 ,
А2х < й2.
Как и раньше, найдем множество Il всех наборов индексов I минимальных подмножеств столбцов матрицы А1 относительно Ь1, а также подмножество 1 наборов, которые определяют общие решения для уравнения и неравенства.
Лемма 7. Уравнение (10) имеет решение тогда и только тогда, когда выполняются условия Д(А1, Ь1) = 1 и 11 = 0. При этом общим решением является семейство
х] = (Ь-А © V'1' От )-, V е X”, I е I.
Доказательство. Применяя лемму 6, получим условия существования решения и общее решение в виде х] = (Ь-А1 © й- А2 © vTОI) , где V е X”, I е 1-1.
Осталось заметить, что й2 = Ь2, а потому Ь- А1 © й-А2 = Ь-А. □
На рис. 6 приведены примеры в КПах + взаимного расположения векторов Ь и й, при котором решение уравнения (10) существует.
Рис. 6. Существование решения уравнения Ах ® й = Ь в К5тах,+
Заметим, что решение уравнения (10) может существовать тогда, когда уравнение (5) его не имеет (см. пример справа на рис. 6).
Литература
1. Воробьев Н. Н. Экстремальная алгебра матриц // Докл. АН СССР. 1963. Т. 152, № 1. С. 24—27.
2. Воробьев Н. Н. Экстремальная алгебра положительных матриц // Elektronische Informationsverarbeitung und Kybernetik. 1967. Bd 3, N 1. S. 39-72.
3. Cuninghame-Green R. A. Minimax algebra. Berlin: Springer-Verlag, 1979. 258 p. (Lecture Notes in Economics and Mathematical Systems. Vol. 166)
4. Baccelli F., Cohen G., Olsder G. J., Quadrat J.-P. Synchronization and linearity: An algebra for discrete event systems. Chichester: Wiley, 1992. 514 p.
5. Маслов В. П., Колокольцов В. Н. Идемпотентный анализ и его применение в оптимальном управлении. М.: Физматлит, 1994. 144 с.
6. Литвинов Г. Л., Маслов В. П., Соболевский А. Н. Идемпотентная математика и интервальный анализ // Вычислительные технологии. 2001. Т. 6, № 6. С. 47-70.
7. Кривулин Н. К. Примеры построения моделей и решения задач на основе методов идемпотент-ной алгебры // Математические модели. Теория и приложения. Вып. 8: сб. науч. статей / под ред. М. К. Чиркова. СПб.: Золотое сечение, 2007. С. 158-183.
8. Zimmermann U. Linear and combinatorial optimization in ordered algebraic structures. Amsterdam: North-Holland, 1981. 390 p. (Annals of Discrete Mathematics. Vol. 10)
9. Cohen G., Moller P., Quadrat J.-P., Viot M. Algebraic tools for the performance evaluation of discrete event systems // Proc. of the IEEE. 1989. Vol. 77, N 1. P. 39-58.
10. Olsder G. J., Roos C. Cramer and Cayley-Hamilton in the Max algebra // Linear Algebra and Its Applications. 1988. Vol. 101. P. 87-108.
11. Кривулин Н. К. О решении линейных векторных уравнений в идемпотентной алгебре // Математические модели. Теория и приложения. Вып. 5: сб. науч. статей / под ред. М. К. Чиркова. СПб.: ВВМ, 2004. С. 105-113.
12. Кривулин Н. К. О решении обобщенных линейных векторных уравнений в идемпотентной
алгебре // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 2006. Вып. 1. С. 23-36.
Статья рекомендована к печати член.-кор. РАН, проф. Г. А. Леоновым.
Статья принята к печати 5 марта 2009 г.