Вычислительные технологии
Том 10, № 5, 2005
СТРОЕНИЕ ДОПУСТИМОГО МНОЖЕСТВА РЕШЕНИЙ ИНТЕРВАЛЬНОЙ ЛИНЕЙНОЙ СИСТЕМЫ*
И. А. ШАРАЯ
Институт вычислительных технологий СО РАН, Новосибирск, Россия
e-mail: [email protected] http://www.ict.nsc.ru/sharaya
We prove that the tolerable solution set of an interval linear system may be represented, on the one hand, as the intersection of a finite number of hyperstripes (where hyperstripe is a solution set of a two-sided inequality) and, on the other hand, as the sum of a linear subspace with a bounded convex polyhedron.
Введение
В работе мы будем использовать обозначения, предложенные в [1].
Напомним, что допустимым множеством решений для интервальной системы линейных алгебраических уравнений Ax = b (где A £ IRmxn обозначает интервальную матрицу размера m х n, b £ IRm — интервальный вектор длины m, x £ Rn — вещественный вектор длины n) называется (в соответствии с [2]) множество
£ = { x £ Rn | (VA £ A) (3 b £ b) (Ax = b) }. (1)
Такие множества возникают, например, в задачах математической экономики, технологического проектирования и автоматического управления, когда требуется решить линейную вещественную систему вида Ax = b, в которой коэффициенты матрицы известны неточно и требуется найти решения системы, удовлетворяющие для всех возможных значений матрицы заданным допускам на правую часть.
В 1985 году И. Рон показал [3], что x £ £ тогда и только тогда, когда x = x+ — x-, где x+, x- дают решение системы линейных неравенств
'Ax+ — Ax- < b,
—Ax+ + Ax- < —b, x+ > 0,
,x- > 0.
В этой системе вещественные матрицы A, A и векторы b, b являются гранями соответствующих интервальных объектов: A = [A, A], b = [b, b]. Как следствие доказанного им
* Работа выполнена в рамках Президентской программы поддержки ведущих научных школ РФ (грант № НШ-2314.2003.1)
© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2005.
результата И. Рон привел утверждение о том, что допустимое множество решений является выпуклым многогранным.
Другое доказательство этого утверждения о строении 5 предложили В.В. Шайдуров и С.П. Шарый в 1988 году в работе [4]. Их доказательство повторено в [5] и сводится к обоснованию выпуклости множества 5 интервальными методами и выписыванию системы линейных неравенств для пересечения 5 с каждым ортантом.
Еще одно доказательство того, что допустимое множество решений интервальной линейной системы является выпуклым многогранным можно найти во многих работах С.П. Шарого, начиная с 1989 года, например [6, 7]. Оно следует из описания 5 в виде множества уровня функционала, подграфик которого является выпуклым многогранным множеством.
Мы докажем два новых результата о строении допустимого множества решений. С геометрической точки зрения они эквивалентны. Кратко их можно сформулировать так:
1) 5 представимо в виде пересечения не более чем т • 2п гиперполос;
2) 5 представимо в виде суммы линейного подпространства {с £ Кп | Ас = 0} с выпуклым многогранником.
Новые результаты описывают допустимое множество решений более точно. С геометрической точки зрения они эквивалентны утверждению о том, что множество 5 не только является выпуклым многогранным, но и вместе с каждым лучом содержит дополнительный (т.е. луч с тем же началом, но противоположным направлением).
Уточнение геометрического строения множества 5 служит основанием для поиска новых способов решения вопросов, связанных с этим множеством. В данной статье мы применим новые результаты о строении 5 к исследованию допустимого множества решений на ограниченность и к оцениванию неограниченных допустимых множеств решений.
Статья имеет следующую структуру. В разд. 1 приведены термины и факты, которые будут использоваться в доказательствах. Подразделами они разбиты на две группы: 1.1 — интервальный анализ, 1.2 — линейная алгебра и выпуклый анализ. Раздел 2 посвящен результатам о строении допустимого множества решений. В его подразделах 2.1 и 2.2 изложены соответственно два новых результата, а в подразделе 2.3 они сравниваются между собой и с известным утверждением о том, что допустимое множество решений является выпуклым многогранным. Раздел 3 посвящен использованию новых результатов при проверке допустимого множества решений на ограниченность. А в разд. 4 намечены пути использования новых результатов о строении при оценивании допустимого множества решений.
1. Необходимые сведения
Назначение этого раздела — уточнить, как мы будем использовать обозначения и термины, которые в литературе толкуются неоднозначно (например, выпуклый многогранник), и перечислить основные факты, на которые будем опираться в доказательствах.
1.1. Интервальный анализ
Как принято в [1], мы используем для обозначения интервальных объектов жирный шрифт, чтобы отличать их в тексте от точечных (вещественных) объектов, из которых они состоят. Для интервала х = [х, х] вещественные числа х и х задают соответственно его нижнюю
Рис. 1. Интервальный вектор а = [а, а] в М3, его вершины, нижняя грань а = (ац, а2,аз) и верхняя грань а = (а\,а2,а3).
и верхнюю грани. При этом всегда х < х. Для интервальных векторов и матриц грани определяются покомпонентно, например, для интервальной матрицы А = {а^} нижней гранью А является матрица {а^ }.
Вершиной интервального вектора называется точечный вектор, компонентами которого являются грани соответствующих компонент интервального. В отличие от понятия грани, понятие вершины в интервальном анализе вполне согласуется с геометрическим образом интервального вектора (рис. 1).
При совпадении нижней и верхней граней интервального объекта будем говорить, что он вырожден, и отождествлять его с соответствующим точечным объектом. Квадратную точечную матрицу с нулевым определителем договоримся называть особенной. Квадратную интервальную матрицу будем называть особенной, если среди ее элементов есть особенная точечная матрица. Вырожденные интервальные объекты, будем обозначать жирным или обычным шрифтом в зависимости от того, что хотим подчеркнуть: их интервальное происхождение или вырожденность. Например, столбец А.з- (т. е. і-й столбец интервальной матрицы А) будем называть вырожденным и обозначать А.з-, если А.^ = А.з-.
Радиусом интервального вектора х будем называть вектор гаё(х) = х — х. Очевидно, что все компоненты радиуса неотрицательны и
(гаё(х) = 0) (х вырожден).
Умножение вещественного вектора на интервальную матрицу обладает следующими свойствами:
Ах = У Ах для А Є Жтхп, х Є Кп; (2)
АеЛ
п
гаё(Ах) = |хг| гаё(А:1) для А Є Жтхп, х Є Кп; (3)
1=1
А( Ах) = А (Ах) для А Є Жтхп, А Є К, х Є Кп; (4)
А(х + у) С Ах + Ау для А Є Жтхп, х, у Є Кп. (5)
Свойство (5) выражает субдистрибутивность умножения на интервальную матрицу, но иногда, например, если векторы х и у лежат в одном ортанте пространства Кп, можно раскрывать скобки по правилу дистрибутивности:
((Ч? = 1,...,п)(хіуз > 0)) ^ (А(х + у) = Ах + Ау). (6)
Поскольку
((УА Є А)(3Ь Є Ь)(Ах = Ь)) ^ ((УА Є А)(Ах Є Ь)) ^ ^ Ах С Ь ) (Ах С Ь),
\АеА /
имеет место следующая характеризация элементов допустимого множества решений:
(х е 5) (Ах С Ь). (7)
1.2. Линейная алгебра и выпуклый анализ
Конечное множество вещественных векторов {г7- | ] е </} называется линейно зависимым, если существуют такие числа с7- е М, что ^ г^-с7- = 0 и ^ |с^-1 > 0. Решение системы
линейных уравнений Ах = 0, где А е Мтхга, х е Мп, является линейным подпространством в Мп. Это подпространство называется ядром линейного оператора А. Столбцы матрицы А е Мтхп линейно зависимы тогда и только тогда, когда ядро линейного оператора А содержит ненулевые векторы.
Суммой множеств М1 + М2 в Мп называется множество всех сумм т1 + т2 векторов
т1 е М1, т2 е М2. Пустое множество считается ограниченным. Сумма двух множеств ограничена тогда и только тогда, когда каждое слагаемое ограничено или хоть одно из слагаемых пусто.
Линейное подпространство Ь' называется дополнительным к линейному подпространству Ь в Мп, если Ь + Ь' = Мп и Ь П Ь' = {0}. Для всякого множества М С Мп, инвариантного относительно сдвига на линейное подпространство Ь (т. е. при выполнении условия М = Ь + М), справедливо разложение М = Ь + (М П Ь'), где Ь' — линейное подпространство, дополнительное к Ь в Мп.
Выпуклым многогранным множеством в Мп будем называть множество решений конечной системы нестрогих линейных неравенств. Выпуклое многогранное множество может быть пустым, совпадать со всем пространством Мп или быть непустым пересечением конечного числа замкнутых полупространств. Всякое линейное подпространство в Мп является выпуклым многогранным множеством. Пересечение конечного числа выпуклых многогранных множеств является выпуклым многогранным множеством. Если объединение конечного числа выпуклых многогранных множеств выпукло, то оно является выпуклым многогранным множеством. Всякое неограниченное выпуклое многогранное множество содержит некоторый луч.
Выпуклым многогранником будем называть ограниченное выпуклое многогранное множество. Выпуклый многогранник — это выпуклая оболочка конечного числа точек или пустое множество. Выпуклый многогранник представим в виде пересечения конечного числа полупространств.
Выпуклым конусом будем называть непустое множество, замкнутое относительно взятия неотрицательных линейных комбинаций. Выпуклое многогранное множество представимо в виде суммы выпуклого конуса с выпуклым многогранником. Из принадлежности луча выпуклому многогранному множеству следует, что луч с таким же направлением принадлежит соответствующему выпуклому конусу.
Гиперполосой в Мп будем называть множество
{х е Мп | ах е Ь}, где ат е Мп, Ь е 1М
(т. е. множество решений нестрогого двойного линейного неравенства Ь < ах < Ь). Типичным геометрическим образом гиперполосы служит множество из двух параллельных гиперплоскостей и всех точек между ними. Пустое множество, гиперплоскость, само пространство Мп являются частными случаями гиперполос. Гиперполоса вместе с каждым
лучом содержит дополнительный, т.к.
^(ac = О) и (0 6 (b — ax)) j ,
$
^(а(—с) = О) и (О 6 (b — ax))j.
(8)
2. Строение допустимого множества решений
Теперь мы можем перейти к изложению новых результатов о строении допустимого множества решений.
2.1. Допустимое множество решений как пересечение конечного числа гиперполос
Договоримся множество всех вершин интервального вектора а 6 IRn обозначать через vert а:
vert а = {а 6 Rn | а 6 {a^ о}, i = 1,..., n}.
Очевидно, что это множество содержит не более чем 2n элементов:
| vert а| < 2n, для а 6 IRn, (9)
причем строгое неравенство соответствует интервальному вектору, у которого есть вырожденные компоненты.
Лемма 1. Пусть а 6 IRn, я 6 Rn, b 6 IR. Тогда
(Va 6 ат)(ая 6 b) (Va 6 vert ат)(ая 6 b), (10)
т. е. при линейном преобразовании пространства, соответствующем скалярному умножению на вещественный вектор я, образ интервального вектора а целиком лежит в
интервале b тогда и только тогда, когда в интервал b попадают образы всех вершин
интервального вектора а.
Доказательство. ^) очевидно.
^) Интервальный вектор а является выпуклой оболочкой своих вершин и при линейном преобразовании переходит в выпуклую оболочку образов вершин, а интервал b является выпуклым множеством и с каждым набором своих точек содержит их выпуклую оболочку. □
Теорема 1.
£= Р| P| {я 6 Rn | ax 6 bj}, (11)
i=1,...,m agvert Aj:
т. е. допустимое множество решений S представимо в виде пересечения гиперполос, число которых не превосходит ^’=1 | vert Ai: | и, тем более, не превосходит m ■ 2n.
^a(x + R+c) С bj ^R+ (ac) С (b — ax)j
^a(x + R+(—c)) С bj (R+(a(—c)) С (b — ax)j
Доказательство. Формулу (11) можно получить эквивалентными преобразованиями определения допустимого множества решений (1):
- = { X е | (УА е А)(3 Ь е Ь) (Ах = Ь) } =
= { х е Ега | (УА е А)(Ах е Ь) } =
= { х е | (Уг е {1,..., т})(Уа е А*:) (ах е Ь*)} =
(10)
{ я 6 Rn | (Vi 6 {1,..., m})(Va 6 vert Aj:) (ax 6 bj)}
Pi P {я 6 Rn | оя 6 bj}.
i=1,...,m agvert Aj:
Доказанная формула означает, что допустимое множество решений £ представимо в виде пересечения гиперполос, число которых равно m=1 | vert Aj:|. Оценка сверху на число
гиперполос следует из (9). □
Теорему 1 можно переформулировать так: допустимое множество решений совпадает с множеством решений системы двойных неравенств
bj < ая < bj, а 6 vert Aj:, i = 1, 2,..., m.
Из такой формулировки очевидно, что допустимое множество решений является выпуклым многогранным.
Утверждение, близкое к теореме 1, встречается во многих работах С.П. Шарого (например, лемма 1 из [7]). От упомянутого утверждения теорема 1 отличается тем, что в ней подчеркнут геометрический смысл и приведена точная оценка сверху на число гиперполос. Точность мы здесь понимаем так: для всякого n > 1 и всякого m найдутся интервальная матрица A 6 IRmxn и интервальный вектор b 6 IRm такие, что соответствующее допустимое множество решений не может быть описано как пересечение менее чем m ■ 2n гиперполос вида
ая 6 bj, а 6 vert Aj:, i = 1, 2,..., m.
(12)
Для доказательства точности оценки числа гиперполос достаточно привести Пример. Рассмотрим сферу единичного радиуса в Мга, центр которой совпадает с началом координат. При п > 1 из пересечения этой сферы с внутренней областью положительного ортанта можно выбрать т различных точек
afc = (afcb afc2, . . . , akn), k = V Для интервальной линейной системы с
, m.
A
( [—a11, a11] [—a12, a12]
[—a21, a21] [—a22,a22]
[—a1n,a1n] ^
[—a2n a2n]
\ [—am1,am1] [— am2,am2] ... [— a
и
]
f [—1,6] [—1,6]
V [—1,6])
где 6 > 1,
допустимое множество представляет собой выпуклый многогранник с т-2га гранями. Различные грани этого многогранника описываются разными гиперполосами вида (12).
Заметим, что, формулируя утверждение о точности оценки числа гиперполос, мы исключили случай п =1. Легко понять, что при п =1 для всякого т допустимое множество решений можно описать не более чем двумя гиперполосами вида (12).
b
2.2. Допустимое множество решений как сумма линейного подпространства с выпуклым многогранником
В этом подразделе мы приведем еще один новый результат о строении допустимого множества решений интервальной линейной системы. Обозначим через 3 множество номеров всех вырожденных столбцов матрицы А, а через — линейное подпространство в Кга, натянутое на оси с индексами ] е 3. При 3 = 0 будем считать, что = {0}.
Лемма 2. Для с е имеет место эквивалентность
ск = 0 при к е 3,
АС = 0 ^ ( Е А:,С, = 0.
Доказательство.
^) очевидно.
^) Если вектор Ас нулевой, то радиус его равен нулевому вектору и в силу (3)
П
]>>1 га^(А:г) = 0. (13)
1=1
Равенство (13) возможно только при условии, что все векторные слагаемые в левой части нулевые. Если к е 3, то га^А:к.) = 0, и потому с^ должно быть нулем.
Исключая из равенства Ас = 0 нулевые слагаемые А:^с^ с индексами к е 3, получаем
Е А:,с, = 0. □
Лемма 3. Существование ненулевого вектора с, для которого Ас = 0, эквивалентно наличию в интервальной матрице А линейно зависимых вырожденных столбцов.
Доказательство следует из леммы 2 и определения конечного множества линейно зависимых вещественных векторов. □
Лемма 4. Множество Ь = {с е | Ас = 0} является линейным подпространством в пространстве .
Доказательство следует из леммы 2 и того факта, что решение системы линейных уравнений в с нулевой правой частью является линейным подпространством в . □ Теорема 2. Допустимое множество решений - представимо в виде суммы
5 = Ь + V,
где Ь = {с е | Ас =0} — линейное подпространство, V — выпуклый многогранник (из дополнительного к Ь линейного подпространства).
Доказательство. Для произвольных векторов х е и с е Ь, привлекая свойство (5) субдистрибутивности умножения вещественных векторов на интервальную матрицу и описание Ь, имеем А(ж + с) С Ах + Ас = Ах. Из полученного включения А (ж + с) С Ах и характеризации (7) элементов допустимого множества решений вытекает, что (х е 5) ^ (х + с е 5). Эта импликация означает, что - + Ь С 5. Обратное включение
- С 5 + Ь справедливо, так как 0 е Ь. Значит, 5 = Ь + 5.
По лемме 4 множество Ь является линейным подпространством в и, следовательно, в объемлющем пространстве Кга. Обозначим через Ь' какое-нибудь линейное подпространство, дополнительное к Ь в Кга. Тогда 5 = Ь + (5 П Ь;). Обозначим множество 5 П Ь'
через V. Так как 5 и Ь' являются выпуклыми многогранными множествами, их пересечение V тоже выпуклое многогранное множество. Для завершения доказательства остается показать, что V ограничено.
Предположим, что V неограничено, тогда оно содержит некоторый луч. Обозначим через с его направление. Пересечение этого луча с ортантом, содержащим вектор с, снова является лучом из V = 5 П Ь' с тем же направлением с, но с новым началом. Обозначим начало нового луча через х. С одной стороны, луч (х + К+с) лежит во множестве 5 и, по характеризации (7) элементов допустимого множества решений, А(х + К+с) С Ь. С другой стороны, начало х и направление с этого луча лежат в одном ортанте, и потому в произведении А(х + К+с) можно раскрыть скобки по правилу дистрибутивности (6). Выходит, что Ах + А(К+с) С Ь. Вынося число за скобки в соответствии с (4), получим Ах + К+(Ас) С Ь. Отсюда Ас = 0. Значит, с е Ь. Но это противоречит выбору луча (х + К+с) из множества, лежащего в дополнении к Ь. Мы показали, что предположение о неограниченности множества V приводит к противоречию, значит, V ограничено. □
Другое доказательство теоремы 2 приведено в [5].
2.3. Сравнение результатов о строении
Давайте обсудим, как результаты о строении допустимого множества решений связаны между собой. Связь между геометрическим смыслом этих результатов дает
Теорема 3. Следующие утверждения эквивалентны для множества в
1) является выпуклым многогранным и с каждым лучом содержит дополнительный;
2) представимо в виде суммы линейного подпространства с выпуклым многогранником;
2') представимо в виде суммы линейного подпространства с выпуклым многогранником из дополнительного линейного подпространства;
3) представимо в виде пересечения конечного числа гиперполос.
Доказательство.
1^2. Из выпуклого анализа известно, что выпуклое многогранное множество представимо в виде суммы выпуклого конуса с выпуклым многогранником. Из принадлежности луча выпуклому многогранному множеству следует, что луч с таким же направлением принадлежит соответствующему выпуклому конусу. Выпуклый конус, который с каждым направлением содержит противоположное, является линейным подпространством.
2^2'. Пусть множество Б представимо в виде суммы какого-то линейного подпространства Ь и выпуклого многогранника V, тогда для всякого линейного подпространства Ь', дополнительного к Ь, справедливо представление Б = Ь + V', где V' — выпуклый многогранник, полученный проектированием V на Ь' параллельно Ь.
2'^3. Пусть
Б = Ь + V', (14)
где V' — выпуклый многогранник из линейного подпространства Ь', дополнительного к линейному подпространству Ь. В пространстве Ь' многогранник V' представляет собой ограниченное пересечение конечного числа полупространств. В этом пересечении каждое полупространство можно заменить гиперполосой, ширина которой больше диаметра многогранника V'. Такая замена дает представление V' в виде пересечения конечного числа гиперполос в Ь'. Подставляя это представление в (14) и внося суммирование под знак пересечения, получим представление множества Б в виде пересечения конечного числа гиперполос в Кп.
3^1. Пересечение конечного числа гиперполос — это множество решений системы нестрогих двойных линейных неравенств, поэтому оно является выпуклым многогранным множеством.
Любое пересечение гиперполос вместе с каждым лучом содержит дополнительный, поскольку это свойство в силу (8) верно для каждой гиперполосы. □
Следствие 1. Новые теоремы о строении допустимого множества решений с геометрической точки зрения эквивалентны.
Их различие лежит вне геометрии и заключается в том, что теорема 1 дает формулы гиперполос и ограничение на их число, а теорема 2 дает описание линейного подпространства Ь.
Следствие 2. Новые теоремы о строении допустимого множества решений с геометрической точки зрения сильнее утверждения о том, что допустимое множество решений является выпуклым многогранным.
В сравнении со старым фактом о строении новые утверждения исключают из возможных форм допустимого множества решений те и только те выпуклые многогранные множества, которые содержат некоторый луч, но не содержат ему дополнительного. Чтобы полно и наглядно представить себе исключенные множества, упорядочим их в зависимости от минимальной размерности грани, в которой есть такой луч. Получим выпуклые многогранные множества, у которых среди одномерных граней есть луч или среди двумерных граней есть полуплоскость, и т. д. до множеств, которые являются полупространствами в Кп. На рис. 2 приведены примеры таких множеств в К3 (луч, двумерный угол меньше развернутого и его усеченный вариант, многогранный угол и усеченный многогранный угол, двугранный угол и усеченный двугранный угол, полуплоскость и полупространство).
Интересно представить, какие же формы допустимого множества разрешены новыми теоремами о строении. Их можно перечислить, воспользовавшись теоремой 2 и перебрав все возможные сочетания размерностей линейного подпространства Ь и непустого выпуклого многогранника V из дополнительного к Ь линейного подпространства, а также случай, когда выпуклый многогранник является пустым множеством. Например, для К3 набор возможных форм допустимого множества решений представлен на рис. 3. В него
Обозначения:
• — вершины, — ребра,
внутренние
точки
граничные
точки
Рис. 2. Примеры выпуклых многогранных множеств в М3, которые непредставимы в виде суммы линейного подпространства с выпуклым многогранником. По теореме 2 допустимые множества решений не могут иметь такую форму.
Обозначения:
вершины,
граничные
точки
внутренние
точки
— ребра,
Рис. 3. Примеры выпуклых многогранных множеств в К3, представимых в виде суммы линейного подпространства с выпуклым многогранником.
— пустое множество 0 (получается как сумма любого линейного подпространства с пустым множеством);
— выпуклые многогранники размерности от 0 до 3, т. е. точка, отрезок, плоский и объемный многогранники (соответствуют сумме нулевого линейного подпространства Ь={0} с самим многогранником);
— прямая линия, плоская полоса и бесконечная многогранная призма (могут быть получены как сумма одномерного линейного подпространства с точкой, отрезком и двумерным многогранником соответственно);
— плоскость и типичная гиперполоса (разлагаются в сумму двумерного линейного подпространства соответственно с точкой и отрезком);
— пространство К3 (представляется суммой самого себя с точкой).
3. Проверка допустимого множества решений на ограниченность
Теорема 2 позволяет связать ограниченность самого множества 2 с ограниченностью его слагаемых Ь и V, ведь сумма множеств ограничена тогда и только тогда, когда каждое слагаемое ограничено или хоть одно из слагаемых пусто. Поскольку Ь всегда не пусто и (Ь ограничено) ^ (Ь = {0}), а выпуклый многогранник V всегда ограничен, получаем
По лемме 3 условие Ь = {0} эквивалентно наличию в матрице А линейно зависимых вырожденных столбцов. Используя эту эквивалентность в (15) и (16) и учитывая, что пустота множества 2 равносильна пустоте V, получаем связь между задачей исследования
входят:
(2 ограничено) ^ ((Ь = {0}) или (V пусто)). Логическое отрицание формулы (15) имеет вид
(2 неограничено) ^ ((Ь = {0}) и (V непусто)).
(15)
(16)
Есть в матрице А линейно зависимые вырожденные столбцы?
Ограничено ли допустимое множество решений?
Рис. 4. Схема связи двух задач.
допустимого множества решений на (не)ограниченность и задачей о проверке конечного множества вещественных векторов на линейную зависимость. Схема связи этих задач показана на рис. 4. Из нее следуют такие утверждения:
Утверждение 1. Если в матрице А нет линейно зависимых вырожденных столбцов, то допустимое множество решений ограничено.
Утверждение 2. Если в матрице А есть линейно зависимые вырожденные столбцы, то допустимое множество решений неограничено или пусто.
Утверждение 3. Если допустимое множество решений неограничено, то в матрице А есть линейно зависимые вырожденные столбцы.
Утверждение 4. Пусть допустимое множество решений непусто. Тогда ограниченность допустимого множества решений эквивалентна отсутствию в матрице А линейно зависимых вырожденных столбцов (а неограниченность — наличию таких столбцов). (Другое доказательство утверждения 4 приведено в [5, 8].)
Заметим, что утверждение 4, представляющее собой критерий (не)ограниченности непустого допустимого множества решений, опирается на знание о непустоте этого множества, а исследование допустимого множества решений на непустоту является довольно сложной задачей. Подробно о ней можно прочитать в [7].
На практике могут быть полезны утвержения 1 и 2. Некоторые достаточные условия ограниченности и неограниченности допустимого множества решений, вытекающие из этих утверждений, приведены в таблице.
Заметим, что множество интервальных матриц с линейно зависимыми вырожденными столбцами нигде не плотно (т. е. замыкание этого множества не имеет внутренних точек), поэтому допустимые множества решений почти всегда ограничены.
Интервальная матрица А
Не имеет вырожденных компонент
Имеет невырожденную компоненту в каждом столбце* Квадратная не особенная
Вырожденная (т. е. точечная) с нулевым ядром Содержит точечную матрицу ранга п**
Вырожденная (т. е. точечная) ранга меньше п***
Имеет нулевые столбцы***
Имеет пропорциональные вырожденные столбцы Имеет больше т вырожденных столбцов
Ограничено
Ограничено
Ограничено
Ограничено
Ограничено
Не ограничено или пусто Не ограничено или пусто Не ограничено или пусто Не ограничено или пусто
4. Оценивание допустимого множества решений
Из новых результатов о строении допустимого множества решений интервальной линейной системы, представленных в разд. 2, сделаем несколько выводов, которые могут помочь при оценивании этого множества решений.
4.1. Оценивание неограниченного
допустимого множества решений
Рассмотрим оценивание допустимого множества решений интервальными векторами. Описание соответствующих методов для оптимального внешнего оценивания можно найти в [9], а для максимального внутреннего — в [2, 7]. Поскольку интервальные векторы являются ограниченными множествами, оценки, полученные этими методами, хорошо подходят для ограниченных допустимых множеств решений (рис. 5, а), а для неограниченных множеств 2 возникают следующие трудности: внешней оценки не существует (рис. 5, б,в), не всегда можно построить максимальную внутреннюю оценку (рис. 5, б), всякая внутренняя оценка бесконечно мала по сравнению с оцениваемым множеством (рис. 5, б,в). Эти трудности останутся, если вместо интервальных векторов мы будем использовать ограниченные оценки любой формы (шары, эллипсоиды, зонотопы и т.п.). Как же адекватно оценить неограниченное допустимое множество решений?
Общая рекомендация такова:
Вывод 1 (из теорем 1-3). Алгоритмы оценивания допустимого множества решений, в ограниченности которого мы не уверены, надо ориентировать на выпуклые многогранные множества, которые удовлетворяют какому-то из следующих эквивалентных условий:
— вместе с каждым лучом содержат дополнительный;
— представимы в виде суммы линейного подпространства с выпуклым многогранником;
— являются пересечением конечного числа гиперполос
Более конкретную рекомендацию дает
Вывод 2 (из теоремы 2). Подходящей оценкой для допустимого множества решений, которое может оказаться неограниченным, является сумма линейного подпростран-
/р ц ГП оцениваемое ^ внешняя ^ внутренняя
— оцениваемого ■ — ^ ^
1—1 множество, 1—1 оценка, 1—1 оценка
множества, ’ ^ ^
Рис. 5. Интервальное оценивание выпуклого многогранного множества.
ства Ь = {с € | Ас = 0} с оценкой выпуклого многогранника V = 2 П Ь из произволь-
ного линейного подпространства Ь, дополнительного к Ь.
Лемма 2 и существование методов оценивания ограниченного допустимого множества решений делают эту рекомендацию конструктивной и позволяют предложить для ее реализации такой алгоритм:
1. Воспользовавшись леммой 2, найдем подпространство Ь = {с € | Ас = 0} методами линейной алгебры (через отыскание ядра матрицы А/, составленной из вырожденных столбцов интервальной матрицы А).
2. Зафиксируем какое-нибудь линейное подпространство Ь, дополнительное к Ь в Кп. Так как V = 2 П Ь, описание многогранника V получается из описания допустимого множества (1) с помощью замены переменных, соответствующей переходу в подпространство Ь .
3. Поскольку множество V ограничено и описывается как допустимое, найдем его оценку Р методом оценивания ограниченного допустимого множества решений.
4. Оценку исходного допустимого множества решений 2 дадим в виде Ь + Р.
Приведем несколько простых примеров использования предложенного алгоритма оценивания допустимого множества решений. Подчеркнем, что на его входе нам не важны такие свойства 2, как ограниченность или непустота. Примеры продемонстрируют, что независимо от этих свойств алгоритм дает подходящую оценку. Для наглядности возьмем задачи размерности п < 3. А для удобства вычислений в качестве ограниченных оценок будем применять интервальные векторы.
Пример 1. (2 неограничено.)
А
/-2 1 1 \
1 1 -2
1 0 -1
-1 2 -1
Л-8, 4Л
[ 4,13]
[ 1, 7] \[-1Д9]/
Методами линейной алгебры получаем Ь = {(1,1,1)т£ | £ € К} (рис. 6). Возьмем V = {(ж1,Ж2,Жз)т € К3 | х3 = 0}. Многогранник V в Ь' описывается как допустимое множество решений интервальной линейной системы с новой матрицей (А:1 А:2) и неизменной правой частью Ь. В терминах характеризации (7) многогранник V состоит из элементов х, удовлетворяющих интервальному включению
/-2 1\
11
10
-1 2
с
Л-8, 4]\ [ 4,13]
[ 1, 7] М-1.19]/
(17)
Рис. 6. Линейное подпространство Ь.
Ь
и легко строится графически (рис. 7). Его вершины: (1,3), (1,6), (3,10), (7,6), (5,2), (3,1). Не прибегая к конкретным методам оценивания, выберем оценки для V на основе анализа
Рис. 7. Многогранник V в L'.
Рис. 8. Оценивание многогранника V в L.
Рис. 9. Допустимое множество решений S = L + V примера 1, одна из его максимальных внутренних оценок L + Pin и оптимальная внешняя оценка L + Pout.
графика (рис. 8): Р;п = [2, 5] х [2, 8], Рс^ = [1, 7] х [1,10]. В качестве оценки допустимого множества решений 2 предъявим сумму линейного подпространства Ь с оценкой многогранника V. Сравнение допустимого множества решений с предъявленными оценками приведено на рис. 9, где показаны их срезы по от 0 до 10.
Понятно, что Ь совпадает с осью абсцисс, т. е. Ь = {(ж1;ж2) | х2 = 0}. В дополнительном линейном подпространстве Ь' = {(ж1;ж2) | х = 0} многогранник V описывается интервальным включением
Из первой строки х2 € [0,1/2], из второй х2 = 1, и решением включения (18) будет множество [0,1/2] П{1} = 0. Мы получили V = 0. Значит, оптимальная внешняя интервальная оценка множества V и всякая его внутренняя оценка тоже являются пустыми множествами, т. е. Р = 0. В качестве оценки допустимого множества решений мы предъявляем множество Ь + Р = Ь + 0 = 0. Так как 2 = Ь + V = Ь + 0 = 0, предъявленная оценка совпадает с оцениваемым множеством.
Пример 3. (2 ограничено и не является пустым.)
В матрице А один вырожденный столбец, он ненулевой, следовательно, Ь = {0}. Единственное дополнительное подпространство Ь совпадает с исходным пространством К2, и многогранник V описывается исходной системой (19). Оценка {0} + Р, соответствующая предложенному способу оценивания, совпадает с оценкой Р многогранника V. Это согласуется с тем, что при Ь = {0} допустимое множество решений 2 = {0} + V совпадает с многогранником V.
Рассматриваемый пример демонстрирует, что предложенный алгоритм оценивания работает и при Ь = {0}, хотя в этом случае можно просто заметить, что 2 = V, и применить к 2 методы оценивания ограниченного допустимого множества решений.
Для системы (19) на рис. 10 с помощью теоремы 1 построено множество 2 = V и по графику выбраны одна из максимальных внутренних оценок [-0.5, 0.5] х [-0.5, 0.5] и оптимальная внешняя оценка [-1,1] х [-1,1].
Пример 2. (2 = 0.)
(18)
(19)
Х2
-1
Хі
допустимое множество решений 2 = {0} + V = V
одна из максимальных внутренних оценок
оптимальная внешняя оценка
-1
Рис. 10. Допустимое множество решений 2 = {0} + V для примера 3 и его оценки.
4.2. Сведение к частному случаю
Покажем, что для поиска и оценивания допустимого множества решений можно попытаться применить методы, разработанные не для самого множества 2, а для множества, которое проще по описанию. Основанием для такого перехода к “упрощенной” задаче является
Вывод 3 (из теоремы 1). Задача об отыскании допустимого множества решений и задача о нахождении пересечения конечного числа гиперполос эквивалентны, и множества решений этих задач можно оценивать одинаковыми методами.
Под задачей о нахождении пересечения конечного числа гиперполос мы понимаем задачу, множество решений которой можно описать формулой
Б = {х € | Ь < Ах < Ь} (20)
с вещественной матрицей А € Ктхп и вещественными векторами Ь,Ь € Кт.
Перепишем (20) в виде, близком к определению допустимого множества решений (1):
Б = {х € | (3 Ь € Ь) (Ах = Ь) }. (21)
Из сравнения (1) и (21) видно, что задачу о нахождении пересечения конечного числа гиперполос можно рассматривать как частный случай задачи о нахождении допустимого множества решений, соответствующий отсутствию интервальной неопределенности в коэффициентах матрицы. Поэтому задача о нахождении пересечения конечного числа гиперполос обычно считается проще. Она чаще возникает в приложениях и лучше изучена.
Например, в теории идентификации линейных объектов эта задача имеет вид: найти все состояния х € Кп, которые удовлетворяют условиям
У = Ах + е, |вг| < £г, г = 1,..., т,
где А € Ктхп — известная вещественная матрица, у € — известный вектор результатов
измерений, е € — неизвестный вектор помех в измерениях, для которого известны
ограничения сверху е € на абсолютные величины помех.
Итак, задачу о нахождении пересечения конечного числа гиперполос можно рассматривать как частный случай задачи о нахождении допустимого множества решений. Но из теоремы 1 следует, что задача об отыскании допустимого множества решений сводится к задаче о нахождении пересечения конечного числа гиперполос (правда, число строк матрицы при этом может увеличиться в 2П раз). Значит, теоретически обе задачи эквиваленты, и для нахождения или оценивания множеств их решений можно использовать одинаковые методы.
Заключение
Основными теоретическими результатами данной работы являются теоремы 1 и 2 о строении допустимого множества решений интервальной системы линейных алгебраических уравнений. Прежде было известно, что допустимое множество решений является выпуклым многогранным множеством. Теоремы одинаково сужают набор возможных форм допустимого множества решений, только по-разному описывают его: по теореме 1 этот набор состоит из пересечений конечного числа гиперполос, а по теореме 2 — из множеств, разложимых в сумму линейного подпространства с выпуклым многогранником.
В разд. 3 с помощью теоремы 2 и леммы 3 установлена и полностью проанализирована связь между ограниченностью допустимого множества решений и наличием в интервальной матрице A линейно зависимых вырожденных столбцов.
В разд. 4 намечены пути использования новых результатов о строении при оценивании допустимого множества решений. На основании теоремы 2, леммы 2 и методов оценивания ограниченного допустимого множества решений предложен способ адекватного оценивания допустимого множества решений, которое может оказаться неограниченным. А в под-разд. 4.2 показано, что задача о допустимом множестве решений сводится к аналогичной задаче с вещественной матрицей большей размерности.
Список литературы
[1] Kearfott R.B., Nakao M.T., Neumaier A. et al. Standardized notation in interval analysis (http://www.mat.univie.ac.at/~neum/software/int)
[2] Шарьш С.П. Алгебраический подход к анализу линейных статических систем с интервальной неопределенностью // Изв. РАН. Теория и системы управления. 1997. № 3. С. 51-61. (http://www.ict.nsc.ru/shary/Papers/IzvAN.ps)
[3] Rohn J. Inner solutions of linear interval systems // Interval Mathematics 1985. N.Y.: Springer Verlag, 1986. P. 157-158. (Lecture Notes in Computer Science. Vol. 212.)
[4] ШаЙДУРОВ В.В., Шарый С.П. Решение интервальной алгебраической задачи о допусках // Красноярск, 1988 (Препр. АН СССР. Сиб. отд-ние. Вычисл. центр. № 5).
[5] Sharaya I.A. On unbounded tolerable solution sets // Reliable Computing. 2005. Vol. 11, N 5. P. 425-432. (http://www.ict.nsc.ru/sharaya/Papers/rc05.ps)
[6] ШарыЙ С.П. О некоторых методах решения линейной задачи о допусках // Красноярск, 1989 (Препр. АН СССР. Сиб. отд-ние. Вычисл. центр. № 6).
[7] Шарый С.П. Решение интервальной линейной задачи о допусках // Автоматика и телемеханика. 2004. № 10. С. 147-162. (http://www.ict.nsc.ru/shary/Papers/AiT.ps)
[8] Шарая И.А. Ограничено ли допустимое множество решений интервальной системы? // Вычисл. технологии. 2004. Т. 9, № 3. C. 108-112.
(http://www.ict.nsc.ru/sharaya/Papers/ct04.ps)
[9] Шарый С.П. Внешнее оценивание обобщенных множеств решений интервальных линейных систем // Вычисл. технологии. 1999. Т. 4, № 4. C. 82-110.
(http://www.ict.nsc.ru/shary/Papers/Outer.ps)
Поступила в редакцию 8 апреля 2005 г., в переработанном виде — 8 августа 2005 г.