вычислительные технологии
ТОМ 3, № 2, 1990
АЛГЕБРАИЧЕСКИЙ ПОДХОД ВО "ВНЕШНЕЙ ЗАДАЧЕ" ДЛЯ ИНТЕРВАЛЬНЫХ ЛИНЕЙНЫХ
СИСТЕМ *
Институт вычислительных технологий СО РАН Новосибирск, Россия e-mail: shary@ict.nsc.ru
The subject of our work is the classical "outer" problem for the interval linear algebraic system Ax = b with the interval n x n-matrix A and interval right-hand side n-vector b: find "outer" component-wise estimates of the solution set £ = {x £ Rra | (3A £ A) (3b £ b)(Ax = b) } formed by all solutions to the point systems Ax = b with A £ A and b £ b, that is, evaluate min{ xk | x £ £ } from below and max{ xk | x £ £ } from above, k = 1, 2,...,n. The purpose of this work is to advance a new algebraic approach to the problem, in which it reduces to computing the algebraic .solution to an auxiliary system in Kaucher complete interval arithmetic, or, what is equivalent, to solving one noninterval (point) equation in the Euclidean space of the double dimension M2ra. We construct a specialized algorithm — subdifferential Newton method — that implements the new approach, present results of numerical testing that demonstrate its exclusive computational efficacy with high quality enclosures of the solution set.
С.П. ШАРЫй
Содержание
1. Введение
68
2. Основы алгебраического подхода
71
3. Полная интервальная арифметика Каухера
3.1. Неформальное обсуждение ...................
3.2. Описание полной интервальной арифметики.
74 74 76
4. Погружение в линейное пространство
4.1. Зачем погружать? ......................
4.2. Определение и основные свойства .....
4.3. Стандартное погружение ..............
4.4. Сопутствующие матрицы ..............
4.5. Вполне невырожденные матрицы......
80 80 81 85 87
88
5. Исследование индуцированного уравнения ......
5.1. Порядковая выпуклость и субдифференцируемость
90
91
* Статья публикуется в авторской редакции. ©С.П. Шарый, 1998.
5.2. Полиэдральность..........................................................................................................................93
5.3. Оценка субдифференциала ....................................................................................................95
6. Субдифференциальный метод Ньютона ......................................................................97
6.1. Алгоритм ........................................................................................................................................97
6.2. Доказательство сходимости ....................................................................................................97
6.3. Вычисление субдифференциала ..........................................................................................100
7. Модификации алгебраического подхода ....................................................................104
8. Вычислительные эксперименты ..........................................................................................107
Литература ................................................................................................................................................112
1. Введение
Основным объектом изучения в нашей работе является интервальная система линейных алгебраических уравнений (ИСЛАУ)
Ax = b (1)
с интервальной n х n-матрицей A и интервальным n-вектором правой части b. Интервальную систему (1) мы мыслим как совокупность всех точечных n х n-систем
Ax = b (2)
с A Е A и b Е b, или, что равносильно, как результат независимого варьирования элементов матрицы и правой части точечной системы (2) в пределах некоторых заданных интервалов, из которых и образованы A и b.
Одной из классических постановок задач для интервальной линейной системы уравнений вида (1) является задача об оценивании покоординатного разброса решений точечных систем с коэффициентами из интервалов A и b. Именно:
НаИти (быстро и, по возможности, более точно) "внешние" покоординатные оценки множества решении
E = { x Е Rra | (ЗА е A)(3b е b)(Ax = b) }, (3)
образованного всеми решениями точечных систем Ax = b с А Е A и b Е b, или, иначе, оценить min{ xk | x Е E } снизу и max{ xk | x Е E } сверху для k = 1, 2,...,n.
Фактически, эта задача требует отыскания некоторого гипербруса (прямоугольного параллелотопа со сторонами, параллельными координатным осям), содержащего множество решений. Гипербрусы являются геометрическими образами интервальных векторов, и, соответственно, мы будем называть внешней интервальной оценкой для множества решений некоторый гипербрус, содержащий (объемлющий) это множество решений.1 Таким образом, рассматриваемую задачу удобно формулировать в следующем, чисто интервальном, виде:
НаИти (быстро и, по возможности, более точно) внешнюю интервальную (^ оценку для множества решении интервальнои линеинои системы.
Существуют и внутренние интервальные оценки — с помощью подмножеств.
Задача (4) — это, по существу, интервальная форма хорошо известной задачи о параметрической чувствительности для линейной системы, когда и вариации параметров и оценки вариаций решения рассматриваются в виде интервалов. Она является одной из старейших и практически наиболее важных задач интервального анализа, а различным аспектам её решения с начала 60-х годов и по настоящее время посвящены несколько монографий и сотни статей. Обширную, но далеко не исчерпывающую, информацию о ней вместе с библиографией работ читатель может найти в [2, 5, 6, 22, 26, 32, 34, 37]. Мы будем называть задачу (4) внешней задачей для интервальной линейной системы (1), чтобы отличать ее от других возможных постановок задач для интервальных систем уравнений (рассмотренных, например, в [38-40, 43]).
Рис. 1. "Внешняя задача" — это задача внешнего интервального оценивания множества решений, т. е. задача об оценке параметрической чувствительности системы в интервальной постановке.
Среди наиболее важных теоретических результатов, касающихся этой задачи, следует упомянуть недавние открытия по вычислительной сложности решения (4) и некоторых родственных ей задач (см. [11, 27] и обширную библиографию к этим работам). Оказывается, что даже задача распознавания того, пусто или непусто множество решений Е, в общем случае NP-трудна (труднорешаема). Далее, вычисление внешних покоординатных оценок для множества решений Е с любой заданной абсолютной или относительной точностью также есть NP-трудная задача как в общем случае, так и во многих практически важных частных ситуациях.
Множество решений Е, определяемое формальной записью (3), а также аналогичные множества решений более общих интервальных систем уравнений, образованные всеми решениями точечных систем той же структуры с коэффициентами из соответствующих интервалов, иногда называют также объединёнными множествами решений [5, 11, 26, 37-3У, 43] и обозначают Е33. Этот расширенный термин не является излишеством, поскольку для интервальных систем уравнений множество решений может быть определено, вообще говоря, большим количеством различных способов. Как для линейных, так и для нелинейных интервальных систем уравнений существуют, к примеру, множества решений Е^, Egv, Еaß и ещё большое количество других. Подобные обобщённые множества решений
для (1) возникают совершенно естественно и имеют интересные и важные приложения в автоматическом управлении, исследовании операций и теории принятия решений (см. [39-42]. В этой работе мы не будем рассматривать их, и потому всюду ниже, имея в виду множество (3) и ему аналогичные, для краткости говорим просто о множестве решений вместо более корректного полного термина "объединенное множество решений".2
За прошедшие три с лишним десятилетия предложено немало хороших алгоритмов для решения задачи (4), так что естественно было бы ожидать угасания теоретического интереса к ней и поворота исследователей к тщательной практической реализации и доводке уже предложенных вычислительных схем. Тем не менее в нашей работе мы собираемся представить свежий взгляд на предмет: для решения "внешней задачи" мы развиваем новый подход вместе с реализующим его численным алгоритмом, отличительными особенностями которых являются
— высокая вычислительная эффективность,
— универсальность — как общая теоретическая схема подхода, так и основной численный алгоритм с равным успехом применимы к задачам внутреннего и внешнего интервального оценивания и множества решений (3) и других, обобщенных, множеств решений для интервальной системы (1).
Предлагаемый нами новый подход к задаче (4) является дальнейшим развитием так называемого алгебраического подхода, при котором исходная постановка сводится к задаче нахождения алгебраического решения некоторой вспомогательной системы в полной интервальной арифметике Каухера, что в конечном итоге равносильно обычной задаче решения одной точечной (неинтервальной) системы уравнений в евклидовом пространстве двойной размерности Ж2п. Алгебраический подход зарекомендовал себя как эффективный инструмент для решения задач внутреннего интервального оценивания различных множеств решений интервальных алгебраических уравнений [38-41, 29]. Настало время распространить его и на "внешние задачи".
Мы конструируем специализированный алгоритм (субдифференциальный метод Ньютона), реализующий новый подход, представляем результаты численных экспериментов с ним. Они показывают, что развиваемая нами вычислительная методика совмещает исключительную вычислительную эффективность с хорошим качеством оценивания множества решений, оказываясь достойным конкурентом таким широко распространённым алгоритмам решения внешней задачи, как интервальный метод Гаусса и процедура Хансена—Рона.
Всюду в этой работе мы предполагаем знакомство читателя с основными фактами интервального анализа; для введения в предмет мы рекомендуем, например, книги [2, 5, 6, 22, 26, 32]. Наши обозначения следуют, главным образом, тем неофициальным международным рекомендациям, которые были недавно выработаны в результате дискуссии среди специалистов по интервальному анализу и резюмированы в [26]. Именно, интервалы и интервальные объекты (векторы, матрицы) мы обозначаем жирным шрифтом (например, A, B, ^ ..., x, у, z), тогда как неинтервальные (точечные) величины никак специально не выделяются. Подчеркивание и надчеркивание интервальных объектов означает соответственно взятие нижнего и верхнего концов интервала. Арифметические операции с интервальными величинами — это операции соответствующих интервальных арифметик:
2Из сказанного следует, что употребляемый нами термин "внешняя задача" не полностью характеризует постановку (4): он указывает лишь способ оценивания, но не уточняет, чего именно, какого множества решений. В идеале следовало бы говорить о"внешней задаче для объединённого множества решений" и т. п., но мы не делаем этого отчасти для краткости, отчасти потому, что другие множества решений просто не рассматриваем.
либо классической интервальной арифметики Ж (см., например, [2, 5, 6, 22, 26, 32]), либо полной интервальной арифметики Каухера Ж, краткому описанию которой мы посвящаем §3. Наконец, под векторами (точечными или интервальными) всюду понимаются вектор-столбцы.
2. Основы алгебраического подхода
Предложение 1. Множество решений интервальной системы
Ах = Ь,
А € Жгахга, Ь € Жга, совпадает со множеством решений интервальной системы
х = Сх + d, (5)
если
С := I - GA, d := Gb,
G € Мгахга — невырожденная диагональная матрица, I — единичная матрица. Доказательство. Замечательность невырожденной диагональной матрицы G состоит в том, что, какова бы ни была интервальная матрица Н подходящего размера, имеет место равенство
GH = { СН | Н € Н },
т. е. результат интервального матричного умножения на такую матрицу С совпадает с множеством поэлементных точечных произведений. Следовательно, с невырожденными диагональными матрицами можно осуществлять рассуждения типа
С € Н эквивалентно СН € СН. (6)
В общем случае, когда С не обязательно диагональная, в этой логической формуле можно осуществлять импликацию только вправо. Итак, мы имеем
множество решений ИСЛАУ (5)
= { х € Ега | (ЗС € (I - СA))(Зd € СЬ)( х = Сх + d ) }
= { х € Ега | (ЗС € (I - СА))^ € СЬ)((1 - С)х = d ) }
= { х € Ега | (З(I - С) € СА))^ € СЬ)( (I - С)х = d ) }
= { х € Ега | ^ € СА))^ € СЬ)( Zx = d ) } где Z := I - С
= { х € Ега | (ЗС-^ € А))(ЗС-Ч € Ь)( С-^х = С-Ч ) } в силу (6)
= { х € Ега | (ЗА € А))(ЗЬ € Ь)( Ах = Ь ) }, где А := С-^ и Ь := С-Ч
= множество решений ИСЛАУ Ах = Ь,
поскольку С € (I - С А) тогда и только тогда, когда (I - С) € I - (I - С А) = С А.
Например, если для интервальной линейной системы Хансена [23, 36]
положить
[2, 3] [0,1] [1, 2] [2, 3]
G :=
x =
[0,120] [60, 240]
0
то мы можем заключить о совпадении множества решений исходной ИСЛАУ (7) с множеством решений системы
x=
[-1, 0] [-1, 0] [-1, - 2] [- 2, 0]
x +
[0, 60] [30,120]
Результат Предложения 1 даёт возможность заменять решение внешней задачи для исходной интервальной линейной системы Ax = b на решение внешней задачи для системы вида (5), в котором переменная выделена в левой части "в чистом виде" (fixed-point form в англоязычной терминологии). Описанное сведение не является единственно возможным, и ниже мы фиксируем его лишь для определённости. Более подробно преобразование системы (1) к виду (5) будет обсуждаться в §7.
Теорема 1[2, 18, 31]. Пусть C — интервальная nxn-матрица. Итерационный процесс в IRra
x
(к+1) := Cx(k) + d, k > 0,
для любого начального вектора х(0) сходится к единственной неподвижной точке х* Е Шга интервального отображения, задаваемого правилом
х ^ Сх + d, (9)
тогда и только тогда, когда спектральный радиус р(|С|) матрицы |С|, составленной из модулей элементов С, меньше чем 1.
Теорема 2[2, 18]. Пусть С — интервальная п х п-матрица, для которой р(|С|) < 1. Тогда для неподвижной точки х* интервального отображения, задаваемого правилом
х ^ Сх + d
(которая существует и единственна в силу Теоремы 1), выполнено соотношение
{ (I - С)-1Ь | С Е С, d Е d }Сх*,
т. е. эта неподвижная точка х* является внешней интервальной оценкой множества решений интервальной системы х = Сх + d.
Определение 1 [19, 33, 35]. Интервальный вектор называется алгебраическим решением интервального уравнения если подстановка его в это уравнение и выполнение всех интервальных операций в соответствии с правилами рассматриваемой интервальной арифметики приводят к равенству.
Понятие алгебраического решения соответствует обычному общематематическому пониманию решения уравнения, и выделение для него отдельного термина имеет скорее исторические причины. Дело в том, что для интервальных уравнений подобные решения
0
долгое время считались малосодержательными и почти не изучались, а фраза "решение интервальной задачи" стала обозначать, главным образом, некоторую оценку (приближение, аппроксимацию) того или иного множества решений задачи, либо процесс получения такой оценки. В этом смысле рассматриваемая нами "внешняя задача" (4) является типичной интервальной постановкой: под её "решением" имеется в виду внешняя интервальная оценка объединённого множества решений.
Развиваемый нами алгебраический подход к решению "внешней задачи" (4) основывается на следующем неожиданном факте, до сих пор остававшемся незамеченным исследователями: фигурирующая в Теоремах 1 и 2 неподвижная точка х* отображения (9) является не чем иным, как алгебраическим решением интервального уравнения (5)! Поэтому мы можем переформулировать приведенные выше классические результаты в следующем модифицированном виде, который будет существенно использоваться в дальнейшем изложении:
Теорема 3. Если интервальная п х п-матрица С такова, что р(|С|) < 1, то для любого d Е Шга алгебраическое решение интервального уравнения
х = Сх + d (10)
существует, единственно и является внешней интервальной оценкой множества решений этого интервального уравнения.
В чем смысл переформулировки хорошо известных результатов Теорем 1, 2 в виде Теоремы 3? Выполненная нами редукция не является "всего лишь" языковым трюком, но имеет глубокие методические следствия. Дело в том, что утверждение Теоремы 3, организованное как "чистая" неконструктивная теорема существования, помогает лучше осознать следующий принципиальный факт: способ доказательства теоремы не обязательно должен совпадать с практическим способом нахождения решения основного уравнения (10). Кроме того, задача нахождения алгебраического решения — это уже не задача оценивания или приближения, а, по существу, традиционная математическая задача решения некоторого уравнения. С подобными задачами имеет дело значительная часть современной математики и естествознания.
Традиционные конструктивные доказательства Теорем 1, 2, основанные на известной теореме Шредера о сжимающих отображениях, породили целый поток работ, посвященных построению различных стационарных итерационных алгоритмов для нахождения неподвижной точки интервального отображения (9). Но, вообще говоря, никто не обязывает нас при конструировании вычислительных подходов к этой задаче ограничиваться лишь стационарными сжатиями, тем более, что получающиеся при этом методы имеют довольно медленную сходимость. При построении конкретных процедур для нахождения алгебраического решения для (10) (= неподвижной точки (9)) разработчик алгоритмов должен быть свободен в выборе и использовании любых других возможных приемов и концепций (например, символьных преобразований). Единственным руководящим принципом должно при этом оставаться удовлетворение искомым решением уравнению (10) в смысле Определения 1. Одним из основных результатов нашей работы является развитие именно такого эффективного нестационарного итерационного алгоритма и техники для его теоретического анализа.
В заключение этого параграфа отметим, что высказанная нами основная идея с равным успехом применима не только к интервальным линейным системам, но и к нелинейным системам уравнений с интервальными коэффициентами. Теоретической основой здесь
служит общий результат, доказанный в несколько других терминах еще Г. Алефельдом и Ю. Херцбергером [2]. Предварительно напомним
Определение 2([2], см. также [14]). Интервальное отображение f : Шп ^ Шп назовём Р-сжатием (или Р-сжимающим3), если существует неотрицательная матрица Р со спектральным радиусом р(Р) < 1, такая что для всех х, у € Шп имеет место
Я( I(х),1(у)) < Р•д(х, у), где через • , •) обозначена псевдометрика (векторная метрика) на Жп
q(x, у):=(тах{ Х1 - У1, х1 - У1} , ••• , Хп - У^ хп - Уп}) € Кп (11)
Теорема 4 (наша переформулировка результата Теоремы 4 и Следствия 6 из гл. 11 книги [2]). Пусть F(а,х) — рациональная функция аргументов а, х, т.е. такая, что аналитическое выражение для F есть конечная комбинация символов переменных и арифметических операций, и пусть F(а, х) — естественное интервальное 'расширение F. Если для некоторого фиксированного а отображение F : Жп ^ Жп, действующее по правилу
х ^ F(а, х),
является Р-сжатием пространства Жп, то интервальная система уравнений
х = F (а,х) (12)
имеет единственное алгебраическое решение х* € Жп, для которого справедливо соотношение
{ х € Кп | (За € а)( х = F(а,х) ) }Сх*.
Иными словами, в этом случае алгебраическое решение системы уравнений (12) является внешней интервальной оценкой её множества решений.
Как видим, и в общем нелинейном случае вычисление внешних интервальных оценок для множеств решений также может быть сведено к нахождению алгебраических решений.
3. Полная интервальная арифметика 3.1. Неформальное обсуждение
К сожалению, свойства классической интервальной арифметики — основного инструмента интервального анализа — не благоприятствуют реализации очерченной в предыдущем параграфе программы по нахождению алгебраических решений для уравнения (10).
Напомним, что классическая интервальная арифметика является алгебраической системой ( Ж, +, -, •,/ ), носитель которой — множество всех вещественных интервалов х := [х, х] = { х € К | х < х < х },а бинарные операции — сложение, вычитание, умножение и деление — определены "по представителям", т. е. в соответствии со следующим фундаментальным принципом:
х * у = { х*у | х € х,у € у } (13)
3К сожалению, в этом вопросе исследователи не придерживаются единой терминологии. Ряд авторов (см. [32]) за матрицей Р закрепляют отдельное понятие — оператора Липшица (матрицы Липшица) отображения ] — и говорят, что оператор Липшица для f сжимающий.
для всех интервалов х, у, таких, что выполнение точечной операции х*у, * е{ +, —, •, / }, имеет смысл для любых х Е х и у Е у [2, 5, 6, 22, 26, 32]. Развёрнутое определение интервальных арифметических операций таково:
х + у = [х + у, х + у] , (14)
х — у = [х — У, х — у] , (15)
х • у = [шт{ху, ху, ху, ху} , max{xy, ху, ху, ху}] , (16)
х/у = х • [ 1/у, 1/у ] для у $ 0. (17)
Алгебраические свойства интервальной арифметики IR в целом плохи, поскольку
— все интервалы с ненулевой шириной, т. е. большинство элементов IR, не имеют обратных по отношению к операциям (14)-(17),
— арифметические операции (14) - (17) связаны друг с другом довольно слабыми соотношениями (типа известной субдистрибутивности), а полноценная дистрибутивность
умножения и деления относительно сложения и вычитания не имеет места. Как следствие, во-первых, в IR элементарные уравнения
a + x = b, a • x = b
и им подобные не всегда имеют алгебраические решения. Во-вторых, техника символьных преобразований в классической интервальной арифметике IR довольно бедна. Мы не имеем возможности даже переносить члены из одной части уравнения в другую и, из-за отсутствия дистрибутивности, приводить подобные члены.
Кроме того, порядковые свойства классической интервальной арифметики также неудовлетворительны: она не является решеткой [3] относительно естественного упорядочения по включению " С". Первая из операций
x Л y := inf с{ x, y } = [maxjx, y}, min{x, y}] (18)
(взятие точной нижней грани относительно С )
x V y := sup с{ x, y } = [min{x, y}, max{x, y}] , (19)
(взятие точной верхней грани относительно С)
не всегда выполнима в классической интервальной арифметике.4
Отсутствие дистрибутивности и вытекающая из неё невозможность приводить подобные члены являются, конечно, наиболее серьёзным дефектом интервальной арифметики, для исправления которого потребуется, по-видимому, её значительная переделка как алгебраической системы. В настоящий момент не вполне ясны даже возможность и целесообразность этого шага. Что же касается необратимости арифметических операций и плохих порядковых свойств интервальной арифметики, то эти неудобства могут быть частично преодолены более лёгким и естественным путём: нам следует достроить IR до некоторой более широкой и полной алгебраической системы A (или, иначе, вложить IR в более широкую алгебраическую систему A), которая имела бы более хорошие алгебраические и
4Если х, у — обычные одномерные интервалы с непустым пересечением, то х Л у и х V у совпадают с х П у и х и у соответственно. Но в общем случае это не так.
порядковые свойства (обратимость элементов и т.п.), в которой была бы более богатой техника эквивалентных преобразований и более мощны аналитические средства. Затем мы будем искать требуемое алгебраическое решение интервальной системы уравнений в этой более широкой алгебраической системе А, а не в обычной интервальной арифметике Ж, так как можно надеяться, что модифицированная подобным образом задача является более лёгкой в силу более благоприятных свойств алгебраической системы А. Но если полученный в результате этой процедуры интервальный вектор окажется лежащим в Ж (а не в А \ Ж), то он и будет искомым алгебраическим решением исходной системы уравнений. Идея облегчить нахождение алгебраических решений путём предварительного перехода в более широкую алгебраическую систему была впервые предложена С. П. Шарым в [17].
Как можно осуществить требуемое расширение классической интервальной арифметики? Здесь нам на выручку приходит абстрактная алгебра. С более общей точки зрения арифметика Ж является коммутативной полугруппой как относительно сложения, так и относительно умножения.5 Известно (см., например, [10]), что всякая коммутативная полугруппа, в которой справедлив так называемый "закон сокращения", может быть вложена в группу (или, что эквивалентно, расширена до группы), т. е. в действительно более богатую алгебраическую систему, в которой каждый элемент имеет обратный. Интервальная арифметика как раз и является коммутативной полугруппой, удовлетворяющей закону сокращения относительно сложения, а относительно умножения полугруппу с законом сокращения образуют все интервалы, не содержащие нуля.6
По счастью, все технические конструкции, необходимые для такого согласованного расширения интервальных полугрупп по сложению и умножению были реализованы немецким исследователем Э. Каухером еще в конце 70-х годов. В работах [24, 25] Каухер построил алгебраическую систему, названную им "интервальной арифметикой Ж", которая включает в себя классическую интервальную арифметику Ж как собственное подмножество и вполне удовлетворяет нашим требованиям: она является группой по сложению и "почти группой" по умножению. Кроме того, Ж — решётка относительно порядка по включению, т. е. обладает лучшими в сравнении с классической арифметикой Ж порядковыми свойствами. Каухер при расширении Ж опирался на свойство монотонности интервальных арифметических операций по включению и сохранил его в новой интервальной арифметике. Подчёркивая хорошие свойства новой алгебраической системы Ж, мы будем называть её полной интервальной арифметикой или, по имени создателя, интервальной арифметикой Каухера. Подробное описание Ж можно найти, например, в [21, 25].
3.2. Описание полной интервальной арифметики
Элементами арифметики Ж являются пары вещественных чисел [ п, $ ], не обязательно связанных соотношением п < $. Таким образом, Ж получается присоединением неправильных интервалов [ п,$ ], П > $, ко множеству Ж = { [ п,$ ] | п, $ € К, п < $} правильных интервалов и вещественных чисел (отождествляемых с вырожденными интервалами нулевой ширины). Элементы арифметики Каухера и образуемые из них более
5Строго говоря, арифметика Ш является даже коммутативным моноидом относительно сложения и умножения, т. е. полугруппой с нейтральным элементом, но этот факт уже не столь важен для последующих рассмотрений.
6Применительно к интервальной арифметике "закон сокращения" означает, что для любых интервалов а, Ъ, с имеет место импликация (а * с = Ь * с ^ а = Ь), где * — рассматриваемая арифметическая операция.
сложные объекты (векторы, матрицы) мы будем выделять жирным шрифтом, как и обычные интервалы. При этом, если x = [ц, $], то ц называется левым концом интервала x и обозначается x, а $ — правым концом интервала x и обозначается x.
Правильные и неправильные интервалы, две половинки IR, меняются местами в результате отображения дуализации dual : IR ^ IR, меняющего местами (переворачивающего) концы интервала, т. е. такого, что
dual x := [ x, x ].
Совершенно аналогично классической интервальной арифметике отношение включения одного интервала в другой определяется на полной интервальной арифметике так:
x С y ^ x > y и x < y. (20)
Например, [3,1] С [2, 2] = 2 G R. Определение (20) делает арифметику Каухера IR не просто решеткой, но даже условно полной решеткой [3] относительно порядка по включению.7 Сложение и умножение на вещественные числа определяются на IR следующим образом:
x + y := [x + y,x + y] , (21)
Г [ ¡1 x^x ^ если ¡1 > 0,
1 • x := \ r - ! (22)
[ [ 1 x,ix ], иначе.
Итак, каждый элемент x из IR имеет единственный обратный по сложению, обозначаемый через " opp x", и
x + opp x = 0 ^ opp x := [ — x, —x]. (23)
Непосредственно из этого факта следует, что относительно сложения IR является коммутативной группой, изоморфной аддитивной группе стандартного линейного пространства R2. Для краткости мы будем обозначать операцию, обратную сложению, т. е. внутреннее (алгебраическое) вычитание в IR, через "0", так что
x 0 y := x + opp y
= [ x — У, x — y ] .
Ниже нам также будут полезны следующие дистрибутивные свойства сложения по отношению к решеточным операциям (см. [21, 25]):
x +(y Л z) = (x + y) Л (x + z), (24)
x +(y V z) = (x + y) V (x + z). (25)
Заметим, что с помощью операции взятия максимума (19) определение (13) можно переписать в следующем эквивалентном виде:
* у =VV(x*y), (26)
x
xEx yEy
7Условно полная решётка — это частично упорядоченное множество, в котором каждое непустое ограниченное подмножество имеет точные верхнюю и нижнюю грани [3]. Таким образом, это уже больше, чем просто решётка, но меньше, чем полная решётка.
"*" обозначает любую из арифметических операций. Наиболее удивительным фактом, касающимся арифметики Каухера, является то, что в ней имеет место представление, обобщающее формулы (13) и (26). Именно, для любой операции * Е { +, —, ■,/ } справедливо соотношение
X * у = ИХ ИУ (х*у), (27)
где
Иx
V, Л,
icGpro x yGpro y
если x правильный, иначе,
(условная операция взятия экстремума по включению),
pro x
x,
если x правильным,
dual x, иначе,
(правильная
проекция
интервала).
Это представление выражает связь между результатом интервальной операции x * y и результатами точечных операций x*y для x Е pro x и y Е pro y8. Представление (27) можно даже взять за основу для определения арифметических операций в полной интервальной арифметике (см. [21]).
Для того, чтобы выписать явные формулы для умножения, выделим в IR следующие подмножества:
P := { x Е IR | (x > 0) & (x > 0) } — неотрицательные интервалы, Z := { x Е IR | x < 0 < x } —P := { x Е IR | —x EP} dual Z := { x Е IR | dual x Е2}
В целом IR = P U Z U (—P) U (dual Z). Тогда умножение в интервальной арифметике Каухера может быть описано следующей таблицей [25]:
Таблица 1
нульсодержащие интервалы, неположительные интервалы, интервалы, содержащиеся в нуле.
X y EV y EZ y E-V y E dual Z
x eV [ xyxy ] [ xy xy ] [ xy ] [ xy ХУ ]
x EZ [ xy,xy ] [minjxy, xy}, maxjxy, xy} ] [xy xy ] 0
x E-V [xy xy] [ xy xy ] [xy xy ] [ xy xy]
x E dual Z [xy xy] 0 [ xy ] [maxjxy, xy}, minjxy, xy} ]
8Формула (27) отражает, в частности, тот факт, что в полной арифметике концы результирующего интервала являются минимаксом и максимином результатов арифметических операций между точками правильных проекций интервалов-операндов, если один из них — правильный интервал, а другой — неправильный. Таким образом, полную интервальную арифметику Каухера можно называть .минимаксной, поскольку она реализует на уровне элементарных арифметических операций взятие минимакса.
Как видим, умножение в арифметике Каухера допускает нетривиальные делители нуля. Например, [ — 1, 2] • [5, —3] = 0. Интервальное умножение в арифметике Каухера оказывается коммутативным и ассоциативным [21, 24, 25], но группу по умножению в IR образуют лишь интервалы x с xx > 0, поскольку "закон сокращения" не выполняется ни на каком более широком подмножестве IR.
Выписанные выше явные формулы для умножения в полной интервальной арифметике являются довольно громоздкими и малообозримыми. В ряде случаев оказывается полезным прибегнуть к другим формулам для интервального умножения, которые были предложены А. В. Лакеевым в [30]. Напомним
Определение 3 [3]. Для вещественного числа x величины
x+ := max{ x, 0 }, x- := max{ —x, 0 }
называются положительной частью и отрицательной частью x соответственно. Предложение 2 [30]. Для любых интервалов x, y G IR справедливо
x • У =
= [ max{ x+y+, x-y-} — max{ x+y-, x-y+}, max{ x+y+, x-y-} — max{ x+y-, x-y+} ].
Если один из интервалов x, y является правильным, то
x • y = [ x+y+ + x-y- — max{ x+y-, x-y+}, max{ x+y+, x-y-} — x+y- — x-y+ ]. (28)
Эта формула не упрощается в случае, когда нам дополнительно известно, что оба интервала x, y правильные.
Если же из интервалов x, y один является правильным, а другой неправильным, то
x • y = [ x+y+ + x-y- — x+y- — x-y+, x+y+ + x-y- — x+y- — x-y+ ]. (29)
Достоинство формул Лакеева — их глобальный характер. Они дают единое выражение для интервального произведения x • y на всей области определения x и y, тогда как представление через таблицу 1 имеет кусочный характер. Это неудобно, например, при исследовании дифференцируемости, вычислении производных и т. п.
Вычитание и деление в арифметике IR определяются так же, как и в классической интервальной арифметике:
x — y := x +(—1) • y = [x — y,х — y] , x /y := x • [1/y, 1/y] для 0 £ pro y.
Наконец, аналогично своим классическим предшественникам, все операции полной интервальной арифметики являются монотонными по включению, т. е. относительно частичного порядка (20):
x С x', y С y' ^ x * y С x' * y' для любых x, y G IM и * g{ +, —, •, / }.
Взаимосвязь сложения и умножения в арифметике Каухера выражается следующими соотношениями:
если x правильный, то x • (y + z) С x • y + x • z — субдистрибутивность, (30) если x неправильный, то x • (y + z) D x • y + x • z — супердистрибутивность. (31)
Эти включения обращаются в точные равенства, в частности, в том случае, когда х стягивается в точку, т. е. х = х Е К.
Операции над векторами и матрицами в полной интервальной арифметике Ж определяются аналогично соответствующим операциям на Ш. Сумма (разность) двух интервальных матриц одинакового размера есть интервальная матрица того же размера, образованная поэлементными суммами (разностями) операндов. Если X = (х—) Е Жтх и Y = (у—) Е Жгхга, то произведение матриц X и Y есть матрица Z = (Zj) Е Мтхга, такая, что
Zij : ^ ^ xikykj .
k=l
Упорядочение по включению на множестве интервальных векторов и матриц с элементами из Ж есть, по определению, прямое произведение [3] порядков по включению на отдельных компонентах Ж. Следовательно, мы считаем, что
( хЛ / У Л / XI V уЛ / хЛ / уЛ
x2
V
\xn J
У2
VW
( xi V yi \
x2 V У2
xn V yn
и
x2
xn
Л
y2
yn
( xi Л yi \
x2 Л y2
xn Л yn
Топология на интервальном пространстве IRn определяется стандартным способом, т. е. метрикой
dist (x,y):=max{\\x — y\\, \\x — y\\}, x,y Е IRn, (32)
где \\ • \\ — абсолютная векторная норма на Rn. Все интервальные арифметические операции, матрично-векторные операции на IRn, а также операции V, Л, "dual" и "opp" являются непрерывными в метрике (32) (см. [25]).
Нам понадобятся, кроме того, операции взятия середины интервала и его радиуса
midx := 1 (x + x), radx := 1 (x — x).
Как обычно, к интервальным векторам и матрицам эти операции будут применяться поэлементно.
Заключая параграф, посвящённый полной интервальной арифметике Каухера, можно резюмировать, что она, хотя и не исправляет "до конца" всех недостатков классической интервальной арифметики, всё же является гораздо более удобной и приспособленной для решения задачи нахождения алгебраических решений интервальных систем уравнений.
4. Погружение в линейное пространство 4.1. Зачем погружать?
Возвратимся к решению "внешней задачи" (4) для интервальной линейной системы (1). Результат параграфа 2 — её сведение к задаче нахождения алгебраического решения интервального уравнения
х = Сх + d,
9Для пространства 1М" эта метрика совпадает с хаусдорфовым расстоянием между интервальными векторами как гипербрусами в М".
которое равносильно в полной интервальной арифметике уравнению
Сх е х + d = 0. (33)
Как мы уже отмечали, это, по существу, есть традиционная математическая задача решения некоторого уравнения, и большая часть классического численного анализа посвящена решению подобных постановок. Но особенность нашей ситуации состоит в том, что основное множество Жга, на котором рассматривается решаемое уравнение, совсем не является линейным пространством: отсутствие дистрибутивности в интервальной арифметике ведет к нарушению той аксиомы линейного пространства, которая требует выполнения
(р + V) х = ¡1 х + V х
для всех х Е Жга и любых скаляров ¡.V Е К. Таким образом, большинство из существующих подходов к исследованию операторных уравнений и к вычислению их решений не применимы напрямую к нашей задаче.
Более того, оставаясь в интервальном пространстве Жга, мы не сможем выполнить теоретический анализ ситуации и понять некоторые явления. Например, точечная матрица
-1 1 ) (34)
является невырожденной (неособенной) в смысле классической линейной алгебры, но умножение на эту матрицу в Ж2 может занулить даже ненулевой вектор:
1 1) ( и. Ц) = I 0 -11/1 [1.-1]) 10
В чем причина? Едва ли возможно обнаружить ее изнутри интервального пространства, которое является существенно нелинейным. Итак, имеется настоятельная потребность перенести наши рассмотрения в некоторое линейное пространство, которое мы обозначим для общности через и. Предполагаем также, что на и задана некоторая топология, согласованная с линейной структурой.
С абстрактной математической точки зрения мы имеем два различных пространства — интервальное пространство Жга и линейное пространство и, — на которых заданы существенно разные алгебраические структуры; каким образом можно "перепрыгнуть" из первого во второе? Мы собираемся сделать это следующим способом, родственным обычной замене переменных.
4.2. Определение и основные свойства
Прежде всего, нам следует построить некоторое отображение 1 : Жга ^ и — вложение интервального пространства Жга в линейное пространство и, — которое должно быть биективным (взаимно однозначным отображением на) для того, чтобы корректно восстанавливать интервальный прообраз по его образу в и и наоборот. Далее, нетрудно понять, что всякая биекция 1 : Жга ^ и порождает также биекцию из множества всех отображений Жга в себя на множество всех отображений и в себя. Более точно, каждому р : Жга ^ Жга сопоставляется единственное отображение
1 о <р о 1-1 : и ^ и, (35)
где " о" обозначает композицию отображений.
Определение 4 Отображение (35) мы будем называть индуцированным отображением для р.
Наглядно ситуация может быть описана коммутативной диаграммой, изображенной на рис. 2.
Линейные пространства
—1
I о р о I 1
Р
Ж"-----^ Ж"
Исходное отображение
Интервальные пространства
Рис. 2. Как вложение I порождает индуцированное отображение.
Свойства отображений р и (I о р о I-1) оказываются тесно связанными, так что вместо исследования р можно исследовать индуцированное им отображение (I о р о I-1). Более того, мы можем заменить задачу решения уравнения Ж" на решение уравнения в линейном пространстве и, придя к ситуации, более привычной для современного численного анализа.
Определение 5. Пусть в интервальном пространстве Ж" задано уравнение10
р(х) = и(х), (36)
где р, и : Ж" ^ Ж" — некоторые отображения, и фиксировано погружение I : Ж" ^ К2". Будем называть индуцированным уравнением для (36) такое уравнение
Ф(ж) = Т(ж)
в евклидовом пространстве К2", что Ф, Т являются индуцированными отображениями для р и и соответственно, т. е. Ф = I о р о I-1 и Т = I о и о I-1. Таким образом, исходное интервальное уравнение
р(х) = и(х) (37)
имеет алгебраическое решение х* Е Ж" тогда и только тогда, когда индуцированное уравнение
Ф(ж) = Т(ж)
10Здесь и всюду далее в интервальных уравнениях мы намеренно обозначаем неизвестную переменную х буквой жирного шрифта, чтобы подчеркнуть, что требуемое алгебраическое решение само является интервалом и должно удовлетворять уравнению в смысле интервальных арифметических операций.
имеет решение х* Е К2п. При этом искомое алгебраическое интервальное решение х* для (37) однозначно восстанавливается из соотношения
* —1/ х = 1 (х ).
В интересующей нас конкретной ситуации с уравнением (33) мы можем заменить исходную задачу — задачу нахождения нулей отображения
ф(х) = Сх е х + d, —
на задачу решения уравнения
Ф(х) = 0
в евклидовом пространстве К2п с индуцированным отображением Ф = 1 о ф о 1-1 : К2п — К2п, определяемым как
Ф(х) = 1( С1-1(х) е 1-1(х) + d)
Более общее соображение. Поскольку 1 и 1-1 — биекции, то обратимость любого отображения р на интервальном пространстве равносильна обратимости индуцированного отображения Ф := 1 о р о 1-1, действующего на евклидовом пространстве К2п. При этом
р-1 = 1-1 о Ф-1 о 1. (38)
Основной вопрос, касающийся построения вложения интервального пространства в линейное пространство, заключается в выборе разумного компромисса между его простотой и удобной формой индуцированных отображений (35). Среди всех биективных вложений 1 : Жп — и мы выделим специальные вложения, которые
1) сохраняют аддитивную алгебраическую структуру Жп, т. е. 1(х + у) = 1(х) + 1(у) для любых х, у,
2) сохраняют топологическую структуру Жп, т.е. как само отображение 1 : Жп — и, так и его обратное 1-1 : и — Жп непрерывны.
Такие вложения Жп — и мы будем называть погружениями интервального пространства Жп в линейное пространство и. Таким образом, формально мы принимаем следующее
Определение 6 [38]. Пусть и — линейное пространство. Биективное отображение 1 : Жп — и будем называть погружением Жп в и, если оно удовлетворяет следующим свойствам:
(^ 1 является изоморфизмом аддитивных групп Жп и и,
(и) 1 является гомеоморфизмом топологических пространств Жп и и.
Например, если интервалу х Е Ж сопоставить пару чисел (х,х) Е К2, т.е. его концы, "забыв" об их интервальном смысле, то задаваемое таким образом отображение Ж — К2 является погружением. Приведённый пример в некотором смысле типичен, так как, привлекая соображения размерности, нетрудно показать, что Определением 1 линейное пространство и задаётся однозначно: и должно быть евклидовым пространством К2п. Этот факт хорошо согласуется с аналитической интуицией, и мы не приводим здесь его строгого обоснования, чтобы не перегружать и без того разросшийся текст работы. Цель настоящего подготовительного параграфа — исследование простейших свойств погружений, которые понадобятся нам в дальнейшем при изучении индуцированного уравнения.
Из Определения 1 немедленно следует, что для любого погружения 1 : Жп ^ К п мы имеем
¿( 0ж") = 0К2п,
¿(орр х) = —¿(х), X е Жп, (39)
тогда как
¿(х) = 0 в К2п ^ х = 0 в Жп
Кроме того, обратное погружению отображение 1-1 : К2п ^ Жп также удовлетворяет условиям (^-(п) из Определения 1 и
¿-1( 0К2«) = 0№п ,
¿-1(-х) = орр ¿-1(х), х е К2п. (40)
Предложение 3. Погружение является положительно-однородным отображением:
¿(Ах) = А ¿(х) для всех х е Жп и А > 0.
Отображение Ж2п ^ Жп, обратное к погружению, также положительно однородно.
Доказательство является стандартным. Пусть х е Жп. Если А = к — натуральное число, то
¿(кх) = ¿( х + х + ••• + х ) = к ¿(х).
4-V-'
k
Если А =1/1 для некоторого натурального I, то
I ¿(Ах) = ¿(Ах) + ¿(Ах) +-----+ ¿(Ах) = ¿(х) ^ ¿(Ах) = l-11(x) = А ¿(х).
4-V-'
I
Если А = к/1 для натуральных к и I, то, пользуясь уже рассмотренными случаями, получим
¿(Ах) = ¿(^к х^ = к^ 1 х^ = 1 ¿(х) = А ¿(х).
Следовательно, равенство ¿(Ах) = А1 (х) верно для всех неотрицательных рациональных А. Распространение его на все неотрицательные вещественные числа можно осуществить путём предельного перехода, используя непрерывность ¿.
Предложение 4. Если 1 : Жп ^ К2п — погружение, а Т — невырожденное линейное преобразование пространства К2п, то (Т о ¿) также является погружением.
Обратно, любое другое погружение к : Жп ^ К2п может быть представлено в виде (Т о ¿) для некоторого невырожденного линейного преобразования Т : К2п ^ К2п.
Доказательство. Первая часть Предложения обосновывается тривиально. Чтобы доказать вторую часть, рассмотрим отображение (к о ¿-1). Очевидно, что, будучи композицией двух изоморфизмов, оно является автоморфизмом аддитивной группы К2п. Кроме того, в силу Предложения 1, это отображение положительно однородно, а так как при любом х е К2п
( к о ¿-1)(х — х) = 0 = ( к о ¿-1)(х) + ( к о ¿-1)(-х) ^ ( к о ¿-1)(-х) = —( к о ¿-1)(х),
то мы можем также заключить о его однородности относительно умножения на отрицательные числа.
Таким образом, в целом отображение к о ¿-1 оказывается невырожденным линейным преобразованием пространства К2п. Мы можем поэтому взять Т = к о ¿-1.
4.3. Стандартное погружение
Из Предложения 1 следует, что любые два погружения Жп в К2п, удовлетворяющих Определению 1, одинаковы с точностью до невырожденного линейного преобразования К2п. Поэтому мы имеем возможность выбирать каждое конкретное погружение из соображений удобства в том или ином смысле.
Каждое погружение I : Жп ^ К2п естественно порождает на линейном пространстве М2п некоторый частичный порядок " Е" — образ порядка по включению " С" на Жп при погружении I, а именно:
х Е у, т.е." х не превосходит у" в Е2п ^^ 1-1(х) С 1-1(у) в Жп. (41)
Определение 7. Частичный порядок " Е", определяемый (41), мы назовем индуцированным частичным порядком на М2п.
Поскольку для любых х, у, и, V Е К2п имеет место
х Е у, а > 0 ^ ах Е ау, х Е у, и Е V ^ х + и Е у + V,
то частичный порядок " Е" согласован с линейной структурой на К2п [1]. Следовательно, он может быть задан эквивалентным образом путем указания конуса положительных элементов, т.е. множества Кц = {х Е К2п | 0 Е х} [1, 8, 9]. Напомним, что конусом в линейном топологическом пространстве называется замкнутое выпуклое положительно инвариантное множество, не содержащее никакого одномерного подпространства.11 Как известно, в частично упорядоченном линейном пространстве, где порядок согласован с линейной структурой, множество положительных элементов является конусом. И наоборот, задание конуса Кц однозначно определяет частичное упорядочение пространства, при котором
х Е у ^^ у — х Е Кц.
Ясно, что конкретные формулы, определяющие индуцированный порядок "Е", зависят от вида погружения I. Но на евклидовом пространстве К2п простейшим и наиболее удобным является задание порядка покомпонентным образом, т. е. когда
х < у ^ xi < у^г = 1,2,...,2п. (42)
Соответственно, конусом положительных элементов при таком упорядочении К2п является множество
К< = { х Е К2п | xi > 0, г = 1, 2,...,2п } — (43)
положительный ортант пространства К2п. Естественно потребовать от погружения, чтобы индуцированный им порядок (41) совпадал с этим простейшим покомпонентным порядком (42), т.е. чтобы
х Е у ^^ х < у в покомпонентном смысле. (44)
Для какого погружения Жп ^ М2п это возможно?
пПри определении конуса некоторые авторы (например, [16]) опускают требования выпуклости, замкнутости и т. п. В нашей работе для удобства изложения мы придерживаемся того определения конуса, которое традиционно для школы М. А. Красносельского [8, 9].
Нетрудно понять, что требуемым погружением является так называемое стандартное погружение, впервые введённое в работе [38]:
Определение 8. Погружение а : Жп ^ К2п, которое действует по правилу
(хь х2,...,х„) ^ ( —хь —х2,...,—хп, х1, х2,...,хп), (45)
т. е. такое, при котором взятые с противоположным знаком левые концы интервалов х1 , х2, ..., хп становятся первой, второй, ..., п-й компонентами вещественного 2п-вектора, а правые концы интервалов х1,х2,...,хп становятся (п + 1)-й, ..., 2п-й компонентами вещественного 2п-вектора соответственно, будем называть стандартным погружением интервального пространства Жп в К2п.
Следствие. Из определения (41) индуцированного порядка на К2п и требования (44) к стандартному погружению а легко вывести, что
I у xY ) = а ( sup с xY) = sup < а( xY) V Лг / V тег / 7ег
у xY J = а ( sup с xY ) = sup < а( xY) (46)
тег
для любого ограниченного семейства интервальных векторов { xY G Жп | y ^ Г }, Г — некоторое индексное множество. Таким образом, стандартное погружение переводит супремумы по включению на интервальном пространстве Жп в супремумы относительно покомпонентного порядка на R2n. Аналогичное утверждение справедливо и для инфи-мумов.
Итак, факт совпадения индуцированного частичного порядка на линейном пространстве R2n с обычным покомпонентным упорядочением и, как следствие, упрощение выкладок и рассуждений являются главным оправданием выбранного нами вида (45) для погружения, названного стандартным. Более того, вышеизложенное достаточно веско свидетельствует в пользу того, чтобы далее в теоретической части нашей работы рассматривать лишь стандартное погружение вида (45), хотя иногда практически полезными могут оказаться и другие погружения. Например, при компьютерной реализации описываемых в этой работе алгоритмов автор использовал простейшее погружение
( xi, x2,...,x„) ^ (xi, x2 ,...,xn, xi, x2,...,xn)
которое более удобно при практическом программировании и т. п.
Полезно дать методологический комментарий по поводу содержания этого и предшествующих подразделов. Приём идентификации концов интервала или интервального вектора с компонентами вектора в евклидовом пространстве нередко применялся и применяется исследователями. Но мы выделили процедуру этой идентификации в отдельное понятие — погружение Жп ^ R2n — и предприняли его тщательное исследование. С какой целью? Нельзя ли было обойтись без "лишних абстракций"?
Помимо того, что явное и осознанное оперирование с любым объектом всегда более предпочтительно, чем неявное, "по умолчанию", имеются, по крайней мере, ещё две причины того, чтобы рассматривать погружение в качестве самостоятельного понятия:
1) отображение Жп ^ R2n не может быть определено раз и навсегда единственным образом, который был бы наиболее удобен (естественен и т. п.) для всех возможных практических ситуаций;
2) мы можем получить ощутимую выгоду от этой неединственности, т. е. наиболее полно использовать особенности того или иного погружения в каждой конкретной ситуации.
Как легко видеть, оба этих довода действительно применимы к рассматриваемому нами случаю.
4.4. Сопутствующие матрицы
Предложение 5. Пусть ф : Жга ^ Жга — оператор умножения на точечную матрицу, т. е.
ф(х) = Qx
для некоторой Q Е Кгахга, Q = (qij), а I : Жга ^ М2га — погружение. Тогда индуцированное отображение I о ф о I-1 является линейным преобразованием пространства М2га.
Для стандартного погружения а матрица этого индуцированного линейного преобразования а о ф о а-1 является блочной 2п х 2п-матрицей вида
(47)
Q+ Q-
Q- Q+
где п х п-подматрицы Q+ = (q+) и Q- = (q-) — это положительная и отрицательная части Q, т. е. матрицы, образованные положительными и отрицательными частями элементов Q соответственно.
Доказательство. Для обоснования первого утверждения нам нужно установить аддитивность и однородность отображения I о ф о I-1.
Аддитивность ф немедленно вытекает из соотношения дистрибутивности
q • (х + у) = q • х + q • у,
справедливого при точечных q для любых интервалов х, у Е Ж. Погружение I и обратное к нему отображение I-1 также аддитивны. Следовательно, индуцированное отображение I о ф о I-1 аддитивно как композиция аддитивных.
Далее, оператор ф умножения на интервальную матрицу однороден, а погружение I и обратное к нему отображение I положительно однородны в силу Предложения 1. Поэтому композиция I о ф о I-1 по меньшей мере положительно однородна. Кроме того, для любого ж Е Е2га
(I о ф о 1-1)(—ж) = (I о ф )(орр 1-1(х)) в силу (40)
= I (орр (ф о ¿-1)(ж)) в соответствии с определениями (22) и (23) = —(I о ф о 1-1)(ж) в силу (39),
что доказывает однородность индуцированного отображения I о ф о I-1 относительно умножения на любые скаляры.
Второе утверждение Предложения — это следствие определения стандартного погружения (45) и правила умножения числа на интервал
![qх, qX], если q > 0, Г - 1
[ q х^х ], иначе , которому удобно придать следующую равносильную форму
q • х = q+ х — q- х,
q • х = — q х + q+ х.
Блочная 2п х 2п-матрица из Предложения 1 настолько важна в развиваемой нами теории, что мы примем для нее специальные обозначение и термин. Определение 9. Для точечной п х п-матрицы Q мы полагаем
ОО
О+ О-
О- О+
(47)
и будем называть точечную 2п х 2п-матрицу О~ сопутствующей матрицей для О.
Важная особенность сопутствующей матрицы О~ Е М2гах2га состоит в том, что она всегда неотрицательна: такая матрица должна соответствовать " <"-изотонному оператору на К2га, индуцированному изотонным по включению умножением на О в интервальном пространстве Жп.
Следствие из Предложения 1. Привлекая определение индуцированного отображения, нетрудно заключить, что для любой точечной п х п-матрицы О и любого х Е К2га справедливо
а(Оа-1(х))= О~х. (48)
Аналогично, для любой точечной п х п-матрицы О и любого интервального вектора х € Жга имеет место
Ох = а-1( О>(х)) (49)
(наглядно соотношения (48) и (49) иллюстрируются коммутативной диаграммой рис. 2).
4.5. Вполне невырожденные матрицы
Предложение 6. Для точечной п х п-матрицы О следующие условия эквивалентны:
(^ Ох = 0 в интервальном пространстве Жга тогда и только тогда, когда х = 0; (п) матрица О~ Е М2гах2га, сопутствующая для О, является невырожденной; (ш) невырожденными являются как сама матрица О, так и её модуль \О\ (т.е. матрица, образованная модулями элементов О).
Доказательство. Эквивалентность (^ ^ (п) является следствием соотношения (49). Для доказательства эквивалентности условий (п) и (iii)12 выполним с сопутствующей матрицей О~ следующие преобразования. К её (п + 1)-й строке прибавим первую строку, к (п + 2)-й — вторую и т. д. до 2п-й включительно, к которой мы прибавляем п-ю строку матрицы ОТ. Поскольку
+ Я~ = \д\
для любого вещественного числа д, то в результате проделанных преобразований мы получим 2п х 2п-матрицу
Далее, вычтем из первого столбца получившейся матрицы (50) её (п + 1)-й столбец, из второго — (п + 2)-й и т. д. до п-го включительно, из которого вычтем последний 2п-й столбец. Поскольку
+ — — д = д
12На формулировку условия (ш) автору указал А. В. Лакеев.
О+ О-
\О\ \О\
(50)
для любого вещественного числа q, то мы получим блочно-треугольную 2п х 2п-матрицу
Q Q~ .
(51)
0
Как известно из линейной алгебры, проделанные нами преобразования (линейное комбинирование строк и столбцов) не изменяют свойство матрицы быть вырожденной или невырожденной (см., например, [12]). Следовательно, матрица (51) вырождена или невырождена одновременно с сопутствующей матрицей Q~. Но в силу специального вида матрицы (51) её определитель равен произведению определителей матриц Q и \Q\. Таким образом, сопутствующая матрица Q~ невырождена действительно тогда и только тогда, когда невырождены обе матрицы Q и \Q\.
Мы уже отмечали, что невырожденность (неособенность) точечной матрицы Q в смысле классической линейной алгебры не обязательно влечёт то, что соответствующий оператор умножения на Q в Жга обратим. Но теперь феномен матрицы (34) и ей подобных получает полное объяснение: хотя сами такие матрицы могут быть и невырожденными, но умножение на них после погружения в линейное пространство соответствует умножению на вырожденные сопутствующие матрицы. Например, для матрицы (34) сопутствующей матрицей является
( 1 1 0 0 \
0 110
0 0 11
\ 1 0 0 1 )
(52)
и её определитель нулевой!
Результат Предложения 1 позволяет сформулировать следующее
Определение 10. Точечная пхп-матрица Q, удовлетворяющая какому-нибудь (а значит и любому) из равносильных условий ^)-(ш) Предложения 2, называется вполне невырожденной (вполне неособенной)13.
К примеру, единичная матрица — вполне невырожденная, тогда как матрица (34) невырождена в обычном смысле, но не является вполне невырожденной. Очевидно также, что если матрица вырождена в обычном смысле, то она тем более не есть вполне невырожденная. Все неотрицательные невырожденные матрицы также являются вполне невырожденными. Практически удобный критерий для проверки полной невырожденности матрицы предоставляет условие (ш) из Предложения 1. Например, вместо вычисления определителя сопутствующей матрицы (52) для матрицы (34) можно было бы просто заметить вырожденность матрицы модулей
' 1 1 1 1
Следствие из Предложений 1 и 1. Оператор ф : Жга ^ Жга, задаваемый умножением на квадратную точечную матрицу в Жга, т. е. такой, что
ф(х) = Qx для некоторой Q Е Кгахга,
13Английский вариант этого термина — completely regular matrix, или completely nonsingular matrix. В своих ранних работах [38, 41] и некоторых других автор называл такие матрицы i-невырожденными.
обратим тогда и только тогда, когда матрица О является вполне невырожденной. При этом обратный оператор ф-1 : Жп ^ Жп действует, согласно (38), следующим образом:
ф-1(х) = а-1(( О~)-1 • а(х)). (53)
Замечание. Несмотря на существование явной формулы (53), оператор, который обра-тен оператору умножения на точечную п х п-матрицу О в Жп, в общем случае не может быть выражен через умножение на какую-нибудь матрицу в Жп (в частности, на матрицу О-1).
5. Исследование индуцированного уравнения
Итак, в результате погружения исследование интервальных отображений Жп ^ Жп сведено нами к исследованию отображений Ж2п ^ К2п на привычном евклидовом пространстве, а нахождение алгебраических решений интервальных уравнений заменено на решение индуцированных уравнений в К2п. Учитывая особую роль стандартного погружения а : Жп ^ К2п, мы всюду ниже под индуцированными отображениями и уравнениями будем иметь в виду именно а-индуцированные отображения и уравнения на К2п. Следовательно, вместо задачи вычисления алгебраических решений интервального уравнения
Сх е х + d = 0 (54)
мы будем заниматься решением индуцированного уравнения
Ф(х) = 0 (55)
в М2п, такого, что
Ф(х) = а( Са-1(х) е а-1(х) + d) = а( Са-1(х)) — х + а^). (56)
Отметим также, что нам не нужно отдельно исследовать существование и единственность решений индуцированного уравнения (55), (56). Фактически, такими результатами являются уже Теоремы 1-3 для исходного уравнения (10), равносильного (54).
Предложение 7.Индуцированное отображение Ф : М2п ^ Ж2п, определённое посредством (56), непрерывно.
Доказательство. Отображение ф : Жп ^ Жп, действующее как
х ^ Сх е х + d,
непрерывно в силу непрерывности интервальных арифметических операций в Ж. Погружение а, как и обратное ему отображение а-1, также непрерывны. Следовательно, непрерывна и их композиция Ф = а о ф о а-1.
Коль скоро отображение Ф действует на евклидовом пространстве, мы можем поставить вопрос о его дифференцируемости, гладкости и т. п. К сожалению, глобально, т. е. на всей области определения, мы не можем похвастаться ни одним из этих свойств. Но взамен мы имеем нечто даже более привлекательное — выпуклость.
5.1. Порядковая выпуклость и субдифференцируемость
Из классического анализа хорошо известно понятие выпуклой функции и его многочисленные плодотворные применения. Напомним обобщение этого понятия на многомерный случай.
Определение 11 [1, 13, 14, 16]. Пусть евклидово пространство М9 упорядочено частичным порядком " 4". Отображение F : Мр ^ М9 называется порядково выпуклым относительно " 4", если
F(Ху + (1 — Х)г) 4 XF(у) + (1 — X)F(г)
для любых у, г Е Мр и Х Е (0,1).
Предложение 8. Индуцированное отображение Ф(ж), определённое посредством (56), является порядково выпуклым относительно покомпонентного порядка "<" на М2п.
Доказательство. Для любых Х Е (0,1) и и, V Е Жп, принимая во внимание субдистрибутивность (30), мы имеем
С( Хи + (1 — Х^) С ХСи + (1 — Х)^.
Следовательно, в М2п
а (С( Хи + (1 — Х^ )) < Ха(Си) + (1 — Х) а(^). (57)
Пусть у, г Е М2п. Если обозначить и = а-1 (ж), V = а-1 (г), то справедлива следующая цепочка преобразований:
Ф( Ху + (1 — Х)г) = а (Са-1(Ху + (1 — Х)г)) — ( Ху + (1 — Х)г) + а^) = а (С( Хи + (1 — Х)v )) — ( Ху +(1 — Х)г) + а(d)
< Ха(Си) + (1 — Х) а(Cv) — ( Ху + (1 — Х)г) + а^) в силу (57) = Х (а(Си) — у + а^)) + (1 — Х) (а(^) — г + а^)) = Х Ф(у) + (1 — Х)Ф(г),
которая и доказывает Предложение.
Выпуклые функции и отображения, будучи одними из ближайших родственников линейным и аффинным отображениям, обладают, как известно, многими замечательными свойствами. Некоторыми из этих свойств мы и собираемся воспользоваться.
Определение 12 [1, 13, 15, 16]. Пусть М9 — частично упорядоченное евклидово пространство с порядком " 4", и отображение F : Мр ^ М9 порядково выпукло относительно " 4". Субдифференциалом отображения F в точке ж Е Мр называется множество, обозначаемое д^F(ж), которое образовано всеми линейными операторами D : Мр ^ М9 такими, что
D(v) 4 F(ж + V) — F(V) (58)
для любого V Е Мр. Элементы множества д^F(ж) — линейные операторы, удовлетворяющие (58), — называются субградиентами отображения F в точке ж. Если субдифференциал д^F(ж) непуст, то про отображение F говорят, что оно субдифференцируемо в ж.
В общем случае понятие субдифференциала может быть определено и для отображений со значениями в общих линейных упорядоченных пространствах. Но проверка существования субдифференциала и его вычисление представляют собой при этом весьма
непростые задачи [1]. По счастью, в интересующей нас конечномерной ситуации все существенно упрощается. Конечномерный выпуклый анализ является одной из наиболее красивых, развитых и практически важных математических дисциплин, результатами которой мы будем существенно пользоваться в нашей работе. Здесь имеет смысл дать краткую сводку необходимых нам сведений.
ЬГ Определение 13 [13, 15, 16]. Односторонней производной функции / : Мр ^ К в точке х по направлению у Е (или, коротко, производной по направлению) называется предел
д/(х) г /(х + аУ) — /(х) —^- := Ят-,
ду а\о а
в случае, если он существует.
Определение 14 [13, 15, 16]. Опорной функцией (выпуклого) множества Ш С Кр называется функция 8w : Кр ^ К такая, что
5W(х) := sup{ хтw \ w Е Ш }.
Теорема 5 [13, 15, 16]. Если выпуклая функция / : Кр ^ К непрерывна в некоторой точке х, то субдифференциал д/(х) — непустое ограниченное множество и производная
по направлению д/х) как функция направления у является опорной функцией для д/(х). дУ
В рассматриваемой ситуации выпуклость исследуемого отображения Ф : К2п ^ К2п относительно покомпонентного < -порядка равносильна тому, что все координатные компоненты — функционалы Ф, : К2п ^ К, i = 1, 2,...,2п, — сами также выпуклы в обычном смысле. Вдобавок, все Ф,(х) непрерывны, и значит субдифференцируемы всюду на К2п в силу классического результата Теоремы 1.
Субдифференциалы дФ,(х), i = 1, 2,..., 2п, можно мыслить, например, как множества 2п-векторов d(i), таких что
Ф,(х + V) — Ф,(х) > dTT)V для любых V Е К2п.
Если же сконструировать из этих векторов d(i), как из строк, 2п х 2п-матрицу D := (d(l), d(2),..., d(2n))т, то, каков бы ни был V Е К2п, удовлетворяется неравенство
Ф(х + V) — Ф(х) > Dv,
и потому линейный оператор, задаваемый матрицей D, является субградиентом Ф в х. Соответственно, субдифференциал д<Ф(х) непуст. Поскольку наши рассуждения никак не зависят от точки х, мы обосновали
Предложение 9. Для индуцированного отображения Ф, задаваемого посредством (56) (и которое порядково выпукло в силу Предложения 1), субдифференциал д<Ф(х) является непустым в любой точке х Е К2п, т. е. отображение Ф всюду субдифференциру-емо.
Ниже мы для краткости часто будем обозначать этот субдифференциал просто дФ(х). Если Ф дифференцируема в точке х, то субдифференциал дФ(х) состоит из единственного элемента, именно, из матрицы Якоби
( дФ1 (х) дФ1(х) \
дх1 дх2п
дФ2п(х) дФ2п(х)
\ дх1 дх
2п
Но, как мы уже отмечали, отображение Ф(ж) не является всюду дифференцируемым. Чтобы указать явный вид субдифференциала дФ(ж) в общем случае и вывести для него некоторые оценки, существенно используемые в дальнейшем, нам необходимо знать больше об исследуемом отображении Ф.
5.2. Полиэдральность
Определение 15 [13, 15, 16]. Надграфиком функции / : Мр ^ М называется множество в Мр+1, определяемое как
ерт / := { (ж, Г) Е Мр+1 | ж Е Rр,t Е М, /(ж) < t}.
Определение 16 [16]. Полиэдральным выпуклым множеством в Мр называется множество, которое можно представить как пересечение конечного числа замкнутых полупространств Мр, т.е. как множество решений конечной системы линейных неравенств вида
Ц)ж < &, г = 1, 2,...,m,
где h(i) Е Мр, ^ Е М. и т — некоторый натуральный номер14.
Определение 17 [16]. Выпуклая функция / : Мр ^ М, надграфик которой является полиэдральным множеством в Мр+1, называется полиэдральной выпуклой функцией.
Рис. 3. График сравнения гладкой выпуклой функции и полиэдральной выпуклой функции.
Подчеркнем, что полиэдральные функции — это простейшие среди выпуклых функций: по существу, полиэдральные функции можно характеризовать как почти всюду локально аффинные выпуклые функции, поскольку их графики составлены из кусков гиперплоскостей.
Предложение 10. Все компоненты ФДж), г = 1,2,...,2п, отображения Ф, определённого посредством (56), являются выпуклыми полиэдральными функциями.
14В русской литературе используется также термин многогранное множество [15]
Доказательство Факт полиэдральности функций ФДж), г = 1, 2,..., 2п, мы получим как следствие некоторого специального представления для Ф(ж). Его выводом мы сейчас и займемся.
Прежде всего отметим, что для любой правильной п х п-матрицы С и произвольного интервального п-вектора V имеет место
Cv = \J Cv
( Vaeo(Cv)i \
V Vcec(Cv)n /
(59)
сес
Действительно, для правильных интервалов с^- согласно представлению (27) можно на-
V
-г]
писать
cij vj = V cij vj.
cij £cij
Используя свойство дистрибутивности операции " V" относительно сложения (25), мы получим для i = 1, 2,...,n
n n n n
(Cv)i = сг]vj ^ V сг]vj = V V • • V сг]vj = V сг]vj = V (Cv)i
j=1 j=1 Cijecij CiiGcii ci2€ci2 CinEcin j=1 CeC j=1 CeC
что и доказывает равенство (59).
Далее, принимая во внимание соотношения (46) и (48), заключаем
Ca-1(x)) = а ( \J Ca-1(x) ) = sup < a(Ca-1(x)) = sup < C~x.
\a ec ) a eC aeC
В целом для отображения Ф, определенного посредством (56), справедливо следующее представление:
Ф(х) = sup C~x - x + a(d) (60)
aeC
(для краткости мы опускаем знак " <", поскольку пока рассматриваем на R2n только этот порядок). В частности,
Фг(x) = ( sup C~x - xi + (a(d))i V ci=c ' г
- a eC
= sup (C~x)i - xi + (a(d))i (61)
aeC
для любого i = 1, 2,..., 2n.
Тот факт, что в представлениях (60) и (61) матрица C~— это неотрицательная матрица специального блочного вида (47), имеет важное следствие. Именно, sup (C~x)i может достигаться только в концах интервальных элементов cij, j = 1, 2,...,n, или же дополнительно еще в нулях, если соответствующие элементы cij Э 0. В любом случае мы можем эквивалентным образом заменить интервал cij на конечное число точек (две или три), по которым только и надлежит брать супремумы в (61). Поэтому вместо (60) и (61) мы можем выписать более точные представления
Фг(x) = max (C~x)i - xi + (a(d))i, (62)
CeVert C v v // '
Ф(x) = max C~x — x + a(d), (63)
CeVert C
где Vert C — это расширенная матрица вершин для C, т.е. множество всех точечных n х n-матриц, определяемое как
(Vert C)
{ Cij, Cij }, если 0 G Cij, { C], 0, Cij }, если 0 G Cij.
Поскольку Vert C конечно, то из (62) следует, что каждая Фг(ж) есть максимум конечного числа линейных форм. Это и доказывает предложение.
5.3. Оценка субдифференциала
Наша ближайшая цель — получить оценку субдифференциала исследуемого отображения Ф, которая будет играть важную роль в доказательстве сходимости численного алгоритма §6. Но предварительно нам необходимо ввести
Определение 18. Положительной частью х+ и отрицательной частью х- правильного интервала х назовем следующие интервалы:
x1 := { x+ | x G x } = { max{ x, 0 }| x G x },
x
Например,
{ x I x G x } = { max{ -x, 0 } I x G x }
[-1, 2]+ = [0, 2], [-1, 2]" = [0,1],
[1, 2]+ = [1, 2], [1, 2]- = [0,0].
Можно рассматривать операции взятия положительной и отрицательной частей интервала как интервальные расширения функций (•)+ и (•)-, введенных в Определении 1. Как обычно, к правильным интервальным векторам и матрицам эти операции будут применяться покомпонентным образом.
Предложение 11. Для субдифференциала дФ(ж) отображения Ф; определённого в (56), справедлива следующая оценка:
дФ^) С
C+ C" C" C+
-1.
(64)
Доказательство. Покажем сначала, что субдифференциал дФ(ж) имеет внешнюю интервальную оценку в виде правильной 2п х 2п-матрицы, составленной из интервалов односторонних частных производных Ф. Более точно
(
дФ^) С
д Ф1 (x) дФ^)
dx"
дx+
дфхН д Ф1 (x)
дx
2п
дХ+п
\
дФ2п (x) дФ^)
дx1
дxt
дФ2п^) дФ^М
дx
2n
дx On
2п
(65)
где
дФг (x) дx"
lim
а\0
Фг( xi,... ,xj"i,xj - a, xj+i,... ,x2n) - Фг( xi,... ,x2n)
a
и
дФi(x) := Фi(Х1,... ,Х]-1,Х] + а,Ху+1,... ,Х2п) — Фi(Х1,... ,Х2п) _ дх+ а
односторонние частные производные компонент Фi в точке Х слева и справа по ^-му координатному направлению.
Поскольку естественный покомпонентный порядок на К2п является прямым произведением порядков " <" на вещественных осях К, то порядковый <-субдифференциал дФ(х) является прямым произведением субдифференциалов дФi (х) отдельных компонент Фi : К2п ^ К, для каждой из которых мы можем воспользоваться Теоремой 1: из этого классического результата и из определения опорной функции следует неравенство
д Фг(х)
ду
>{yld | d G дФг(х) }.
(66)
Далее, последовательно полагая у равным векторам, имеющим ]-й компонентой — 1 или 1, ] = 1, 2,...,п, а остальными — нули, получим из (66) включение
дФг(х) С
дФг(х) д Фг(х) дх-
дх+
дФДх) дФг(х)
дх-п дх+п
равносильное (65).
Теперь можно перейти собственно к выводу оценки (64). Для удобства условимся писать ± вместо каждого отдельного из знаков + и —.В силу представления (62)
д Фг(х) дх±
д
дх± \ CeVert C
д
дх
max (C~х)г — хг + (a(d))i ) =
max (C~х)г — Si*,
CeVert с '
(67)
где Sij — символ Кронекера:
Sij =
1, если i = j, 0, иначе.
Воспользовавшись известным правилом дифференцирования функции максимума (см., например, [4], §Ш.2), можем заключить, что
Q ( \ ij-й элемент той матрицы С~, на которой
-—г max (C~x)i ) = „ (Г<~ ч
dx± \ cevert с j достигается рассматриваемый max (C x)i
(68)
В целом, объединяя (47), (67) и (68), мы придем к следующему общему виду матрицы производных по направлению:
дФг (х) дх
2n
i,j=l
(C')+ (С)-(C")~ (C")+
-1,
где C', C" G Mraxra, С, C" G Vert C. Следовательно, с учетом включения (65), действительно получим доказываемую оценку (64).
6. Субдифференциальный метод Ньютона 6.1. Алгоритм
Для решения уравнений (55) - (56) в объемлющем линейном пространстве R2n мы предлагаем следующий итерационный Алгоритм (субдифференциальный метод Ньютона со специальным начальным приближением).
В качестве начального вектора x(0) Е R2n берем решение "средней" 2n х 2п-системы линейных уравнений
(I - (mid С)~) x = a(d).
Если (k- 1)-е приближение x(k-1) Е R2n, k = 1, 2,... , уже найдено, то вычисляем какой-нибудь субградиент отображения Ф в
точке x(k-1) и полагаем
x(k) := x(k-1) - г (D(k-1))-1 (Ф(x(k-1))), где г Е (0,1] — некоторая константа.
Константа г — это релаксационный параметр, с помощью которого в методах ньютоновского типа иногда удаётся расширить область сходимости. Наш вычислительный опыт пока не позволяет однозначно утверждать полезность выбора г < 1, но мы сохраняем его отчасти как дань традиции, а отчасти как потенциальный путь для модификации Алгоритма (например, можно попытаться рассмотреть нестационарный метод, в котором г меняется от шага к шагу и т. п.). На практике мы рекомендуем брать г равным или близким к 1. Оказывается, что тогда при сходимости Алгоритм дает точное решение уравнения (55) - (56) за небольшое конечное число итераций, которое, как правило, не превосходит размерности n интервальной системы.
Отметим также, что аналогичный алгоритм использовался в работе [38] для нахождения внутренних интервальных оценок множества решений интервальных линейных систем. Единственное отличие состоит в том, что в [38] мы применяли субдифференциальный метод Ньютона для вычисления алгебраического решения уравнения A x = dual b (или, что эквивалентно, (dual A) x = b).
6.2. Доказательство сходимости
Полное и всеобъемлющее исследование субдифференциального метода Ньютона выходит за рамки настоящей работы, и ниже мы дадим, основываясь на стандартной технике (см., например, [14]), доказательство локальной теоремы сходимости. Ее утверждение сводится к следующему.
Теорема 6. Если правильная интервальная п х п-матрица С является достаточно узкой и все точечные 2п х 2п-матрицы S, удовлетворяющие условию
( С+ С- ч
3ЧС- о+) -Л
являются невырожденными, то Алгоритм сходится к ст(х*), где х* — алгебраическое решение основной системы (10).
Доказательство. Уточним, что имеется в виду под "достаточной узостью" интервальной матрицы А. Это условие означает, что
замыкание выпуклой оболочки множества
и {s-1k
Se R2nx2n, Sei С+ С+ ) - I
С С+/ J (69)
где S- 1K< обозначает прообраз конуса положительных элементов (43) при линеИном преобразовании S, само является некоторым конусом в пространстве R2n.
Это осмысленное условие. Если матрица С имеет нулевую ширину, т. е. С = C, то < , как прообраз конуса при невырожденном линейном преобразовании, является конусом. Если же точечные невырожденные 2n х 2n-матрицы S', S" "достаточно близки" друг к другу, то близки также и конусы (S')-1K< и (S")-1K< и их выпуклая оболочка все еще является конусом. Следовательно, условие (69) в некотором смысле действительно отражает "узость" интервальной матрицы С.
Итак, пусть множество (69) — некоторый конус, который мы будем обозначать К<]. Тогда он определяет некоторый частичный порядок " <" на R2n. Мы станем считать, что
x < y ^^ y - x Е K<. (70)
Основная идея нашего доказательства — продемонстрировать то, что последовательность приближений, порожденная Алгоритмом, является монотонно невозрастающей и ограниченной снизу относительно этого специальным образом сконструированного порядка
Начнём с того, что специальный выбор начального приближения
x(0) в
Алгоритме
влечет следующую цепочку соотношений: Ф( x(0)) = а( С u-l( x(0))) - x(0) +
a(d)
> (mid С) o-l( x(0))) - x(0) + a(d) в силу монотонности по включению = (mid С)~ x(0) - x(0) + a(d) в силу свойства (48) = ((mid С)~ - I) x(0) + a(d) = 0.
Поэтому
Ф( x(0)) > 0.
Далее, из неравенства (58), определяющего субдифференциал, вытекает
Ф( x(k)) > Ф( x(k-1)) + D(k-1) (x(k) - x(k-1)) для D(k-1) Е 5Ф( x(k-1)) и всех k = 1, 2,... . Но, по построению Алгоритма,
D(k-1) (x(k) - x(k-1)) = -гФ( x(k-1)). (71)
Следовательно, при 0 < г < 1
Ф(x(k)) > 0, k = 1,2,.... (72)
Что стоит за неравенством (72)? Привлекая представление (63), мы можем заключить,
что
max C~x(k) — x(k) + a(d) > 0,
CeVert с
или
max C~x(k) — x( ) + a(d) E K<.
C GVert с
В частности, для некоторой матрицы
5 (k) е( C+ C+)—',
на которой достигается (max C~x(k) — x(k)), имеет место
5 (k)x(k) + a(d) E K<. Так как эта матрица 5(k) по условию Теоремы невырождена, то
x(k) + (5(k))-V(d) e (5(k))-1K< С K<, а это включение, в силу (70), означает, что
— (5(k))-V(d) < x(k). Если же мы положим вектор £ E R2ra таким, что
£ := inf—5-V(d)
5 E R2rax2ra, 5 e{ ) — I
C- C+
то тогда £ < Х(к) для всех к = 1, 2,..., т. е. последовательность { Х(к)} оказывается в самом деле ограниченной снизу относительно порядка " <".
Другой важный момент доказательства: последовательность { Х(к)}, порожденная рассматриваемым Алгоритмом, является монотонно невозрастающей относительно "<", т.е.
Х(к) < Х(к-1) (73)
для всех к = 1, 2,....
Действительно, комбинируя (71) и (72), нетрудно получить
D(k-1) (Х(к) — Х(к-1)) < 0.
Из Предложения 11 следует, что для всех D(k-1) имеют место включения
D(k-1) е( С+ СЛ — I. \С- С+
Отсюда, с учетом (69), следует (73). Мы доказали, таким образом, что
£ < x(k) < x(k-1), k = 1,2,... (74)
В общем случае связь между порядком и топологией в частично упорядоченном линейном топологическом пространстве может быть весьма сложной, но, к счастью, в конечномерном пространстве ситуация решительно упрощается: любая последовательность, монотонная и ограниченная относительно частичного порядка, согласованного с линейной структурой пространства, всегда имеет (топологический) предел.15 Следовательно, из (74) мы можем заключить о существовании некоторого предела х* последовательности { х(к} порождаемой Алгоритмом. Значение этого предела является решением уравнения для неподвижной точки
х* = х* - г (Д*)"1(Ф(х*)),
где матрица D* Е дФ( х*) невырождена в силу (64) и условий доказываемой Теоремы. Итак, Ф( х*) = 0.
Из проведённого доказательства следует, между прочим, что если г = 1, то неравенство
Ф( х(к)) > 0, к =1,2,... (72)
выполняется вне зависимости от выбора х(0). Поэтому при г =1 мы можем брать начальное приближение Алгоритма не обязательно как решение специальной "средней" системы уравнений, а совершенно произвольно (например, нулевым). Иногда это удобно упрощением логической структуры программы, хотя и не уменьшает объёма вычислительной работы, требуемой для сходимости к решению (количество итераций возрастет на 1).
6.3. Вычисление субдифференциала
Сейчас мы опишем методику вычисления субдифференциала дФ(х), необходимую при практической реализации субдифференциального метода Ньютона. Как и следовало ожидать, субдифференциал дФ(х), вообще говоря, не совпадает с интервальной матрицей из правой части (65), образованной интервалами односторонних частных производных. Для некоторых интервальных матриц С равенство на месте включения (65) может не выполняться даже на множестве аргументов х ненулевой меры. Тем не менее мы можем выписать явный вид субдифференциала дФ(х) в общем случае.
Вспомним определение стандартного погружения: для интервального вектора х Е Жга
(a(x))i = -Xi, если i Е{1, 2,..., n}, (a(x))i = xi, если i е{п + 1,..., 2n}.
Обозначая через еi вектор, имеющий ^й компонентой 1, а остальные нули, и привлекая
15Это факт часто формулируют в следующем эквивалентном виде: в конечномерном пространстве всякий конус является правильным [8, 9].
известный результат о субдифференциале суммы [13, 15, 16], найдём дФДх) = д( (а(Са-1(х))) - Xi + Иф^ )
/ п
= д ( с^ [ ху ,х^+п] - Xi +
3=1
д ^ ^ cij [ х3 ,х3+п] ei 3=1
п
= д (су [-хз ,хз+п]) - е^ для i е{1, 2,...,п}
3 = 1
дФi(x) = д( (а(Са-1(х))) - ^ + (a(d))i )
(п
[-хз,хз+П] - х + ИФ)
3=1
п
= дХ С3[
Cij [ х3 , х 3+п I е?!
3=1
п
У^ д (с^- [-х3 х+п]) - ei для i е{п +1,...,2п}. (76)
3 = 1
Таким образом, вычисление субдифференциала дФi(x) сводится к вычислению субдифференциалов простейших отображений К2п ^ К следующих двух видов
( х1,х2,...,х2п) ^ С3 • [-х3 ,х3+п], (77)
( х1,х2,...,х2п) ^ С3 • [-х3 ,х3+п], (78)
где С3 — некоторые правильные интервалы. Ниже, чтобы не загромождать изложение, имеет смысл не выписывать "немые" компоненты аргумента х, никак не влияющие на значения этих отображений, так что вместо (77)-(78) мы будем рассматривать
( х3, xi+n) ' ^ cij •[ х3, х3
( х3 ,х3+п) ^ cij х3 ,х3+п],
где cij — некоторые правильные интервалы.
Воспользовавшись формулой Лакеева (28) и тем обстоятельством, что (-х)- = х+ и (-х)+ = х-, получим
д (СЧ [-х3 ,х3+п]) = С+ д( х- ) + С- д( х-+п) - д( тах{ С+ х+, С-х++п} ) , (79)
д (сij [-х3 ,х3+п]) = д (тах{ С+ С-х+} ) - С+ д( х-+п) - с- д( х-). (80)
Известно, что субдифференциал функции максимума в некоторой точке есть замыкание выпуклой оболочки объединения субдифференциалов тех функций, на которых рассматриваемый максимум достигается в данной точке (см., например, [13, 15, 16]). Привлекая дополнительно определения положительной и отрицательной частей числа, легко можем вывести, что
(0, 0), если Хз < 0, д(Х+) = { ([0,1], 0), если Хз = 0, (1, 0), если Хз > 0,
д (Х- )
(—1, 0), ([—1, 0], 0), (0,0),
если Хз < 0,
если Хз = 0, если Хз > 0,
(81)
и
д( Х++п)
(0, 0), если Хз+п < 0, (0, [0,1]), если Хз+п = 0, (0,1), если Хз+п > 0,
(0, —1), если Хз+п < 0, д(Х-+п) = <( (0, [—1, 0]), если Хз+п = 0, (0, 0), если Хз+п > 0.
(82)
Таким образом, вычисление первых двух слагаемых в выражении (79) и последних двух слагаемых в (80) не представляет трудностей.
Далее, вычисление оставшихся членов сумм (79) и (80) требует предварительного нахождения и сравнения значений с+Х+ и с-Х++п, с+Х++п и с-Х+ соответственно. Но величины
++
++
-+
iз, Хз , Хз+п все неотрицательны, и потому, например, из неравенства сзХз > с^-Х-+п
следует Х+ > 0, так что д( Х+) = (1, 0). Аналогично,
с + ^^^^ << с Х' +
сз Хз < сз Хз+п
с + ^^^^ с Х' +
^зз+п —ъзз
с + ^^^^ << с Х' +
сзХз+п < сзХз
=
д( Х++п) = (0,1), д( Х++п) = (0,1), д( Х+) = (1,0).
С учетом выписанных равенств мы можем заключить:
д (тах{ с+x+, с-Х++п} )
(с+, 0),
выпуклая оболочка С+ д( Х+) и с-д( x++n),
(0, с-),
если с+Х+ > с-
если с+Х+
с- Х+ ,
если с+Х+ < с-^^
(83)
и
д ( max{ с+ Х++п, с-Х+} )
(0, с+), выпуклая оболочка
с++ д( Х++п) и с-д( x+),
(с-, 0),
если ^ Хз +п с?Хз ,
если с+ Х++п с-Х+ ,
если с+ Х++п < с-Х+.
(84)
Остается лишь уточнить вид искомых субдифференциалов (83) и (84) в точках, где
достигаются равенства с+Х+
с-и с+Х+^ = с-Х+. Разбор всех возможных ситуа-
—Ъз з+п ъз з+п
ций является в этих случаях несложным, хотя и довольно хлопотным делом. Например, различные конфигурации субдифференциала д(max{ с+Х+, с-Х++п} ) показаны на рис. 4. Похоже выглядит и д (max{ с+Х++п, с- Х+} ).
(д...
с+ (д. .. ),
4 Х3 Х++п 0
С++ = 0, с" = 0
(д ... )3+п
Ч (д...).
Х3 = Х++п = 0
-г3
(д ... )3+п ■ (д ... )3+п
0 с+ (д...)3 0 (д..
С5 3 = С-3 Х++п = 0
с+ = 0 с-. = 0
С+3 Х+ = С-3 Х++п = 0
С+ = 0, С" = 0
Рис. 4. Различные конфигурации субдифференциала д(тах{ с+3Х+, с"Х++п} ) в точках где с.Х+ = с"Х++п.
В действительности, нам нужно немногое: вычислительная схема субдифференциального метода Ньютона требует нахождения какого-нибудь одного (безразлично какого именно) субградиента отображения Ф(х), а для этого нам достаточно предъявить по единственному субградиенту для функций
тах{ с+ х+, с--х~++п}
тах{ с+ х++п, с-3 х+}.
Соответственно, нам нужна только одна какая-нибудь точка выпуклой оболочки с+д(х+) и с"д( х++п) при с+х+ = с"х++п и одна какая-нибудь точка выпуклой оболочки с+д( х++п) и с"д( х+) при с+3х++п = с"х+. Нетрудно понять, что в первом случае такой точкой может
'1^+ 1-"
служить, например, (|с^, В целом
1 с-) (см. рис. 4), а во втором — (
1с" ±с+
2-г3 2^г3
0
0
3
).
д (тах{ с+3х
I с хх +
г3 3 ' —г3 3+п
{ (
(с+ , 0) , если с+ х+ > О"х++п,
2 с+3, 2с") , если с+ х+ = с"3х++п, (0, с") , если С+ х+ < с"х++п,
(85)
если с+Х+,
7Г+„.+
Ъз з+п
Ъз з+п
(86)
На практике вычисление искомого субградиента для Ф(х) может быть выполнено одновременно с вычислением значений этого отображения, опираясь на формулы (75)-(82),
Алгебраический подход предоставляет новый взгляд на старый предмет, следствием чего является очень общий и эффективный численный алгоритм для отыскания внешних интервальных оценок множеств решений. Но каково его практическое значение? Иными словами, каково положение развиваемого нами алгебраического подхода среди других методов решения "внешней задачи" (4)?
Все численные методы решения внешней задачи для интервальных линейных систем можно разделить на три большие группы. Во-первых, это методы для нахождения оптимальных решений внешней задачи, т. е. точных (неулучшаемых) оценок множества решений. Поскольку задача вычисления таких решений NP-трудна, методы этой группы являются очень трудоёмкими и по своей структуре близки переборным алгоритмам дискретной оптимизации (см., например, [37]). Во-вторых, это методы общего назначения для решения внешней задачи, в которых на ответ не накладывается требование оптимальности или достижения гарантированной точности. Третью группу методов образуют различные специализированные алгоритмы для ИСЛАУ частного вида (блочных, ленточных и т. п.).
Алгебраический подход наследует качество внешнего оценивания множества решений от интервальных итерационных схем. Следующая теорема — это известный результат Д. М. Гея [20], переформулированный в терминах "алгебраического подхода".
Теорема 7. Пусть ПЕ — интервальная оболочка множества решений Е исходной интервальной системы Ах = Ь; х* — алгебраическое решение уравнения (5)
и и := \\1 — СА|| < 3. Тогда справедливо следующее неравенство для отклонения внешней интервальной оценки х* множества решений Е от оптимальной оценки ПЕ в псевдометрике (11):
В то же время вычислительная сложность субдифференциального метода Ньютона почти такая же, как и конечных прямых алгоритмов. В целом, как нам представляется, алгебраический подход, соответствующим образом развитый и модифицированный, может служить эффективным средством для вычисления хороших внешних оценок для достаточно общих интервальных линейных систем. Иначе говоря, мы мыслим его как хороший метод общего назначения. Цель настоящего параграфа — набросать, не вдаваясь в малосущественные детали, краткую схему дальнейшего возможного развития алгебраического подхода.
(85) и (86).
7. Модификации алгебраического подхода
х = (I — GA)x + Gb,
В настоящее время среди методов общего назначения наиболее популярны интервальный метод Гаусса—Зейделя с предобуславливанием, интервальный метод Гаусса, который также часто применяют с предобуславливанием, и недавно предложенная процедура Хансена—Рона. Все эти алгоритмы являются естественными конкурентами развиваемого нами алгебраического подхода.
Одной из основных проблем алгебраического подхода является приведение данной интервальной линейной системы Ах = Ь к виду х = Сх + d, в котором для матрицы С выполнено условие р(|С|) < 1. Один из способов такого сведения был указан в Предложении 1, и здесь имеет смысл дополнительно обсудить выбор диагональной матрицы G.
Коль скоро значение спектрального радиуса матрицы |С| = II — GA| столь критично для разрешимости простейшего уравнения (5)
и применимости алгебраического подхода, то посредством подходящего выбора G следует попытаться сделать так, чтобы р(|1 — GA|) был как можно меньшим. И, во-вторых, даже если в (10) мы имели р(|С|) < 1 и алгебраический подход был применим к этому простейшему уравнению, то ширина его неподвижной точки, как показано различными исследователями (например, в [18]), также решающим образом зависит от величины р(|С|). Чем меньше р(|С|), тем лучшую, при прочих равных условиях, внешнюю интервальную оценку множества решений мы получаем. Можно порекомендовать, например, следующий выбор матрицы G.
Определение 19. Отклонением правильного интервала х назовем величину
т. е. G является диагональной матрицей, составленной из величин, обратных отклонениям диагональных элементов A. Ниже мы экспериментально демонстрируем, что даже такой простейший выбор G ведет к неплохим результатам. При этом область применимости нашего подхода действительно расширяется и улучшается качество внешнего оценивания в сравнении с немодифицированной версией (5).
Тем не менее в общем случае указанный в Предложении 1 способ эквивалентного приведения интервальной системы к fixed-point form не всегда может достичь желаемого. А. Ноймайер недавно доказал, что при рассмотренном нами отщеплении диагонального отклонения матрицы A в уравнении (5) алгебраический подход применим в точности к интервальным линейным системам с так называемыми ^-матрицами. Напомним
Определение 20 [32]. Пусть (a) — наименьшее расстояние точек интервала a до нуля, т. е.
x = (I — GA) x + Gb
т. е. наиболее удаленную от нуля точку интервала х. В качестве диагональной матрицы G в (5) возьмём
i (dev an)-1 0 \
G := (dev diagA)-1 = ...
0 (dev ann) 1 )
min{|a|, |a|}, если a ^ 0, 0, если a 0.
Для правильной интервальной матрицы A = (a-) Е IRnxn матрицей сравнения называется матрица (A) Е Rnxn, такая, что
. . „ , . , Г (a-), если i = j,
ij-й элемент (A) := < , , . , .
[ —I a-1, если i = j.
Правильная интервальная квадратная матрица A называется H-матрицей, если её матрица сравнения является M-матрицей, или, что равносильно, если (A) u > 0 для некоторого вектора u > 0.
В частности, H-матрицами являются интервальные матрицы со строгим диагональным преобладанием, удовлетворяющие
(aii) >^2 I aik I для i =1,2,...,n. (87)
k=i
Оказывается, что рассмотренная нами простейшая версия алгебраического подхода с диагональным расщеплением матрицы системы будет давать тем лучшие результаты, чем больше у матрицы A диагональное преобладание, т. е. чем больше разнятся левая и правая части в неравенстве (87). Это продемонстрировано в приводимых ниже в разделе 8 результатах тестовых рассчетов.
В общем случае естественный выход из создавшегося затруднения состоит в том, чтобы в Предложении 1 при сведении "внешней задачи" к уравнению (5) не ограничивать себя только диагональным видом матриц G. Если в качестве G рассматривается произвольная точечная матрица, то результат Предложения 1 оказывается уже неверным: множества решений систем (1) и (5) неодинаковы. Тем не менее, поскольку множество решений (1) содержится во множестве решений (5), то мы все равно можем заменить внешнюю задачу для (1) на внешнюю задачу для (5), хотя и неэквивалентным образом, с некоторым огрублением.
Нетрудно понять, что описанный приём приведения эквивалентен так называемому предобуславливанию интервальной линейной системы (по-английски preconditioning). Предобуславливание впервые было предложено Хансеном и является одним из наиболее часто используемых преобразований интервальных линейных систем. Предобуславлива-ние заключается в домножении обеих частей интервальной линейной системы слева на некоторую точечную матрицу G, так что вместо исходной системы (1)
Ax = b
мы получаем предобусловленную интервальную систему
GAx = Gb, (88)
множество решений которой не уже, чем множество решений для (1). Далее, от системы (88) можно перейти к
0 = —GA + Gb,
и, добавляя к обеим частям по x, будем иметь (5).
Наиболее часто в качестве предобуславливающей матрицы берут обратную к "средней" матрице системы, т.е. G = (midA)-1. Подобное предобуславливание привлекательно тем, что получающаяся предобусловленная система (88) имеет своей средней матрицей единичную матрицу. Соответственно, в матрице (I — GA) все интервальные элементы
симметричны относительно нуля. Ноймайер [32] доказал ряд теоретических результатов, свидетельствующих о некоторой (правда, довольно специфической) оптимальности пре-добуславливания с помощью обратной средней матрицы. Кроме того, для таких систем оптимальные внешние оценки множества решений могут быть очень быстро (ценой одного обращения точечной матрицы) получены с помощью процедуры Хансена—Рона [23, 36].
Но улучшение свойств интервальной системы путём предобуславливания не достигается совершенно бесплатно. Неизбежная издержка процедуры предобуславливания — увеличение множества решений предобусловленной системы (88) в сравнении с множеством решений исходной ИСЛАУ. И это нежелательное расширение множества решений является, вообще говоря, тем большим, чем больше предобуславливающая матрица отличается от диагональной (конкретные примеры с иллюстрациями читатель может найти в [23, 32]). По этой причине нежелательно брать матрицу G "слишком сильно" отличающейся от диагональной.
С другой стороны, располагая более детальной информацией об интервальной матрице системы или об алгоритме, можно строить предобуславливающие матрицы, лучшие чем "обратная средняя". Например, в популярном интервальном методе Гаусса—Зейделя мы имеем возможность выбирать даже оптимальные (в том или ином смысле) предобу-славливатели, которые перевычисляются для каждого отдельного шага алгоритма [26]. На наш взгляд, алгебраический подход также может получить дальнейшее развитие и расширение сферы своей применимости на основе подходящего выбора предобуславливания. Имеет смысл рассмотреть предобуславливающие матрицы, в некотором смысле промежуточные между "обратной средней" и диагональной. Тогда они не будут сильно искажать множество решений, приводя в то же время матрицу к нужному значению спектрального радиуса. Другой многообещающий путь модификации алгебраического подхода — использование расщепления интервальной матрицы системы.
8. Вычислительные эксперименты
В этом параграфе мы приводим результаты численных экспериментов на персональном компьютере, выполненных с субдифференциальным методом Ньютона, реализующим алгебраический подход к внешней задаче для интервальных линейных систем. Проверка условия p(\I — GA)|) < 1, которое столь существенно для применимости алгебраического подхода, была заменена нами на проверку неравенства \\\I — GA\ || < 1, которое является более сильным в силу известного соотношения между спектральным радиусом и матричными нормами. Алгоритм был реализован на Turbo C в стандартной машинной арифметике двойной разрядности с плавающей точкой.16 Приводимые ниже результаты округлены до трех десятичных знаков после запятой.
Как мы уже отмечали, естественными конкурентами алгебраического подхода являются знаменитый интервальный метод Гаусса [2, 6, 32] и недавно предложенная процедура Хансена—Рона [23, 36]. Каждая из этих методик имеет свою собственную область применимости, и для каждой существует некоторый специальный класс (или даже классы) интервальных линейных систем, на которых она дает лучшие результаты — внешние оценки множеств решений с меньшей избыточной шириной. Хорошо известно, что для вынесения того или иного определенного заключения о сравнительных качествах метода требуется
16Всё программное обеспечение имеет статус public domain и находится на сервере Института вычислительных технологий СО РАН по адресу ftp://www-sbras.ict.nsc.ru в файле pub/interval/shary.zip.
проведение большого количества рутинной работы. Несколько случайных примеров едва ли смогут убедить в том, что некоторый подход действительно лучше остальных. Ниже мы сравниваем вышеупомянутые методы на ряде тестовых интервальных линейных систем с ^-матрицами, а термин "алгебраический подход" мы используем для обозначения его простейшей версии, в которой решение исходной задачи (4) сводится к отысканию алгебраического решения уравнения (5) с рассмотренным в предыдущем параграфе выбором G := (dev diag А)-1. Это сделано для того, чтобы продемонстрировать работу алгебраического подхода "в чистом виде", поскольку при использовании традиционного предобуславливания "обратной средней" процедура Хансена—Рона даёт заведомо лучшие результаты.
Пример 0 из [23].
( [0.7,1.3] [—0.3,0.3] [—0.3,0.3] \ [—0.3, 0.3] [0.7,1.3] [—0.3, 0.3]
Х=
( [—14, —7] \ [9,12]
\ [—0.3,0.3] [—0.3,0.3] [0.7,1.3] / V [—3,3] В применении к этой системе интервальный метод Гаусса дает
[—101, 71] [—62.25, 99] у [—90,90]) у а результатом применения подхода Хансена является
( [—101,17] ^
[—15, 99] У [—90,90] )
тогда как при реализации алгебраического подхода субдифференциальный метод Ньютона сходится за две итерации к
/ [—101, 71] \
[—69,99] . у [—90,90] у
Поскольку средняя матрица системы является единичной, то неудивительно, что подход Хансена оказывается в этом (довольно искусственном) примере лучшим по качеству оценивания.
Пример 1. Обратимся к интервальной линейной системе из работы [34]
Х
( [15,17] [—3, 3.01] [—3, 3.01] [—3, 3.01] \
[—3, 3.01] [15,17] [—3, 2.99] [—3, 2.99]
[—3, 2.99] [—3, 2.99] [15,17] [—3, 3.01]
\ [—3, 3.01] [—3, 3.01] [—3, 2.99] [15,17] )
Интервальным методом Гаусса мы получаем внешнюю оценку множества решений системы в виде
( [—1.03,0.495] \
( [—6, —2] \ [4,5] [—2, 4] [8,10]
[—0.347, 0.974] [—0.770, 0.917] [0.150,1.25]
/
а с помощью методики Хансена [23]
( [—1.03,0.363] \ [—0.223, 0.975] [—0.752, 0.919] \ [0.149,1.25] )
Алгебраический подход сходится за 4 итерации к внешней оценке
( [—1.03,0.495] \ [—0.372, 0.974] [—0.785, 0.917] V [—0.05,1.25] )
что совсем неплохо: средняя матрица интервальной системы опять близка к диагональной и это благоприятствует хорошему качеству результатов, получаемых по методике Хансена—Рона.
Пример 2, неизменный пример Хансена (см. [6, 23]):
[2, 3] [0,1] [1, 2] [2, 3]
х
[0,120] [60, 240]
(7)
В данном случае алгебраический подход (с отщеплением матрицы диагонального отклонения) сходится за 2 итерации к точному алгебраическому решению
[—120, 90] [—60, 240]
(89)
являющемуся внешней интервальной оценкой множества решений. Этот же ответ дает и интервальный метод Гаусса.
Заметим, что интервал (89) — это даже оптимальная (наиболее узкая) интервальная оценка множества решений системы (7). Но применение к ней подхода Хансена [23] приводит к худшему результату
— 120, Ш5!
11
—60, 2940]
что является следствием огрубляющего предобуславливания, встроенного в процедуру Хансена—Рона.
Следующий интересный ряд Примеров 3-7 с фиксированной интервальной матрицей заимствован нами из работы Нинга и Кирфотта [34], в которой делается попытка дальнейшего развития подхода Хансена—Рона.
Пример 3 [34]. Пусть дана интервальная линейная система Ах = Ь с
( [3.7,4.3] [—1.5, —0.5] [0,0] ^
А = [—1.5, —0.5] [3.7,4.3] [—1.5, —0.5]
у [0,0] [—1.5, —0.5] [3.7,4.3]
и Ь = ([—14,14], [—9,9], [—3, 3])т.
Тогда, применяя интервальный метод Гаусса, мы получим следующую оценку множе-
ства решений:
( [-6.38, 6.38] ^ [-6.40, 6.40]
(91)
\ [-3.40, 3.40] у
Тот же самый результат дает использование методики Хансена [23], а также ее усовершенствованные варианты, предложенные Роном [36] и Нингом и Кирфоттом [34]. Интервал (91) является интервальной оболочкой множества решений рассматриваемой системы, и к нему же всего за 1 итерацию приводит алгебраический подход.
Пример 4 [34]. Пусть дана интервальная линейная система Ах = Ь с той же матрицей А, что и в Примере 3 и правой частью Ь = ([-14, 0], [-9, 0], [-3, 0] )т.
Применяя интервальный метод Гаусса, мы получим оценку множества решений
[-6.38, 0] [-6.40, 0] V [-3.40, 0] )
(92)
Поскольку матрица (90) — это интервальная М-матрица и все компоненты вектора правых частей имеют одинаковый знак, этот интервал является оптимальной (наименьшей) оценкой множества решений. Но использование методики Хансена [23] или модификации Рона [36] приводит к более широкому гипербрусу
/ [-6.38,1.12] \
[-6.40,1.54] , у [-3.40,1.40] у
а модификация Нинга—Кирфотта дает еще более грубый результат
( [-6.38,1.67] ^
[-6.40, 2.77] V [-3.40, 2.40] у
Напротив, алгебраический подход позволяет найти точную (с точностью до ошибок округления) интервальную оболочку (92) множества решений рассматриваемой системы всего за 1 (одну) итерацию.
Пример 5 [34]. Пусть дана интервальная линейная система Ах = Ь с той же матрицей А, что и в Примере 3 и правой частью Ь = ([0,14], [0, 9], [0, 3] )т. Интервальный метод Гаусса дает интервал
/ [0, 6.38] \
[0,6.40] , (93)
V [0, 3.40] У
который служит оболочкой множества решений рассматриваемой системы. Применяя методику Хансена [23], мы получим более широкий оценивающий гипербрус
/ [-1.12, 6.38] ^
[-1.54, 6.40] у [-1.40, 3.40] у
а модификация Нинга—Кирфотта приводит к еще более грубому результату
/ [-1.67, 6.38] \
[-2.77,6.40] . у [-2.40, 3.40] у
Что же касается алгебраического подхода, то с его помощью мы снова получаем за одну итерацию интервальный вектор оптимального решения (93).
Пример 6 [34]. Пусть дана интервальная линейная система Ах = Ь с той же матрицей А, что и в Примере 3 и правой частью Ь = ([2,14], [-9, -3], [-3,1] )т.
Применение интервального алгоритма Гаусса дает оценивающий гипербрус
/ [-1.09,4.29] \
[-4.02,1.24] . у [-2.44, 0.773] у
Используя методику Хансена [23], мы получим более широкий ответ
( [-0.995, 5.01] \
[-4.64,1.52] , у [-2.69,1.38] у
тогда как наименьшей интервальной оценкой множества решений служит
( [-0.995, 4.29] \
[-3.79,1.24] . у [-2.35, 0.773] у
Приятно отметить, что, как и в предыдущих случаях, алгебраический подход дает этот интервальный ответ всего за 1 (одну) итерацию.
Пример 7 [34]. Пусть дана интервальная линейная система Ах = Ь с той же матрицей А, что и в Примере 3 и правой частью Ь = ([2,14], [3, 9], [-3,1] )т. Применение интервального метода Гаусса приводит к оценке
( [0.517,6.25] \
[0.450,6.07] . у [-0.881, 2.73] у
Использование методики Хансена из [23] дает более широкий интервал
( [-0.206, 6.25] \
[-0.386,6.07] , у [-2.01,2.73] у
в то время как интервальной оболочкой множества решений является
[0.523, 6.25] [0.499,6.07] . у [-0.743, 2.73] у
И снова алгебраический подход демонстрирует свое превосходство: он сходится к этому наилучшему интервальному ответу за 2 итерации.
В целом наш вычислительный опыт свидетельствует о том, что для интервальных линейных систем с Н-матрицами, для которых средняя матрица не является близкой к диагональной, алгебраический подход работает очевидно лучше процедуры Хансена—Рона— Нинга—Кирфотта. Как следует выбирать предобуславливатели для общих интервальных линейных систем? насколько при этом расширится сфера приложимости алгебраического подхода? как он будет работать в сравнении с другими методами решения внешней задачи для ИСЛАУ? Всё это открытые и очень интересные вопросы, которые ещё ждут своего разрешения.
Список литературы
[1] Акилов Г.П., Кутателадзе С.С. Упорядоченные векторные пространства. Наука, Новосибирск, 1978.
[2] Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. Мир, М., 1987.
[3] Биркгоф Г. Теория решёток. Наука, М., 1984.
[4] Демьянов В.Ф., МалОЗЕмов В.Н. Введение в минимакс. Наука, М., 1972.
[5] ДОБРОНЕЦ Б.С., ШаЙДУРОВ В.В. Двусторонние численные методы. Наука, Новосибирск, 1990.
[6] Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. Наука, Новосибирск, 1986.
[7] КоллАТЦ Л. Функциональный анализ и вычислительная математика. Мир, М., 1969.
[8] Красносельский М.А. Положительные решения операторных уравнений. Физ-матгиз, М., 1962.
[9] Красносельский М.А., Лифшиц Е.А., Соболев А.В. Позитивные линейные системы. Наука, М., 1985.
[10] Курош А.Г. Лекции по общей алгебре. Наука, М., 1973.
[11] Лакеев А.В., Носков С.И. О множестве решений линейного уравнения с интер-вально заданными оператором и правой частью. Сиб. матем. журн., 35, у 5, 1994, 1074-1084.
[12] Мальцев А.И. Основы линейной алгебры. Наука, М., 1970.
[13] Обэн Ж.-П. Нелинейный анализ и его экономические приложения. Мир, М., 1988.
[14] Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. Мир, М., 1975.
[15] Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. Наука, М., 1980.
[16] Рокафеллар Р. Выпуклый анализ. Мир, М., 1973.
[17] ШАРЫй С.П. Об одной интервальной задаче линейной алгебры. В "Информационно-оперативный материал", Препринт у2/1987, ВЦ СО АН СССР, Красноярск, 1987, 45-46.
[18] Apostolatos N., Kulisch U. Grundzüge einer Intervallrechnung für Matrizen und einige Anwendungen. Electronische Rechenanlagen, 10, у 2, 1968, 73-83.
[19] Berti S. The solution of an interval equation. Mathematica, 11 (34), у 2, 1969, 189-194.
[20] Gay D.M. Solving interval linear equations. SIAM J. on Num. Anal., 19, у 4, 1982, 858-870.
[21] Gardenes E., Trepat A. Fundamentals of SIGLA, an interval computing system over the completed set of intervals. Computing, 24, 1980, 161-179.
[22] Hansen E. Global optimization using interval analysis. Marcel Dekker, N. Y., 1992.
[23] Hansen E. Bounding the solution of interval linear equations. SIAM J. on Num. Anal., 29, у 5, 1992, 1493-1503.
[24] KAUCHER E. Algebraische Erweiterungen der Intervallrechnung unter Erhaltung Ord-nungs- und Verbandsstrukturen. Comput. Supplement, 1, 1977, 65-79.
[25] KAUCHER E. Interval analysis in the extended interval space IR. Ibid., 2, 1980, 33-49.
[26] KEARFOTT R.B. Rigorous global search: continuous problems. Kluwer, Dordrecht, 1996.
[27] KreinoviCH v., Lakeyev A., Rohn J., Kahl P. Computational complexity and feasibility of data processing and interval computations. Kluwer, Dordrecht, 1997.
[28] KreinoviCH v., Lakeyev A.V. NP-hard classes of linear algebraic systems with uncertainties. Reliable Comput., 3, у 1, 1997, 51-81.
[29] Kupriyanova L. Inner estimation of the united solution set of interval linear algebraic system. Ibid., 1, у1, 1995, 15-31.
[30] Lakeyev A.V. Linear algebraic equations in Kaucher arithmetic. In "Int. J. of Reliable Comput. Supplement 1995" (Extended Abstracts of APIC'95: International Workshop on Applications of Interval Computations, El Paso, Texas, February 23-25, 1995), UTEP, El Paso, 130-133.
[31] MAYER O. Algebraische und metrische Strukturen in der Intervallrechnung und einige Anwendungen. Computing, 5, 1970, 144-162.
[32] NEUMAIER A. Interval methods for systems of equations. Cambridge University Press, Cambridge, 1990.
[33] Nickel K. Die Auflösbarkeit linearer Kreisscheiben- und Intervall-Gleichungssystemen. Linear Algebra and its Applicat., 44, 1982, 19-40.
[34] Ning S., Kearfott R.B. A comparison of some methods for solving linear interval equations. SIAM J. on Num. Anal., 34, у 4, 1997, 1289-1305.
[35] Ratschek H., Sauer W. Linear interval equations. Computing, 28, 1982, 105-115.
114
c. 11. mapbrn
[36] ROHN J. Cheap and tight bounds: the recent result by E. Hansen can be made more efficient. Interval Computations, y 4, 1993, 13-21.
[37] SHARY S.P. On optimal solution of interval linear equations. SIAM J. on Num. Anal., 32, y 2, 1995, 610-630.
[38] SHARY S.P. Algebraic approach to the interval linear static identification, tolerance and control problems, or One more application of Kaucher arithmetic. Reliable Comput., 2, y 1, 1996, 3-33.
[39] SHARY S.P. Algebraic solutions to interval linear equations and their applications. In "Numerical Methods and Error Bounds", Eds. G. Alefeld and J. Herzberger, Akademie Verlag, Berlin, 1996, 224-233.
[40] SHARY S.P. A new approach to the analysis of static systems under interval uncertainty. In "Scientific Comput. and Validated Numerics", Eds. G. Alefeld, A. Frommer and B. Lang, Akademie Verlag, Berlin, 1996, 118-132.
[41] SHARY S.P. Algebraic approach to the analysis of linear static systems with interval uncertainty. Russ. J. on Num. Anal. and Mathem. Modeling, 11, y 3, 1996, 259-274.
[42] SHARY S.P. Controllable solution set to interval static systems. Appl. Mathem. and Computat., 86, y 2-3, 1997, 185-196.
[43] SHOKIN Yu.I. On interval problems, interval algorithms and their computational complexity. In "Scientific Comput. and Validated Numerics", Eds. G. Alefeld, A. Frommer and B. Lang, Akademie Verlag, Berlin, 1996, 314-328.
nocmyuuAa e peda^uw 3 Mapma 1998 г.
Правила для Авторов
1. Статья должна быть представлена в редакцию в одной из двух форм:
1.1. Два экземпляра рукописи, отпечатанных на одной стороне листа стандартного формата A4 (297x210 мм) + файлы рукописи в формате LTEX или AmS-LTEX + файлы рисунков на дискете;
1.2. Два экземпляра рукописи, отпечатанных на одной стороне листа стандартного формата A4 (297x210 мм) + электронная версия рукописи, набранная в текстовом формате Microsoft Word (RTF) + файлы рисунков на дискете.
Время прохождения издательского цикла для рукописей, представленных в форме 1.1, минимально, а для рукописей в форме 1.2 — максимально.
2. Все файлы предоставляются на дискете 3.5" формата 1440 Кбайт. Возможна пересылка файлов по электронной почте jct@ict.nsc.ru в виде *.zip архива. Текстовые файлы и файлы TX представляются в кодировке CP866 (MS-DOS).
3. Статья предваряется аннотацией, содержащей не более 300 знаков. На отдельной странице прилагаются на русском и английском языках название статьи, имена авторов, аннотация и ключевые слова.
4. Статья должна сопровождаться разрешением на опубликование от учреждения, в котором выполнена данная работа. В сопроводительном письме необходимо указать почтовый адрес, телефоны, e-mail автора, с которым будет вестись переписка.
5. Для каждого автора должна быть представлена (на русском и английском языках) в виде отдельного файла следующая информация:
о Фамилия, имя, отчество о место работы и должность о почтовый адрес о ученая степень и звание о год рождения
о телефоны с кодом города (дом. и служебный), факс, e-mail, URL домашней страницы о область научных интересов (краткое резюме)
6. Рекомендации по оформлению статьи в LaTeX.
Оформление статьи в LTEX 2.09 Оформление статьи в LTEX 2е
7. Все материалы следует направлять по адресу: редакция журнала "Вычислительные технологии", Институт вычислительных технологий СО РАН, проспект Ак. Лаврентьева 6, 630090, Новосибирск, 90, Россия, Пестунову Игорю Алексеевичу (отв. секретарь) — тел.: +7(3832)343785, Митиной Галине Григорьевне (зав. РИО).
Оформление статьи в LT^X 2.09
Стиль журнала jctart.sty.
Для представления статей на английском языке используйте стиль jctart-e.sty.
Структура файла формата LaTeX должна быть следующей: \documentstyle{jctart}
\setlength{\textwidth}{170mm}\setlength{\textheight}{240mm}
\begin{document}
\pagestyle{myheadings}
\markboth{<^ О. Фамилия автора(ов)>}{<КРАТКОЕ НАЗВАНИЕ СТАТЬИ (ДО 40 СИМВОЛОВ)>} ^^^{<НАЗВАНИЕ CTАТЬИ>\footnote{<Ссылка на поддержку (факультативно)>.}} \author{\sc{<^ О. Фамилия первого автора>}\\
\^{<Место работы первого автора>}\\[2mm] \sc{<^ О. Фамилия второго автора>}\\ \^{<Место работы второго автора>}\\[2mm] ...} \maketitle \begin{abstract} <Текст аннотации> \end{abstract} <Текст статьи> \begin{thebibliography} <Библиография (\item-список)> \end{thebibliography} \end{document}
<Перевод названия статьи на английский язык (или на русский, если статья на английском)> <аннотации на английский язык (или на русский, если статья на английском)>
Список литературы составляется по ходу упоминания работы в тексте и оформляется по образцу:
[1] Иванов И. И., Иванова И. И. К вопросу о вычислительных технологиях // Вычислительные технологии. 1999. Т. 11, №11. С. 1123-1135.
[2] Иванов И. И. Что такое вычислительные технологии? Новосибирск: Наука, 1995.
[3] Ivanov 1.1. Problems in computational techologies // Intern. Conf. Comput. Techs. Novosibirsk, 1988. P. 225-229.
Следует учитывать, что иллюстрации будут воспроизводиться в масштабе 1:1 с разрешением 300 dpi. Наиболее предпочтительной формой представления иллюстраций являются файлы черно-белых растровых рисунков в форматах .pcx, .bmp, .tif или векторном формате PostScript (.eps). Иллюстрации вставляются в текст статьи с помощью следующих команд:
\begin{figure}[htbp]
\hspace*{<сдвиг рисунка по горизонтали в мм>шш} \special{em:graph <имя файла рисунка>} \vspace*{<BbicoTa рисунка в мм>шш} \caption{<Подрисуночная подпись>} \end{figure}
Оформление статьи в ЖГеХ 2е
Для представления статей на английском языке используйте опцию english: \documentclassEenglishKjctart}.
\documentclass{jctart}
\setlength{\textwidth}{170mm}\setlength{\textheight}{240mm} \usepackage{amsmath}
\begin{document} \pagestyle{myheadings}
\markboth{<^ О. Фамилия автора(ов)>}{<КРАТКОЕ НАЗВАНИЕ СТАТЬИ (ДО 40 СИМВОЛОВ)>} \title{<НАЗВАНИЕ СТАТЬИ>\footnote{<Ссылка на поддержку (факультативно)>.}} \author{\sc{<И. О. Фамилия первого автора>}\\
\it{<Место работы первого автора>}\\[2mm] \sc{<И. О. Фамилия второго автора>}\\ \it{<Место работы второго автора>}\\[2mm] ...} \maketitle \begin{abstract} <Текст аннотации> \end{abstract} <Текст статьи> \begin{thebibliography} <Библиография (\iteш-список)> \end{thebibliography} \end{document}
<Перевод названия статьи на английский язык (или на русский, если статья на английском)> <аннотации на английский язык (или на русский, если статья на английском)>
Список литературы составляется по ходу упоминания работы в тексте и оформляется по образцу:
[1] Иванов И. И., Иванова И. И. К вопросу о вычислительных технологиях // Вычислительные технологии. 1999. Т. 11, №11. С. 1123-1135.
[2] Иванов И. И. Что такое вычислительные технологии? Новосибирск: Наука, 1995.
[3] Ivanov 1.1. Problems in computational techologies // Intern. Conf. Comput. Techs. Novosibirsk, 1988. P. 225-229.
Следует учитывать, что иллюстрации будут воспроизводиться в масштабе 1:1 с разрешением 300 dpi. Наиболее предпочтительной формой представления иллюстраций являются файлы черно-белых растровых рисунков в форматах .pcx, .bmp, .tif или векторном формате PostScript (.eps). Иллюстрации вставляются в текст с помощью следующих команд:
\includegraphics{<имя файла рисунка>}
Instructions für Authors
1. The paper may be submitted to the editorial board in one of the following forms:
1.1. As two copies of the manuscript typed on one side of the standard A4 sheet (297x210 mm) + figures on separate sheets + file with electronical manuscript in LTeX or AmSLTeX + files with figures, created in one of the appropriate graphics formats (see below);
1.2. As two copies of the manuscript typed on one side of the standard A4 sheet (297x210 mm) + figures on separate sheets + file with electronical manuscript (saved as RTF-format) with (or without) formules + files with figures, created in one of the appropriate graphics formats (see below).
The duration of the publishing cycle for the manuscripts, submitted in the second form is the longest one and for the manuscript in the forms first - the shortest.
2. All files should be submitted on a 3.5" floppy disc (1440 Kbytes) or sent by e-mail jct@ict.nsc.ru as a *.zip - archive. All text-files and TeX-files in Russian must be submitted in CP866 (MS-DOS) Code Page.
3. The "hard copies"must be typed neatly with a fresh black ribbon. The typing should be double-spaced and lettered as neatly as possible. Any material that cannot be typed such as symbols and formulae should be inked carefully in black meeting the existing standards. The drawings must be printed on a laser or high-quality ink-jet printer or drawn directly in Indian ink on a sheet of a strong (bond) white paper.
4. Each paper must be preceded by an abstract of no more than 300 characters. The title of the paper and its abstract in English should be submitted on a separate sheet accompanied by the list of the key words (not more than 20) in Russian and English as well as the AMS/ZBL classification codes.
5. Authors are required to obtain permission for the publication from the company or institution at which the scientific results presented in the paper had been obtained. The accompanying letter should contain the communicating author, his mail address, telephone number(s), e-mail address.
6. The following information pertinent to every author have to be submitted as a separate file:
o First name, Second name, Last name o Affiliation data: Institution/Organization, Position o Scientific degree, Title o Address
o Telephone numbers, including the area code, Fax number, E-mail address, Homepage URL o Scientific Interests (Breef Curriculum Vitae)
7. Submission in LaTeX — Case (3). Recommendations.
Using IATeX 2.09 Using LTeX 2e
8. All materials should be mailed to the following address: Journal of Computational Technologies, Institute of Computational Technologies SB RAS, Academician Lavrentyev Ave. 6, Novosibirsk, 630090, Russia, Ph. D. Igor A. Pestunov — Phone +7(3832)343785, Galina G. Mitina.
Writing paper in English in LT^X 2.09
Journal style jctart-e.sty
Writing paper in Russian using L-TX 2.09
Journal style jctart.sty.
In this case LaTeX file structure should look like this: \documentstyle[jctart]
\setlength{\textwidth}{170mm}\setlength{\textheight}{240mm}
\begin{document}
\pagestyle{myheadings}
\markboth{<Name(s) of the author(s)>}{<SHORT TITLE (LESS THAN 40 SYMBOLS)>} \title{<TITLE OF THE PAPER>\footnote{<Name of the supporting institution (optional)>.}} \author{\sc{<Name of the first author>}\\
\it{<Affiliation of the first author>}\\[2mm] \sc{<Name of the second author>}\\
\it{<Affiliation of the second author>}\\[2mm] ...} \maketitle \begin{abstract} <Text of the abstract> \end{abstract} <Body of the paper> \begin{thebibliography} <References(\item-list)> \end{thebibliography} \end{document}
The list of references should only include works that are cited in the text and should be sorted in the order they appear in the text. Here is a short example of the style of references:
[1] Ivanov 1.1., Ivanova 1.1. On computational technologies. Computational technologies // 1989. V. 11, No. 11. P. 1123-1135.
[2] Ivanov 1.1. What is computational technology? Novosibirsk: Nauka, 1995.
[3] Ivanov 1.1. Problems in computational techologies // Intern. Conf. Comput. Techs. Novosibirsk, 1998. P. 225-229.
The preferred representation of figures (along with the hard copy) are the files of black and white or greyscale drawings (resolution = 300 dpi) in the raster formats (.pcx, .bmp, .tif) or as a vector graphics in Encapsulated PostScript format (.ps, .eps). File names for the figures should contain the figure number. Figure captions should be included in the text not in the figure file. The illustrations are inserted into the text by the following commands:
\begin{figure}[htbp]
\hspace*{<horizontal shift of the drawing in mm>mm} \special{em:graph <name of the drawing file>} \vspace*{<height of the drawing in mm>mm} \caption{<caption>} \end{figure}
Writing paper in LT^X 2e
Writing paper in English use the option english: \documentclass[english]{jctart}. \documentclass{jctart}
\setlength{\textwidth}{170mm}\setlength{\textheight}{240mm} \usepackage{amsmath}
\begin{document} \pagestyle{myheadings}
\markboth{<Name(s) of the author(s)>}{<SHORT TITLE(LESS THAN 40 SYMBOLS)>} \title{<TITLE OF THE PAPER>\footnote{<Name of the supporting institution (optional)>.}} \author{\sc{<Name of the first author>}\\
\it{<Affiliation of the first author>}\\[2mm] \sc{<Name of the second author>}\\
\it{<Affiliation of the second author>}\\[2mm] ...} \maketitle \begin{abstract} <Text of the abstract> \end{abstract} <Body of the paper> \begin{thebibliography} <References (\item-list)> \end{thebibliography} \end{document}
<Russian translation of the paper title for papers in Russian> <Abstract in Russian>
The list of references should only include works that are cited in the text and should be sorted in the order they appear in the text. Here is a short example of the style of references:
[1] Ivanov 1.1., Ivanova 1.1. On computational technologies. Computational technologies // 1989. V. 11, No. 11. P. 1123-1135.
[2] Ivanov 1.1. What is computational technology? Novosibirsk: Nauka, 1995.
[3] Ivanov 1.1. Problems in computational techologies // Intern. Conf. Comput. Techs. Novosibirsk, 1998. P. 225-229.
The preferred representation of figures (along with the hard copy) are the files of black and white or greyscale drawings (resolution = 300 dpi) in the raster formats (.pcx, .bmp, .tif) or as a vector graphics in Encapsulated PostScript format (.ps, .eps). File names for the figures should contain the figure number. Figure captions should be included in the text not in the figure file.