Научная статья на тему 'Новые характеризации множества решений для интервальных систем линейных уравнений'

Новые характеризации множества решений для интервальных систем линейных уравнений Текст научной статьи по специальности «Математика»

CC BY
44
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ИНТЕРВАЛЬНЫЕ ЛИНЕЙНЫЕ УРАВНЕНИЯ / INTERVAL LINEAR EQUATION / МНОЖЕСТВО РЕШЕНИЙ / SOLUTION SET / ХАРАКТЕРИЗАЦИЯ / CHARACTERIZATION / РАСПОЗНАЮЩИЙ ФУНКЦИОНАЛ / RECOGNIZING FUNCTIONAL

Аннотация научной статьи по математике, автор научной работы — Шарый Сергей Петрович

Предложены новые аналитические характеризации для множества решений интервальных систем линейных уравнений, альтернативные известному результату Оеттли и Прагера. На основе новых характеризаций введены распознающие функционалы множества решений, которые для заданной точки определяют агрегированную количественную меру ее совместности (согласованности) с интервальными данными системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

New characterizations of the solution set for interval systems of linear equations

This note presents new analytical characterizations for the solution set for interval linear equation systems, which are alternatives to the well-known Oettli Pager inequality. The new characterizations have the form of vector inequalities involving interval magnitude function. Based on the new characterization, we introduce so-called recognizing functionals of the solution set that determine, for a given point, an aggregated quantitative measure on how the point is compatible (consistent) with the interval data of the system. The recognizing functionals prove to be useful in investigation of whether the solution set is empty or not, as well as in finding the points that possess some optimality properties with respect to the interval linear equation system, e. g., in data fitting problems under interval uncertainty.

Текст научной работы на тему «Новые характеризации множества решений для интервальных систем линейных уравнений»

Вычислительные технологии Том 21, № 5, 2016

Новые характеризации множества решений для интервальных систем линейных уравнений

С. П. ШАРЫй

Институт вычислительных технологий СО РАН, Новосибирск, Россия Контактный e-mail: [email protected]

Предложены новые аналитические характеризации для множества решений интервальных систем линейных уравнений, альтернативные известному результату Оеттли и Прагера. На основе новых характеризаций введены распознающие функционалы множества решений, которые для заданной точки определяют агрегированную количественную меру ее совместности (согласованности) с интервальными данными системы.

Ключевые слова: интервальные линейные уравнения, множество решений, харак-теризация, распознающий функционал.

Введение

В работе исследуются интервальные системы линейных алгебраических уравнений вида

апх 1 + а\2Х2 + ... + а\пХп = Ъь а2\Хг + а22Х2 + ... + а2пХп = Ъ2,

ат1Х1 + ат2Х2 + . . . + атпХп Ът

или, в краткой матрично-векторной записи,

Ах = Ъ, (2)

где А = (а^) — интервальная т х п-матрица коэффициентов и Ъ = (Ъ^) — интервальный т-вектор правых частей.

Мы придерживаемся системы обозначений, предложенной в неформальном стандарте [1]. В частности, интервалы и интервальные объекты выделяются жирным шрифтом, тогда как для неинтервальных (точечных) величин никакого специального выделения не используется. Подчеркивание а и надчеркивание а обозначают нижний и верхний концы интервала а, так что а = [а, а] = { а € К | а ^ а ^ а}. Кроме того,

mid a = i (a + a)

rad a

2(a - a)

середина интервала,

радиус интервала,

ИВТ СО РАН, 2016

|а| = max |а| = max { |а|, |а| } — абсолютное значение (модуль) интервала,

aGa

(

иначе.

— мигнитуда интервала, наименьшее расстояние от точек интервала до нуля.

Нетрудно заметить, что мигнитуда интервала является в определенном смысле антиподом его абсолютного значения.

Интервальные линейные системы уравнений вида (1), (2), т.е.

рассматриваются всюду далее как семейства точечных (неинтервальных) линейных систем Ах = Ь той же структуры, для которых А = (ац) Е А и Ь = (Ьг) Е Ь, т. е. такие, что Чц Е а^ и Ьг Е Ьг для всех индексов I, ]. Множество решений интервальной системы линейных алгебраических уравнений определяется как

т. е. как множество решений всевозможных точечных систем Ах = Ь, чьи коэффициенты и правые части принадлежат А и Ь соответственно. Множество Б (А, Ь) часто называют объединенным множеством решений, поскольку для систем (1), (2) имеются и другие определения множеств решений, вызванные существом тех или иных постановок задач [2]. Мы не рассматриваем их в нашей работе, так что в отношении (3) будем использовать краткий термин "множество решений".

Аналитическое описание множества решений для интервальных линейных систем уравнений дается классическим результатом У. Оеттли и В. Прагера, опубликованным в 1964 г. [3] (см. также [5, 6]):

где операции "mid", "rad" и " | • |" применяются к интервальным векторам и матрицам покомпонентным и поэлементным образом, а векторное неравенство понимается как неравенство аналогичного смысла между компонентами сравниваемых векторов. Цель настоящей статьи — представить новые аналитические характеризации для множества решений Б (A, b) интервальных линейных систем уравнений, альтернативные результату Оеттли — Прагера. В предварительном порядке представленные результаты были опубликованы в [4].

1. Новые характеризации

Исходной точкой наших рассмотрений является следующее утверждение, полученное Х. Беком [7] (см. также [5, 6]).

Характеризация Бека. Точка x Е принадлежит множеству решений Б (A, b) тогда и только тогда, когда A • x П b = 0, т. е. когда интервальные векторы A • x и b имеют непустое пересечение.

В формулировке характеризации Бека произведение A • x понимается в смысле интервального матричного умножения. Ниже, как это обычно принято, мы будем опускать

Ax = b,

Б (A, b) = {x E Rn | (3 A E A)(3 b E b)( Ax = b ) },

(3)

x E б (A, b) ^ I (mid A) x — mid bl < (rad A) |x| + rad b,

Рис. 1. Взаимное расположение брусов AX и b

знак умножения " •", записывая Ax вместо A • x. Напомним, что у этого вектора про-

n

изведения i-я компонента по определению равна Xj, где все операции являются

j=1

операциями классической интервальной арифметики (см., к примеру, книги [5, 6, 9, 10]).

Проверка выполнения условий характеризации Бека для точки X Е Rn сводится к исследованию того, пересекаются ли друг с другом интервальные брусы AX и b в пространстве Rn (рис. 1). Чтобы переформулировать геометрические идеи характеризации Бека на аналитическом языке, рассмотрим вначале одномерный случай, т. е. пересечение двух одномерных интервалов p и q на вещественной оси R.

Сдвинем всю конфигурацию на величину mid q, т.е. вместо исходных интервалов p и q рассмотрим интервалы (p — mid q) и (q — mid q). Очевидно, что сдвинутые интервалы (p — mid q) и (q — mid q) пересекают друг друга в том и лишь в том случае, когда это верно для исходных интервалов p и q.

Интервал (q — mid q) = [—rad q, rad q ] симметричен относительно нуля, и поэтому он имеет непустое пересечение с интервалом (p — mid q) тогда и только тогда, когда абсолютное значение (q — mid q) не меньше, чем мигнитуда (p — mid q). Поскольку абсолютное значение для (q — mid q) равно rad q, сформулированное выше условие равносильно следующему (рис. 2):

p П q = 0 (p — mid q )< rad q. (5)

Последнее неравенство можно также переписать в виде

rad q — (p — mid q) > 0. (6)

rad q

R

q — mid q 0

p — mid q

(p — mid q)

Рис. 2. Пересечение сдвинутых интервалов (нуль является серединой q — mid q)

Так как многомерные интервальные векторы (брусы) являются прямыми декартовыми произведениями одномерных интервалов, проверяя выполнение характеризации Бека и пересечение брусов АХ и Ь, мы можем утверждать на основе (5), что

АХ П Ь = 0 ^ ((АХ)г - Ьг) < гаё Ьг, г = 1, 2,..., т. (7)

Если условиться, что операции " (•)", "гаё ", "" и неравенство "<" применяются к интервальным векторам покомпонентным образом, то система соотношений (7) может быть записана в кратком виде:

АХ П Ь = 0 ^ (АХ - Ь ) < гаё Ь.

В целом

(8)

С другой стороны, можно обратить ситуацию и посмотреть на пересечение тех же брусов с другой точки зрения, если в равносильности (5) взять p = b и q = (Ax)j, i = 1, 2,..., m. Тогда будем иметь

Ax П b = 0 ^ (mid(Ax) - b) < rad(Ax).

Чтобы упростить полученную формулу, можем использовать равенства [5, 6]

mid (Ax) = (mid A) x, rad(Ax) = (rad A) |x|. (9)

В результате получаем, что

(10)

Эквивалентности (8) и (10) являются новыми аналитическими характеризациями точек из множества решений интервальных систем линейных алгебраических уравнений, альтернативными известному неравенству Оеттли — Прагера (4).

Интересно, что и само неравенство Оеттли — Прагера также легко выводится из ха-рактеризации Бека. В самом деле, на пересечение интервалов можно взглянуть несколько по-иному, заметив, что два интервала p и q на вещественной оси пересекаются непусто тогда и только тогда, когда расстояние между их серединами mid p и mid q не превосходит суммы их радиусов:

p П q = 0 ^ | mid p — mid q | < rad p + rad q.

Если взять p = (Ax)i и q = b^, i = 1, 2,... , n, то для брусов Ax и b в целом получим

Ax П b = 0 ^ I mid (Ax) — mid b | < rad (Ax) + rad b.

Наконец, привлекая равенства (9) и характеризацию Бека, приходим окончательно к эквивалентности (4):

x E Б (A, b) ^ | (mid A) x — mid b| < (rad A) |x| + rad b.

точка Х принадлежит множеству решений интервальной системы линейных алгебраических уравнений Ах = Ь тогда и только тогда, когда (АХ — Ь ) < гаё Ь.

точка x принадлежит множеству решений интервальной системы линейных алгебраических уравнений Ax = b тогда и только тогда, когда ( (mid A) x — b ) < (rad A) |x|.

2. Распознающие функционалы

В действительности мы можем продолжить наши конструкции, организовав на основе характеризаций (8) и (10) так называемые распознающие функционалы для множества решений интервальной линейной системы уравнений Ах = Ь. Покажем это на примере равносильности (8).

Наша основная руководящая идея будет состоять в том, чтобы "свернуть" отдельные покомпонентные неравенства (6) в единое отношение. Свертка векторного неравенства в одно скалярное может быть осуществлена различными способами, но при этом должны быть выполнены некоторые естественные условия. Во-первых, результирующее выражение в левой части конструируемого скалярного неравенства обязано быть отрицательным в случае, когда отрицательно по крайней мере одно из сворачиваемых выражений (что соответствует пустоте пересечения Ах и Ь). Во-вторых, результирующее выражение обязано быть неотрицательным (положительным), если неотрицательны (положительны) все составляющие его подвыражения (при этом интервальные бру-сы Ах и Ь имеют непустое пересечение).

В то же время нежелательно, чтобы в результирующем выражении значения подвыражений комбинировались друг с другом таким образом, что одни из них могли бы компенсировать другие. Вклад всех подвыражений в результирующее выражение должен учитываться в равной мере.

С учетом сформулированных требований для наших целей хорошо подходит операция взятия минимума, так как она "равномерно" учитывает те отдельные подвыражения, по которым берется. Некоторым неудобством операции минимума может показаться потеря гладкости получающейся функции, но при современном развитии негладкого анализа и методов негладкой оптимизации это соображение в значительной мере утратило свой вес.

Суммируя наши выводы, можно, основываясь на (8), предложить в качестве обобщенной количественной "меры совместности" точки X с данными задачи, т. е. интервальной матрицей А и правой частью Ь, выражение

шт ( rad Ь — ( (АХ), — mid ЬЛ ) , (11)

1 <г<т 1 х ' '

или, в расширенной форме,

min < rad b* — ( у a,x, — mid b* \<i<m I \ ' J J

j=i

Итак, приходим к следующему результату, впервые сформулированному в работе [11]: Теорема. Пусть A — интервальная m х n-матрица, b — интервальный т-вектор. Тогда выражением

( / n

Uni (x, A, b) = min | rad b* — / mid b* — ^^ a,x,

определяется функционал Uni : Rn ^ R, такой что принадлежность точки x G Rn множеству решений E(A, b) интервальной системы линейных уравнений Ax = b равносильна неотрицательности функционала Uni в точке x. Иными словами, x G E(A, b) тогда и только тогда, когда Uni (x, A, b) > 0.

Как следствие, множество решений ^ (А, Ь) интервальной системы линейных алгебраических уравнений является "множеством уровня"

для функционала Uni. Получается, что функционал Uni "распознает" посредством знака своих значений принадлежность точек множеству решений S (A, b). По этой причине мы используем в отношении Uni термин распознающий функционал.

Что касается характеризации (10), то соответствующий распознающий функционал для нее определяется в виде

Он принимает неотрицательные значения в том и лишь в том случае, если его аргументом является точка из множества решений интервальной системы линейных алгебраических уравнений Ах = Ь. Наконец, характеризация Оеттли — Прагера (4) также может быть "свернута" в распознающий функционал [12-14]

Значения каждого распознающего функционала дают нам некоторую агрегированную количественную меру того, насколько точка x совместна с данными A и b рассматриваемой интервальной системы линейных уравнений. Максимизируя далее эту меру по всем точкам x G Rn, мы получим общую меру совместности интервальной линейной системы Ax = b в целом.

Вычислительная сложность нахождения значений распознающих функционалов Uni и Uss невелика. Она равна произведению числа подвыражений, по которым берется общий минимум, на сложность вычисления отдельного подвыражения, что дает всего O(mn). Но максимизация распознающих функционалов Uni и Uss является очень сложной задачей, так как каждый из них представляет собой негладкую невогнутую функцию, которая может иметь много локальных максимумов. В самом общем случае их число растет как 2n в зависимости от размерности n пространства неизвестных. Но эти сложности отражают принципиальную труднорешаемость задачи распознавания разрешимости интервальных линейных систем уравнений [15, 16] и, по большому счету, радикально преодолены быть не могут.

Каким может быть практическое применение развитых выше теоретических идей? Наши результаты могут служить основой для нового подхода к решению задачи восстановления зависимостей в условиях, когда данные имеют интервальную неопределенность. Для линейных регрессионных моделей решение подобных задач сводится к интервальным системам линейных алгебраических уравнений вида Ax = b, где матрица A представляет входные данные (экзогенные переменные), а b — выходные (эндогенные) переменные. В качестве оценки параметров модели, наилучшим образом согласующейся с данными, можно взять точку, которая максимизирует распознающий функционал, т. е. соответствует максимальному согласованию (совместности) с интервальными данными A и b (см. подробности в работах [11-14]).

{ x G Rn | Uni (x, A, b) > 0 }

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Uss(x, A, b) = ^^ (rad aij) |xj| + rad bi — ^^ (mid aij) xj — mid bi

n n

Дальнейшее развитие математических деталей представленной выше теории, которое приводит к перспективным алгоритмам исследования разрешимости интервальных систем линейных алгебраических уравнений, можно найти, в частности, в публикациях

[11, 12, 14].

Благодарности. Автор выражает искреннюю благодарность профессору Гюнтеру Майеру (Росток, Германия) и профессору Иржи Рону (Прага, Чехия) за плодотворные и стимулирующие обсуждения предмета.

Список литературы / References

[1] Kearfott, R.B., Nakao, M.I., Neumaier, A., Rump, S.M., Shary, S.P., van Hentenryck, P. Standardized notation in interval analysis // Comput. Technologies. 2010. Vol. 15, No. 1. P. 7-13.

[2] Shary, S.P. A new technique in systems analysis under interval uncertainty and ambiguity // Reliable Computing. 2002. Vol. 8, No. 5. P. 321-418. Available at: http://www.nsc.ru/ interval/shary/Papers/ANewTech.pdf

[3] Oettli, W., Prager, W. Compatibility of approximate solution of linear equations with given error bounds for coefficients and right-hand sides // Numerische Mathematik. 1964. Vol. 6, No. 1. P. 405-409.

[4] Shary, S.P. New characterizations for the solution set to interval linear systems of equations // Applied Mathematics and Computation. 2015. Vol. 265. P. 570-573.

[5] Шарый С.П. Конечномерный интервальный анализ. Новосибирск: ИВТ СО РАН, 2016. 617 c. (Электронная книга.) Адрес доступа: http://www.nsc.ru/interval/index.php?j= Library/InteBooks/index

Shary, S.P. Finite-dimensional interval analysis. Novosibirsk: Institute of Computational Technologies, 2016. 617 p. Available at: http://www.nsc.ru/interval/index.php?j = Library/InteBooks/index (In Russ.)

[6] Neumaier, A. Interval methods for systems of equations. Cambridge: Cambridge Univ. Press, 1990. 255 p.

[7] Beeck, H. Uber die Struktur und Abschätzungen der Lösungsmenge von linearen Gleichungssystemen mit Intervallkoeffizienten // Computing. 1972. Vol. 10, No. 3. P. 231-244.

[8] Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. М.: Мир, 1987. 356 с.

Alefeld, G., Herzberger, J. Introduction to interval computations. New York: Acad. Press, 1983. 345 p.

[9] Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. Новосибирск: Наука, 1986. 222 с.

Kalmykov, S.A., Shokin, Yu.I., Yuldashev, Z.Kh. Methods of interval analysis. Novosibirk: Nauka, 1986. 222 p. (In Russ.)

[10] Moore, R.E., Kearfott, R.B., Cloud, M.J. Introduction to interval analysis. Philadelphia: SIAM, 2009. 223 p.

[11] ШШарый С.П. Разрешимость интервальных линейных уравнений и анализ данных с неопределенностями // Автоматика и телемеханика. 2012. № 2. С. 111-125.

Shary, S.P. Solvability of interval linear equations and data analysis under uncertainty // Automation and Remote Control. 2012. Vol. 73, No. 2. P. 310-322.

[12] Ш!арый С.П., ШШарая И.А. Распознавание разрешимости интервальных уравнений и его приложения к анализу данных // Вычисл. технологии. 2013. Т. 18, № 3. С. 80-109. Адрес доступа: http://www.ict.nsc.ru/jct/getfile.php?id=1551

Shary, S.P., Sharaya I.A. Recognizing solvability of interval equations and its application to data analysis // Comput. Technologies. 2013. Vol. 18, No. 3. P. 80-109. (In Russ.)

[13] Shary, S.P. Maximum consistency method for data fitting under interval uncertainty // J. of Global Optimization. 2016. Vol. 66, No. 1. P. 111-126. DOI: 10.1007/s10898-015-0340-1.

[14] Shary, S.P., Sharaya, I.A. On solvability recognition for interval linear systems of equations // Optimization Letters. 2016. Vol. 10, No. 2. P. 247-260. DOI: 10.1007/s11590-015-0891-6.

[15] Фидлер М., Недома Й., Рамик Я., Рон И., Циммерманн К. Задачи линейной оптимизации с неточными данными. Москва; Ижевск: РХД, 2008. 288 c.

Fiedler, M., Nedoma, J., Ramik, J., Rohn, J., Zimmermann, K. Linear optimization problems with inexact data. New York: Springer Science+Business Media, 2006. 214 p.

[16] Kreinovich, V., Lakeyev, A., Rohn, J., Kahl, P. Computational complexity and feasibility of data processing and interval computations. Dordrecht: Kluwer, 1998. 459 p.

Поступила в 'редакцию 8 февраля 2016 г., с доработки —18 апреля 2016 г.

New characterizations of the solution set for interval systems of linear equations

Shary, Sergey P.

Institute of Computational Technologies SB RAS, Novosibirsk, 630090, Russia Corresponding author: Shary, Sergey P., e-mail: [email protected]

This note presents new analytical characterizations for the solution set for interval linear equation systems, which are alternatives to the well-known Oettli —Pager inequality. The new characterizations have the form of vector inequalities involving interval mignitude function.

Based on the new characterization, we introduce so-called recognizing functionals of the solution set that determine, for a given point, an aggregated quantitative measure on how the point is compatible (consistent) with the interval data of the system.

The recognizing functionals prove to be useful in investigation of whether the solution set is empty or not, as well as in finding the points that possess some optimality properties with respect to the interval linear equation system. The latter may be applied e.g., in data fitting problems under interval uncertainty.

Keywords: interval linear equation, solution set, characterization, recognizing functional.

Acknowledgements. The author expresses his sincere gratitude to Prof. Gunter Mayer (Rostock, Germany) and Prof. Jiri Rohn (Prague, Czech Republic) for fruitful and stimulating discussions on the subject.

Received 8 February 2016 Received in revised form 18 April 2016

© ICT SB RAS, 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.