Научная статья на тему 'Рекуррентные соотношения для частично обратных матриц'

Рекуррентные соотношения для частично обратных матриц Текст научной статьи по специальности «Математика»

CC BY
226
46
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Барт А. Г., Щербакова И. С.

В статье, следуя [3], рассматриваются различные параметризации множества обобщенных обратных матриц. Матрицы, соответствующие конкретным значениям параметров, называются частично обратными. Строятся рекуррентные формулы для операторов первого и повторного обращения матриц в канонической параметризации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Recurrent Relations for Partially Inverse Matrices

Different parameterized sets of generalized inverse matrices are considered. Matrices corresponding to concrete values of parameters are called partially inverse ones. Recurrent formulas for singleand double-inverse matrix operators in the canonical parameterization are constructed.

Текст научной работы на тему «Рекуррентные соотношения для частично обратных матриц»

2005_ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА_Сер. 1_Вып. 2

МАТЕМАТИКА

УДК 512.64, 519.248:[57+61]

А. Г. Барт, И. С. Щербакова

РЕКУРРЕНТНЫЕ СООТНОШЕНИЯ ДЛЯ ЧАСТИЧНО ОБРАТНЫХ МАТРИЦ*

1. Введение

В теории обобщенного обращения матриц можно выделить три взаимосвязанных основных направления: дискриптивное (^-обратные матрицы в теории линейных операторов), [1]; конструктивное, связанное с решением различного рода экстремальных задач в статистике [2], в теории линейных неравенств и математическом програмиро-вании; и, наконец, чисто вычислительные аспекты построения обратных матриц, ориентированные на возможности вычислительной техники.

Предлагается несколько иной взгляд на операцию обращения, основанный на параметрическом описании множества всевозможных обратных функций и матриц [3]. Вводимые в ней параметры называются параметрами частичности, а конкретные обратные функции и матрицы называются частично обратными. В приводимых примерах анализа медико-биологических систем параметры частичности рассматриваются как потенциальное управление развитием системы. Так в примерах из паразитологии и иммунологии параметр частичности при обращении функций интерпретируется как мера толерантности компонентов биосистемы и, в частности, позволяет указывать в ней границы устойчивых регуляций (масштаб и пороги иммунитета).

В нейрофизиологии при исследовании реконструкций нейронных деревьев параметры частичности могут рассматриваться как управляющие в описании развития системы через повторные обращения, например, при построении моделей реконструкций нейронных деревьев методом двойного частичного обращения их матриц инцидентности. Этот метод позволяет сохранить содержательную часть рассматриваемой проблемы при построении модели. Так вопрос о способе предачи информации по нейронным деревьям при соблюдении основных принципов развития биосистем является одним из ведущих в нейрофизиологии. Принцип отражений наряду с принципом целостности и принципом П. Кюри составляет основу логической структуры биосистем (см. [3]). Если при указанном моделировании морфологические свойства дерева будем закладывать в матрицу инцидентности его блоков (например, аксонных коллатералей), а физиологи-

* Работа выполнена при финансовой поддержке РФФИ (грант №03-04-49643).

© А. Г. Барт, И. С. Щербакова, 2005

ческие свойства (например, распределение синапсов на дереве) опишем параметрами обращения этой матрицы, то согласование указанных свойств будет ведущим при построении модели.

Данная работа является продолжением указанного направления исследований. Ее основная цель состоит в получении рекуррентных соотношений для построения первой и двойной обратных матрицы к заданной при повторном частичном ее обращении. Это даст возможность применить вычислительную технику для практического применения метода [5].

Следует отметить, что вопросы построения рекуррентных формул для решений экстремальных задач, эквивалентные обращению матриц, остаются актуальными (см., например, [4]).

В разделе (2) приведены необходимые определения и результаты из [3], касающиеся матричной, канонической и барицентрической параметризаций частично обратных матриц, используемые в основном разделе (3) при построении рекурентных соотношений.

2. Необходимые определения и результаты

Предварительно кратко напомним общепринятую терминологию. Обобщенная обратная матрица А- (п, к) к матрице А(к, п) ранга г определяется (по Муру и Пенроузу) о помощью следующих 4-х соотношений:

О1 : АА-А = А,

О2 : А-АА- = А- ,

Оз : (А- А)* = А-А,

О4 : (аа-)* = АА-,

где А* — сопряженная матрица (исходная матрица транспонируется и ее элементы заменяются на комплексно-сопряженные).

Соотношение 0\ определяет обобщенную обратную (^-обратную) матрицу. Если дополнительно к О1 выполнено О2, то обобщенная обратная называется рефлексивной матрицей. Если наряду о 01,02 выполнено еще одно из оставшихся определений, то рефлексивная обобщенная обратная матрица называется слабо обобщенной обратной: левой, если выполнено О3, и правой, если выполено О4. В дальнейшем будем их называть просто левой и правой обратной, соответственно. Если ранги левой и правой обратных совпадают и равны г = шт(к,п), то произведение их на исходную матрицу (соответственно слева или справа) равно единичной матрице. Наконец, если выполнены все четыре равенства, то такую матрицу (она единственна) называют псевдообратной.

Будем рассматривать только матрицы с вещественными элементами.

Частично единичные матрицы. Матричная параметризация. В дальнейшем полагаем: А(к, п) — матрица размера к х п; — начальный отрезок натурального ряда длины п; 1п —единичная матрица порядка п; V(1\п) = [V1,. —подмножества

(сочетания, упорядоченные по возрастанию: V1 < V2 < ••• < V1). Через (V) обозначим дополнение V до Само V, если будет необходимость подчеркивать его отличие от (V), будем отмечать квадратными скобками: [V]. Например: [145] и (145) = [12345] = N5. А" (к,1) — блок матрицы А, составленный из ее столбцов с номерами из множества V, а А\(1, п) —ее блок, соответствующий строкам с номерами из Л = Л(1 \ к). Размеры матриц могут быть не указаны, когда они очевидны.

Назовем матрицу, составленную из строк (1^ (1,п)-левая) или из столбцов (1^ (п,1)-правая) матрицы 1п, соответствующих множеству V = V(1\п), V-частично единичной

матрицей. В общем случае частично единичная матрица размера к х п, сответству-ющая множествам частичности Л = Л(1 \ к) и V = V(I \ п), определяется соотношением к) = (п,/)1А(/,к). При этом индекс частичности опускается, если его дополнение пусто.

Приведем правило умножения частично единичных .матриц.

Пусть V = V (1,п); Л = Л(1\к); п = п(^\к); М = м(Цт); Л П п = [Л*1 ,...,Л1в ] = [п'1,... ]; а = а(в\п) = [V*1 ,...,у*3 ]; в = [3(в\т) = [р,'1 ,..., м'3 ], тогда

1л(п,к)1^(к,т) = 1%(п,т). С учетом этого правила получаем:

1л1л = 1г; 1л 1" = 1$; 1" 1„ = =' 1П,

где 7 = [«!,..., г8], 6 = [71, ...,^я] и —квадратная частично единичная матрица.

Частично единичные матрицы являются удобным аппаратом для выделения блоков из матрицы и для восстановления матрицы по ее блокам. Отметим несколько очевидных тождеств:

АЛ = 1л ЛГ; А = А" 1„ + А(^1И = 1лАл + 1(л)А(л);

А(к,п)В(п,т) = А" Ви + АМБИ. (1)

Для матричной параметризации семейства ^-обратных матриц к матрице А(к, п) ранга г достаточно использовать хотя бы один неособенный ее блок порядка г. Такая параметризация соответствует обычной форме записи множества всех решений системы уравнений Ах = у. Ее вид указывается в следующей теореме (см. [3]).

Теорема 1. Пусть г = гапкА(к, п), Л = Л(г\к), V = V(г\п), такие, что detAЛ = 0. Тогда,:

1) имеют место следующие разложения матриц:

А = А^ (Ал)-1Ал; А- = (Ал)-Ал(А^)-; (2)

2) для всяких матриц Р = Р(г, к) и Р = Р(п, г) матрица А- является д-обратной к А(к, п), где левая обратная, к А"(к, г) и правая обратная, к Ал (г, п) имеют вид

(А")- = (Ал)-11л + Р(Ь - Н), (Ал)- = 1"(Ал)-1 + (1„ -Н)р

при

Н = А- (Ал)-11л, Н = 1" (Ал) Ал;

3) если РА" = 1г, то Р = (А^)-; если АлР = 1г, то <5 = А-.

Следствие 1. Так как Рл1лН = Рл 1л и Н1^= , применяя (1), получаем

(А")- = (Ал)-11л + Р(л)(1(л) - А (л) (Ал)-11л), (Ал)- = (Ал)-1 + (1" - 1"(Ал)-1 Ал^и,

т. е. в действительности параметрами являются лишь блоки Р(л) и Q(v).

Из (2) непосредственно следует, что А- является рефлексивной ^-обратной матрицей.

Каноническая и барицентрическая параметризации. Эти виды параметризаций используют только миноры матриц.

Пусть г = гапкА(к, г) и А(к, г) — (г — 1)-ассоциированная с А(к, г) матрица при лексикографическом упорядочивании миноров. Перенумеруем миноры от 1 до к = С^ 1. Сочетание Л = Л(г\к) из элементов по г будем называть ассоциированным с сочетанием Л = Л(г\к), если все миноры с номерами из к соответствуют блокам, состоящим только из строк матрицы А с номерами из Л. Для указанных исходного и ассоциированного с ним сочетаний выполнено равенство (А)д = (Ад).

Множество всех левых обратных А- (г, к) к матрице А(к, г) можно описать с помощью вектора миноров V = [V1,... ] матрицы А- в лексикографическом их упорядочивании. Через Д = [Д1,..., ДС'к ] обозначим такой же вектор миноров матрицы А. Положим Н^ Х(У) = (А-)ТЪ^ А~, где

г

Ь = £(—1)т1[4](г, 1)1[г-т](1,г) 1=1

— побочно-диагональная матрица с чередующимися диагональными значениями 1 и —1 (в первой строке 1). Очевидно,

КК = \ijhr = 1Г; АА = (НГУСДЭНГ1^) = Д).

Справедливы следующие равенства (см. [3]):

1) нГ1^) = ]Г(НГУ(Л) = (3)

8=1 1=1

С1

2) £ЛV = 1, (4)

1=1

где Л8 = detAЛs; V1 = ёе^А-)л. При к = г тождество

^А)1Г = АЬГ АТ ЬТ

определяет классический способ построения обратной матрицы.

Назовем каноническим следующее представление ^-обратной матрицы:

Ау(г,^)=ЬгАтнГ1(У). (5)

При повторном обращении каноническими параметрами будут миноры двойной обратной к А матрицы (А-)-(к,п), которая примет вид

(Ау)7 = (НГ1)Т(<5)НГ1(У)А = Щ(У, 6)А,

где б = [б1,..., ], ^ = det((A-)-)лt. 6

Теорема 2. Матрица А-(г, к), полученная по формуле (5), является левой обратной к А(к, г) тогда и только тогда, когда для параметров обращения выполняется _сг

соотношение 4=1 ДtVt = 1, где Д4 = detAлt.

Доказательство. Необходимость следует из полученного для обратных матриц соотношения (4).

Достаточность: пусть 5^4=1 Д^4 = 1; проверим, что выполняются соотношения, определяющие левую обратную матрицу. Непосредственной подстановкой полу-

ск

чаем, что условие О1 : АА-А = А эквивалентно ^ Д4У4А = А; аналогично для

4=1

ск ск

О2 : А- = А-, и О3 : ^ = 1г. Следовательно, построенная матрица

4=1 4=1

является левой обратной по определению.

Следствие 2. Матрица (А-)- является дважды обратной к исходной (правой обратной к А-) тогда и только тогда, когда ^£=1 = 1.

Если положить 64 = Д4 и Д = [... Д4... ], то (А-)- = А для произвольных значений параметров V.

Наконец, отметим, что значения

Е,(Д')2

параметров частичности выделяют псевдообратную матрицу.

Для параметров приведем уравнения, возникающие при решении важной для приложений задачи восстановления фиксированного блока матрицы путем двойного частичного обращения другого заданного блока. Рассмотрим матрицы А и В: В = НА = Н ((5)Н(\7)А, где 6 — вектор миноров В. Так как конструкция Н зависит только от размеров матрицы и ее миноров, а размеры А и В согласованы, В = НТ((5)Н(\7)В для всякого V. Отсюда получаем условие на параметры первого обращения:

НТ((5)Н(У)(В - А) = 0.

Геометрически более наглядным является барицентрическая параметризация множества обратных матриц, имеющих вид

А- = Х) а^-!^,

где а4 = Д^4, а = [...а4... ], а4 = 1 и достаточно суммировать по таким Ь, что

Д4 = 0, Эта параметризация эквивалентна канонический при условии, что если Д4 = 0, то V4 = 0. Действительно,

Ау = Е1 а*А- 1лг + ЕАл ЬТ 1лг = А- (г, к) + А- (г, к), (6)

где 1 означает суммирование по Ь, для которых Д4 = 0, а ^2° — суммирование по остальным Ь. Указанное условие влечет отсутствие в (6) слагаемого А-, которое является аннулятором матрицы А : А-А = 0. То есть такие обратные матрицы имеют один и тот же барицентрический вид.

ТТГ- 1

3. Рекуррентные соотношения.

Рекуррентная формула для матрицы типа Н) Теорема 3. Разобьем вектор параметров V (будем его также обозначать Voo) на блоки следующем образом:

=

0,0

V1

Vl,l VI 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V,

V,

г,3

V,

(7)

т. е. каждый V,,] разбивается на два подвектора Vi+l,2j-l и Vi+l,2j, размерности которых соответствуют тождеству С* = С*-1 + С*_ 1.

Тогда при V = [1], (V) = [2, 3,...,к] и Л = [1,..., С*-2], (Л) = [С- + 1,..., С*-1],

1М + 1(л)Н;:11(У4+1,2,-)1И =

-г— 1

Чк

0

при начальных условиях

0

Нк(У) = [У\...,У*], Нк(У) = [0,...,0].

ттг- 1,

Доказательство. Рассмотрим последовательно блоки матрицы Нд, Первый блок удовлетворяет соотношениям

Ск-1

л; .[1] (=) л 1[г] =

0.

1=1

1=1

Действительно, ЬТ 1дг = 1л4, где Л^ —перестановка Лt в обратном порядке элементов и, возможно, со сменой знака; поэтому максимальный элемент в Л4 стоит на первом месте, а минимальный на г-ом; таким образом при £ =1 + С*-1 на последнем месте стоит 1.

1. Равенство (1) выполняется, т.к. только первые С*-1 перестановок Л4 содержат 1,

ук-1

а значит, 1Л4= 0; получаем ЬТ1Л4= 1к] при £

1 + Ск-1 и, по правилу

умножения частично единичных матриц, 1л 1 = 1Д.

2. Равенство (2) выполняется, т. к. в силу лексикографического упорядочения миноров при £ =1 + Ск-1 в на последнем (г-ом) месте всегда стоит число большее С*-1, а все предыдущее элементы меньше г, следовательно, Л4 П [г] = 0.

Для второго блока из (3) следует

4=1

]Г ^1(л)1ЛЬТ1л< 1[1].

4=сг=1+1

1

2

1

Второе слагаемое равно 0, ибо все Л4 при Ь > Ск_1 не содержат 1 и, следовательно, 1л, 1[1] = 0 и второе слагаемое равно 0.

В первом слагаемом \4 содержат только по одному элементу, принадлежащему (Л), при этом он стоит на последнем (г-ом) месте, таким образом, первое слагаемое равняется

ск-1

4=1

Третий блок удовлетворяет равенствам

ск-1 ск-1

4=1 4=1

Действительно,

1) так как при Ь > СИ-1 Л4 не содержит чисел, меньших Сгк_^ имеем Л П Л4 = 0 и верно (1);

2) при Ь < Ск-1 Л4 = Л4(г\к) содержат только первые (г — 1) элементов, меньших СИ-2, а последний — больше СИ-

1л 1л = ^, 1л, 1м = 1(х]

таким образом получаем, что последние строка и столбец у 1л и первые строка и столбец у ^ нулевые, а значит, у матрицы Ь можно не учитывать первый столбец и последнюю строку, что равносильно рассмотрению матрицы - Ь^ 1:

1л 1л ЬТ 1л, 1й = -1* ЬТ_11Ч4,

где П4 = П4(г - 1 \к - 1), П4 = П4(г - 1\(к - 1)). Для последнего нерассмотренного блока справедливо

сг

1(л)н £ У41(л)1^ьдлди = н;:11.

4=1 4=ск-1+1

Действительно,

1) при Ь < Ск_ 1 в Л4 только последний элемент больше Ск_ ^ умножением на ЬТ последний элемент становится на первое место, а значит, все V4 при Ь < Ск-1 находятся в блоке 1 только в первом столбце, который исключается выделением блока

2) при Ь > Ск_ 1 в \4 входят только числа, неменьшие Ск-\, а значит

1(л)1л = 1*, 1л, 1м = 1*, где п4 = п4(г\к - 1) и к = к(г\(к - 1)), и следовательно, второе слагаемое соот-

-1 „ г

ветствует структуре Нй_1 при = [Х^^-1-1-1,...,

Рекуррентная формула для матрицы типа Н*. Представим вектора параметров V и 6 в виде (7): }, {6,^}. Будем обозначать матрицу, определяющую оператор повторного обращения на 1-ом шаге, ; ). Тогда

Hk 1( Vi,j; Si,j)

(Hfc- Пбг])пк- (Vj.

-(Hfc_1)T(Ji+l,2j-l)

ST+l,2j-l Vi+l,2j-l

(Hrfc:i)T№+il5y)

v.

i+1,2j-1

Hfc-l(Vi+l,2j)

TT- 1.

(Hfc-l) №+l,2j)Vi+l,2j-l

Hfc-1 (Vi+l,2j-l; ^i+1,2j-l) + Hk-1(Vi+i,2j ; ¿i+l,2j)

Из теоремы 3 следует, что для верхнего правого блока имеют место рекуррентные соотношения:

= [^M-2,4j-2Vi+2,4j-i; 4j-3Hfc-2(Vi+2,4j-l) + <^2,4j-2Hfc-l ( Vi+2,4j )]

при начальных условиях

Н°(У) = [У1,...,УЙ], Н*(У) = [0,...,0].

Аналогично для нижнего левого блока.

Для практической реализации представленного метода необходимо решать вопросы выбора матрицы инцидентности и параметров при ее обращениях. Здесь существенна содержательная сторона рассматриваемых приложений. Конкретные примеры требуют отдельного изложения.

Summary

A. G. Bart, I. S. Sсherbakova. Recurrent Relations for Partially Inverse Matrices.

Different parameterized sets of generalized inverse matrices are considered. Matrices corresponding to concrete values of parameters are called partially inverse ones. Recurrent formulas for single-and double-inverse matrix operators in the canonical parameterization are constructed.

Литература

1. Ра,о С. Р. Линейные статистические методы и их применения. М., 1968. 548 с.

2. Макарова Е. В., Денисов В. И., Полетаева И. А., Пономарев В. В. Дисперсионный анализ и синтез планов на ЭВМ. М.: Наука, 1982. 195 с.

3. Барт А. Г. Анализ медико-биологических систем. Метод частично-обратных функций. СПб.: Изд. С.-Петерб. ун-та, 2003. 280 с.

4. Неймарк Ю. И., Теклина Л. Г. Новые технологии применения метода наименьших квадратов. Н. Новгород: Изд. ННГУ им. Н. И. Лобачевского, 2003. 196 с.

5. Bart A. G., Scherbakova I.S., Kozhanov V.M., Bart V. A. Neuronal Trees Modeling by Method of Partially Inverse Matrices // Proceeding of the Firth Workshop on Simulation. 2005. P. 119-124.

Статья поступила в редакцию 2 ноября 2004 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.