Научная статья на тему 'Быстрота сходимости метода выравнивания в равномерной σ-аппроксимации'

Быстрота сходимости метода выравнивания в равномерной σ-аппроксимации Текст научной статьи по специальности «Математика»

CC BY
76
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Даугавет В. А., Таныгина Н. А.

В статье исследуется алгоритм решения следующей задачи сжатия информации. Для заданной прямоугольной матрицы F требуется найти векторы x и y, для которых функционалϕ(u, v) := max ) |F [i, j] − x[i] − y[j]|i∈Mj∈Nпринимает минимальное значение. Рассматриваемая задача сводится к задаче линейного программирования с большим числом переменных и ограничений. Использование традиционного симплекс-метода для решения этой задачи не эффективно. Удобно использовать простой итеративный процесс выравнивания Diliberto S.P. и Straus E.G.В данной работе рассматривается вопрос о быстроте сходимости метода выравнивания. Вводится определение альтернанса для матрицы F и показывается, что метод выравнивания сходится с быстротой геометрической прогрессии со знаменателем, зависящим от длины альтернанса.Показано, в частности, что если исходная матрица обладает единственным альтернансом наименьшей длины (состоящим из четырех точек), то процесс выравнивания конечен.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The convergence rate of the leveling method for the uniformΣ-approximation

The discrete uniform approximation problem of two variables by the sum of functions of onevariable is considered. The known leveling method resulting in this problem solution is investigated.The estimation of the convergence rate under certain assumptions is obtained.

Текст научной работы на тему «Быстрота сходимости метода выравнивания в равномерной σ-аппроксимации»

УДК 518.12:518.61

В. А. Даугавет, Н. А. Таныгина

Вестник СПбГУ. Сер. 1, 2003, вып. 2 (№9)

БЫСТРОТА СХОДИМОСТИ МЕТОДА ВЫРАВНИВАНИЯ В РАВНОМЕРНОЙ ^-АППРОКСИМАЦИИ

1. Под ^-аппроксимацией понимается аппроксимация функции двух переменных /(и,«) суммой функций одной переменной ж(м)+у(-у). В данной статье рассматривается дискретный вариант такой аппроксимации, который описывается следующим образом. Пусть ^[М, N] —приближаемая матрица (таблица функции от двух переменных), где М = {1, 2,..., т}, N = {1, 2,..., п}, а х[М] и у^] искомые векторы (таблицы функций одной переменной). Равномерная дискретная задача ^-аппроксимации имеет вид

у(ж, у) := тах I ^[г, 7] — х[г] — у[7] М . (1)

Эта задача сводится к задаче линейного программирования, но применение традиционного симплекс-метода для ее решения не эффективно. Для этой задачи обычно используется итеративный метод выравнивания (см. [1, 2]). В данной работе рассматривается вопрос о быстроте сходимости метода выравнивания. Вводится определение альтер-нанса для матрицы ^ и показывается, что метод выравнивания сходится с быстротой геометрической прогрессии со знаменателем, зависящим от длины альтернанса.

2. Приведем необходимые и достаточные признаки существования решения для задачи (1). Обозначим Р := {[г,.] г € М, . € N}.

Определение 1. Ступенчатым циклом Сч называется множество 2ц различных пар индексов из Р следующего вида:

С9 = {[гЪ.?и [гЬ.72 ^ ^ .З^ . . [гд . ], [гд .1]},

где ц € [2, тт{т,п}]. Число ц называется длиной альтернанса.

Определение 2. Пара векторов {х, у} обладает альтернансом относительно матрицы ^ [М, N], если в Р существует ступенчатый цикл Сд, на котором при всех к € 1 : ц выполняются равенства:

^ [¿й ] - х[гй] - у и = м, ^[¿й, ] - х[гй] - у [7^+1] = -М, .д+1 = .Ъ И = ^(х,у).

На рис. 1 приведена схема расположения альтернансных точек при ц = 4.

.1 .2 .3 .4

¿1 М -М

¿2 М -М

¿3 М -М

¿4 -М М

Рис.

© В. А. Даугавет, Н. А. Таныгина, 2003

Известный признак оптимальности для непрерывной задачи S-аппроксимации (см. [3]) в дискретном случае формулируется следующим образом.

Теорема 1. Пара векторов |ж*,у*} является 'решением задачи (1) тогда и только тогда, когда она обладает альтернансом.

Заметим, что в дискретном случае доказательство этой теоремы становится очень простым. Действительно, задача (1) сводится к задаче линейного программирования, и результаты теоремы легко вытекают из известных теорем двойственности.

3. Для заданной матрицы i1[M, N] возьмем произвольный ступенчатый цикл Cq =

{[¿ljl ], [«1, j2], . . . , [iq, jq ], [iq, ji]} и обозначим

р(ся) ¿2(F[ik,jk]-F[ik,jk+!]).

^ fc£l:q

Решим задачу аппроксимации только на этом ступенчатом цикле. Положим

<£>с(и, v) := max{I F[ik, jk] - u[k] - v[k] I, I F[ife, jk+i] - u[k] - v[k +1] 1}, ke1:q

где jq+i = ji, v[q + 1] = v[1], и рассмотрим задачу

<^>c(u, v) ^ min .

u,v£Rq

Она сводится к следующей задаче линейного программирования:

g ^ min,

g + u[k] + v[k] > F[ik,jk], g - u[k] - v[k] > - F[ik,jk],

g + u[k] + v[k +1] > F[ik,jk+i], (2)

g - u[k] - v[k + 1] > - F[ik,jk+i] V k G 1 : q.

Покажем, что

min <^c(u,v) = |p(Cq )|. (3)

u,v

Действительно, сложив первое неравенство с последним и просуммировав по k G 1 : q, получим неравенство g > p(Cq). Аналогичным образом из второго и третьего неравенства получаем g > -p(Cq). Значит, g > |p(Cq)|. Подберем теперь и, v, на которых эта оценка реализуется. Возьмем произвольное число y и положим v[1] = 7. Остальные компоненты v и и найдем из следующих рекуррентных соотношений для k = 1, 2,..., q:

u[k] = F[ik, jk] - v[k] - p(Cq), v[k + 1] = F[ik, jk+i] - и[k] + p(Cq).

Легко видеть, что полученная пара векторов и, v G Rq является планом задачи (2) и значение целевой функции на этом плане равно |p(Cq)|. Значит, равенство (3) доказано.

Замечание. Возьмем произвольные векторы x[M] и y[N] и рассмотрим матрицу H[i, j] = F[i, j] - x[i] - y[j]. Для любого ступенчатого цикла Cq справедливо равенство

у Е (H[ik,jk] ~ H[ik,jk+1]) = p(Cq). (4)

q k£i:q

и* = тах „ оч 2ц

Действительно, при вычислении суммы в левой части все ж[гк] и у[7к] сократятся и останется только р(С9).

Вернемся к задаче (1). В силу (3) для любого ступенчатого цикла С9 и любой пары векторов {ж[М],у[Ж]} справедливо неравенство <^>(ж, у) > |р(С9)|, значит, := М <^>(ж, у) > |р(С9)|. Так как оптимальная пара векторов задачи (1) обладает

х,У

альтернансом, то

1 9

— - Р[гк,зк+1])

к=1

Пользуясь (4) легко показать, что если |р(С9)| = то ступенчатый цикл С9 является альтернансом для любого решения {ж, у} задачи (1), поэтому далее будем называть его просто альтернансом матрицы К. Нетрудно построить матрицы К, у которых несколько альтернансов, при этом они могут и пересекаться. Тем не менее, практически часто встречаются матрицы К, которые имеют единственный альтернанс с ц = 2.

4. Метод выравнивания в дискретной равномерной ^-аппроксимации заключается в следующем.

Выберем жо [М] и затем на каждом р-м шаге (р = 1, 2,...) производим следующие операции. Зафиксировав вектор жр-1 [М], построим "наилучший"для него вектор ур[Ж], решив задачу

¥>(жр-1,у) := тах [¿,7] - жр-1 [г] - у[7]| ^ М . (5)

[г^]еР у[Щ ]

Затем, зафиксировав вектор ур, построим "наилучший"для него вектор жр[М], решив задачу

^(ж,ур) = тах [¿,7] - ж [г] - ур[^']| ^ М . (6)

[г,з]еТ х[М ]

Процесс закончится, когда жр совпадет с жр-1.

Опишем этот процесс подробнее. Ясно, что задача (5) распадается на п самостоятельных задач при каждом 7 € N:

тах [*,- жр-1[г] - ¿| ^ ш$ . Очевидно, что решение 7-й задачи, которое обозначим ур[7], находится по формуле

УрИ] = I (тах^М -жр_1Й) -жр_1Й) ) . (7)

2 КгеМ геМ 1

Введем в рассмотрение матрицу невязок Нр-1,р-1 [М, Ж] с компонентами Нр-1,р-1 [г, 7] = К [г,.?] - жр-1 [г] - ур-1[Я и вектор Д ур с компонентами Д ур[7] := ур[7] - ур-1[7]. Тогда из (7) следует, что

2 V геМ геМ /

а новая матрица Нр-1,р получается из Нр-1,р-1 вычитанием из каждого элемента 7-го столбца одного и того же числа Д ур [7].

Аналогично решается задача (6), т. е. находится вектор Джр := жр - жр-1 и строится новая матрица Нр р. Таким образом, р-й шаг метода выравнивания (построение жр по известному жр-1) заключается в построении следующих векторов и матриц:

ЛурЬ] = Ь( тахЯр_1,р_1[г,]} + ттЯр_1,р_1 [г,]}), ] € Ж; геМ геМ )

Яр-1,р[г,7] = Яр-1,р-1[г,7] - Дур[7], г € М, 7 € N;

Джр[г] = U max. Hp-lp[i,j] + min Hp-i p[i, j]), i G M; V je« je« /

j] = Hp_i,p[i, j] - Д i G M, j G N.

Вычисления заканчиваются, когда вектор Д xp[M] станет нулевым.

Ясно, что у(хр, yp) < , yp) < у(жр_1, yp_i), поэтому при p ^ то имеем

у(хр,ур) ^ В работах [1, 2] доказано, что

= min у (ж, у).

Значит, всякая предельная пара последовательности {xp, yp} является решением задачи (1).

Перейдем к основному результату данной работы — установлению быстроты сходимости метода выравнивания. Предварительно докажем некоторые вспомогательные утверждения.

5. Если процесс выравнивания сходится, то согласно алгоритму в пределе получим матрицу невязок H* с компонентами H*[i, j] = F[i, j] — x* [i] — y*[j], которая обладает свойством

max H [i, j] = — min H [i, j], i G M; je« 1 J je« 1 J

max H [i, j] = — min H [i, j], j G N.

ieM *L'7J ieM *L'7J' 7

Матрицу невязок H* с таким свойством назовем выравненной.

Теорема 2. Пусть исходная матрица F имеет единственный альтернанс и решение задачи (1) {ж*,у*} таково, что матрица H*[i, j] = F[i, j] — x* [i] — y*[j] выравнена. Тогда каждая пара индексов [i,j], на которой |H*[i,j]| = у(х*,у*), принадлежит аль-тернансу.

Доказательство. Введем обозначения

C* = {[ii, ji], [ii, j2],..., [iq, jq], [ig, ji]} — альтернанс,

c* = {i1,i2, ...,i4 , cj = {ji, j2 , jq} .

Пусть для определенности H*[ik, jk] = у*, k = 1 : q, что соответствует рис. 1 с ^ = у*. Допустим, что |H*[ri, si]| = у* и пара [ri, si] не принадлежит С*. Рассмотрим четыре случая.

а) ri = ip G c*, si = ji G c*. Если H*[ri, si] = —у*, то цепочка

[ip, jг], [ib jiL [il, jl+l],[ip, jp]

образует другой альтернанс, что противоречит предположению теоремы. Аналогичным образом можно построить другой альтернанс, если H*[ri, si] = у*.

б) ri = ip G c*, si G c* (или ri G c*, si = ji G c*). Не умаляя общности считаем, что H*[ri,si] = у*. Так как матрица H* выравнена, то найдется H*[r2,si] = —у*. Далее, если Г2 G c*, то находим H*[r2, s2] = у* и т.д. Таким образом строим цепочку из точек, не принадлежащих C*, пока это возможно. Если цепочка замкнулась, то получился новый альтернанс, что недопустимо. Если цепочка сама не замкнулась, а вышла на точку из C*, то, как в случае а), ее можно замкнуть точками из C* и снова получить другой альтернанс.

в) ri G c*, si G c*. Опять сначала строим цепочку из точек, не принадлежащих C*, пока это возможно. Либо она сама замкнется, либо выйдет своими концами в C*. В

обоих случаях образуется новый альтернанс, что противоречит предположению теоремы. ■

6. Исследовать скорость сходимости будем для матрицы F, которая имеет единственный альтернанс

Cq = {[н,л ], [H,j2],. [«q, ], [«q, ,

и для которой inf <^>(ж,у) = м* > 0. Для определенности будем считать, что H*[«k, jk] =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М* и ff*[«k, jk+i] = —м* при всех k € 1 : q (см. рис. 1), так что p(Cq) = м*.

Пусть для такой матрицы F метод выравнивания сходится к паре векторов {ж*, у*} с какого-либо начального вектора жо. Согласно алгоритму предельная матрица невязок H* выравнена и по теореме 2 у матрицы H* нет других компонент максимального уклонения, кроме тех, которые входят в Cq.

Пусть пара {xp,yp}, построенная методом выравнивания, настолько близка к предельной паре {ж*, уФ}, что для нее и для пар на всех следующих итерациях выполнено неравенство:

max |Hp,p[i,j]| < min [«, j]|,

[i,j]eP\c,' [i,j]ec,' (8)

Hp,p[ik, jk] > 0, Hp,p[ik, jk+i] < 0, k € 1 : q.

Установим скорость сходимости пар {xp,yp} к предельной паре {ж*, у*}. Напомним, что на каждой итерации метода матрица невязок выравнена по строкам, матрица Hp,p+i выравнена по столбцам. Введем в рассмотрение q-мерные векторы Д(р) и

¿(p) с

компонентами

Д(р)[к] := Hp,p[ik,jk] — М* = —Hp,p[«k,jk+i] — М*, ¿(p)[к] := Hp,p+i[«k, jk] — М* = —Hp,p+i[ik-i, jk] — М*, к € 1 : q, «о = «q, jq+i = ji.

Быстрота сходимости рассматриваемого процесса зависит от длины альтернанса (q > 2) и определяется следующей оценкой.

Теорема 3. Справедливы неравенства

ЦД^+^IU < ll^(p)IU < ЦД(р)1и

Более того, полагая £(</) = (1 — т^т), имеем

||A(p+r)||TO < £(q) • ||A(p)||TO для нечетного q = 2r + 1, ||A(p+r)||TO < £(q) • ||£(р)|Ц для четного q = 2r.

(9)

Доказательство. Согласно алгоритму

HP,p+i[bj} = HpA^j] ~ rJm&jHpA1'з\ +

2 V ¿^ziW ¿^ziW /

В силу (8) минимальное и максимальное значения ffp,p[i, j] в столбце j известны. Пользуясь выравненностью матрицы Hp,p по строкам, имеем:

min jfc] = Hp^ifc-i, jfc] = -#p,p[ifc_i, jfc_i],

max Hp,p[1, jk] = Hp,p[ifc, j ] = -Hp,p[ifc, jfc+i ].

Значит, на альтернансных индексах (к € 1 : ц)

~Нр,р+1[гк, Зк+\] = 2 (Нр,р[чЛк] + Нр,р[ч+1Лк+1]^ = Нр,р+1[ч+1Лк+1]-Вычитая из обеих частей первого равенства получим

ём[к] = ^{¿^р)[к- 1] + Д(р)И), к£1:д. (10)

Здесь Д(р)[0] = Д(р)[ц]. Далее, по алгоритму

Нр+1,р+1[г,з] = НР,Р+ Льз] ~ 1М] +ттЯР)Р+1[1,1]|.

Поступая аналогичным образом с учетом, что матрица Нр,р+1 выравнена по столбцам, получим

Д^+^И = 1(б^[к + 1]+ё^[к]), к£ 1:д. (И)

Здесь 5(р)[ц + 1] = ¿(р)[1]. Из (11) и (10) теперь следует первая оценка теоремы:

||Д(р+1)1и < Н^(р)1и < 1|Д(р)Н~.

Далее, подставляя (10) в (11), получим

д(р+1)[(!г] = 1(д(р)[(!г_1] + 2Д(г')[/г]+Д(р)[/г+1]), ке 1:д. (12)

Аналогичным образом, вычисляя матрицу Нр+1,р+2, получим

6(-р+1'>[к] = ^(6(-р'>[к-1} + 26(-р'>[к}+6(-р'>[к+1}), ке 1:д. (13)

Напомним (см. (4)), что на всех итерациях для матриц Нрр и Нр,р+1 выполнено равенство

1Г (НР,Р^к,Зк] ~ Нр,р[1к,Зк+1\) = Р(Сд) = /X*, откуда при любых р имеем

Д(р) [к] = 0, ^ ^(р)[к] = 0. (14)

Чтобы воспользоваться этими равенствами, найдем выражение Д(р+г)[к] через Д(р)[к], подбирая г таким, чтобы в выражении для Д(р+г)[к] содержалось ровно ц различных компонент вектора Д(р) или

5(р).

Рассмотрим два случая. Пусть ц — нечетное, ц = 2г +1. Применим формулу (12) г раз к Д(р+г)[к]. Каждое г-е применение формулы добавляет две различные новые компоненты вектора Д(р+г-г) и уменьшает общий множитель в четыре раза. Значит, за г шагов получим

1 9

2 ¿=1

Нетрудно заметить, что ^?=1 а( = 22г. Пользуясь формулой (14) получим

д(р+г)г

22г

]Г(а(г) - 1)Д(р)[г]

< е(«)ПД(р)П~, к е 1: д,

откуда следует требуемая оценка для нечетного д.

Пусть д — четное, д = 2г. Найдем выражение Д(р+г) [к] через £(р)[к]. Воспользуемся один раз формулой (11), а затем г — 1 раз формулой (13). Тогда получим

Так как ^?=1 6( = 22г 1, в силу (14) получим

Д(Р+г)[

22г-1

Е(ь(г) — 1)^р)н

¿=1

< СМН^и к е 1: д,

откуда следует оценка для четного д. ■

Следствие. При д = 2 метод выравнивания конечен. При д = 3 оценка (9) точна. При д = 4 справедливо равенство

||Д^+2)||00 = 1||Д^+1)||00.

Доказательство. Очевидно, что £(д) = 0 при д = 2, так что Д(р+1) = О. При </ = 3 имеем £(3) = а из формулы (12) для всех /г € 1 : 3 следует

Д^+^И = 1 • Д^[/г] + ^(Д(р)[А; - 1] + Д^И + 1]).

Теперь в силу (14) получаем = ^Д^^/г]. Аналогичная формула справедлива

и для ¿(р+1)[к].

При д = 4 применим к Д(р+2)[к] сначала формулу (11), потом (13), а затем воспользуемся (14). Тогда получим

Теперь из (11) следует равенство = ^А^^Щ для всех к £ 1 : </. ■

Таким образом, если матрица ^ обладает единственным альтернансом, то метод ва-равнивания, описанный в п. 4, сходится с быстротой геометрической прогрессии, знаменатель которой равен £(</) = (1 — тфг), где (/—длина альтернанса (</ > 2).

Работа выполнена при финансовой поддержке РФФИ (проект №01-0100231).

1

Summary

Daugavet V.A., Tanygina N.A. The convergence rate of the leveling method for the uniform ^-approximation.

The discrete uniform approximation problem of two variables by the sum of functions of one variable is considered. The known leveling method resulting in this problem solution is investigated. The estimation of the convergence rate under certain assumptions is obtained.

Литература

1. Diliberto S.P., Straus E.G. On the approximation of a function of several variables by the sum of functions of fewer variables // Pacif. J. Mathem. 1951. Vol. 1. P. 195-210.

2. Аникеич А.А., Грибов А.Б. Приближение элементов матрицы суммой соответствующих компонент двух векторов// Исследование операций и статистическое моделирование. Вып. 1. Л., 1972. С. 3-9.

3. Хавинсон С.Я. Чебышевская теорема для приближения функции двух переменных суммами // Изв. АН СССР. Сер. мат. T. 33, №3. 1969. С. 650-666.

Статья поступила в редакцию 13 июня 2002 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.