Научная статья на тему 'Оценка наилучшего приближения в равномерной σπ-аппроксимации'

Оценка наилучшего приближения в равномерной σπ-аппроксимации Текст научной статьи по специальности «Математика»

CC BY
126
39
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Даугавет В. А., Таныгина Н. А.

Рассматривается задача равномерного приближения прямоугольной матрицы F матрицами Z фиксированного ранга r меньшего, чем ранг F. Для поиска решения этой задачи имеетсяпростой релаксационный процесс, который, однако, не всегда приводит к решению. Для установления близости полученной этим процессом матрицы Z0 ранга r к решению Z∗ желательно иметь достаточно высокую оценку снизу для наилучшего приближения F − Z∗ ∞. Такую оценку можно получить, если решить задачу подобную исходной, но не для всей матрицы F, а для ее (r + 1) строк или столбцов (задача на полосе ). В работе показано, что решение задачина полосе сводится к решению конечного числа задач линейного программирования. Решив задачу на какой-либо полосе, получим двустороннюю оценку для наилучшего приближенияνL ≤ F − Z∗ ∞ ≤ F − Z0 ∞,где νL — наилучшее приближение на полосе. Если верхняя и нижняя оценки в этом двойном неравенстве близки, то матрицу Z0 можно принять за хорошее приближение к решению Z∗. В противном случае релаксационный процесс можно повторить с другой начальной матрицей. Приведены численные примеры, указывающие на эффективность использования таких оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Даугавет В. А., Таныгина Н. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The estimate of the best approximation in the uniform ΣΠapproximation

The uniform approximation problem of the rectangular matrix F by matrices Z of fixed rank r less than rank F is considered. There is a simple method of a relaxation type for finding the solution of this nonlinear problem, which, however, doesn’t result in the solution. To determine closeness of matrix Z0 with rank r, obtained by this process, to the solution Z∗, it is desirable to have a rather high estimate from below for the best approximation F − Z ∞. It is shown that such estimate may be obtained by solving the problem similar to the original one not for the entire matrix F, but only for its (r + 1) rows or columns (strip problem).

Текст научной работы на тему «Оценка наилучшего приближения в равномерной σπ-аппроксимации»

В. А. Даугавет, Н. А. Таныгина

ОЦЕНКА НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ В РАВНОМЕРНОЙ ЯП-АППРОКСИМАЦИИ

Под ЯП-аппроксимацией понимается приближение функции многих переменных суммой произведений функций, каждая из которых зависит от меньшего числа переменных. Такая аппроксимация находит свое применение в вопросах повышения эффективности систем передачи информации, в теории обработки изображения и других областях. Впервые она была предложена Е. Шмидтом в 1907 г. [1], в 1957 г. к ней обратился М. Р. Шура-Бура [2], но они рассматривали среднеквадратическую ЯП-ап-проксимацию. Дискретный вариант равномерной ЯП-аппроксимации для функции от двух переменных впервые был рассмотрен в работе [3], позднее в работах [4, 5], где были получены необходимые и некоторые достаточные признаки локального минимума, а также предложен некоторый простой релаксационный процесс для поиска наилучшего равномерного приближения. Однако, этот процесс может не приводить к решению задачи, поэтому для установления близости полученного приближения к точному решению желательно иметь оценку снизу для наилучшего приближения. Вычислению такой оценки и посвящена предлагаемая статья. Описанная в статье вспомогательная задача является естественным обобщением двумерной чебышевской интерполяции, описанной в работе [6].

1. Постановка задачи. Пусть F[M,N] произвольная вещественная матрица, где M = {1,...,m}, N = {1,...,n}, и r — некоторый целочисленный параметр, причем

1 < r < rank F, R = {1,... ,r}. Рассмотрим дискретную равномерную ЯП-аппроксима-

цию, т. е. равномерное приближение матрицы F произведением двух матриц X [M,R] и YT [R, N] меньшего размера:

ф(Х,У):= max |F[i,j] -V X[i,k]Y[j,k]\ ^ inf , (1)

ieM,jeN ^ J| {X,Y }eMr

kER

где под Mr понимается множество всевозможных пар вещественных матриц фиксированного размера {X[M, R],Y[N, R]}. Эта задача связана с проблемой сокращения объема информации, содержащейся в матрице F. Она рассматривалась, в частности, в работах [5, 6].

Известно, что задача (1) разрешима. Обозначим через л* наилучшее приближение матрицы F матрицами указанного размера, т. е.

Л* '■= inf Р(X,Y).

Mr

Имеется некоторый релаксационный процесс для поиска минимума функционала p(X,Y) [5]. Он заключается в следующем. Выбирается матрица Yo[N, R] и затем на каждом p-м шаге (р =1, 2,...) производятся следующие операции. Фиксируется матрица Yp-i и находится Xp как решение линейной задачи

V(X,Y—) ^ inf.

X

© В.А.Даугавет, Н.А.Таныгина, 2004

Затем фиксируется матрица Хр, а Ур находится как решение линейной задачи

Процесс продолжается до тех пор пока не выполнится неравенство \\Yp — Y^iH < 5, где 5 — заданная точность вычислений. Однако, в результате этого процесса полученная пара может оказаться далекой от решения, более того, может оказаться даже не стационарной для <р. В связи с этим хотелось бы иметь хорошие оценки снизу для л*, чтобы оценить близость полученного уклонения от наилучшего приближения. В данной работе показано, как находить эти оценки.

2. ЯП-аппроксимация на полосе. Выделим в M подмножество Mi, состоящее из (г + 1) элементов, где r —параметр задачи (1). Пару множеств {Mi,N} назовем горизонтальной полосой. Аналогичным образом определяется вертикальная полоса: {M, Ni}, где |Ni| = r +1. Далее будем рассматривать только горизонтальную полосу.

Для удобства изложения положим Fl = F[Mi,N], строки матрицы Fl занумеруем от 0 до r и положим Ro = {0,1,...,r}. Запишем задачу ЯП-аппроксимации на горизонтальной полосе:

Здесь Сг — множество пар произвольных матриц заданного размера {и[Ко, К], У[М, Д]}.

В отличие от задачи (1) для задачи на полосе можно предложить конечный алгоритм поиска глобального минимума функции рь(и, У), который будет описан ниже.

Значит, решив задачу на полосе, получим оценку снизу для наилучшего приближения исходной матрицы. Заметим, что если vl = 0, то оценка не содержательна, поэтому следует выбирать такую полосу, для которой rank Fl = r +1, тогда и наилучшее приближение vl будет положительным.

Из вышесказанного следует, что если для некоторой пары {X*,Y*} из Mr и некоторой полосы оказалось, что

где £ достаточно мало, то пару можно принять за хорошее приближение к решению задачи (1).

Заметим, что ЯП-аппроксимация на полосе является обобщением известной задачи двумерной чебышевской интерполяции [6], которая отличается от (2) тем, что множество N тоже имеет лишь г + 1 элементов. Предлагаемый ниже способ решения задачи (2) годится и для решения задачи двумерной чебышевской интерполяции.

3. Решение задачи на полосе. Рассмотрим другую задачу чебышевской аппроксимации с той же матрицей ^:

f(Xp, Y) ^ inf.

(2)

Пусть vl = inf <^l(U,Y). Очевидно, что

Л* > vl.

^(X*,Y*) = vl,

то пара {X*,Y*} доставляет p(X,Y) глобальный минимум. Если же

<fi(X*, Y*) — vl < є,

где ||ад|| і = |ад1*]|- Ниже будет описан способ решения этой задачи, а сейчас пока-

іЄКо

жем, что задача (2) эквивалентна задаче (3).

Лемма. Для любой пары {и,У} Є Сг найдется вектор ад|До], ||ад||і = 1, такой, что Фь(ад) < фь(и,У).

Доказательство. Количество строк у матрицы и на единицу больше количества столбцов, поэтому строки ее линейно зависимы. Значит, для каждой матрицы и найдется вектор ад [До] такой, что ||ад||і = 1 и адТ и = 0. Для пары и, ад и произвольной матрицы У докажем требуемое неравенство.

Положим

Мьі] = Рь [і,і] -^2 и[і,к]у |j,k}, і Є ^, З Є N, тогда для всех З Є N имеем ^ ад|і]й|і,З] = ^ ад[і]^[і,З]. Отсюда следует

гЄКо іЄКо

Фь (ад)=шах|у^ ад|і]^|і,З] <( тах |^|і,З]П • ||ад| і = рь(и,У).

jЄN І \iЄRo,jЄN /

іЄКо

Лемма доказана. І

Покажем, что для нахождения решения задачи (2) достаточно решить задачу (3). Пусть имеется вектор ад* |До], ||ад*||і = 1. По этому вектору построим пару матриц

{и, У}, которую будем называть согласованной с вектором ад* и которая строится по

следующему правилу.

Положим

1, если ад* |і] > 0, .

-1, если ад* |і] < 0,

:= ^2 ад* [^}Fь[^,j}, і Є N■

і Є До

їЩ :=

іЄКо

тах \ад* |і]1 =

іЄК о 1

( іи*[к— 1]

- ги* [іо] ’

і и>* [Й]

- ги* [г0] ’

к Є іо + 1 : г.

Построим пару матриц

УТ к,з] =

Рь |к - 1,З] - £|к - 1]^-, З Є N, к Є 1 : іо,

Рь |к, З] - £|к]^-, З Є N, к Є іо + 1 : г,

и |До,Д] =

\

1 0 0 0

0 1 0 0

«|1] • • а|іо] а|іо + 1] • а|т

0 0 1 0

0 0 0 1

0

/

(в матрице и [До, Д] строка с номером го совпадает с а[Д], а если ее вычеркнуть, то останется единичная матрица).

ад

=1=

Теорема. Если ад* —решение задачи (3), то решением задачи (2) является пара {и, У}, согласованная с вектором ад*, при этом

¥l(U,Y ) = ^l(w* ) = vl.

Доказательство. Пусть пара {U,Y} согласована с w*. Рассмотрим матрицу h[Ro, Ж] с компонентами

h[i,j] = Fb[i,j] - ^ U[i,k]YT[k,j]

heR

и покажем, что ее чебышевская норма равна ). Замечаем, что для всех i = io

имеет место равенство

h[i j] = / fl[i,j\ - YT[i + 1 j] = £[i]ij, i < io,

[ \ FL [i,j] - YT [i,j] = k[i]^j, i>i0.

Покажем, что такое же равенство верно и для io :

h[i0,j] = FL[i0,j] - ^ a[k]Y T [k,j] =

heR

w*[i0]FL[i0,j] + E w* [k - 1]YT[k,j]+ S w*[k]YT[k,j]

hel:io heio + 1:r

W* [*o]

Подставляя вместо YT [k,j] его представление через Fl и ij, получаем ij - ij E |w*[k - 1]| - ij E |w*[k]| I r. -.I

ir- .-I he1:io heio + 1:r |w*[i0]| ^r. ,

w* [i0] w* [i0]

Таким образом,

^l(U,Y) = max |h[i,j]| = max \ij\ = ФL(w*).

ieRo jeW jew

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теперь из леммы следует, что {U,Y} —решение задачи (2). Действительно, если существует пара {U,Y} с <pl(U,Y) < l(U,Y), то по лемме существует w, ||w||i = 1 такой, что ФL(W) < <^l(U,Y) < Фl(w*), что невозможно. ■

Перейдем к методу решения задачи (3). Заметим, что множество Q = {w|||w||i = 1} не является выпуклым, но его можно представить в виде объединения конечного числа выпуклых множеств:

П = иП(£),

где ^[R0] —векторы, компоненты которых равны либо 1, либо (-1), а

^(0 = j w | w[i]£[i] > О, ^ w[i]£[i] = 1 1 .

I iERo J

Очевидно, что задача (3) распадается на конечное число задач (при каждом фиксированном векторе £):

^ь(ад,£) = шах| > ад|і]Рь|і,З] ^ шіп . (4)

jєN\^ wen(e)

іЄКо

Значит, для решения задачи (3) необходимо решить задачу (4) при всех возможных £. Их число можно сократить, т. к. при £ и (-£) результат будет одинаков, поэтому можно зафиксировать £|0] = 1. Обозначим через ад(£) решение задачи (4) при заданном £. Тогда

Vь = ш|пФь (ад (£),£) = Фь(ад(£* ),£*)

и решением задачи (3) является вектор ад* = ад(£*).

Осталось заметить, что задача (4) эквивалентна задаче линейного программирования.

4. Численные эксперименты.

Пример 1. Рассмотрим матрицу Р

11 13 15 17 19 20 22 26 33 33 34 35

9 11 13 14 16 19 21 25 31 33 32 33

9 11 12 14 15 16 20 24 29 31 30 32

9 11 11 13 15 14 19 23 28 29 29 31

6 8 11 12 15 18 19 24 28 30 29 31

6 7 9 11 13 15 17 23 26 29 28 30

7 12 10 11 14 13 17 22 23 25 24 30

6 10 8 9 12 11 15 20 21 24 22 27

5 7 8 10 12 11 16 20 21 24 22 27

V 3 5 6 7 10 11 14 18 21 24 21 27

Применим к ней релаксационный процесс при г = 3, причем в качестве начальной матрицы Уо используем первые 3 строки матрицы Д. В результате получается пара матриц {Хр, Ур} с уклонением у>(Хр, Ур) = 0.7179. Матрица невязок Нр = Д — ХрУр" (с округлением) имеет следующий вид:

( 0.14 0.72 0.43 0.67 0.67 0.72 -0.03 -0.72 -0.53 -0.62 -0.68 0.72

-0.03 0.67 0.10 -0.67 -0.67 0.67 0.37 -0.43 -0.48 0.52 -0.56 0.04

0.62 0.62 0.19 0.41 -0.62 -0.44 0.45 -0.11 0.03 0.62 -0.01 0.20

0.39 -0.72 -0.43 -0.27 -0.39 -0.72 -0.29 -0.55 0.72 0.15 0.68 -0.72

-0.62 0.72 0.25 -0.44 0.67 0.72 0.58 0.72 -0.72 -0.60 -0.68 0.72

0.43 -0.05 -0.43 -0.23 -0.23 -0.58 -0.58 0.58 -0.49 -0.24 0.58 0.05

-0.62 0.72 0.10 -0.67 0.27 0.72 -0.44 0.72 -0.72 -0.62 -0.68 0.72

0.47 0.58 0.24 -0.55 0.37 0.54 -0.58 0.58 0.45 0.46 0.58 -0.48

0.23 -0.67 0.43 0.67 0.67 -0.67 0.58 0.44 -0.42 -0.58 -0.26 -0.23

\ 0.62 0.43 0.19 -0.60 0.40 -0.72 -0.15 -0.72 0.72 -0.62 -0.05 0.72

Как видно из таблицы, строки матрицы Нр, в которых присутствуют максимальные по модулю элементы, имеют номера 1, 4, 5, 7,10. Далее решим задачу на полосе {Мі, N}, где Мі = {1,4, 7,10}. Перебрав все знаковые области П(£), получим, что наименьшее

значение ^l(w, £) достигается для £ = (1, -1,1,1). При этом vl := ^l(w(£), £) = 0.6679. Значит,

0.6679 < v* < 0.7179.

Верхнюю оценку можно уменьшить, если повторить релаксационный процесс для всей матрицы F, взяв в качестве начальной матрицы Y0 матрицу Y из пары {U,Y}, согласованной с вектором w(£). Получается пара {X*,Y*} с уклонением p(X*,Y*) = 0.7114. Следовательно,

0.6679 < i* < 0.7114

и пару {X*, Y*} можно использовать как хорошее приближение к решению задачи (1).

Пример 2. Рассмотрим функцию заданную таблично, где * и j меня-

ются от 1 до 1000 с шагом 1.

Релаксационный процесс для всей матрицы (таблицы функции) при r = 3 приводит к некоторой паре матриц {Xp, Yp} с уклонением у>(Xp, Yp) = 0.008409. При этом строки, в которых присутствуют максимальные по модулю элементы матрицы невязок Hp = F -XpYpT, имеют номера 1, 2, 10, 107-117. Далее была решена задача на полосе {Mi, N}, где Mi = {1, 2,10,117}, в результате чего наилучшее приближение на этой полосе оказалось равным vl = 0.008401. Таким образом, получаем оценку

0.008401 < i* < 0.008409,

из которой следует, что пара {Xp, Yp} практически является наилучшей аппроксима-ционной парой для рассматриваемой таблицы функций.

Для наилучшего приближения i* при r = 8 получаем следующую оценку

0.0000193 < i* < 0.0000213.

Summary

V. A. Daugavet, N. A. Tanyghina. The estimate of the best approximation in the uniform ЕП-approximation.

The uniform approximation problem of the rectangular matrix F by matrices Z of fixed rank r less than rank F is considered. There is a simple method of a relaxation type for finding the solution of this nonlinear problem, which, however, doesn’t result in the solution. To determine closeness of matrix Zo with rank r, obtained by this process, to the solution Z„, it is desirable to have a rather high estimate from below for the best approximation ||F — Z||<^• It is shown that such estimate may be obtained by solving the problem similar to the original one not for the entire matrix F, but only for its (r + 1) rows or columns (strip problem).

Литература

1. Schmidt E. Zur Teorie der linearen und nichtlinearen integralgleihungen //I., Math. Annalen 63. 1907. P. 433-476.

2. Шура-Бура М. Р. Аппроксимация функций многих переменных функциями, каждая из которых зависит от одного переменного // Вычислительная математика. Вып. 2. М., 1957.

С. 3-19.

3. Даугавет В. А. О равномерном приближении функции двух переменных, заданной таблично, произведением функций одной переменной // Журн. вычислит. мат. и мат. физики. Т. 11, №2. 1971. С. 289-303.

4. Даугавет В. А. Приближение функции двух переменных суммой произведений функций одной переменной // Методы вычислений. Вып. 12. Л., 1981. С. 174-186.

5. Даугавет В. А., Сазонова Л. В. Некоторые вопросы многомерной аппроксимации // Методы вычислений. Т. 14. Л., 1985. С. 109-127.

6. Даугавет В. А., Сазонова Л. В. Двумерная чебышевская интерполяция // Вестн. Ленинград. ун-та. №7. 1984. С. 89-91.

Статья поступила в редакцию 19 февраля 2003 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.