Вестник СПбГУ. Математика. Механика. Астрономия. 2019. Т. 6 (64). Вып. 2
УДК 519.61+512.6
МБС 15А23, 15А80, 90С47, 90С48, 15В48
Об одноранговой аппроксимации положительных матриц с помощью методов тропической оптимизации*
Н. К. Кривулин, Е. Ю. Романова
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9
Для цитирования: Кривулин Н. К., Романова Е. Ю. Об одноранговой аппроксимации положительных матриц с помощью методов тропической оптимизации // Вестник Санкт-Петербургского университета. Математика. Механика. Астрономия. 2019. Т. 6 (64). Вып. 2. С. 208-220. https://doi.org/10.21638/11701/spbu01.2019.203
В статье развивается подход на основе применения методов тропической оптимизации к задаче одноранговой аппроксимации положительных матриц в метрике Чебышёва в логарифмической шкале. Теория и методы тропической оптимизации составляют один из разделов тропической математики, которая изучает полукольца и полуполя с идем-потентным сложением и их приложения. Для многих практически важных задач методы тропической оптимизации позволяют найти полное решение задачи в явном виде в замкнутой форме. В этой работе рассматриваемая задача аппроксимации приводится к многомерной задаче тропической оптимизации, которая в общем случае имеет известное решение. Предлагается новое решение задачи для случая матриц без нулевых столбцов или строк, которое представляется в более простой форме. На основе этого результата строится новое полное решение задачи одноранговой аппроксимации положительных матриц. Для иллюстрации полученных результатов приводится пример решения в явном виде задачи аппроксимации произвольной положительной матрицы второго порядка.
Ключевые слова: тропическая математика, тропическая оптимизация, тах-алгебра, одноранговая аппроксимация матриц, к^-чебышёвская функция расстояния.
1. Введение. Малоранговая аппроксимация матриц широко используется в задачах машинного обучения [1], статистики [2, 3], сжатия информации [4, 5] и других. Аппроксимация матрицами малого ранга позволяет в таких задачах понизить вычислительную сложность манипуляций с данными, сохранив при этом основную информацию. Обзор приложений и методов малоранговой аппроксимации можно найти, например, в работах [6, 7].
В задачах, в которых данные имеют достаточно простую структуру, в качестве аппроксимирующих матриц часто можно выбирать матрицы ранга 1, обеспечивающие максимальное сжатие информации. При помощи одноранговой аппроксимации могут решаться, например, некоторые задачи статистики [8] и принятия решений [9]. Кроме того, аппроксимация матрицами единичного ранга может оказаться полезной при решении более общей задачи аппроксимации матрицами малого ранга. Так, например, в работах [3, 5] предлагаются рекурсивные методы малоранговой
* Работа выполнена при финансовой поддержке РФФИ в рамках научного проекта №18-01000723.
(¡5 Санкт-Петербургский государственный университет, 2019
аппроксимации, на каждом шаге которых вычисляются одноранговые матричные приближения. Некоторые методы одноранговой аппроксимации описаны в работах [10, 11].
В общем виде задача аппроксимации вещественной матрицы A G Rnxn матрицами X из некоторого подмножества S С Rnxn формулируется как задача оптимизации
min d(A, X), xes
где d — функция расстояния на множестве Rnxn, измеряющая ошибку аппроксимации.
Различия между подходами к решению задачи аппроксимации во многом определяются выбором функции расстояния. Например, в [9] обратно симметрическая матрица суждений в задаче принятия решений аппроксимируется матрицей единичного ранга, минимизирующей расстояние Евклида в обычной или логарифмической шкале. Для одноранговой аппроксимации бинарных матриц в статье [5] используется матричный аналог расстояния Хэмминга. Применение метрики Чебышёва в решении задачи малоранговой аппроксимации, исследованное в [12], позволяет минимизировать абсолютную ошибку между элементами исходной и аппроксимирующей матриц.
Для положительных матриц можно использовать чебышёвскую аппроксимацию в логарифмической шкале. С использованием логарифма по основанию больше единицы задача log-чебышёвской аппроксимации матрицы A матрицей X = stT единичного ранга с элементами Xj = sjtj имеет вид
minmax | logа^ — log(sjtj)|, (1)
где минимум берется по всем положительным векторам s = (sj) и t = (tj).
Задача log-чебышёвской одноранговой аппроксимации рассматривается в работах [13-16], где для решения этой задачи предлагается использовать методы и результаты тропической оптимизации. Тропическая математика изучает теорию полуколец с идемпотентным сложением и ее приложения [13, 17-19]. Экстремальные задачи, которые могут быть записаны и решены в терминах идемпотентных полуколец и полуполей (задачи тропической оптимизации), образуют важное направление исследований в тропической математике [20, 21]. Такие задачи возникают во многих областях, включая сетевое планирование [22], принятие решений [15] и задачи размещения [23].
В работах [14, 15] представлено полное решение задачи (1) для случая одноранговой аппроксимации обратно симметрическими матрицами. Частное решение задачи аппроксимации произвольными матрицами единичного ранга, которое строится при помощи тропических собственных векторов некоторых матриц, получаемых из исходной матрицы, было дано в [13]. Полное решение этой задачи получено в работе [16], где описано множество всех матриц, на которых достигается минимум погрешности аппроксимации. Задача одноранговой log-чебышёвской аппроксимации в указанной работе приводится к задаче, которая может быть записана и решена в терминах тропического полуполя, использующего в качестве сложения операцию взятия максимума.
Решение с помощью тропической оптимизации опирается на замену задачи (1) эквивалентной задачей нахождения положительных векторов s и t, которые обес-
печивают
тт тахтах^ а-1 -л, в^а^-(2)
Ниже для рассматриваемой задачи одноранговой аппроксимации в предположении, что исходная матрица не имеет нулевых столбцов (строк), строится новое решение, которое представляется в более простой форме.
Статья устроена следующим образом. В разделе 2 представлены необходимые определения, обозначения и предварительные результаты тропической математики. В разделе 3 приводятся задачи тропической оптимизации и их решения, которые будут использованы для построения решения задачи аппроксимации. Раздел 4 является ключевым и предлагает новое полное решение задачи тропической оптимизации, сформулированной в предыдущем разделе, для случая матриц без нулевых столбцов (строк). Раздел 5 посвящен приложению полученных результатов к задаче одноранговой аппроксимации. В конце раздела приводится пример решения в явном виде задачи аппроксимации произвольной положительной матрицы второго порядка.
2. Элементы тропической математики. В этом разделе представлены основные понятия и предварительные результаты тропической (идемпотентной) математики [13, 20, 21], на которые опираются решения, описанные в остальной части статьи. Дополнительные сведения по теории и методам тропической математики можно найти, например, в работах [17-19].
2.1. Идемпотентное полуполе. Рассмотрим непустое множество X, которое замкнуто относительно ассоциативных и коммутативных операций сложения ф и умножения (, и содержит их нейтральные элементы нуль 0 и единицу 1. Сложение обладает свойством идемпотентности, согласно которому х ф х = х для всех х € X. Умножение дистрибутивно относительно сложения и для любого ненулевого х существует обратный по умножению элемент х-1 такой, что х-1 ( х = 1. Описанная алгебраическая структура называется идемпотентным полуполем. Далее при записи выражений знак умножения ( для краткости опускается.
Идемпотентность сложения позволяет определить отношение < так, что х < у тогда и только тогда, когда х ф у = у. При таком определении выполняются стандартные свойства отношения частичного порядка: рефлексивность, транзитивность и антисимметричность, а также свойства монотонности операций сложения и умножения. Кроме того, из определения следует справедливость неравенств х < х ф у и у < х ф у, а также то, что неравенство х ф у < г равносильно системе неравенств х < г, у < г. Далее будем считать, что индуцированный сложением порядок является линейным.
Операция возведения в целую степень определяется стандартным образом. Для любого ненулевого х € X и целого р > 0 имеем х0 = 1, хр = хр-1х, х-р = (х-1 )р и 0р = 0. Дополнительно предполагается, что полуполе является алгебраически полным, то есть уравнение хр = а разрешимо для любого натурального р и а € X, обеспечивая существование корня любой натуральной степени р.
Ниже для приложений тропической математики к задаче одноранговой аппроксимации будет использоваться вещественное идемпотентное полуполе Ктах,х, которое принято называть шах-алгеброй. Это полуполе определено на неотрицательной вещественной полуоси в качестве операции сложения использует операцию взятия максимума с нейтральным элементом 0, а в качестве операции умножения —
арифметическое умножение с нейтральным элементом 1. Отношение < определяет естественный линейный порядок на Понятия обратного элемента и степени имеют обычный смысл.
2.2. Матрицы и векторы. Обозначим через Xmхn множество матриц над X, которые состоят из т строк и п столбцов. Матрица, все элементы которой равны числу 0, называется нулевой. Квадратная матрица, все диагональные элементы которой равны числу 1, а недиагональные — числу 0, называется единичной и обозначается 7. В случае полуполя Ктах,х (тах-алгебры) нулевая и единичная матрицы имеют обычный вид.
Матрица называется регулярной по столбцам (строкам), если она не содержит нулевых столбцов (строк). В контексте тах-алгебры регулярность по столбцам (строкам) означает наличие в каждом столбце (строке) матрицы по крайней мере одного элемента, отличного от арифметического нуля.
Сложение и умножение двух матриц подходящего размера и умножение матрицы на число производятся по обычным законам с заменой арифметических операций на операции ф и
Мультипликативно сопряженным транспонированием матрицы А = (а^) € Xmхn называется операция преобразования этой матрицы в матрицу А- = (а-) € Хпхт, элементы которой определяются по правилу а— = а--1, если а^ = 0, и а— = 0 иначе.
Для любой ненулевой квадратной матрицы А и целого р > 0 определены степени матрицы А0 = 7, Ар = Ар-1 А.
След матрицы А = (а^) € Хпхп вычисляется по формуле ^ А = а11 ф • • • ф апп. Для любого числа а € X выполняется очевидное равенство ^(аА) = а ^ А.
Обозначим через Хп множество векторов-столбцов над X размера п. Вектор, все элементы которого равны 0, называется нулевым. Вектор х € Хп называется регулярным, если он не имеет нулевых компонент. Для тах-алгебры нулевой вектор совпадает с обычным нулевым вектором, а регулярность вектора означает, что он не имеет элементов, равных арифметическому нулю (положительный вектор).
Мультипликативно сопряженным транспонированием ненулевого вектора-столбца х = (х^) будем называть его преобразование в вектор-строку х- = (х-), где х- = ж-1, если х^ = 0, и х- = 0 иначе. Ясно, что х-х = 1.
Определим для любой квадратной матрицы А € Хпхп функцию
п
Тг(А) = ^ А ф •• •ф ^ Ап =0 ^ Ат,
т=1
которую можно понимать как некоторый тропический аналог детерминанта матрицы.
Если для матрицы А выполняется условие Тг(А) < 1, то можно составить матрицу («звезда Клини»)
п— 1
А* = 7 ф А ф • • • ф Ап-1 = 0 Ат.
т=0
Число Л € X и ненулевой вектор х € Хп называются собственным значением и собственным вектором матрицы А € Xnхn, если они удовлетворяют равенству
Ах = Лх.
Максимальное собственное число матрицы A вычисляется по формуле
Л = и А ф--ф 1Г1/п (Ап) = 0^1/т(Ат)
т= 1
и называется спектральным радиусом матрицы.
Ясно, что в силу свойств идемпотентного сложения для любого натурального т < п, из определения спектрального радиуса следует неравенство Лт > ^ Ат.
2.3. Решение векторных неравенств. Пусть дана матрица А € Xmхn и
вектор Ь € X™, и требуется решить относительно неизвестного вектора х € Xn неравенство
Ах < Ь. (3)
Лемма 1. Для любой регулярной по столбцам матрицы А и регулярного вектора Ь все 'решения неравенства (3) имеют вид х < (Ь-А)-.
Предположим, что задана матрица А € Xnхn. Рассмотрим задачу нахождения регулярных векторов х € Xn, которые удовлетворяют неравенству
Ах < х. (4)
Лемма 2. Для любой квадратной матрицы А такой, что Тг(А) < 1, все решения неравенства (4) имеют вид х = А* и, где и € Xn.
3. Задачи тропической оптимизации. Рассмотрим задачи тропической оптимизации, которые будут использованы ниже для одноранговой аппроксимации матриц. Предположим, что задана ненулевая матрица A G Xnxn и требуется решить задачу
min x-Ax, (5)
где минимум берется по всем регулярным векторам x G Xn.
В работе [21] получено полное решение задачи (5) в следующем виде.
Лемма 3. Пусть A —матрица со спектральным радиусом А > 0. Тогда минимум в задаче (5) равен А, а все регулярные решения имеют вид x = (А-1 A)*u, где u G Xn.
Пусть теперь для заданной ненулевой матрицы A G Xnxn необходимо найти регулярные векторы x, y G Xn, которые решают задачу
min x-Ay ф y-A-x. (g)
Ниже представлено полное решение этой задачи, полученное в работе [16].
Теорема 1. Пусть A — ненулевая матрица, а ^ — спектральный радиус матрицы AA-. Тогда минимум в задаче (6) равен ^1/2, а все регулярные решения имеют вид
x = (M-1AA-)*v ф m-1/2A(m-1A-A)*w, y = m-1/2A-(m-1AA-)*v ф (m-1A-A)*w, v, w G Xn.
В случае, если матрица А является регулярной по столбцам или по строкам, можно построить другое решение этой задачи, которое предлагается в следующем разделе.
4. Решение для регулярной по столбцам матрицы. Приведем результат, который определяет все векторы х и у, обеспечивающие минимум в задаче (6) для случая регулярной по столбцам матрицы А. Если матрица является регулярной по строкам, то может быть получено аналогичное решение.
Для построения решения используется общий подход, предложенный в [21]. Вводится параметр, обозначающий минимум целевой функции, и находится его точная нижняя граница. Затем при помощи лемм 1 и 2 решаются неравенства, которым должны удовлетворять векторы х и у, минимизирующие значение целевой функции.
Теорема 2. Пусть А —регулярная по столбцам матрица, а м —спектральный радиус матрицы АА-. Тогда минимум в задаче (6) равен м1/2, а все регулярные 'решения определяются соотношениями
х = (м-1 АА-)*и, и € X"-, М-1/2А-х < у < м1/2(х-А)-.
Доказательство. Введем параметр в для обозначения минимума целевой функции задачи (6). Тогда все решения задачи находятся из уравнения х-Ау ф у-А-х = в. Из того, что матрица А — ненулевая, а векторы х и у — регулярные, вытекает, что в > 0.
Учитывая, что в обозначает минимум целевой функции, множество решений не изменится, если уравнение заменить неравенством х-Ау ф у-А-х < в. В силу свойств идемпотентного сложения последнее неравенство равносильно системе неравенств
х-Ау < в, у-А-х < в. (7)
Применяя лемму 1 для решения первого неравенства относительно Ау и второго относительно А-х, получим неравенства Ау < вх и А-х < ву. Умножая второе из полученных неравенств слева на х- А и учитывая первое неравенство системы (7), будем иметь х-АА-х < вх-Ау < в2. Ненулевые элементы матриц А и Асимметричны относительно главной диагонали и образуют хотя бы одну единицу на диагонали матрицы АА-, а тогда спектральный радиус м матрицы АА- отличен от нуля и можно воспользоваться леммой 3.
В силу того, что по лемме 3 минимум функции х-АА-х равен м, будем иметь в2 > х-АА-х > м, откуда следует оценка для в снизу в виде в > м1/2. Покажем, что эта оценка является точной. Возьмем регулярное решение х уравнения х-АА-х = м, которое в соответствии с леммой 3 существует. Определим вектор у = м
-1/2А-
х.
Вычисление целевой функции для таких векторов х и у с учетом того, что вектор А-х ненулевой, дает следующий результат:
х-Ау ф у-А-х = м-1/2х-АА-х ф м1/2(А-х)-А-х = м-1/2М ф М1/2 = М1/2.
Таким образом, получили, что в = м1/2 и система неравенств (7) принимает вид Ау < м1/2х, А-х < м1/2у.
Так как матрица А регулярна по столбцам, можно применить лемму 1 для решения первого неравенства полученной системы относительно у. В результате будем иметь неравенство у < ^,1/2(х-А)-. Объединив последнее неравенство со вторым неравенством системы, умноженным на ^-1/2, получим двойное неравенство, эквивалентное системе, которое имеет вид
уТ1/2А-х < у < м1/2(х-А)-.
Для того чтобы множество значений вектора у не было пустым, необходимо и достаточно выполнение неравенства А-х < ^,(х-А)-. По лемме 1 это неравенство является решением относительно А-х неравенства
ц-1АА-х < х. (8)
В силу того, что для любого натурального числа к < п имеем > Ьт((АА-)к), выполняется соотношение
п
Тт(м-1АА-) = 0^((АА-)к) < 1.
к=1
Теперь, применяя лемму 2, приходим к тому, что все векторы х, отвечающие неравенству (8), имеют вид х = (^,-1АА-)*и, где и € Xn.
После объединения последнего результата с двойным неравенством для у, заключаем, что минимум в задаче (6) равен ^1/2 и достигается на векторах х и у, которые удовлетворяют условиям, приведенным в формулировке настоящей теоремы. □
Покажем, что условие регулярности матрицы по столбцам является существенным для применения теоремы 2. Допустим, что у матрицы А имеется один нулевой столбец, например первый. В этом случае векторы в левой и правой частях двойного неравенства ^,-1/2 А-х < у < ^,1/2(х-А)- имеют нулевую первую координату. Тогда для всех решений должно выполняться условие у1 = 0, из чего следует заключить, что регулярных решений задача (6) не имеет. Однако известно, что регулярные решения этой задачи существуют и определяются теоремой 1. Кроме того, легко видеть, что для матрицы А с нулевым первым столбцом целевая функция задачи (6) на самом деле вообще не зависит от элемента у1, который для всех решений может быть выбран произвольно.
Рассуждая так же, как в теореме 2, получим решение задачи тропической оптимизации для матрицы, регулярной по строкам, в следующем виде.
Следствие 1. Пусть А —регулярная по строкам матрица, а ^ — спектральный радиус матрицы А-А. Тогда минимум в задаче (6) равен я-1/2, а все регулярные решения определяются соотношениями
М-1/2Ау < х < м1/2(у-А-у = (^-1А-А)*и, и € Xn.
5. Приложение к задаче аппроксимации. В работе [16] было показано, что после перехода к тропическому полуполю Ктах,х задача одноранговой аппроксимации (2) положительной матрицы размерности п может быть сведена к задаче тропической оптимизации (6) и решена при помощи применения теоремы 1. Решение задачи одноранговой аппроксимации дано в следующей теореме.
Теорема 3. Пусть A — положительная матрица, ^ — спектральный 'радиус матрицы AA-. Тогда минимальная погрешность log-чебышёвской аппроксимации матрицы A равна logа все аппроксимирующие матрицы имеют вид stT, где
s = (p-1AA-)*v © M-1/2A(M-1A-A)*w, tT = (M-1/2A-(M-1AA-)*v © (M-1A-A)*w)-, v, w e R+.
Для того чтобы применить теорему 2, сначала запишем целевую функцию задачи (2) в терминах тропического полуполя Rmax,x в виде (см. также [16])
n
0 (s-1ftjt-1 © ) = s-A(t-)T © tTA-s.
i,j=1
Тогда задача (2) принимает вид
min s-A(t-)T ® tTA-s,
s,t
где минимум берется по всем положительным векторам s и t.
Положив x = s, y = (t-)T, приходим к задаче тропической оптимизации в форме (6). Применяя теорему 2, получим следующее решение задачи аппроксимации.
Теорема 4. Пусть A — положительная матрица, ^ — спектральный радиус матрицы AA-. Тогда минимальная погрешность log-чебышёвской аппроксимации матрицы A равна log^1/2, а все аппроксимирующие матрицы имеют вид stT, где
s = (^-1AA-)*u, u e R+, M-1/2s-A < tT < m1/2(A-s)-.
В силу следствия 1 решение задачи аппроксимации можно записать в другом виде.
Следствие 2. Пусть A — положительная матрица, ^ — спектральный радиус матрицы A-A. Тогда минимальная погрешность log-чебышёвской аппроксимации матрицы A равна log ^1/2, а все аппроксимирующие матрицы имеют вид stT, где
M-1/2A(t-)T < s < M1/2(tTA-)-, tT = ((m-1 A-A)*u)-, u e R+.
Проиллюстрируем применение теорем 3 и 4 на следующем примере.
Пример 1. Рассмотрим задачу аппроксимации положительной матрицы второго порядка
A = ( а11 а12
\а,21 а,22
Используя арифметику идемпотентного полуполя Rmax, x , найдем спектральный радиус матрицы AA-. Для этого построим матрицы
AA-
1 а11а211 © а12а221
ча111а21 © а121Я22 1
Вестник СПбГУ. Математика. Механика. Астрономия. 2019. Т. 6(64). Вып. 2 215
(АА_)2 = (а11а121а21:1а22 Ф а^а^а^а-1 аца2 11 ф а^а-1
V а 1 1 а2 1 Ф а 1 2 а22 а 1 1а 1 2 а2 1 а22 Ф а 1 1 а 1 2а2 ^2
Вычисление спектрального радиуса дает следующий результат:
М = ^(АА -) ф 1г1/2((АА -)2) = (а11а121а211а22 ф а111а12а21а221)1/2 > 1.
Рассмотрим два возможных значения м. Предположим, что выполняется условие м = (а111а12а21а221)1/2 > (аца121а211а22)1/2. Тогда матрица АА- принимает вид
а-14
а11 а21 1
Далее для применения теоремы 3 требуется найти матрицы
АА- = 11 а12а22
(М-1АА-г = ( 111 м 1а12а221
V М а12 М а22 у
Кроме того, для матрицы
А-А
необходимо вычислить матрицы
а21 а221
а111а12
(М-1А-А)* = ( 1 1 _1 М 1а111а1Л , М-1/2А(м-1А-А)* = К^11 ми11//22;12)
\М ' а21 М а22 /
Пусть V и ш —двумерные векторы. Согласно утверждению теоремы 3, решением задачи являются все матрицы вида , где
1 м-^-Л ^ ф ( М1/2а11 М-^«^ ш
М-1а111а21 1 ) \М-1/2а21 М1/2а22 /
¿т = ( /У^а^1 М1/2а211 А ^ ( _ 1 _ М-1аГ11а12А ш \\М1/2а121 М-1/2а22/ \М 1а21а221 1 у
Заметим, что в каждой из полученных матриц (м-1АА-)*, м-1/2А-(м-1 АА-)*, (М-1А-А)* и м-1/2А(м-1 А-А)*, используемых для построения векторов в и ¿т, столбцы коллинеарны друг другу. Например, в случае матрицы (м-1АА-)* умножение первого столбца на м^а^а—1 дает второй столбец.
Учитывая, что решение имеет форму линейной оболочки столбцов этих матриц, один из столбцов может быть отброшен. Тогда для записи выражений для векторов в и ¿т достаточно выбрать по одному одноименному столбцу в каждой матрице. Возьмем, например, первый столбец и для произвольных ненулевых чисел V и Ш запишем
-1 1 1 А Vф ( М1^" ) ш, ¿т = ((м--ац1^ Vф ( -1 1 Л Ш
уМ 1а11 а2^ \М 1/2а2^ ЧЧМ^а^ / \М 1а21а22 )
1
1
Полученные выражения можно представить в следующей форме:
Определим новый параметр и = V ф ¡1/2 ацЖ. Тогда величина и отлична от нуля, а векторы в и £т принимают вид
s = (-Л ) U, tT = (V/V1 V и-1.
\М а11 1/2 «12 у
Записывая аппроксимирующую матрицу, приходим к единственному решению задачи в форме матрицы
^т = ( М1/2в11 М-1/2в1Л = Ла11 а12в21а221)1/4 (аца?2о-1022 \чЛ-1/2Я21 ¡1/2а<22 / \(а11 аГ21а21а22)1/4 (а-^а^а^а^
Можно показать, что при л = (а11а-21а-11а22)1/2 получается такая же матрица.
Убедимся в том, что применение теоремы 4 дает это же решение. Предположим, что ¡л = (0-^012а21а-21)1/2, а и — произвольное ненулевое число. Нетрудно проверить, что тогда минимальная погрешность аппроксимации достигается на матрицах , где
в = ( 1 ^ и, ( ¡_1/2,а11 ^ и-1 < *т < ( ^Ъ1 )Т и-1
л 1а111Я2^ ' Ул 1/201^ чл 1/2012
В силу того, что вектор £Т определяется двойным неравенством однозначно, имеем
в = ( 1-1 ) и, *т = ( Л1/*"" и-1.
1а11 1/2 Я12/
Полученные векторы совпадают с векторами в и найденными в результате применения теоремы 4, что приводит к одной и той же аппроксимирующей матрице
В случае, когда ¡л = (апа121а211а22)1/2, имеем такой же результат.
Литература
1. Yao Q., Kwok J. Greedy learning of generalized low-rank models // Proc. 25th Intern. Joint Conf. on Artificial Intelligence (IJCAI'16). AAAI Press, 2016. P. 2294-2300.
2. Elden L. Numerical linear algebra in data mining // Acta Numer. 2006. Vol. 15. P. 327-384. https://doi.org/10.1017/S0962492906240017
3. Ruhe A. Numerical computation of principal components when several observations are missing. Research report. Umea Univ., 1974.
4. Friedland S., Mehrmann V., Miedlar A., Nkengla M. Fast low rank approximations of matrices and tensors // Electron. J. Linear Algebra. 2011. Vol. 22. P. 1031-1048. https://doi.org/10.13001/1081-3810.1489
5. Koyuturk M., Grama A., Ramakrishnan N. Compression, clustering, and pattern discovery in very high-dimensional discrete-attribute data sets // IEEE Trans. Knowledge Data Eng. 2005. Vol. 17, N 4. P. 447-461. https://doi.org/10.1109/TKDE.2005.55
6. Kumar N. K., Schneider J. Literature survey on low rank approximation of matrices // Linear Multilinear Algebra. 2017. Vol. 65, N 11. P. 2212-2244 https://doi.org/10.1080/03081087.2016.1267104
7. Gillis N. Introduction to nonnegative matrix factorization // SIAG/OPT Views and News. 2017. Vol. 25, N 1. P. 7-16.
8. Aissa-El-Bey A., Seghouane K. Sparse canonical correlation analysis based on rank-1 matrix approximation and its application for FMRI signals // 2016 IEEE Intern. Conf. on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2016. P. 4678-4682. https://doi.org/10.1109/ICASSP.2016.7472564
9. Саати Т. Принятие решений. Метод анализа иерархий / пер. с англ. Р. Г. Вачнадзе. М.: Радио и связь, 1993. 315 c.
10. Luss R., Teboulle M. Conditional gradient algorithms for rank-one matrix approximations with a sparsity constraint // SIAM Review. 2013. Vol. 55, N 1. P. 65-98. https://doi.org/10.1137/110839072
11. Shi Z., Wang L., Shi L. Approximation method to rank-one binary matrix factorization // IEEE Intern. Conf. on Automation Science and Engineering (CASE). IEEE, 2014. P. 800-805. https://doi.org/10.1109/CoASE.2014.6899417
12. Gillis N., Shitov Y. Low-rank matrix approximation in the infinity norm // Computing Research Repository. 2017. arXiv:1706.00078.
13. Кривулин Н. К. Методы идемпотентной алгебры в задачах моделирования и анализа сложных систем. СПб: Изд-во С.-Петерб. ун-та, 2009.
14. Krivulin N. Rating alternatives from pairwise comparisons by solving tropical optimization problems // 12th Intern. Conference on Fuzzy Systems and Knowledge Discovery (FSKD). IEEE, 2015. P. 162-167. https://doi.org/10.1109/FSKD.2015.7381933
15. Krivulin N. Using tropical optimization techniques to evaluate alternatives via pairwise comparisons // 2016 Proc. 7th SIAM Workshop on Combinatorial Scientific Computing. Philadelphia: SIAM, 2016. P. 62-72. https://doi.org/10.1137/L9781611974690xh7
16. Krivulin N. K., Romanova E. Yu. Rank-one approximation of positive matrices based on methods of tropical mathematics // Vestnik St. Petersburg Univ. Math. 2018. Vol. 51, N 2. P. 133-143. https://doi.org/10.3103/S106345411802005X
17. Маслов В. П., Колокольцов В. Н. Идемпотентный анализ и его применение в оптимальном управлении. М.: Физматлит, 1994. 144 с.
18. Butkovic P. Max-linear systems. In Ser.: Springer Monographs in Mathematics. London: Springer, 2010. https://doi.org/10.1007/978-1-84996-299-5
19. McEneaney W. M. Max-Plus Methods for Nonlinear Control and Estimation. In Ser.: Systems and Control: Foundations and Applications. Boston: Birkhauser, 2006. https://doi.org/10.1007/0-8176-4453-9
20. Krivulin N. Tropical optimization problems // In: Advances in Economics and Optimization (Economic Issues, Problems and Perspectives). New York: Nova Sci. Publ., 2014. P. 195-214.
21. Krivulin N. Extremal properties of tropical eigenvalues and solutions to tropical optimization problems // Linear Algebra Appl. 2015. Vol. 468. P. 211-232. https://doi.org/10.1016/j.laa.2014.06.044
22. Krivulin N. Tropical optimization problems in time-constrained project scheduling // Optimization. 2017. Vol. 66, N 2. P. 205-224. https://doi.org/10.1080/02331934.2016.1264946
23. Krivulin N. K. An extremal property of the eigenvalue of irreducible matrices in idempotent algebra and solution of the Rawls location problem // Vestnik St. Petersburg Univ. Math. 2011. Vol. 44, N 4. P. 272-281. https://doi.org/10.3103/S1063454111040078
Статья поступила в редакцию 23 октября 2018 г.;
после доработки 17 ноября 2018 г.; рекомендована в печать 20 декабря 2018 г.
Контактная информация:
Кривулин Николай Кимович —д-р физ.-мат. наук, доц.; [email protected]
Романова Елизавета Юрьевна — [email protected]
On rank-one approximation of positive matrices using methods of tropical optimization
N. K. Krivulin, E. Yu. Romanova
St. Petersburg State University, Universitetskaya nab., 7—9, St. Petersburg, 199034, Russian Federation
For citation: Krivulin N. K., Romanova E. Yu. On rank-one approximation of positive matrices using methods of tropical optimization. Vestnik of Saint Petersburg University. Mathematics. Mechanics. Astronomy, 2019, vol. 6(64), issue 2, pp. 208-220. https://doi.org/10.21638/11701/spbu01.2019.203 (In Russian)
In the paper, an approach to the problem of rank-one approximation of positive matrices in the Chebyshev metric in logarithmic scale is developed based on the application of methods of tropical optimization. The theory and methods of tropical optimization constitute one of the areas of tropical mathematics that deals with semirings and semifields with idempo-tent addition and their applications. For many practically important problems, methods of tropical optimization allow finding a complete solution explicitly in a closed form. In this work, the approximation problem under consideration is reduced to multidimensional tropical optimization problem, which has a known solution in the general case. A new solution to the problem in the case when the matrix has no zero columns or rows is proposed and represented in a more simple form. On the basis of this result, a new complete solution of the problem of rank-one approximation of positive matrices is developed. To illustrate the results obtained, an example of the solution of the approximation problem for an arbitrary positive matrix of the second order is given in analytical form.
Keywords: tropical mathematics, tropical optimization, max-algebra, rank-one matrix approximation, log-Chebyshev distance.
References
1. Yao Q., Kwok J., "Greedy learning of generalized low-rank models", Proc. 25th Intern. Joint Conf. on Artificial Intelligence (IJCAI'16), 2294-2300 (AAAI Press, 2016).
2. Elden L., "Numerical linear algebra in data mining", Acta Numer. 15, 327-384 (2006). https://doi.org/10.1017/S0962492906240017
3. Ruhe A., Numerical computation of principal components when several observations are missing (Research report, Umea Univ., 1974).
4. Friedland S., Mehrmann V., Miedlar A., Nkengla M., "Fast low rank approximations of matrices and tensors", Electron. J. Linear Algebra 22, 1031-1048 (2011). https://doi.org/10.13001/1081-3810.1489
5. Koyuturk M., Grama A., Ramakrishnan N., "Compression, clustering, and pattern discovery in very high-dimensional discrete-attribute data sets", IEEE Trans. Knowledge Data Eng. 17 (4), 447-461 (2005). https://doi.org/10.1109/TKDE.2005.55
6. Kumar N.K., Schneider J., "Literature survey on low rank approximation of matrices", Linear Multilinear Algebra 65 (11), 2212-2244 (2017). https://doi.org/10.1080/03081087.2016.1267104
7. Gillis N., "Introduction to nonnegative matrix factorization", SIAG/OPT Views and News 25 (1), 7-16 (2017).
8. Aissa-El-Bey A., Seghouane K., "Sparse canonical correlation analysis based on rank-1 matrix approximation and its application for FMRI signals", 2016 IEEE Intern. Conf. on Acoustics, Speech and Signal Processing (ICASSP), 4678-4682 (2016). https://doi.org/10.1109/ICASSP.2016.7472564
9. Saaty T., The Analytic Hierarchy Process: Planning, Priority Setting, Resource Allocation (McGraw-Hill, New York, 1980).
10. Luss R., Teboulle M. "Conditional gradient algorithms for rank-one matrix approximations with a sparsity constraint", SIAM Review 55 (1), 65-98 (2013). https://doi.org/10.1137/110839072
11. Shi Z., Wang L., Shi L., "Approximation method to rank-one binary matrix factorization", IEEE Intern. Conf. on Automation Science and Engineering (CASE), 800-805 (2014). https://doi.org/10.1109/CoASE.2014.6899417
12. Gillis N., Shitov Y., "Low-rank matrix approximation in the infinity norm", Computing Research Repository, arXiv: 1706.00078 (2017).
13. Krivulin N. K., Methods of idempotent algebra for problems in modeling and analysis of complex systems (St. Petersburg University Press, St. Petersburg, 2009). (In Russian)
14. Krivulin N., "Rating alternatives from pairwise comparisons by solving tropical optimization problems", 12th Intern. Conference on Fuzzy Systems and Knowledge Discovery (FSKD), 162—167 (2015). https://doi.org/10.1109/FSKD.2015.7381933
15. Krivulin N., "Using tropical optimization techniques to evaluate alternatives via pairwise comparisons", 2016 Proc. 7th SIAM Workshop on Combinatorial Scientific Computing, 62—72 (SIAM, Philadelphia, 2016). https://doi.org/10.1137/L9781611974690.ch7
16. Krivulin N. K., Romanova E. Yu., "Rank-one approximation of positive matrices based on methods of tropical mathematics", Vestnik St. Petersburg Univ. Math. 51 (2), 133—143 (2018). https://doi.org/10.3103/S106345411802005X
17. Maslov V. P., Kolokoltsov V. N., Idempotent Analysis and Its Applications to Optimal Control Theory. (Nauka Publ., Moscow, 1994). (In Russian)
18. Butkovic P., Max-linear systems, in Springer Monographs in Mathematics (Springer, London, 2010). https://doi.org/10.1007/978-1-84996-299-5
19. McEneaney W. M., Max-Plus Methods for Nonlinear Control and Estimation, in Systems and Control: Foundations and Applications (Birkhauser, Boston, 2006). https://doi.org/10.1007/0-8176-4453-9
20. Krivulin N., Tropical optimization problems, in Advances in Economics and Optimization (Economic Issues, Problems and Perspectives), 195—214 (Nova Sci. Publ., New York, 2014).
21. Krivulin N., "Extremal properties of tropical eigenvalues and solutions to tropical optimization problems", Linear Algebra Appl. 468, 211-232 (2015). https://doi.org/10.1016/j.laa.2014.06.044
22. Krivulin N., "Tropical optimization problems in time-constrained project scheduling', Optimization 66 (2), 205-224 (2017). https://doi.org/10.1080/02331934.2016.1264946
23. Krivulin N. K., "An extremal property of the eigenvalue of irreducible matrices in idempotent algebra and solution of the Rawls location problem", Vestnik St. Petersburg Univ. Math. 44 (4), 272-281 (2011). https://doi.org/10.3103/S1063454111040078
Received: October 23, 2018 Revised: November 17, 2018 Accepted: December 20, 2018
Author's information:
Nikolai K. Krivulin — [email protected] Elizaveta Yu. Romanova — [email protected]