ЧЕБЫШЕВСКИЙ СБОРНИК Том 13 Выпуск 1 (2012)
Труды IX Международной конференции Алгебра и теория чисел: современные проблемы и приложения, посвященной 80-летпю профессора Мартина Давидовича Г риндлингера
УДК 519.7
НЕКОТОРЫЕ КОМБИНАТОРНЫЕ АСПЕКТЫ ТЕОРЕТИКО-ГРУППОВОГО ПОДХОДА К ПРОБЛЕМЕ БЫСТРОГО УМНОЖЕНИЯ МАТРИЦ1
Ю. В. Кузнецов (г. Москва) ykuz@niisi.ras.ru
Аннотация
В рамках теоретико-группового подхода к проблеме быстрого умножения матриц, изложенного в основополагающей работе [5], возникают специфические комбинаторные объекты, получившие название “однозначно разрешимые матрицы” (в оригинале “uniquely solvable puzzle”) или сокращенно USP-матрицы.
В работе обсуждаются вопросы, связанные с некоторой числовой характеристикой USP-матриц и доказывается обобщение одного ключевого результата из [5], касающегося алгебраических свойств USP-матриц.
Проблема быстрого умножения матриц является одной из наиболее значительных проблем алгебраической теории сложности вычислений. Толчком для интенсивных исследований в направлении поиска быстрых алгоритмов для умножения матриц явилась публикация в 1969 году знаменитой работы Штрас-сена [1] . В этой работе автор привел алгоритм для умножения двух квадратных матриц порядка п над любым полем со сложностью 0(п1°927) (до Штрас-сена считалось, что умножение двух матриц невозможно осуществить быстрее, чем за 0(п3) операций). Тем самым, Штрассен первым получил нетривиальную оценку экспоненты матричного умножения ш < log27 (напомним, что экспонентой матричного умножения называется наименьшее действительное число ш,
n
полнено за 0(пш+£) операций при любом фиксированном е > 0).
1 Работа выполнена при финансовой поддержке Российского Фонда Фундаментальных Исследований, гранты 12-01-00190-а и 11-01-12002-офи-м-2011
В течение длительного времени усилиями многих математиков оценка для ш постепенно улучшалась и наилучшая оценка ш < 2.376 была получена в 1990 году Копперсмитом и Виноградом в работе [2]. Вплоть до недавнего времени указанная оценка оставалась непревзойденной, однако совсем недавно на конференции Symposium on Theory of Computing - STOC’12 американским математиком В.Василевской Вильямс была анонсирована незначительно улучшенная оценка ш < 2.3727 [3]. Эта оценка получается в результате чрезвычайно трудоемкого и сложного уточнения метода Копперсмита и Винограда.
Следует отметить, что большинство специалистов, работающих над проблемой быстрого умножения матриц, склоняются к тому, что ш = 2.
Новый теоретико-групповой подход к проблеме быстрого умножения матриц был предложен X. Коном и К. Умансом в 2003 году и описан в работе [4]. В этой работе излагался сам подход, однако там не были построены примеры групп,
ш
Через два года к Кону и Умансу присоединились Р. Клейнберг и Б. Сегеди и им удалось построить группы, позволяющие получать нетривиальные оценки
ш
Ключевое свойство, которому должны удовлетворять такие группы назва-ется “свойством тройного произведения” (triple product property).
Пусть G — произвольная конечная группа.
Для произвольного непустого подмножества M С G через Q(M) обозначим множество правых частных M, т.е.
Q(M) = {S1S2 1 : Si, s2 E M}.
G
ния, реализуемому подмножествами S,T,U С G, если из равенства
Q1Q2Q3 = 1
следует q1 = q2 = q3 = 1,
где q1 E Q(S), q2 E Q(T), q3 E Q(U).
Один из способов построения групп, пригодных для оценки экспоненты матричного умножения заключается в следующем: искомая группа строится как полупрямое произведение некоторой циклической группы и симметрической
Un (т.е. U С {1, 2, 3}™), которые в совокупности обладают специфическими комбинаторными свойствами. Такие множества получили название “однозначно разрешимых матриц” (в оригинале “uniquely solvable puzzle” или сокращенно USP).
Для произвольного конечного множества U через Sym(U) обозначим сим-
U
ОПРЕДЕЛЕНИЕ 2. Однозначно разрешимой матрицей (USP-матрицей) ширины п называется множество наборов U С {1, 2, 3}™, удовлетворяющее следующему свойству:
Для любых трех перестановок п1, п2, п3 E Sym(U) либо п1 = п2 = п3 либо найдется набор u E U и номер i, 1 ^ i ^ п такие что выполняются не менее двух равенств из трех
(n1(u))i = 1, (п2(u))i = 2, (пз(и))г = 3.
ш
весь класс USP-матриц, а некоторый его подкласс — так называемые усиленные USP-матрицы (strong USP).
n
жество наборов U С {1, 2, 3}™, удовлетворяющее следующему свойству:
Для любых трех перестановок п1, п2, п3 E Sym(U) либо п1 = п2 = п3 либо найдется набор и E U и номер i, 1 ^ i ^ п такие что выполняются в точности два равенства из трех
Ы(и))г = 1, (п2(u))i = 2, (пз(и))г = 3.
U
n
Си = \U i1/™.
В работе [5] было показано, что для произвольных USP-матриц при стрем-n
Си < 3/22/3 + o(1).
U
С
матриц (усиленных USP-матриц) с возрастающей шириной и с таким же зна-С
ее емкость не превосходит
3/22/3
В той же работе [5] была построена бесконечная серия усиленных USP-
22/3
лучить оценку ш ^ 2.48. Серия усиленных матриц с асимптотической емкостью 22/3 ш
неизвестно пока ни одного примера усиленной USP-матрицы с емкостью строго большей чем 22/3. Таким образом оценка ш ^ 2.48 остается наилучшей оценкой, которая получается с использованием аппарата USP-матриц.
Кон, У маис, Клейнберг и Сегеди сформулировали комбинаторную гипотезу,
ш=2
Гипотеза, sup^ {Си} = 3/22/3 (супремум берется по всем усиленным USP-матрицам).
Правдоподобность данной гипотезы объясняется тем, что для случая всех
3/22/3
ным образом следует из вышеупомянутой работы Копперсмита и Винограда
И-
При построении указанной серии усиленных ГЗР-ма грин с асимптотической емкостью 22/3 авторы Кон, Уманс, Клейнберг и Сегеди существенным образом опираются на лемму (в оригинальной работе [5] это лемма 3.7), которая устанавливает связь между усиленными иЭР-матрицамп определенного вида и свойством тройного произведения, которому удовлетворяет симметрическая группа Бут(и). Ограничение, накладываемое на ГОР-матрицы из этой леммы, состоит в том, что в каждой координате наборов таких ГЗР-ма грин допускается только два возможных значения из трех.
Определение 5. Множество наборов и с {1,2,3}™ называется неполным, если в каждой координате наборов из и допускается только два возможных значения из трех.
Одно из ключевых свойств неполных ГОР-матриц заключается в следующем. Если ГОР-матрица является неполной, то из этого сразу следует, что она является усиленной иЭР-матрицей.
Особо отметим, что иЭР-матрицы с асимптотической емкостью 22/3 из вышеуказанной серии являются неполными.
Будем говорить, что перестановка п Е Бут(и) сохраняет координату I множества наборов и С {1,2,3}™, если для всех наборов и Е и выполняется п(и)г = и^.
Определение 6. Для произвольного множества наборов и с {1,2,3}™ через Н12(и) обозначим, подгруппу группы, Бут(и), состоящую из всех пере-
и
1 и 2.
Аналогичным образом определяются подгруппы Н13(и), Н2,3(и) и Н1)2)3(и).
Приведем вышеупомянутую ключевую лемму 3.7 из работы [5].
Лемма 1. Неполное множество наборов и С {1,2,3}™ является, иБР-матрицей тогда и только тогда, когда, подгруппы Н1>2(и), Н13(и) и Н2,3(и) удовлетворяют свойству тройного произведения в группе Бут(и).
Главный недостаток неполных ГЗР-магрин заключается в том, что их емкость асимптотически не превосходит 22/3. Это было показано в работе [5]. Таким образом, вышеупомянутая серия неполных усиленных ГЗР-магрин имеет максимально возможную асимптотическую емкостью 22/3 и чтобы научиться строить усиленные матрицы с емкостью большей, чем 22/3, мы должны выйти за пределы класса неполных ГЗР-ма грпц.
Настоящая работа является первым шагом в этом направлении. Целью работы является обобщение указанной леммы 3.7 на случай произвольных Г8Р-матриц.
Теорема 1. Если для множества наборов и С {1,2,3}™ подгруппы Н1>2(и), Н13(и) и Н2,3(и) удовлетворяют свойству тройного произведения в группе Бут(и), то и является, усиленной иЗР-матрицей.
Доказательство. Воспользуемся подходом, предложенным в обзорной работе [6] для доказательства вышеуказанной леммы 3.7 из работы [5]. Для этого будем рассматривать иЭР-матрицу и С {1, 2, 3}™ непосредственно как матрицу,
и
вать порядок строк, какой конкретно порядок - не имеет значения.
Итак, будем рассматривать прямоугольные матрицы, элементы которых
{1, 2, 3}
Пусть троичная матрица и имеет размер к х и, и на строках этой матрицы действует симметрическая группа Буть- Через щ, 1 < г < к будем обозначать г-ую строку матрицы и, через п(и*) — строку матрицы и, являющуюся образом строки и* иод действием перестановки п Е Буть, а через (п(щ))^ , 1 < ] < и — ^'-й элемент строки п(щ).
Наконец, через п(и) — обозначим матрицу иявляющуюся образом матрицы и под действием перестановки п Е Бут^ т.е. матрицу, г-ая строка которой и1* = п(и*) , 1 < г < к.
В этих терминах определение ГЯР-матрпцы (усиленной ГЯР-матрпцы) будет выглядеть следующим образом:
Определение 7. Троичная матрица и размера к х и называется иБР-матрицей (усиленной ЦБР-матрицей), если она удовлетворяет условию:
Для любых перестановок строк матрицы и п1, п2, п3 Е Буть таких,
п1, п2, п3
найдутся индексы г и 1 < г < к, 1 < ] < и, что из трех равенств
(п1(иг))з = 1 (п2 (иг))] = 2,
(п3 (итУ)] = 3
выполняются не менее двух равенств из трех (соответственно в точности два).
и и1 2
и
и2 3 и1 3 и1 2 3
и
и1 2 и2 3 и1 3 и1 2 3
и =1 и1 и,3и1,3и1,2,3 | •
Тогда для любой перестановки п Е Н1 , 2(и) будет выполняться
п(и) =| и1,2112А,3&1,2 ,3 || •
Аналогичные равенства будут справедливы также для подгрупп Н2,3(и), Н1,3(и)ж Н1,2,3(и).
Перейдем к непосредственному доказательству теоремы 1.
Пусть симметрическая группа Бушк удовлетворяет свойству тройного произведения, реализуемому подгруппами Ні2(и), Н23(и), Ні3(и). Будем доказывать, что и — усиленная ГОР-матрица.
Доказательство будем проводить от противного, т.е. предположим, что и не является усиленной иЭР-матрицей. Тогда существуют некоторые три перестановки пі} п2, п3 Є БуШк, среди которых хотя бы две перестановки различны и для всех г и і из трех равенств
(лі(пі))з = 1, {п2{пі))з = 2,
(пз(и))з = З
не может выполняться в точности два равенства.
Покажем, что
(пі(и)) 1,2 = (П2(и))і,2 (1)
Обозначим (п1(и))1;2 через А, а (п2(и))1;2 через В. Очевидно, что при любых г и і из-за сделанного предположения относительно и не может возникнуть ситуация, что
1, Ьі,3 2 '
Поэтому возможно только три варианта
сз = 1, Ьг,3 =1
сз 2, Ьі,3 =2
3 2, Ьі,3 : =1
В то же время матрицу В можно получить из А некоторой перестановкой строк и следовательно количество элементов 2 в В равно количеству элементов 2 в А.
Поэтому третий вариант также невозможен ни при каких г и Следовательно
А = В.
Аналогично можно показать, что
('к2{и ))2,з = ))2,з (2)
(п\(и)) 1,з = (пз(и)) 1,з (3)
Перестановки п1} п2 и пз определяют некоторые перестановки Н17 Н2, Нз Е БуШк такие, что
П2 (и) ^1 • пі(и)
пз(и) П2(и )
п1(и ) пз(и).
Нетрудно выразить Ні7 Н2 и Н3 через пі7 п2 и п3 :
Ні = піп-1, Н2 = П2П-1, Нз = пзп-1.
В силу равенств (1), (2) и (3)
Н1 Е Н1'2(и), Н2 Е Н2,з(и), Нз Е Н1,з(и). о построению, Н1 ■ Н2 ■ Нз = 1, следовательно, по свойству тройного произве-
Д6НИЯ
Н1 = Н2 = Нз = 1 ,
откуда следует, что
П1 = П2 = Пз ,
что противоречит выбору П1} П2, пз .
Теорема 1 доказана. □
К сожалению, в обратную сторону лемму 3.7 удается обобщить только в несколько ослабленной форме.
Теорема 2. Если множество наборов и С {1, 2, 3}™ является ивР-мат-рицей, то подгруппы (Н12ПН12,з), (Н2,зПН12 з) и (Н1зПН12 з) удовлетворяют свойству тройного произведения в группе Буш(и).
и
Рассмотрим произвольные перестановки Н1} Н2, Нз из соответствующих под-Н1 ■ Н2 ■ Нз = 1.
Положим
п1 = 1, п2 = Н-1, пз = Н^Н-1 .
Несложно заметить, что так же, как и при доказательстве теоремы 1
П2 (и) • П1(и)
Пз(и) П2(и)
П1(и ) Пз(и).
Н 1 Е ( Н1 , 2 П Н1 , 2 , з ) Н 2 Е ( Н2 , з П Н1 , 2 , з ) Н з Е ( Н1 , з П Н1 , 2 , з )
выполняются следующие равенства:
(П1(и )) 1,2 = (П2(и )) 1,2
(П2(и ))2,з = (Пз(и ))2,з (П1(и)) 1,з = (пз(и)) 1,з (П1 (и )) 1,2,з = (П2 (и )) 1,2,з = (Пз (и )) 1,2,з-
Тогда, в силу этих равенств при любом выборе г и ] среди трех равенств (п1(ui))j = 1 ( п2(мг))^- = 2 ( пз(иг))з = 3 ровно два равенства всегда будут Н6 выполняться.
Если среди перестановок п\, п2 и п3 хотя бы две разлпчны, то U не является USP-матрицей, поэтому
п\ = П2 = Пз .
Следовательно, h\ = 1, h2 = 1, h3 = 1, что и требовалось до казать. □
В заключение отметим, что USP-матрицы оказались новым, интересным и сложным комбинаторным объектом. Недавно в работе Алона, Шпильки и Уманса [7] была обнаружена тесная связь между USP-матрицами и известной комбинаторной гипотезой о “подсолнечнике”.
СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ
[1] V. Strassen, Gaussian elimination is not optimal // Numer. Math., 1969, V.13, N 4, P. 354-356.
[2] D. Coppersmith and S. Winograd, Matrix multiplication via arithmetic progressions, // J. Symbolic Comput., 1990, v. 9 no. 3, P. 251-280.
[3] V. Vassilevska Williams, Multiplying Matrices Faster than Coppersmith-Winograd // Proceedings of the 44-th Symposium on Theory of Computing, STOC’12, 2012. (см. полную версию работы V. Vassilevska Williams, Breaking the Coppersmith-Winograd barrier, доступную на сайте www.cs.berkeley.edu/ virgi/matrixmult.pdf)
[4] H. Cohn, С. Umans, A group theoretic approach to fast matrix multiiplication // Proceedings of the 44th Annual Symposium on Foundations of Computer Science, 2003., P. 438-449.
[5] H. Cohn, E. Kleinberg, B. Szegedy, C. Umans, Group-theoretic algorithms for matrix multiiplication // Proceedings of the 46th Annual Symposium on Foundations of Computer Science, 2005, P. 379-388
[6] В.П.Платонов, Ю.В.Кузнецов, М.М.Петрунин, О теоретико- групповом подходе к проблеме быстрого умножения матриц. // Математическое и компьютерное моделирование систем: теоретические и прикладные аспекты. Сборник научных трудов IIIIIICII РАН, Москва, 2009, с. 4-15.
[7] N. Alon, A. Shpilka, С. Umans, On sunflowers and matrix multiplication // Electronic Colloquium on Computational Complexity, Report No. 67, 2011, P. 1-16.
НИИ СИ РАН Получено 22.05.2012