Научная статья на тему 'Некоторые комбинаторные аспекты теоретико-группового подхода к проблеме быстрого умножения матриц'

Некоторые комбинаторные аспекты теоретико-группового подхода к проблеме быстрого умножения матриц Текст научной статьи по специальности «Математика»

CC BY
89
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Чебышевский сборник
Scopus
ВАК
RSCI
Область наук

Аннотация научной статьи по математике, автор научной работы — Кузнецов Ю. В.

В рамках теоретико-группового подхода к проблеме быстрого умножения матриц, изложенного в основополагающей работе [5], возникают специфические комбинаторные объекты, получившие название “однозначно разрешимые матрицы” (в оригинале “uniquely solvable puzzle”) или сокращенно USP-матрицы. В работе обсуждаются вопросы, связанные с некоторой числовой характеристикой USP-матриц и доказывается обобщение одного ключевого результата из [5], касающегося алгебраических свойств USP-матриц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые комбинаторные аспекты теоретико-группового подхода к проблеме быстрого умножения матриц»

ЧЕБЫШЕВСКИЙ СБОРНИК Том 13 Выпуск 1 (2012)

Труды IX Международной конференции Алгебра и теория чисел: современные проблемы и приложения, посвященной 80-летпю профессора Мартина Давидовича Г риндлингера

УДК 519.7

НЕКОТОРЫЕ КОМБИНАТОРНЫЕ АСПЕКТЫ ТЕОРЕТИКО-ГРУППОВОГО ПОДХОДА К ПРОБЛЕМЕ БЫСТРОГО УМНОЖЕНИЯ МАТРИЦ1

Ю. В. Кузнецов (г. Москва) ykuz@niisi.ras.ru

Аннотация

В рамках теоретико-группового подхода к проблеме быстрого умножения матриц, изложенного в основополагающей работе [5], возникают специфические комбинаторные объекты, получившие название “однозначно разрешимые матрицы” (в оригинале “uniquely solvable puzzle”) или сокращенно USP-матрицы.

В работе обсуждаются вопросы, связанные с некоторой числовой характеристикой USP-матриц и доказывается обобщение одного ключевого результата из [5], касающегося алгебраических свойств USP-матриц.

Проблема быстрого умножения матриц является одной из наиболее значительных проблем алгебраической теории сложности вычислений. Толчком для интенсивных исследований в направлении поиска быстрых алгоритмов для умножения матриц явилась публикация в 1969 году знаменитой работы Штрас-сена [1] . В этой работе автор привел алгоритм для умножения двух квадратных матриц порядка п над любым полем со сложностью 0(п1°927) (до Штрас-сена считалось, что умножение двух матриц невозможно осуществить быстрее, чем за 0(п3) операций). Тем самым, Штрассен первым получил нетривиальную оценку экспоненты матричного умножения ш < log27 (напомним, что экспонентой матричного умножения называется наименьшее действительное число ш,

n

полнено за 0(пш+£) операций при любом фиксированном е > 0).

1 Работа выполнена при финансовой поддержке Российского Фонда Фундаментальных Исследований, гранты 12-01-00190-а и 11-01-12002-офи-м-2011

В течение длительного времени усилиями многих математиков оценка для ш постепенно улучшалась и наилучшая оценка ш < 2.376 была получена в 1990 году Копперсмитом и Виноградом в работе [2]. Вплоть до недавнего времени указанная оценка оставалась непревзойденной, однако совсем недавно на конференции Symposium on Theory of Computing - STOC’12 американским математиком В.Василевской Вильямс была анонсирована незначительно улучшенная оценка ш < 2.3727 [3]. Эта оценка получается в результате чрезвычайно трудоемкого и сложного уточнения метода Копперсмита и Винограда.

Следует отметить, что большинство специалистов, работающих над проблемой быстрого умножения матриц, склоняются к тому, что ш = 2.

Новый теоретико-групповой подход к проблеме быстрого умножения матриц был предложен X. Коном и К. Умансом в 2003 году и описан в работе [4]. В этой работе излагался сам подход, однако там не были построены примеры групп,

ш

Через два года к Кону и Умансу присоединились Р. Клейнберг и Б. Сегеди и им удалось построить группы, позволяющие получать нетривиальные оценки

ш

Ключевое свойство, которому должны удовлетворять такие группы назва-ется “свойством тройного произведения” (triple product property).

Пусть G — произвольная конечная группа.

Для произвольного непустого подмножества M С G через Q(M) обозначим множество правых частных M, т.е.

Q(M) = {S1S2 1 : Si, s2 E M}.

G

ния, реализуемому подмножествами S,T,U С G, если из равенства

Q1Q2Q3 = 1

следует q1 = q2 = q3 = 1,

где q1 E Q(S), q2 E Q(T), q3 E Q(U).

Один из способов построения групп, пригодных для оценки экспоненты матричного умножения заключается в следующем: искомая группа строится как полупрямое произведение некоторой циклической группы и симметрической

Un (т.е. U С {1, 2, 3}™), которые в совокупности обладают специфическими комбинаторными свойствами. Такие множества получили название “однозначно разрешимых матриц” (в оригинале “uniquely solvable puzzle” или сокращенно USP).

Для произвольного конечного множества U через Sym(U) обозначим сим-

U

ОПРЕДЕЛЕНИЕ 2. Однозначно разрешимой матрицей (USP-матрицей) ширины п называется множество наборов U С {1, 2, 3}™, удовлетворяющее следующему свойству:

Для любых трех перестановок п1, п2, п3 E Sym(U) либо п1 = п2 = п3 либо найдется набор u E U и номер i, 1 ^ i ^ п такие что выполняются не менее двух равенств из трех

(n1(u))i = 1, (п2(u))i = 2, (пз(и))г = 3.

ш

весь класс USP-матриц, а некоторый его подкласс — так называемые усиленные USP-матрицы (strong USP).

n

жество наборов U С {1, 2, 3}™, удовлетворяющее следующему свойству:

Для любых трех перестановок п1, п2, п3 E Sym(U) либо п1 = п2 = п3 либо найдется набор и E U и номер i, 1 ^ i ^ п такие что выполняются в точности два равенства из трех

Ы(и))г = 1, (п2(u))i = 2, (пз(и))г = 3.

U

n

Си = \U i1/™.

В работе [5] было показано, что для произвольных USP-матриц при стрем-n

Си < 3/22/3 + o(1).

U

С

матриц (усиленных USP-матриц) с возрастающей шириной и с таким же зна-С

ее емкость не превосходит

3/22/3

В той же работе [5] была построена бесконечная серия усиленных USP-

22/3

лучить оценку ш ^ 2.48. Серия усиленных матриц с асимптотической емкостью 22/3 ш

неизвестно пока ни одного примера усиленной USP-матрицы с емкостью строго большей чем 22/3. Таким образом оценка ш ^ 2.48 остается наилучшей оценкой, которая получается с использованием аппарата USP-матриц.

Кон, У маис, Клейнберг и Сегеди сформулировали комбинаторную гипотезу,

ш=2

Гипотеза, sup^ {Си} = 3/22/3 (супремум берется по всем усиленным USP-матрицам).

Правдоподобность данной гипотезы объясняется тем, что для случая всех

3/22/3

ным образом следует из вышеупомянутой работы Копперсмита и Винограда

И-

При построении указанной серии усиленных ГЗР-ма грин с асимптотической емкостью 22/3 авторы Кон, Уманс, Клейнберг и Сегеди существенным образом опираются на лемму (в оригинальной работе [5] это лемма 3.7), которая устанавливает связь между усиленными иЭР-матрицамп определенного вида и свойством тройного произведения, которому удовлетворяет симметрическая группа Бут(и). Ограничение, накладываемое на ГОР-матрицы из этой леммы, состоит в том, что в каждой координате наборов таких ГЗР-ма грин допускается только два возможных значения из трех.

Определение 5. Множество наборов и с {1,2,3}™ называется неполным, если в каждой координате наборов из и допускается только два возможных значения из трех.

Одно из ключевых свойств неполных ГОР-матриц заключается в следующем. Если ГОР-матрица является неполной, то из этого сразу следует, что она является усиленной иЭР-матрицей.

Особо отметим, что иЭР-матрицы с асимптотической емкостью 22/3 из вышеуказанной серии являются неполными.

Будем говорить, что перестановка п Е Бут(и) сохраняет координату I множества наборов и С {1,2,3}™, если для всех наборов и Е и выполняется п(и)г = и^.

Определение 6. Для произвольного множества наборов и с {1,2,3}™ через Н12(и) обозначим, подгруппу группы, Бут(и), состоящую из всех пере-

и

1 и 2.

Аналогичным образом определяются подгруппы Н13(и), Н2,3(и) и Н1)2)3(и).

Приведем вышеупомянутую ключевую лемму 3.7 из работы [5].

Лемма 1. Неполное множество наборов и С {1,2,3}™ является, иБР-матрицей тогда и только тогда, когда, подгруппы Н1>2(и), Н13(и) и Н2,3(и) удовлетворяют свойству тройного произведения в группе Бут(и).

Главный недостаток неполных ГЗР-магрин заключается в том, что их емкость асимптотически не превосходит 22/3. Это было показано в работе [5]. Таким образом, вышеупомянутая серия неполных усиленных ГЗР-магрин имеет максимально возможную асимптотическую емкостью 22/3 и чтобы научиться строить усиленные матрицы с емкостью большей, чем 22/3, мы должны выйти за пределы класса неполных ГЗР-ма грпц.

Настоящая работа является первым шагом в этом направлении. Целью работы является обобщение указанной леммы 3.7 на случай произвольных Г8Р-матриц.

Теорема 1. Если для множества наборов и С {1,2,3}™ подгруппы Н1>2(и), Н13(и) и Н2,3(и) удовлетворяют свойству тройного произведения в группе Бут(и), то и является, усиленной иЗР-матрицей.

Доказательство. Воспользуемся подходом, предложенным в обзорной работе [6] для доказательства вышеуказанной леммы 3.7 из работы [5]. Для этого будем рассматривать иЭР-матрицу и С {1, 2, 3}™ непосредственно как матрицу,

и

вать порядок строк, какой конкретно порядок - не имеет значения.

Итак, будем рассматривать прямоугольные матрицы, элементы которых

{1, 2, 3}

Пусть троичная матрица и имеет размер к х и, и на строках этой матрицы действует симметрическая группа Буть- Через щ, 1 < г < к будем обозначать г-ую строку матрицы и, через п(и*) — строку матрицы и, являющуюся образом строки и* иод действием перестановки п Е Буть, а через (п(щ))^ , 1 < ] < и — ^'-й элемент строки п(щ).

Наконец, через п(и) — обозначим матрицу иявляющуюся образом матрицы и под действием перестановки п Е Бут^ т.е. матрицу, г-ая строка которой и1* = п(и*) , 1 < г < к.

В этих терминах определение ГЯР-матрпцы (усиленной ГЯР-матрпцы) будет выглядеть следующим образом:

Определение 7. Троичная матрица и размера к х и называется иБР-матрицей (усиленной ЦБР-матрицей), если она удовлетворяет условию:

Для любых перестановок строк матрицы и п1, п2, п3 Е Буть таких,

п1, п2, п3

найдутся индексы г и 1 < г < к, 1 < ] < и, что из трех равенств

(п1(иг))з = 1 (п2 (иг))] = 2,

(п3 (итУ)] = 3

выполняются не менее двух равенств из трех (соответственно в точности два).

и и1 2

и

и2 3 и1 3 и1 2 3

и

и1 2 и2 3 и1 3 и1 2 3

и =1 и1 и,3и1,3и1,2,3 | •

Тогда для любой перестановки п Е Н1 , 2(и) будет выполняться

п(и) =| и1,2112А,3&1,2 ,3 || •

Аналогичные равенства будут справедливы также для подгрупп Н2,3(и), Н1,3(и)ж Н1,2,3(и).

Перейдем к непосредственному доказательству теоремы 1.

Пусть симметрическая группа Бушк удовлетворяет свойству тройного произведения, реализуемому подгруппами Ні2(и), Н23(и), Ні3(и). Будем доказывать, что и — усиленная ГОР-матрица.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство будем проводить от противного, т.е. предположим, что и не является усиленной иЭР-матрицей. Тогда существуют некоторые три перестановки пі} п2, п3 Є БуШк, среди которых хотя бы две перестановки различны и для всех г и і из трех равенств

(лі(пі))з = 1, {п2{пі))з = 2,

(пз(и))з = З

не может выполняться в точности два равенства.

Покажем, что

(пі(и)) 1,2 = (П2(и))і,2 (1)

Обозначим (п1(и))1;2 через А, а (п2(и))1;2 через В. Очевидно, что при любых г и і из-за сделанного предположения относительно и не может возникнуть ситуация, что

1, Ьі,3 2 '

Поэтому возможно только три варианта

сз = 1, Ьг,3 =1

сз 2, Ьі,3 =2

3 2, Ьі,3 : =1

В то же время матрицу В можно получить из А некоторой перестановкой строк и следовательно количество элементов 2 в В равно количеству элементов 2 в А.

Поэтому третий вариант также невозможен ни при каких г и Следовательно

А = В.

Аналогично можно показать, что

('к2{и ))2,з = ))2,з (2)

(п\(и)) 1,з = (пз(и)) 1,з (3)

Перестановки п1} п2 и пз определяют некоторые перестановки Н17 Н2, Нз Е БуШк такие, что

П2 (и) ^1 • пі(и)

пз(и) П2(и )

п1(и ) пз(и).

Нетрудно выразить Ні7 Н2 и Н3 через пі7 п2 и п3 :

Ні = піп-1, Н2 = П2П-1, Нз = пзп-1.

В силу равенств (1), (2) и (3)

Н1 Е Н1'2(и), Н2 Е Н2,з(и), Нз Е Н1,з(и). о построению, Н1 ■ Н2 ■ Нз = 1, следовательно, по свойству тройного произве-

Д6НИЯ

Н1 = Н2 = Нз = 1 ,

откуда следует, что

П1 = П2 = Пз ,

что противоречит выбору П1} П2, пз .

Теорема 1 доказана. □

К сожалению, в обратную сторону лемму 3.7 удается обобщить только в несколько ослабленной форме.

Теорема 2. Если множество наборов и С {1, 2, 3}™ является ивР-мат-рицей, то подгруппы (Н12ПН12,з), (Н2,зПН12 з) и (Н1зПН12 з) удовлетворяют свойству тройного произведения в группе Буш(и).

и

Рассмотрим произвольные перестановки Н1} Н2, Нз из соответствующих под-Н1 ■ Н2 ■ Нз = 1.

Положим

п1 = 1, п2 = Н-1, пз = Н^Н-1 .

Несложно заметить, что так же, как и при доказательстве теоремы 1

П2 (и) • П1(и)

Пз(и) П2(и)

П1(и ) Пз(и).

Н 1 Е ( Н1 , 2 П Н1 , 2 , з ) Н 2 Е ( Н2 , з П Н1 , 2 , з ) Н з Е ( Н1 , з П Н1 , 2 , з )

выполняются следующие равенства:

(П1(и )) 1,2 = (П2(и )) 1,2

(П2(и ))2,з = (Пз(и ))2,з (П1(и)) 1,з = (пз(и)) 1,з (П1 (и )) 1,2,з = (П2 (и )) 1,2,з = (Пз (и )) 1,2,з-

Тогда, в силу этих равенств при любом выборе г и ] среди трех равенств (п1(ui))j = 1 ( п2(мг))^- = 2 ( пз(иг))з = 3 ровно два равенства всегда будут Н6 выполняться.

Если среди перестановок п\, п2 и п3 хотя бы две разлпчны, то U не является USP-матрицей, поэтому

п\ = П2 = Пз .

Следовательно, h\ = 1, h2 = 1, h3 = 1, что и требовалось до казать. □

В заключение отметим, что USP-матрицы оказались новым, интересным и сложным комбинаторным объектом. Недавно в работе Алона, Шпильки и Уманса [7] была обнаружена тесная связь между USP-матрицами и известной комбинаторной гипотезой о “подсолнечнике”.

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

[1] V. Strassen, Gaussian elimination is not optimal // Numer. Math., 1969, V.13, N 4, P. 354-356.

[2] D. Coppersmith and S. Winograd, Matrix multiplication via arithmetic progressions, // J. Symbolic Comput., 1990, v. 9 no. 3, P. 251-280.

[3] V. Vassilevska Williams, Multiplying Matrices Faster than Coppersmith-Winograd // Proceedings of the 44-th Symposium on Theory of Computing, STOC’12, 2012. (см. полную версию работы V. Vassilevska Williams, Breaking the Coppersmith-Winograd barrier, доступную на сайте www.cs.berkeley.edu/ virgi/matrixmult.pdf)

[4] H. Cohn, С. Umans, A group theoretic approach to fast matrix multiiplication // Proceedings of the 44th Annual Symposium on Foundations of Computer Science, 2003., P. 438-449.

[5] H. Cohn, E. Kleinberg, B. Szegedy, C. Umans, Group-theoretic algorithms for matrix multiiplication // Proceedings of the 46th Annual Symposium on Foundations of Computer Science, 2005, P. 379-388

[6] В.П.Платонов, Ю.В.Кузнецов, М.М.Петрунин, О теоретико- групповом подходе к проблеме быстрого умножения матриц. // Математическое и компьютерное моделирование систем: теоретические и прикладные аспекты. Сборник научных трудов IIIIIICII РАН, Москва, 2009, с. 4-15.

[7] N. Alon, A. Shpilka, С. Umans, On sunflowers and matrix multiplication // Electronic Colloquium on Computational Complexity, Report No. 67, 2011, P. 1-16.

НИИ СИ РАН Получено 22.05.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.