Ю. В. Кузнецов. Об одной комбинаторной проблеме, связанной с быстрым умножением матриц
УДК 519.7
ОБ ОДНОЙ КОМБИНАТОРНОЙ ПРОБЛЕМЕ, СВЯЗАННОЙ С БЫСТРЫМ УМНОЖЕНИЕМ МАТРИЦ
Ю. В. Кузнецов
Кандидат физико-математических наук, заместитель директора, Научно-исследовательский институт системных исследований РАН, Москва, ykuz@niisi.ras.ru
В рамках теоретико-группового подхода Х. Кона, К. Уманса, Р. Клейнберга, Б. Сегеди к проблеме быстрого умножения матриц возникают специфические комбинаторные объекты, получившие название «однозначно разрешимые матрицы» («uniquely solvable puzzle») или USP-матрицы. В работе обсуждается некоторая числовая характеристика USP-матриц и исследуется связь между USP-матрицами и известной комбинаторной проблемой, в англоязычной литературе носящей название «Cap set problem».
Ключевые слова: быстрое умножение матриц, теоретико-групповой подход, экспонента матричного умножения ш, USP-матрицы, Cap set problem.
Проблема быстрого умножения матриц является одной из наиболее значительных проблем алгебраической теории сложности вычислений. Основные усилия исследователей сосредоточены на получении оценки экспоненты матричного умножения и. Вплоть до недавнего времени, наилучшей оценкой для и оставалась оценка Копперсмита (D. Coppersmith) и Винограда (S. Winograd) и < 2.З76..., полученная в 1990 году в работе [1]. В 2012 году в результате чрезвычайно трудоемкого уточнения указанной оценки В. Василевской-Вильямс (V. Vassilevska Williams) в работе [2] была получена оценка и < 2.З727... Большинство исследователей в области быстрого умножения матриц считают, что и = 2.
В 2003-2005 годах в работах [3,4] Х. Коном (H. Cohn), К. Умансом (C. Umans), Р. Клейнбергом (R. Kleinberg) и Б. Сегеди (B. Szegedy) был предложен принципиально новый подход к проблеме быстрого умножения матриц, носящий теоретико-групповой характер. Один из способов построения групп, пригодных для оценки экспоненты матричного умножения заключается в следующем: искомая группа строится как сплетение некоторой циклической группы и симметрической группы, действующей на некотором множестве U троичных наборов длины n (т.е. U С {l, 2, З}п ), которые в совокупности обладают специфическими комбинаторными свойствами. Такие множества получили название «однозначно разрешимых матриц» («uniquely solvable puzzle» или сокращенно USP).
Для дальнейшего изложения понадобится серия определений из работы [4] (см. также работы на русском языке [5] и [б]). Для произвольного конечного множества U через Sym(U) обозначим симметрическую группу, действующую на U.
Определение. USP-матрицей ширины n называется множество наборов U С {l, 2, З}п, удовлетворяющее следующему свойству.
Для любых трех перестановок п1, п2, п3 G Sym(U) либо п1 = п2 = п3, либо найдется набор u G U и номер i, l < i < n, такие, что выполняются не менее двух равенств из трех: (n1(u))i = l,
Для оценки экспоненты матричного умножения ш представляет интерес не весь класс USP-матриц, а некоторый его подкласс — так называемые усиленные USP-матрицы (strong USP) или SUSP-матрицы.
Определение. SUSP-матрицей ширины n называется множество наборов U с {1, 2,3}n, удовлетворяющее следующему свойству.
Для любых трех перестановок п, п2, п3 е Sym(U) либо п = п2 = п3 либо найдется набор u е U и номер i, 1 < i < n, такие, что выполняются в точности два равенства из трех: (п1 (u))j = 1,
(п2(u))i = 2, (n3(u))i = З.
(П2(u))i = 2, (n3(u))i = З.
© Кузнецов Ю. В., 2013
63
В свою очередь, важным подклассом SUSP-матриц являются так называемые локальные SUSP-матрицы.
Определение. Локальной SUSP-матрицей ширины n называется подмножество U с {1, 2,3}n, удовлетворяющее следующему свойству.
Для любой упорядоченной тройки наборов е U3, среди которых хотя бы два набора
различны, найдется координата i, 1 < i < n, такая, что тройка чисел (u, v,Wj) является одним из элементов множества {(1, 2,1), (1, 2, 2), (1,1, 3), (1,3,3), (2, 2, 3), (3, 2,3)}.
Иными словами, выполняются в точности два равенства из трех u = 1, v = 2, w =3.
Аналогичным образом определяются локальные USP-матрицы.
Основной характеристикой USP-мариц является так называемая емкость (capacity).
Определение. Емкостью USP-матрицы (SUSP-матрицы) U ширины n назовем величину Си = |U |1/n.
Непосредственно на саму оценку экспоненты матричного умножения и влияет емкость Csusp всего класса SUSP-матриц.
Определение. — это наибольшее число С, для которого найдется бесконечная последова-
тельность SUSP-матриц {Unk}, для которых CU ^ С при k ^ ж.
Аналогично определяется емкость CUSP всего класса USP-матриц и емкость Слок.^^^р всего класса локальных SUSP-матриц.
В работе [4] было показано, что CUSP = 3/22/3, CSUSP > 22/3 и CSUSP = СЛок.^^^Р. В работе [4] была также выдвинута гипотеза, что CSUSP = CUSP, т.е. CSUSP = 3/22/3. Из этой гипотезы следует, что и = 2.
С использованием оценки Csusp > 22/3 удается получить оценку и < 2.48. Эта оценка остается на сегодняшний день наилучшей оценкой, которая получается с использованием аппарата USP-матриц.
Таким образом, улучшение оценок для Csusp является одним из направлений развития теоретико-группового подхода к проблеме быстрого умножения матриц.
SUSP-матрицы оказались новым, интересным и сложным комбинаторно-алгебраическим объектом. В 2011 году Н. Алоном (N. Alon), А. Шпилькой (A. Shpilka) и К. Умансом в работе [7] была обнаружена тесная связь между SUSP-матрицами и глубокой комбинаторной гипотезой П. Эрдёша о «подсолнечнике», известной еще с 1960-х годов.
В настоящей работе изучается связь USP-матриц с другой известной комбинаторной проблемой — о максимальном размере множеств векторов С с F3, не содержащих «троек», где F3 = {0,1, 2} — поле из трех элементов, «тройка» — три вектора x, y, z е F3, таких, что x + y + z = 0. В литературе эта проблема получила название «Cap set problem», при этом само множество векторов С называется «cap», а указанная «тройка» — «set».
Нетрудно заметить, что векторы x,y,z е F3 образуют «тройку» тогда и только тогда, когда для каждой координаты i, 1 < i < n, либо xj = yj = zj, либо xj, yj, zj — попарно различны. С другой стороны, в поле F3 условие x + y + z = 0 эквивалентно условию y — x = z — y, поэтому о «тройке» иногда говорят как о трехчленной арифметической прогрессии. В вышеуказанной работе [7] в качестве обобщения понятия «тройки» выступал «подсолнечник» в ZD.
Через an обозначим максимальную мощность множества С с F3, не содержащего «троек». Точно вычислены только 6 первых значений этой последовательности: 2, 4, 9, 20, 45, 112 [8].
Основные усилия исследователей направлены на получение оценок для последовательности {а^}. На сегодняшний день наилучшая оценка сверху получена Бэйтманом (M. Bateman) и Кацем (N. Katz) в работе [9]:
33
an < С——, n1
где е > 0 и С — некоторые константы.
Наилучшая оценка снизу получена Эделем (Y. Edel) в работе [10]: 2.2174n < an.
Ю. В. Кузнецов. Об одной комбинаторной проблеме, связанной с быстрым умножением матриц
Проблема получения оценок для (ак} является сложной, глубокой и имеет многочисленные приложения. Филдсовские лауреаты Теренс Тао и Тимоти Гауэрс, а также другой известный математик Гил Калай, неоднократно указывали на важность исследований в этой области.
Пусть С С Ед. Произведем замены в С: 0 ^ 123, 1 ^ 231, 2 ^ 312.
Полученную матрицу размера |С| х 3п обозначим через ^(С).
В работе [11] показано, что если С С Ед — произвольное множество, не содержащее «троек», то ^ (С) — БиБР-матрица.
На самом деле справедливо более сильное утверждение.
Теорема 1. Если С С Ед — произвольное множество, не содержащее «троек», то ^(С) — локальная SUSP-матрица.
Доказательство.Через С1 обозначим матрицу, которая получается из матрицы С заменами 0 ^ 1, 1 ^ 2, 2 ^ 3; через С2 — матрицу, получающуюся из С заменами 0 ^ 2, 1 ^ 3, 2 ^ 1; и, наконец, через Сз — матрицу, получающуюся из С заменой 0 ^ 3 (т. е. 1 и 2 не заменяются).
Понятно, что ^(С) можно получить в результате объединения С1, С2, С3 с соответствующей перестановкой столбцов.
Рассмотрим три набора (и, V, ад) € ^(С)3, причем будем считать, что наборы и, г, ад попарно различны. Так как матрица С не содержит «троек», то найдется некоторая координата г такая, что среди чисел щ, г^ ад^ ровно два различных. Пусть для определенности щ = а, г^ = в, = а.
Нетрудно видеть, что в одной из матриц С1, С2, С3 в строке г в соответствующем ]-м столбце будет находиться число 2, а в строках и и ад — некоторое число а', отличное от 2 . В любом случае мы получаем, что эта координата ] — искомая, в которой выполняется ровно два равенства из трех Uj = 1, г^ = 2, Wj = 3.
Аналогично рассматривается случай, когда среди трех наборов (и, г,") € ^(С)3 ровно два различных. Теорема 1 доказана.
Нетрудно заметить, что если исходная матрица С, не содержащая «троек», имеет емкость а, то результат ^(С) будет иметь емкость а1/3. Поэтому даже в самом лучшем случае, если верно, что ак = (3 — о(1))п (к чему склоняется Теренс Тао), мы получим оценку для всего класса БиБР-матриц С^изр > 31/3, что хуже, чем С^изр > 22/3. Однако теорема 1 показывает, что конструкция С ^ ^(С) является избыточной, и поэтому возможно при более экономном переходе С ^ ^(С) удастся получить оценку лучше, чем 22/3.
Пусть и С (1, 2,3}п. Произведем замены в и: 1 ^ 0, 2 ^ 1, 3 ^ 2.
Полученную матрицу обозначим через С(и).
Теорема 2. Если и — SUSP-матрица, то С(и) — множество, свободное от «троек».
Доказательство. Предположим противное, а именно пусть найдутся три попарно различных набора и, г, " € С(и), образующих «тройку». Обозначим прообразы этих наборов при отображении и ^ С(и) через и', г', соответственно. Определим три перестановки п1, п2, п3, действующие на и следующим образом:
- перестановка п1 = Е;
- перестановка п2 циклически переставляет строки и', г', , т. е. п2 осуществляет преобразование и' ^ г', г' ^ , ^ и';
- перестановка п3 осуществляет преобразование и' ^ "', г' ^ и', ^ г'.
На остальных строках перестановки п2 и п3 действуют тождественно.
Утверждается, что для любой строки а € и и любой координаты г, 1 < г < п, невозможно выполнение в точности двух равенств из трех: (п1(а))^ = 1, (п2(а))^ = 2, (п3(а))^ = 3.
Действительно, если строка а отлична от строк и', г', , то требуемое утверждение очевидно.
Пусть а совпадает с одной из строк и', г', . Для определенности будем считать, что строка а совпадает с и'.
Рассмотрим произвольную координату г, 1 < г < п. Возможно два варианта.
Математика
65
1. Выполняются равенства и[ = у' = ш'. В этом случае опять требуемое утверждение очевидно.
2. Все числа у', ш' попарно различны. Но тогда:
(п1 (и'= и[, (п2 {и'т))г = у', (П3 (и[= ш'
и может выполняться только либо три равенства, либо одно, либо ни одного. Получили противоречие. Аналогично рассматриваются случаи, когда строка а совпадает с у' или ш'. Теорема 2 доказана.
Как показывает следующий пример, существуют иБР-матрицы и такие, что С(и) содержит «тройки». Тем самым утверждение теоремы 2 справедливо не для всех иБР-матриц. Пример. Матрица
1 2 3
2 1 2
3 3 1
является USP-матрицей.
Доказательство этого факта можно провести методом, изложенным в работе [11]. Таким образом теорема 2 позволяет в некотором смысле выделить класс БиБР-матриц в классе всех иБР-матриц и косвенно объясняет трудности, возникающие при исследовании БиБР-матриц.
Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00190-а и 13-01-12402 оф_м2).
Библиографический список
1. Coppersmith D., Winograd S. Matrix multiplication via arithmetic progressions // J. Symbolic Comput. 1990. Vol. 9, № 3. P. 251-280.
2. Vassilevska Williams V. Multiplying Matrices Faster than Coppersmith-Winograd // Proceedings of the 44-th Symposium on Theory of Computing, STOC'12. 2012. URL: www.cs.berkeley.edu/ virgi/matrixmult.pdf (дата обращения 30.09.2013).
3. Cohn H., Umans C. A group theoretic approach to fast matrix multiplication // Proceedings of the 44-th Annual IEEE Symposium on Foundations of Computer Science. 2003. P. 438-449. DOI: 10.1109/SFCS.2003.1238217.
4. Cohn H., Kleinberg R., Szegedy B., Umans C. Group-theoretic algorithms for matrix multiplication // Proceedings of the 46-th Annual IEEE Symposium on Foundations of Computer Science. 2005. P. 379-388. DOI: 10.1109/SFCS.2005.39.
5. Платонов В. П., Кузнецов Ю. В., Петрунин М. М. О теоретико-групповом подходе к проблеме быстрого умножения матриц. Математическое и компьютер-
ное моделирование систем : теоретические и прикладные аспекты // Сб. науч. тр. НИИСИ РАН. М., 2009. C. 4-15.
6. Кузнецов Ю. В. Некоторые комбинаторные аспекты теоретико-группового подхода к проблеме быстрого умножения матриц // Чебышевский сб. 2012. Т. 13, № 1. С. 102-109.
7. Alon N., Shpilka A., Umans C. On sunflowers and matrix multiplication // Electronic Colloquium on Computational Complexity. 2011. Report № 67. P. 1-16.
8. Davis B. L, Maclagan D. The card game SET // Mathematical Intelligencer. 2003. Vol. 25, № 3. P. 33-40.
9. Bateman M, Katz N. New bounds on caps sets // J. American Math. Soc. 2012. Vol. 25, № 2. P. 585-613.
10. Edel Y. Extensions of generalized product caps // Designs, Codes and Cryptography. 2004. Vol. 31. P. 5-14.
11. Mebane P. Uniquely Solvable Puzzles and Fast Matrix Multiplication. HMC Senior Theses, 2012. 37 p.
On Combinatorial Problem, Related with Fast Matrix Multiplication
Yu. V. Kuznetsov
Scientific Research Institute for System Studies of RAS, Russia, 117218, Moscow, Nakhimovskii pr., k. 1,36, ykuz@niisi.ras.ru The group-theoretical approach to fast matrix multiplication generates specific combinatorial objects, named Uniquely Solvable Puzzles (briefly USP). In the paper some numerical characteristic of the USP was discussed and the relation of USPs to famous combinatorial problem named «Cap set problem» was investigated.
Key words: fast matrix multiplication, group-theoretical approach to fast matrix multiplication, USP, Cap set problem.
А. Лауринчикас и др. Об универсальности некоторых дзета функций
References
1. Coppersmith D., Winograd S. Matrix multiplication via arithmetic progressions. J. Symbolic Comput., 1990. Vol. 9, no. 3, pp. 251-280.
2. Vassilevska Williams V. Multiplying Matrices Faster than Coppersmith-Winograd. Proceedings of the 44-th Symposium on Theory of Computing, STOC'12. 2012. URL: www.cs.berkeley.edu/ virgi/matrixmult.pdf (Accsessed 30, September, 2013).
3. Cohn H., Umans C. A group theoretic approach to fast matrix multiplication. Proceedings of the 44-th Annual IEEE Symposium on Foundations of Computer Science. 2003, pp. 438-449. DOI: 10.1109/SFCS.2003.1238217.
4. Cohn H., Kleinberg R., Szegedy B., Umans C. Group-theoretic algorithms for matrix multiplication. Proceedings of the 46-th Annual IEEE Symposium on Foundations of Computer Science. 2005, pp. 379-388. DOI: 10.1109/SFCS.2005.39.
5. Platonov V. P., Kuznetsov Iu. V., Petrunin M. M. O teoretiko-gruppovom podkhode k probleme bystrogo umnozheniia matrits. Matematicheskoe i komp'iuternoe modelirovanie sistem: teoreticheskie i prikladnye aspekty [A group-theoretical approach to the problem of fast matrix multiplication. Mathematical and computer
modeling of systems: theoretical and applied aspects]. Sbornik nauchnuh trudov NIISI RAN [Collection of scientific papers NIISI RAS]. Moscow, 2009, pp. 4-15 (in Russian).
6. Kuznetsov Yu. V. Nekotorye kombinatornye aspekty teoretiko-gruppovogo podkhoda k probleme bystrogo umnozheniia matrits [Some combinatorial aspects of the group-theoretic approach to fast matrix multiplication]. Chebyshevskii sbornik., 2012, vol. 13, no. 1, pp. 102-109 (in Russian).
7. Alon N., Shpilka A., Umans C. On sunflowers and matrix multiplication. Electronic Colloquium on Computational Complexity, 2011, Report no. 67, pp. 1-16.
8. Davis B. L., Maclagan D. The card game SET. Mathematical Intelligencer, 2003, vol. 25, no. 3, pp. 33-40.
9. Bateman M., Katz N. New bounds on caps sets. J. American Math. Soc., 2012. vol. 25, no. 2, pp. 585-613.
10. Edel Y. Extensions of generalized product caps. Designs, Codes and Cryptography, 2004, vol. 31, pp. 5-14.
11. Mebane P. Uniquely Solvable Puzzles and Fast Matrix Multiplication. HMC Senior Theses, 2012, 37 p.
УДК 511.3
ОБ УНИВЕРСАЛЬНОСТИ НЕКОТОРЫХ ДЗЕТА-ФУНКЦИЙ
А. Лауринчикас1, Р. Мацайтене2, Д. Мохов3, Д. Шяучюнас4
1Академик АН Литвы, доктор физико-математических наук, профессор, заведующий кафедрой теории вероятностей и теории чисел, Вильнюсский университет (Литва), antanas.laurincikas@mif.vu.lt 2Доктор математических наук, профессор кафедры математики, Шяуляйский университет (Литва), renata.macaitiene@mi.su.lt
3Магистрант факультета математики и информатики, Вильнюсский университет (Литва), dmitrij.mochov@mif.vu.lt 4Доктор математических наук, профессор кафедры математики, Шяуляйский университет (Литва), siauciunas@fm.su.lt
Хорошо известно, что обобщение дзета функции Гурвица — периодическая дзета функция Гурвица — с трансцендентным параметром универсальна в том смысле, что её сдвигами приближается всякая аналитическая функция. В статье условие трансцендентности параметра заменяется более слабым условием о линейной независимости некоторого множества.
Ключевые слова: периодическая дзета функция Гурвица, пространство аналитических функций, слабая сходимость, универсальность.
1. INTRODUCTION
Let s = a+it be a complex variable, and a, 0 < a < 1, be a fixed parameter. The Hurwitz zeta-function Z(s,a) is defined, for a > 1, by the Dirichlet series
Z (s,a)= £
n(m + a)s '
m=0 v y
and continues analytically to the whole complex plane, except for a simple pole at s = 1 with residue 1.
© Лауринчикас А., Мацайтене Р., Мохов Д., Шяучюнас Д., 2013