2020 Математические основы информатики и программирования № 48
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ИНФОРМАТИКИ И ПРОГРАММИРОВАНИЯ
УДК 510.52
О ГЕНЕРИЧЕСКОЙ СЛОЖНОСТИ ПРОБЛЕМЫ ПРЕДСТАВИМОСТИ НАТУРАЛЬНЫХ ЧИСЕЛ СУММОЙ ДВУХ КВАДРАТОВ1
А. Н. Рыбалов
Институт математики им. С. Л. Соболева СО РАН, г. Омск, Россия
Генерический подход к алгоритмическим проблемам был предложен Мяснико-вым, Каповичем, Шуппом и Шпильрайном в 2003 г. В рамках этого подхода рассматривается поведение алгоритмов на множествах почти всех входов. В работе изучается генерическая сложность проблемы представимости натуральных чисел суммой двух квадратов. Данная проблема, восходящая ещё к Ферма и Эйлеру, тесно связана с проблемой факторизации целых чисел и проблемой распознавания квадратичности вычетов по составным модулям, для решения которых не известно эффективных алгоритмов. Доказывается, что, при условии трудно-разрешимости этой проблемы в худшем случае и Р = ВРР, для её решения не существует полиномиального сильно генерического алгоритма. Сильно генерический алгоритм решает проблему не на всём множестве входов, а на подмножестве, последовательность относительных плотностей которого при увеличении размера экспоненциально быстро сходится к единице. Для доказательства используется метод генерической амплификации, который позволяет строить генерически трудные проблемы из проблем, трудных в худшем случае. Основным ингредиентом метода является объединение эквивалентных входов в достаточно большие множества. Эквивалентность входов означает, что рассматриваемая проблема на них решается одинаково.
Ключевые слова: генерическая сложность, суммы квадратов, диофантовы уравнения.
DOI 10.17223/20710410/48/8
ON GENERIC COMPLEXITY OF THE PROBLEM OF REPRESENTATION OF NATURAL NUMBERS BY SUM OF TWO SQUARES
A. N. Rybalov Sobolev Institute of Mathematics, Omsk, Russia E-mail: [email protected]
Исследование поддержано Программой фундаментальных научных исследований СО РАН 1.1.1.4, проект №0314-2019-0004.
Generic-case approach to algorithmic problems was suggested by Miasnikov, Kapovich, Schupp and Shpilrain in 2003. This approach studies behavior of an algorithm on typical (almost all) inputs and ignores the rest of inputs. In this paper, we study the generic complexity of the problem of representation of natural numbers by sum of two squares. This problem, going back to Fermat and Euler, is closely related to the problem of integer factorization and the quadratic residuosity problem modulo composite numbers, for which no efficient algorithms are known. We prove that under the condition of worst-case hardness and P = BPP, for the problem of representation of natural numbers by sum of two squares there is no polynomial strongly generic algorithm. A strongly generic algorithm solves a problem not on the whole set of inputs, but on a subset, the sequence of frequencies which with increasing size converges exponentially fast to 1. To prove this theorem we use the method of generic amplification, which allows to construct generically hard problems from the problems hard in the classical sense. The main ingredient of this method is a technique of cloning, which unites inputs of the problem together in the large enough sets of equivalent inputs. Equivalence is understood in the sense that the problem is solved similarly for them.
Keywords: generic complexity, sums of squares, Diophantine equations.
Введение
Проблема представимости натуральных чисел суммой двух квадратов состоит в том, чтобы по любому заданному натуральному числу N определить, разрешимо ли в натуральных числах диофантово уравнение х2 + у2 = N. Эта задача восходит ещё к Ферма, который в 1640 г. сформулировал (см. [1, 2]) следующее красивое утверждение: любое простое число вида р = 4n + 1 представимо в виде суммы квадратов двух натуральных чисел. Эта гипотеза впоследствии была доказана Эйлером и называется теперь теоремой Ферма — Эйлера (см. [1, 2]). В дальнейшем был получен критерий Ферма — Эйлера разрешимости диофантова уравнения х2 + у2 = N для любого натурального N. Однако этот критерий сводит проблему к задаче факторизации (разложения на множители) целых чисел, которая на текщий момент считается трудноразрешимой [3]. Таким образом, критерий Ферма — Эйлера не может быть проверен эффективно (за полиномиальное от размера входа время). Кроме того, проблема представимости натуральных чисел суммой двух квадратов тесно связана с проблемой распознавания квадратичности вычетов по составным модулям, для которой тоже не известно эффективных алгоритмов [3].
Генерический подход к алгоритмическим проблемам предложен в [4]: алгоритмическая проблема рассматривается не на всём множестве входов, а на некотором подмножестве «почти всех» входов. Такие входы образуют генерическое множество. Понятие «почти все» формализуется введением естественной меры на множестве входных данных. Проблема может быть трудноразрешимой или вообще неразрешимой в классическом смысле, но легкоразрешимой на генерическом множестве.
В данной работе изучается генерическая сложность проблемы представимости натуральных чисел суммой двух квадратов. Доказывается, что, при условии трудноразрешимое™ этой проблемы в худшем случае и Р = ВРР, для неё не существует полиномиального сильно генерического алгоритма. Сильно генерический алгоритм решает проблему не на всём множестве входов, а на подмножестве, последовательность относительных плотностей которого при увеличении размера экспоненциально быстро сходится к единице. Класс ВРР состоит из проблем, разрешимых за полиномиальное время на вероятностных машинах Тьюринга. Одной из важных гипотез в теории слож-
ности вычислений является гипотеза о совпадении классов Р и ВРР. Из неё следует, что любой полиномиальный вероятностный алгоритм Л можно эффективно дерандомизи-ровать, то есть построить полиномиальный алгоритм В, не использующий генератор случайных чисел и решающий ту же проблему, что и алгоритм Л. В [5] доказано, что равенство Р = ВРР следует из весьма правдоподобных гипотез о вычислительной сложности некоторых трудных проблем.
1. Генерические алгоритмы
Пусть / — некоторое множество входов. Для подмножества Б С / определим последовательность относительных плот,ноет,ей
Рп(в) = |уу, п= 1,2,3,...,
где 1п — множество входов размера щ Бп = Б П 1п. Заметим, что рп(Б)—это вероятность попасть в Б при случайной и равновероятной генерации входов из 1п. В данной работе множеством входов для алгоритмов является множество натуральных чисел, записанных в двоичной форме. Под размером натурального числа понимается длина его двоичной записи.
Асимптотической плотностью множества Б назовём верхний предел
р(Б) = Ит рп(Б).
п—>оо
Множество Б называется венерическим, если р(Б) = 1, и пренебрежимым, если р(Б) = 0. Очевидно, что Б генерическое тогда и только тогда, когда его дополнение I \ Б пренебрежимо.
Следуя [4], назовём множество Б сильно пренебрежимым, если последовательность Рп(Б) экспоненциально быстро сходится к нулю, т.е. существуют константы о, 0<с<1,иС>0, такие, что для любого п
Рп(Б) < Сап.
Теперь Б называется сильно венерическим, если его дополнение 1\Б сильно пренебрежимо.
Алгоритм Л с множеством входов / и множеством выходов .] и {?} (? ^ .]) называется (сильно) венерическим, если
1) Л останавливается на всех входах из /;
2) множество {х £ I : Л(х) ф ?} является (сильно) генерическим.
Генерический алгоритм Л вычисляет функцию /:/—)•/, если (Л(х) = у Е ■]) =>-(/(ж) = у) для всех х £ I. Ситуация Л(х) = ? означает, что Л не может вычислить функцию / на аргументе х. Но условие 2 гарантирует, что Л корректно вычисляет / на почти всех входах (входах из генерического множества). Множество Б С. I называется (сильно) венерически, разрешимым за полиномиальное время, если существует (сильно) генерический полиномиальный алгоритм, вычисляющий его характеристическую функцию.
2. Проблема представимости натуральных чисел суммой двух квадратов
Проблема представимости натуральных чисел суммой двух квадратов состоит в следующем. Дано натуральное число N, записанное в двоичной системе. Нужно
определить, разрешимо ли в натуральных числах диофантово уравнение х2 + у2 = N. Классический критерий Ферма — Эйлера (см. [1, 2]) связывает эту проблему с известной проблемой факторизации целых чисел.
Теорема 1 (Ферма, Эйлер). Пусть N — натуральное число. Диофантово уравнение М = х2 у2 разрешимо в натуральных числах тогда и только тогда, когда каждый простой делитель N вида 4/с + 3 входит в разложение N в чётной степени.
Если бы проблема факторизации решалась эффективно, то этот критерий давал бы эффективный алгоритм для проблемы представимости натуральных чисел суммой двух квадратов. Однако до сих пор неизвестно эффективных алгоритмов факторизации [3]. Кроме того, проблема представимости натуральных чисел суммой двух квадратов тесно связана с проблемой распознавания квадратичности вычетов по составным модулям, которая тоже считается трудноразрешимой [3].
В дальнейшем нам потребуется простое следствие из теоремы Ферма — Эйлера.
Лемма 1. Пусть N и М — натуральные числа, такие, что диофантовы уравнения М = х2 + у2 и ММ = х2 + у2 разрешимы в натуральных числах. Тогда диофантово уравнение N = х2 + у2 тоже разрешимо в натуральных числах.
Доказательство. По теореме Ферма —Эйлера и в разложение М, ив разложение любой простой делитель вида Ак + 3 входит в чётной степени. Отсюда следует, что то же верно и для числа N. Поэтому по теореме Ферма — Эйлера уравнение N = х2 + у2 разрешимо в натуральных числах. ■
Потребуется также следующая классическая теорема [6].
Теорема 2 (Гаусс). Пусть М(г) есть число решений неравенства х2 + у2 ^ г в натуральных числах. Тогда имеет место оценка
\Щг) -тгг/4| ^
Непосредственно из теоремы Гаусса выводится следующая
Лемма 2. Пусть 8п есть число решений неравенства 2п ^ х2 + у2 ^ 2га+1 в натуральных числах. Тогда при п > 8 имеет место
тг2га 8
Доказательство. Очевидно, что вп = ]У(2га+1) — ]У(2га). С помощью теоремы Гаусса дадим верхнюю и нижнюю оценки:
7г2га+1 л/27г2(га+1)/2 7г2га л/27г2га/2
^(2га+1) ^ ~ ^^-, N(2™) ^ + ^ .
Поэтому вп^^- тг2(га+2)/2 = 7г(2га~2 - 2(™+2)/2) > тг2га"3 при п > 8. ■
3. Основной результат
Теорема 3. Если существует сильно генерический полиномиальный алгоритм, решающий проблему представимости натуральных чисел суммой двух квадратов, то существует вероятностный полиномиальный алгоритм, разрешающий эту проблему на всем множестве входов.
Доказательство. Допустим, что существует сильно генерический полиномиальный алгоритм Л, решающий проблему представимости натуральных чисел суммой двух квадратов. Построим вероятностный полиномиальный алгоритм В, решающий эту проблему на всём множестве входов. На натуральном числе N размера п (2П ^ N < 2га+1) алгоритм В будет работать следующим образом:
1) Генерирует случайно и равновероятно натуральное число М вида ж2 + у2 размера п2 за п раундов:
а) случайно, равновероятно и независимо генерируются натуральные числа ж и у из отрезка [0,... , [л/2гг2+1]];
б) проверяется условие 2П ^ х2 + у2 < 2П +1;
в) если условие выполнено, процесс генерации заканчивается;
г) если условие не выполнено, то алгоритм возвращается к п. а;
д) если п раундов не дали результата, то алгоритм выдаёт 0.
2) Запускает алгоритм Л на числе ММ.
3) Если А^ЫМ) ф ?, то, по лемме 1, ответ А^М) является решением проблемы представимости натуральных чисел суммой двух квадратов и для числа N.
4) Если Л(ММ) = ?, то выдаёт ответ 0.
Заметим, что полиномиальный вероятностный алгоритм В выдаёт правильный ответ на шаге 3, а на шагах 1 и 4 может выдать неправильный ответ. Нужно доказать, что вероятность того, что ответ выдаётся на шагах 1 или 4, меньше 1/2.
Процесс генерации на шаге 1 можно мыслить как бросание случайной точки (ж, у) с целыми координатами внутрь квадрата [0,... , [л/2тг2+1]] х [0,... , [л/2гг2+1]]. При этом генерация успешна, если точка попала в область 2П ^ х2 + у2 < 2П +1. По лемме 2, вероятность успеха больше
7Г2""2 7Г
8•2п2+1 16'
Поэтому вероятность того, что в течение всех п раундов мы не получим успешной генерации числа N, меньше
7Г \ п 1
1--< -
16/ 4
при достаточно больших п.
Теперь оценим вероятность выдачи ответа на шаге 4. Число А имеет размер п2,
значит, размер числа ММ равен т = п2 + п. Вероятность того, что для ММ имеет
место Л(ММ) = ?, не больше
А(К)ф?}т\
|{Ы(х2 + у2) : 2п ^ х2 + у2 ^ 2п +1}т\ \{К еП:А(К)ф?}т\ |Нт|
(| |{Ы(х2 + у2) : 2п ^ ж2 + у2 ^ 2га +1}т|'
Так как множество {К Е N : А(К) ф ?} сильно пренебрежимое, то существует константа а > 0, такая, что
Л{К)ф1}т\ < 1 _ 1
|Мт| 2ат 2а(га2+га)
для любого п. С другой стороны, по лемме 2
2 , 2\ . г\п2 ^ 2 , 2 ^ ога2+!т 1
\{М(х2 + у2) : 2га ^ ж2 + у2 ^ Г +1}т| > — >
8Ж 8 • 2п+1'
Отсюда
|Nm| 2т • 8 • 2п+1 _ 2п+4
\{N(x2 + у2) : 2п2 ^х2 + у2 ^ 2n2+l}m\ < ~
2«.+4
Искомая вероятность ответа на шаге 4 не больше-, 2 , < — при больших п. Итого,
вероятность ответа на шагах 1 или 4 меньше 1/4 + 1/4 = 1/2. ■
Напомним, что класс ВРР состоит из проблем, разрешимых за полиномиальное время на вероятностных машинах Тьюринга. Одной из важных гипотез в теории сложности вычислений является гипотеза о совпадении классов Р и ВРР. Из неё следует, что любой полиномиальный вероятностный алгоритм Л можно эффективно дерандомизи-ровать, то есть построить полиномиальный алгоритм В, не использующий генератор случайных чисел и решающий ту же проблему, что и алгоритм Л. В [5] доказано, что равенство Р = ВРР следует из весьма правдоподобных гипотез о вычислительной сложности некоторых трудных проблем.
Теорема 4. Если проблема представимости натуральных чисел суммой двух квадратов не лежит в классе Р и Р = ВРР, то не существует сильно генерическо-го полиномиального алгоритма для этой проблемы.
Доказательство. Пусть существует сильно генерический алгоритм, решающий проблему представимости натуральных чисел суммой двух квадратов. Тогда по теореме 3 существует вероятностный полиномиальный алгоритм, решающий её на всём множестве входов, т. е. эта проблема лежит в классе ВРР. Так как Р = ВРР, то она лежит и в классе Р, что противоречит посылке теоремы. ■
Автор выражает благодарность рецензенту за полезные замечания и предложения по улучшению текста статьи.
ЛИТЕРАТУРА
1. Dickson L. Е. History of the Theory of Numbers. V. II. N.Y.: Dover Publications, 2005. 803 p.
2. Сендеров В., Спивак А. Суммы квадратов и целые гауссовы числа // Квант. 1999. №3. С.14-22.
3. Adleman L. М. and McCurley К. S. Open problems in number theoretic complexity, II // Proc. First Intern. Symp. Algorithmic Number Theory. N.Y., USA, May 6-9, 1994. P. 291-322.
4. KapovichL, Miasnikov A., Schupp P., and Shpilrain V. Generic-case complexity, decision problems in group theory and random walks //J. Algebra. 2003. V. 264. No. 2. P. 665-694.
5. Impagliazzo R. and Wigderson A. P = BPP unless E has subexponential circuits: Derandomizing the XOR Lemma. Proc. 29th STOC. El Paso: ACM, 1997. P. 220-229.
6. Hardy G. H. and Ramanujan S. Twelve Lectures on Subjects Suggested by His Life and Work. N.Y.: Chelsea, 1999. 67p.
REFERENCES
1. Dickson L. E. History of the Theory of Numbers, vol. II. N.Y., Dover Publications, 2005. 803 p.
2. Senderov V. and SpivakA. Summy kvadratov i celye gaussovy chisla [Sums of squares and gaussian integers]. Quant, 1999, no. 3, pp. 14-22. (in Russian)
3. Adleman L. M. and McCurley K. S. Open problems in number theoretic complexity, II. Proc. First Intern. Symp. Algorithmic Number Theory, N.Y., USA, May 6-9, 1994, pp. 291-322.
4. KapovichL, Miasnikov A., Schupp P., and Shpilrain V. Generic-case complexity, decision problems in group theory and random walks. J. Algebra, 2003, vol. 264, no. 2, pp. 665-694.
5. Impagliazzo R. and Wigderson A. P = BPP unless E has subexponential circuits: Derandomizing the XOR Lemma. Proc. 29th STOC, El Paso, ACM, 1997, pp. 220-229.
6. Hardy G. H. and Ramanujan S. Twelve Lectures on Subjects Suggested by His Life and Work. N.Y., Chelsea, 1999. 67p.