Научная статья на тему 'О генерической сложности проблемы выполнимости нормализованных булевых формул'

О генерической сложности проблемы выполнимости нормализованных булевых формул Текст научной статьи по специальности «Математика»

CC BY
103
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ГЕНЕРИЧЕСКАЯ СЛОЖНОСТЬ / ПРОБЛЕМА ВЫПОЛНИМОСТИ БУЛЕВЫХ ФОРМУЛ / GENERIC COMPLEXITY / PROBLEM OF SATISFIABILITY OF BOOLEAN FORMULAS

Аннотация научной статьи по математике, автор научной работы — Рыбалов А. Н.

В статье изучается генерическая сложность классической проблемы выполнимости булевых формул. Знаменитая теорема Кука Левина утверждает, что эта проблема является NP-полной, откуда следует отсутствие полиномиального алгоритма для ее решения при условии несовпадения классов P и NP. В 2013 г. А. Рыбалов доказал, что проблема выполнимости булевых схем остается вычислительно трудной и в генерическом случае. В данной статье доказывается аналогичный результат для так называемых нормализованных булевых формул. Булева схема называется нормализованной, если все ее переменные занумерованы слева направо, т. е. переменная xi+1 не может встретиться раньше xi.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Generic-case approach to algorithmic problems was suggested by Miasnikov, Kapovich, Schupp and Shpilrain in 2003. This approach considers a problem for the “most” inputs instead of all inputs like in worst-case approach. Cook and Levin proved that Boolean satisfiability problem is NP-complete. That implies there is no polynomial algorithm for this problem unless P and NP are equal. In this paper we proove that Boolean satisfiability problem for normalized formulas remains computationally hard on some natural subsets of “almost all” normalized Boolean formulas.

Текст научной работы на тему «О генерической сложности проблемы выполнимости нормализованных булевых формул»

УДК 510.52

DOI 10.25513/1812-3996.2017.3.8-12

О ГЕНЕРИЧЕСКОИ СЛОЖНОСТИ ПРОБЛЕМЫ ВЫПОЛНИМОСТИ НОРМАЛИЗОВАННЫХ БУЛЕВЫХ ФОРМУЛ

А. Н. Рыбалов

Омский государственный университет им. Ф. М. Достоевского, г. Омск, Россия

Информация о статье

Дата поступления 27.04.2017

Дата принятия в печать 26.06.2017

Дата онлайн-размещения 05.10.2017

Ключевые слова

Генерическая сложность, проблема выполнимости булевых формул

Финансирование

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-01-00577

Автор выражает благодарность рецензенту за полезные замечания и предложения по улучшению текста статьи

Аннотация. В статье изучается генерическая сложность классической проблемы выполнимости булевых формул. Знаменитая теорема Кука - Левина утверждает, что эта проблема является NP-полной, откуда следует отсутствие полиномиального алгоритма для ее решения при условии несовпадения классов Р и NP. В 2013 г. А. Рыбалов доказал, что проблема выполнимости булевых схем остается вычислительно трудной и в генерическом случае. В данной статье доказывается аналогичный результат для так называемых нормализованных булевых формул. Булева схема называется нормализованной, если все ее переменные занумерованы слева направо, т. е. переменная х/+1 не может встретиться раньше х(. .

ON GENERIC COMPLEXITY OF THE PROBLEM OF SATISFIABILITY FOR NORMALIZED BOOLEAN FORMULAS

A. N. Rybalov

Dostoevsky Omsk State University, Omsk, Russia

Article info

Received 27.04.2017

Accepted 26.06.2017

Available online 05.10.2017

Abstract. Generic-case approach to algorithmic problems was suggested by Miasnikov, Kapovich, Schupp and Shpilrain in 2003. This approach considers a problem for the "most" inputs instead of all inputs like in worst-case approach. Cook and Levin proved that Boolean satisfiability problem is NP-complete. That implies there is no polynomial algorithm for this problem unless P and NP are equal. In this paper we proove that Boolean satisfiability problem for normalized formulas remains computationally hard on some natural subsets of "almost all" normalized Boolean formulas.

Keywords

Generic complexity, problem of satisfiability of Boolean formulas

Вестник Омского университета 2017. № 3(85). С. 8-12

ISSN 1812-3996-

Acknowledgements

The reported study was funded by RFSR according to the research project № 16-01-00577

The author is grateful to the his reviewer for useful advices and suggestions for improving the paper

Введение

Проблема выполнимости булевых формул является классической проблемой информатики, изучаемой многие десятилетия. С. Кук [1] и Л. Левин [2] доказали, что эта проблема является NP-полной, т. е. все проблемы из класса NP сводятся к ней за полиномиальное время. Это означает, что, при условии неравенства классов Р и NP, для нее не существует полиномиального алгоритма, решающего ее на всем множестве булевых формул. Поэтому многочисленные исследования посвящены изучению под-проблем проблемы выполнимости и построению для них эффективных разрешающих алгоритмов. Естественным желанием является то, чтобы в эти классы попадало как можно больше формул, а в идеале «почти все» формулы.

В работе [3] была предложена теория генери-ческой сложности вычислений. В рамках этого подхода алгоритмическая проблема рассматривается не на всем множестве входов, а на некотором подмножестве «почти всех» входов. Такие входы образуют так называемое генерическое множество. Понятие «почти все» формализуется введением естественной меры на множестве входных данных. С точки зрения практики алгоритмы, решающие быстро проблему на генерическом множестве, так же хороши, как и быстрые алгоритмы для всех входов. Классическим примером такого алгоритма является симплекс-метод: он за полиномиальное время решает задачу линейного программирования для большинства входных данных, но имеет экспоненциальную сложность в худшем случае. Более того, может так оказаться, что проблема трудноразрешима или вообще неразрешима в классическом смысле, но легкоразрешима на генерическом множестве. В работах [3; 4] было доказано, что таким поведением обладают многие алгоритмические проблемы алгебры, а в статье [5] было построено генерическое множество, на котором разрешима классическая проблема остановки для машин Тьюринга с лентой, бесконечной в одном направлении.

В данной статье доказывается, что проблема выполнимости булевых формул для нормализованных формул неразрешима за полиномиальное время на любом полиномиальном, строго генериче-ском множестве нормализованных формул, при условии несовпадения классов P и NP и совпадения классов P и BPP. Здесь класс BPP - это класс проблем, разрешимых за полиномиальное время на вероятностных машинах Тьюринга. Большинство исследователей сейчас считает, что имеет место равенство P = BPP. Это равенство означает, что любой полиномиальный вероятностный алгоритм можно эффективно дерандомизировать, т. е. построить полиномиальный детерминированный алгоритм, решающий ту же задачу. Хотя это равенство пока еще не доказано, имеются серьезные результаты в пользу него (см.: [6]). При доказательстве данного результата будут использованы методы, развитые в статьях [7; 8]. Булева формула называется нормализованной, если все ее переменные занумерованы слева направо, т. е. переменная х/+1 не может встретиться раньше x ■

Генерическая вычислимость и сложность Пусть A есть множество всех входов для некоторой алгоритмической проблемы, а S - некоторое его подмножество. Рассмотрим последовательность

р (S)=LS^AJ

Рп I An | ,

где A - множество всех входов проблемы размера п . Если случайно и равновероятно генерировать входы размера n , то вероятность попасть в S равна Р(S). Определим асимптотическую плотность множества S как предел (если он существует)

M(S) = lim Pn(S) ■

Если предела не существует, то считаем, что асимптотическая плотность не определена.

Множество входов S с A называется генери-ческим, если ^,(S) = 1, и пренебрежимым, если

ц(5) = 0. Непосредственно из определения следует, что 5 является генерическим тогда и только тогда, когда А \ 5 пренебрежимо. Понятие генерического множества формализует интуитивное понятие множества «почти всех» входов в том смысле, что при увеличении размера входа вероятность того, что случайно сгенерированный вход попадет в генери-ческое множество, стремится к 1. Если последовательность рп(5) стремится к 0 экспоненциально быстро, т. е. существуют константы С > 0 и 0 <ст< 1 такие, что для любого п

рп (5) < С стп,

то множество 5 называется строго пренебрежи-мым. Множество 5 называется строго генерическим, если А \ 5 строго пренебрежимо.

Алгоритмическая проблема 5 с А строго гене-рически полиномиально разрешима, если существует множество б с А такое, что

1. б - строго генерическое.

2. б - разрешимое за полиномиальное время.

3. 5П|б - разрешимое за полиномиальное время.

Генерический алгоритм, решающий проблему 5, работает следующим образом. Сначала определяет, принадлежит ли вход генерическому множеству. Если да, то проверяет принадлежность входа 5. Если нет, то отвечает «НЕ ЗНАЮ». Такой алгоритм правильно решает проблему 5 на почти всех входах.

Нормализованные булевы формулы

Пусть ф - булева формула в базисе {л^,—1}.

Без ограничения общности можно считать, что в ней отрицания находятся только над переменными. Любую булеву формулу можно легко привести к такому виду с помощью законов Де Моргана, поэтому в дальнейшем будем рассматривать только такие формулы. Естественным образом можно сопоставить формуле ф бинарное дерево Т , которое представляет конструкцию ф из переменных и их отрицаний с помощью конъюнкций и дизъюнкций. Внутренние вершины Т помечены символами V и л, а

листья Т помечены переменными или их отрицаниями. Если Т имеет п листьев, то не более п переменных могут встретиться в Т , поэтому в дальнейшем будем полагать, что все переменные Т ле-

-ISSN 1812-3996

жат в множестве x1xn. Дерево Т называется нормализованным, если для любой переменной X, i > 1 найдется более левый лист в дереве, в котором лежит переменная x^ . Другими словами, переменные в дереве нумеруются слева направо. Очевидно, что любое дерево Т можно нормализовать

с помощью подходящих перестановок поддеревьев. При этом дерево будет задавать эквивалентную булеву функцию. Будем отождествлять булеву формулу ф и нормализованное дерево Т . Заметим

также, что число булевых операций в бескванторной части ф равно n -1. Под размером формулы ф будем понимать число листьев n . Обозначим через F - множество всех нормализованных формул и через F - множество всех нормализованных формул раз-

мера n .

Лемма 1

где Cn-i =- СП-Ii, n )

|F| = ППп-1 n!Cn-1, - это (n -1 )-е число Каталана.

Доказательство. Любая формула размера п состоит из бинарного дерева с п листьями и п-1 внутренней вершиной. Существуют С неизоморф-

ных деревьев с n листьями, где С^ =— С

2(n-1)

это

п-1 -ое число Каталана. Каждая внутренняя вершина может быть помечена либо V, либо л (всего

п-1 таких вершин - 2п-1 вариантов разметки). Самый левый лист нормализованного дерева может быть первой переменной либо ее отрицанием, второй лист - переменными х1, х2 или их отрицаниями. Лист с номером / имеет 2/ вариантов разметки. В итоге получается 22п-1 п!Сп_г различных формул размера п . Лемма доказана.

Для любой формулы ф определим следующее множество:

£д(ф) = {ф V ((Х1 л —Х1 )л^)},

где

Лемма 2

Для любой формулы ф

1

|F„| (16nr

для всех n >k, где k - размер формулы ф.

ISSN 1812-3996-

Доказательство. Пусть формула ф имеет размер k. Тогда для любой формулы фv((x1 л-iXj)лу) из множества Ед(ф)nFn формула у должна иметь размер п -k-2. Кроме того, в этой формуле может участвовать любая из п переменных. Поэтому, аналогично тому как это делалось в доказательстве леммы 1, можно подсчитать

|£д(ф) n Fj = 22(n-k)-1(n - k - 2)!Cn-k-3 ■

Отсюда |Ед(ф) n Fn|

Fl

1

,2(n-k)-1

(n - k - 2)!Cn-k-1

2 n!Cn-i

1 C„

22kn(n-1)...(n -k-1) Cn-

22knk С

Теперь оценим отношение чисел Каталана:

f2(p - k) ^

С„

Cn-1

-= n -1 = p =-

C

p-k-2

P +1

P - k

CB P - k +1

2p

>

p! 2(p-k)...(p-k +1)

(p - k)!

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

_ (p...(p -k +1))2 2p...(2(p-k) +1) ^ 2p...(2p-k +1) Таким образом, имеем

2p...(p +1) p...(p - k +1)

ЕЧ(ф) n Fn\

1

N (16л)^ '

что и требовалось доказать.

Основной результат

Под проблемой выполнимости булевых формул понимается следующая проблема. На входе имеется булева формула фХхп) от переменных х±,...,хп, содержащая только конъюнкции, дизъюнкции и отрицания переменных. Нужно определить, существуют ли значения переменных х1,...,хп такие, при которых формула будет истинной.

Теорема. Если проблема выполнимости нормализованных булевых формул строго генерически разрешима за полиномиальное время, то существует вероятностный полиномиальный алгоритм, разрешающий эту проблему на всем множестве формул.

Доказательство. Допустим, существует генери-ческий полиномиальный алгоритм А, разрешающий проблему выполнимости булевых формул на

некотором, строго генерическом множестве нормализованных булевых формул в . Построим вероятностный полиномиальный алгоритм В , определяющий выполнимость любой формулы ф. Алгоритм В будет работать на формуле ф размера п следующим образом:

1) Проверяет, принадлежит ли ф множеству в. Это делается за полиномиальное время, так как множество в разрешимо за полиномиальное время. Если феС, то с помощью алгоритма А определяет выполнимость ф. Если нет, то переходит к шагу 2.

2) Генерирует случайную формулу у размера

п2 - п - 2 .

3) Проверяет, принадлежит ли формула фv((x1 л—х2множеству в . Если да, то с помощью алгоритма А определяет ее выполнимость а значит, и выполнимость формулы ф. Если нет, то выдает ответ «НЕВЫПОЛНИМА».

Заметим, что алгоритм на шаге 3 может выдать неправильный ответ. Нужно доказать, что вероятность того, что ответ выдается на шаге 3, меньше 1/2.

Вероятность того, что случайная формула вида фv((x1 л—^)лу) из Eq(ф)П|£2 не попадет в в, не больше

Ич^Ич^ Ы . ^(ф)п2| ^(ф)п2|

Так как б строго генерическое, то существует константа а> 0 такая, что

ИвЫ 1

F 2

2"

для любого п . С другой стороны, по лемме 2

2!

, 1 п 1 , < (16п2)п.

Мы

Поэтому искомая вероятность не больше

(16n2)n 2

4n+2nlogn

2ап 2ап

и при больших п меньше 1/2.

Осталось доказать полиномиальность алгоритма. Для этого нужно за полиномиальное время уметь генерировать случайно и равномерно формулу размера п2 -п-2 . Как это делается, описано в работе [8].

n

Вестник Омского университета 2017. № 3(85). С. 8-12

-ISSN 1812-3996

Итак, в предположении существования полиномиального строго генерического множества, на котором проблема выполнимости булевых формул

разрешима за полиномиальное время, мы построили вероятностный полиномиальный алгоритм, разрешающий эту проблему на всем множестве нормализованных формул, что и требовалось доказать.

СПИСОК ЛИТЕРА ТУРЫ

1. Cook S. The complexity of theorem proving procedures // Proceedings of the Third Annual ACM Symposium on Theory of Computing. 1971. P. 151-158.

2. Левин Л. А. Универсальные задачи перебора // Проблемы передачи информации. 1973. Т. 9, № 3. С. 115-116.

3. Kapovich I., Myasnikov A. G., Schupp P., Shpilrain V. Generic-case complexity, decision problems in group theory and random walks // J. Algebra. 2003. Vol. 264, № 2. P. 665-694.

4. Kapovich I., Myasnikov A. G., Schupp P., Shpilrain V. Average-case complexity for the word and membership problems in group theory // Advances in Mathematics. 2005. Vol. 190. P. 343-359.

5. Hamkins J. D., MiasnikovA. The halting problem is decidable on a set of asymptotic probability one // Notre Dame Journal of Formal Logic. 2006. Vol. 47, № 4. P. 515-524.

6. Impagliazzo R., Wigderson A. P=BPP unless E has Subexponential Circuits: Derandomizing the XOR Lemma // STOC'97: proc. of the 29th Annual ACM Symp. on the Theory of Computing. EL Paso: ACM, 1997. P. 220-229.

7. Myasnikov A., Rybalov A. Generic complexity of undecidable problems // Journal of Symbolic Logic. 2008. Vol. 73, № 2. P. 656-673.

8. Рыбалов А. О генерической сложности проблемы общезначимости булевых формул // Прикладная дискретная математика. 2016. № 2 (32). С. 119-126.

ИНФОРМАЦИЯ ОБ АВТОРЕ

Рыбалов Александр Николаевич - кандидат физико-математических наук, Омский государственный университет им. Ф. М. Достоевского, 644077, Россия, г. Омск, пр. Мира, 55а; e-mail: alexander. rybalov@gmail.com.

INFORMATION ABOUT THE AUTHOR

Rybalov Alexander Nikolaevich - Candidate of Physics and Mathematics, Dostoevsky Omsk State University, 55a, pr. Mira, Omsk, 644077, Russia; e-mail: alexander. rybalov@gmail.com.

ДЛЯ ЦИТИРОВАНИЯ

Рыбалов А. Н. О генерической сложности проблемы выполнимости нормализованных булевых формул // Вестн. Ом. ун-та. 2017. № 3(85). С. 8-12. Э01: 10.25513/1812-3996.2017.3.8-12.

FOR CITATIONS

Rybalov A. N. On generic complexity of the problem of satisfiability for normalized Boolean formulas. Vestnik Omskogo universiteta = Herald of Omsk University, 2017, no. 3(85), pp. 8-12. DOI: 10.25513/18123996.2017.3.8-12. (In Russ.).

i Надоели баннеры? Вы всегда можете отключить рекламу.