МАТЕМАТИКА
Вестн. Ом. ун-та. 2011. № 2. С. 39-43.
УДК 510.52
А.Н. Рыбалов, В.В. Федосов
Омский государственный университет им. Ф. М. Достоевского
О ГЕНЕРИЧЕСКОЙ СЛОЖНОСТИ АЛГЕБРЫ ТАРСКОГО*
Рассматривается генерический подход к алгоритмическим проблемам, предложенный в 2003 г. Мясниковым, Каповичем, Шуппом и Шпильрайном. В рамках этого подхода алгоритмическая проблема рассматривается не для всего множества входов (сложность в худшем случае), а для множества «почти всех входов». Термин «почти все входы» уточняется при помощи введения естественной меры на множестве входных данных. Изучается генерическая сложность классической теории первого порядка - поля действительных чисел (алгебра Тарского). Рабин и Фишер в 1974 г. доказали, что эта теория имеет по крайней мере экспоненциальную сложность в худшем случае. В статье доказывается, что алгебра Тарского остается вычислительно трудной и в генерическом случае.
Ключевые слова: генерическая сложность, алгебра Тарского.
Введение
Теория алгоритмов в классической постановке изучает алгоритмические проблемы в худшем случае, рассматривая поведение алгоритмов на всем множестве входов. В Computer Science исследуется также сложность алгоритмов в среднем, при этом алгоритм может хорошо (полиномиально) работать на большинстве входных данных и плохо (экспоненциально) на очень редких входах. Генерический подход в применении к алгоритмическим проблемам был впервые предложен в 2003 г. в статье [1]. В рамках этого подхода изучается поведение алгоритмов на множестве «почти всех» входов (это множество называется генерическим), игнорируя поведение алгоритма на остальных входах, на которых он может работать медленно или вообще не останавливаться. Такой подход имеет приложение в криптографии, где требуется, чтобы алгоритмические проблемы были трудными для «почти всех» входов. В отличие от сложности в среднем, генерический подход применим и для алгоритмически неразрешимых проблем. Для многих классических алгоритмически неразрешимых проблем алгебры доказано, что они разрешимы в генерическом случае. В работе
[2] установлено, что проблема остановки для машин Тьюринга с полу-бесконечной лентой генерически разрешима.
Значительный интерес представляют генерическая вычислимость и сложность классических элементарных теорий первого порядка. Рабин и Фишер в [3] доказали, что в худшем случае арифметика Прес-бургера имеет по крайней мере дважды экспоненциальную сложность, а теория поля действительных чисел (алгебра Тарского) имеет по крайней мере экспоненциальную сложность. В работе [4] было до-
Работа выполнена при финансовой поддержке РФФИ (коды проектов 10.01.00383 и 08-01-00067).
© А.Н. Рыбалов, В.В. Федосов, 2011
казано, что не существует строго генерического множества формул, на котором арифметика Пресбургера разрешима за экспоненциальное время. Цель данной статьи - получить аналогичный результат для алгебры Тарского.
Пусть А есть множество всех входов для некоторой алгоритмической проблемы, а ^ - некоторое его подмножество. Рассмотрим последовательность
где Ап - множество всех входов проблемы размера п . Если случайно и равновероятно генерировать входы размера п , то вероятность попасть в S равна рп (S). Определим асимптотическую плотность множества S как предел
М $) = іі'щ рп($).
Множество входов S с А называется генерическим, если м( $) = 1, и пренебре-жим^ім, если м($) = 0 . Непосредственно из определения следует, что $ является генерическим тогда и только тогда, когда А \ $ пренебрежимо. Понятие генерического множества формализует интуитивное понятие множества «почти всех» входов в том смысле, что при увеличении размера входа вероятность того, что случайно сгенерированный вход попадет в генерическое множество, стремится к 1. Если последовательность рп ($) стремится к 0 экспоненциально быстро, т. е. существуют константы С > 0 и 0 <о < 1 такие, что для любого п
Рп ($) < Сап, то множество $ называется строго пре-небрежимым. Строго пренебрежимое
множество существенно меньше просто пренебрежимого в том смысле, что никакое (не строго) пренебрежимое множество не может содержаться в строго пренеб-режимом. Множество $ называется строго генерическим, если А \ $ строго пренебрежимо.
Алгоритмическая проблема $ с А (строго) генерически полиномиально разрешима, если существует множество G с А такое, что:
1) G - (строго) генерическое;
2) G - разрешимое за полиномиальное время;
3. ^ п О - разрешимое за полиномиальное время.
Генерический алгоритм, решающий проблему ^, работает следующим образом. Сначала определяет, принадлежит ли вход генерическому множеству. Если да, то проверяет принадлежность входа ^. Если нет, то отвечает «НЕ ЗНАЮ». Такой алгоритм правильно решает проблему на почти всех входах.
Алгебра Тарского
Под алгеброй Тарского будем понимать теорию первого порядка алгебраической системы < Л,0,1, =, Ф, +, • > . Будем рассматривать только замкнутые формулы, удовлетворяющие следующим условиям.
1. Ф приведена к натуральной пре-нексной форме, т. е.
Ф= Х2..£пХп ,
где Qi е {3, V}, ф - бескванторная формула.
2. ф содержит только конъюнкции и дизъюнкции и не содержит отрицаний.
3. Любая атомарная подформула бескванторной части может быть только следующих типов:
(a) х, = х};
(b) xi Ф Ху;
(c) х = ху + хк;
№ хФ ху + хк;
(е) х, = ху • хк;
(Ю х, Ф ху • хк .
Легко доказать, что любая формула из алгебры Тарского может быть трансформирована в эквивалентную формулу, состоящую только из вышеперечисленных.
Пусть ф - бескванторная часть некоторой формулы Ф. Можно естественным образом сопоставить ф некоторое бинарное дерево Тф. Внутренние вершины Тф пометим символами V или л. Листьям дерева Тф сопоставим элементарные атомарные подформулы. Причем так, чтобы по дереву Тф можно было восстановить
бескванторную формулу ф. Это даст нам взаимнооднозначное соответствие между формулами ф и деревьями Тф. Если Тф
имеет п листьев, то количество переменных, от которых зависит дерево, не превосходит 3п, поэтому можно считать, что
все переменные из Тф принадлежат множеству х1,...,х3п и ф зависит от этих переменных.
Таким образом, представление формулы Ф состоит из бинарного дерева Тф и
префиксной кванторной части на все 3п переменных ф. Мы будем отождествлять формулу Ф с ее представлением. Размер формулы Ф - это количество листьев дерева 7ф. Обозначим через F - множество всех формул и через Fn - множество всех формул размера п .
Лемма 1. = 25п—1(54п 3 + 9п 2)nCn_l,
где Сп-1 = -п
Каталана.
( 2(п -1) ^
V п - 1 У
- это (п -1 )-ое число
Доказательство. Любая формула размера п состоит из Зп кванторов и бинарного дерева с п листьями и п -1 -ой внутренней вершиной. Существует 2Зп вариантов выбрать кванторы (V, 3). Существуют Cn-1 неизоморфных деревьев с
п листьями, где
Сп-1=
(2(п -1)^
п-1
это
п —1 -ое число Каталана. Каждая внутренняя вершина может быть помечена либо V , либо л (всего п — 1 таких вершин - 2п-1 вариантов разметки). Каждый лист дерева может быть какой-нибудь атомарной подформулой, отсюда 2(2(Зп)3 + (Зп)2) разметки каждого листа дерева. Так как всего п листьев, то получаем
(2(54п3 + 9п2))п вариантов разметки листьев. В итоге получается 2Зп • 2п—1 • 2п х х(54п3 + 9п2)nCn—1 различных формул размера п. Лемма доказана.
Для любой формулы Ф определим следующие множества:
AND(Ф) =
= {Ф л¥,^ — произвольная формула }, OR(Ф) =
= {Ф V ^,^ — произвольная формула }, AND(Ф)+ =
= {Ф л¥, ^—произвольная истинная формула}, OR(Ф)— =
= {Ф V ¥, ^ — произвольная ложная формула}
Лемма 2. Для любой формулы Ф, множества AND(Ф)+ и OR(Ф)“ не строго пренебрежимы. Более того, существует константа C > 0 такая, что
|АЛЮ(Ф)+
п К\
•>•
C
Г„| (16 п)4к
для всех п > к, где к - размер формулы Ф. Аналогичная оценка верна и для OR(Ф)—.
Доказательство. Докажем это для AND(Ф) +, для OR(Ф)— утверждение доказывается аналогично. Допустим формула Ф имеет размер к . Рассмотрим все формулы вида
йх1..-03пх3п рл/) , (1)
где р - бескванторная часть формулы Ф,
от первых 3к переменных из х1...х3п, а / -произвольная бескванторная формула размера п — к, не содержащая переменных, содержащихся в р . Так как множества переменных формул р и / различны, то мы можем записать каждую формулу типа (1) в виде Фл^еAND(Ф). Таким образом, множество таких формул (обозначим его ^) является подмножеством AND(Ф )п.
Количество формул типа (1) равно количеству всех возможных бескванторных частей с учетом перемены 3(п — к) кванторов для переменных формулы / (кванторы для переменных формулы р зафиксированы). Отсюда |5| = 23(п—к) • 2п—1 • 2п—к • (54п3 + 9п2)п—кСп_к_1 =
= 25
• (54п3 + 9п 2)п~кСп-к-1,
поэтому имеет место оценка
N
5п-4к -1 • (54п3 + 9п 2)п-кСп-25п-1 • (54п3 + 9п 2)пСп-1
Оценим сначала часть без чисел Ката-лана:
1 1
>-
24к • (54п3 + 9п2)к 24к • (2(3п)3 + (3п)2)к
1 1
>
>
• ((Зп)3 + (3п +1)3 )к 24к • ((Зп)3 + (4п)3)к
>
1
1
1
24к • (2(4п)3)к 24к • 2к • (4п)4к 2к • (8п)
\3\ к ^4к ^к
4к
\4к •
1
п
Теперь оценим отношение чисел Ка-талана:
Г 2( p - k)л
C
<-k -1
n -1 = p
C
C
p-k
p +1 І p - k
Cv p-k +1
>
p I 2(p - k)...(p - k +1)
(p - k)! 2 p...( p +1)
(p...( p - k +1) )2 >Г p...( p - k +1)
2p...(2(p-k) +1) І 2p...(2p -k +1)
>
,2k '
Таким образом, имеем |А^(Ф)п| 1 1
C
2k - (Sn)4k
22к (16п )4к
где С > 0 - некоторая константа.
Докажем теперь, что
AND(Ф )п = AND(Ф)+ и AND(Ф)—. Если
ФлТ £ AND(Ф)п, то формула
Ф л —Р £ AND(Ф)n. Действительно, если
Р = 01 Х...&(п—к)х„(,—к) /(^ ,..., х„(,—к) ) , то
^ = Q1 x, ...Q:
3( n-k ) X»3( n-k )
где 3 = V , У = 3 . Дерево для — / можно получить по правилам Де Моргана, заменив л на V для внутренних вершин (и V на V) и заменив каждую атомарную формулу на ее отрицание. Размер дерева сохранится. Это означает, что для каждой формулы из AND(Ф) + найдется уникальная формула из AND(Ф)- и наоборот. Это означает, что |А^(Ф)+1 = |А^(Ф)-
этому |А^(Ф )+| = І-| AND(Ф) п|.
|А^(Ф) + п Fn|
2
C
по-
В итоге
(16n)4
■. Лемма доказана.
Основной результат
Теперь все готово, чтобы доказать основной результат статьи.
Теорема. Если существует строго генерическое множество формул, на котором алгебра Тарского разрешима за полиномиальное время, то существует вероятностный полиномиальный алгоритм, разрешающий алгебру Тарского на всем множестве формул.
Доказательство. Допустим, существует генерический полиномиальный ал-
горитм А, разрешающий алгебру Тарского на некотором строго генерическом множестве S, т. е. существуют константы D > 0 и а > 0 такие, что для любого п
2ап 1 ' По лемме 2 существует С > 0 такое,
что
п FJ
|and^ )+
C
И,| '(16п )4к' (3)
Построим вероятностный полиномиальный алгоритм В, разрешающий алгебру Тарского на всем множестве формул. Алгоритм В будет работать следующим образом (для формулы Ф размера к ):
1) равномерно генерируется случайная формула Р размера п — к (полиномиальный алгоритм генерации будет описан ниже);
2) проверяется принадлежность формул ФлРи ФvРстрого генерическому множеству S (вероятность этого достаточно велика, доказательство смотрите ниже). Если обе принадлежат S, то с помощью алгоритма А проверяем их истинность;
3) если ФлР - истина, то и исходная формула Ф истинна. Выдаем ответ «ИСТИННА»;
4) если Ф^ - ложна, то Ф тоже ложна. Выдаем ответ «ЛОЖНА»;
5) в противном случае и в случае, если хотя бы одна из формул не лежит в S, выдаем ответ «ЛОЖНА».
Заметим, что алгоритм выдает правильный ответ в пунктах 3 и 4, а в пункте 5 может выдаваться неправильный ответ. Докажем, что вероятность выдачи правильного ответа больше 1/2 при достаточно большом размере формулы Ф - это докажет корректность вероятностного алгоритма. Для этого нужно оценить снизу вероятность попадания формул из множеств AND(Ф) + и OR(Ф)— в строго генерическое множество S. Сделаем это для множества AND(Ф) +, для OR(Ф)— доказательство аналогично. В оценках (2) и (3) возьмем для определенности п = к2. Имеем \Fn \5! D
\Fn\
|AND^
2а
>
C
\Fn\ (16к 2)4к'
Отсюда вероятность непопадания
2 ?
k
| А№(Ф)п
IF |
IFn \SI
IFn \S| IFI
< _D_ С16^2)4к <
IАЛ®(Ф) n + I 2ak C
D (6k)8k D 28k'log2(6k)
C 2 “'k2
C 2a
Значит,
0.
IFn \SI
->0,
\ANDm;! '
откуда вероятность попадания в строго генерическое множество
\AND(Ф)n +\ \5 п Fn\
стремится к 1, что доказывает корректность вероятностного алгоритма.
Осталось доказать полиномиальность алгоритма. Полиномиальность пунктов 25 следует из предположения, что алгебра Тарского разрешима за полиномиальное время на строго генерическом множестве 5. Для доказательства полиномиальности пункта 1 приведем вероятностный полиномиальный алгоритм равномерной генерации формул размера п.
1. Генерируем некоторую последовательность (далее «слово») из п символов а и п — 1 символов р.
2. Делаем такой циклический сдвиг этого слова, чтобы оно начиналось на символ а и заканчивалось на р. Этому слову соответствует обратная польская запись для скобочного выражения от символов а.
3. По слову ищем скобочное выражение следующим образом: пробегаем по всем символам слова, если встречаем символ а, то помещаем его в стек. Если встречаем символ р, то извлекаем 2 элемента из стека, затем добавляем между ними символ р, заключаем их в скобки и помещаем в стек. Если по ходу процедуры стек окажется пуст, то переходим к шагу
2. Если все пройдет нормально, мы дойдем до конца слова, при этом в стеке останется всего 1 элемент, то искомым скобочным выражением и будет этот элемент. Иначе переходим к шагу 2.
4. Вместо букв р подставляем V или л - равновероятно.
5. Каждую букву а в слове заменяем на атомарную подформулу (какую - выбираем равновероятно) от переменных
xi,..., Xj (переменные тоже выбраем равновероятно из множества x1,...,xn).
6. Для каждой переменной из множества x1,...,xn равновероятно генерируем
кванторы 3 или V.
Корректность этого алгоритма и равномерность генерации формул следует из того, что существует взаимнооднозначное соответствие между обратной польской записью из n символов а и n -1 символов p и бинарным деревом с n листьями, которые помечены символом а (см.: [5]).
Итак, в предположении существования полиномиального строго генерического множества, на котором алгебра Тарского разрешима за полиномиальное время, мы построили вероятностный полиномиальный алгоритм, разрешающий алгебру Тарского на всем множестве формул. Что и требовалось доказать.
Большинство исследователей сейчас считает, что имеет место равенство P = BPP. Это равенство означает, что любой полиномиальный вероятностный алгоритм можно эффективно дерандомизи-ровать, т. е. построить полиномиальный детерминированный алгоритм, решающий ту же задачу. Хотя это равенство пока еще не доказано, имеются серьезные результаты в пользу него (см.: [6]). Из доказанной выше теоремы по модулю равенства P = BPP следует, что алгебра Тарского остается вычислительно трудной в генерическом случае.
ЛИТЕРАТУРА
[1] Karpovich A. V, Myasnikov A. G., Schupp P., Shpilrain V. Generic-case complexity, decision problems in group theory and random walks // J. Algebra. 264 (2003). № 2. P. 665-694.
[2] Hamkins J. D., Miasnikov A. The halting problem is decidable on a set of asymptotic probability one // Notre Dame Journal of Formal Logic. 47 (2006). № 4. P. 515-524.
[3] Fischer M. J., Rabin M. O. Super-Exponential Complexity of Presburger Arithmetic // Proceedings of the SIAM-AMS Symposium in Applied Mathematics. V. 7 (1974). Р. 27-41.
[4] Rybalov A. Generic complexity of Presburger Arithmetic // Theory of Computing Systems. V. 46. 2010. № 1. P. 2-8.
[5] Спивак А. Числа Каталана // Квант. 2004. № 3. С. 2-10.
[6] Impagliazzo R., Wigderson A. P=BPP unless E has Subexponential Circuits: Derandomizing the XOR Lemma // Proceedings of the 29th STOC, 1997. Р. 220-229.