Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
МНГЕИНТПКН
КОНЦЕПЦИЯ ИНФОЛОГИЧЕСКОЙ СЛОЖНОСТИ И ПРОБЛЕМА P*NP
О.В. Герман, Е.Н. Гончарова
INFOLOGICAL COMPLEXITY CONCEPTION AND THE PROBLEM OF P*NP
O.V. German, E.N. Goncharova
The conception of computing complexity based on the necessary conditions (ink) contained in the problem is considered. The authors suggest a system of postulates under fulfilment of which it is possible to reveal that the number of infs contained in the problem «SATISFIABILITY» increases exponentially, while the number of infs which can be processed by the determinated Turing's machine increases as a polynomial function - that is the condition arising from the postulate of the limited carrying capacity of the Turing's machine.
Рассматривается концепция вычислительной сложности с позиции содержащихся в задаче необходимых условий (инфов). Вводится система постулатов, при выполнении которых удается показать, что число содержащихся в задаче типа ВЫПОЛНИМОСТЬ инфов растет экспоненциально, в то время как число инфов, которые может обработать детерминированная машина Тьюринга, растет как полиномиальная функция - условие, вытекающее из постулата ограниченной пропускной способности машины Тьюринга.
УДК 681.3
Введение
Вычислительная сложность процедуры вывода в пропозициональной логике определяется сложностью детерминированного алгоритма для задачи ВЫПОЛНИМОСТЬ. Мы намереваемся показать, что последняя при разумных допущениях не ограничена никаким полиномом. Из этого следует, что необходимо искать иные парадигмы решения задач вывода. Одна из таких парадигм формулируется как человеко-машинная система поиска решения, в которой основным решающим контекстом является дерево гипотез, создаваемое человеком в процессе решения задачи.
При решении задачи машина Тьюринга работает с условиями задачи. Часть условий задана явным образом, часть скрыта в ее содержании.
Условие «принимается во внимание», если решатель затрачивает один или более тактов своей работы на проверку истинности (ложности) условия.
Условие, логически не следующее из других условий, называется независимым (от этих последних).
Для данного множества условий УьУ2,.",Уп условие а является простейшим, если его по форме можно представить как дизъюнкт, никакой собственный поддизъ-юнкт которого не содержится среди дизъюнктов формулы, логически эквивалентной У1 &У2 &...&Уп.
Минимально необходимое и достаточное по числу условий множество Тп^6' простейших независимых условий, записанных с помощью переменных задачи А, которое должен принять во внимание решатель этой задачи, называется инфологической сложностью задачи А, а элементы Тп^6 -инфами.
Итак, инф - это условие, в записи которого участвуют переменные задачи. Ин-фологическая сложность есть мощность множества обозначаемая далее 1п£А.
Рассматриваем только алгоритмы, принимающие инфы во внимание, т.е. не игнорирующие инфы, т.к. при игнорировании инфа условие не берется в расчет, как если бы его не было, что нелепо, ибо инф есть необходимое условие. Игнорирование инфов наделяет алгоритм качеством оракула, что нами не допускается.
Алгоритм, не игнорирующий инфы, назовем «реалистическим». Не оговаривается, впрочем, как алгоритм получает инф и как он формально представлен.
Условие, эквивалентное множеству не менее 2-х инфов, называется формой. Принять форму во внимание значит заменить индивидуальный анализ инфов задачи распознаванием истинности некоторого предиката (условия срабатывания формы), который определяется способом записи (спецификации) задачи. Очевидным образом предполагается, что между формальным представлением задачи (спецификацией) и ее содержанием (множеством инфов) существует связь.
Рассматриваем только такие задачи, которые формулируются в терминах п>1 однородных булевых переменных х1, х2,...,хп и решением (выполняющим набором, интерпретацией) является множество индивидуальных значений для переменных х; (1=1,...,п), удовлетворяющих условиям задачи, представленным в ее спецификации. Это разнит такого рода задачи от «ДА-НЕТ» -задач, хотя и не принципиально. Кроме того, в качестве решения принимается любой подходящий набор из числа выполняющих. В силу результата С.Кука будем иметь дело только с задачами ВЫПОЛНИМОСТЬ [1],
если противное не оговорено явно. Таким образом, слово «задача» понимается как «задача Выполнимость».
Результаты, полученные в этой работе, полностью определяются принятыми предположениями и постулатами. Таким образом, убедительность этих результатов зависит от общности и ясности посылок. Ситуация такого рода вполне типична, когда речь идет о некой первичной системе понятий, используемых для решения общей проблемы. Учитывая сказанное, отметим, что статья только обозначает подход к решению проблемы Р Ф КР(?), но не претендует на ее решение, так что предполагается, что ее основная цель - вызвать интерес к излагаемой точке зрения в надежде, что дальнейшее развитие сформулированных концепций даст полезные всходы.
ПРЕДПОЛОЖЕНИЕ 1. Проблема Р Ф КР(?) осмысленна только для реалистических алгоритмов, так что оракулы исключены из рассмотрения и не могут использоваться в доказательстве.
ПРЕДПОЛОЖЕНИЕ 2. Никакой реалистический алгоритм не использует никаких иных способов работы с инфами, кроме как выполняя индивидуальный анализ ин-фов и/или анализ форм.
1. Постулаты
Определение. Две задачи З1(х1, х2,...,хп) и З2(х1, х2,...,хп), записанные на одном и том же множестве переменных, эквивалентны, если выполняющие их наборы суть одно и то же множество либо обе задачи не выполнимы.
Определение. Выполнимая задача В называется ослаблением выполнимой задачи А, если часть (пустую или нет) или все условия задачи А заменить их следствиями (хотя бы одним следствием).
ПОСТУЛАТ 1.
1а. Инфологическая сложность любой задачи, сформулированной как задача отыскания произвольного выполняющего набора на множестве булевых переменных, есть целое неотрицательное число.
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
1b. Инфологическая сложность любой задачи А(х), формализованной на основе единственной переменной х е {0,1}, не выше 2.
1c. Всякая выполнимая ослабленная задача имеет инфологическую сложность, не превосходящую сложность исходной выполнимой задачи.
Замечание. В дальнейшем следует иметь в виду, что число инфов, принимаемых во внимание алгоритмом (а не содержащихся в задаче), может быть отрицательным, если (и только если) инфы игнорируются либо алгоритм выполняет сведение простой задачи к более сложной. Во избежание словесной путаницы, следует полагать равносильными понятия принять во внимание отрицательное число инфов и игнорировать инфы.
Замечание. Невыполнимая задача З(х1, x2,...,xn) в общем случае может содержать невыполнимую часть в качестве собственного подмножества. Указать a priori, какова эта часть в общем случае, не решая задачу, нельзя. Однако невыполнимость этой части достаточна для того, чтобы игнорировать оставшуюся часть задачи и не принимать во внимание содержащиеся в ней инфы. Для выполнимых задач это невозможно ввиду того, что инфы представляют не зависимые от других простейшие условия.
Определение. Две индивидуальные задачи 31 (xi ,Х2,... ,Xn) и З2(хк, XK+1,...,XS) Н-эквивалентны, если (и только если) одновременно истинны следующие условия:
(1) Эти задачи суть индивидуальные представители одной и той же массовой проблемы.
(2) Множество {хк, xR+1,...,xS} с попарно различными переменными является подмножеством (необязательно собственным) множества {x1,x2,...,xn} также с попарно различными переменными.
(3) Либо эти задачи одновременно не выполнимы, либо любой выполняющий набор для З^к, xR+1,...,xS) содержится в некотором выполняющем наборе для 31(x1,x2,...,xn) и любой выполняющий набор для 31(x1,x2,...,xn) содержит выполняющий набор для З^к, xR+1,...,xS).
Теорема 1. Пусть З1(х1,х2,...,хп) и З2(хк, хк+1,...,х8) - выполнимые Неэквивалентные задачи. Тогда > 1пГЗ2.
Доказательство. Рассмотрим любую задачу З2(хт,хк,хк+1,...,хк) Н-эквивалентную задаче З2(хк, хк+ь...,х5), где х^ не содержится среди хк,хк+1,...,х8 и содержится среди х1,х2,...,хп. Тогда множество дизъюнктов З2(хк, хк+1,...,х8) получается из дизъюнктов З2(хт,хк,хк+1,...,хк) на основе операции хт-резолюционирования, как описано в [2,3]. Именно, в З2(хк, хк+1,...,х8) перейдут все дизъюнкты из З2(хт,хк,хк+1,...,хк), не содержащие литеры хт. Обозначим это множество З20М(хк, хк+1,...,х8). Затем найдем резольвенты всех возможных пар дизъюнктов с отсекаемой литерой х^ в З2(х|а,хк,хк+Ь...,х;;), один из
которых содержит литеру хт, а другой--|хт.
При этом в З2(хк, хк+1,...,х8) включим только нетавтологические хт-резольвенты. Описанная процедура дает нам Н-эквивалентную систему дизъюнктов с сокращенным числом различных индексов литер (в частности, нет литеры хт). Теперь можно видеть, что З2(х|,хк,хк+1,...,хк) есть конъюнкция З20М (хк, хк+1,...,х8) и множества М дизъюнктов, участвовавших в хт-резолюциониро-вании, т.е. (З2^м(хк, хк+ь...,х5), М}. Пусть ЯМ - множество хт-резольвент из М. Тогда З2(хк, хк+1,...,х5) суть (З2^м(хк, хк+ь...,х5), ям}. Теперь остается воспользоваться Постулатом 1, п.1с, поскольку {З20М(хк, хк+1,...,х8), ям} есть ослабление З2^м(хк, хк+ь...,х5),М}.
Определение сведения задачи А к задаче В можно найти в [1].
ПОСТУЛАТ 2. Пусть задачи А и В Н-эквивалентны и выполнимы и 1п£дв - минимально необходимое и достаточное число инфов, принимаемых во внимание или игнорируемых при сведении задачи А к задаче В. Тогда
Шд = 1п£В + Мдв.
Следствие.
1) 1п£Дс = Ыдв + МВс.
2) ЫДв = - Мед.
Доказательство.
ШД = ШВ + Мдв. 1п!В = МС + ЫВс, откуда
InfX = Infb + ШВс + InfAB.
Но Inf^A = Infc + InfАС, что и дает требуемое.
Доказательство 2) очевидно. Заметим, что отрицательное значение числа инфов для процедуры сведения означает, что инфы игнорируются. Такое может быть только при сведении более сложной задачи к простой, без фактического (частичного) решения. В силу наших предположений такое состояние вещей требует оракула, но мы имеем дело только с реалистичными алгоритмами.
Пусть дана выполнимая задача З1(хьх2,...,хп) и Н-эквивалентные ей задачи
З2(хы,хк2,...,хк0 и Зз(х0. Тогда
Inf З1(х1,х2,...,хп) = Inf З3(Х1). + Inf З1З3 = =Inf 32(xkl,xk2,...,xkt) + Inf 3132.
Следовательно, если исходная задача содержит полиномиальное число инфов, то каждое слагаемое в правой части от «=« не выше значения этого полинома (при условии, что слагаемые не отрицательны, т.е. сведение выполняется реалистическим алгоритмом). Следовательно, далее в этом случае Постулат 2 позволяет ограничить весь спектр возможных способов решения единственным : 3l(xl,x2,...,xn) решается как последовательность переходов 3i(Xi,X2,...,Xn)®32(Xi,X2,...,Xn-l) ® 3n-l(xi).
(1)
При этом не важен порядок сокращения переменных. Если же задача содержит экспоненциальное (от размера записи) число инфов, то никакие трансформации к Н-эквивалентным задачам не позволят принять во внимание только полиномиальное число инфов при допущении о реалистичности алгоритма.
ПОСТУЛАТ 3. Для любой задачи 3(xl,x2,...,xn), выполнимой или нет,
Inf 3(xl,x2,., xi,..,xn) >Inf 3(xl,x2,.,0,..,xn)
Inf 3(xl,x2,., xi,..,xn) >Inf 3(xl,x2,.,l,..,xn)
Inf3
3(xl,x2,., xi,..,xn)
< Inf
3(xl,x2,.,0,..,xn)
+
+Inf 3(xl,x2,.,l,..,xn).
Следствие. Inf 3(xi,x2,.,o,..,xn) >
>0.5* Inf 3(xl,x2,., xi,..,xn) v Inf 3(xl,x2,.,l,..,xn) > >0.5* Inf 3(xl,x2,., xi,..,xn).
Теорема 2. В задаче З(х1,х2,...,хп) (выполнимой или нет) не может содержаться более 2п инфов.
Доказательство. Рассмотрим задачу З(х1,х2) с двумя переменными. Тогда
Inf
3(xl,0) *
> 0.5* Inf
3(xl,x2)
v Inf
3(xl,l) >
> 0.5* Inf 3(xl,x2), но Inf 3(xl,0) < 2 и Inf 3(xl,l) < 2 по Постулату l, следовательно,
Inf 3(xl,x2) < 4. Далее аналогично
Inf 3(xl, x2, 0) > 0.5* Inf 3(xl,x2, x3) V Inf 3(xl, X2, l) >
> 0.5* Inf 3(xi,x2, x3), откуда Inf з^^, x3) < 8 и т.д.
Никакой реалистический алгоритм или форма не может принять число инфов для 3(xl,x2,...,xn), превосходящее 2n
Обозначим TH - пропускную способность машины Тьюринга, N - число выполняемых ею тактов при решении задачи, I -число принятых во внимание при этом ин-фов. Примем
TH= I / H. (2)
ПОСТУЛАТ 4. Какова бы ни была задача на входе финитной машины Тьюринга A, решающей некоторую общую проблему (распознающую некоторый корректно определенный формальный язык) имеет место ограничение:
THa < CA < ¥, (3)
где cA - фиксированная константа.
Физический смысл этого постулата состоит в том, что физическая машина Тьюринга не может переработать за один такт (в единицу времени) неограниченно большое число единиц информации. Этот фундаментальный физический принцип принимается, в частности, в [4 ]. Введенное условие, чтобы машина распознавала некий формально описанный язык, вероятно, избыточно.
Кратко остановимся на возможной контр-аргументации через известную теорему М.Блюма об ускорении [5], суть которой сводится к существованию общерекурсивных функций f, принимающих значения 0 и l и обладающих тем свойством, что для каждой машины Тьюринга Z1, которая вычисляет f(n) за F1(n) шагов, существует другая машина Zj, которая делает ту же работу зна-
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
чительно быстрее за ФJ(n) шагов, причем Ф^п) > 2^(п) и при этом возникает бесконечная последовательность машин, вычисляющих £, в которой для каждой соседней в последовательности пары машин и 28+1 имеет место Фя(п) > 2Фя+1(п), справедливое для почти всех п.
Из теоремы Блюма вовсе не следует неограниченность пропускной способности машин Тьюринга, т.к. если и признать, что машины, вычисляющие одну и ту же функцию, перерабатывают одно и то же количество информации, теорема Блюма не ограничивает нижний предел по всем индексам ! на Ф^п) для каждого фиксированного п. Поэтому для любого фиксированного п самое быстрое вычисление Дп), скажем, на 2Г может требовать сколь угодно большое число шагов и при этом для т > п наискорейшее вычисление ^т) уже обеспечивается другой машиной, скажем, 2У также с очень большим значением ФУ(т).
ПОСТУЛАТ 5. Инфологическая сложность выполнимой задачи ВЫПОЛ-НИМОСТЬ(х1,х2,...,хп) не ниже числа дизъюнктов в минимальной по числу дизъюнктов КНФ (конъюнктивной нормальной форме), эквивалентной этой задаче ВЫПОЛНИМОСТЬ.
Все дизъюнкты минимальной КНФ суть простейшие независимые условия. Принять во внимание число условий, меньше этого числа, недостаточно для отыскания гарантированного решения задачи. Постулат 5 указывает существование наибольшей нижней границы инфологической сложности выполнимой задачи ВЫПОЛНИМОСТЬ и базируется на определении инфа, как простейшего независимого условия.
ПОСТУЛАТ 6.
(a) Значение любого нетавтологического дизъюнкта на данном наборе I* можно определить только через вычисление путем подстановки переменных из I*.
(b) Истинность или ложность множества из К не зависимых друг от друга дизъюнктов на I* можно определить только через вычисление истинности каждого из них в общем случае и не менее одного из них в любом случае. При этом во внимание
принимаются в случае выполнимости на I* ровно К дизъюнктов.
Постулат 6, в частности, указывает на те случаи, когда применение форм либо невозможно, либо бессмысленно. Он свидетельствует о том, что имеются простейшие вычислительные задачи, которые допускают только прямое вычисление.
Теперь мы подошли к первому промежуточному результату. Мы построим выполнимую задачу с экспоненциально нарастающим от числа переменных п числом ин-фов. Следовательно, для таких задач невозможен полиномиальный по времени работы алгоритм при условии:
(a) что это - реалистический алгоритм;
(b) что он принимает во внимание все инфы, причем каждый инф принимается во внимание индивидуально, а не группой.
Таким образом, остается последняя «лазейка» - заменить анализ индивидуальных инфов анализом формы - общего условия, локализующего множество (экспоненциальное по мощности) инфов. Во второй части работы мы установим, что и это невозможно.
2. Инфы
Перейдем к рассмотрению важного технического результата. Некоторые КР-полные задачи формализуются через условие вида:
с1 < а1х1 + а2х2 +... + апхп < С2, (4а) где а!, с1, с2 - целые и положительные, х! е {0,1}.
В частности, при с1 =С2 получим задачу об упаковке в контейнер (ЗУК):
а1х1 + а2х2 +... + апхп = с. (4Ь)
Частный вид (4Ь) входит в постановку задачи о минимальном покрытии 0,1-матрицы (ЗМП). К форме (4а,Ь) приводится ВЫПОЛНИМОСТЬ. Нетрудно видеть, что ЗУК КР-полна. Сформулируем проблему: «Можно ли ЗУК свести к эквивалентной ВЫПОЛНИМОСТЬ (коротко, ВЫ1П), т.е. записанной на том же множестве переменных, так, чтобы для любого п размеры ВЫП
были ограничены некоторым одним полиномом от п ?»
Замечание. Эквивалентность задач, записанных на основе одних и тех же переменных означает, что любой выполняющий набор для одной из них в точности суть выполняющий набор для другой и наоборот.
Ответ на поставленную проблему дает
Теорема 3. Невозможно сведение ЗУК(хьх2...,хп) к ВЫШ(хьх2...,хп) с сохранением свойства эквивалентности множества решений, при котором для каждого п размеры ВЫШ(хьх2...,хп) были бы ограничены некоторым фиксированным полиномом от п.
Доказательство. Рассмотрим единственное равенство
х1 + х2 +... + хп = (п+1)/2, (5) где п - нечетное.
Будем строить КНФ (конъюнктивную нормальную форму) для равенства (5). Покажем, что любая эквивалентная КНФ для (5) имеет экспоненциальное от п число дизъюнктов. Нетрудно составить дизъюнктивную нормальную форму (ДНФ) для (5). Например, рассмотрим равенство:
х1 + х2 + х3 + х4 + х5 = 3, (6) которому соответствует ДНФ
х1х2х3—1х4—1х5 V х1х2—1х3х4—1х5 V... V
V—1х1 —1х2х3х4х5. (7)
Пусть произвольный набор (конъюнкция) к =(хОа1(х2)а2... (хп)ап дает одно из решений равенства (5). Назовем набор
К*= (хО1-^)1""2... (хп)1-ап, сопряженным набору К ((х)а = х, если а =1 и пх, если а=0).
Дизъюнкт Бг- (Вг*) определяем следующим образом:
Бг = 0К = (хО1-"1 V (х2)1-а2 V... V (хп)1-ап (8) Бг* = 0К* = (х1)а1 V (х2)а2 V... V (хп)ап
Говорим, что дизъюнкт Б а выводим из дизъюнкта Бр,если Бр с Ба.
Дизъюнкт Б,- есть простой имплицированный дизъюнкт относительно заданной логической формулы Б(х1,х2...,хп), если
(I) Б(х1,х2...,хп) ® Б;
(II) Бк ((Бк с Б;)&(Р(х1,х2...,хп) ® Бк)) (® символ импликации).
Понятие резольвенты (резолюциони-рования) традиционно [6].
Множество Ъ дизъюнктов назовем замкнутым, если любая резольвента (логическое следствие), выводимая из любого подмножества дизъюнктов из Ъ, сама принадлежит Ъ.
Подмножество П дизъюнктов любого замкнутого множества Ъ, из которого выводимы все другие дизъюнкты из Ъ, называется покрытием Ъ.
Покрытие П минимальное, если оно содержит минимальное число дизъюнктов среди всех покрытий множества Ъ.
Каждое подмножество независимых друг от друга дизъюнктов множества дизъюнктов Я назовем ядром (для) Я. Ясно, что всякое минимальное покрытие ПШ1п для Ъ есть одновременно и его ядро. Обратное в общем случае не справедливо.
Снова рассмотрим равенство (6). Очевидно, конъюнкция
Ка = х1х2 х30х40х5
участвует в записи ДНФ для (6) и определяет дизъюнкт
Ба = 0х1 V 0х2 V 0х3 V х4 V х5. Ясно, что Ба не выводим из множества дизъюнктов ДВЫП, где ДВЫП представляет эквивалентную (6) задачу ВЫ1П. Это значит, что существует интерпретация, в которой все дизъюнкты ВЫ1П истинны, а Ба ложен, и этой интерпретацией является
х1 = х2 = х3 ='1'; х4 = х5='0'. Далее ясно, что из ДВЫП не выводим никакой дизъюнкт Бр, Бр с Ба, например, 0х1 V 0х2 или х4 V х5,или 0х1.
Ясно, наконец, что ВЫ1П на всех наборах, сопряженных к наборам К из ДНФ-представления равенств (5), (6), не выполнима. Например, ВЫ1П не выполнима на наборе (Кк)* = 0х1х2х30х40х5, определяющем дизъюнкт
(Бк)* = х1 V 0х2 V 0х3 V х4 V х5. Рассмотрим дизъюнкты Ба и (Бк)*. Из наших рассуждений вытекает, что, например, дизъюнкты С1 = х4 V х5 С2 = 0х3 V х5 С3 = 0х2 V 0х3 V х4
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
и др. не выводимы из дизъюнктов задачи ВЫП, т.е. не содержатся среди дизъюнктов задачи ВЫП и не выводимы из них в силу правил логического вывода.
Найдем теперь такое (произвольное) минимальное по числу литер подмножество дизъюнкта (В)*, которое потенциально выводимо из ДВЫП в силу правил вывода (в частности, правил резолюционирования). Например, таким подмножеством является х1 V х4 V х5. Мы говорим «потенциально выводимо», ибо каждая интерпретация, выполняющая (6), выполняет также и данный дизъюнкт, в чем нетрудно убедиться (таким образом, выводимость устанавливается теоремой Геделя об эквивалентности синтаксического и семантического следования [6]). Итак, рассмотрим дизъюнкт:
= х1 V х4 V х5, входящий в (В)*. Ясно, что любое собственное подмножество не выводимо из ДВЫП. Например, невыводим «поддизъюнкт» х1 V х4, участвующий в записи невыводимого дизъюнкта
Б'= х1 V —1х2 V —1х3 V х4 V —х5. Следует заметить следующее. В ДВЫП не может входить ни один двухлитерный либо однолитерный дизъюнкт, т.к. он обязательно входит в какой-то более широкий невыводимый дизъюнкт. Далее, в ДВЫП не могут содержаться трехлитерные дизъюнкты любого из следующих видов: х1 V XJ V —1хк х1 V —х V —х —|х1 V —lXj V —1хк по той же причине: они суть поддизъюнкты некоторого невыводимого дизъюнкта. Таким образом, в Двып могут входить дизъюнкты вида х1 V Xj V хк либо подмножество более «широких» дизъюнктов, из коих следует х1 V X V хк.
Тогда ясно, что можно вывести в лучшем случае из группы дизъюнктов фт1п, содержащей не менее двух (выводимых) дизъюнктов, например: х1 V —1х2 V х4 V х5, фт1п = х1 V х2 V х4 V х5. Каждый из дизъюнктов в фт1п при условии вхождения в ДВЫП, может быть заме-
нен на х1 V х4 V х5, из которого он следует. Следовательно, поскольку наша цель - опровергнуть допущение о невхождении в ДВЫП х1 V х4 V х5, надо признать, что каждый из дизъюнктов х1 V —1х2 V х4 V х5 и х1 V х2 V х4 V х5 выводим без использования х1 V х4 V х5. Рассмотрим первый из них: х1 V —1х2 V х4 V х5.
Ясно, что он не может быть выведен ни из одного меньшего по числу литер дизъюнкта, кроме х1 V х4 V х5 (но мы полагаем, что х1 V х4 V х5 ё ДВЫП). Поэтому остается (помимо прочих) возможность вывода дизъюнкта
х1 V —1х2 V х4 V х5 из двух выводимых дизъюнктов: х1 V —1х2 V х4 V х5 V х3 и х1 V —1х2 V х4 V х5 V—1х3.
Ни одно меньшее подмножество второго из этих дизъюнктов не может быть выводимо, кроме х1 V х4 V х5. Поэтому снова рассмотрим этот второй дизъюнкт. Опять же, он не выводим ни из одного собственного поддизъюнкта, кроме х1 V х4 V х5, либо выводится из более широких дизъюнктов, коих уже быть не может. Следовательно, его, в случае вхождения в ДВЫП, можно заменить дизъюнктом х1 V х4 V х5., так как этот дизъюнкт не есть резольвента других (!), и выводится только из
х1 V х4 V х5.
Иначе, должны признать, что х1 V х4 V х5 обязан войти в ДВЫП.
Эти рассуждения легко обобщить для произвольного случая (5). В самом деле, пусть рассматривается минимальный выводимый позитивный дизъюнкт
хП V х12 V... V х1(п+1)/2.
Тогда он должен быть выводим из пары:
хц V х12 V...V х1(п+1)/2 V хк хц V х12 V... V х1(п+1)/2 V 1хк.
Для второго дизъюнкта этой пары нельзя использовать меньшее число позитивных литер. Рассматриваем этот второй дизъюнкт и замечаем, что он не выводим ни из какого своего собственного поддизъюнк-та, кроме
хц V х12 V... х1(п+1)/2.
Поэтому если данный дизъюнкт выводится из отличных дизъюнктов, то этими дизъюнктами может быть и пара вида:
хц V х;2 V...V х;(п+1)/2 V хк V хг,
хц V х;2 V... V х;(п+1)/2 V0Xk V0Xг..
Каждый из дизъюнктов этой пары либо выводим из других либо входит в ДВЫП. Второй из этих дизъюнктов снова не выводим ни из одного своего собственного под-дизъюнкта, кроме х;1 V х12 V... V х1(п+1)/2 (т.к. ни один из этих собственных поддизъюнк-тов не входит в ДВЫП и не выводим из них). Поэтому, т.к. мы исключили вхождение хП V х;2 V... V х;(п+1)/2 в Двып, то либо х;1 V х12 V... V х1(п+1)/2 V—1хк V—1хг выводим из других дизъюнктов ДВЫП, либо содержится среди них. В последнем случае его можно заменить на более короткий дизъюнкт х11 V х12 V... V х1(п+1)/2. В первом случае следует рассмотреть новую пару выводимых дизъюнктов, одним из которых будет дизъюнкт х11 V х12 V... V х1(п+1)/2 V—1хк V0XгV0Xt. Этот процесс должен прерваться после исчерпания всех литер, оставив возможность произвести замену полученного дизъюнкта на хц V х12 V... V х1(п+1)/2.
Теперь мы получаем следующее. В каждом сопряженном наборе к * можно определить уникальный дизъюнкт d1A типа рассмотренного выше (т.е. записанного только из позитивных литер), так что все такие дизъюнкты образуют ядро Я (очевидно, мы записываем все дизъюнкты d1A из позитивных литер, участвующих в записи дизъюнктов Бг* = 0К*).
Пусть ПШ1п - минимальное покрытие множества дизъюнктов ДВЫП, эквивалентное ВЫП. Тогда ПШ1п, по меньшей мере, для каждого дизъюнкта d1A должно содержать множество дизъюнктов фш1п, из которого d1A выводим. Ясно, что если d1A ^ ПШ1п,то ПШ1п должно содержать как минимум подмножество дизъюнктов фШ1п, т.к. ни один dkA с d1A не выводим. Но фШ1п должно быть само не выводимо, т.к. его иначе можно было бы заменить на d1A и сократить размер ПШ1п, что невозможно. Вместе с тем мы показали, что
тогда должен быть выводим дизъюнкт х11 V х12 V... V х1(п+1)/2 V—1хк v—xгv...v0xt, никакой собственный поддизъюнкт которого не выводим, кроме позитивного поддизъюнкта х11 V х12 V... V х1(п+1)/2. Это и устанавливает, что дизъюнкт d1A входит в ПШ1п.
Теперь, учтя, что в Двып нет одноли-терных и двухлитерных дизъюнктов, заключаем, что наше ПШ1п вообще имеет минимальный возможный размер среди всех возможных покрытий ДВЫП.
Дадим теперь необходимые количественные выкладки. Пусть, как и ранее, число позитивных литер в каждом наборе К из ДНФ-представления (5) суть к= (п+1)/2. Тогда число всех конъюнкций К суть число сочетаний Сп(п1)/2. Столько же будет и сопряженных наборов К *, а, следовательно, и дизъюнктов d1A в ядре ПШ1п Кроме того, Сп(п+1)/2 = О(2п/2).
Таким образом показано, что эквивалентная минимальная по размеру КНФ для (5) содержит экспоненциальное число дизъюнктов (т.е. не ограничивает их число полиномом от п в общем случае).
Покажем (предложено Найденко В.Г.), как для условия (5) построить Н-эквивалентную КНФ полиномиальных от п размеров. Этот общий способ продемонстрируем для (6). Для каждой переменной х1 введем столько копий х1 -1, какова константа с в правой части (5); у нас с=3. Это позволит
составить следующую систему равенств:
11111 х1 + х2 + х3 + х4 + х5 = 1;
х1 2 + х2 2 + х3 2 + х4 2 + х5 2 = 1;
33333 х1 + х2 + х3 + х4 + х5 = 1.
Очевидно, что из каждого столбца должна быть выбрана не более чем одна переменная, что дает:
123
х1 + х1 + х1 < 1
123
х2 + х2 + х2 <1
123 х5 + х5 + х5 <1
Остается записать эквивалентности:
1 2 3
х1 ® х1 V х1 V х1
1 V ^ V 3 . • 1 £ х1 ® х1; х1 ® х1, х1 ® х1 1=1,...,5
Убеждаемся, что с учетом произведенных замен для записи (5) в форме эквивалентной КНФ потребуется О(п3) дизъюнк-
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема PфNP»
тов. Полученную таким образом КНФ назовем Н-КНФ, а первоначальную минимальную КНФ, эквивалентную (5), назовем Э-минКНФ. Имеет место следующее
Утверждение 1. Э-минКНФ и Н-КНФ суть Н-эквивалентные задачи и
Н-КНФ > Э-минКНФ.
Доказательство. Н-эквивалентность получаем непосредственно, приняв, например, что х1 и х1 1 (1=1,... ,п) суть одна и та же переменная. Теперь достаточно воспользоваться теоремой 1.
Таким образом, мы видим, что полиномиальная по размеру записи КНФ может содержать экспоненциальное число инфов. Кроме того, любой реалистический алгоритм для Н-КНФ, основанный на сокращении литер (сведении типа (1)), должен принять во внимание экспоненциальноре число инфов, т.е. экспоненциален. Таким образом, только использование форм может дать надежду на преодоление экспоненциальной сложности. Однако, как показано ниже, и это невозможно.
3. Формы
Пусть задача ВЫПОЛНИМОСТЬ ВЫ1П записана с помощью литер х1, х2,...,хр и их отрицаний. Рассмотрим задачу ВЫП2, записанную с помощью литер У1,У2,..., уя, к которой ВЫП1 сводится на основе гомоморфизма Н:
ВЫ1Щ (У1,У2,..., Уя) = Н(ВЫ1П1 (х1, х2,...,хр)).
Свойства гомоморфизма Н таковы
[7] :
(I) Щ-А) = 0 Н(А) (0 операция взятия дополнения);
(II) Если А ® В то Н(А) ® Н(В).
Как следствие получаем
(III) Н(А V В) = Н(А) V Н(В) (1у) Н(А & В) = Н(А) & Н(В).
Теорема 4. Пусть выполнимая задача
ВЫПОЛНИМОСТЬ ВЫП1 определена как конъюнкция дизъюнктов
Б1 & Б2 & .... & Бк, из которых ни один не зависит от других. Пусть ВЫП1 сведена к ВЫП2 на основе подстановок для переменных ВЫП1, устанавливающих тотально определенный гомоморфизм Н, где ВЫП2 = Н(ВЫП1). Тогда (каж-
дая) конъюнктивная нормальная форма (КНФ), соответствующая ВЫП2, содержит не менее к дизъюнктов.
Доказательство. В силу теоремы Геде-ля о полноте узкого исчисления предикатов используем эквивалентность понятий синтаксической и семантической выводимости. Таким образом, ф зависима от Б, если ф выводима из Б. Из того, что каждый дизъюнкт в ВЫП1 не зависит от других дизъюнктов, следует, что найдется интерпретация ©, в которой все дизъюнкты, кроме Б1, истинны, а Б1 - ложен. Если такой интерпретации нет, то Б1 избыточен. В силу свойств гомоморфизма Н имеем, что в интерпретации Н(©) истинны формулы Н(Б1),..., Н(Б1_ 1),Н(В1+1),...,Н(Вк), а Н(Б1) - ложна, т.е. не зависит от других дизъюнктов Н(Б^, что и необходимо.
Для условия (5) будем использовать подстановки вида
хъ= Ь + а11У1 + а12У2 +...+ атУп, 1=1,п, (9) где Ь1, аи - рациональны. Пока не требуем от У быть целыми числами. Главное требование для подстановок (9) - обеспечивать взаимную однозначность преобразования, иначе: каждому набору х=< х*1,х*2,..., х*п > ставится в соответствие единственный набор у=< у*1,у*2,... У*п > (обратное очевидно). Это свойство обеспечивается, как известно из линейной алгебры, невырожденностью матрицы преобразования А=[а^]. Следующие результаты изложены в [8].
Определение. Размеры рационального числа у=р/я (р, я - целые и взаимно простые, я Ф 0), рационального вектора с = (уьу2,...,уп) и рациональной матрицы А=[ащ] определяются так
81ге(у) = 1+ Г1о&(|р|+1)> Г1с82(!я!+1)1
81ге(с)= п+ 81ге(у0+...+ 81ге(уп) 81ге(А)= т*п+Еу 81ге(ащ), где Гх~| - минимальное целое, превосходящее х.
Из (9) получим:
у= А-1 *(х-Ь). (10)
Теорема 5 [8].
1. Если система рациональных линейных уравнений (10) имеет решение, то она
имеет решение, размер которого ограничен полиномом р от размеров А-1 и
2. Матрица А-1, обратная к невырожденной рациональной матрице А, имеет размер, ограниченный полиномом р 2 от размера матрицы А.
Теперь заметим, что нас интересуют только такие значения у*1, которые определяют значения х*1 е {0,1}. Кроме того, для удобства примем Ь=0. Таким образом, размер записи у* суть р (р2(А))= р3(А).
Представим произвольное число у с заданной точностью е > 0 как двоичную сумму:
2' у +2'-1 у'-1 +...+ 20 у0 +2-1 У-1...+ 2-8 у.8, Ур,У-я е {0,1}, р=0,...Д; я=-1,...,-8. Для представления целой части у, содержащей не более су десятичных разрядов, нужно использовать число двоичных разрядов, не более чем
log2(10sy)+1= Су *^2 10 +1.
Аналогично, для обеспеченния заданной точности е число 8 определяется из условия: е > 2-8 ® 8 > | log2 е |. Принимая во внимание, что по Теореме 5 су + 8 < р 3(А), заключаем, что (1+8) < с*р3(А), где с - константа порядка ^210.
Итак, преобразование (4.9) можно теперь представить иначе:
хъ= ал*(2 у',1 +2Ы у1_1,1 +....+ 2-8 у^) + +ай*(21 у',2 +21-1 ^'-1,2 +....+ 2-8 у«,2)+...+
+ ат*(2' уи +2и ум.п +...+ 2-8 у-8,п), 1=1,...,п; и все у1-к,1 -булевы; к=0,..,-8. (11) Показано тем самым, что число булевых переменных у1-к>1 в (11) растет как полином от размеров А. Убедимся, что и рост размеров А можно ограничить полиномом от п. Заметим, что вычисление 2 (2-8) по сложности не выше некоего полинома р4(А), ибо размер 2' + 2й +...+ 2-8 не превышает р3(А). Видим, что т.к.
size(A)= Ш*п+Еу size(a1J) < /при Ш=п/ п2 +п+п*(Шах у size(a1J)), то нужно лишь добиться, чтобы size(a1J) росло не быстрее некоего фиксированного полинома. Однако это требование элементарное, т.к. в выборе коэффициентов матрицы А мы ограничены лишь условием невырожденности матрицы А А Ф0).
В результате с помощью (11) переводим (5) в двойное неравенство:
п/2 -е < Ci у1 < п/2 +е,(у е {0,1},
с1 - рациональны, (12) е учитывает погрешность двоичной аппроксимации), которое имеет размеры, растущие не быстрее фиксированного полинома от п при указанном выше способе определения коэффициентов матрицы А. При этом число дизъюнктов в эквивалентной минимальной КНФ для (12), не меньше числа дизъюнктов в минимальной КНФ, эквивалентной равен-сту:
х1 + х2+... +хп= п/2, в силу Теоремы 4 и тотальной определенности преобразования (11), вытекающей из невырожденности матрицы преобразования А. Таким образом, в условии (12) число ин-фов растет как экспонента от п, в то время как размеры матрицы А и самого равенства (12) растут как фиксированный полином от п.
Теперь обратимся к формам.
Форма Б суть конструкция «если..., то...» или F° P ® f, где Р - условие «срабатывания» формы; f - алгоритм, конструирующий любые наборы, представляющие решения задачи, удовлетворяющей Р, и только их. Предикатная формула Р в качестве аргументов использует свойства спецификации задачи. Отсюда Б реализует связь между способом представления задачи и множеством ее решений.
Определение. Две формы Ра и Рр независимы, если и только если Ра и Рр независимы (друг от друга).
Это определение можно переформулировать иначе: две формы Ра и Рр независимы, если найдутся такие индивидуальные задачи З1 и З2, что Ра истинно на З1 и ложно на З2; одновременно Рр истинно на З2 и ложно на З1.
Определение. Форма над Б1,..., Рк называется универсальной, если в зависимости от индивидуальной задачи на входе решателя она ведет себя как форма (1 =1,к), если и только если данная индивидуальная задача распознается формой (удовлетворяет Б1).
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
Определение. Для данного решающего семейства форм Fb..., Fk универсальная форма FU называется case-формой, если она имеет следующий вид
FU = если Pi, то fi; если P2, то f2;...; если Pk, то fk, где "i ^j Pi &Pj = ложь (т.е. для любой задачи на входе решателя может сработать не более одной формы).
Универсальная case-форма сводится к разбору случаев и только.
Для универсальной формы условие срабатывания P таково, что имеют место импликации:
Pi ® P, P2 ® P,..., Pk ® P, P® Pi v P2 v Pk.
Теорема 6. Для заданного решающего семейства попарно независимых форм F1,..., Fk не существует никакой другой универсальной формы F, кроме как case-формы.
Доказательство. Достаточно рассмотреть случай k=2. Пусть Fa, Fp - две независимые формы и P - универсальное условие для них, не являющееся case-условием. Имеет место
Pa ® P, Pp ® P, P® Pa V Pp, откуда P= Pa v Pp.
Воспользуемся леммой.
Лемма. Если Pa и Pp. - два независимые множества условий, то вычисление Pa на произвольном входном наборе в общем случае не позволяет вычислить значение Pp. на этом наборе и наоборот.
Доказательство с очевидностью следует из факта независимости условий. Таким образом при справедливости посылок теоремы вычисление Pa в общем случае недостаточно для вычисления Pp. и наоборот, т.е. кроме вычисления Pa требуется в общем случае еще дополнительное вычисление для определения значения Pp. Но это в том или ином виде дает case-схему:
Вычисление Pa Дополнительное вычисление: .
(13)
Теперь вернемся к теореме. Итак, Вычисление P дает вычисление Pa. Вычисление Р дает вычисление Pp.
Но вычисление Pa не дает вычисления Pp. и, следовательно, вычисление Р не ис-
черпывается вычислением Ра, т. е. содержит дополнительное вычисление для Рр., что и дает case-схему, в том или ином виде соответствующую (13).
Итак, вычисление Р есть вычисление разбором случаев, т.е. case-вычисление.
Теорема 7. Case-форма, соответствующая множеству различных условий (12), объединяет число условий срабатывания, экспоненциально растущее от п. Доказательство. Для формы х1 + х2 +...+ хп = (п+1)/2, х1 е {0,1}, используя систему подстановок х1 = аПу1 + а12У2 +...+ а1пУп
................................................(Я)
хп = ап1У1 + ап2У2 +...+ аппУп, получим форму
Е1=1,п С1У1 = (п+1)/2 (ЯЯ), где у1, вообще говоря, не целочисленны. Це-лочисленность у1 обеспечивается двоичным представлением У1, как было показано выше. Примем в (Я)
У*1 = У1 + & где ^ - ненулевое число. Такая подстановка дает форму:
21=1* СУ*1 = (п+1)/2 +5 (ЯЯЯ), И (ЯЯ), и (ЯЯЯ) суть две различные формы, так что для заданного набора-решения х*1, х*2,... , х*п мы получаем два соответствующих ему набора-решения У и У*, не равных друг другу. Соответственно и их двоичные аналоги не равны друг другу. Теперь видим, что поскольку число различных двоичных набров Х*, выполняющих (5), конечно, то всегда можно указать такие что множества решений (ЯЯ) и (ЯЯЯ) не содержат общих наборов. В самом деле, наличие общего набора соответствует случаю совместности системы: {(ЯЯ), (ЯЯЯ)}, что невозможно при 5ф0. Таким образом, мы имеем, вообще говоря, экспоненциальное число подстановок (Я) даже при ограничении на размер решения У в силу теоремы 5. В самом деле, число всех переменных у1 равно п, причем каждая переменная у1 принимает не менее 2-х значений, откуда общее число различных решений У* не менее 2п Поэтому к величинам ^1,1=1,п предъявляем только одно требование - не выводить раз-
мер у* = у+ ^ за эти границы, т.е. 81ге|^| < Р (|А|), где Р() - полином сколь угодно высокой степени. Пусть А - принятая точность двоичной аппроксимации вещественного корня, тогда > пА, где п - число переменных. Число W различных значений которые можно использовать в подстановках у*1 = у1 + например, при А=2-п оценивается как W=O(10P(A) 2пп-1). Таким образом, принципиально можно построить экспоненциальное от п число попарно независимых форм (ЖЖЖ) для формы (КЖ), заменяя лишь одну единственную переменную у*1 = у1 + но всякий раз используя новое значение
Итак, мы показали, что число различных попарно-независимых форм для (5) растет быстрее любого полинома от п. Показано, что любая универсальная форма для множества попарно независимых форм, суть case-форма. Постулат 6 требует, чтобы оценка истинности предусловия выполнялась прямым вычислением каждого дизъюнкта эквивалентной КНФ. Следовательно, независимые формы нельзя обработать в группе быстрее, чем по отдельности, каков бы размер этой группы ни был. Однако никакой полиномиальный алгоритм не может интегрировать в себя экспоненциальное число индивидуальных форм, которые нельзя заменить анализом одной формы за полиномиальное время. Сказанное подводит итог всем рассуждениям.
4. Заключение
Можно найти очевидную связь с постулатом теории относительности в связи с ограниченностью скорости света, если провести аналогию с испусканием фотона света и операцией перехода в машине Тьюринга (при этом скорость света выступает физическим аналогом скорости обработки информации машиной Тьюринга). Не занимая «физическую» позицию, авторам нет возможности естественным и логически оправданным способом соединить физические принципы мира и те принципы, которые «допускает» абстрактное устройство, которое, надо заметить, лишь с известной степе-
нью приближения моделирует реальную вычислительную машину.
Понятие инфа следует рассматривать как математическую абстракцию философской категории «условия». Задача ВЫПОЛНИМОСТЬ представляет свои условия явно, т.е. требует от физического решателя хотя бы принять во внимание каждое условие (прочитать его). Другие задачи «прячут» условия в форме представления. Однако, если они эквивалентны задаче ВЫПОЛНИМОСТЬ, то они имеют те же «внутренние» условия. Мы считаем, что коль скоро природа этих задач одинакова, то одинаковыми должны быть и решающие их алгоритмы; иначе говоря, если для ВЫПОЛНИМОСТИ нет алгоритма, игнорирующего инфы, то его не может быть и для других задач из NP.
Введенные нами постулаты заимствованы так или иначе из теории систем, и имеют в силу этого статус физических. Они характеризуют то понимание сложности, которое интуитивно используется разработчиками алгоритмов. Наиболее уязвимо в этом смысле, разве что, предположение, использующее представление об оракуле. Мы отдаем себе отчет в том, что использованные нами постулаты не имеют статус математических формализованных аксиом. Поэтому речь не идет о математическом доказательстве формулы РФОТ. Тем не менее, мы привели именно доказательство этой формулы в той системе знаний, которая объединяет различные системные принципы.
ЛИТЕРАТУРА
1. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. — М.: Мир, 1982.
2. Герман О.В., Семерюк Д.В. Об одной задаче синтеза поведения интеллектуального робота // Автоматика и телемеханика.— 2001. — N2. — С. 15-25.
3. German O.V., Ofitserov D.V. Problem Solving: Methods, Programming and Future Concepts // North Holland, 1995. — 440 p.
4. Хармут Х Применение методов теории информации в физике. — М.: Мир, 1989. — 343 с.
5. Блюм М. Машинно-независимая теория сложности рекурсивных функций // Проблемы математической логики / Под ред.
Ш Герман О.В., Гончарова Е.Н.
«Концепция инфологической сложности и проблема P^NP»
В.А. Козмидиади и А.А. Мучника. - М.: Мир, 1970. - С.401. - 422 с.
6. Чень Ч., Ли Р. Математическая логика и автоматическое доказательство теорем. - М.: Мир, 1979.
7. Расева Е., Сикорски Р. Математика метаматематики. -М.: Наука, 1972. - 590 с.
8. Схрейвер А. Теория линейного и целочисленного программирования. - М.: Мир, 1991. - Т.1, 2.
Об авторах
Герман Олег Витольдович, кандидат технических наук, доцент Белорусского государственного университета информатики и радиоэлектроники (Минск) с научно-педагогическим стажем
23 года. Автор 6 книг и 40 статей в ведущих научных журналах СНГ. Научные интересы - математическая кибернетика, автоматизация решения задач, системы логического вывода. Основные научные результаты представлены в монографии: «Problem Solving: Methods, Programming and Future Concepts / O.V. German, D.V. Ofitserov // Elsevier, North Holland. - 1995, 440p.». Гончарова Елена Николаевна, кандидат физико-математических наук, доцент кафедры прикладной математики и информатики Ставропольского государственного университета. Автор более 20 научных и научно-методических работ.