Научная статья на тему 'Оценки числовых параметров ДНФ случайных частичных булевых функций'

Оценки числовых параметров ДНФ случайных частичных булевых функций Текст научной статьи по специальности «Математика»

CC BY
28
8
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Махина Г.А.

Ряд задач распознавания образов сводится к построению тупиковых, сокращенных или минимальных ДНФ частичных булевых функций. Информация о метрических свойствах таких функций может значительно ускорить поиск оптимальных решений. Работа посвящена оценкам числовых параметров частичных булевых функций, принимающих значения 0 и 1 с вероятностью p и q соответственно. Для таких функций получены нижние и верхние оценки кратчайших д.н.ф., вывод которых приводится в данной статье.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A number of Pattern Recognition problems can be reduced to the construction of prime, irredundant, or shortest disjunctive normal forms for partial Boolean functions. Knowledge of considered function metrical properties can facilitate finding optimal decision. The paper is devoted to numerical parameter estimates of partial Boolean functions taking values 0 and 1 with probabilities p и q correspondingly. The lower and upper bounds on the length of the shortest DNF representation of such functions are obtained in the paper.

Текст научной работы на тему «Оценки числовых параметров ДНФ случайных частичных булевых функций»

УДК 519.68: 681.513.7

ОЦЕНКИ ЧИСЛОВЫХ ПАРАМЕТРОВ В ДНФ СЛУЧАЙНЫХ ЧАСТИЧНЫХ БУЛЕВЫХ ФУНКЦИЙ

© Г.А. Махина

Таврический национальный университет им.В.И.Вернадского,

факультет математики и информатики

пр-т Вернадского,4, г.Симферополь, Крым, Украина, 95007 е-ма1ь: gmakhina@yandex.ru

Abstract. A number of Pattern Recognition problems can be reduced to the construction of prime, irredundant, or shortest disjunctive normal forms for partial Boolean functions. Knowledge of considered function metrical properties can facilitate finding optimal decision. The paper is devoted to numerical parameter estimates of partial Boolean functions taking values 0 and 1 with probabilities pw q correspondingly. The lower and upper bounds on the length of the shortest DNF representation of such functions are obtained in the paper.

Применение дизъюнктивных нормальных форм (ДНФ) в распознавании образов связано с понятием отделимости (см. [1]) и с идеей построения простейшего логического отделителя двух подмножеств вершин п-мерного единичного куба. Задача нахождения простейшего логического отделителя представляет собой по сути задачу минимизации ДНФ частичных булевых функций (ЧБФ). Исследование метрических свойств таких функций позволяет оценить трудоемкость и качество процедур распознавания и тем самым ускорить поиск оптимальных решений. Обзоры по оценкам метрических параметров для почти всех функций алгебры логики можно найти в работах [2, 3, 4]. В статье [4] получена нижняя оценка среднего значения сложности тупиковой ДНФ частичной булевой функции. В работе [5] были рассмотрены частичные булевы функции /, принимающие каждое из значений 0,1, — с вероятностью 1/3. Для таких функций были найдены верхние и нижние асимптотические оценки числа //-.мерных интервалов, длины и сложности кратчайших и минимальных д.н.ф. В данной работе получен более общий результат в предположении, что частичная булевая функция принимает значения 0 и 1 с вероятностями рад соответственно.

Пусть А = |г/|..... г/,. }• конечное множество, ф - функция, ставящая в соответствие каждому <1 (г Л неотрицательное число ф(а). Будем обозначать через

среднее значение функции ф на множестве А.

Лемма 1. Пусть 0 > 0 и 6д - доля тех а е А, для, которых ф{а) > Оф. Тогда 6д <

Введение

1. Вспомогательные результаты и определения

Доказательство.

ф = -У" ф(а) > - У" ф(а) > -з5ввф = 5ввф,

откуда и получаем утверждение леммы.

Обозначим через число ребер из содержащих вершину V.

Лемма 2. Пусть Н = (V, £') - гиперграф с п вершинами. Пусть ^ С ^ < т, а У С V - множество всех вершин V, для, которых > Пусть е > 0 таково,

что |У| > (1-е)п. Тогда длина всякого градиентного покрытия гиперграфа Н не превосходит

Доказательство данной леммы можно найти в [3].

2, Оценки среднего значения и дисперсии интервалов

размерности к

Пусть функция / : Н" —{(). I. —} на каждом наборе принимает независимо единичное значение с вероятностью р и нулевое значение - с вероятностью q. Класс таких функций обозначим через Рпрд.

Интервалом, функции называется грань куба, не содержащая нулей, но содержащая по крайней мере одну единицу. Обозначим через число интервалов размерности к функции /, а через = М[г&(/)] - математическое ожидание величины ik(f)■

Утверждение 1. Справедливо равенство

Доказательство. Пусть = = 1, - множество всех граней размер-

ности к куба Вп. Пусть Р(1) — вероятность того, что некоторая грань I е является интервалом функции / (г /'„. Из определения интервала следует, что

1 + 6 п Н--1п —

5 т

п,зе

Так как = (£) 2п-к, то

что и требовалось доказать.

Утверждение 2. Пусть £>4(п) = М[г^(/)] — (М[4(/)])2 - дисперсия параметра ч{}')- Тогда

где £ = 1 — р — д.

Доказательство. Пусть - множество ^-мерных граней куба Вп.

Для того чтобы оценить математическое ожидание величины гЦ/), найдем вероятность Р(1,Г) того, что два интервала I и I', такие что 1,1' е одновременно принадлежат функции / е /';(/„;. Имеем два случая,

1, Если 11 П = 2-7', то

IV. /О = (1 - - 2(1 - чГ (1 - + (1 - = I):

2, Если 11 П = 0, то

/'(/• /') = (1 - ' - 2(1 - р - дГ (1 - + (1 - р - дГ+1 = Р0

Найдем М[г^(/)]. Имеем:

Здесь было использовано равенство (") = (£) (*) ■ Заметим, что

= ((1 - (1 -д-р)*)* = (МЫт2

Обозначим через / = 1 — /> — // и преобразуем выражение

р. _ р0 = (1 _ д)**1"* -2^(1 - д)2^ +

//1 \ 2к+1

(1 - д)2к+1 -2^(1 - д)2" + = ( ((1 - -

í

Подставляя найденные значения, получаем к

' 1^д)-23 - 1) + Г23 - 1

^ 1 \ / /1 „Л-2-* 1 \ , 23

3=0

что и требовалось доказать, □

Теорема 1. Пусть Ф(п) —оо при п —оо. Тогда для почти всех функций }'{хп) из класса Рпря число к-мерных интервалов удовлетворяет неравенствам,:

пч к

(*п~к ((1 - - - < ¿к(/) <

< ((1 - д)2* - ¿2*) + Ф(п)^2»-*((1-<7)2* -¿2*)) (2.1)

где £ = 1 — р — д.

Доказательство. Пусть £ = 1 — р — д. Воспользуемся неравенством Чебышева, положив в = Ф(п)С) ((1 — д)24 — ¿2,г), Необходимо показать, что 0 при п —оо.

Заметим, что £>и(п) = ¿2*+12™(£) 0) где

2'=+1 /1 _ 4 24 , у ((1 - «Г* --2 .

Величина о^ > 0, так как о^ > 2^ ^(1 — д)^23 — — I)2,

Покажем, что а,/ возрастает по

л ( (г* - (1 - И-1)

а,- 2 1 41

Т.к. (^Г23 — (1 — д— > 0, то > 1, а значит о,- возрастает по j.

а, =2-Ц{ ) ((1 - - 1) - 2 ( 1-А ) ((1 _ ^ _ 1) + - 1

Следовательно,

Отсюда т^п'> < -р^у 0 при п —оо, что и требовалось доказать, □

Следствие 1. У почти всех функций }'(хп) из Рпря нет интервалов размерности большей, нем [1о§2(п1о§1д1_^ 2)],

Положим ко = [1о§2(п1о§1д1_(?) 2)] и пусть Ф(п) = п Тогда Ч0+1 <

((1 - д)2к0+1 - + ((1_д)2*о+1_ ¿2*0+1)

<1 П \ I

¿0 + 1, <

Данное выражение стремится к нулю с ростом п. Следовательно, у почти всех функций f(xn) нет интервалов размерности [log2(nlog1^(1_^ 2)], а значит, и интервалов большей размерности.

Следствие 2. Для почти всех функций

2пр^Пл/¥^р< \Nf \ < 2пр + пл/2Рр

Заметим, что \Nf\ = (/), Тогда утверждение вытекает из Теоремы 1, если положить в ней Ф(п) = п.

Следствие 3. Пусть k\ = [log21о§1д1_^ п + log2 log21о§1д1_^ п], a Qki{,f) - число вершин а е Nf, содержащихся хотя бы в одном, интервале функции / размерности, большей чем к\. Тогда, у почти всех функций

Qki (/) < 1082 l0Si/(i-e) » ■ 2",

где 5п —0 при п —оо.

В самом деле, пусть Q^if) - число вершин а £ Nf, содержащихся хотя бы в одном интервале функции / размерности, равной ki +1, Ясно, что Qkt(f) = Q'kl (/) ^ 2 kl+lik1+i(f), но у почти всех функций

tfcl+i(/(xn))<ifcl+i(n) I 1+ Ф(п)

Полагая Ф(п) = п, получим для произвольного г и достаточно больших п

Qki (/) < 2fel+1 ^ J ((1 - qfH+l - (1 + £)<

< (1 + е)2ППк1+1(1 — д)21о%1/(1-я)п1о£-21°£1/(1-я)п < 2

где ')„ —0 при п —оо.

Следствие 4. Пусть к2 = |_1°ё21°ё1/(1-д) ~ число всех интервалов функции

/. Тогда для почти всех функций }'{хп)

+ ^г»-**-1 ((1 - 2+1 - (1 - „ ) (1 + бп),

где —0 прм п —оо. Рассмотрим отношение

^=^=(р - •>*+=- •>* I1+(т^Г) ■

где £ = 1 — д — р.

Ясно, что Л^ оо при /с < и Л^ —0 при к > к2. Для достаточно больших п имеем Л^ > 1 при к < к2 и Л^ < 1 при А; > к2. Поэтому тах*. 1к{п) достигается либо при к = к,2 либо при к = к,2 + 1.

Полагая в (2.1) Ф(п) = п, получим, что для почти всех функций /(хп) и к < [^(п^д^г)]

1к(п)(1 - 6п) < 1к(п) < 1к(п)( 1 + 5„),

где <)„ —0 при п —оо.

Суммируя эти неравенства по к, 0 < к < [1о§2(п 1о§1д1_^ 2)] и учитывая, что Аь > п°, с > 0 при к < и Ак < (1о§21о§1д1_^ п)-1 при к > к2, получим, что для почти всех функций

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(гк2 (п) + гк2+1 (п)) (1 - 6'п) < г(/) < (гк2 (п) + гк2+1 (п)) (1 + 6'п),

где 6'п ^ 0 при п —оо.

Следствие 5. Для, почти всех функций }'{хп)

_ п(1-г„)1оё21оё1/(1_,г)п

Вытекает из предыдущего следствия.

Следствие 6. Для почти всех функций }'{хп) число максимальных интервалов не превосходит п(1_о(1)) п 2".

п

■¡0

0--о(.Ш2 Ж

ш

ш

ё

Рис. 1. Зависимость г„(к) от к.

На рису икс 1 показана зависимость г„(к) от к. Из теоремы 1 вытекает, что для почти всех функций $(хп) параметр зависит от к подобным же образом.

Следствие 7. Пусть /(/) - длины, а !/(/), ЬК (/) - сложности минималь-

ной и кратчайшей д.н.ф. функции / соответственно. Тогда для почти всех функций /(.?")

(п - Г1оё2(?г1оё1/(1_(/) 2)1) /(/) <

< (п - Г1оё2(д1оё1/(1_</) 2)1) ^(/)) < Ц/) < !,*(/) < п1(/).

Отсюда и вытекает утверждение.

Таким образом, дня получения асимптотических оценок параметров /(/),

!/(/), Ьк (/) достаточно найти асимптотическую оценку одного из этих параметров, например, !(/),

Теорема 2. Для, почти всех функций ¡(хг,)

п>-

т>

с п'2"р

1(Л>

с.Тр

где 1/2 < с < 1.

Доказательство. Рассмотрим множество Р„ функций /еРп, обладающих следующими свойствами:

1. >

2. ЯкЛЛ < п~(1+о(1))1о821о81/(1-в)п2п.

Из следствий 1-3 вытекает, что Гпп„ : х \Р'п\2^2П = 1,

Покажем, что для всякой функции / е Р^ любое покрытие множества интервалами имеет мощность, большую -) гЛо^лс^ /-уп- ® самом деле,

из свойств (1) и (2) вытекает, что по меньшей мере 2пр(1 — о(1)) вершин множества покрываются лишь интервалами размерности не большей, чем кг = |"1о§2 1о81/(1_9) п + 1о§21о§21о§1/(1_?) п]. Отсюда

,(/) >№- <?*■(/)>__

2й1 1оё1/(1-<г) п 1о§21оё1/(1-<г) п

Оценим сверху длину кратчайшей д.н.ф, для почти всех функций / е /';(/„;.

Пусть Рпрд(а) - множество всех функций / е Pnpq, таких, что /(а) = 1, и пусть Gfc"(5) - множество ^-мерных граней куба Вп, содержащих вершину а. Обозначим через vk{o¿,/) число ^-мерных интервалов функции / из Pnpq(a), содержащих вершину а, через Vk(n) - математическое ожидание величины v¡¡(a, /), Vk{n) = M[v¡¡(a, /)], и через Dv¡¡(n) - дисперсию параметра v¡¡(a, /), Dvk(n) = M[v¡(aJ)] - (M[vk(aJ)])2.

Утверждение 3.

к3

Dvk(n) < vl(n) I —-- +

п( 1-д) ©(1 -д)&-\

Доказательство. Очевидно, что вероятность Р{1) того, что некоторая грань I е &к{а) является интервалом функции / е Рпря(а), равна

Р{1) = (1 -

Поскольку общее число граней ранга п — к в Н". содержащих заданную вершину, равно то получаем, что

Оцепим сверху дисперсию Бпк(п) = М[и1(а, /)] — (М[г^(5,/)])2, Чтобы оценить М[у1(а, /)], найдем вероятность того, что грани 1,1' из одновременно являются интервалами функции / из Рпрд(а). Рассмотрим два случая

1. \ШГ\ = {а}:

2. \ШГ\ ф а:

Пусть интервалы 1,1' из ^(5) пересекаются по грани размерности ], тогда

/'(/./') = (!-'/Г' 1

Обозначим через

и

к / \ / Л / /\

( п\ ( п — ( п — к\ . \2к+1-Я-1

Поскольку < — я)2'1^1^ = уЦп), то имеем

= + уЦП) <

Преобразуем

{к\ (п—к\

Положим ау = ( •) •) (1 — д) 23. Рассмотрим отношение

сI

ан 1 (к - ])2(1 - д) 23

Имеем (I < 1 при ] < [1о§2 п\ и с! > 1 при к > ] > [1°ё21°ё1/(1-9) га] ■ Поэтому

^ а,- < А(о1 + ок) < к (к ^ I С1 - ЯУ2 + (1 - д)"2*

Таким образом, получаем 52 ^ (*)(1" д)2к+1"к {к(110(1" ^ + (1"дГ2к) =

А;3 А;

и

£>ик(п) < ( —-—г + к

п( 1-д) (1)(1^д)2к-'

Следствие 1. Если к < к\ — 1 = П°§2 l°gi/(i-g) п + 1°§21°§2 l°gi/(i-9) га1 —

то Dvk{n) < с1°82"vl(n), где с - константа.

Утверждение 4. Пусть 1 < к < к\ — 1. Тогда доля 5п тех функций / е Ргт{<у)

Пйк(п), не превосходит

для которых \vk(ct, f) — vk{v)\ > т—^—vk{v), не превосходит clog2".

Доказательство. В силу неравенства Чебышева доля 6п функций / е Рпрд(а), для которых /) — Ук(п) | > в, удовлетворяет неравенству 6п < . Поло-

жив в = , получаем требуемое утверждение, □

Утверждение 5. Пусть f е Рпрд и Ьк{}') - число тех вершин а е для, которых \ук(а,}') — > 1оёх Пусть 5'п - доля, тех функций, у кото-

рых bk(f) < Тогда > 1

П п — log2 П '

Доказательство. Обозначим через Р{а) - вероятность того, что вершина а е

Ук(п)

-. i гл . иi л1 (ч ] (:.\1 с1 ] и 1п |\1л: ил\идй

= Заметим, что Р(а) = рбп < р"

ггз „

где / G Pnpq-, и f) ~ vk(п)I > ■ Тогда математическое ожидание величи-

ны bk(f) равно bk(n) = -Р(5), Заметим, что Р{а) = р5п < pclog2". Отсюда

получаем bk(f) < с 1082"2".

В силу леммы 1 доля тех функций / е Pnpq, для которых bk(f) > 1о^2"2", не превосходит logc п. Значит, доля тех функций /, для которых bk(f) < 1о^2"2", больше, чем 1 — logc п, что и требовалось доказать, □

Теорема 3. Для почти всех функций / е Рпр(? существует д.н.ф. И длины /(£>) < 1——- и сложности ЫБ) < ——

Доказательство. Рассмотрим подмножество РЦ С Рпря всех функций /(х11), обладающих следующими свойствами:

1. < 2пр + гг^2^;

2- Ьк(/) < 1о^2"2" для всех к < к\ — 2;

3. гк1_2(/) = (к1п_2)2»-^+2 ((1 - д)2*1" - (1 - - р)2"1") (1 + <У, где ^ 0 при п —оо.

Из следствия 1 и утверждения 5 вытекает, что почти все функции обладают свойствами 1 и 2, ^

Свяжем теперь с каждой функцией / е гиперграф Hf = (V, Е), в котором V = а Е совпадает с множеством всех интервалов функции /, Пусть ^ -множество всех интервалов размерности к = [1о§21о§1д1_(?) п+1о§21о§21о§1д1_(?) п] —2,

а У - множество тех а 6 для которых Vk(a,/) > — , Поло-

жим б = 1°р2пп■ Ясно, что условия Леммы 2 выполняются. Поэтому длина всякого градиентного покрытия гиперграфа Н не превосходит

рп

Отсюда и вытекает утверждение теоремы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, у почти всех функций /(хп) из класса Рпрд длина кратчайшей д.н.ф, удовлетворяет неравенствам

В работе получены нижние и верхние оценки кратчайших днф почти всех частичных булевых функций, принимающих значения 0 и 1 с вероятностями рад соответственно,

Автор выражает признательность проф. Сапоженко А, А, за постановку задачи и внимание к работе.

1. Журавлев Ю. И. Об отделимости подмножеств вершин n-мерного единичного куба. // Труды МИЛИ. 1958 г., том LI, 143-157.

2. Васильев Ю. Л., Глаголев В. В. Метрические свойства дизъюнктивных нормальных форм. Сб. Дискретная математика и математические вопросы кибернетики. М.: Наука, 1974, С. 99-206.

3. Сапоженко А. А. Дизъюнктивные нормальные формы. - М.: Изд-во Московского университета, 1975.

4. Сапоженко А. А., Чухров И. П. Минимизация булевых функций в классе дизъюнктивных нормальных форм // Итоги науки и техники, Теория вероятностей, мат. статистика, теоретическая кибернетика, т. 25, М.: ВИНИТИ, 1987, 68-116.

5. Махина Г. А. Числовые характеристики ДНФ случайных частичных булевых функций. // Таврический вестник информатики и математики. Симферополь, ТНУ, 2008. том 2, С. 68-79.

6. Гаврилов Г.П., Сапоженко А.А. Задачи и упражнения по дискретной математике. - М.: Физ-матлит, 2004 г. 416 с.

7. Сапоженко А.А. Проблема Дедекинда и метод граничных функционалов. - М.: Изд. отдел ф-та ВМиК МГУ, 2005. 124 с.

8. O'Connor L. A new lower bound on the expected size of irredundant forms for Boolean functions // Information Processing Letters, Volume 53, Number 6, 24 March 1995 , pp. 347-353(7).

Заключение

список литературы

Статья поступила в редакцию 19.09.2009

i Надоели баннеры? Вы всегда можете отключить рекламу.