Научная статья на тему 'О статистических свойствах нелинейности сужений булевых функций на случайно выбранное подпространство'

О статистических свойствах нелинейности сужений булевых функций на случайно выбранное подпространство Текст научной статьи по специальности «Математика»

CC BY
108
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
БУЛЕВА ФУНКЦИЯ / НЕЛИНЕЙНОСТЬ / СЛУЧАЙНОЕ ПОДПРОСТРАНСТВО / СТАТИСТИЧЕСКАЯ ОЦЕНКА / BOOLEAN FUNCTIONS / NONLINEARITY / RANDOM SUBSPACE / STATISTICAL ESTIMATION

Аннотация научной статьи по математике, автор научной работы — Алексейчук Антон Николаевич, Конюшок Сергей Николаевич

Показано, что для всех достаточно больших натуральных n относительная нелинейность произвольной булевой функции n переменных может быть статистически аппроксимирована относительной нелинейностью ее сужения на случайное подпространство (возможно, с выколотым нулевым вектором), размерность которого не зависит от n.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алексейчук Антон Николаевич, Конюшок Сергей Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Nonlinearity statistical properties of Boolean function restrictions on a randomly chosen subspace

It is shown that for all sufficiently large natural n, the relative nonlinearity of any Boolean function in n variables can be statistically approximated by the relative nonlinearity of its restriction on a random subspace (possibly without the zero vector), whose dimension is independent on n.

Текст научной работы на тему «О статистических свойствах нелинейности сужений булевых функций на случайно выбранное подпространство»

2012 Теоретические основы прикладной дискретной математики №1(15)

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПРИКЛАДНОЙ ДИСКРЕТНОЙ МАТЕМАТИКИ

УДК 631.391:519.2

О СТАТИСТИЧЕСКИХ СВОЙСТВАХ НЕЛИНЕЙНОСТИ СУЖЕНИЙ БУЛЕВЫХ ФУНКЦИЙ НА СЛУЧАЙНО ВЫБРАННОЕ ПОДПРОСТРАНСТВО

А. Н. Алексейчук, С. Н. Конюшок

Институт специальной связи и защиты информации Национального технического университета Украины «Киевский политехнический институт», г. Киев, Украина

E-mail: alex-crypto@mail.ru, 3tooth@mail.ru

Показано, что для всех достаточно больших натуральных n относительная нелинейность произвольной булевой функции n переменных может быть статистически аппроксимирована относительной нелинейностью ее сужения на случайное подпространство (возможно, с выколотым нулевым вектором), размерность которого не зависит от n.

Ключевые слова: булева функция, нелинейность, случайное подпространство, статистическая оценка.

1. Постановка задачи и основной результат

Пусть Vn = {0,1}n, f : Vn ^ {0,1} — булева функция n переменных, f (a) = = 2-n (—1)fФ aX, a G Vn,—ее нормированные коэффициенты Уолша — Адама-

x€V„

ра. Напомним (см., например, [1, с. 233]), что нелинейность Nf функции f определяется как расстояние от f до множества аффинных булевых функций n переменных и удовлетворяет следующему равенству:

Nf = 2n-1(1 - f),

где

/* = max |f (a)|.

аЄУп

Назовем число Nf = Nf /2п-1 относительной нелинейностью функции f.

Пусть далее X — двоичная матрица размера t х n, где t < n. Обозначим fx (u) = = f (uX), u G V* = V\{0}, частичную булеву функцию, равную, с точностью до замены переменных u М uX, u G Vt*, сужению функции f на подпространство, порожденное строками матрицы X (возможно, с выколотым нулевым вектором). Положим

Па(Х) = 2Г1Т £ (-1)fx(u) *“ а G Vt; (2)

2 — 1 ueVt*

n*(X ) = max 1 Па(X )|. (3)

aeVt

2* — 1

Из данных определений следует, что величина N= —-—(1 — п*(Х)) равна расстоянию от функции /х до множества аффинных функций £ переменных, ограниченных на подмножество У**. Назовем число Л/ = 1 — п* (X) относительной нелинейностью функции /х.

Предположим теперь, что матрица X выбирается случайно и равновероятно из множества ^*хп всех £ х п-матриц над полем ^ = СЕ(2). Тогда случайную величину ТУ/ можно рассматривать как статистическую оценку параметра Nf, и естественно поставить вопрос о свойствах этой оценки. Отметим, что связь между нормированными коэффициентами Уолша — Адамара функций ¡ и ¡х исследуется в работах [2 - 4] в связи с построением вероятностных алгоритмов нахождения линейных аппроксимаций, а также проверки ряда свойств булевых функций. В частности, в [3] показано, что при случайном равновероятном выборе матрицы X из множества ^*хп для любых а Е УП, £ Е (0,1) выполняется неравенство

£-2

Р||/(а) — Пха(X)| ^ £} ^ ^. (4)

Аналогичное неравенство применительно к более общему случаю получено в [5], однако в указанных, а также в других известных авторам публикациях не затрагивается вопрос о связи между величинами (1) и (3) или, что то же самое, между относительными нелинейностями функций ¡ и ¡X.

Основным результатом настоящей работы является следующая теорема.

Теорема. Для любых £, 8 Е (0,1) существует натуральное число £0 = £о(£, 8), такое, что для любых натуральных п > £ ^ £0 и произвольной функции ¡ : Уп ^ {0,1} справедливо неравенство

Р{№ — /| » £} « 8, (5)

где X — случайная равновероятная £ х п-матрица над полем ^.

Доказательство теоремы базируется, в основном, на анализе моментов случайных величин (2) и излагается в п. 2. Возможность практического применения теоремы к оцениванию нелинейности булевых функций обсуждается в п. 3.

2. Доказательство теоремы

Зафиксируем числа п, £ Е N где п > £, £ Е (0,1), функцию ¡ : УП ^ {0,1} и оценим

сверху вероятность события {|ТУ/ — | ^ £} = {|/* — п*^)| ^ £}.

Докажем ряд вспомогательных утверждений.

Лемма 1. Справедливо неравенство

£-2 2* - 1'

Доказательство. Обозначим а* вектор из множества УП, такой, что ¡* = |/(а*)|. На основании формулы (3) событие {¡* ^ п*(X) + £} влечет событие {|¡(а*)| ^ ^ |пХ«*(X)| + £}, которое, в свою очередь, влечет событие {¡(а*) — пха*(X)| ^ £}. Отсюда на основании неравенства (4) следует, что

£—2 2* - 1'

Лемма доказана. ■

Следующее простое утверждение, по-видимому, хорошо известно, однако авторам не удалось найти источник, содержащий нужную формулировку.

Лемма 2. Для числа / (к, п) линейно зависимых систем, состоящих из к двоичных векторов длины п, справедливо неравенство /(к,п) < 2пк • 2к-п.

Доказательство. Число линейно независимых систем из к двоичных векторов длины п равно

2пк — /(к, п) = (2п — 1)(2п — 2) • • • (2п — 2к-1) = 2пк(1 — 2-п)(1 — 2-(п-1)) • • • (1 — 2—(п—(к—^).

N N

Отсюда на основании неравенства (1 хг) ^ 1 /* 1 хг, хг Е (0, 1), ^ 1,..., N,

г=1 г=1

следует, что

2пк — /(к, п) ^ 2пк (1 — 2-(п-к+1)(1 + 2-1 + ••• + 2-(к-1))) >

> 2пк ^ 2—(п-к+1) 2^ __ 2пк 2пк 2^—п

Лемма доказана. ■

Для любого положительного четного числа т ^ £ +1 обозначим

Пт,* = Е Е^^))т. (6)

а€У

Следующая лемма играет ключевую роль в доказательстве теоремы.

Лемма 3. Справедливо неравенство

т

- < (1 + 2*—т) & (¡<“0т + -»(1 + 2*—!

Доказательство. Преобразуем выражение (6):

Пт,. = £ Е( ЕЫ/(“х

а€У \ 2 — 1 <

1____Е( ^2 ^2 (—1)/(“(1)х)®"^®/(“(т)х)Ф(и(1)Ф-Фи(т))а

(2* 1) \и(1),...,и(т)еУ4* «£У

2* ы ^ / 1\/(«(1)х)ф^ф/(м(т-1)х)ф/(м(1)хф^фм(т-1)х)

Е Е (—1);

(2* 1) \и(1),...,«(т-1)еУ(*

о—*п

^ / ,ч/(«(1)х )©•••©/(«(т-1)х )ф/(«(1)хф^ф«(т-1)х)

Е 2—*п £ (—1)

(2* — 1)ти(1),...,и(т-1)еу4* х вЪх

Представим выражение в правой части (8) в виде суммы двух слагаемых

П(1) = _______2_____ у^(1) (. . .) П(2) = _________2______ у^(2) (. . .)

/1т,* /г)* 1 \т V У > лт,* (п-. \т V 7 >

(2 — 1) и(1),...,и(т-1)бУ4* (2 — 1) «(1),...,«(т-1)еУ4*

где символы £(1) и £(2) обозначают суммы по всем линейно независимым и линейно зависимым системам векторов и(1),... ,и(т—1) Е У** соответственно. Используя лемму 2, оценим значение п^2* следующим образом:

(2) 1 2*

га

(2* — 1)т

^(2) 2—*п ^2 ( — 1)/(“(1)х)Ф-Ф/(«(т-1) х)ф/(«(1)хф^ф«(т-1)х)

«(1),...,«(т-1)еУ4* х х„

2* 2* / 1 \ т

^ . * 2 ,т Е(2) 1 ^ * 2 ,т 2*(т—1)+т—1—* = 2т—*—1 1 + 1

(2* — 1)ти(1),...,и(т-1)еУ(* (2* — 1)т V 2* — 1

Оценим теперь значение п""*. Заметим, что если векторы и(1),... , и(т—1) Е У* линейно независимы, то для любого набора векторов г>(1),... , ^(т—1) Е Уп существует ровно (2*—(т— 1^ матриц X Е ^*хп, таких, что = ^(г), г = 1,... ,т — 1. Следовательно,

П

(1)

У^(1) 2—*п • 2*п— (т— 1)п ^ (—1)/(^(1))®^^^®/(^(т-1))ф/('и^ф—ф^™-1^

(2* — 1)

«(1),...,«(т-1)еУ4* ®(1),...,^(т-1)еУ„

Далее, поскольку

Е í/(а)) т = Е 2—'тп ^ (—1)/(^(1))®^^^®/(^(т))фа(а(1)ф^"фа(т))

аеУП аеУ„ »(1),...,^(“)еУп

= 2 — (т— 1)п ^ ( —1)/(^(1))ф^^^ф/(^(т-1))ф/(^(1)ф^^^ф^(т-1))

^(1),...,»(га-1)еУ„

то

п') = ,2‘ т Г (/МГ Е(1) 1

2421 — 1)т—1 & (/(а»' =(1 + ^) £ (/(а))"

(2* 1) аеУп ' «(1),...,«(т-1)еУ4*

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ПО)

(2* — 1)т ¿¿У' Ч V 2* — V аеУп

Из соотношений (8)-(10) следует неравенство (7). ■

Лемма 4. Для любого положительного четного числа т ^ £ + 1 справедливо неравенство

р{/, + £ « ^)} < £—2 (1 + ) (г+7У" 2 + £-m2m-,-^ (1 + 4 '

Доказательство. Из формулы (3) и неравенства Чебышева следует, что

Р{/* + £ ^ п*^)} = Р ( и {/* + £ ^ |Па(X)|} ) ^ Е Р{/* + £ ^ |Па(X)|} ^

\«еУ4 / “еУ‘

^ (/* + £)—" Е Е^))" = (/* + £)—"Пт,*.

«еУ(

Следовательно, на основании леммы 3

Р{/*+£«n*<X)} « (/. +£)—т( 1 + 2г^^)е_(/(а))"+(/* + £)-m2m-,-^ 1 + ^)

Далее, согласно формуле (1) и равенству Парсеваля,

Е (/(а))" /т—2 Е (/ (а))2 = /Г—2,

аеУп У 7 аеУп У 7

откуда следует, что

*

1\/^\т 2 ( 1 Ут 2 1 , 1 1 I •> * 1 I ! £ I тот—*—1/1 , 1

< (/* + £)-( +(/* + "2т—‘—\«

*

2

< ^ 1 + 2^) (^) "—2 + ^ ^ "

Лемма доказана. ■

Завершение доказательства теоремы. На основании леммы 1 и леммы 4 для любых п,£,т Е N где п > £ ^ т — 1, т четно, £ Е (0,1) и / : Уп ^ {0,1}, справедливы следующие соотношения:

Р{|Ж/ — /| ^ £} = Р{(* ^ n*(x) + £} + Р{/* + £ У п*^)} У

— 2 т— 2 т

У ^—7 + £—2 I 1 + ^---7 I I ^-- I + £ т2т * 11 1 + —---- I у

2* — 1 V 2* — 1) У1 + £) V 2* — 1) ^ (11

У -----г + £—2 (1 + т—1—7Мт~^~У + £—т2т—*—1 (1 + 1

2т—1 — 1 ^ 2т—1 — 1 у \ 1 + £) \ 2т—1 — 1

Пусть теперь 8 Е (0,1). Выберем наименьшее четное число т0 > 0, такое, что

£—2 2 ( 1 у( 1 уто—2 8 , ,

+ £—2 1 + ^—1-------7 У ^, (12)

2то—1 — 1 у 2"о—1 — 1у^1+ £) " 2

и наименьшее натуральное число £0 ^ т0 — 1, такое, что

( 1 у то 8

£—то 2то—*о—1 / 1 +---_---- у (13)

^ 2"о—1 — 1 у ^2

В силу соотношений (11) для любых п > £ ^ £0 выполняется неравенство (5), что и требовалось доказать.

3. Заключительные замечания

Полученная теорема позволяет предложить вероятностный алгоритм оценивания нелинейности функции / : УЛ ^ {0,1} с точностью 2п—1 £ и достоверностью не

менее 1 — 8, £,8 Е (0,1), состоящий в вычислении значения случайной величины

2п—1(1 — п*^)), где X — случайная равновероятная матрица размера £0 х п над полем ^, а число £0 < п определяется из соотношений (12), (13). Нетрудно видеть, что при вычислении всех значений (2) с помощью быстрого преобразования Адамара (см., например, [1, с. 217]) трудоемкость указанного алгоритма составляет 0(2*°£0п) двоичных операций, где £0 зависит только от £ и 8. Однако значения £0 быстро растут

с уменьшением параметра £, поэтому применение этого алгоритма на практике оказывается неэффективным.

Вместе с тем, согласно лемме 1, для любых £,8 Е (0,1) и п > £ = |~1с^(1 + £—28—1)] справедливо неравенство

Р{2п—1(1 — п*^)) — 2п—1£ У Ж/} ^ 1 — 8,

где X — случайная равновероятная £ х п-матрица над полем ^, причем для вычисления указанной нижней оценки параметра Ж/ достаточно выполнить 0(п£—28—1 log(£—28—1)) двоичных операций. Далее, в качестве верхней оценки нелинейности функции / можно

использовать случайную величину 2п—1(1 — п?"^)), где ) = ( 2—* ^ (п«^))"

V «еУ

m ^ 4 — четное число. Опираясь на лемму 3 и проводя рассуждение, почти дословно повторяющее доказательство леммы 4, нетрудно убедиться в том, что для любых е, - Е (0,1) и n > t ^ m — 1, удовлетворяющих условию

e-22-t Л+-^-) У -, e-m2m-2i-1^1 + ) у -,

V 2J — V\1 + Ч 2’ V 2J — 1) 2

справедливо неравенство

P{Nf у 2n-1(1 — Пт(X)) + 2ra-1e} ^ 1 — -,

где X — случайная равновероятная t х n-матрица над полем F. При фиксированном m и t = [1/2 • log(4me-m--1)] для вычисления указанной верхней оценки параметра Nf требуется выполнить O(2Jtn) = O ^ne-m--2 log(e-m--2)^ двоичных и

O(2J) = O ^e-mm--2^ арифметических операций (сложения и возведения в степень вещественных чисел), что приводит к алгоритму, трудоемкость которого полиномиально зависит от n, e-1 и --1.

ЛИТЕРАТУРА

1. Логачев О. А., Сальников А. А., Ященко В. В. Булевы функции в теории кодирования и криптологии. М.: МЦНМО, 2004. 470с.

2. Levin L. A. Randomness and non-determinism // J. Symbolic Logic. 1993. V. 58. No. 3. P. 1102-1103.

3. Bshouty N., Jackson J., and Tamon C. More efficient PAC-learning of DNF with membership queries under the uniform distribution // Proc. 12th Annual Conf. on Comput. Learning Theory. NY, USA: ACM,1999. P. 286-295.

4. Gopalan P., O’Donnell R., Servedio A., et al. Testing Fourier dimensionality and sparsity // SIAM J. Comput. 2011. V.40(4). P. 1075-1100.

5. Алексейчук А. Н., Шевцов А. С. Быстрый алгоритм статистического оценивания максимальной несбалансированности билинейных аппроксимаций булевых отображений // Прикладная дискретная математика. 2011. №3(13). С. 5-11.

i Надоели баннеры? Вы всегда можете отключить рекламу.