УДК 004.052 С.Ю. Мельников
О задаче определения функции выходов автомата со случайным входом по статистике встречаемости слова в выходной последовательности
Рассматривается задача определения функции выходов конечного сильносвязного автомата Мура со случайным входом по относительной частоте встречаемости фиксированного слова в его выходной последовательности. Показано, что эта задача сводится к задаче дискретной минимизации модуля линейной формы.
Ключевые слова: конечный автомат, определение функции выходов, дискретная минимизация, регистр сдвига.
Рассматривается перерабатывающий последовательность независимых одинаково распределенных по полиномиальной схеме случайных величин конечный сильносвязный автомат Мура. Полиномиальная схема считается известной и заданной стохастическим вектором значений вероятностей символов входного алфавита, входная последовательность, начальное распределение и последовательность состояний считаются неизвестными. Наблюдения производятся над выходной последовательностью автомата.
С такими предположениями связан ряд прикладных и теоретических задач, рассматриваемых в литературе. Перечислим некоторые из них. Задача выбора минимального набора мультиграмм в выходной последовательности, вероятности которых характеризуют автомат, приводит к задаче анализа алгебраических свойств семейства вероятностных распределений таких мультиграмм как функций от вероятностного распределения на входе [1, 2]. Поиск новых методов вычислений приводит к задаче анализа класса функций, описывающих вероятности мультиграмм в выходной последовательности, как функций действительных переменных [3, 4]. Ряд работ [5, 6] посвящен задаче тестирования дискретных устройств путем подачи на них случайных последовательностей (тестов) и анализа статистик на выходах. В [7] для известной функции переходов автомата рассматривалась задача определения функции выходов по набору вероятностей биграмм в выходной последовательности. В данном случае при тех же условиях рассматривается задача определения функции выходов по значению вероятности одного фиксированного слова в выходной последовательности.
В первой части статьи рассматривается перерабатывающий последовательность независимых одинаково распределенных случайных величин сильносвязный автомат Мура. Вероятностной функцией для его функции выходов относительно слова у назван предел относительной частоты встречаемости слова у в растущих начальных отрезках выходной последовательности. Областью определения вероятностной функции является множество всевозможных распределений на входном алфавите. На множестве функций выходов введено отношение статистической эквивалентности по признаку тождественного равенства их вероятностных функций. Рассматриваются задачи определения класса эквивалентности неизвестной функции выходов по значению вероятностной функции и по статистике выборочного среднего. Показано, что задача определения класса эквивалентности неизвестной функции выходов по статистике выборочного среднего сводится к задаче дискретной минимизации модуля линейной формы.
Во второй части статьи рассматривается частный случай исследуемой задачи, соответствующий двоичному проходному регистру сдвига с неизвестной булевой функцией выходов, на вход которого поступает последовательность бернуллиевских случайных величин. Возникающая в этом случае вероятностная схема описана в [8, 9]. В п. 1 изучается информация о функции выходов, получаемая по значковой статистике выходной последовательности. На множестве булевых функций вводится отношение эквивалентности по признаку тождества их вероятностных функций. Получены точные и асимптотические выражения для числа и мощностей классов эквивалентности. Показано, что задача определения класса эквивалентности функции выходов сводится к целочисленной задаче
мимнимизации модуля линейной формы при линейных ограничениях. Для всех значений параметра бернуллиевского распределения, за исключением конечного множества «особенных распределений», при достаточной длине выходной последовательности эта задача имеет единственное решение. Исследуется строение множества «особенных распределений».
1. Задача определения функции выходов автомата Мура, перерабатывающего последовательность независимых случайных величин
Определение вероятностной функции
Пусть А = (Х,7,0,И,I) - конечный детерминированный сильносвязный автомат Мура, где X = {х1,Х2,...,хт} - входной алфавит; 7 ={л,У2,...,Ук} - выходной алфавит; 0 = {<?1,^2,. ,^г} -множество состояний; И :0 х X ^ 0 - функция переходов; I :0 ^ 7 - функция выходов. Пусть на
п (0) Г (0) (0) Ш
множестве 0 задано некоторое начальное вероятностное распределение ф ' =1 д^ ,д2 ,...,ЧГ I, и
на вход автомата А поступает последовательность независимых случайных величин х(), г = 1,2,... с
распределением Р(х(г) = Ху ) = ру , pj >0,у = 1,2,...,т-1,рт = 1- ^ pj > 0 .
У ' У=1
Автомату А, перерабатывающему последовательность х(г), г = 1,2,..., соответствует
автономный вероятностный автомат, определяемый квадратными матрицами М(у) = (/ (у),У е7) порядка г , где
т
(У) = X Рх •
хеХ И(Чг, х)=Чу
I(Чг)=У
Пусть у = у(1)у(2)...у(/) , у(г) е 7, г = 1,2,...,/. Положим М = ^ М(у), М(А,) = Е ,
уе7
М (у) = М (у1- > )М (у1- ' )...М( у-’), где А - пустое слово, Е - единичная матрица порядка г . Через
Т т
п(у) обозначим сумму столбцов матрицы М(у), л(у) = М(у)(П...1) , где (11-1Г - вектор-
столбец порядка г , составленный из единиц.
Как нетрудно видеть, последовательность состояний автомата образует эргодическую цепь Маркова с вектором начального распределения q(0) и матрицей переходных вероятностей М. Следовательно, существует единственный стохастический вектор п = (пі,п2,...,пг), такой, что пМ = п . Вектор п не зависит от q(0). Закон больших чисел для цепей Маркова [10. С. 61] позволяет интерпретировать величины п и пп(у) как пределы относительных частот встречаемости состояния Ці и слова у в растущих начальных отрезках последовательности состояний и выходной последовательности автомата А соответственно.
Проведенные построения относятся к вектору р = (рі,Р2,...,Рт-і), принадлеащему связной открытой области
1_ т-1 І
0 = |р = (Р1,Р2,•••,Рm-l), X РІ <1,Рі >0,І = 1,2,...,т-1|
евклидова пространства Ят 1. В частности, для т = 2 (случай автомата с двоичным входным алфавитом и бернуллиевской входной последовательности с распределением ^{1} = Р1, ^{0} = Ро,
Р0 + Р1 = 1, ро > 0, Р1 > 0 ) векторы п и п(у) являются функциями одной действительной переменной
Р1. Функция іу() = пл(у) называется ([1]) вероятностной функцией автомата А для слова у .
Лемма 1. Вероятностная функция автомата А для слова у представима в виде отношения двух
полиномов от р = (р1,Р2,. .,Рт-1) с целыми коэффициентами:
рЮ-М)
^ £( '
причем знаменатель £(р) не зависит от у , степени числителя и знаменателя ограничены числами
г + / и г соответственно: 0<deg£()<г , 0<degЛу(р)< г + /, где / - длина слова у .
Доказательство. Элементы матрицы М являются линейными функциями от р, причем коэффициенты этих функций есть целые числа. Применяя правило Крамера для решения системы линейных уравнений п М = п, получаем, что каждый из пу представим в виде отношения двух
полиномов с целыми коэффициентами, степени которых не превосходят г . Знаменатели этих отношений не зависят от у .
Элементы матрицы М(у) являются полиномами от р степеней не выше /. Следовательно,
координаты вектора л(т) = М(у)(11...1) обладают тем же свойством. Поскольку Ру(р) = пп(у) ,
лемма доказана.
В [3] имеется описание вероятностных функций для знака сильносвязных автоматов с двоичными входным и выходным алфавитами.
Теорема 1 [3]. Функция О(р) является вероятностной функцией для знака сильносвязного автомата тогда и только тогда, когда она удовлетворяет условиям:
1) О (р) определена на интервале (0,1) и принимает значения из отрезка [0,1];
2) функция О(р) представима в виде 0(р)/£(р), где 0(р) и £(р) - полиномы с целыми коэффициентами, £(р)> 0 при р е (0,1);
3) если О(р) принимает значение 0 или 1 внутри интервала, то она является тождественной константой.
Задача определения неизвестной функции выходов
Пусть А = {А = (X ,7,0,И, /), / е^. ,к } - класс описанных выше конечных сильносвязных автоматов Мура, функции выходов которых принадлежат множеству Гг к всех функций из 0 в 7 . Рассмотрим возможность определения неизвестной функции выходов / автомата А еА по значению его вероятностной функции р () для заданного ре Б. С целью подчеркнуть зависимость
вероятностной функции от / будем обозначать ее Ру,/ (р) .
Функции /1 и /2 из Рг к назовем статистически эквивалентными относительно слова уе 7 (и примем для такого случая обозначение /1 ~ /2), если Ру,/ (р) = Ру,/2 (р) для всех р е Б.
Нетрудно видеть, что так введенное отношение в самом деле является отношением эквивалентности, разбивающим Рг к на непересекающиеся классы. Соответствующее фактормножество обозначим . Очевидно, по значению вероятностной функции Ру / () в точке
ре Б статистически эквивалентные функции выходов неразличимы, и определение функции
выходов возможно лишь с точностью до класса эквивалентности. Оказывается, что класс эквивалентности можно определить «почти всегда».
Лемма 2 [11]. Пусть £(х[,Х2,...,хп) - ненулевой полином от переменных Ху,Х2,...,хп. Мера
Лебега в п -мерном евклидовом пространстве множества {(Х1,Х2,...,хп)£(х1,Х2,...,хп) = 0} равна нулю.
Утверждение 1. Для всех ре Б, за исключением некоторого множества Ос Б, имеющего нулевую меру Лебега (в Ят 1), значению Ру/ (р) соответствует единственный класс эквивалентности функции / .
Доказательство. Рассмотрим семейство и функций от р = (р1,р2,...,рт-\) : и = {Ру,/ ()-Ру^(), /,g-неэквивалентныефункцииизРг к}.
Семейство и конечно, перенумеруем его произвольным образом. С помощью леммы 1 легко
/-Ч Щ (р) /-Ч /-Ч —
показать, что г -я функция из и имеет вид щ (р) =—, где Щ (р) и £(р) - многочлены от р . По
£ ()
построению среди щ () нет тождественного нуля.
Положим О = у{реБ|щ(р) = 0}. По лемме 2 мера Лебега (в Ят-1) каждого из множеств
г
{реб|щ() = 0} равна нулю, поэтому мера множества О также равна нулю.
Зафиксируем ре Б \ О. Тогда щ 0 ни для какой функции рассматриваемого семейства. Это
означает, что все элементы множества {Ру,/ (р), / - не эквивалентные функции из Ег,} различны.
Поэтому значению Ру,/ () соответствует единственный класс эквивалентности функции /,
указать который можно, например, перебрав все классы эквивалентности.
Последовательность {сту,у = 0,1,...} состояний автомата А в рассматриваемой схеме является
простой однородной цепью Маркова с вектором начального распределения q(0) и матрицей переходных вероятностей М. Из цепи {сту,у = 0,1,...} образуем новую марковскую цепь
{ст^, у = 0,1,...}, состояния которой представляют собой всевозможные последовательности длины I
состояний цепи {сту,у = 0,1,...} . Более точно множество состояний 0(1) новой цепи определим следующим образом:
Обозначим
(О
^^т^)..™^^ 0.
- r(l) (очевидно. r(l) < Г). и зафиксируем на Q(l) лексикографический
порядок. В [12] показано, что из эргодичности цепи {ст^, j = 0,1,...} следует эргодичность цепи
( (l) ■ n i I - “(О ( (l)- n(l)
СТ j , j = 0,1,...; и существование для последней предельного распределения П' =1 %- , q eUy '
j ) \ q
Если q = (q(l).q(2).....q(/)jeQ(/). то
4/)-^тЛ(2).Л(Л«'
С целью подчеркнуть зависимость вектора предельного распределения от р = (рьр2,. .,рт-1) будем его обозначать п(1) () .
Определим функцию ^у": —> {0,1} , положив
( А..,^)если / (^(г))=г=1,2,...,/,
' ' [ 0 в противном случае.
)()) ^
Вектор-столбец (у'(),qеQP)) обозначим . Во введенных обозначениях вероятностная функция автомата представляется в виде скалярного произведения векторов размера г:
ри ()=.
Рассмотрим линейное пространство у|я( ( ( ())), ((1),^(2),---5#()|єО() М над полем
действительных чисел, порожденное элементами вектора предельного распределения. Это
пространство состоит из действительных функций от р = (р\,Р2’...’Рт-1) вида X с- п!?(р); с- -
- „() 4 - ' ’ 4
произвольные действительные числа; qєQ(1). Пусть ґ - размерность этого пространства.
Очевидно, ґ < г(1). Выберем в нем базис d(р) = (^1 (р),^2 (р),.,^ (р)) . Через С обозначим
. (/)
действительную матрицу размера ґ х п ', для которой
П(/) (р)=d (р)с .
Выбирая в качестве базиса (1, где d = (1Н , Н - действительная квадратная матрица порядка г(1), det Н Ф 0, имеем
П(г)(р)=(1 нс .
Выбором подходящего базиса приведем матрицу С к ступенчатому виду (эрмитовой нормальной форме [13]), и с помощью перенумерации множества состояний получим матрицу следующего вида:
(г. 1 г.1 г.1 * * ... *
2 ,2 ,2
НС =
В.
оо ••• о Ъ2 ь2 и .
12 ^2
оо - о оо - о ; ъ1 ъ2 - и
1 2 * у
Такое переупорядочивание множества Q() приводит к разбиению его на ґ блоков:
О() = и^г, І =1’2,...’ґ, Оі ПОу = о,і Ф] .
І=1
Состояние -єО() принадлежит і -му блоку разбиения О , і = 1,2,...,ґ, тогда и только тогда,
(г) /-ч
когда функция п- () линейно выражается через первые і базисных функций, т.е. через первые і
координат вектора 1 (р) .
(I) ГЛ ~ гл
П- (р) = Е ау (р), аг * 0 (1)
q у <г
и не представляется линейной комбинацией первых г -1 базисных функций.
Отметим, что размерность ? пространства ^|п- (р), - е0(1)|^ является константой,
зависящей только от функции переходов автомата. Выбор базиса и связанные с ним ступенчатый вид матрицы В и представление (1) не определены однозначно.
Предполагаем, что для рассматриваемого класса автоматов ступенчатая матрица В выбрана произвольным образом и зафиксирована.
Утверждение 2. Функции / и g из к статистически эквивалентны относительно слова
у тогда и только тогда, когда
ВТ/ = ВТ!? . (2)
Доказательство. Тождество Ру,/ (р) = Ру^ (р) имеет место тогда и только тогда, когда
п(1)(р)т/ = п^р)^. Последнее равенство переписывается в виде ЙВТ/ = ЙВТ^ , что в силу линейной независимости базисных функций равносильно (2).
Доказанное утверждение позволяет отождествить класс эквивалентности функции / с
/
вектором ВТу и получить следующие результаты.
Утверждение 3. Число различных классов статистической эквивалентности относительно слова у равно
^ = |{в¥ // е ^}
Мощность |[/°]^ | класса эквивалентности, содержащего функцию /°, равна числу решений уравнения
в(т{° - т/)=0,
где неизвестной является функция / е Ег к .
Согласно утверждению 1, для р е Б \ О значению Ру,/ (р) соответствует единственный класс эквивалентности функции / . Теперь можно уточнить этот результат.
Утверждение 4. Для ре Б \ О уравнение
(* V = Ру,/ (р) (3)
при ограничениях на неизвестные V = (М'ЪМ'2,...М'1)е{в¥у,/еГгк} имеет единственное решение
/
= ВТ ' , соответствующее классу эквивалентности функции / .
В случае когда реО , уравнение (3) имеет несколько решений, среди которых содержится вектор, соответствующий классу эквивалентности истинной функции выходов.
Границы для числа классов эквивалентности
Структурность матрицы В позволяет получить границы для числа классов эквивалентности. Прежде всего заметим, что имеет место включение
{ВТ/,/е^}сУ® , где V = {0,1} ,
которое для I = 1 превращается в равенство множеств. Отсюда вытекает неравенство
Вг
гє¥г
с равенством при I = 1.
Пусть В г - подматрица размера / х Я/ матрицы В с множеством строк {1,2,...,/} и столбцов,
соответствующих множеству , г =1,2,...,?. Нижнюю (г -ю) строку матрицы В/ обозначим Ьг'. Очевидно, все ее элементы отличны от нуля.
- число образов точек Я/ -мерного единичного куба при _.“(г) *(г)ер^
Ві г(і), г(і)є У5'
Обозначим: т/ = линейном отображении Вг :У‘г— V, /-1,2,...,I; к/ =
{б,- г(і), г(і)
число различных сумм,
составленных из элементов нижней строки матрицы В/, г =1,2,...,?.
Очевидны соотношения:
Я <к/ <т/ <2Я/ , г = 1,2,...,?.
Утверждение 5. Для числа классов статистической эквивалентности относительно слова у справедливы неравенства:
Рг ,к.
при I = 1
<т\т2...тг, Ег,к/ >к^.Л.
(4)
(5)
- -(О
Доказательство. Для произвольного вектора г є V имеем:
Б£ = Г Б«^ 0 + Г б(2)£(2)1 о
V 0 У V 0 У
+... + В(ґ)£(ґ) = рі + р2 +... + вґ
г(і)
где £ - подвектор вектора £, соответствующий множеству Qi. Так как вектор ві может
принимать лишь ті значений, то Бг = ІРг- может принимать не более т\т2...ті различных
значений. Неравенство (4) доказано.
Неравенство (5) равносильно неравенству
{вг£єР
>к^...^.
(6)
Для доказательства последнего применим индукцию по ?.
10. ? = 1. Матрица В является матрицей-строкой размера 1х у[, и (6) очевидно. 20. Пусть В имеет вид
Г В(г-1) Б Л
о ••• о ъШ^.Ь^
12 .
Б:
Обозначим через 0 множество (г(1) - ) -мерных двоичных вектор-столбцов q', для которых
значения В( 1 q' различны, а через 0 - множество 5 -мерных двоичных вектор-столбцов q", для которых различны значения (Ъ^Ъ^ ...Ъ^. По предположению индукции, 0"\^к{. Положим
о=&* о. Для ,?)ео
имеем
Г_(м)^
Б1 ^ ' + БЯ'
(*1*2 .* )ч'
V і У
Для фиксированного Я 0 є Q' и произвольного Я ', пробегающего множество Q', ґ -я координата вектора БЯ принимает ровно к значений. Зафиксируем одно из этих значений, соответствующее какому-то вектору Я0 є Q", и заставим я ' пробегать все множество Q'. Очевидно,
число различных значений вектора Б(ґ 1)я ' + Бя " равно ^ ”1 >к^...^_і. Таким образом, для
каждого из к значений ґ -й координаты вектора Бя" нами указано по меньшей мере к^...^_і различных значений первых ґ _1 координат этого вектора. Неравенство (6), а вместе с ним и утверждение доказаны.
Определение класса эквивалентности неизвестной функции выходов по статистике выборочного среднего
Пусть в рассматриваемой схеме входная последовательность х(1), х(2),..., х(^) перерабатывается
автоматом А в выходную последовательность у^1,у(2),...,у(^. Через g(к) обозначим функцию, которая вычисляется по выходной последовательности длины к > 1 и слову у следующим образом:
1, если последние I символов выходной
g(к)=
последовательности длины к составляют слово у,
0 в противном случае.
Положим
% =-
N
I g
к=1
(к)
Оценим объем материала N, достаточный для определения класса статистической эквивалентности функции выходов / по статистике YN с заданным уровнем надежности 8,
0 <8<1. Воспользуемся нормальной аппроксимацей.
Для последовательности g(1),g(2),...,g^ при Nсправедлива ЦПТ [10], согласно которой случайная величина
N / \
I g - (-1 + 1))/ (О
к=1
^й/ (( -1 + 1)
сходится по распределению к стандартному нормальному закону. Величина предельной дисперсии й/ вычисляется [12] следующим образом:
г г
й/ = I П (y)c/Пу (у) + IпуПу (у)( -Пу (у)) , (7)
^,]=1 у=1
где Пг (у) - компоненты вектора п(у) , равные условной вероятности появления на выходе автомата последовательности у , если он находился в состоянии ; су - элементы матрицы C предельных
ковариаций цепи {сту, у = 0,1,..} .
Элементы матрицы предельных ковариаций вычисляются по формуле
су = пу2у - пг8гу — пгпу , (8)
где 8гу - символ Кронекера; - элементы фундаментальной матрицы
Z = ( -( - чя))"1
эргодической цепи {<СТу, у = 0,1,...} .
Задача определения класса статистической эквивалентности функции выходов по статистике
рг ,к
YN для р е О \ О является задачей различения
= V гипотез о принадлежности с.в. YN к тому
или иному распределению из V нормальных совокупностей:
V
аУ N -1 +1
№ е Рг,к, g - gl!
к е ргк, g ~ g2 \ ,
й VN -1+1 ,
^ V N-I+1,
Здесь множество {gl, g2,..., gv} образовано попарно неэквивалентными функциями, по одному
:еРг к,g-gv \.
представителю от каждого класса эквивалентности.
Построим критерий различения перечисленных гипотез с помощью метода доверительных интервалов. Для этого нам потребуется равномерная по всем функциям / е р- к верхняя граница
для предельных дисперсий йтах > й/. Получим ее.
Из (7) следует оценка
гг г
й/ = I Пг (у)ся у (у)+!п /П у (у)( -П у (у)) I Пг (у)сЯ у (у) +1/4 ^ гАтах (С) г, ] =1 у=1 ?, ] =1
где Атах (C) - наибольшее собственное число матрицы C. (Матрица C симметрична и положительно определена).
Получим границу для предельной дисперсии в терминах собственных чисел матрицы M, которые обозначим А4 = • Нетрудно убедиться, что собственные числа матрицы
E-( - пп) имеют вид (1,1-^2,.,1-^г), а собственные числа матрицы Z есть 11,------------,...,-
' 1 I 1-^2 1-А»
В силу положительной определенности матрицы C справедливо неравенство Xтах ^)< №(C), где ?г (О - след матрицы C.
С учетом (8) имеем
1
tr (C)< 2tr (Z)-1 = 1 + 2 X
t=2
1 -Xt
Необходимая оценка получена:
= r
t=2
1-Х,
+1.
Для заданного p обозначим sq = minpf (p)- Pg (p) = min d(p)(1- Д2)
f,g n.^Frk/
где первый
Д1
И *Д 2
минимум берется по всем парам неэквивалентных функций / и g. По построению отношения эквивалентности имеем ед > 0.
Зададимся уровнем надежности 8, 0 < 8 < 1. Учитывая, что
Yn - Pf
й
s0
(
<2Ф
Л
s0
Jdf (N -1 + 1)
где Ф - функция распределения стандартного нормального закона, найдем N0 как наименьшее целое, удовлетворяющее неравенству
(
е0
^>Ф
2
А
^/dmax (( 1 + 1)
(9)
Примендение метода доверительных интервалов приводит к следующему утверждению.
- Г - - (О!
Утверждение 6. Пусть для N>Nо,pгП вектор ^0 е^г, ге¥г !> является решением задачи минимизации
Yn - d
(pW
при ограничении д є< Be, г єV,
Jt)
Тогда с вероятностью, не меньшей 8, можно утверждать, что класс статистической эквивалентности истинной функции выходов / есть Д0 .
Сформулируем аналогичный результат для случая p еП. Пусть
so = min
Pf * pg
d(p)((1 - Д2)
Р/ ()- Pg (р)| = тр
' И ,Ц2е
ф)ц1 *ф)ц2
Утверждение 7. Пусть N0 определено соотношением (9). Для N > N0 с вероятностью, не меньшей 8 , соответствующий классу статистической эквивалентности истинной функции выходов / вектор ^0 содержится среди решений неравенства
yn -d од < 2
рассматриваемого при ограничении д є \ Be, г eV‘
J)
2. Задача определения булевой функции выходов проходного регистра сдвига с бернуллиевским входом.
Рассматривается задача определения неизвестной булевой функции выходов проходного регистра сдвига с бернуллиевским входом по значковой статистике выходной последовательности. Будем придерживаться общей схемы, изложенной ранее.
Пусть Еп - множество всех булевых функций от п аргументов, п = 1,2,.... Для булевой функции /(х1,Х2,...,хп)еЕп через А/ = (х = {0,1},Уп,У = {0,1},Л,/) обозначим автомат Мура, являющийся двоичным регистром сдвига с накопителем размера п > 1, множеством состояний Уп , функцией переходов Ъ, определяемой по правилу Ъ((а1,...,ап),х) = (а2,...,ап,х) , где х,аг- е {0,1}, г = 1,2,...,п , функцией выходов /(х1, Х2,..., хп).
Предположим, что на вход А/ поступает бернуллиевская последовательность независимых
двоичных случайных величин х(), г = 1,2,... с распределением р{х(г)=1} = р, р{х(г) = о} = 1-р ,
0 < р < 1. Для удобства предположим, что на множестве начальных заполнений регистра задано
вероятностное распределение Р(1,82,...,еп) = р^8 (1-р)п . Очевидно, такое предположение не
является ограничительным.
Вероятностная функция автомата А/ для знака «1» выходной последовательности является [8]
/ ( ^..^ хп )/
7^ ^ у; , ‘д- ^ ~
У =0
функции / на подуровнях булевого куба.
В обозначениях первого параграфа в исследуемом случае имеем: I = 1, у = 1,0 = Vй , 0 = г = 2п.
Для q = (81,82,...,8п) если £еу = г, то Пд = р1 (1-р)п-г, г = 0,1,...,п .
Очевидно, размерность пространства, порожденного функциями Пд, равна п + 1.
Воспользовавшись линейной независимостью системы функций {рг 1 (1-р)п г+1,г = 1,2,...,п +1} на отрезке [0, 1], положим
Лг (р) = р1 -1 (1 -р)п-г +1,г = 1,2,...,п +1.
Разбиение множества 0 состояний на классы 0 соответствует разбиению Vn на классы
векторов фиксированного веса. Упорядочим векторы Vn по возрастанию весов, а в группах векторов постоянного веса примем лексикографический порядок. Введенная в первом параграфе
матрица В в данном случае имеет размер (п + 1)х 2п . Она обладает «ступенчатой» структурой:
полиномом Ф/ (р)= X 5}р} (1- р)п 1 , где =
(^..^ хп Л = к
к = 0,1,...,п, - веса
В =
П ^
111 -
... 111
1
В г -й строке матрицы В имеется ровно единиц (указаны только ненулевые элементы).
Булевы функции / и g от п аргументов назовем статистически эквивалентными (и примем для такого случая обозначение / ~ g ), если вероятностные функции автоматов А/ и Ag совпадают как функции от р на отрезке [0,1].
Утверждение 8. Статистическая эквивалентность булевых функций / и g равносильна равенству их весов на подуровнях одинакового веса:
/ ( хп)
(х1,...,хп ) = І
g(х1,...,хп )
(х1,..., хп Л = І
І = 0,1,...,п.
У
Доказательство. Определенный выше вектор Ту в данном случае является вектором табличного задания функции /. Воспользовавшись полученным видом матрицы В , нетрудно видеть, что доказываемые равенства являются покоординатной записью критерия утверждения 2.
Полученный результат позволяет отождествить фактор-множество ^п/^ с множеством (п + 1) -мерных векторов с целочисленными координатами
j(s0,s1,...,^^ є{о,1,...,(п)}|.
Утверждение 9. Для р е[0,1] \ 0.п, где Пп - конечное множество точек отрезка [0,1], по значению Фу (р) можно указать класс эквивалентности функции /. Справедлива оценка
ы — п
V 2 У
Доказательство. Рассмотрим семейство Мп не равных тождественно нулю полиномов от р
вида ^ сур! (1-р) ■* , где с у - целые числа, удовлетворяющие неравенствам
j=0
/п\^ ^¡п\ п
— . <с, < . ,у = 0,...,п.
\л у и/
Определим множество Оп как объединение множеств корней полиномов рассматриваемого семейства, которые принадлежат отрезку [0,1]. Степень каждого полинома не превосходит п. Поскольку в этом семействе содержатся все попарные разности вероятностных полиномов функций из Еп, приходим к оценке
V 2 у
Отбрасывая по одному из каждой пары различающихся только знаком полиномов, приходим к доказываемой формуле. Доказательство утверждения завершается теми же рассуждениями, что и при доказательстве утверждения 1.
Доказанный результат допускает наглядную геометрическую интерпретацию (рис. 1). В квадрате [0,1] х [0,1] изобразим графики вероятностных функций Фу (р) для всех неэквивалентных
булевых функций из Еп . Тогда множество «особенных распределений» 0.п есть множество абсцисс точек пересечения указанных графиков.
Следующее утверждение, по сути, является переформулировкой утверждения 4 для случая регистра сдвига.
Утверждение 10. Для р е[0,1] \ Пп уравнение
Ф у (р)= Е н ]Р} I1 - р)п-1
3=0
при ограничениях на неизвестные 0<ц} <(п) ,} = 0,...,п имеет единственное целочисленное
V/
Г (0) (0) (0П ф ,
решение I Н0 ,Н1 , . ,Нп I, соответствующее классу эквивалентности функции у .
В случае когда р е 0.п, данное уравнение имеет несколько решений, среди которых содержится вектор весов на подуровнях истинной функции выходов.
Ф у (р )
Рис. 1. Вероятностные функции Фу (р) для всех неэквивалентных булевых функций из ^3
Структура отношения статистической эквивалентности
Полученные в утверждении 5 верхняя и нижняя границы для числа классов эквивалентности в рассматриваемом случае оказываются равными, что в совокупности с результатом утверждения 8 позволяет получить следующее
Утверждение 11. Число классов эквивалентности равно
Я
Число функций, эквивалентных у0 , равно
=п
І+1І.
1/0 ]=П
к=0
к=0
( (п\ ^ \к) ¿0)
V К у
(10)
(0)
где їу =
у0( x1,..., хп )
к = 0,1,...,п.
(x1,..., хп )| = к
Конкретные значения чисел классов статистической эквивалентности для функций от малого количества переменных сведены в таблицу.
п 2 3 4 5
Еп/„ 12 144 11664 8622400
яу 0,75 0,56 0,18 0,002
оп 22
Утверждение 12. При п справедливо соотношение
Я
= ехр
( 2 п
- п 1п п + О (п)
Доказательство. Воспользовавшись формулой суммирования Эйлера-Маклорена для суммы п п п2 п2
^ г 1пг, нетрудно получить, что ^ г 1пг =— 1пп-+ п 1пп + О(1пп) . Записывая (10) в виде
¿=0 г=0 2 4
произведения факториалов и используя формулу Стирлинга, приходим к доказываемому соотношению.
Свойства множества Пп
Опишем некоторые свойства множества Оп «особенных распределений».
Теорема 2. При п >1 справедливы следующие соотношения:
1) ^п с ^п+1.
2) ^0,1,^2^е0п.
3) р е Пп тогда и только тогда, когда (1 - р) е Пп .
5 t
4) Точка р еПп является рациональной тогда и только тогда, когда р =------ либо р =-----, где
5 + t 5 + t
5 и t - целые числа, удовлетворяющие условиям
( п ^
0 < 5 < Гп + 1
0 < t <
1
5) В интервалах 12-еп ,21 и (Н+еп I, где вп=2^п, нет точек множества °п.
Доказательство. Умножая произвольный многочлен из Мп на р, получаем многочлен из Мп+1, откуда следует включение множеств корней и первый пункт теоремы.
Для доказательства второго пункта достаточно рассмотреть двоичные функции 0, Х1, и Х1 , принадлежащие Я , после чего воспользоваться п. 1.
Третий пункт вытекает из инвариантности множества Еп относительно операции инвертирования всех переменных.
20
Докажем четвертый пункт теоремы. Пусть 20 > 0, 0 < р0 < 1, р0 =-. Точка 20 является
1 + 20
п
корнем полинома ^ Су2^ тогда и только тогда, когда р0 является корнем полинома
>0
п
^ Сур^ (1- р)п у . Нетрудно показать, что множество неотрицательных рациональных корней
>0
п
полиномов ^ Су2] , где Су - целые числа, не все равные нулю одновременно, такие, что
У=0
/п\^ / п А1
-(/)< Су <(/) '=0Д-..'"'
имеет вид
5 t ,
—, или — и,5 - целые, 0 < 5 <
t 5
0 < t <
Учитывая, что р0 =
20
1 + 20
получаем, что все рациональные корни многочленов из Мп на
5 t
отрезке [0,1], т.е. все рациональные точки 0.п образуют множество {------ либо ------, где 5 и t -
5 +1 5 +1
целые числа, удовлетворяющие условиям 0 < 5 <
0 < t <
}.
Для доказательства п. 5 оценим наименьший по абсолютной величине корень многочлена
О(2 -б|,О(8)еМи .
Пусть р = — - 8 . Имеем:
І ср (1-р)”-> = (1-8^‘ (2+8^)” ' = 2-” І о,(1-28)(1 + 28)--
і=0 ]
= 2- ” І С”-і І|/,|(28)‘”іІ (-1)’ (” - >
5=0
-і ^\к І=0 к=0
’
І=0 ” ”-І
2-” І(28); ІС”-, І (-1)’(”-І)(/:-■’)= 2-”І(28),ї> ,
/=0 і=0 ’=/-і ' М ' /=0
”-і
где і, = І с^. І- (-1)’(”-і):-’). і=0 ’=/-і v Л
Воспользовавшись неравенством
нетрудно показать, что
|< 2” (” )< 2”
= Т.
Рассмотрим полином Т(х)= ^ ?гхг на интервале х е (0,1) . Пусть сперва ?о Ф 0. Без ограничения
г=0
общности можно считать ?о > 0. Тогда
Т (Ф'»-
”
І чх1 > ?0 - ІТхі
і=1 і=1
„1-х” хТ
= ?0 - хТ-------------> ?п---------
1-х
1-х
Следовательно, при х <Т0 =—0— имеет место Т (х)> 0.
Т +(0
Пусть теперь ?0 = (1 =... = (к-1 = 0, (к Ф0,к<и. Вновь можно считать (к >0 . Тогда
.м-к
х)> х
ґ ” А ґ А
їк - І их-к > хк їк - І Тх1-к
( і=к+1 ( і=к +1 І
1 - х хТ
= ік - хТ --------------------> ?к---------------
1-х
1-х
Следовательно, при х <Тк = —к— имеет место Т(х) > 0 .
Т + ік
”
Итак, многочлен Т(х)=І їіх1 не имеет корней в интервале хє(0,шіпТк). Воспользовавшись
і=0
тем, что коэффициенты їі - целые числа, получаем, что наименьший по абсолютной величине корень 80 многочлена О-8^, О(8)єМ” удовлетворяет неравенству
80 > 14-.
Теорема доказана.
Определение класса статистической эквивалентности неизвестной функции выходов по значковой статистике
ДЧхР) М
Пусть в рассматриваемой схеме входная последовательность ((,( (,...,х перерабатывается автоматом Ау в выходную последовательность (у(1),у(2),...,У*), где
/) =,.,(+М) . ^бозначим * = 1|/к). О-™ объем материала *, до_й для
определения класса эквивалентности функции выходов / по статистике У* с заданным уровнем надежности 8,0 < 8 < 1. Будем использовать критерий, построенный в первом параграфе. В данном случае можно получить более простую верхнюю границу для предельных дисперсий йу, чем в
общем случае. Воспользовавшись тем, что для п -зависимых двоичных с.в. у(г), г = 1,2,...,
Гп
справедлива оценка D
IУ
Vi=1
(О
+ ІДГ А sП + 1 f 17
< 2 N , получаем, что df < , f є Fn .
Для заданного pgQn обозначим sq = minPf(p)-P„(p) = min d(р)(д-MJ, где первый минимум
берется по всем парам неэквивалентных булевых функций f и g .
По построению отношения эквивалентности имеем sq > 0. Зададимся уровнем надежности 8 , 0 <8<1. Учитывая, что при больших N (мы вновь пользуемся нормальной аппроксимацией)
P fN - Pf (4
s0
<2Ф
( \ s0
V
где Ф - функция распределения стандартного нормального закона, найдем N0 как наименьшее целое N, удовлетворяющее неравенству
">ф
2
(
Є0
(11)
А * (”+1)2,
Приходим к следующему утверждению.
Утверждение 13. Пусть N0 определено соотношением (11). Для N > N0, р £&■”, через ц00),ц(0),..,ц”0)] обозначим решение целочисленной задачи минимизации
- Ё цур] (1-р)п -
у =0
/ п\
при ограничении 0 <цу < I у I, Цу - целые.
Тогда с вероятностью, не меньшей 8, можно утверждать, что класс статистической
й ф у Г (0) (0) (0)
эквивалентности истинной функции выходов у соответствует вектору I Ц0 ,М"1 ,...,Ци I .
Если параметр р лежит в пределах, указанных в п. 5 теоремы 2, последний результат можно уточнить. Для таких р неравенство (11) можно переписать в виде
ґ її -і Л ґ и -і _іл” А
IViP(1-p)n-i -Щpi (1-p)n
i=1 i=1
.> 1- 2 p
1 1 - 2 PT 1-1-2p
1-2 Pn Г
1 1 - 2 P 4
1-1-2P
где минимум в левой части берется по всем различным целочисленным векторам (^0,^1 , . ,Цп) и
(,1^1,...,цП) с условием 0<Цу,Цу <().
Следовательно, в данном случае N0 можно определить как наименьшее целое,
удовлетворяющее неравенству
5>ф
2
( ( 1-2 Pn
1 1-2 P 4
1-1-2P
\\
jNo (n + 1)/2
(12)
Утверждение 14. Пусть
1
>2 - P
<-2-4 и , No определяется соотношением (12). Для N>Nо,
через I J обозначим решение целочисленной задачи минимизации
yn -Za jPJ (1- p) i=0
n-J
т\
при ограничении 0<цj <1 А, цj -целые.
Тогда с вероятностью, не меньшей 8, можно утверждать, что класс статистической
й ф /■ Г (0) (0) (0)
эквивалентности истинной функции выходов } соответствует вектору I М-0 , М-1 ,. .,Ми I ■
Сформулируем результат, аналогичный утверждению 13 для случая p еПи. Пусть so = min\Pf (p)- Pg (p)| = mind(p)n^d(p)n' |d(р)(д- д )|, где первый минимум берется по всем парам неэквивалентных булевых функций f и g .
Утверждение 15. Пусть No определено соотношением (11). Для N > No, p €0.n, с вероятностью, не меньшей 8, соответствующий классу статистической эквивалентности истинной
ф f Г (0) (0) (0П й
функции выходов j вектор I ц0 , ц ,...,цп I содержится среди целочисленных решений неравенства
Yn -£ц,У (1- p)n-i j=0
/ n\
рассматриваемого при ограничении 0 < ц j < I А, ц j - целые.
Таким образом, в случае, когда в качестве автомата выступает двоичный регистр сдвига и рассматриваются значковые характеристики выходной последовательности, задача сводится к задаче целочисленной минимизации модуля линейной формы при линейных ограничениях, размерность которой равна размеру регистра плюс единица, т.е. логарифмически зависит от числа состояний.
Литература
1. Барашко А.С. О ранге и статистическом отображении сильносвязного автомата // Кибернетика. - 1987. - № 4. - С. 56-60.
2. Kingman J.F.C. Some algebraic results and problems in the theory of stochastic processes with a discrete parameter // Stochastic Anal. (ed. by D.G. Kedell and E.F. Harding). - 1973. - P. 315-330.
3. Кудрявцев В.Б. Введение в теорию автоматов / В.Б. Кудрявцев, С.В. Алешин, А.С. Под-колзин. - М.: Наука, 1985. - 320 с.
4. Рябинин А.В. Стохастические функции конечных автоматов // Алгебра, логика и теория чисел: 7 темат. конф. мех.-мат. фак. МГУ (фев.-март 1985). - М., 1986. - С. 77-80.
5. Голембиовский Д.Ю. Диагностика цифровых устройств. Микропрограммное и вероятностное тестирование: конспект лекций / Д.Ю. Голембиовский. - Саратов: СПИ, 1993. - 28 с.
6. Hadjicostis Christoforos N. Probabilistic detection of FSM single state-transition faults based on state occupancy measurements // IEEE Trans. Autom. Contr. - 2005. - Vol. 50, № 12. - P. 2078-2083.
7. Мельников С.Ю. Об использовании спектров графов автоматов в задаче определения функции выходов по вероятностям биграмм в выходной последовательности // Вестник Моск. гос. ун-та леса. - 2007. - № 2(51). - C.153-158.
8. Севастьянов Б. А. Условное распределение выхода автоматов без памяти при заданных характеристиках входа // Дискретн. матем. - 1994. - T. 6, вып. 1. - С. 34-39.
9. Хохлов В.И. Точные формулы для вторых моментов условных преобладаний по Севастьянову // Обозрение прикладной и промышленной математики. - 2003. - Т. 10, вып. 3. - С. 579-582.
10. Сарымсаков Т.А. Основы теории процессов Маркова. - М.: Гос. изд. техн.-теор. лит., 1954. -208 с.
11. Колмогоров А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М.: Наука, 1989. - 624 с.
12. Кемени Дж. Конечные цепи Маркова / Дж. Кемени, Дж. Снелл. - М.: Наука, 1970. - 272 с.
13. Маркус М. Обзор по теории матриц и матричных неравенств / М. Маркус, Х. Минк. - М.: Наука, 1972. - 232 с.
Мельников Сергей Юрьевич
Канд. физ.-мат. наук, зам. ген. директора ООО «Лингвистические и информационные технологии», г. Москва
Тел.: 8 (495) 792-39-25 Эл. почта: info@linfotech.ru
Melnikov S.Yu.
On the finite automaton output function with the random input by the frequency of a word in the output sequence
The article deals with the problem of finding the output function of finite automaton with the random input by
the relevant frequency of a certain word in its output sequence. The problem reduces to the discrete minimization of the linear form module. When binary shift register is regarded as finite automaton and character characteristic of the output sequence, the problem reduces to the integer-valued minimization of the linear form module under the linear constraints. The dimension of the problem is equal to the span of the register plus one, i.e. is on logarithmic dependence on the quantity of states.
Keywords: finite automaton; finding the output function; discrete minimization; shift register.