Научная статья на тему 'Применение дискриминирующей функции в задаче оценивания порядка двоичной марковской цепи'

Применение дискриминирующей функции в задаче оценивания порядка двоичной марковской цепи Текст научной статьи по специальности «Математика»

CC BY
148
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВОИЧНАЯ МАРКОВСКАЯ ЦЕПЬ / ДИСКРИМИНИРУЮЩАЯ ФУНКЦИЯ / БИНОМИАЛЬНОЕО РАСПРЕДЕЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Авдашов С. А., Коньков Е. А.

В работе предложен метод оценивания порядка двоичной марковской цепи на основе дискриминирующей функции для биномиального распределения. Исследована эффективность метода в задаче оценивания порядка двоичной марковской цепи. Приведены результаты сравнения эффективности предложенного метода оценивания порядка двоичной марковской цепи и методов, основанных на информационных критериях Акаике и Байеса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Авдашов С. А., Коньков Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF DISCRIMINANT FUNCTION IN THE ORDER ESTIMATION PROBLEM OF A BINARY MARKOV CHAIN

A method of binary Markov chain order estimation based on a discriminant function for a binomial distribution has been proposed and its efficiency has been studied. The efficiency of the method has been compared with those based on Akaike and Bayesian information criteria. The results of this comparison are presented.

Текст научной работы на тему «Применение дискриминирующей функции в задаче оценивания порядка двоичной марковской цепи»

РАДИОФИЗИКА

УДК 519.217.2

ПРИМЕНЕНИЕ ДИСКРИМИНИРУЮЩЕЙ ФУНКЦИИ В ЗАДАЧЕ ОЦЕНИВАНИЯ ПОРЯДКА ДВОИЧНОЙ МАРКОВСКОЙ ЦЕПИ

© 2008 г. С.А. Авдашов, Е.А. Коньков

Нижегородский госуниверситет им. Н.И. Лобачевского

ekon@nifti.unn.ru

Поступила и редакцию 05.05.2008

Предложен метод оценивания порядка двоичной марковской цепи на основе дискриминирующей функции для биномиального распределения. Исследована эффективность метода в задаче оценивания порядка двоичной марковской цепи. Приведены результаты сравнения эффективности предложенного метода оценивания порядка двоичной марковской цепи и методов, основанных на информационных критериях Акаике и Байеса.

Ключеиые слоиа: двоичная марковская цепь, дискриминирующая функция, биномиальное распределение.

Введение

Дискретные марковские модели - марковские цепи - находят применение в различных задачах обработки данных в качестве моделей анализируемых сигналов [1 - 4]. Многосвязные марковские процессы представляют собой обобщение простых марковских процессов [3]. Одной из важнейших характеристик многосвязной марковской цепи является её порядок, он в первую очередь подлежит оценке.

Рассмотрим последовательность отсчетов сигнала в дискретном времени, который представляет собой реализацию случайного процесса - однородной по времени марковской цепи некоторого неизвестного конечного порядка М, значения отсчетов этого процесса принадлежат конечному множеству А. Задача состоит в оценке порядка М двоичной марковской цепи по имеющейся реализации случайного процесса.

Существуют несколько методов оценки порядка марковской цепи. Условно их можно разделить на несколько классов: методы, основанные на анализе поведения энтропии [4-6], методы, основанные на информационных критериях Акаике [7, 8] и Байеса [9, 10]; кроме того, существует группа методов, в которых анализируются непосредственно значения переходных распределений вероятностей [5, 11].

В данной работе предлагается метод оценивания порядка двоичной марковской цепи на

основе дискриминирующей функции для биномиального распределения.

Метод оценивания порядка двоичной марковской цепи

Введем обозначение для случайной последовательности из п бит в дискретном времени

Х-, , X,

(1)

где х{ может принимать значение из множества А = (0, 1). Обозначим конкретную реализацию случайной последовательности следующим образом:

а? = {а„ а2, а3,..., ап}, а1 е А V /.

Количество повторений в выборке Х? по-к 1

следовательности бит ах, к < п, можно выразить как

п ~к а \

Нп (ак) = 15Х'+к = ак I (2)

1=0

где

Ьк\++к = ак Н 1 1

1 |0, х^ Ф ак .

Используя данные обозначения, можно выразить эмпирические совместные вероятности

к 1

появления последовательности бит а1 в выборке Х1п

Р к+1 )=-^г N а

п - к

(3)

Эмпирические переходные вероятности выражаются следующим образом

N ЯГ1 ]

Ж>'

к+1

)=

N.

(4)

причём Рп (як+1 Я )= 0, если Ып _1 (як ]= 0.

Метод, предлагаемый в данной работе, основан непосредственно на анализе количеств повторений (2) различных комбинаций бит, входящих в выражение для переходных вероятностей (4). Он заключается в сравнении переходных вероятностей вида (4), у которых длина битовой последовательности в условии различается на 1 и остальные биты условной части совпадают между собой. Сравнение осуществляется с помощью дискриминирующей функции для биномиального распределения [12] следующим образом.

По заданной выборке последовательно оцениваются переходные вероятности (4) порядка к от 1 до к0, где к0 > М. Между соответствующими переходными вероятностями моделей соседних порядков рассчитывается значение дискриминирующей функции

который находится слева, соответствует последовательности независимых одинаково распределенных случайных бит. Узлы, находящиеся на одном уровне, соответствуют марковскому процессу, порядок которого равен номеру уровня. Номер уровня определяется количеством бит предыстории, стоящих в аргументе условной вероятности. Данная иллюстрация получена по выборке длиной 5 • 105 бит, представляющей собой реализацию марковской цепи третьего порядка (М = 3).

Рассмотрим переходную вероятность для некоторой комбинации бит в марковской модели текущего порядка к и соответствующую ей пару переходных вероятностей в марковской модели порядка к + 1. Если к > М, то учет еще одного бита предыстории приведет к тому, что переходные вероятности марковской модели порядка к + 1 будут (в идеальном случае) совпадать с соответствующими им переходными вероятностями марковской модели порядка к, а значение дискриминирующей функции (5) будет мало. Это можно наблюдать на рис. 1 между переходными вероятностями третьего и четвертого порядка. В противном случае, когда 0 < к < М, учет дополнительного бита предыстории существенно изменит значения переходных вероятностей

где

d (да1,

т1 = Nn

2 ) =

ш1+1 т2+1

п1 +2

П2 + 2

+1

(ш1 + 1)(п1 - ш1 +1) (ш2 + 1)(п2 - ш2+1) Г ш1 +1

(п1 + 2) (п1 + 3) (п2 + 2) (п2 + 3) ^ п1 + 2

(5)

п2 2

= N. (>,(к *‘)*'),

аг ■),

п2 = N,

п1 = К.

К достоинствам дискриминирующей функции (5) можно отнести те факты, что ее значение лежит в интервале от 0 до 1, в выражении (5) отсутствует операция логарифмирования, что исключает вычислительные трудности, возникающие при стремлении аргумента логарифма к нулю, характерные для алгоритмов на основе анализа поведения энтропии [4-6].

Для каждой пары моделей соседних порядков к и к +1 получается всего 2к1 значений дискриминирующей функции. Иллюстрация этой вычислительной процедуры в виде графа приведена на рис. 1. Граф представляет собой дерево, в узлах которого приведены значения переходных вероятностей и количества соответствующих комбинаций бит, через которые эти вероятности вычисляются по формуле (4). На ребрах, соединяющих узлы графа, приведены значения дискриминирующей функции (5), рассчитанной на основе величин, приведенных в узлах на концах ребра. Корневой узел дерева,

и значение дискриминирующей функции (5) будет велико.

В качестве критерия, по которому производится оценка марковского порядка исследуемого двоичного процесса, будем использовать среднее значение дискриминирующей функции (5), усредненное по всем 2к+1 ее значениям:

1

d (к) =

к+1

I d N к*1

N

п-1 *4

N к(к+1)+1) N„-1 кк+1))

(6)

Зависимость среднего значения дискриминирующей функции от предполагаемого порядка марковской цепи показана на рис. 2, где первые четыре точки отражают ситуацию, приведенную на рис. 1. Величина М является оценкой порядка марковской цепи, если выполняются следующие условия:

ё (к) > А

ё (к) < А, к > М .

Из анализа представленной на рис. 2 зависимости можно сделать вывод, что при к < М = 3

к < М.

(7)

2

п ,ш ,п

2

ш

ш2 =

а

Рис. 1. Граф (дерево), иллюстрирующий вычисление дискриминирующей функции

Рис. 2. Зависимость среднего значения дискриминирующей функции от предполагаемого порядка марковской цепи

Рис. 3. Вероятность правильной оценки порядка марковской цепи предложенным методом в зависимости от порога для марковских цепей второго порядка длиной 1000 бит

среднее значение дискриминирующей функции больше порога Д = 0.5, а при к > М среднее значение дискриминирующей функции меньше этого порога. Порог Д является параметром предложенного метода и должен быть выбран таким, чтобы минимизировать ошибку определения порядка марковской модели.

Для случая когда дискриминирующая функция (5) используется в процедурах проверки гипотезы и принятия решения, зависимость свойств от величины порога изучена в [4].

В данной работе используется среднее значение дискриминирующей функции (6) и свойства предложенного алгоритма в зависимости от величины порога Д определяются по результатам компьютерного моделирования.

Результаты и обсуждение

На рис. 3 представлена зависимость вероятности правильной оценки порядка марковской цепи Рг предложенным методом от величины

Длина выборки п

Рис. 4. Вероятность правильной оценки порядка марковской цепи в зависимости от длины выборки для марковских процессов третьего порядка

Длина выборки п

Рис. 5. Вероятность правильной оценки порядка марковской цепи в зависимости от длины выборки для марковских процессов четвертого порядка

порога Д. Ошибки, как в сторону завышения, так и в сторону занижения на любую величину порядка марковской цепи, учитывались одинаково. Зависимость получена по реализациям различных марковских процессов второго порядка длиной 103 бит. Усреднение производилось по 100 выборкам для 50 распределений, каждая точка на графике получена усреднением по 5 • 103 выборкам. Значения порога варьировались от 0.05 до 1 с шагом 0.05. Анализ зависимости на рис. 3 показывает, что для процесса второго порядка при значении порога Д в интервале от 0.3 до 0.5, с вероятностью 0.9 и выше оценка порядка марковской цепи будет верной. Результаты компьютерного моделирования для марковских цепей третьего порядка дают интервал оптимальных значений порога от 0.3 до

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.4, для четвёртого порядка — от 0.25 до 0.35. Таким образом, интервалы оптимальных значе-

ний порога Д для исследованных процессов пересекаются и можно рекомендовать выбирать порог Д = 0.35.

На рис. 4 и 5 приведены зависимости вероятности правильной оценки порядка марковской цепи от её длины. По вертикальной оси отложена вероятность правильной оценки порядка марковской цепи, по горизонтальной оси - длина выборки (кривая ё - предложенный метод, кривая А1С - метод на основе информационного критерия Акаике, кривая В1С - метод на основе информационного критерия Байеса).

Значения на графиках, получались следующим образом. Генерировалось по 20 случайных распределений каждого порядка. По каждому распределению генерировалось по 20 реализаций, которые подвергались анализу. Таким образом, каждая точка на графиках получена усреднением по 400 выборкам. Значение порога

было выбрано в соответствии с результатами проведенного исследования равным 0.35. На графиках указаны интервалы погрешностей, рассчитанные для доверительного уровня, равного 0.99.

Анализ рис. 5 показывает, что предложенный метод в данных условиях с учетом погрешностей по эффективности сравним с методом, основанным на информационном критерии Байеса, и несколько превосходит метод, основанный на информационном критерии Акаике, уже для длины выборки от 600 бит. Анализ рис. 5 показывает, что метод, основанный на информационном критерии Акаике, оказывается более предпочтительным при малых длинах выборок, а при длине выборок от 600 бит эффективность всех трех методов становится примерно одинаковой в пределах погрешностей. Вычисление критерия в предложенном методе не сопряжено с трудностями, характерными для методов, основанных на информационных критериях Акаике и Байеса, при стремлении аргумента логарифма к нулю.

Таким образом, в работе предложен метод оценивания порядка двоичной марковской цепи на основе дискриминирующей функции для биномиального распределения. Исследованы свойства метода в зависимости от величины порога принятия решения, установлен оптимальный диапазон значений порога. Проведено сравнение эффективности предложенного метода с методами на основе информационных критериев Акаике и Байеса.

Список литературы

1. Карлин С. Основы теории случайных процессов. М.: Мир, 1971.

2. Баруча-Рид А.Т. Элементы теории марковских процессов и их приложения. М.: Наука, главная редакция физико-математической литературы, 1969.

3. Романовский В.И. Дискретные цепи Маркова.

М.-Л.: Государственное издательство технико-

теоретической литературы, 1949.

4. Коньков Е.А., Солдатов Е.А., Морозов О.А. // Вестник Нижегородского государственного университета им. Н.И. Лобачевского. Сер. Радиофизика. Вып. 1 (3). Н. Новгород: Изд-во ННГУ, 2005. С. 148-155.

5. Peres Y., Shields P. // arXiv.org — ar-Xiv:math. ST/0506080 v1.

6. Merhav N., Gutman M., Ziv J. // IEEE Transactions on Information Theory. 1989. V. 35, № 5. P. 1014-1019.

7. Akaike H. // IEEE Transactions on Automatic Control. 1974. V. AC-19, № 6. P. 716-723.

8. Tong H. // Journal of Applied Probability. 1975. V. 12. P. 488-497.

9. Csizar I., Shields P. // The Annals of Statistics. 2000. V. 28, № 6. P. 1601-1619.

10. Schwarz G. // The Annals of Statistics. 1978. V. 6. № 2. P. 461-464.

11. Finesso L., Liu Ch.-Ch., Narayan P. // IEEE Transactions on Information Theory. 1996. V. 42, № 5. P. 1488-1497.

12. Бурланков Д.Е., Коньков Е.А. // Труды РНТОРЭС им. А.С. Попова. Серия: Цифровая обработка сигналов и ее применение. Вып. IX-2. М.: РНТОРЭС, 2007. С. 449.

APPLICATION OF DISCRIMINANT FUNCTION IN THE ORDER ESTIMATION PROBLEM

OF A BINARY MARKOV CHAIN

S.A. Avdashov, E.A Konkov

A method of binary Markov chain order estimation based on a discriminant function for a binomial distribution has been proposed and its efficiency has been studied. The efficiency of the method has been compared with those based on Akaike and Bayesian information criteria. The results of this comparison are presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.