Научная статья на тему 'Синтез и анализ иерархического правила принятия статистических решений'

Синтез и анализ иерархического правила принятия статистических решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
169
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКОЕ РЕШЕНИЕ / РАДИОМОНИТОРИНГ / БАЙЕСОВСКОЕ ПРАВИЛО

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Русанов В. Э.

Получен алгоритм принятия статистического решения по предварительным противоречивым решениям, с учётом априорных оценок их достоверности. Данная постановка задачи отличается от традиционной тем, что обрабатываемые отсчёты-решения имеют различные характеристики достоверности, которые заданы в виде вероятностей ошибок первого и второго рода. Другая особенность данной работы в том, что синтезируемое решающее правило позволяет комплексировть решающие правила более низких уровней в иерархическом порядке, поскольку итоговое решение принимается по результатам обработки серии предварительных статистических решений. В работе решена задача анализа данного иерархического правила. Получены формулы вероятностного распределения байесовской решающей статистики логарифма отношения правдоподобия, определены вероятности ошибок 1 и 2 рода. Данный подход к комплексному объединению алгоритмов принятия статистических решений применим для проектирования радиотехнических систем, в частности, систем радиомониторинга, а также для построения алгоритма взвешенной обработки данных экспертного опроса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Русанов В. Э.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез и анализ иерархического правила принятия статистических решений»

Синтез и анализ иерархического правила принятия статистических решений

Ключевые слова:

статистическое решение, радиомониторинг, байесовское правило.

Получен алгоритм принятия сттистического решения по предварительным противоречивым решениям, с учётом априорных оценок их достоверности. Данная постановка задачи отличается от традиционной тем, что обрабатываемые отсчёты-решения имеют различные характеристики достоверности, которые заданы в виде вероятностей ошибок первого и второго рода- Другая особенность данной работы в том, что синтезируемое решающее правило позволяет комплексировть решающие правила более низких уровней в иерархическом порядке, поскольку итоговое решение принимается по результатам обработки серии предварительных статистических решений. Решена задача анализа данного иерархического правила. Получены формулы вероятностного распределения байесовской решающей статистики логарифма отношения правдоподобия, определены вероятности ошибок 1 и 2 рода. Данный подход к комплексному объединению алгоритмов принятия статистических решений применим для проектирования радиотехнических систем, в частности, систем радиомониторинга, а также для построения алгоритма взвешенной обработки данных экспертного опроса.

Русанов В.Э.,

к.т.н., доц. МТУСИ, rvvred52@rambler.ru

Пусть имеется набор данных |, состоящих из двоичных отсчётов-решений, подтверждающих одну из двух альтернативных гипотез результатов испытаний: Н1 либо //(). Содержание этих двух взаимоисключающих гипотез - традиционно принятое в статистической радиотехнике. Гипотеза И^ означает, что в результате испытаний произошло некоторое событие А, а На - что данное событие не происходило. Результаты

испытаний - это статистические решения, полученные из различных источников информации по самым различным правилам (например, данные аппаратуры обнаружения, мнения экспертов) и принимающие значения:

{1 подтверждение //,

О подтверждение //(|

Пусть имеется оценка достоверности принятия решений у. в виде вероятностей ошибок 1 и 2-го рода: р. и

ц. соответственно.

Для объединения равноправных решений с равными вероятностями ошибок байесовское решение [1,2] представляет собой мажоритарное суммирование и сравнение

с порогом: у у ~с ■ Если отсчёты неравноправны, то

м <

суммирование, вероятно, должно быть взвешенным. Получению байесовского решающего правила по серии решений различной достоверности и посвящена данная работа.

Для синтеза байесовского решающего правила для данного случая определим отношение правдоподобия наблюдаемой выборки противоречивых решений {у^У21—>Уп}' К0Т0Рые будем полагать независимыми.

Числитель и знаменатель отношения правдоподобия — условные вероятности обрабатываемой выборки отсчётов-решений при условии справедливости гипотез Но и Н|, соответственно.

Условные распределения (вероятности

Р[ух,у2,...,у„\Н0) и р[ух,у2,...,уп\Н,)) наблюдаемой выборки отсчётов-решений у,,у-,,...,у„ определяются по соответствующим вероятностям ошибок. Это вероятности принятия одного из двух решений для гипотез Н0 И я,.

Пусть справедлива гипотеза Н{) • Вероятности принятия ешений у. следующие:

а) р. - вероятность «ложной тревоги» (у. = ]);

б) 1 — р. вероятность правильного решения (у. — 0)

об отсутствии события А, то есть принятия данной гипотезы #().

Таким образом, обрабатываемые отсчёты-решения у. = 0 или у! = 1 имеют следующее распределение вероятностей:

[ 1 - р, для у,• = О Р, для у, = 1 Данное распределение также можно выразить единой формулой:

Р[у, |#0) = Рр \\~Pi’ поскольку

/>(о|я0)=а°(1-а),=1-Р/

/>(11//о) = Л* (1-Р,)0 = Р/

Рассмотрим противоположную гипотезу Н, о том,

что произошло заданное событие А. В этой ситуации решение у. может быть правильным или неправильным

со следующими вероятностями.

а) - вероятность ошибки 2 рода («пропуск события»);

б) \ — Ц вероятность правильного решения. Обрабатываемый отсчёт-решение, подтверждающий

гипотезу //| равен 1 (у. =1). В случае, если отсчёт-решение подтверждает гипотезу его значение

у. =0. Таким образом, условное распределение вероятностей:

V 1 '/ [1-9, Для .у, =1

Распределение можно выразить единой формулой:

р(у! Iя,) = я)~У‘ • (1 ~Я, )У' ’ П0СК0ЛЬКУ /’(о|я|)=^-°-(1-^)°=9<

/>(1|Я|) = <7‘-'-(1-А),=1-А.

Пусть обрабатываемые решения статистически независимы. Байесовское решающее правило принятия общего решения по частным (у.\ строится в виде отношения

правдоподобия.

Сформируем отношение правдоподобия, для чего определим вероятность одного конкретного набора решений для обеих возможных гипотез. Решения считаются независимыми, поэтому их вероятности перемножаются. Гипотеза И{) ■

Р{угу2,...,уп/Н0) = у\Р?(\-Р:)'-у1

/=Г

Гипотеза Н,-

Р(УгУ2’-’Уп1 нх)=\\ч)~у>{\-Ч1У‘

»=г

Логарифм отношения правдоподобия

1-9;

Р(у^у2...Уи*Н0,

1іЯжл_,>и—Ни V

п, «

1=11 Рі

Ч,

1-л

=Х>7 - £1п +2>, 1п

Я // // 1-1 /|/ #-1

Таким образом, решающее правило - взвешенная сумма решений (д>, =0 или у. = 1 )> которая сравнивается с порогом.

Если Ь>С принимается // , при Ь < С - Н() Весовые коэффициенты [,-) ^ ~Р/)0 ~Я<) комплексно учи-

Я1Р1

тывают достоверность мнений экспертов или методов принятия решений. В числителе - вероятности правильных решений, в знаменателе - ошибочных. Помимо взвешенной суммы в байесовское правило входит посто-

" Ч,

которое учитывается

янное смещение Сп =-У 1п -

" и 1 -Р,

при вычислении порога принятия решения.

Помимо отношения правдоподобия в байесовское правило решения должны входить априорные вероятности гипотез Р11,Р1, а также оценки «потерь» от решений. «Потери» от правильных итоговых решений будем считать нулевыми: П,, =0; П(|()= О.-

Потери от неправильных итоговых решений («ложная тревога» и «пропуск события», соответственно): П0|=1; П|(| = 1 - примем равными 1.

Байесовское правило принятия решения в общем случае сформулировано для плотностей вероятности. И^///,)1/»(П„,-П0„)

1У(х/Н0) />(П|0-ПМ)

Здесь р и Рг - априорные вероятности справедливости двух гипотез Н И Н] ■

В нашем случае дискретных случайных величин отношение условных плотностей есть отношение условных вероятностей:

Р(у„у2,...,уп/ Н,) ^ Р0(П0, -Пц,) Р(у],у2,...,уп/Н{) ~ /?(П10-Пп)

Определим порог в правой части байесовского правила и возьмём от него логарифм.

с_1п^о(П0,-П00)_ 1-/»

ВДо-П,,) Рх

В результате получили итоговое решающее правило принятия решения, позволяющее оптимально объединить целый набор противоречивых решений. Принимается гипотеза //(. если

ЧіРі

->У1п-^+1п-и 1 -Рі

{'-Рі)

1=1

В противном случае принимается гипотеза И• Случай равенства может быть отнесён и к случаю принятия этой гипотезы, если специфика приложения диктует соответствующие презумпции.

Для решения задачи анализа или оценки эффективности синтезированного алгоритма определим вероятности ошибок полученного решающего правила. Для этого нужно установить распределение статистики логарифма отношения правдоподобия в левой части решающего правила [3,4]. Для наглядности рассмотрим конкретный пример.

Пусть имеются п — 3 источника информации, дающие сведения об одном и том же событии с достоверностью, заданной в виде вероятностей:

Порядковый номер источника Вероятности ошибок источников информаци Коэфф. решающего правила

і 1 рода р„ Н0 2рода д,; Н, С,

1 0.15 0.12 3,727

2 0.1 0.11 4.288

3 0.08 0.09 4.756

Логарифм отношения правдоподобия как сумма конечного числа дискретных случайных величин также имеет дискретное распределение. В данном случае логарифм отношения правдоподобия - это сумма трёх слагаемых, каждое из которых может принимать всего два значения. Следовательно, логарифм отношения правдоподобия может принимать 2" = 8 дискретных значений. В случае гипотезы Н(> слагаемые логарифма отношения правдоподобия равны:

Г С,, с вероятностью

1 1 0 с вероятностью I - с]/

где с _|ПС-

9/А

В случае гипотезы Н| слагаемые логарифма отношения правдоподобия равны:

С, с вероятностью 1 — Р1

0 с вероятностью р.

Для гипотезы Но все дискретные значения логарифма отношения правдоподобия показаны в таблице, приведённой ниже. Вероятности, соответствующие этим значениям, вычисляются как произведения вероятностей для входящих в них независимых слагаемых:

Значение логарифма отношения правдоподобия Вероятность логарифма отношения правдоподобия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 0 (1ч1,) а-я,) (1-а,) 0.712

С, 3.727 ЧіС'Чг) (І-Яі) 0.0972

С2 4.287 (І-Яі) 4:0-41) 0.088

С, 4.756 <І-Яі) Ч> 0.07048

С,+С2 8.014 Чі ЧА'-Чі) 0.012

С2+С, 9.043 (І-Чі) чя> 0.00871

с,+с, 8,483 4,0-42)4, 0.009612

с,+с:+с, 12,7 7 Чі 42 Чі 0.00119

Для гипотезы Н| вероятностное распределение лога-

рифма отношения правдоподобия:

Значение логарифма отношения правдоподобия Вероятность логарифма отношения правдоподобия

0 0 Рі Р:Рз 0.0012

С, 3.727 (І-Рі) РіРз 0.0068

С: 4.287 Рі(І-Р2)Рі 0.0108

С, 4,756 Рі Р’(І-Рз) 0.0138

С,+С2 8,015 <І-Рі) <І-Р2)Рі 0.0612

с2+с, 9,044 Рі(1-Р2> <І-Рі) 0.1242

с,+с, 8.483 (І-Рі) Р_у/і-Р_<) 0.0782

С|+С2+С} 12.77 ч-Р 1 0.704

получены соответствующим тестированием экспертов. В частности, данная методика взвешенной обработки данных экспертного опроса с предварительным тестированием экспертов уже использовалась в учебном процессе при изучении байесовоского правила принятия статистических решений в рамках курсов «Статистическая теория радиотехнических систем» и «Теоретические основы статистической радиотехники» в Московском техническом университете связи и информатики.

0.4

Порог принятия решения при априорных вероятностях гипотез

Р0 = Р{= 0,5 для рассмотренного примера равен:

С0 = - V 1п ——6,383

к 1 -р,

Порог принятия решения показан на рис.1 вертикальной штрих-пунктирной линией. Для данного порога можно определить вероятности ошибок исследуемого решающего правила:

а= £ии|Я„) = 0,0!2 + 0.009612 + 0,00871 + 0.00119 = 0.03152 /?= X 1Т( £ | //,) = 0.0012 + 0.0068 + 0,0108 + 0,0138 = 0,0326

1<С0

Результаты анализа показали, что вероятность ошибок итогового решения уменьшилась в примерно 3-4 раза по сравнению с вероятностями ошибок исходных статистических решений.

Данный подход к комплексному объединению алгоритмов принятия статистических решений применим для проектирования радиотехнических систем, в частности, комплексов радиомониторинга. В подобных комплексах выявления сигналов, например, при поиске сигналов с заданными параметрами либо сигналов несанкционированной связи, используются сложные многоэтапные процедуры обработки сигнала (спектральная идентификация, демодуляция, селекция по типу и номиналам параметров модуляции). Для каждого из перечисленных алгоритмов выявления искомого сигнала обычно имеются расчётные и экспериментальные данные оценки вероятностей ошибок, что является достаточным для синтеза сложных решающих правил, оптимальных согласно байесовскому подходу.

Другое приложение полученных результатов - возможность построения алгоритма взвешенной обработки данных экспертного опроса. Вероятностные коэффициенты для байесовского решающего правила могут быть

; |

І і

\У<1 -|Н„) 1 і \У(Ь н.)

1 і

і і

1 і

1 і і

г і і

1 і і

1 1,1 ( і 1 с і: і: і

2 4 6 8 10 12

Рис. 1. Вероятностные распределения логарифма отношения правдоподобия для гипотез Но и Н|

В практике использования классического байесовского правила принятия статистических решений встречаются известные трудности, связанные с отсутствием и невозможностью получения некоторых априорных данных. В практических приложениях бывает необходимо использовать не только байесовский, но и другие критерии оптимальности решающего правила, в частности: критерий Неймана Пирсона, идеального наблюдателя, максимума апостериорной вероятности, минимаксный, последовательный. Все эти критерии применимы для использования в составе решающего правила, рассмотренного в данной работе.

Литература

1. Левин Б.Р. Теоретические основы статистической радиотехники. - М.: Радио и связь, 3-е издание, 1989. - 653 с.

2. Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем: Учеб. пособие для вузов. - М.: Радио и связь, 2004. - 608с.

3. Перов, А. И. Статистическая теория радиотехнических систем. - М.: Радиотехника, 2003. - 400 с.

4. Худяков Г. И. Статистическая теория радиотехнических систем : учеб. пособие для студ. высш. учеб. заведений / Г.И. Худяков. - М. : Издательский центр «Академия», 2009. -400 с. '

i Надоели баннеры? Вы всегда можете отключить рекламу.