Научная статья на тему 'Автоматическое распознавание случайных сигналов по критерию минимального информационного рассогласования с переспросом'

Автоматическое распознавание случайных сигналов по критерию минимального информационного рассогласования с переспросом Текст научной статьи по специальности «Математика»

CC BY
48
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЕ СИГНАЛЫ / СТАТИСТИЧЕСКАЯ КЛАССИФИКАЦИЯ / СИНТЕЗ ОПТИМАЛЬНОГО АЛГОРИТМА / ИНФОРМАЦИОННОЕ РАССОГЛАСОВАНИЕ / ЗАДАЧА РАСПОЗНАВАНИЯ РЕЧИ / CASUAL SIGNALS / PROBLEM OF STATISTICAL CLASSIFICATION / SYNTHESIS OF OPTIMUM ALGORITHM / INFORMATION MISMATCH / PROBLEM OF RECOGNITION OF SPEECH

Аннотация научной статьи по математике, автор научной работы — Савченко В. В., Акатьев Д. Ю.

Ставится и решается задача оптимального распознавания случайных гауссовских сигналов на основе критерия минимального информационного рассогласования выборочных распределений в метрике Кульбака–Лейблера. Предложен новый алгоритм с обнаружением и отбраковкой сомнительных решений, которые не отвечают асимптотическим свойствам оптимальной решающей статистики. Этим реализуется принцип "переспроса", т. е. повторения сигналов при их нечетком распознавании. Рассмотрен пример практического применения алгоритма в задаче распознавания речевых сигналов. Показано, что благодаря переспросу в моменты отбраковки сомнительных решений качество распознавания существенно повышается.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Automatic recognition of casual signals by criterion of the minimal information mismatch with reasking

The problem of optimum recognition of casual normal signals is put and solved on the basis of criterion of the minimal information mismatch of selective distributions in metrics Kullback–Leibler. The new algorithm with detection and rejection of doubtful decisions which do not answer asymptotical properties of optimum solving statistics is offered. It realizes a principle "reasking", i. e. recurrences of signals at their indistinct recognition. The example of practical application of algorithm in a problem of recognition of speech signals is considered. It is shown, that thanking to reasking at the moment of rejection of doubtful decisions quality of recognition essentially raises.

Текст научной работы на тему «Автоматическое распознавание случайных сигналов по критерию минимального информационного рассогласования с переспросом»

Известия вузов России. Радиоэлектроника. 2006. Вып. 1======================================

V. B. Antipov, I. V. Antipov, M. G. Zlepushkov

Sibirian physical and technical institute associated with Tomsk state university

Steady-states in a system of coupled oscillators synchronized with phase-splitted external signal

For a system of arbitrary number N of coupled oscillators synchronized with phase-splitted single tone signal, hysterezis is found to exist in vector sum dependence upon external signal amplitude. Synchronization bandwidth is proportional to N-th power of signal amplitude.

Synchronization, phase demodulator, signal processing

Статья поступила в редакцию 1 июня 2005 г.

УДК 621.391:519.72

В. В. Савченко, Д. Ю. Акатьев

Нижегородский государственный лингвистический университет

Автоматическое распознавание случайных сигналов по критерию минимального информационного рассогласования с переспросом

Ставится и решается задача оптимального распознавания случайных гауссовских сигналов на основе критерия минимального информационного рассогласования выборочных распределений в метрике Кульбака-Лейблера. Предложен новый алгоритм с обнаружением и отбраковкой сомнительных решений, которые не отвечают асимптотическим свойствам оптимальной решающей статистики. Этим реализуется принцип "переспроса", т. е. повторения сигналов при их нечетком распознавании. Рассмотрен пример практического применения алгоритма в задаче распознавания речевых сигналов. Показано, что благодаря переспросу в моменты отбраковки сомнительных решений качество распознавания существенно повышается.

Случайные сигналы, статистическая классификация, синтез оптимального алгоритма, информационное рассогласование, задача распознавания речи

Задача распознавания случайных сигналов относится к числу классических задач статистической обработки информации. В рамках универсального байесовского подхода она обычно сводится к задаче статистической классификации. Принцип минимума информационного рассогласования является одним из наиболее эффективных инструментов для ее решения, что было показано, в частности, в работах [1]-[3] на целом ряде практических примеров. Далее дается развитие указанного принципа на задачи с обнаружением и исправлением ошибок распознавания.

Задача статистической классификации. Пусть Хг = (хг 1, хГ2, , хг Мг) ,

г = 1, Я - набор многомерных (размера п) повторных (объема Мг) независимых выборок хг у = |хг у (1), хг у (2), ..., хг у (пиз Я (Я > 2) случайных гауссовских процессов Рг = N (Кг ) с нулевым средним значением каждый и неизвестными автоковариационны-

20

© В. В. Савченко, Д. Ю. Акатьев, 2006

======================================Известия вузов России. Радиоэлектроника. 2006. Вып. 1

ми (п х п) -матрицами (АКМ) Кг = Б^ (хг 7 х^ 7 ), где т - символ транспонирования векторов; п = 1, 2, ...; ] - номер цикла наблюдения над г-м случайным процессом; Бх -символ математического ожидания. Пусть Х0 - аналогичная по структуре выборка (сигнал) объема М0 из входного (анализируемого) процесса, отражающая текущее состояние объекта с неизвестным распределением Р е {Рг}. Задача распознавания сигнала Х0 сводится в таком случае к задаче ^-альтернативной проверки сложных статистических гипотез о неизвестном законе его распределения:

Щг : Р = Рг, г = 1Я . (1)

Рассмотрим эту задачу в наиболее простом варианте для случая дихотомии (Я = 2): проверяется сложная гипотеза Щ : Р = Р против сложной альтернативы Щ : Р = Р в отношении гауссовского распределения Р = N (К) с неизвестной АКМ К или К2 . Воспользуемся для ее решения асимптотическим минимаксным критерием отношения правдоподобия [1]. В таком случае решение в пользу гипотезы Щ будет приниматься по выборке из

объединенного выборочного пространства X = {XI, Х2, Х0} при выполнении условия

БирБир [Р (Х|Щ )]

Щ (X): X (X) = К1 К2 чп > 1,

БирБир [р (XIЩ2 )]

К1 К2

или, в развернутой форме,

Бир

р ( Xo| Щ ) Р ( X!)] вир [ р ( X2 )]

Щ (X): Л,Ш= м м г , м >1, (2)

8ир [Р (Xo| Щ ) Р (X2 )] Бир [Р (X1)] К2 К1 где символ " Бир" обозначает верхнюю границу каждой функции на множестве допустимых АКМ; р(Xo\Жг) - функция правдоподобия сигнала Xo при справедливости гипотезы Щг ; Р (Xr) - функция правдоподобия г-го сигнала; г = 1,2.

Принцип минимума информационного рассогласования. Учитывая независимость наблюдений {хг 7} в совокупности, запишем систему равенств:

1п Р (X01 Щг ) = -0.5М0 [1п |КГ | + 1х(£0К-1) + п 1п (2п)] , (3)

1пР(Xг) = -0.5Мг [1п|Кг| + 1х(8ГК-1) + п 1п(2л)], г = 1; 2, (4)

м-

где 8- = М-1 ^ х- 4 х| 4 - оценка максимального правдоподобия для АКМ К- по выбор-

7=1

ке X- ; - = 0;2; 1г(Кг ) и |Кг| - след и определитель матрицы Кг .

Рядом преобразований [1] из выражения (4) будем иметь

sup[lnp(Xr)] = -0.5Mr [ln\Sr\ + nc], r = 1,2, (5)

Kr

где c = ln (2п) +1 = const. Здесь учтено, что верхняя граница в (4) достигается при равенстве АКМ Kr = Sr - строго в соответствии с принципом максимального правдоподобия. Аналогично, для всех других величин из (2) через выражения (3) и (4) получим

sup [ln p (Xo | Wr ) p (Xr )" =

K r

= -0.5 {(M0 + Mr ) [ln | S0r | + n ln ( 2n )] + M0tr ( S0 S-) + Mr tr ( SrS0"r:)} =

= -0.5 (M0 + Mr ) [ln |S0r| + nc ], r = 1,2, (6)

где S0r = SqM0/(M0 + Mr ) + SrMrj(M0 + Mr ) - оценка максимального правдоподобия для АКМ Kr, вычисленная по объединенной выборке наблюдений X0r = {X0, Xr} суммарного объема M0 + Mr.

Подставив выражения (5) и (6) в (2), при учете естественного равенства Mr = М Vr < R в (4) (но M0 * М) после ряда несложных преобразований получим искомый алгоритм распознавания двух случайных сигналов:

W1 (X): 0.5[(M0 + M)ln|S01| - (M0 + M)ln|S02| -Mln \S.\ + Mln |S21]> 0 или, в эквивалентном виде,

W1 (X): MP101 + M0P0,01 < MP2,02 + M0P0,02 . (7)

где Pk0r = 0.5 - ln |Sk| + ln |S0r| + tr ( SkS—.1 ) + n - величина информационного рассогласования по Кульбаку-Лейблеру [4] между двумя гипотетическими гауссовскими распределениями N (Sk ) и N (Sor ) с АКМ Sk и Sor соответственно; к = 0,2; r = 1,2.

Распространим по индукции решающее правило (7) на случай произвольного числа альтернатив R > 2 в задаче различения сигналов (1), в результате будем иметь

Wv (X): Mpv ov + MoPq ov < MPr,0r + MoPo, or; vr < R; r * V < R. (8)

В наиболее актуальном для практики случае Mq/M << 1, когда Vr : pr or ~ 1, а Po or ~ Po r, из (8) придем к упрощенному алгоритму оптимального распознавания сигналов по критерию минимума информационного рассогласования (МИР):

Wv (X) : Po, v <Po, r; Vr < R; r *v< R, (9)

где

Po, r =P (P/Pr) = 0.5 [ln| Sr| - ln | Sq\ + tr ( SqS-1 ) - n ] (10)

- величина информационного рассогласования (ВИР) эмпирического распределения P = N (Sq ) относительно каждой из R рассматриваемых гипотез Pr = N (Sr ), r = 1, R.

22

Утверждение 1. В условиях введенных ограничений в задаче распознавания сигналов (1) критерий МИР в формулировке (9), (10) эквивалентен классическому критерию максимального правдоподобия (МП) в его адаптивном варианте реализации.

Доказательство прямо следует из сопоставления классического результата теории оптимальной обработки гауссовских сигналов по критерию МП [2]:

Ж (X): 1п|Кг\ + ЦКг

-1

= шт; г = 1, Я

Г =У г

(11)

с критерием МИР. В адаптивном байесовском варианте реализации решающего правила МП из (11) при равенстве Кг = 8Г получим точный эквивалент (9), (10).

Анализ эффективности. Эффективность синтезированного алгоритма (9) может быть охарактеризована набором условных вероятностей перепутывания каждого у-го и

(12)

г- :

ау,г = Р(Ж (X)Ж) = Р[р(Р/Ру) > р(Р/Рг )|Ж ]; v ф г = \Я.

К сожалению, строгий анализ данного выражения в общем случае наталкивается на трудности вычислительного характера. Поэтому упростим задачу, сводя ее к асимптотическому случаю Мо >> 1. Рассмотрим отдельно каждый из элементов под знаком вероятности Р (•) в (12).

Известно [4], что при справедливости гипотезы Жу статистика

Р

(РР)

Р,) = 0.5

1п | - 1п| ^ + 1г (^ ) -

п

= \2М{

1-

2п2 +3п-1 6М0 ( п +1)

1-1

Хт

с точностью до константы \ 2М(

2п2+3п-1 6М0 (п +1)

-1

6М0 2п

асимптотически распре-

делена как Хтп -случайная величина Пирсона с т = п (п +1)/2 степенями свободы.

С другой стороны, при М0 ^ ^ выполняется асимптотическое равенство

п.н.

^р (Ру/Рг) [обозначение <п.н.> соответствует сходимости с вероятностью

Р

( Р/Рг )

Ж

"единица" (или выражению "почти наверное") к величине информационного рассогласования

р ( Ру/ Рг ) = 0.5

(13)

1п\К I- 1п|К I + ЫК К-1-п

_ I г\ IV XV г ) _ между распределениями у-го и г-го сигналов]. На основании изложенного из (12) в асимптотике будем иметь

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

«У,г = Р [*т > 2р (Ру/ Рг ) Ь ]; V* г = 1Я, (14)

где Ь = (3М0 - п

)/3.

Чем больше "расстояние" (13) между двумя рассматриваемыми распределениями, тем сложнее их перепутать при распознавании сигналов по конечной выборке наблюде-

3

1

V

ний. При увеличении объема выборки М0 до бесконечности вероятность ошибочных решений в соответствии с (14) в пределе уменьшается до нуля, что означает оптимальное решение поставленной задачи (1) в асимптотике. Преобразуем (14) в более удобный для

вычислений вид. При п >> 1 величина Хт/(2Ь) хорошо аппроксимируется гауссовским 2Ь),т/(2Ь2)] = N(т,2т2/т), где т - математическое ожидание (МО). В

законом N

m

результате вероятность перепутывания (14) приводится к виду

_ 1

av,r _ 2

1 -ф

р (Pvi Pr) - m

2m 2/m

(15)

где Ф (•) - табулированный интеграл вероятности [5].

Результаты математического моделирования. Для подтверждения и развития результатов проведенного анализа был поставлен эксперимент по распознаванию двух гауссов-ских сигналов. В качестве таких сигналов использовались авторегрессионные процессы десятого порядка каждый, сформированные из двух независимых "белых" гауссовских шумов с

дисперсиями а2 = const в каскадных линейных схемах из десяти рециркуляторов каждая с коэффициентами Pi и Р2 в цепях обратной связи. Оценки максимального правдоподобия для их АКМ Ki, K2 десятого порядка (n = 10) вычислялись по выборкам наблюдений Х^, X2 одинаковых объемов M = 800, а при оценивании АКМ анализируемого (входного) сигнала Хо использовалась выборка существенно меньшего и переменного объема Mo < 150 . Полученные оценки совместно с правилом (9), (10) и определяли в конечном итоге для каждого отдельного испытания искомое оптимальное решение. Всего таких испытаний с независимыми выборками наблюдений в процессе эксперимента проведено 10 000. При этом все вычисления выполнялись на стандартном ПК типа Pentium-4 со стандартным программным обеспечением. Далее приводятся некоторые полученные результаты.

На рис. 1 показаны две кривые выборочных оценок (по формуле средней частоты) для вероятности перепутывания рассматриваемых АР-сигналов в зависимости от объема M0 анализируемого сигнала при следующих сочетаниях их параметров: Pj = 0.40,

Р2 = 0.42 (кривая 1) и р: = 0.40, р2 = 0.41 (кривая 2). Соответствующие им значения ВИР (13) составили 0.42 и 0.35 соответственно. На этом же рисунке для сравнения представлены две аналогичные теоретические зависимости, рассчитанные по соотношению (14) при равенстве т = 55, соответственно, для первого (кривая 3) и второго (кривая 4) случаев. Из рисунка видно, что в асимптотике при М0 >> 1 результаты

«1,2

^-1

10"

10

i-2

10

,-3

10

-4

10

i-5

90 110

Рис. 1

теоретического и экспериментального анализов хорошо согласуются между собой, причем чем меньше степень информационного рассогласования сигналов (13), тем больше вероятность ошибки при фиксированном объеме М0.

Таким образом, благодаря использованию терминологии критерия МИР удалось достаточно точно отобразить асимптотические свойства оптимального алгоритма в компактной форме (14) и (15).

Еще одно и, по-видимому, наиболее важное преимущество критерия МИР в формулировке (9) затрагивает актуальнейшую проблему контроля надежности принимаемых решений в задачах распознавания образов. Вернемся к рис. 1. Нетрудно увидеть, что при любом конечном объеме выборки наблюдений M0 < да вероятность ошибки перепутывания,

особенно при распознавании близких альтернатив, может достичь значительной величины. Иными словами, в каждом конкретном случае на практике нет никакой гарантии, что принятое оптимальное решение является безошибочным. Более того, остается неясным, насколько такое решение критично к используемым реализациям сигналов. И наконец возникает естественный вопрос, в какой степени объем и состав конкретной выборки достаточны для принятия надежного решения? К сожалению, современная теория распознавания образов не дает исчерпывающего ответа ни на один из поставленных вопросов.

Логика рассуждений совершенно иного рода, отталкивающаяся от строгого информационного критерия МИР, реализуется в идее обнаружения и "отбраковки" всех ненадежных решений по признаку несоблюдения в сомнительных случаях решающей статистикой (10) своих оптимальных асимптотических свойств (14).

Алгоритм с обнаружением ошибок. Предположим, что при принятии решения согласно алгоритму (9) произошла ошибка, т. е. принято решение Wr (X) при справедливости гипотезы Wv, r фу . В соответствии с выражением (14) вероятность такого события av r << 1, как правило, весьма мала, т. е. произошло довольно редкое событие. С другой стороны, если оно все же произошло, тогда (a posteriori) выполняется соотношение р (Р/ Pv ) >р (Р/ Pr ) = min р (Р/ Pr ) Вероятность такого события (a priory) равна

r

Р > 2b min р (РуPr)JJ = ßv r . При малости значения ßv r << 1 предположение об ошибке в решении Wr (X) подтверждается нетипичным характером данной конкретной ситуации. В таком случае первоначальное решение Wr (X) должно быть отброшено из рассмотрения как сомнительное. Вместо него следует получить иное решение, взяв другую, повторную выборку Xo из анализируемого процесса.

Напротив, если полученное значение ßv r сопоставимо с единицей, первоначальное

предположение об ошибке в решении Wr (X) опровергается, и данное предположение поэтому следует отклонить как недостаточно обоснованное.

Таким образом, признаком отбраковки решения W (X) в общем случае может служить соотношение вида P Хт > 2b min р (PjPr) = ß или, что эквивалентно,

min р (PI Pr ) >xm,1-ß/( 2b ), r

где ß - некоторый пороговый (сверху) уровень для априорной вероятности ßv r решения

Wr (X); Xml-ß - квантиль распределения Пирсона с n (n +1)/2 степенями свободы на уровне значимости 1 - ß. Используя рассмотренную ранее аппроксимацию распределения

Пирсона гауссовским законом N [т/(2b), т/(2b2 )] = N ( т ,2т 2/т), получим следующий алгоритм проверки каждого решения по критерию МИР (9) в отношении его надежности:

min р (P/Pr) > zß, r < R, (16)

r

где zß - квантиль распределения N(т,2т2/т) на уровне значимости 1 -ß, ß<< 1. При

выполнении данного условия решение в пользу того или иного сигнала отклоняется как недостаточно обоснованное. Оценив по выборке параметр т гауссовского распределения (формула выборочного среднего), при любом заданном значении параметра т можно автоматически восстановить весь этот закон и легко вычислить его любой квантиль ¿р.

Отметим, что предложенный алгоритм асимптотически инвариантен по отношению к составу распознаваемых сигналов. В этом смысле здесь много общего с идеями последовательного анализа А. Вальда [6]. Отличия правила отбраковки решений (16), причем принципиального характера, состоят в реализации упомянутых идей не на основе отношения правдоподобия, а на основе асимптотически оптимальной решающей статистики в метрике Кульбака-Лейблера.

Выражения (9), (10) и (16) в совокупности определяют искомый алгоритм распознавания случайных сигналов по критерию МИР с обнаружением и отбраковкой возможных ошибок. В зависимости от объема М0 выборок наблюдений, а также порядка п в нем, варьируется ограничение сверху на допустимый уровень минимальной решающей статистики в задаче распознавания образов. Как результат повышается надежность принимаемых решений. Проиллюстрируем изложенное на примере актуальной задачи распознавания речевых сигналов.

Пример применения. Для выяснения практической ценности разработанного алгоритма была рассмотрена задача распознавания десяти изолированных слов - числительных: "нуль", "один", ..., "девять". Задачи подобного рода возникают в информационных системах с голосовым управлением, например, для получения справочной информации, при речевом наборе телефонного номера и других.

В соответствии с формулировкой критерия МИР для каждого числительного фор-

мировался рабочий массив Хг, г = 1, 10, в виде последовательности эквидистантных отсчетов сигнала на выходе микрофона. Для этого использовали персональный компьютер и встроенный АЦП с частотой дискретизации 8 КГц. В дальнейшем каждый речевой сигнал

нормировался по своей средней мощности к некоторому постоянному уровню и для него вычисляли оценку АКМ Sr по формуле второго смешанного момента. Полученные оценки использовались в качестве базы данных (эталонов) для распознавания различных реализаций тех же слов. Анализируемый сигнал Xq с выхода микрофона подвергался обработке по критерию МИР согласно выражениям (9) и (10) при заданном порядке n = 10. При этом обработка велась по каждому слову целиком, а его границы регулировались автоматически по амплитудному признаку. Каждую процедуру повторяли по 100 раз над разными реализациями каждого слова из заранее подготовленного рабочего словаря. Одновременно варьировался и состав базы слов-эталонов. В результате была сформирована база данных из тех реализаций, которые отвечали критерию минимальной суммарной ВИР в пределах множества реализаций из используемого словаря. В целом условия эксперимента не отличались от описанных в работе [3].

В результате были получены следующие данные. Наиболее часто перепутывались слова "нуль" и "восемь" - первое и девятое из распознаваемых слов. Это видно из рис. 2, на

котором показаны L = 100 реализаций минимальной решающей статистики р (Р/р) (кривая 1) в сравнении с соответствующими 100 реализациями статистики р (Р/р) (кривая 2)

при распознавании слова "нуль". Звездочками на оси абсцисс помечены реализации, в которых произошло перепутывание слова "нуль" со словом "восемь". Видно, что всего таких реализаций - пять с номерами 10, 42, 54, 68, 72, т. е. экспериментальная оценка для вероятности перепутывания a^ 9 = 0.05. Оценив по выборке (кривая 1) МО минимальной решающей статистики из (16), получим m = 0.0249. В этом случае для вероятности в = 0.1 при n = 10 по таблицам гауссовского распределения [5] определим пороговый уровень Zp = 0.0635 . Применением после этого алгоритма (16), были исключены все пять первоначальных ошибок. При этом общее число отброшенных реализаций составило 10, или 10% от их суммарного числа. Таким образом, благодаря процедуре отбраковки по правилу (16) удалось кардинальным образом повысить достоверность распознавания речевых сигналов.

Рис. 2

Известия вузов России. Радиоэлектроника. 2006. Вып. 1======================================

Отметим такую деталь: при распознавании всех других слов - числительных (наряду с нулем) оценка МО минимальной решающей статистики т варьировалась в очень узких пределах от 0.02 до 0.03, что говорит о практической инвариантности порогового уровня

по отношению к анализируемым сигналам. Это свойство критерия МИР имеет большое значение с точки зрения его применения. Кроме того, особую ценность рассмотренный пример представляет в том смысле, что распределения речевых сигналов имеют в данном случае явно выраженный негауссовский характер. Но тем не менее предложенный алгоритм показал высокую эффективность в задаче их распознавания. Поэтому можно предположить, что ограничение на закон распределения сигнала в постановочной части данной статьи не является чрезмерно жестким, а все особенности разных сигналов будут сводиться исключительно к выбору оптимального порога .

Кажется, нет никакой разницы в том, по какому алгоритму - (9) или (11) - приняты полученные решения (X), если они совпадают друг с другом автоматически (критерии МИР и МП эквивалентны между собой). Однако на практике ситуация усложняется при неизбежной попытке оценивания качества каждого принятого решения. Здесь выясняется, что критерий МИР по сравнению с МП в своей формулировке (9) содержит важную полезную информацию именно в отношении надежности принимаемых решений. Сначала это было показано при обосновании статистических характеристик качества (14), (15) -при решении весьма нетривиальной, как известно [4], задачи. Еще более наглядно преимущества критерия МИР проявляются в правиле (16) отбраковки сомнительных с точки зрения надежности решений. Рассмотренная задача распознавания речи служит хорошей иллюстрацией к изложенному. Поэтому можно утверждать, что при прочих равных условиях в задачах распознавания случайных процессов применение критерия МИР в ряде случаев существенно более обоснованно по сравнению с классическим критерием МП.

Библиографический список

1. Акатьев Д. Ю., Савченко В. В. Принцип минимума информационного рассогласования при различении случайных сигналов // Изв. вузов России. Радиоэлектроника. 2004. №1. С. 12-17.

2. Савченко В. В. Различение случайных сигналов в частотной области // Радиотехника и электроника. 1997. Т. 42, № 4. С. 426-431.

3. Савченко В. В. Автоматическая обработка речевых сигналов по критерию минимального информационного рассогласования на основе метода обеляющего фильтра // Радиотехника и электроника. 2005. Т. 50, № 3. С. 309-315.

4. Кульбак С. Теория информации и статистика. М.: Наука, 1967. 408 с.

5. Мюллер П., Нойман П., Шторм Р. Таблицы по математической статистике / Пер. с нем.; Под ред. В. М. Ивановой. М.: Финансы и статистика, 1982. 278 с.

6. Вальд А. Последовательный анализ / Пер. с англ.; Под ред. Б. А.Севастьянова. М.: Физматгиз, 1960. 260 с.

V. V. Savcenko, D. Y. Akatiev

State linguistic university of Nizhny Novgorod

Automatic recognition of casual signals by criterion of the minimal information mismatch with reasking

The problem of optimum recognition of casual normal signals is put and solved on the basis of criterion of the minimal information mismatch of selective distributions in metrics Kullback-Leibler. The new algorithm with detection and rejection of doubtful decisions which do not answer asymptotical properties of optimum solving statistics is offered. It realizes a principle "reasking", i. e. recurrences of signals at their indistinct recognition. The example of practical application of algorithm in a problem of recognition of speech signals is considered. It is shown, that thanking to reasking at the moment of rejection of doubtful decisions quality of recognition essentially raises.

Casual signals, problem of statistical classification, synthesis of optimum algorithm, information mismatch, problem of recognition of speech

Статья поступила в редакцию 7 июня 2005 г.

УДК 51-7:621.396

В. И. Марчук

Южно-Российский государственный университет экономики и сервиса

К. Е. Румянцев

Таганрогский государственный радиотехнический университет

Анализ методов адаптации порогового значения при обнаружении аномальных измерений

Рассматриваются методы адаптации порогового значения при использовании алгоритма обнаружения аномальных измерений на основе метода размножения оценок. Приведены результаты аналитического анализа и результаты имитационного моделирования методов адаптации порогового значения.

Аномальные измерения, адаптация порога, пороговое значение, вероятность правильного обнаружения, ошибка первого рода

В процессе первичной обработки результатов измерений одной из основных задач является выявление аномальных или ошибочных значений, которые существенно влияют на результаты оценивания параметров физических процессов.

Если выборка результатов измерений {х^}; / = 1, N представляет собой N независимых значений случайного процесса х (^), распределенного по нормальному закону с ма-

2

тематическим ожиданием т и дисперсией а , то возможно использование статистики [1]

иI = (х1 - т)/а; I = 1, N. Величина и] является центрированной, нормально распределенной случайной величиной с единичной дисперсией. Если значение и] превышает при выбранном уровне зна-

© В. И. Марчук, К. Е. Румянцев, 2006

29

i Надоели баннеры? Вы всегда можете отключить рекламу.