Научная статья на тему 'Решение проблемы ложных тревог в системах голосового управления на основе метода фонетического декодирования слов'

Решение проблемы ложных тревог в системах голосового управления на основе метода фонетического декодирования слов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
49
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ / СИСТЕМЫ ГОЛОСОВОГО УПРАВЛЕНИЯ / IMAGES RECOGNITION / AUTOMATIC SPEECH RECOGNITION / SYSTEM OF VOICE-ACTIVATED CONTROL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Савченко Владимир Васильевич

Показано, что особенность автоматического распознавания речи в системах голосового управления в режиме непрерывного времени состоит в предельно жестких требованиях к вероятности ложных тревог. Рассмотрены возможности созданного автором метода фонетического декодирования слов в варианте с редукцией данных. Показано, что в отличие от известных методов при его применении вероятность ложных тревог может регулироваться самим пользователем, причем простыми средствами и в широких пределах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Савченко Владимир Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Solution of the problem of false alarms in systems of voice-activated control on the basis of the method of phonetic decoding of words

The task of automatic speech recognition in the systems of voice control under conditions of continuous time is considered. It is shown that her feature consists in extremely rigorous demands to probability of false alarms. Opportunities of method of phonetic decoding of words for his realization with data reduction are considered. It is shown that as opposed to known methods his probability of false alarms may be controlled by user himself by simple means and over a wide range.

Текст научной работы на тему «Решение проблемы ложных тревог в системах голосового управления на основе метода фонетического декодирования слов»

УДК 621.372:519.72

В. В. Савченко

Нижегородский государственный лингвистический университет Решение проблемы ложных тревог в системах голосового управления

л

на основе метода фонетического декодирования слов1

Показано, что особенность автоматического распознавания речи в системах голосового управления в режиме непрерывного времени состоит в предельно жестких требованиях к вероятности ложных тревог. Рассмотрены возможности созданного автором метода фонетического декодирования слов в варианте с редукцией данных. Показано, что в отличие от известных методов при его применении вероятность ложных тревог может регулироваться самим пользователем, причем простыми средствами и в широких пределах.

Распознавание образов, автоматическое распознавание речи, системы голосового управления

Автоматическое распознавание речи (АРР) на протяжении многих лет относится к числу наиболее актуальных задач теоретической и прикладной информатики. Этот факт объясняется, прежде всего, непрерывным расширением сферы практического применения речевых технологий по мере развития и распространения цифровой вычислительной техники. Так, в недавнем прошлом на рынке доминировали системы голосового поиска информации (СГПИ) и в этом направлении был достигнут значительный практический эффект. Примером может служить ряд новейших разработок международных корпораций "Microsoft", "Google", "Apple", IBM, "Nuance" и др. (см., например, [1]-[3]). Однако в последние 5-10 лет тренд исследований в области речевых технологий все более перемещается по направлению систем голосового управления (СГУ). В подтверждение этого можно сослаться на поисковую систему "Apple-Siri" с элементами голосового управления некоторыми функциями сотового телефона . Данному процессу имеется простое объяснение: эффект от применения СГУ в самых разных областях человеческой деятельности - от военной до сугубо бытовой - намного превосходит сумму затрат на их создание и эксплуатацию. Кроме того, большие ожидания исследователи и разработчики СГУ первоначально связывали с появлением новых методов АРР в предшествующий период бурного распространения СГПИ. Но, к сожалению, эти ожидания практически не оправдались, так как очень быстро выяснилось [4], [5], что СГПИ и СГУ предъявляют принципиально разные требования к техническим характеристикам используемых в них систем и технологий АРР. В частности, в этих системах существенно разнятся цены ошибок первого рода и второго рода. Принципиальное отличие СГУ, особенно при работе в режиме непрерывного времени (системы тревоги, безопасности, антитеррора и т. п.), - это высокая (иногда чрезвычайно) цена ложной тревоги (ЛТ) (ошибки первого рода): принимается решение о поступлении на вход системы ключевого слова xq, когда в действительности оно отсутствует.

1 Работа выполнена при финансовой поддержке Минобрнауки РФ в рамках ФЦП "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы" (Государственный контракт № 07.514.11.4137).

2 http://www.freepatentsonline.com/y2012/0016678.html

© Савченко В. В., 2012 11

Вероятность такой ошибки а непосредственно пересчитывается в среднюю частоту ЛТ: /'ЛТ = а/тср, где тср - средняя длительность ключевого (кодового) слова. Например при

тСр =1с и а = 0.01 (что отвечает современному уровню развития речевых технологий [6]),

получим в среднем одну ложную тревогу в каждые полторы минуты. Понятно, что это недопустимо часто для любой практики применения СГУ. Вот почему нужен принципиально новый подход с гарантированно малой вероятностью ЛТ (ВЛТ) в системе АРР. С указанной точки зрения представляет интерес недавно созданный метод фонетического декодирования слов (МФДС) [7], [8] с повышенными точностью и надежностью АРР. Его модификации с редукцией данных, благодаря которой ВЛТ может регулироваться в широких пределах пользователем СГУ, и посвящена настоящая статья. При этом изложение проведено в терминах информационной теории восприятия речи (ИТВР) [9].

Постановка задачи. Работа большинства систем АРР сводится к поэлементному (на фонетическом уровне) сопоставлению произнесенного диктором слова или фразы х с зара-

нее подготовленным набором вариантов-эталонов хг , г = 1, Я (Я - объем множества эталонов). При этом под фонемой понимают минимальную речевую единицу (МРЕ) (не членимую далее). Решение принимается в пользу фонемы ху, \> < М, которая наиболее близка

на слух к произнесенному слову. Общей проблемой является то, что диктор в силу ряда причин, например из-за дефектов речи или органов слуха, может быть просто не в состоянии произнести отдельные МРЕ в достаточной степени близко по звучанию к их эталонам. К тому же само понятие "в достаточной степени близко" не формализовано. Выходом из данной ситуации может служить сравнение сигнала х одновременно с несколькими этало-

нами хгу, / = 1, ./,. (Jr - объем г-го множества эталонов) по каждой г-й фонеме. Диктору в

таком случае будет достаточно приблизить свое произношение к любому из них, чтобы быть правильно понятым слушателем. Поэтому можно утверждать, что однофонемные (одноименные) реализации слов диктора группируются в сознании человека-слушателя в соот-

ветствующие классы, или речевые образы Хг — х^- , г = 1, Я, каждый вокруг своего центра - эталонной метки данного образа. В ИТВР указанные эталоны определяются в строгом теоретико-информационном смысле [9]: речевая метка х* е Xг образует информационный центр-эталон (ИЦ-эталон) г-го речевого образа, если в пределах множества Xг она характеризуется минимальной суммой информационных рассогласований по Кульбаку-Лейблеру

[10] относительно всех других его меток-реализаций хг/, у = Jr. Это стандартная формулировка критерия минимума информационного рассогласования (МИР) [11]. Задача в общем случае сводится к двухэтапной проверке статистических гипотез. На первом этапе распознаются отдельные МРЕ, на втором - слова, фразы и целые тексты как соответствующим образом структурированные последовательности фонем.

Задача первого этапа. Она существенно упрощается, если воспользоваться гауссов-ской (нормальной) аппроксимацией закона распределения речевого сигнала Рг = N Кг на

интервалах его квазистационарности длительностью т = const (Кг - автокорреляционная

матрица (АКМ) с размерами пхп, п = /*дх > 1; /'д - частота дискретизации). Задача в этом

случае формулируется как проверка простых гипотез о законе распределения МРЕ. Известно [11], что в этом случае критерий МИР является оптимальным в байесовском смысле. Набор оптимальных решающих статистик может быть записан следующим образом:

р х|хг - 1/2п [tr КК;1 -In KK~V -п\, (1)

где tr • - трек (след) матрицы; К - выборочная оценка АКМ анализируемого сигнала х = х t . Решение принимается в пользу гипотезы Pv, v < R, по признаку минимума v-й решающей статистики:

Wv X : р х|х* =minp х|х* (2)

г

в пределах заданной фонетической базы данных (ФБД) х* . Это стандартная формулировка критерия МИР в задаче АРР.

Рассмотренный алгоритм имеет множество разнообразных модификаций главным образом за счет применения рекуррентных вычислительных процедур корреляционного анализа. Среди них наибольший интерес представляет метод обеляющего фильтра (МОФ) [12], основанный на линейной авторегрессионной (АР) модели МРЕ общего вида:

Р _

xr t =^arixr t-i + т| t , r = \,R. (3)

i=1

Указанная модель однозначно определяется своим вектором АР-коэффициентов ar = ari заданного порядка р<п и дисперсией ст^ = const порождающего процесса

г| t типа "белого" шума. С одной стороны, она органично сочетается с голосовым механизмом человека ("акустическая труба" переменного диаметра), с другой - существенно расширяет возможности программно-аппаратной реализации критерия МИР (1), (2) по направлению рекуррентных вычислительных процедур с высокой скоростью сходимости. В

этом случае набор оптимальных решающих статистик (2) примет вид р х|х* =

= 1/2 [ст^ x/ajr-l], г = \, R, где ст^ х - выборочная дисперсия отклика г-го обеляющего фильтра (ОФ)

Р

yr t = х t ~^arix t-i , t = 1, 2, ..., n (4)

i=1

на вектор анализируемого сигнала размера n.

Анализ эффективности распознавания на первом этапе. Как следует из предыдущего раздела, задача первого этапа АРР сведена к АР-анализу речевого сигнала по МОФ. При этом обработка сигнала осуществляется в R параллельных каналах с использованием набора ОФ (4), каждый из которых настроен на соответствующий ИЦ-эталон МРЕ

-1

*

хг из одноименного множества реализаций МРЕ Xг. Решение принимается с периодом т в пользу одной из возможных фонем по критерию МИР (2). В результате исходный речевой сигнал х = х I , 1 = 0, 1, ..., L, L=TCpjx, на интервале его действия Гср преобразуется системой АРР в последовательность фонетических символов (букв) национального языка вида х= Х|, х2, ..., хг-, .х/ , хг-е хг , т. е. формируется фонетический код

анализируемого слова x. В получении фонетического кода и состоит смысл первого этапа обработки речевого сигнала в задаче АРР.

В работах [13] и [14] показано, что эффективность фонетического кодирования зависит прежде всего от RxR -матрицы информационных рассогласований (ИР)

А I * p-jjy р хг

между гипотетическими распределениями эталонов разных фонем.

X = X*

Это прямо вытекает из известного выражения [14] для вероятности перепутывания у-й фонемы с г-й:

Кг-р РГ х <ру х 1хеХу 1 + Руг ]> V, г<Я, УФГ, (5)

которая, в свою очередь, легко пересчитывается в вероятность ошибки при распознавании каждой отдельной фонемы в пределах ФБД х* :

R

ßv=l-n !-ßvr = r=1

R

П ФК,К 1 + Pvr r=1, r^v

V < R, (6)

где Ф/( ¡< ■ - интегральная функция /'-распределения Фишера с КхК степенями свободы: К = Ь — р - объем выборки наблюдений по сигналу (4) на выходе ОФ (3) р-то порядка.

Чем больше ИР между фонемами руг и как результат меньше вероятность их перепутывания (5), тем меньше вероятность ошибок при распознавании фонем согласно решающему правилу МИР (2).

Зафиксировав в (6) вероятность ошибки на некотором приемлемом уровне и воспользовавшись ее оценкой сверху

ß*=l- l-maxßvr R «7?шахРУГ =R

г г

1~ФК К l + minpvr

ТФ\

>ßv, О)

с помощью таблиц ^-распределения найдем пороговый уровень ИР. Например при (Зу =0.01, ^ = 100 и К = 60 (типичные значения обоих параметров в задачах АРР [12]),

р* =1.67. Найденное значение определяет требования к минимальной различимости фонем в метрике ИР (1) для их возможного распознавания согласно правилу (2). При сокращении объема ФБД R эти требования монотонно ослабляются: например при том же К = 60 и

^ = 10, будем иметь р* =1.25, что примерно на 25 % меньше предыдущего значения.

Для иллюстрации в таблице представлен фрагмент матрицы ИР от некоторого диктора, рассчитанной по известной методике [14] с частотой дискретизации речевого сигна-

Входная фонема Фонема базы данных

А Л Ль О У Ф Фь Х Хь Ц Ы Э

г

А 0.0 4.0 29.6 12.2 8.8 4.2 13.4 8.9 20.0 15.4 9.1 4.7

Л 7.4 0.0 14.8 1.3 4.3 53.5 64.1 104.6 64.7 113.8 7.0 5.8

Ль 5.9 17.2 0.0 15.5 6.5 26.2 27.1 54.3 27.5 55.2 4.8 7.6

О 99.2 14.5 472.2 0.0 40.6 457.5 746.9 580.0 600.7 856.1 213.4 21.5

У 284.2 12.3 162.3 3.6 0.0 1631.4 1922.1 2709.3 1685.8 3384.1 124.2 27.6

Ф 2.3 7.5 2.4 11.9 3.7 0.0 0.4 0.3 1.3 0.6 4.3 5.6

Фь 5.4 11.7 2.6 15.1 6.3 0.4 0.0 0.4 0.7 0.3 6.1 8.0

Х 12.5 19.8 5.9 33.1 11.0 1.1 0.4 0.0 2.1 0.8 5.3 5.0

Хь 7.4 6.6 3.5 16.9 12.9 1.4 0.8 1.9 0.0 0.3 21.5 30.3

Ц 7.0 7.2 3.0 14.8 9.5 0.9 0.6 1.0 0.3 0.0 16.8 18.2

Ы 13.3 8.0 5.4 25.7 9.5 35.6 41.9 75.3 42.6 90.3 0.0 7.4

Э 8.6 13.6 8.2 19.7 4.1 23.0 28.4 29.7 25.2 43.7 3.7 0.0

ла 7<д = 8 кГц на интервалах т = 10 мс (откуда Ь — 80). Порядок АР-модели в (3) установлен р = 20. В результате К - 60. Серым фоном в таблице отмечены элементы с минимальными значениями ИР, лежащими в непосредственной близости от порогового уровня

р* =1.67. Отметим, что все они относятся к случаю невокализованных фонем на входе.

Вокализованные и, в частности гласные, фонемы, напротив, характеризуются заведомо

*

более высоким уровнем ИР в пределах заданной ФБД х* , что говорит об их существенно более устойчивой (надежной) различимости согласно критерию МИР (2). Указанная закономерность лежит в основе предложенного далее высокоточного метода АРР на основе МФДС с редукцией данных.

Задача второго этапа. Рассмотрим автоматическую регистрацию (обнаружение) в непрерывном речевом потоке от некоторого диктора (или группы дикторов) ключевого слова (или набора слов) хд, которое кодируется последовательностью (вектором) своих

гласных фонем Ь = Ьт длиной т> 2. Идея метода отталкивается от общих

принципов слоговой фонетики русского языка. Сначала из непрерывного потока речи на входе СГУ автоматически (без участия оператора) выделяется очередное слово х с фиксацией его передней и задней границ в непрерывном времени. Затем это слово автоматически разбивается на последовательность из п смежных открытых слогов: х = Х|, х2, .\п .Из

экспериментальной фонетики известно [15], что обе используемые разновидности сегментации речевого сигнала - по изолированным словам и по открытым слогам характеризуются заведомо высокими точностью и надежностью, что является важной особенностью русского языка. Если при этом значение п отличается от количества т слогов используемого кодового слова хд, то никакой дальнейшей обработки речевого сигнала в СГУ на втором этапе АРР не производится, а решение принимается в пользу альтернативной гипотезы

Щ X : х*х0 (8)

об отсутствии на входе СГУ ключевого слова. Это правило резко ограничивает значение ВЛТ а. При равенстве п — п^ обработка речевого сигнала продолжается по каждому слогу отдельно.

Во-первых, в привязке к заднему фронту слога хг-, i = 1, п, на ближайшем предшествующем ему гребне речевого сигнала автоматически выделяется стационарный отрезок x длительностью тг-, содержащий некоторый гласный звук. Длительность хг- и количество отсчетов Ь^ меняются в широких пределах в зависимости от длительности выделенного отрезка (обычно Ц = F^x^ = 80...800 ) и могут регулироваться темпом речи диктора. После

этого запускается алгоритм проверки гипотез (2) и данная гласная автоматически распознается. Как следует из приведенной ранее таблицы ИР, распознавание также выполняется без особых проблем в отношении точности. В результате проверки всех n слогов анализируемого слова x формируется его редуцированный, т. е. сокращенный на множестве гласных фонем русского языка, фонетический код а= а-у, а^> ■ И, наконец, по-

элементным сопоставлением полученного кода с фонетическим кодом b = by, ¿2^ •••,bn ключевого слова из базы данных СГУ при выполнении системы равенств

V/ < п: щ = bt (9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

принимается решение в пользу основной ("нулевой") гипотезы АРР Wq х : x = xq. В противном случае принимается альтернативное решение (8).

По существу, описанная процедура есть стандартная процедура декодирования сообщений. Поэтому предложенный алгоритм легко распространяется на произвольное число используемых в СГУ кодовых слов. Причем в любом варианте алгоритма ВЛТ опреде-

п

ляется по формуле « = [ сх/ < max ос" вероятности суммы группы независимых событий

/=1

(9) в отсутствие на входе ключевого слова xq (ссг - вероятности указанных событий).

Например на множестве из R = 6 гласных фонем русского языка А, О, И, У, Ы и Э, в предположении равной вероятности ошибки первого рода для каждой фонемы будем

иметь ВЛТ CLj = \/6 = const, а для слова целиком а «\/ 6п . Последняя вероятность быстро уменьшается до нуля в асимптотике: а « 0.028 при п = 2; а « 0.005 при п = 3 и т. д. Уже

при п = 7 получим а «3.6-10 ^, что соответствует среднему периоду ложных тревог в СГУ, примерно равному приемлемым 3.25 сут. И это далеко не предел. Например, расширив состав ФБД за счет звонких (вокализованных) согласных В, Вь, Л, Ль,и т. д., можно

увеличить ее объем до 20.. .25, что соответствует ВЛТ порядка а « \/20п <С \/6п . По существу, получен эффективный механизм регулировки ВЛТ за счет изменения темпа речи самим диктором-пользователем СГУ.

С другой стороны, вероятность ошибки перепутывания фонем (5) может также регулироваться темпом речи диктора. Например при вытягивании гласных звуков в течение тj > 50 мс, в условиях ранее рассмотренного примера имеем для каждой гласной фонемы

объем выборки Lj =400, а параметр /'-распределения К = 400-20 = 380. Тогда из (7) по-

лучим вероятность ошибки второго рода, т. е. пропуска ключевого слова при АРР, ß* «

« 6Ql -Ф380 380 25 J = 0.2-10 Это пренебрежимо малая вероятность для любой

возможной сферы применения СГУ.

Таким образом, в результате проведенного исследования на основе ИТВР и МФДС предложен метод АРР для СГУ с повышенной надежностью. При его применении точность распознавания ключевых слов регулируется темпом речи диктора, и это основное достоинство нового метода. Чем меньше темп речи, тем выше точность АРР. Причем применительно к СГУ снижение темпа речи на входе почти не сказывается на оперативности принятия решения, так как с лихвой компенсируется значительным в общем случае (на порядок и более) выигрышем по скорости вычислений [16] за счет радикальной редукции фонетических данных. Наряду с указанным качеством метод обладает и другими важными для практики свойствами и возможностями, в том числе возможностями оперативной (за несколько минут) настройки СГУ на конкретного диктора, моментальной замены (обновления) набора используемых в СГУ ключевых слов, минимальными требованиями к объему памяти и к используемому программному обеспечению и другими. Перечисленные преимущества позволяют рекомендовать новый метод для применения в современных СГУ, нацеленных на экспресс-оповещение специальных служб и служб спасения об авариях на транспорте, на производстве и в быту в режиме непрерывного наблюдения.

Список литературы

1. Pat. US 6301560 B1. Int.CI G10L15/22. Discrete speech recognition system with ballooning active grammar / S. P. Masters. Publ. 09.10.2001.

2. Schuster M. Speech recognition for mobile devices at Google // Proc. of the 11th Pacific Rim int. conf. on trends in artificial intelligence. Daegu, Korea, 30 Aug. -2 Sept. 2010. Berlin: Springer-Verlag, 2010. Vol. 6230. P. 8-10.

3. Pat. US 8175883 B2. Int.CI G10L21/00 (2006.01) Speech recognition system and method / R. Grant, P. Gregor. Publ. 08.05.2012.

4. Practical issues in the application of speech technology to network and customer service applications / D. Att-water, M. Edgington, P. Durston, S. Whittaker // Speech comm. 2000. Vol. 31, № 4. P. 279-291.

5. Tan B. A distributed speech remote control system based on web service and automatic speech recognition // Proc. of Int. conf. on electrical power systems and computers. Nanchang, China, 20-22 June 2011. Berlin: SpringerVerlag, 2011. Vol. 99. P. 771-778.

6. Левин Е. К., Рагузин П. С., Татарникова М. Ю. Оценка вероятности ложного срабатывания системы автоматического распознавания голосовых команд // Науч.-техн. ведомости СПбГПУ. Сер. Информатика. Телекоммуникации. Управление. 2011. № 5. C. 7-12.

7. Савченко В. В. Метод фонетического декодирования слов в задаче автоматического распознавания речи // Изв. вузов России. Радиоэлектроника. 2009. Вып. 5. С. 41-49.

8. Пат. RU 111944 U1 G10L15/00 (2006.01). Устройство для фонетического анализа и распознавания речи / А. В. Савченко, В. В. Савченко, Д. Ю. Акатьев. Опубл. 2011.12. БИ № 36.

9. Савченко В. В. Информационная теория восприятия речи // Изв. вузов России. Радиоэлектроника. 2007. Вып. 6. С. 3-9.

10. Кульбак С. Теория информации и статистика. М.: Наука, 1967. 408 с.

11. Савченко В. В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра // Радиотехника и электроника. 2005. Т. 50, № 3. С. 309-314.

12. Савченко В. В., Акатьев Д. Ю., Карпов Н. В. Автоматическое распознавание элементарных речевых единиц методом обеляющего фильтра // Изв. вузов России. Радиоэлектроника. 2007. Вып. 4. С. 11-19.

13. Савченко В. В. Анализ качества речи на основе информационной теории восприятия // Изв. вузов России. Радиоэлектроника. 2008. Вып. 5. С. 22-32.

14. Савченко В. В. Фонема как элемент информационной теории восприятия речи // Изв. вузов России. Радиоэлектроника. 2008. Вып. 4 С. 3-11.

15. Бондарко Л. В. Опыт описания слоговой структуры текста с точки зрения его распознавания: к проблеме единиц спонтанной речи // Просодия текста: тез. докл. науч.-метод. конф., М., 7-9 дек. 1982. М.: Изд-во Моск. гос. пед. ин-та иностр. яз. им. М. Тореза., 1982. С. 11-13.

16. Савченко В. В. Автоматическое распознавание речи на основе кластерной модели минимальных речевых единиц в информационной метрике Кульбака-Лейблера // Изв. вузов России. Радиоэлектроника. 2011. Вып. 3. С. 9-19.

V. V. Savchenko

Nizhny Novgorod state linguistic university

Solution of the problem of false alarms in systems of voice-activated control on the basis of the method of phonetic decoding of words

The task of automatic speech recognition in the systems of voice control under conditions of continuous time is considered. It is shown that her feature consists in extremely rigorous demands to probability offalse alarms. Opportunities of method ofphonetic decoding of words for his realization with data reduction are considered. It is shown that as opposed to known methods his probability of false alarms may be controlled by user himself by simple means and over a wide range.

Images recognition, automatic speech recognition, system of voice-activated control

Статья поступила в редакцию 28 сентября 2012 г.

УДК 621.3.001

А. Г. Силина, М. В. Соклакова, Э. П. Чернышёв

Санкт-Петербургский государственный электротехнический

университет "ЛЭТИ"

Обоснование наличия автоколебаний в гистерезисной релейной цепи с апериодическим звеном в цепи обратной связи

Рассмотрен теоретически важный случай наличия автоколебаний в релейных цепях с апериодическим звеном в контуре обратной связи. Высокое быстродействие и простота обработки информации в релейных автоколебательных системах позволяют широко применять их в различных областях. Приведены основы новой методики расчета автоколебаний.

Релейная система, автоколебания, переходная характеристика, устойчивость, передаточная функция, дискретные цепи

В работах [1]-[3], посвященных разработке новой методики оценки устойчивости автоколебаний (АК) в релейных цепях (РЦ) с применением теории дискретных цепей (ДЦ), показано, что при переходе от передаточной функции (ПФ) линейной части (ЛЧ) РЦ к ПФ ДЦ методом инвариантности их импульсных характеристик (ИХ) для цепей с разрывной ИХ требуется дополнительная коррекция ИХ ДЦ на условном нулевом шаге расчета.

Классический метод расчета АК в случае разрывной ИХ ЛЧ, в частности для апериодического звена в контуре обратной связи (ОС), не дает решения [4], [5], т. е. получить его методом гармонического баланса не удается, так как частотная характеристика ЛЧ и комплексная характеристика линеаризованного релейного элемента (РЭ) не имеют точек пересечения.

Применение нового метода расчета АК в "замкнутой форме" и нового метода уточненного анализа устойчивости АК с применением теории ДЦ [1]-[3] позволяет получить

18 © Силина А. Г., Соклакова М. В., Чернышёв Э. П., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.