ЛИТЕРАТУРЫ.
1. Карелин В.П. Ковалёв СМ. Метод построения модели, имитирующей алгоритм поиска управляющих решений оператором. // Изв. АН СССР. Техн.киберн. - 1983. -Вып.5.
УДК 621.391
С.М. Ковалёв
ИДЕНТИФИКАЦИЯ РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ НЕЧЁТКОГО
КОМПОЗИЦИОННОГО АНАЛИЗА ИХ ВИЗУАЛЬНЫХ ОБРАЗОВ
В настоящее время сложилось устойчивое мнение о том, что наиболее информативные признаки речевого сигнала заложены в его спектральном описании [1]. , -ет, что с позиции выявления системы инвариант необходима более "грубая" визуализация, которая наиболее устойчива к возможным искажениям и помехам в речевом сигнале. Такую визуализацию можно провести на основе ЛПК-аншгаза, в результате которого выявляется набор коэффициентов ^ моделирующего фильтра. После решения характеристического уравнения а^-1 + a2Z-2 + ... + а^-11 = 0 получаем комплексные корни, характеризующие мгновенное состояние голосового тракта. Они несут информацию о центральных частотах фильтра, моделирующего . - -
кость, получаем визуальный образ речевого сигнала. На рис. 1 приведен визуальный образ слова "ноль", на котором помимо названных центральных частот фильтра, перпендикулярными отрезками показаны интенсивности соот-.
Визуальные образы являются исходным материалом для экспертного анализа и выявления семейства инвариант в ре.
осуществляется грубое разбиение интервала анализа на несколько временных сегментов. При этом главным критерием разбиения является стабиль-
ность поведения формантных траекторий на сегменте.
Число таких сегментов для рассматриваемого словаря не превышало пяти. Длина сегмента для одной и той же морфемы колеблется достаточно в широких пределах в зависимости от темпа речи и характера произнесения. Количество таких сегментов характеризует ядерность слова и от реализации к реализации не меняется. Второй уровень анализа связан с оценкой образа внутри каждого из сег-
51 52 вЗ |
Рис.1 Визуальный образ слова "ноль" с выделением сегментов, формант и га интенсивностей
ментов. При этом ключевыми признаками являются "выр^ённость" той или иной , .
В качестве примера рассмотрим типовое описание экспертом визуального образа слова "ноль" приведенного на рис.1. Интервал анализа состоит из трех временных сегментов БьБ^Бз. Первый из них характеризуется малой длительностью и слабо выраженной первой формантой в диапазоне около 250Г ц. Интервал 82 имеет большую длительность на котором четко выражены первая и вторая форманты в диапазоне от 500Гц до 1500Гц. Кроме этого на интервале 82 прерывисто наблюдается умеренно выраженная третья форманта в диапазоне до 3700Гц. Заключительный сегмент 83 характеризуется малой длительностью, на котором
500 -
2700 .
Ключевым признаком любого речевого образа является форманта, которая представляется в виде множества точек на частотно временной плоскости. Пусть 8f =[5 - некоторый частотный интервал дискретной шкалы Б исследуемого визу-
ального образа Р на временном отрезке §1 = [Ъ 1]. Обозначим через Р(8£81) подмножество точек образа Р, определяемое в соответствии с
Р(8£ 81) = { (5, 1) е Р / 5 е 55, 1 ей}. (3.1)
Для ответа на вопрос, насколько подобраз Р(8£ §1) соответствует той или иной форманте в нечётком понимании эксперта, воспользуемся линейной регрессией F (1). Соответствующие управления находятся из условия минимизации среднеквадратической ошибки
Е (Р(8£ 81)) = ^ [Р (г)-1 (г )]2 ^ шт . (3.2)
(/ ,г )еР (8,8)
Ошибка Е характеризует "сгруппированность" точек множества Р(85, §1) , . было установлено, что величина Е вместе со значением п (числом точек в Р(85, 81) ) достаточно хорошо характеризуют субъективное мнение наблюдателя о степени "выр^енности" форманты V. Для построения соответствующей функции принад-
Е
лежности использовалось нормализованное значение Еп = ------------у-. Функция
103 * п32
принадлежности нечеткой оценки "выр^енности" V форманты Fi в частном интервале 8fi определяется в соответствии с формулой
1, пр и Еп <1
Я(Р88) = \ 0,^« Е„)3 (3.3)
1 -1* Еп «Р«1 < Еп < 3
В общем случае каждый из временных сегментов речевого образа характеризуется несколькими формантами в различных частотных интервалах. В этих условиях интегральная оценка эксперта для всего сегмента базируется на разбиении шкалы Б на несколько частотных интервалов, каждый из которых соответствует одной из формант, присутствующих в визуальном образе. При этом разбиение вы-
полняется таким образом, чтобы все имеющиеся форманты были как можно более . .
Пусть на временном интервале т речевого образа Р наблюдаются несколько, для конкретности скажем три, формант Б2 Б3. Рассмотрим произвольное разбиение а={851,852,853} частотной шкалы Б на три сегмента. Используя (3.3), можно получить нечёткую оценку "выр^енности" форманты Fi на сегменте 8£. Тогда величина
Я (а) = я ( ВД)& Я ( Б2,850 & Я, ( Б3,85,) (3.4)
характеризует степень "уверенности" эксперта в том, что на исследуемом временном интервале т присутствуют форманты Б!, Б2, Б3 в частотных диапазонах 851,852,853 соответственно. Требуется из всех возможных разбиений шкалы Б найти такое а, для которого величина я (ах), определяемая в соответствии с (3.4), будет максимальной. В этом случае значение я (ах) является нечёткой оценкой сегмента на предмет присутствия в нём формант Бь Б2, Б3.
Для поиска такого разбиения воспользуемся следующей композиционной схемой. Предварительно заметим, что каждая из нечётких оценок 8£) индуци-
рует в пространстве Б х Б нечёткое отношение Я i в соответствии с
Яш^кД) = ЯЛТ^О, (85 = [^ £], к<1. (3.5)
Учитывая (3.5), определим в пространстве Б х Б следующее нечёткое отношение
Я = ДоЯ2оЯ3, (3.6)
представляющее собой композицию нечётких отношений Я в классическом
"максиминном" понимании [2]. Нетрудно показать, что композиционная цепочка (3.6) является своеобразным "генератором" всех возможных маршрутов длины 3 в Б х Б. Причём в данном случае каждому маршруту между 4 и ^ однозначно соответствует некоторое разбиение интервала [4 5] на 3 подсегмента. В силу замечательного свойства композиции нечёткое отношение Я определяет для каждой пары (4 £) наилучшее разбиение а и, соответствующую ему, наилучшею оценку я(а). Таким образом, подставив в (3.6) пару (^ £0, в которой £) и £, являются начальной
и конечной точками частотной шкалы Б, мы получим значение Я (Р^) которое является искомой нечёткой оценкой временного сегмента т речевого образа.
Глобальная оценка речевого образа осуществляется экспертом на основе его , -более стабильными формантными траекториями. Количество выделенных интервалов зависит от числа морфем в исследуемой фразе. Последнее, как правило, от реализации к реализации не меняется, в то время как длительность каждого из сегмента варьируется в широких пределах. В ходе сегментации экспертом преследуется цель выделения интервалов с как можно более стабильными оценками на предмет присутствия в них тех или иных формант.
Пусть исследуемый речевой образ Р состоит из нескольких, для конкретности , , . через а={ Рт1, Рт2, Рт3} некоторое произвольное разбиение Р на три временных по-
добраза. Предварительно отметим, что нечёткое отношение Я (см. 3.6) выведено
т, . . Я = Я (т). ,
используя (3.6), можно для каждого из Рт разбиения а, определить нечёткую оценку "выр^енности" подобраза Рт на сегменте т
Я (т) = Ях^сЛ), (4.1)
где - соответственно начальное и конечное значения шкалы Б.
Используя (4.1) определим нечёткую оценку
Я(а) = я(тО & я(т2) &я(т3) , (4.2)
отражающую степень "выр^енности" тех или иных формант на всем интервале
, а. -
ния заключается в нахождении всех возможных разбиений шкалы Т на три подин-
тервала. Используя (4.1), определим в пространств е Т х Т для каждого из Рт разбиения а нечёткое отношение П i в соответствии с
~ Яи^) = Я(т) (т = [11,1^]). (4.3)
Отношение П1 характеризует для каждого из сегмента [11,1|] нечёткую оценку "выретенности" на нём формант, соответствующих подобразу Рт . В этом случае, .3,
В = В 1 о!)2 о!~3, (4.4)
которая будет характеризовать для каждой из пар (11 1) наилучшее (в смысле максимизации (4.2)) разбиение временного сегмента [11,1|]. Подставив в (4.4) пару (10,1п), в которой 1) и 1п являются границами интервала анализа, получим искомую интегральную оценку я (^ 1п) речевого образа на всём интервале анализа. Опта-
В
мальное разбиение находится путём выделения соответствующего маршрута в ходе реализации композиции (4.4).
ЛИТЕРАТУРА
1. Потапова Р.К. Речь: коммуникация, информация, кибернетика. - М.: Радио и связь, 1997-528с.
2. Мелихов А.Н.,Берштейн Л.С. Конечные четкие и расплывчатые множества. Часть 2 . -
: , 1981.
УДК 519.68:681.51
С.В. Астанин, Т.Г. Калашникова*
МОДЕЛЬ НЕМОНОТОННЫХ РАССУЖДЕНИЙ НА ОСНОВЕ НЕЧЕТКОЙ
ЛОГИКИ
Различные немонотонные логики увеличивают гибкость вывода продукционных систем в области с неполными знаниями. Однако, правило умолчания: если <посылка> и М <решение> то <решение>, где М - читается как “допекается”, может привести к неверному решению из-за нежелательной транзитивности. Избежать этого можно, перечислив все исключения, которые не позволяют принять решение в правилах с умолчаниями. Правило с исключением может быть выражено как: если <посылка> то <решение> если не <исключение>.
Явная обработка исключений уменьшает вероятность появления аномального решения, увеличивает надежность системы.
При выборе схемы управления в зависимости от доступной информации в одном случае можно игнорировать условие исключения и обрабатывать правило < > < >, вычислительные ресурсы для исследования исключений и, соответственно, получения вывода в точном виде. Исключения могут учитываться при получении реше-
* Работа выполнена в рамках гранта РФФИ № 99-01-0024.