Научная статья на тему 'Идентификация речевых сигналов на основе нечёткого композиционного анализа их визуальных образов'

Идентификация речевых сигналов на основе нечёткого композиционного анализа их визуальных образов Текст научной статьи по специальности «Математика»

CC BY
91
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идентификация речевых сигналов на основе нечёткого композиционного анализа их визуальных образов»

ЛИТЕРАТУРЫ.

1. Карелин В.П. Ковалёв СМ. Метод построения модели, имитирующей алгоритм поиска управляющих решений оператором. // Изв. АН СССР. Техн.киберн. - 1983. -Вып.5.

УДК 621.391

С.М. Ковалёв

ИДЕНТИФИКАЦИЯ РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ НЕЧЁТКОГО

КОМПОЗИЦИОННОГО АНАЛИЗА ИХ ВИЗУАЛЬНЫХ ОБРАЗОВ

В настоящее время сложилось устойчивое мнение о том, что наиболее информативные признаки речевого сигнала заложены в его спектральном описании [1]. , -ет, что с позиции выявления системы инвариант необходима более "грубая" визуализация, которая наиболее устойчива к возможным искажениям и помехам в речевом сигнале. Такую визуализацию можно провести на основе ЛПК-аншгаза, в результате которого выявляется набор коэффициентов ^ моделирующего фильтра. После решения характеристического уравнения а^-1 + a2Z-2 + ... + а^-11 = 0 получаем комплексные корни, характеризующие мгновенное состояние голосового тракта. Они несут информацию о центральных частотах фильтра, моделирующего . - -

кость, получаем визуальный образ речевого сигнала. На рис. 1 приведен визуальный образ слова "ноль", на котором помимо названных центральных частот фильтра, перпендикулярными отрезками показаны интенсивности соот-.

Визуальные образы являются исходным материалом для экспертного анализа и выявления семейства инвариант в ре.

осуществляется грубое разбиение интервала анализа на несколько временных сегментов. При этом главным критерием разбиения является стабиль-

ность поведения формантных траекторий на сегменте.

Число таких сегментов для рассматриваемого словаря не превышало пяти. Длина сегмента для одной и той же морфемы колеблется достаточно в широких пределах в зависимости от темпа речи и характера произнесения. Количество таких сегментов характеризует ядерность слова и от реализации к реализации не меняется. Второй уровень анализа связан с оценкой образа внутри каждого из сег-

51 52 вЗ |

Рис.1 Визуальный образ слова "ноль" с выделением сегментов, формант и га интенсивностей

ментов. При этом ключевыми признаками являются "выр^ённость" той или иной , .

В качестве примера рассмотрим типовое описание экспертом визуального образа слова "ноль" приведенного на рис.1. Интервал анализа состоит из трех временных сегментов БьБ^Бз. Первый из них характеризуется малой длительностью и слабо выраженной первой формантой в диапазоне около 250Г ц. Интервал 82 имеет большую длительность на котором четко выражены первая и вторая форманты в диапазоне от 500Гц до 1500Гц. Кроме этого на интервале 82 прерывисто наблюдается умеренно выраженная третья форманта в диапазоне до 3700Гц. Заключительный сегмент 83 характеризуется малой длительностью, на котором

500 -

2700 .

Ключевым признаком любого речевого образа является форманта, которая представляется в виде множества точек на частотно временной плоскости. Пусть 8f =[5 - некоторый частотный интервал дискретной шкалы Б исследуемого визу-

ального образа Р на временном отрезке §1 = [Ъ 1]. Обозначим через Р(8£81) подмножество точек образа Р, определяемое в соответствии с

Р(8£ 81) = { (5, 1) е Р / 5 е 55, 1 ей}. (3.1)

Для ответа на вопрос, насколько подобраз Р(8£ §1) соответствует той или иной форманте в нечётком понимании эксперта, воспользуемся линейной регрессией F (1). Соответствующие управления находятся из условия минимизации среднеквадратической ошибки

Е (Р(8£ 81)) = ^ [Р (г)-1 (г )]2 ^ шт . (3.2)

(/ ,г )еР (8,8)

Ошибка Е характеризует "сгруппированность" точек множества Р(85, §1) , . было установлено, что величина Е вместе со значением п (числом точек в Р(85, 81) ) достаточно хорошо характеризуют субъективное мнение наблюдателя о степени "выр^енности" форманты V. Для построения соответствующей функции принад-

Е

лежности использовалось нормализованное значение Еп = ------------у-. Функция

103 * п32

принадлежности нечеткой оценки "выр^енности" V форманты Fi в частном интервале 8fi определяется в соответствии с формулой

1, пр и Еп <1

Я(Р88) = \ 0,^« Е„)3 (3.3)

1 -1* Еп «Р«1 < Еп < 3

В общем случае каждый из временных сегментов речевого образа характеризуется несколькими формантами в различных частотных интервалах. В этих условиях интегральная оценка эксперта для всего сегмента базируется на разбиении шкалы Б на несколько частотных интервалов, каждый из которых соответствует одной из формант, присутствующих в визуальном образе. При этом разбиение вы-

полняется таким образом, чтобы все имеющиеся форманты были как можно более . .

Пусть на временном интервале т речевого образа Р наблюдаются несколько, для конкретности скажем три, формант Б2 Б3. Рассмотрим произвольное разбиение а={851,852,853} частотной шкалы Б на три сегмента. Используя (3.3), можно получить нечёткую оценку "выр^енности" форманты Fi на сегменте 8£. Тогда величина

Я (а) = я ( ВД)& Я ( Б2,850 & Я, ( Б3,85,) (3.4)

характеризует степень "уверенности" эксперта в том, что на исследуемом временном интервале т присутствуют форманты Б!, Б2, Б3 в частотных диапазонах 851,852,853 соответственно. Требуется из всех возможных разбиений шкалы Б найти такое а, для которого величина я (ах), определяемая в соответствии с (3.4), будет максимальной. В этом случае значение я (ах) является нечёткой оценкой сегмента на предмет присутствия в нём формант Бь Б2, Б3.

Для поиска такого разбиения воспользуемся следующей композиционной схемой. Предварительно заметим, что каждая из нечётких оценок 8£) индуци-

рует в пространстве Б х Б нечёткое отношение Я i в соответствии с

Яш^кД) = ЯЛТ^О, (85 = [^ £], к<1. (3.5)

Учитывая (3.5), определим в пространстве Б х Б следующее нечёткое отношение

Я = ДоЯ2оЯ3, (3.6)

представляющее собой композицию нечётких отношений Я в классическом

"максиминном" понимании [2]. Нетрудно показать, что композиционная цепочка (3.6) является своеобразным "генератором" всех возможных маршрутов длины 3 в Б х Б. Причём в данном случае каждому маршруту между 4 и ^ однозначно соответствует некоторое разбиение интервала [4 5] на 3 подсегмента. В силу замечательного свойства композиции нечёткое отношение Я определяет для каждой пары (4 £) наилучшее разбиение а и, соответствующую ему, наилучшею оценку я(а). Таким образом, подставив в (3.6) пару (^ £0, в которой £) и £, являются начальной

и конечной точками частотной шкалы Б, мы получим значение Я (Р^) которое является искомой нечёткой оценкой временного сегмента т речевого образа.

Глобальная оценка речевого образа осуществляется экспертом на основе его , -более стабильными формантными траекториями. Количество выделенных интервалов зависит от числа морфем в исследуемой фразе. Последнее, как правило, от реализации к реализации не меняется, в то время как длительность каждого из сегмента варьируется в широких пределах. В ходе сегментации экспертом преследуется цель выделения интервалов с как можно более стабильными оценками на предмет присутствия в них тех или иных формант.

Пусть исследуемый речевой образ Р состоит из нескольких, для конкретности , , . через а={ Рт1, Рт2, Рт3} некоторое произвольное разбиение Р на три временных по-

добраза. Предварительно отметим, что нечёткое отношение Я (см. 3.6) выведено

т, . . Я = Я (т). ,

используя (3.6), можно для каждого из Рт разбиения а, определить нечёткую оценку "выр^енности" подобраза Рт на сегменте т

Я (т) = Ях^сЛ), (4.1)

где - соответственно начальное и конечное значения шкалы Б.

Используя (4.1) определим нечёткую оценку

Я(а) = я(тО & я(т2) &я(т3) , (4.2)

отражающую степень "выр^енности" тех или иных формант на всем интервале

, а. -

ния заключается в нахождении всех возможных разбиений шкалы Т на три подин-

тервала. Используя (4.1), определим в пространств е Т х Т для каждого из Рт разбиения а нечёткое отношение П i в соответствии с

~ Яи^) = Я(т) (т = [11,1^]). (4.3)

Отношение П1 характеризует для каждого из сегмента [11,1|] нечёткую оценку "выретенности" на нём формант, соответствующих подобразу Рт . В этом случае, .3,

В = В 1 о!)2 о!~3, (4.4)

которая будет характеризовать для каждой из пар (11 1) наилучшее (в смысле максимизации (4.2)) разбиение временного сегмента [11,1|]. Подставив в (4.4) пару (10,1п), в которой 1) и 1п являются границами интервала анализа, получим искомую интегральную оценку я (^ 1п) речевого образа на всём интервале анализа. Опта-

В

мальное разбиение находится путём выделения соответствующего маршрута в ходе реализации композиции (4.4).

ЛИТЕРАТУРА

1. Потапова Р.К. Речь: коммуникация, информация, кибернетика. - М.: Радио и связь, 1997-528с.

2. Мелихов А.Н.,Берштейн Л.С. Конечные четкие и расплывчатые множества. Часть 2 . -

: , 1981.

УДК 519.68:681.51

С.В. Астанин, Т.Г. Калашникова*

МОДЕЛЬ НЕМОНОТОННЫХ РАССУЖДЕНИЙ НА ОСНОВЕ НЕЧЕТКОЙ

ЛОГИКИ

Различные немонотонные логики увеличивают гибкость вывода продукционных систем в области с неполными знаниями. Однако, правило умолчания: если <посылка> и М <решение> то <решение>, где М - читается как “допекается”, может привести к неверному решению из-за нежелательной транзитивности. Избежать этого можно, перечислив все исключения, которые не позволяют принять решение в правилах с умолчаниями. Правило с исключением может быть выражено как: если <посылка> то <решение> если не <исключение>.

Явная обработка исключений уменьшает вероятность появления аномального решения, увеличивает надежность системы.

При выборе схемы управления в зависимости от доступной информации в одном случае можно игнорировать условие исключения и обрабатывать правило < > < >, вычислительные ресурсы для исследования исключений и, соответственно, получения вывода в точном виде. Исключения могут учитываться при получении реше-

* Работа выполнена в рамках гранта РФФИ № 99-01-0024.

i Надоели баннеры? Вы всегда можете отключить рекламу.