Научная статья на тему 'Методика вейвлет-диагностики дисфонии по фонеме и'

Методика вейвлет-диагностики дисфонии по фонеме и Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
155
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Краснова Н. В., Филист С. А., Шаталова О. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика вейвлет-диагностики дисфонии по фонеме и»

Н.В. Краснова, С.А. Филист, О.В. Шаталова

К информативным признакам отнесем амплитудный джиттер в сегментах В и Э. Под джиттером будем понимать степень вариации (дрожания) интенсивности вейвлет-коэффициентов вдоль оси времени вейвлет-плоскости. Так как фонема И имеет одну или две форманты, то показатель джиттера надо рассчитывать в двух формантах. При наличии только одной форманты, возникает вопрос, каков джиттер отсутствующей форманты? Если примем равным нулю показатель джиттера отсутствующей форманты, то это может ошибочно улучшить интегральный показатель состояния голосового аппарата. Поэтому в качестве второго информативного признака принимаем величину

Х2=тах{Лв, Ло}, (3)

где Лв и Ло - показатели амплитудного джиттера в сегментах В и О вейвлет-плоскости. Для определения амплитудного джиттера в формантах надо разбить сегменты В и О на одинаковые подсегменты в направлении оси времени, что можно выполнить с применением двумерного окна Q(h, п-т), и определить дисперсию их кратковременной энергии. Чтобы этот показатель не зависел от энергии сигнала, его надо пронормировать по энергии форманты. Кратковременную энергию в окне определим:

= 2 2 , Ьт )2п (к, Ьп - т)

(4)

где Ьн и Ьв - номера строк нижней и верхней границ сегмента; п - номер подсегмента в сегменте; 5 - длина подсегмента;

[1 при к е[кн ,ке ] и (п -1)Ь< т < пЬ [0 в противном случае Джиттер в сегменте В:

2п (к, Ьп - т) —

N-1 2(» 2 К- К)г

Т + т

2 2 ™2(а’ ьт)

(5)

где К=т^Т/5) - число подсегментов в сегменте; т - левая граница сегмента, Т - длина сегмента. Формулу, аналогичную (5), можно записать и для джиттера в сегменте Э. Третьим информативным признаком является соотношение энергий в сегментах В и Э, которые определяются как знаменатель (5):

2 2 № 2 (а, Ьт )

' Т +т

2 2 № 2 (а, Ьт )

(6)

Четвертый и пятый информативные признаки характеризуют степень локализации формант. Эти признаки определяются высотами сегментов В и Э. Так как они должны быть выражены в относительных единицах, то высоту сегментов будем нормировать на частотный диапазон вейвлет-плоскости, то есть на величину /в -/н. Численные расчеты этих информативных признаков: X 4 — И, /(/в - /н), X5 — И /(/в - /н). (7)

Чтобы проиллюстрировать связь этих информативных признаков с голосовой патологией рассмотрим рис. 5, на котором показаны вейвлет-плоскости подростков-юношей с «женским голосом» (женским голосом мы называем мужской голос, формантный состав фонемы И которого соответствует формантному составу женского голоса) при патологии и после курса лечения.

Масштабы по обеим осям обеих вейвлет-плоскостей совпадают, поэтому будем использовать безразмерные единицы: /в-/н=10; Н1в=0,5; Н1э=2; Н2в=3; Н2э=4. Следовательно, для класса «здоров» Х4=0,05; Х5=0,2. Для класса «болен» Х4=0,3; Х5=0,4.

Голосовой аппарат каждого пациента может быть охарактеризован 5-компонентным вектором, компоненты которого определяются по вейвлет-плоскости фонемы И. Для экспериментальной проверки эффективности диагностики в выбранном признаковом пространстве воспользуемся дискриминантным анализом в пакете 8ТЛТ18Т1СЛ 6 [1]. Для этого используются функции классификации, предназначенные для определения того, к какому классу наиболее вероятно может быть отнесен каждый объект. Число функций классификации равно числу классов. Каждая функция классификации вычисляется по следующей формуле

Si=Ci+WilX1+Wi2X2+WiзXЗ+Wi4X4+Wi5X5, (8)

где индекс і обозначает класс, а индексы 1, 2,... 5 - номер информативного признака; Сі - константа і-го класса; Wij - веса для j-го информативного признака. Для вычисления функций классификации надо иметь обучающую выборку, обеспечивающую точность классификации. Объем обучающей выборки п

оценивался по методике, принятой в медицинских приложениях [3]. Объект считается принадлежащим к тому классу, для которого получено наибольшее значение функции классификации. Для определения вероятности того, что исследуемый объект принадлежит к данному классу, использовалось расстояние Махалано-биса. По итогам работы диагностического правила проведена проверка достоверности принятого решения (табл.).

Таблица

Результаты диагностики 35 пациентов для каждого класса

Клинический диагноз Результат диагностики Чувствительность Специфичность

Без патологии Функциональная дисфония Органическая дисфония Острое заболевание

Без патологии 32 З - - 91,4 97,1

Функциональная дисфо-ния З 27 5 - 77,1 9З,З

Органическая дисфония - 4 28 З 80 91,4

Острое заболевание - 1 4 30 85,7 97,1

Чувствительность решающего правила определяем как % выражение частоты положительных результатов теста для объектов данного класса (в классе 35 объектов) [2]. Специфичность решающего правила определяем, как % выражение частоты истинно отрицательных результатов у объектов, не принадлежащих к этому классу (в данном случае не принадлежит к данному классу 105 объектов выборки). Общее число ошибок для всех классов составило 23. Общий объем выборки 140 (по 35 из каждого класса). Процент правильного принятия диагностического решения для предложенного метода диагностики составил 84%.

Литература

1. Боровиков В. 8ТАТ18Т1СА. искусство анализа данных на компьютере.- СПб.: Питер, 2003.- 688 с.

2. Омельченко В.П., Демидова А.Л. Практикум по медицинской информатике.- Ростов-на-Дону: Феникс, 2001.- 304 с.

3. Справочник по функциональной диагностике в педиатрии. / Под ред. Ю.Е. Вельтищева, Н.С. Кисляк.- М.: Медицина, 1979.- 624 с.

4. Яковлев А.Н. Основы вейвлет-преобразования сигналов: Уч. пособ.- М.: САЙНС-ПРЕСС, 2003.- 80 с.

Й Филист Сергей Алексеевич окончил Севастопольский приборостроительный институт. В 2003 г. защитил докторскую диссертацию. Профессор кафедры «Биомедицинская инженерия» КГТУ. Автор более 130 научных работ.

Шаталова Ольга Владимировна окончила в магистратуру КГТУ. Аспирант кафедры «Биомедицинская инженерия» КГТУ. Автор более 14 научных работ.

Краснова Надежда Валерьевна окончила КГМУ. С 2001 г. - врач-оториноларинголог в МУЗ «Горбольница №1». Автор 5 научных работ.

УДК 615.84

МЕТОДИКА ВЕЙВЛЕТ-ДИАГНОСТИКИ ДИСФОНИИ ПО ФОНЕМЕ И Н.В. КРАСНОВА*, С.А. ФИЛИСТ**, О.В. ШАТАЛОВА**

Для оценки патологии голоса врачу-фониатру следует использовать частотно-временное картирование сигнала голоса, а в качестве тестового сигнала - фонацию звука И, т.к. он имеет наиболее простую Фурье-структуру из всех гласных русского языка. В качестве частотно-временного преобразования лучше применить вейвлет-преобразование, как имеющее преимущество перед сонограммой при анализе нестационарных сигналов [1].

Цель предлагаемой методики - качественное описание выделенных информативных признаков и их экспертная количест-

* *305006, г. Курск, ул. Димитрова, 61, МУЗ «Горбольница №1»

305040, г. Курск, ул. 50 лет Октября, 94, ГОУ ВПО «КГТУ»; тел./факс: (4712) 50-48-20; Е-таП: biomed@kstu2.kursk.ru

Е

2

к—кн т — (п-1) Ь

Н.В. Краснова, С.А. Филист, О.В. Шаталова

венная оценка путем измерений на вейвлет-плоскости или по 5балльной шкале, с принятием решения на основе степени тяжести голосового нарушения. На рис. 1 стр. 3 обл. представлена вейвлет-плоскость сигнала голоса при фонации звука И здоровой девушки-подростка. Для диагностики дисфонии по вейвлет-плоскости синтезируют признаковое пространство, для чего вейвлет-плоскость рис. 1 стр. 3 обл. разбивают на сегменты А, В, С, Э, и Е, дислокации которых показаны контурными линиями. Признаковое пространство синтезируем путем сегментации.

Признак XI характеризует регулярность частоты по оси времени в сегменте А и оценивается по 5-балльной системе на основе экспертной оценки. Признак Х2 характеризует степень вариабельности величин вейвлет-коэффициентов вдоль осей времени и частоты в сегментах В и Э, соответствующих зонам дислокаций 2-й и 1-й формантам фонемы И. Он также оценивается по 5-балльной системе на основе экспертной оценки. Признак Х3 характеризуется отношением энергий в сегментах В и Э и примерно может быть охарактеризован отношением площадей этих сегментов. Информативные признаки Х4 и Х5 характеризуют степень локализации формант и определяются расстоянием (по оси частот) между верхней и нижней границами сегментов В и Э. Чтобы эти признаки не зависели от параметров вейвлет-преобразования, их надо нормировать по частотному диапазону, который занимает вейвлет-плоскость. Для получения диапазонов изменения этих признаков проведены статистические исследования вейвлет-плоскостей детей и подростков в норме и с голосовой патологией. В качестве характерных патологий взяты функциональные и органические дисфонии.

Итоги исследований см. в табл. 1. Вейвлет-описания признаков класса «норма» см. рис. 1 стр. 3 обл., где видим, что в области обертонов (сегмент А) имеется высокая регулярность, оценивающаяся 4-г 5 баллами. Самый высокий показатель Х2 в 1й форманте (сегмент Э) оценивается 0-г1 баллом. Среднестатистическое соотношение энергий сегментов В и Э - в пределах

0,35^0,44. Показатели локализации формант составляют 0,05^0,1 и 0,1^0,15. К 5 признакам добавим еще признак текстурирован-ности изображения сегмента Е. В норме он равен 4,5 баллам.

Таблица 1

Вейвлет-описания информативных признаков фонемы И

Монитор

Показатель Норма Функцион. дисфония Органическая дисфония

после леч. патология

X1 4...5 3.4 1...2 0.1

X2 0...1 1.2 2.3 3.5

X3 0,35.0,44 0,1.0,15 0,01.0,1 0.0,1

X4 0,05.0,1 0,04.0,08 0,02.0,04 0.0,02

X5 0,1.0,15 0,1.0,12 0,12.0,15 0,1.0,15

Текстурированность в сегменте E 4,5 2.2,5 ,5 4 ,5 2, 2,5.3

Анализируя вейвлет-плоскости фонем И лиц с другими патологиями, типичные из которых см. на рис. 2-4 стр. 3 обл., получим вейвлет-описание всех классов патологий табл. 1. Каждая вейвлет-плоскость рис. 2-4 стр. 3 обл. визуализирована в виде 256 цветовых оттенков (через 255 уровней квантования). Для детального анализа этого мало, и в нижней части рис. показана та же вейвлет-плоскость, но значения ее вейвлет-коэффициентов - в логарифмическом масштабе. На рис. 5 показано аппаратно-программное обеспечение автоматизированной системы вейвлет-анализа сигнала голоса. Для получения вейвлет-плоскостей сигнала голоса использовался персональный компьютер (ПК) на базе процессора AMD Duron 950 МГц. Вводился сигнал голоса в ПК через стереогарнитуру HN 928 с микрофоном чувствительностью 54 дБ, частотным диапазоном 20 Гц^20 кГц, импедансом 2,2 кОм. Для оцифровки сигнала голоса использовали плату аналогового интерфейса L-761-84. По табл. 1 найдем алгоритм для диагноза и дифференцирования дисфоний (рис. 6).

Алгоритм предусматривает скрининг-диагностику и анализ информативных признаков. Скрининг-диагноз ведется блоками 1-5 и блоками 11-12. В основу скрининг-диагностики положен анализ признаков X1 и X3, как наиболее информативных. Информативность признака X1 иллюстрирует рис. 7 стр. 3 обл., где показаны вейвлет-плоскости сегментов А: «здоров», «после лечения», «патология». При патологии в зоне обертонов ухудшается частотно-временная периодичность, которая оценивается путем корреляционного анализа или экспертных оценок.

ЭВМ

Модуль оцифровки сигнала PCI

Модуль Фурье- анализа Интерфе йсный модуль Модуль вейвлет- анализа

Z

Аналоговый

интерфейс

Клавиатура

=f=

Врач

Стереогарни- тура

Пациент

Рис. 5. Структурная схема аппаратно-программного обеспечения вейвлет-преобразования сигнала голоса

Рис. 6. Схема алгоритма диагностики дисфоний на основе информативных признаков, полученных в результате вейвлет-анализа фонемы И

При постановке скрининг-диагноза «функциональная дисфония» он дифференцируется от состояния «здоров», что осуществляется в блоке 7, где анализируются информативные признаки Х2...Х5. При постановке скрининг-диагноза «органическая дисфония» он дифференцируется на состояние «после лечения» и состояние «патология», это дифференцирование осуществляется в блоке 14, в котором анализируются информативные признаки Х2, Х4, Х5. Т.к. признаковое пространство имеет сложную структуру классов, то возможно невыполнение условий и в блоке 4, и в блоке 11. Это т.н. артефакт данных, который может быть обусловлен патологией пациента или некорректным тестированием голосового аппарата. Эту ситуацию фиксирует блок 18, после чего эксперт принимает решение о плане диагностических процедур.

Использование современных компьютерных технологий, основанных на вейвлет-анализе сигналов, при наличии методики дает фониатру возможность для скрининг-диагностики и мониторинга эффективности лечебно-оздоровительных мероприятий.

Литература

1. Яковлев А.Н. Основы вейвлет-преобразования сигналов: Учебное пособие.- М.: САЙНС-ПРЕСС, 2003.- 80 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.