Научная статья на тему 'Исследование особенностей спектральных характеристик голоса в норме и патологии'

Исследование особенностей спектральных характеристик голоса в норме и патологии Текст научной статьи по специальности «Клиническая медицина»

CC BY
1291
141
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Подшивалов М. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование особенностей спектральных характеристик голоса в норме и патологии»

вания, посвященного этой проблеме. Целью исследования является изучение особенностей голосообразования в норме и в патологии, что позволило бы в дальнейшем приступить к созданию функционального стандарта здорового и больного голоса и разработке алгоритма автоматизированной компьютерной скрининг-диагностики заболеваний гортани.

Материалы и методы исследования: при спектральном исследовании здорового голоса нами была произведена компьютерная запись и спектральный анализ голоса десяти человек, из них у пяти мужчин и пяти женщин (контрольная группа). Записывались гласные фонемы русского языка на уровне комфортной высоты и громкости голоса у каждого исследуемого («примарный тон» голоса), были также записаны согласные фонемы. У этих же исследуемых записывалась шепотная фонация,

Во второй группе были записаны голоса десяти больных острыми или обострением хронических катаральных ларингитов, сопровождавшихся различными степенями дисфонии, от легкой осиплости до афонии.

Всем исследуемым проводилось стандартное ЛОР исследование, включая непрямую ларингоскопию.

Исследовался также синтезированный на компьютере звук, представлявший собой сложный двухтоновый сигнал (рис. 2.).

шш

■Г Маш

3 |0Ш<Ш ,ООООС1.3У .

,

Spectrum Analysis - Эвух1

Опт* OTCÉpi*mw Обновить' Лоиса*

» ЗИ5 7Ж И0)7 И?08 «Î73 2dW Ги

Частотами) Децибелы id FFT 1 427 1 ; •52 { 68 ’S— Выступающая Частота -27 $ на 830 Нг (Ноте: F5) FFT Размер 2 048 Части 1 Пересе-ече 75*i Блнг.«+Хар(ж Пи-фНй: Мсно Cv-ri/ioe 84 824 до

Рис.2.

При записи голоса использовался активный микрофон МКЭ-2, обладающий широкой и равномерной амплитудно-частотной характеристикой, и малым уровнем собственных шумов,

Здесь и далее иллюстрации и запись звуков автора

персональный компьютер с процессором AMD Duron(tm) 700 и звуковой картой ESS 1969 PCI AudioDrive. Спектральный и частотный анализ звуков производился с помощью звуковых редакторов CoolEdit Pro 2.0, Adobe Audition 2.0. и Sound Forge 9.0. В начале исследования, для проверки функциональности аппаратно-программного комплекса и выявления спектральной структуры сложного звукового сигнала был синтезирован произвольный музыкальный звуковой сигнал с частотой основного тона 690 Гц и произведен его спектральный анализ.

На спектрограмме синтезированного звукового сигнала (Рис.2.) отчетливо видны два спектральных пика на частотах 690Гц (основной тон) и 1427 Гц (гармоника).

С помощью цифрового FFT фильтра оба спектральных пика вырезаны из исследуемого сигнала и подвергнуты компьютерному анализу. Обнаружено, что синтезированный музыкальный звуковой сигнал состоит из двух простых синусоидальных тонов: 690 Гц и 1427 Гц (Рис. 3.).

/ \ А /

Простой тон 690 Гц

V' V V V/ V

V V V

Простои тон 1427 Гц

Рис. 3.

Точно также, любой, даже самый сложный звуковой сигнал например звук человеческого голоса, при анализе может быть разложен на отдельные простые синусоидальные составляющие - частоту основного тона (самый низкий тон, определяющий общую тональность, т.е. высоту звука) и гармоники.

В человеческом голосе отдельные гармонические составляющие гласных называются формантами. Форманты несут в себе смысловую нагрузку и определяют дифференциацию одной фонемы от другой. Смысловое значение гласной, определяют лишь первые две форманты, остальные гармонические составляющие определяют индивидуальные особенности голоса. При этом зона первых двух определяющих формант располагается в диапазоне от 170-200 Гц до 3,5-4 кГц [3,4,5].

Рассмотрим спектральный состав человеческого голоса на примере реальной записи

гласного звука «И» (здоровый мужской голос, - Рис. 4.). На спектрограмме отчетливо видны несколько спектральных пиков - частота основного тона, две отчетливые форманты и высокочастотные гармоники, определяющие индивидуальные особенности голоса.

|Частота основного тонр голоса Форманты-

■ -шШе

1 'І І'.

■ 1 ! " Кл •

Спектр гласной “И"

;Ь аЬ «¿с ■’ «со . '¿I* ‘ 1«Ь *іі» " «аки і

і-ту* ю.лі^ив; ;•.. • , -- ‘їм В **?*** о • о _ __{(«№•; Г7" - * ІІІИ

Рис.4.

Кроме гармонических составляющих гласная фонема может содержать в себе некоторое количество негармонических, шумовых, или так называемых «рассеянных» частот. От наличия их зависит чистота или звонкость звучания голоса. В звучании голоса здорового человека содержание рассеянных частот минимально (см. Рис. 4.). При патологических состояниях голосообразующего аппарата содержание шумовых компонентов возрастает, что приводит к появлению осиплости.

Согласные фонемы человеческой речи не имеют четкой формантной структуры и представляют собой сложные непериодические звуковые колебания, имеющие шумовой спектр и изменяющуюся амплитуду, а так же продолжающуюся во времени (шипящие согласные), или краткую «взрывную» динамическую характеристику (фрикативные согласные) [4]. При формировании согласных звуков голосовые складки почти не принимают участия, при этом лишь несколько меняется ширина и форма голосовой щели гортани. Для примера приводим осциллограммы и спектры шипящей согласной «С» (Рис.5а) и фрикативной согласной «Т» (Рис.56).

Звук человеческого голоса в патологическом состоянии, например при остром или хроническом ларингите, также состоит из частоты основного тона, определяющей высоту голоса, и формант. Однако наличие осиплости в таких случаях вызывает возникновение на спектрограмме дополнительных шумовых («рассеянных») частот, значительно изменяющих структуру спектра. При этом особенно отчетливо проявляются высокочастотные компоненты

шумового спектра в диапазоне от 5000 Гц до 12 тыс. Гц, т.е. в той зоне, где формантные частоты заведомо отсутствуют. Это отчетливо видно на представленной спектрограмме (Рис. 6.).

Осцилограмма согласной "С'

? Хресігит Апаїукі»

Опт їм 04 обновите.! і К*«

Спектр согласной С

1 1 1 і І

1 —1

Частота |Гц1 Доциі'илху (сі РТТ

Рыстутающ«« Частоте '51 сі* »и 31 Нг (Нога 60]

ГРІ Рвгыср 2 048 Чвети 1 Пере*-75%

Б/икыам Харрис ЯимКуел*. Мсмо Сэмгш« 80вЭБдо,

Рис.5а

гЧл,-"

Осцилогремма согласной "Т*

нввишиг

Олц. (и Отображение Обносит*.' Помощь

Спектр согласной "Т" 3

111 1

^4—

¿о г «V*] і »«4 іти ії?ів ібооо г

Частот« Децибелы 1<і РГГ Корпии*

I------

Выетупак/илл Частота. -4? с!8 мз 31 Н'г |Нотаг В0|

КГ7 Р»*мер .? 046 Част»» 1 Пересечение /5й Блтоам-Харрис. Линейный. Моко С*мплов <4,2 Э&8до

Рис.56.

Форманты

Шумовые ("рассеянные”) частоты

• / уу

г

^ ЦЩ. л\

Ї. ш V

' V * * ,|4, I

Спектр гласной “И”- охриплость

Рис. б.

Формантная структура гласной при этом сохраняется, однако узнаваемость гласной существенно снижается, хотя обычно остается достаточной для распознавания речи.

Существует еще один способ речевого общения - это шепот, часто его образно называют «речь без голоса». Общение шепотом возможно в норме, а также встречается при некоторых патологических состояниях гортани (миопа-тические парезы и параличи гортани). Формирование гласных и согласных фонем при этом происходит за счет артикуляции дыхательного шума, возникающего при прохождении воздуха через неполностью сомкнутую голосовую щель и неколеблющиеся голосовые складки. Спектрограмма при таком способе фонации также содержит частоты, являющиеся аналогом основного тона голоса и формант, которые в норме обеспечивается фонирующими голосовыми складками, однако эго псевдофонация, формирующаяся из дыхательных шумов (Рис. 7). Спектр гласной при шепоте изобилует шумовыми частотами во всем диапазоне звукового спектра, форманты и даже шумовой аналог основного тона прослеживаются, но амплитуда их снижена, в ряде случаев отмечается удвоение второй форманты, что обусловливает меньшую разборчивость и звучность речи.

Рис. 7.

Звучание согласных фонем при шепоте существенно не отличается от нормального голо-сообразования, их отличает лишь меньшая звучность.

Таким образом, спектральные характеристики голоса в норме и при наличии патологии значительно отличаются и могут дифференцироваться даже визуально на спектрограмме, а при дальнейшем создании компьютерного анализатора спектра возможно создание достаточно простого и эффективного метода функциональной диагностики, позволяющего проводит ь

первичную аппаратную скрининг-диагностику патологических состояний гортани.

Выводы:

1. Спектральные компоненты голоса, при формировании гласных фонем, значительно отличаются в норме, различных видах патологии гортани и шепоте.

2. Различные виды фонации могут дифференцироваться путем анализа спектра визуально.

3. Изменения спектра голоса при патологии достаточно отчетливы и могут быть подвергнуты систематизации, что создает предпосылки для создания компьютерного алгоритма диагностики голосовых дисфункций.

4. Анализ спектра голоса в перспективе может быть использован в качестве средства автоматизированной компьютерной диагностики заболеваний гортани.

Литература

1. Агаджанян Н.А., 'Гелль Л.З., Циркин В.И., Чеснокова С.А. Физиология человека. -М.: Медицинская книга, Н. Новгород: Издательство НГМА, 2001. - 526 с.: ил.

2. Девидов И.И. Певческий голос в здоровом и больном состоянии. - «Искусство», Ленинград, 1939. -251 с.: ил.

3. Максимов И. Фониатрия: пер.с болгар. В.Д.Сухарева - Ь.: Медицина, 1987, 288 с.: ил.

4. Митринович-Моджеевска А. Патофизиология речи, голоса и слуха.(Перевод с польского Е.Ланеева). - Варшава. Польское государственное медицинское издательство, 1965. - 352 с.: ил.

5. М.Н.Подшивалов. К вопросу о значении формант гласных звуков русского языка. // Материалы юбилейной научно-практической конференции Актуальные вопросы диагностики и лечения патологии уха и верхних дыхательных путей (19-20 мая 1998 г.).- Киров, 1998.- С. 62-63.

6. Alexander Gaiembo (1996). “Russian (Soviet) Contribution to Musical Acoustics,” Journal of the Acoustical Society of America, v. 98, No. 6, pp. 3071-3079.

7. Gaiembo, A. (1994). “Musical acoustics in Russia,” Speech Transmission Laboratory Quarterly Progress and Status Report, Dept, of Speech Communication and Music Acoustics, Royal Institute of Technology, P.O. Box 700 14, S-100 44 Stockholm, Sweden, STL-QPSR 3-4/94, p. 1 - 42.

8. E. J. Wallen and J. H. L. Hansen, “A screening test for speech pathology assessment using objective quality measures,” in Inter. C'onf. on

Материалы научно-практической конференции

Philadelphia, PA, October 1996

9 S. F. Boll, “Suppression of acoustic noise in speech using spectral subtraction,” IEEE Trans. Acoustics, Speech, and Signal Processing, vol. 27, no. 2, pp. 113-120, 1979.

i Надоели баннеры? Вы всегда можете отключить рекламу.