Научная статья на тему 'Слоговые контрасты как фактор помехоустойчивости и разборчивости речи в шуме'

Слоговые контрасты как фактор помехоустойчивости и разборчивости речи в шуме Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
239
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛОГОВОЙ КОНТРАСТ / СЛОГОВАЯ АКУСТИКА / ПОМЕХОУСТОЙЧИВОСТЬ / NOISE IMMUNITY / ВОСПРИЯТИЕ УСТНОЙ РЕЧИ / ПЕРЦЕПТИВНОЕ ТЕСТИРОВАНИЕ / AUDIO TESTING / ШУМОВАЯ ПОМЕХА / БЕЛЫЙ ШУМ / WHITE NOISE / РОЗОВЫЙ ШУМ / PINK NOISE / TEST PATTERN PRODUCTION / SYLLABLE INTELLIGIBILITY / ACOUSTIC AND PHONOLOGICAL SYLLABLE CHARACTERISTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Крейчи Станислав Антонович, Кривнова Ольга Федоровна, Тихонова Екатерина Александровна

Данная работа посвящена исследованию акустики слоговых контрастов в слогах типа СГ как основного фактора помехоустойчивости и разборчивости речи при ее маскировке шумом. Во вводном разделе 1 и разделе 2 рассматривается понятие слогового контраста, дается оценка потенциальной помехоустойчивости разных типов контраста, формулируются основные задачи исследования. В разделе 3 описана методика составления тестовых диагностических таблиц с разной степенью потенциальной помехоустойчивости слогов для исследования их восприятия в шуме, в частности, для выявления наиболее устойчивых к шуму акустико-фонологических признаков фонем в составе слога. В разделе 4 описаны дизайн и результаты перцептивного эксперимента, проведенного авторами для анализа помехоустойчивости составленных слоговых таблиц при маскировке речевого сигнала шумом. Результаты перцептивного анализа диагностических таблиц показали, что интегральная помехоустойчивость (разборчивость) составленных слоговых таблиц примерно одинакова в отсутствии шумовой помехи и значительно отличается при маскировке белым и розовым шумом. В заключение подводятся итоги исследования и обсуждаются перспективные направления, в которых можно было бы продолжить данную работу.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Крейчи Станислав Антонович, Кривнова Ольга Федоровна, Тихонова Екатерина Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Syllabic Contrasts as a Factor of Speech Immunity during Perception in Noise

This paper is devoted to a study of the syllabic acoustic contrasts in CV syllables as the main factor of speech immunity when being masked by noise. In the introduction and section 2 the concept of syllabic contrast is discussed, as well as an assessment of the potential noise immunity of different types of acoustic contrasts, and the main objectives of the study are also formulated. Section 3 describes a method of preparation of test syllabic tables with different degrees of potential noise immunity for the study of their perception in noise, in particular with the goal to identify the most robust to noise acoustic-phonological phonemes’ features in the structure of the syllable. Section 4 describes the design and the results of the perceptual experiment conducted in this study for the analysis of noise immunity of the composed syllabic tables when speech signal is masked by noise. Three types of test tables were used in the perception test: with syllables, that are potentially most proof against noise, with syllables of average stability and with syllables of the least stability. For noise masking of speech signals two types of noise were used: white stationary noise spectral components which are evenly distributed over the entire range of frequencies and pink stationary noise, uniformly decreasing on a logarithmic frequency scale. The results of perception tests show that noise immunity (intelligibility) of the composed tables is about the same in the absence of noise interference and significantly different when being masked with white and pink noise. The conclusion summarizes the research and discusses promising directions in which it would be possible to continue the study.

Текст научной работы на тему «Слоговые контрасты как фактор помехоустойчивости и разборчивости речи в шуме»

Вестник Московского университета. Серия 9. Филология. 2018. № 1

СТАТЬИ

СА. Крейчи, О.Ф. Кривнова, Е.А. Тихонова

СЛОГОВЫЕ КОНТРАСТЫ КАК ФАКТОР

ПОМЕХОУСТОЙЧИВОСТИ И РАЗБОРЧИВОСТИ

РЕЧИ В ШУМЕ

Федеральное государственное бюджетное образовательное учреждение высшего

образования «Московский государственный университет имени М.В. Ломоносова»

119991, Москва, Ленинские горы, 1

Данная работа посвящена исследованию акустики слоговых контрастов в слогах типа СГ как основного фактора помехоустойчивости и разборчивости речи при ее маскировке шумом. Во вводном разделе 1 и разделе 2 рассматривается понятие слогового контраста, дается оценка потенциальной помехоустойчивости разных типов контраста, формулируются основные задачи исследования. В разделе 3 описана методика составления тестовых диагностических таблиц с разной степенью потенциальной помехоустойчивости слогов для исследования их восприятия в шуме, в частности, для выявления наиболее устойчивых к шуму акустико-фонологических признаков фонем в составе слога. В разделе 4 описаны дизайн и результаты перцептивного эксперимента, проведенного авторами для анализа помехоустойчивости составленных слоговых таблиц при маскировке речевого сигнала шумом. Результаты перцептивного анализа диагностических таблиц показали, что интегральная помехоустойчивость (разборчивость) составленных слоговых таблиц примерно одинакова в отсутствии шумовой помехи и значительно отличается при маскировке белым и розовым шумом. В заключение подводятся итоги исследования и обсуждаются перспективные направления, в которых можно было бы продолжить данную работу.

Ключевые слова: слоговой контраст; слоговая акустика; помехоустойчивость; восприятие устной речи; перцептивное тестирование; шумовая помеха; белый шум; розовый шум.

1. Введение. Исследования слухового восприятия речевых сообщений в шуме не перестают быть актуальными при решении многих задач в области разработки новых средств связи, а также с

Крейчи Станислав Антонович — научный сотрудник филологического факультета МГУ имени М.В. Ломоносова (e-mail: kreychi@mail.ru).

Кривнова Ольга Федоровна — доктор филологических наук, ведущий научный сотрудник филологического факультета МГУ имени М.В. Ломоносова (e-mail: okrivnova@mail.ru).

Тихонова Екатерина Александровна — бакалавр филологического факультета МГУ имени М.В. Ломоносова (e-mail: tikhonova.k.012@gmail.com).

общефонетической точки зрения, так как помогают расширить наши представления о восприятии речи, детализировать и уточнить существующие модели слуховой обработки речевого сигнала человеком [Венцов, Касевич, 1994]. Общие положения этих моделей сводятся к тому, что минимальные звуковые единицы языка (фонемы) хранятся в памяти носителя языка в виде целевых артикуляций, которые необходимы для их произнесения при порождении речи. Механизм восприятия речи обрабатывает только те звуки/фрагменты речевого сигнала, которые могут быть соотнесены с целевыми артикуляциями и их различительными признаками. Предполагается, что неречевые сигналы обрабатываются отдельно, другими механизмами. Независимость работы этих механизмов позволяет отделять речь от помех в зашумленных условиях восприятия.

Смысловая интерпретация речевого сигнала строится на идентификации входящих в него слов и установлении синтаксических и семантических связей между ними [Кодзасов, Кривнова, 2012]. Распознаванию слова в сообщении предшествует распознавание его фонемного состава, полного или частичного. Однако распознавание отдельных фонем не осознается слушающим, в связи с чем возникает вопрос о том, на каком этапе восприятия, каким образом и в какой мере оно влияет на восприятие и распознавание слова. Одна из популярных гипотез состоит в том, что в памяти носителя языка каждой фонеме, наряду с целевой артикуляцией, соответствует свой слуховой образ, представляющий собой определенную конфигурацию полезных акустических признаков-параметров, на формирование которой в речевом сигнале и направлена целевая артикуляция фонемы (мы говорим, чтобы быть услышанными и понятыми). В рамках данного подхода слуховой образ фонемы (или, иначе, ее акустическая модель) рассматривается либо как результат усреднения по всем акустическим признакам всех когда-либо слышанных вариантов данной фонемы, либо как ее вариант, наиболее часто встречающийся в речи. При этом предполагается, что при восприятии речи фонема опознается не как целостная единица, а через распознавание ее фонологически значимых признаков [Ягунова, 1994]. Если для определения точного значения признака недостаточно акустической информации, то определяется не отдельная фонема, а класс фонем, различающихся по данному неопознанному признаку. Такой принцип является основополагающим для большинства моделей восприятия речи. Они имеют между собой некоторые различия, касающиеся, например, набора полезных акустических признаков, имеющих фонологическую нагрузку, но тем не менее их можно объединить под общим названием «модели, использующие дифференциальные признаки», или сокращенно «признаковые модели».

В признаковых моделях активно используется также понятие акустических ключей. Акустические ключи, или дескрипторы, — это «сведения о наличии/отсутствии в речевом сигнале релевантных для каждого фонологического признака акустических событий, об отношениях следования между ними, а также сведения об их временных, частотных и энергетических модификациях» [Зиновьева, 1989]. Различные акустические ключи в разной степени подвергаются искажению под воздействием помех [Елкина, Юдина, 1964], что и определяет помехоустойчивость соответствующих фонологических признаков и ассоциированных с ними речевых единиц. Кроме акустических факторов, на восприятие речи могут также влиять и другие факторы (статистические, общелингвистические, контекстные, стилистические и пр.).

2. Задачи исследования. В работе экспериментально исследовалось восприятие речи в условиях внешнего шума. Цель исследования — выявить наиболее устойчивые к шуму акустико-фонологические признаки, а также проанализировать влияние шумовой помехи на стратегию восприятия речевого сигнала. Основная задача исследования была направлена на анализ влияния акустических и частотных факторов на качество распознавания речевого сигнала в нормальных условиях и в шуме в условиях минимального использования неакустической информации при идентификации речевых единиц. В качестве материала для исследования были выбраны бессмысленные единицы речи (отдельные слоги). В составленные нами артикуляционные таблицы были включены слоги структуры согласный-гласный (СГ). Фонемы в слоге этой структуры характеризуются наибольшей произносительной слитностью по сравнению с другими звукосочетаниями. Из этого следует, что в сочетаниях СГ сильнее всего проявляется контекстное влияние целевых артикуляций фонем друг на друга, что приводит к изменению звучания как гласного, так и согласного по сравнению с их возможным изолированным произнесением и произнесением в других контекстах. С учетом этого целесообразно в качестве акустической характеристики слога СГ рассматривать не только собственные признаки входящих в него фонем, согласного и гласного, а признак слога как такового, который заключается в степени фонетического сходства/различия входящих в него фонем, т.е. в степени слогового контраста [Бондарко, 1977].

Согласно Л.В. Бондарко, в интегральном признаке «слоговой контраст» можно выделить следующие акустические составляющие1:

1. Контраст по частоте основного тона (ЧОТ): реализуется в наибольшей степени в сочетаниях глухих согласных с гласным (так как

1 Приводимые ниже данные относятся прежде всего к отдельно произнесенным слогам и к ударным слогам отдельно произнесенного слова.

на участке согласного тон отсутствует, а на участке гласного присутствует), а в сочетаниях со звонкими шумными согласными заключается в изменении ЧОТ при переходе от согласного к гласному.

2. Контраст по длительности: реализуется максимально в слогах с твердыми глухими смычными (взрывными) согласными, длительность которых намного меньше длительности гласного.

3. Контраст по формантной структуре: реализуется во всех слогах, кроме слогов с начальными сонорными согласными, имеющими, как и гласные, четко выраженную формантную структуру.

4. Контраст по интенсивности: в слоге типа СГ гласный характеризуется, как правило, большей интенсивностью, чем согласный, хотя в слогах с сонорными согласными этот контраст ослабляется.

5. Контраст по частоте Б2: количественно характеризуется величиной перепада частоты второй форманты (Б2) на начальном переходном участке гласного (табл. 1).

Таблица 1

Значения контраста по F2 в слогах СГ (С — любой согласный), по данным [Бондарко, 1977: 146]

Величина перепада между значением

Б2 в начале и в конце переходного Слог

участка, Гц с учетом знака

-400 па, ба, ма, фа, ва, ла

0... — 100 ка, га, ха

100 та, да, на, са, за, ца, ра, ша

500 все слоги С'а

-100 по, бо, мо, фо, во, ло

400 то, до, но, со, зо, до, ро, то

1000 п'о, б'о, м'о, ф'о, в'о

1100 т'о, д'о, н'о, с'о, з'о, л'о, р'о, к'о, г'о, х'о

0... — 100 ко, го, хо

0 бу, му, фу, ву, ку, гу, ху, лу

500 ту, ду, су, зу, ну, шу, жу

1100 п'у, б'у, м'у, ф'у, в'у

1200 т'у, д'у, с'у, з'у, л'у, р'у, г'у, н'у

-500 ле

-400 пе, бе, ме, фе, ве

0 те, де, се, зе, не, ше, же, ре

100 С'е

-900 пы, бы, мы, фы, вы, лы, ты, ды, сы, зы, ны, ры

0 С'и

При восприятии речи в шуме наблюдается так называемый эффект маскировки — изменение слуховой чувствительности к маскируемому сигналу под воздействием маскирующего [Алдошина, 2000]. В нашем эксперименте мы использовали следующие виды шума:

- белый шум — стационарный шум, спектральные составляющие которого равномерно распределены по всему диапазону частот;

- розовый шум — стационарный шум, равномерно убывающий по логарифмической шкале частот.

Эффект маскировки слоговых контрастов под воздействием указанных типов шумов должен проявляться, по-видимому, следующим образом:

• маскировка наиболее выражена, когда частоты маскируемого и маскирующего звука близки. Таким образом, можно ожидать, что эффект маскировки белым шумом не будет зависеть от частотных характеристик маскируемого звука, в то время как эффект маскировки розовым шумом будет сильнее для звуков с низкими частотами;

• степень маскировки увеличивается с увеличением интенсивности маскирующего звука. В наших экспериментальных условиях, когда интенсивность шума будет постоянной, а интенсивность участков речевого сигнала разной (в зависимости от собственных акустических свойств произносимого слога), этот принцип можно переформулировать так: «степень маскировки увеличивается с уменьшением интенсивности маскируемого звука относительно шума»;

• при условии большой интенсивности маскера, маскировка заметно более выражена по отношению к звукам высокой частоты. Речевой сигнал в принципе имеет относительно небольшой диапазон частот, однако можно предположить, что те акустические ключи, которые расположены в более низкой частотной области, будут подвергаться маскировке в меньшей степени, чем те, которые располагаются в более высокой частотной области.

При составлении тестовых слоговых таблиц с разной степенью потенциальной помехоустойчивости мы руководствовались следующими соображениями:

• речевые единицы, характеризующиеся большей интенсивностью, можно считать более помехоустойчивыми;

• такие акустические ключи, как наличие/отсутствие основного тона и наличие/отсутствие формантной структуры можно считать более помехоустойчивыми, так как они находятся в области более низких частот, и, следовательно, в меньшей степени подвергаются маскировке;

• Б-картину гласного можно считать помехоустойчивым («надежным») акустическим ключом для распознавания слога;

• конфигурационные характеристики формант (формантные треки) также можно считать надежным акустическим ключом для распознавания слога;

• шумные согласные, у которых наибольшая и достаточно выраженная интенсивность шума приходится на область низких частот, можно считать потенциально более помехоустойчивыми, чем согласные, у которых при прочих равных условиях наибольшая интенсивность шума приходится на область высоких частот.

На основании изложенных соображений для проведения перцептивного эксперимента нами были составлены три тестовые таблицы, одна из которых содержала потенциально наиболее помехоустойчивые слоги, вторая — средние по помехоустойчивости и третья — наименее помехоустойчивые. При этом мы руководствовались следующими критериями относительно конкретных акустико-фонетических характеристик компонентов слога:

1) шумность-сонорность согласного.

Сонорные согласные обладают ярко выраженной формантной структурой и в целом являются более надежными акустическими ключами для восприятия слога, чем шумные согласные. Однако восприятие слога в этом случае может зависеть от фонемного состава слога, величины перепада частоты Б2 и веса других признаков слогового контраста. К сонорным по данному признаку примыкают согласные [в] и [й], которые также обладают выраженной формант-ной структурой;

2) интенсивность шумового компонента шумного согласного. Глухие и звонкие шумные согласные отличаются друг от друга по

наличию основного тона, который маскируется шумом в меньшей степени. Однако для того, чтобы различать глухие согласные между собой, так же, как и звонкие, необходимо располагать и акустической информацией о шумовом компоненте согласного. Степень маскировки шумового компонента согласного зависит как от области его частотной локализации в спектре, так и от его интенсивности и длительности. Слоги с более интенсивными шумными согласными можно считать наиболее помехоустойчивыми по этому признаку. К ним относятся прежде всего слоги, содержащие сибилянты: [с], [с'], [з], [з'], [ш], [ш'], [ц], [ч'] и аффрицированные смычные типа [т'], [д']. Наименьшей интенсивностью шумных участков и, следовательно, наименьшей помехоустойчивостью должны обладать в русском языке прежде всего глухие согласные [х], [х'], [ф], [ф'], [т], [п], [п'], [к], [к'];

3) интенсивность гласного.

Участки гласных содержат большое количество акустических ключей, важных для распознавания слогов. По критерию интенсив-

ности к наиболее помехоустойчивым будут, скорее всего, относиться слоги с гласным [а], который является наиболее интенсивным из гласных. К наименее помехоустойчивым — слоги с гласными компонентами [и] и [у], наименьшими по интенсивности;

4) слоговой контраст по Б2.

Б-картина гласного является надежным акустическим ключом для распознавания речи в шуме. Слоги, в которых перепад Б2 максимально информативен, должны быть наиболее помехоустойчивыми по данному признаку. Однако надо учитывать не только степень выраженности данного контраста, т.е. величину перепада между значением Б2 на начальном и стационарном участке, но и информативность Б-картины. Под информативностью мы понимаем количество контекстов, для которых характерен тот или иной тип переходного участка: чем меньше это количество, тем более информативной считается Б-картина.

Например, Б-картина гласного одинакова для всех слогов типа С'и, а также для всех слогов типа С'е и всех слогов типа С'а, см. табл. 1. В подобных случаях мы будем считать ее малоинформативной.

Таким образом, слоги, в которых перепад Б2 максимально информативен, мы будем считать наиболее помехоустойчивыми по данному признаку;

5) частота встречаемости слога в речи.

В условиях недостаточности акустической информации для однозначной идентификации сообщения при отсутствии контекстной информации слушающий принимает решение в пользу наиболее частотного варианта из возможных. В связи с этим более помехоустойчивыми являются более частотные слоги русского языка, а менее помехоустойчивыми — менее частотные.

Ниже приведена сводная таблица потенциально помехоустойчивых и помехонеустойчивых слогов по каждому из описанных критериев в отдельности.

3. Методика подготовки артикуляционных (слоговых) таблиц с тремя типами помехоустойчивости. На основе табл. 2.1 была проведена дальнейшая работа по подготовке слоговых таблиц трех степеней помехоустойчивости, которые служили материалом для перцептивного эксперимента.

Интегральная помехоустойчивость таблицы определяется помехоустойчивостью входящих в нее элементов. Показателем помехоустойчивости элемента таблицы является относительно высокий уровень его разборчивости в шуме, и наоборот, элементы, имеющие низкий уровень разборчивости в шуме, мы называем помехонеу-стойчивыми.

Таблица 2.1

Помехоустойчивость разных типов слогов

Критерии Устойчивые Неустойчивые

Шумность-сонорность согласного слоги с согласными [м], [н], [р], [л], [й], [в] слоги с шумными согласными (кроме [в])

Интенсивность шумового компонента шумного согласного слоги с согласными [ш], [с], [ш'], [с'] [ч], [ц] слоги с согласными [п], [б], [ф], [х] и их мягкими аллофонами

Интенсивность гласного слоги с относительно широкими гласными неверхнего подъема [а], [е], [о] слоги с узкими гласными верхнего подъема [у], [и], [ы]

Слоговой контраст по частоте F2 па, ба, ма, фа, ва, ла ка, га, ха по, бо, мо, фо, во, ло п'о, б'о, м'о, ф'о, в'о ко, го, хо п'у, б'у, м'у, ф'у, в'у ле пе, бе, ме, фе, ве С'и С'е С'а

Частотность наиболее частотные наименее частотные

Элементами таблиц в нашем исследовании являются слоги русского языка структуры СГ. Всего было составлено три тестовые таблицы, одна из которых содержала потенциально наиболее помехоустойчивые слоги (1), вторая — средние по помехоустойчивости (2) и третья — наименее помехоустойчивые (3).

При подготовке таблиц все слоги были условно разделены по каждому из критериев табл. 2.1 на помехоустойчивые (+) и помехо-неустойчивые (—). Для критериев «интенсивность шумового компонента согласного», «контраст по F2» и «частотность» была также введена оценка «±», так как по этим критериям выделяются единицы, которые трудно однозначно отнести к той или иной группе. По совокупности оценок, установленных по каждому отдельному критерию, для каждого слога была определена та артикуляционная таблица (из трех), к которой он был отнесен в соответствии с суммарной оценкой прогнозируемой помехоустойчивости (табл. 2.2).

При отнесении слога в ту или иную группу мы руководствовались некоторыми дополнительными соображениями относительно потенциальной значимости отдельного признака для восприятия речи в шуме:

• признак шумности-сонорности согласного имеет наибольший вес, так как его важность для распознавания в шуме была доказана в экспериментальных исследованиях [Phatak, Lovitt, Allen 2008; Wang, Bilger 1973];

• признак слогового контраста по Б2 имеет большой вес, так как мы исходим из предположения, что акустические ключи, находящиеся на участках гласных, наиболее устойчивы к шуму;

• критерий частотности оказывается решающим в тех случаях, когда по остальным (акустическим) признакам слоги относятся к помехонеустойчивым.

Таблица 2.2

Влияние критериев помехоустойчивости на включение слога в артикуляционную таблицу определенной степени помехоустойчивости

Шумность—сонорность + + +

Интенсивность шумового - - - + + ± ± ± - - -

компонента шумного со- -

гласного

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Слоговой контраст по F2 + - ± ± ± + ± ± + - - -

± - - - - - ±

Частотность + + - + ± + + - + + ± -

± ± - ± -

Интенсивность гласного + + + + + + + + + + + -

Тип (номер) таблицы 1 2 2 1 2 1 2 3 1 2 3 3

В результате все возможные слоги СГ с полноартикулируемым гласным (180 единиц) были размещены в артикуляционные таблицы с определенной степенью помехоустойчивости (разборчивости). Ниже в качестве иллюстрации приводится таблица слогов с потенциально минимальной степенью разборчивости в условиях шума (в табл. 2.3 слоги записаны в широкой фонетической транскрипции, т.е. с различением основных звукотипов русского языка).

Таблица 2.3

Слоги с низкой степенью помехоустойчивости

де ф'о пе х'е бо зе ху г'и б'у з'а

х'о ф'а г'о фо з'у г'у ф'е б'о т'у хы

к'а фе т'а фы д'а пы к'у те х'а ды

ф'и п'о Ф'у зо к'е бе хе п'а з'о х'и

к'о п'у х'у б'а т'о г'е

4. Перцептивный анализ помехоустойчивости составленных слоговых таблиц. Помехоустойчивость составленных таблиц исследовалась посредством аудитивного тестирования на разборчивость в нормальных условиях и в шуме. Слоговые элементы каждой таблицы были начитаны диктором (женский голос) — носителем орфоэпической нормы русского языка. Каждый слог в таблице повторялся два раза. Пауза между повторами составляла две секунды, а пауза

между вторым повтором и следующим слогом — три секунды. На оцифрованные записи в звуковом редакторе Adobe Audition CS6 накладывался белый или розовый шум в соотношении 0 Дб2. Каждая таблица предъявлялась слушателям в трех вариантах записи: без наложения шума, с наложением белого шума и розового шума.

Экспериментальные комплекты аудиозаписей были составлены таким образом, чтобы внутри одного комплекта присутствовали все три таблицы и все три режима. Таким образом, получилось шесть экспериментальных комплектов. Испытуемыми были 15 студентов от 19 до 23 лет с нормальным слухом, девять женского пола и шесть мужского пола. Родной язык для всех испытуемых — русский, все они являлись носителями стандартного московского произношения.

Каждому испытуемому предлагался для прослушивания один из экспериментальных комплектов. Задача испытуемого состояла в том, чтобы записать в протокол в русской орфографии слоги, которые он слышит на аудиозаписи. В случае затруднения ставился знак «0». Перед прослушиванием экспериментального материала предлагался тренировочный материал из пяти слогов — элементов «средней» таблицы в нормальных условиях. Тренировочный материал можно было прослушивать неограниченное количество раз. Громкость устанавливалась таким образом, чтобы испытуемый чувствовал себя комфортно. Каждая тестовая запись предъявлялась один раз в присутствии экспериментатора.

Всего в результате эксперимента было получено 2700 реакций. Разборчивость каждого слога рассчитывалась как процент правильного распознавания от общего количества предъявлений слога в данном режиме. Ниже приводится средний интегральный показатель разборчивости составленных нами слоговых таблиц, полученный с учетом показателей разборчивости каждого отдельного слога в таблице.

Таблица 3

Средний интегральный показатель разборчивости слоговых таблиц

Таблица 1 Таблица 2 Таблица 3

Без шума 0,98 0,97 0,95

Розовый шум 0,90 0,72 0,47

Белый шум 0,89 0,70 0,48

В результате тестирования было установлено, что слоговая разборчивость слоговых элементов составленных таблиц примерно одинакова при отсутствии шумовой помехи и значительно отличается

2 При соотношении «сигнал/шум», равном 0 Дб, средний амплитудный уровень наложенного шума равен среднему уровню сигнала.

при белом и розовом шуме. Это говорит о том, что учитываемые в таблицах признаки слога, такие как шумность-сонорность согласного, интенсивность шумового компонента шумного согласного, слоговой контраст по частоте Б2, интенсивность гласного и частотность слога, являются значимыми для оценки помехоустойчивости слога. Обнаружено также, что слоги, содержащие сочетания мягких заднеязычных согласных с гласными среднего и заднего ряда обладают в условиях шумовой помехи разборчивостью, близкой к нулю, а слоги с сонорными согласными в целом оказались наиболее помехоустойчивыми. Среди сонорных следует выделить носовые согласные, которые испытуемые часто путали между собой. Это происходило в тех слогах, где данные согласные были мягкими. Объясняется это тем, что некоторая часть информации о формантной картине, осложненной к тому же влиянием назальных антиформант на переходном участке гласного всё же теряется в условиях шумовой помехи, а при наличии и-образного перехода на гласном не так заметно на слух понижение формант, вызванное соседством губного согласного, которое и является основным отличием в акустической картине слогов с носовыми [м'] и [н'].

В ходе эксперимента также выяснилось, что в шуме слоги с фрикативными согласными часто опознаются как слоги со взрывными или аффрикатами того же места образования. Так, в ответах испытуемых [с] исходного слога часто заменяется на [ц], [ш'] на [ч'], [з'] на [д'] и т.п. В реальной речи относительно долгий шумный участок фрикативного согласного часто неравномерен по своей интенсивности. Возможно, что из-за эффекта маскировки менее интенсивные участки фрикативного согласного не прослушиваются, а следующий за ними краткий пик интенсивности шума воспринимается как короткий по длительности шумовой участок, характерный для взрывных или аффрикат. Таким образом, к описанным выше критериям помехоустойчивости можно добавить критерий способа образования, где «фрикативный» будет относиться к по-мехонеустойчивым признакам. Исключение составляют шипящие согласные [ж] и [ш], для которых в русском языке нет взрывных того же места образования.

5. Заключение. Основная цель данного исследования заключалась в том, чтобы по определенной методике построить и произвести перцептивный анализ артикуляционных слоговых таблиц, в которых учитывалась бы разная степень потенциальной помехоустойчивости к шумовым помехам открытых слогов русского языка с разными типами акустического слогового контраста.

Несмотря на то что выработанная нами система критериев оказалась достаточной для составления нужных слоговых таблиц, полноту

решения этой задачи можно увеличить. С учетом использованных нами критериев, а также результатов перцептивного анализа, можно разработать более детальную систему оценок помехоустойчивости слогов рассматриваемого нами типа. С ее использованием, возможно, удастся создать таблицы, которые будут еще более существенно отличаться по помехоустойчивости друг от друга, и достичь большей однородности элементов внутри каждой таблицы с точки зрения их помехоустойчивости к определенным шумам. Можно отметить еще несколько направлений, в которых целесообразно продолжать данное исследование.

1. Слоговой материал таблиц можно расширить слогами другой структуры и слогами, в которых используются не только ударные аллофоны гласных фонем. Кроме того, материалом для исследований подобного рода могут служить не только слоги. Интересно также проанализировать восприятие речи в шуме на материале более крупных единиц речи.

2. В нашем исследовании была сделана попытка выявить зависимость эффекта маскировки, который оказывает шум на восприятие речи, от спектральных характеристик шума — белого и розового. Значимых отличий для распознавания речи с наложением этих видов шума выявлено не было, но, возможно, если экспериментировать с разным соотношением «сигнал/шум» и различными спектральными характеристиками шума, могут быть получены более яркие и значимые результаты.

3. Наконец, восприятие в шуме можно сравнивать с другими видами помех и выяснить, какие свойства речевых единиц обеспечивают их общую перцептивную устойчивость, а какие обеспечивают устойчивость только к какому-то конкретному виду помех.

Список литературы

Алдошина И. Основы психоакустики. М., 2000.

Бондарко Л.В. Звуковой строй современного русского языка. М., 1977. Венцов А.В., Касевич В.Б. Современные модели восприятия речи: критический обзор. Проблемы восприятия речи. СПб., 1994. Елкина В.М., Юдина Л.С. Статистика слогов русской речи // Вычислительные системы. Новосибирск, 1964. Зиновьева Н.В. Система акустических ключей к распознаванию фонетических единиц русского языка // Экспериментальная фонетика. М., 1989.

Кодзасов С.В., Кривнова О.Ф. Общая фонетика. М., 2001. Штерн А.С. Перцептивный аспект речевой деятельности. СПб., 1992. Ягу нова Е.В. Восприятие согласных фонем и их дифференциальных признаков (экспериментально-фонетическое исследование на ма-

териале русского языка): Автореф. дисс. ... канд. филол. наук. СПб., 1994.

Phatakhatak S., Lovitt A., Allen J. Consonant confusions in white noise //

J. Acoust. Soc. Am. 124. 2008. Wang M.D., Bilger R.C. Consonant confusions in noise: a study of perceptual features // J. acoust. Soc. Am. 54. 1973.

Stanislav A. Kreychi, Olga F. Krivnova, Ekaterina A. Tikhonova

SYLLABIC CONTRASTS AS A FACTOR

OF SPEECH IMMUNITY DURING PERCEPTION IN NOISE

Lomonosov Moscow State University

1 Leninskie Gory, Moscow, 119991

This paper is devoted to a study of the syllabic acoustic contrasts in CV syllables as the main factor of speech immunity when being masked by noise. In the introduction and section 2 the concept of syllabic contrast is discussed, as well as an assessment of the potential noise immunity of different types of acoustic contrasts, and the main objectives of the study are also formulated. Section 3 describes a method of preparation of test syllabic tables with different degrees of potential noise immunity for the study of their perception in noise, in particular with the goal to identify the most robust to noise acoustic-phonological phonemes' features in the structure of the syllable. Section 4 describes the design and the results of the perceptual experiment conducted in this study for the analysis of noise immunity ofthe composed syllabic tables when speech signal is masked by noise. Three types of test tables were used in the perception test: with syllables, that are potentially most proof against noise, with syllables of average stability and with syllables of the least stability. For noise masking of speech signals two types of noise were used: white — stationary noise spectral components which are evenly distributed over the entire range of frequencies and pink — stationary noise, uniformly decreasing on a logarithmic frequency scale. The results of perception tests show that noise immunity (intelligibility) of the composed tables is about the same in the absence of noise interference and significantly different when being masked with white and pink noise. The conclusion summarizes the research and discusses promising directions in which it would be possible to continue the study.

Key words: test pattern production; audio testing; noise immunity; white noise; pink noise; syllable intelligibility; acoustic and phonological syllable characteristics.

About the authors: Stanislav A. Kreychi — researcher at the faculty of Philology of Moscow Lomonosov state University (e-mail: kreychi@mail.ru); Оlga F. Srivnova — doctor of Philology, leading researcher of the faculty of Philology of Moscow Lomonosov state University (e-mail: okrivnova@mail.ru); Ekaterina A. Tikhonova — bachelor of the faculty of Philology of Moscow Lomonosov state University (e-mail: tikhonova.k.012@gmail.com).

References

Aldoshina I. (2000) Fundamentals of psychoacoustics [Osnovy psihoakustiki]. M.

Bondarko L.V. Xhe Sound system of the modern Russian language [Zvukovoj stroj sovremennogo russkogo jazyka]. M., 1977.

Ventsov A. V., Kasevich V.B. Modern models of speech perception [Sovre-mennye modeli vosprij atij a russkoj rechi]: a critical review. Problems of speech perception. SPb, 1994.

Elkina V.M., Yudina, L.S. Syllable statistics of Russian speech [Statistical slogov russkoj rechi]. The Computing systems [Kompjuternyje sistemy]. Novosibirsk, 1964.

Zinovieva N.V. A system of acoustic keys to recognition of phonetic units of the Russian language [Sistema akusticheskih rliuchej k raspozna-vaniju foneticheskih edinits russkogo jazyka]. Experimental phonetics [eksperimental'naja fonetika]. M., 1989.

Kodzasov S.V., Krivnova O.F. General phonetics [Obschaja fonetika]. M., 2001.

Stern A.S. Perceptual aspect of speech activity [Pertsepivnyj aspect rechevoj dejatelnjsti]. SPb, 1992.

Yagunova E.V. Perception of consonant phonemes and their distinctive features [Vosprij atie soglasnyh fonem I ih differentsialnyh priznakov]. The dissertation on competition of a scientific degree of candidate of philological Sciences. SPb, 1994.

Phatak S., Lovitt A., Allen J. Consonant confusions in white noise. J. Acoust. Soc. Am. 124. 2008.

Wang M.D., Bilger R.C. Consonant confusions in noise: a study of perceptual features. J. acoust. Soc. Am. 54. 1973.

i Надоели баннеры? Вы всегда можете отключить рекламу.