Научная статья на тему 'ВЛИЯНИЕ ТИПА УДАРЕНИЯ И ПОЗИЦИИ ГЛАСНОГО ВО ФРАЗЕ НА ШИРИНУ ЕГО ФОРМАНТ'

ВЛИЯНИЕ ТИПА УДАРЕНИЯ И ПОЗИЦИИ ГЛАСНОГО ВО ФРАЗЕ НА ШИРИНУ ЕГО ФОРМАНТ Текст научной статьи по специальности «Математика»

CC BY
88
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
LEXICAL STRESS / EMPHATIC STRESS / FORMANT / FORMANT BANDWIDTH / RUSSIAN LANGUAGE / LINGUISTIC EXPERIMENT / УДАРЕНИЕ / ЭМФАТИЧЕСКОЕ УДАРЕНИЕ / ФОРМАНТА / ШИРИНА ФОРМАНТЫ / РУССКИЙ ЯЗЫК / ЛИНГВИСТИЧЕСКИЙ ЭКСПЕРИМЕНТ

Аннотация научной статьи по математике, автор научной работы — Баталин Сергей Васильевич

В статье представлены результаты экспериментального изучения влияния типа ударения, позиции слова в составе фразы и взаимодействия этих факторов на ширину формант гласного звука [a]. Актуальность работы обусловлена важностью выявления акустических коррелятов ударения для создания качественного синтеза речи и распознавания эмоций. Цель исследования - определение закономерностей в изменении ширины формант при произнесении с нейтральным и эмфатическим ударением гласного звука [a] в слове, занимающем начальную, срединную и конечную позиции во фразе. Акустический анализ выполнен с помощью программы Praat. Полученные данные обработаны с использованием методов дисперсионного анализа, позволивших обнаружить, что позиция слова во фразе оказывает влияние на ширину первых четырех формант гласного звука, при этом изменения значений разнонаправлены и в значительной степени определяются особенностями идиолекта информантов. Взаимодействие факторов фразовой позиции гласного и типа ударения является статистически значимым в произношении всех привлеченных к эксперименту информантов. В результате эксперимента установлены особенности изменения ширины формант при реализации различных типов ударения в зависимости от позиции слова в составе фразы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE IMPACT OF LEXICAL STRESS TYPE AND POSITION OF A VOWEL WITHIN A PHRASE ON VOWEL FORMANT BANDWIDTHS

The article sets out to explore the impact of different types of lexical stress and word position within a phrase as well as the interaction of these factors on formant bandwidths. The findings contribute to establishing the role of these formant features as acoustic correlates of the Russian lexical stress. The experimental material for analysis is presented by the Russian sound [a] embedded in a word in a natural language carrier phrase. The word position is changed from phrase initial to the phrase final one and in each position the target word is uttered with a neutral and an emphatic stress by four speakers. The Praat software is used to extract the mean values of the first four formant bandwidths of the target vowel. Two-way ANOVA is carried out to establish the significance of difference between neutrally and emphatically stressed vowels in all the three phrasal positions. The impact of phrasal position and stress type is clearly pronounced and is valid for all the four speakers. Specific trends in bandwidth alterations are hard to identify in most cases because of inconsistent fluctuations of formant bandwidths and a heavy influence of the speakers’ idiolects: formant bandwidths expand, contract or remain unchanged. An explanation of the results obtained is suggested.

Текст научной работы на тему «ВЛИЯНИЕ ТИПА УДАРЕНИЯ И ПОЗИЦИИ ГЛАСНОГО ВО ФРАЗЕ НА ШИРИНУ ЕГО ФОРМАНТ»

www.volsu.ru

РАЗВИТИЕ И ФУНКЦИОНИРОВАНИЕ РУССКОГО ЯЗЫКА

о

(N О (N

DOI: https://doi.Org/10.15688/jvolsu2.2020.3.1

UDC 811.161.1'342.4 Submitted: 01.04.2019

LBC 81.411.2-1 Accepted: 28.02.2020

THE IMPACT OF LEXICAL STRESS TYPE AND POSITION OF A VOWEL WITHIN A PHRASE ON VOWEL FORMANT BANDWIDTHS

Sergey V. Batalin

Volgograd State Technical University, Volgograd, Russia

Abstract. The article sets out to explore the impact of different types of lexical stress and word position within a phrase as well as the interaction of these factors on formant bandwidths. The findings contribute to establishing the role of these formant features as acoustic correlates of the Russian lexical stress. The experimental material for analysis is presented by the Russian sound [a] embedded in a word in a natural language carrier phrase. The word position is changed from phrase initial to the phrase final one and in each position the target word is uttered with a neutral and an emphatic stress by four speakers. The Praat software is used to extract the mean values of the first four formant bandwidths of the target vowel. Two-way ANOVA is carried out to establish the significance of difference between neutrally and emphatically stressed vowels in all the three phrasal positions. The impact of phrasal position and stress type is clearly pronounced and is valid for all the four speakers. Specific trends in bandwidth alterations are hard to identify in most cases because of inconsistent fluctuations of formant bandwidths and a heavy influence of the speakers' idiolects: formant bandwidths expand, contract or remain unchanged. An explanation of the results obtained is suggested.

Key words: lexical stress, emphatic stress, formant, formant bandwidth, Russian language, linguistic experiment.

Citation. Batalin S.V. The Impact of Lexical Stress Type and Position of a Vowel Within a Phrase on Vowel Formant Bandwidths. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 2. Yazykoznanie [Science Journal of Volgograd State University. Linguistics], 2020, vol. 19, no. 3, pp. 5-15. (in Russian). DOI: https://doi.org/ 10.15688/jvolsu2.2020.3.1

УДК 811.161.1'342.4 Дата поступления статьи: 01.04.2019

ББК 81.411.2-1 Дата принятия статьи: 28.02.2020

ВЛИЯНИЕ ТИПА УДАРЕНИЯ И ПОЗИЦИИ ГЛАСНОГО ВО ФРАЗЕ НА ШИРИНУ ЕГО ФОРМАНТ

Сергей Васильевич Баталин

Волгоградский государственный технический университет, г. Волгоград, Россия

рд Аннотация. В статье представлены результаты экспериментального изучения влияния типа ударения, ^ позиции слова в составе фразы и взаимодействия этих факторов на ширину формант гласного звука [а]. § Актуальность работы обусловлена важностью выявления акустических коррелятов ударения для создания ¡д качественного синтеза речи и распознавания эмоций. Цель исследования - определение закономерностей в изменении ширины формант при произнесении с нейтральным и эмфатическим ударением гласного звука [а]

в слове, занимающем начальную, срединную и конечную позиции во фразе. Акустический анализ выполнен с помощью программы Ргаа1. Полученные данные обработаны с использованием методов дисперсионного анализа, позволивших обнаружить, что позиция слова во фразе оказывает влияние на ширину первых четырех формант гласного звука, при этом изменения значений разнонаправлены и в значительной степени определяются особенностями идиолекта информантов. Взаимодействие факторов фразовой позиции гласного и типа ударения является статистически значимым в произношении всех привлеченных к эксперименту информантов. В результате эксперимента установлены особенности изменения ширины формант при реализации различных типов ударения в зависимости от позиции слова в составе фразы.

Ключевые слова: ударение, эмфатическое ударение, форманта, ширина форманты, русский язык, лингвистический эксперимент.

Цитирование. Баталин С. В. Влияние типа ударения и позиции гласного во фразе на ширину его формант // Вестник Волгоградского государственного университета. Серия 2, Языкознание. - 2020. - Т. 19, №2 3. -С. 5-15. - DOI: https://doi.Org/10.15688/jvolsu2.2020.3.1

Введение

В настоящее время направление многих лингвистических исследований определяется задачами автоматического распознавания эмоций и высококачественного синтеза речи. Важную роль в их решении играет качество звуков речи, которое в соответствии с положениями линейной теории порождения звука определяется формантными частотами и шириной формантных диапазонов. При анализе роли ширины формант исследователи отмечают, что этот параметр является одним из маркеров тембра гласных звуков [The Effect..., 2007] и используется слушающими для определения психофизических различий между гласными [Easwar, Scollie, Purcell, 2019]. Кроме того, анализ ширины формант при первичном описании гласных для автоматического обнаружения звуков позволяет снизить их ложное распознавание [Чудновская, 1997].

Сложность измерения значений ширины формант определяется не только необходимостью учета физиологических факторов, таких как импеданс и диссипативные потери в тканях голосового тракта [Фант, 1964, с. 129; Hanna, Smith, Wolfe, 2016], но и техническими причинами, к которым относятся используемые методы измерения ширины формантного диапазона [Kent, Vorperian, 2018; Medabalimi, Seshadri, Bayya, 2014]. Тем не менее к настоящему времени накоплен достаточный объем эмпирических данных, позволяющий оценить особенности функционирования анализируемого акустического параметра. В первую очередь рассмотрим роль ширины формант как акустического коррелята ударения. Необходи-

мо отметить, что в соответствии с положениями линейной теории порождения звука ширина формант может определять энергию звука и, соответственно, является одним из коррелятов громкости. В настоящее время общепризнан тот факт, что звуковая энергия, распределенная по нескольким диапазонам, воспринимается громче, чем та же энергия, распределенная в пределах одного критического диапазона [Glasberg, Moore, 2002; Zwicker, Flottorp, Stevens, 1957]. Так, Г. Фант обращал внимание на значимость более высоких частотных областей, подчеркивая, что при усилении голосового напряжения (характерного для произнесения ударных гласных. - С. Б.) наблюдается усиление высокочастотных формант [Фант, 1964, с. 131]. К аналогичным выводам приходят А. Слюйтер и В. Хевен, также установившие, что выделение ударного гласного сопровождается усилением форман-тных частот в среднем и высоком диапазонах, в то время как усиление интенсивности в нижней части спектра (ниже 500 Гц) является незначительным. Кроме того, лингвистами отмечается, что одним из акустических коррелятов ударения выступает неполное смыкание голосовой щели, определяющее ширину диапазона F1 [Sluijter, Van Heuven, 1996]. Ф. Тамбурини и К. Кейни, исследуя распределение энергии в различных диапазонах ударных и безударных слогов, выделяют три основных диапазона: 0-300 Гц, 300-2200 Гц и 2200-4000 Гц. Если распределение энергии в нижнем и верхнем диапазонах практически совпадает для ударных и безударных гласных, то в центральном диапазоне (300-2200 Гц) отличие между ударными и безударными глас-

ными носит явно выраженный характер. На основании этих данных авторы делают вывод об увеличении энергии ударных гласных в средней и центральной частях спектра звуков [Tamburini, Caini, 2005]. Таким образом, усиление области высоких частот признается более надежным признаком ударения, чем равномерное повышение интенсивности звука во всех диапазонах.

В отличие от нейтрального ударения, эмфатическое ударение выражает некоторую эмоциональную окраску ударного гласного, поэтому закономерно возникает вопрос о том, в какой степени произнесение слова с эмфатическим ударением может модифицировать ширину формант. Поскольку нам не удалось найти в литературе данных о связи ширины формант с эмфатическим ударением, рассмотрим имеющиеся результаты о влиянии эмоционально окрашенной речи на данный акустический параметр. Так, Л.В. Златоусто-ва установила, что во фразах, выражающих положительные эмоции, увеличивается суммарная энергия гласных в верхней части их диапазона. Отрицательные эмоции, наоборот, сопровождаются сужением ширин формант-ных полос, что приводит к падению энергии гласных в верхней части диапазона [Златоус-това, 1983]. Данный факт можно подтвердить целым рядом наблюдений, сделанных лингвистами в разное время. Так, Г. Фант обращал внимание на значимость более высоких частотных областей в эмоциональной речи [Фант, 1964, с. 131]. Э.А. Нушикян отмечала смещение спектральной энергии в области более высоких частот (F3 и F4) при выражении сильных эмоций - радости, гневного возмущения, ярости, изумления и др. В таких случаях наблюдалось расширение частотных областей всех формант и повышение их энергии на 2030 % [Нушикян, 1986, с. 106]. По данным К. Шерера, выражение гнева, отвращения и страха сопровождается сужением диапазона форманты F1 [Scherer, 1986]. Зависимость ширины диапазона BW1 от типа передаваемой эмоции также установлена К. Гоблом и А. Чазедом [Gobl, Chasaide, 2003]. Изменение значений ширины формантных диапазонов объясняет, почему в настоящее время данный параметр регулярно используется исследователями в качестве одного из признаков, ха-

растеризующих эмоционально окрашенную речь в различных языках [Petrushin, 2000; Mannepalli, Sastry, Suman, 2018; Ververidis, Kotropoulos, 2006].

Исходя из вышесказанного, выдвинем предположение, что степень ударности гласного и эмоциональная окраска высказывания могут выступать в качестве фактора, определяющего вариативность ширины диапазонов формантных частот. Кроме того, отметим еще один фактор, способный задавать вариативность формант, - позицию звука в составе фразы. Хотя в литературе отсутствуют данные о влиянии этого параметра на ширину формантных диапазонов, ряд наблюдений о влиянии фразовой позиции на формантные частоты звуков [Баталин, 2019; Валуйцева, Ху-туни, 2016; Koolagudi, Rao, 2012] позволяет предположить, что такая зависимость существует. Выдвинутая гипотеза определяет необходимость экспериментального анализа изменений ширины формант в зависимости от позиции звука в составе фразы (начальная -срединная - конечная) и типа ударения (нейтральное vs эмфатическое).

Методика организации и проведения эксперимента

В качестве экспериментального корпуса были использованы фразы с гласным [a], включенным в стандартный непосредственный фонетический контекст - слово «Стас». Фразы имели идентичный сегментный состав, а анализируемое слово занимало начальную, срединную и конечную фразовые позиции. В каждой позиции слово произносилось с нейтральным и эмфатическим ударением по двадцать раз, общее количество реализаций аллофона [a], использованных для анализа, составило 480 единиц. В роли дикторов выступили четверо носителей русского литературного произношения - два мужчины и две женщины в возрасте от 25 до 45 лет. Последующий аудиторский анализ, выполненный 28 непрофессиональными аудиторами, показал правильность идентификации типа ударения в 93 % случаев. В связи с поставленными задачами исследования для измерения значения ширины формант BW1, BW2, BW3 и BW4 звука [а] в слове Стас была использована программа Praat.

Полученные результаты оценивались с помощью факторного анализа.

Результаты и обсуждение

Для оценки степени дикторских различий сравнивалась ширина диапазонов формант гласного [а], произнесенного с нейтральным и эмфатическим ударением и занимающего начальную, срединную и конечную позиции во фразе. Поскольку факторный анализ показал наличие статистически значимых различий между привлеченными к эксперименту дикторами (Rao's R=32,81146; df1 = 18; df2 = 1332; p = 0,00), последующий анализ был проведен отдельно для каждого из привлеченных к эксперименту информантов. Значения ширины формантных частот диктора БС представлены на рисунке 1.

В произношении диктора БС отметим прежде всего статистически достоверное влияние фразовой позиции на ширину первой форманты BW1 гласного [а], произнесенного с нейтральным ударением. Апостериорные сравнения показали, что ширина форманты BW1 в конечной позиции превышает соот-

ветствующие значения в начальной и срединной позициях во фразе. Что касается ширины формант BW2, BW3 и BW4, то статистически достоверных различий в их значениях в зависимости от фразовой позиции гласного выявлено не было. Анализ произнесения гласного [а] с эмфатическим ударением показал, что влияние фразовой позиции в этом случае является более выраженным, нежели в случае с нейтральным ударением. При произнесении с эмфатическим ударением позиция гласного оказывала статистически достоверное влияние на ширину диапазонов первых трех формант: для BW1 и BW3 наблюдалось расширение диапазонов формант F1 и F3 в конечной фразовой позиции, а диапазон BW2 в начале фразы был меньше соответствующих диапазонов форманты F2 в середине и конце фразы. Статистически достоверных отличий в значениях ширины диапазона BW4 в составе фразы выявлено не было. Значения F-крите-рия и вероятностей, использованные для оценки влияния фразовой позиции на ширину формант для двух типов ударения в речи четырех информантов, приведены в таблице; ста-

900 800 700 600 500 400 300 200 100 0 -100

POSITION'STYLE: LS Means Wilks lambda= 66908 F(8. 222)=6 1754 p= 00000 Effective hypothesis decomposition Vertical bars denote 0 95 confidence inten/als

POSITION: begin

middle

end

POSITION: begin

middle

end

3E BW1 IE BW2

JE BW3

STYLE neutral STYLE emph 5E BW4

Рис. 1. Ширина формант гласного [а], произнесенного с нейтральным и эмфатическим ударением,

в различных позициях во фразе (диктор БС)

Fig. 1. Formant bandwidths of the Russian vowel [a] uttered with neutral and emphatic stresses

in various phrasal positions (speaker BS)

тистически достоверные отличия (р < 0,05) выделены жирным шрифтом.

Взаимодействие фактора фразовой позиции и типа ударения является статистически достоверным для диктора БС: F(8, 222) = 6,754; р = 0,0000; при этом наблюдается расширение диапазона в случае произнесения гласного с эмфатическим ударением по сравнению с нейтральным ударением во всех позициях в случае BW1 и BW2, а для BW3 - только в конечной фразовой позиции. Расширение BW4 было зафиксировано на уровне статистической тенденции (р < 0,06) в срединной фразовой позиции.

При произношении диктором ХТ анализируемого гласного с нейтральным ударением позиция слова во фразе оказывает статистически достоверное влияние на ширину всех рассматриваемых диапазонов. Представленные на рисунке 2 графики показывают, что значение ВW1 гласного [а], произнесенного с нейтральным ударением, в начале фразы статистически достоверно превышает значения середины и конца фразы, BW2 в начальной позиции шире по сравнению с конечной фразовой позицией, значение ВW3 максимально в середине фразы, а ширина BW4 максимальна в начале фразы. Обращает на себя внимание тот факт, что ширина формант BW1 и BW3 характеризуется «проседанием» в срединной фразовой позиции.

Фразовая позиция оказывает статистически достоверное влияние на ширину всех формантных диапазонов при произнесении слова с анализируемым гласным с эмфатическим ударением. При этом ширина BW1 минимальна в конечной позиции, значения BW2 и BW4 в срединной позиции статистически достоверно превышают соответствующие значения в начале и конце фразы, BW3 максимальна в конечной позиции.

Взаимодействие факторов позиции и типа ударения является статистически значимым в произношении диктора ХТ: F(8, 222) = 14,861; р = 0,0000, однако различия в изменениях фор-мантных диапазонов можно охарактеризовать как разнонаправленные. Так, диапазон BW1 в случае произнесения гласного [а] с эмфатическим ударением сокращается в начальной фразовой позиции и увеличивается в срединной фразовой позиции по сравнению с соответствующими значениями гласного, произнесенного с нейтральным ударением. Сокращение диапазонов в случае эмфатического ударения было зафиксировано для BW2 в начальной фразовой позиции; для BW3 - в срединной; для BW4 - в конечной; в остальных случаях тип ударения не оказывал влияния на ширину диапазонов.

В произнесении диктора ПА выявлено статистически достоверное влияние фразовой позиции на ширину диапазонов гласного как в случае нейтрального, так и эмфатического ударения; соответствующие графики представлены на рисунке 3. При произнесении гласного с нейтральным ударением средние значения всех формантных диапазонов статистически достоверно минимальны в срединной позиции во фразе. В случае эмфатического ударения изменения ширины формант в различных фразовых позициях можно характеризовать как разнонаправленные. Так, наблюдается сокращение ширины формант в конечной позиции в случае BW1, BW2 и BW3, в случае BW4 минимальное значение принимает ширина форманты F4 в срединной фразовой позиции.

Тип ударения и фразовая позиция гласного оказывают статистически достоверное влияние на ширину всех четырех формант: F(8, 222) = 10,759; р = 0,0000; при этом значе-

Значения критерия Фишера ^ 8, 222) и р-значения для оценки влияния типа ударения на ширину формант гласного [а]

F and p-values to evaluate stress type impact on the bandwidths of the vowel [a]

Ширина фоРманты Диктор БС Диктор ХТ Диктор ПА Диктор КН

Нейтраль- Эмфатиче- Нейтраль- Эмфатиче- Нейтральное Эмфатиче- Нейтральное Эмфатиче-

ное ударе- ское ударе- ное ударе- ское ударе- ударение ское ударение ударение ское ударение

ние ние ние ние

F р F р F р F р F р F р F р F р

BW1 22,4 0,00 19,06 0,00 20,5 0,00 4,35 0,02 11,65 0,00 4,75 0,01 11,10 0,00 3,31 0,04

BW2 1,86 0,16 19,80 0,00 3,15 0,05 17,98 0,00 31,18 0,00 3,40 0,04 3,95 0,03 6,45 0,00

BW3 0,20 0,81 4,54 0,02 22,1 0,00 20,39 0,00 8,30 0,00 5,78 0,01 2,59 0,08 6,51 0,00

BW4 0,36 0,70 1,88 0,16 8,48 0,00 21,32 0,00 13,00 0,00 27,73 0,00 35,70 0,00 10,21 0,00

POSITION'STYLE: LS Means Wilks lambda=.42411, F(8, 222)= 14.861. p=0.0000 Effective hypothesis decomposition Vertical bars denote 0.95 confidence intervals

3500 3000 2500 2000 £ 1500 1000 500 0

-500

-

-

А

т / г

-—гп

Ш -а

§- ___ffi-

——а

POSITION: begin

middle

end

POSITION: begin

midde

end

. BW1 BW2 ' BW3 BW4

STYLE: neutral STYLE: emph

Рис. 2. Ширина формант гласного [а], произнесенного с нейтральным и эмфатическим ударением

в различных позициях во фразе (диктор ХТ)

Fig. 2. Formant bandwidths of the Russian vowel [a] uttered with neutral and emphatic stresses in various phrasal positions (speaker KhT)

Рис. 3. Ширина формант гласного [а], произнесенного с нейтральным и эмфатическим ударением

в различных позициях во фразе (диктор ПА)

Fig. 3. Formant bandwidths of the Russian vowel [a] uttered with neutral and emphatic stresses

in various phrasal positions (speaker РА)

ния ширины диапазонов могут уменьшаться, увеличиваться или оставаться неизменными. Так, в начальной фразовой позиции BW1 одинакова для гласного, произнесенного с ударениями обоих типов, в то время как в середине и конце фразы в случае эмфатического ударения диапазон форманты сужается. В случае BW2 в начальной фразовой позиции тип ударения не оказывает влияния на ширину диапазона, в то время как в середине фразы эмфатическое ударение сопровождается расширением диапазона, а в конце - его сужением по сравнению с нейтральным ударением. Произнесение гласного с эмфатическим ударением приводит к сужению диапазона BW3 в начале и конце фразы и его расширению в срединной фразовой позиции. BW4 увеличивается в начальной позиции во фразе при эмфатическом ударении, в то время как изменение типа ударения не оказывает влияния на ширину диапазона в середине и конце фразы.

В произношении диктора КН выявлено статистически достоверное влияние фразовой позиции гласного, произнесенного с нейтральным ударением, на ширину трех диапазонов -В\¥1, В\¥2 и В\¥4 (рис. 4). При этом в слу-

чае BW1 наблюдается статистически достоверное сокращение диапазона первой форманты гласного в начальной фразовой позиции, у BW2 ширина диапазона в начале фразы достоверно превышает ширину диапазона в конечной фразовой позиции, а BW4 характеризуется расширением диапазона по мере перемещения гласного от начала к концу фразы. Фразовая позиция гласного, произнесенного с нейтральным ударением, не оказывает статистически достоверного влияния на ширину диапазонов форманты F3.

Фразовая позиция оказывает статистически достоверное влияние на ширину диапазонов гласных, произнесенных с эмфатическим ударением: BW1 характеризуется расширением в конечной фразовой позиции, в то время как ширина диапазона BW2 минимальна в начале фразы. BW3 принимает максимальное значение в середине фразы, BW4 - в ее начале.

Факторный анализ показал, что ширина формант определяется статистически достоверным взаимодействием позиции гласного во фразе и типа ударения: F(8, 222) = 10,02; р = 0,0000. Изменения ширины формант в произношении диктора КН могут быть охарак-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

POSITION*STYLE: LS Means Wilks lambda- 53974. F(8, 222)= 10,022, p=, 00000 Effective hypothesis decomposition Vertical bars denote 0.95 confidence intervals

1800 1600 1400 1200 1000 800 600 400 200 0 -200

-г - -

т

>

£

1 ï

"Г - -

-

>

POSITION: begin

middle

end

POSITION: begin

middle

end

5E BW1 3E BW2 3E BW3

STYLE: neutral STYUE: emph 3E BW4

Рис. 4. Ширина формант гласного [а], произнесенного с нейтральным и эмфатическим ударением

в различных позициях во фразе (диктор КН)

Fig. 4. Formant bandwidths of the Russian vowel [a] uttered with neutral and emphatic stresses in various phrasal positions (speaker KN)

теризованы как разнонаправленные (аналогично рассмотренным выше случаям реализаций гласного звука в произнесении остальных информантов). При произнесении анализируемого гласного с эмфатическим ударением ширина первой форманты сокращается в начальной и срединной фразовых позициях, ср. произнесение с нейтральным ударением. Кроме того, наблюдается сокращение ширины форманты BW2 в начальной фразовой позиции и уменьшение значения BW3 во всех трех фразовых позициях по сравнению с соответствующими значениями в случае нейтрального ударения. Расширение диапазонов формант при произнесении гласного с эмфатическим ударением отмечено в срединной и конечной фразовых позициях в случае BW2 и начальной и срединной позициях в случае BW4 относительно соответствующих значений, полученных при произнесении анализируемого гласного с нейтральным ударением.

Как следует из графиков, представленных на рисунках 1-4, величины характеризуются высокой степенью вариативности, при этом стандартное отклонение ширины форманты имеет тенденцию к возрастанию с увеличением номера форманты, а в случае BW3 и BW4 в произнесении всех четырех информантов является максимальным. Полученные результаты коррелируют с имеющимися в литературе данными о размахе выборок, в частности приведенными коллективом испанских исследователей [Formant..., 2016]. Кроме того, прослеживается тенденция к расширению ширины формант BW3 и BW4 относительно BW1 и BW2, которая также подтверждается имеющимися в литературе наблюдениями о расширении ширины формант с увеличением их номера [Kent, Vorperian, 2018; Krishna, Rajashekhar, 2013]. Несомненно, что высокая вариативность полученных данных затрудняет выявление закономерностей функционирования формантных диапазонов при реализации ударения анализируемых типов в различных фразовых позициях. Информантам, вероятно, было сложно использовать ширину формант в качестве акустического коррелята громкости при произнесении гласного с различными типами ударения - нейтральным и эмфатическим. Тем не менее произношение диктора БС характеризуется расширением диапазонов

BW1 и BW2 во всех фразовых позициях при произнесении гласного с эмфатическим ударением по сравнению с нейтральным, что частично подтверждается экспериментальными данными об использовании BW1 в качестве акустического коррелята эмоционально окрашенной речи [Gobl, Chasaide, 2003]. Кроме того, в речи всех информантов было выявлено, что фразовая позиция влияет на ширину формант. Особый интерес представляет в этом плане реализация ширины формант при произнесении гласного с нейтральным ударением в речи диктора ПА: значения диапазонов четырех формант минимальны в срединной позиции анализируемого гласного в составе фразы. У диктора ХТ в случае нейтрального ударения подобная закономерность прослеживается для двух формант - BW1 и BW3; в случае эмфатического ударения, наоборот, форманты BW1 и BW4 в середине фразы характеризуются расширением диапазонов. Эти наблюдения, на наш взгляд, свидетельствуют в пользу гипотезы о том, что ширина формант звуков может быть одним из параметров, закладываемых в фонетический образ слова при порождении высказывания протяженностью «синтагма - фраза».

Выводы

В работе исследовано влияние позиции гласного в составе фразы (начальная, срединная и конечная) и типа ударения (нейтральное vs эмфатическое) на значения ширины формант BW1, BW2, BW3 и BW4. Полученные результаты позволяют сделать следующие выводы:

1. Позиция слова во фразе оказывает влияние на ширину формант BW1, BW2, BW3 и BW4 при произнесении анализируемого слова как с нейтральным, так и с эмфатическим ударением, при этом наблюдается изменение ширины формант в начальной, срединной и конечной фразовых позициях. Величина и направление изменений диапазонов формант зависят от индивидуальных особенностей дикторов.

2. Закономерности в величине и направлении изменения ширины формант в зависимости от фразовой позиции в исследованном экспериментальном корпусе прослеживаются

у двух из четырех привлеченных к эксперименту информантов; степень влияния позиционного фактора на изменения ширины формант определяется идиолектом говорящего.

3. Закономерности варьирования значений ширины формант в зависимости от типа ударения прослеживаются только у одного из четырех привлеченных к эксперименту дикторов: в произнесении диктора БС ширина диапазонов BW1 и BW2 при эмфатическом ударении превышает соответствующие значения при нейтральном ударении. В остальных случаях изменение значений ширины формант в значительной степени обусловлено особенностями идиолекта информантов: при изменении ударения с нейтрального на эмфатическое ширина формант может увеличиваться, уменьшаться или оставаться неизменной.

4. Взаимодействие факторов фразовой позиции гласного и типа ударения является достоверным в произношении всех привлеченных к эксперименту информантов.

Таким образом, позиция гласного в составе фразы, степень его ударности, а также взаимодействие этих факторов оказывают влияние на такие параметры формантной картины гласного, как ширина диапазона первых четырех формант. Несмотря на междикторскую вариативность, у информантов прослеживаются определенные тенденции в динамике изменения ширины формант в зависимости от вышеперечисленных условий. Полученные результаты свидетельствуют в пользу предположения о программировании формантных характеристик звуков при порождении высказываний протяженностью «синтагма - фраза».

СПИСОК ЛИТЕРА ТУРЫ

Баталин С. В., 2019. Зависимость формантных характеристик гласного от позиции во фразе и типа ударения // Вестник Пермского университета. Российская и зарубежная филология. Т. 11, вып. 4. С. 5-15. DOI: https://doi.org/ 10.17072/2073-6681-2019-4-5-15. Валуйцева И. И., Хутуни Г. Т., 2016. Эмоции в звучащей речи: экспериментальное исследование // Вопросы психолингвистики. № 3 (29). С. 45-55.

Златоустова Л. В., 1983. Интонация и просодия в организации текста // Звучащий текст : сб.

науч.-аналит. обзоров / отв. ред. Ф. М. Бере-зин, Р. К. Потапова. М. : ИНИОН АН СССР. С. 11-21.

Нушикян Э. А., 1986. Типология интонации эмоциональной речи. Минск : Выща школа. 157 с.

Фант Г., 1964. Акустическая теория речеобразова-ния. М. : Наука. 284 с.

Чудновская И. Н., 1997. Исследование акустических параметров звуков русской речи на микросегментном уровне : автореф. дис. ... канд. филол. наук. М., 1997. 28 с. URL: http:// cheloveknauka.com/v/402520/a?#?page= 1 (дата обращения: 04.02.2019).

Easwar V., Scollie S., Purcell D., 2019. Investigating Potential Interactions Between Envelope Following Responses Elicited Simultaneously by Different Vowel Formants // Hearing Research. Vol. 380. P. 35-45. DOI: https://doi.org/10.1016/ j.heares.2019.05.005.

Formant Frequencies and Bandwidths in Relation to Clinical Variables in an Obstructive Sleep Apnea Population, 2016 / A. M. Benavides [et al.] // Journal ofVoice. Vol. 30, №. 1. P. 21-29. DOI: http://dx.doi.org/10.1016/jjvoice.2015.01.006.

Glasberg B. R., Moore B. C. J., 2002. A Model of Loudness Application to Time Varying Sounds // Journal of the Audio Engineering Society. J№ 50. P. 331-342.

Gobl C., Chasaide A., 2003. The Role of Voice Quality in Communicating Emotion, Mood and Attitude // Speech Communication. Vol. 40. P. 189-212.

Hanna N., Smith J., Wolfe J., 2016. Frequencies, Bandwidths and Magnitudes of Vocal Tract and Surrounding Tissue Resonances, Measured Through the Lips During Phonation // Journal of Acoustical Society of America. Vol. 139, N° 5. P. 2924-2936. DOI: http://dx.doi.org/10.1121/ 1.4948754.

Kent R. D., Vorperian H. K., 2018. Static Measurements of Vowel Formant Frequencies and Bandwidths: A Review // Journal of Communication Disorders. № 74. P. 74-97. DOI: https://doi.org/ 10.1016/j.jcomdis.2018.05.004.

Koolagudi S. G., Rao K. S., 2012. Emotion Recognition from Speech: A Review // International Journal of Speech Technology. Vol. 15, iss. 2. P. 99-117. DOI: https://doi.org/10.1007/s10772-011-9125-1.

Krishna Y., Rajashekhar B., 2013. Association Between Bandwidths of Vowel Formants and Age, Gender and Consonant Context in Telugu // Language in India. Vol. 13, № 3. P. 574-584. URL: https:// docplayer. net/30951662-Association-between-bandwidths-of-vowel-formants-and-age-gender-and-consonant-context-in-telugu.html (date of access: 05.02.2019).

Mannepalli K., Sastry P. N., Suman M., 2018. Analysis of Emotion Recognition System for Telugu Using Prosodic and Formant Features // Speech and Language Processing for Human-Machine Communications. Advances in Intelligent Systems and Computing / ed. by S. Agrawal [et al.]. Vol. 664. P. 137-144. DOI: https://doi.org/ 10.1007/978-981-10-6626-9_15.

Medabalimi A. J. X., Seshadri G., Bayya Y., 2014. Extraction of Formant Bandwidths Using Properties of Group Delay Functions // Speech Communication. №№ 63-64. P. 70-83. DOI: https:/ /dx. doi.org/ 10.1016/j. specom.2014.04.006.

Petrushin V. A., 2000. Emotion Recognition in Speech Signal: Experimental Study, Development, and Application // Sixth International Conference on Spoken Language Processing (ICSLP 2000), Beijing, October 16-20, 2000. Vol. 2. P. 222-225. URL: https://www.isca-speech.org/archive/ archive_papers/icslp_2000/i00_4222.pdf (date of access: 04.02.2019).

Scherer K. R., 1986. Vocal Affect Expressions: A Review and a Model for Future Research // Psychological Bulletin. Vol. 99. P. 143-165.

Sluijter A. M. C., Van Heuven V J., 1996. Acoustic Correlates of Linguistic Stress and Accent in Dutch and American English // The Fourth International Conference on Spoken Language Processing (ICSLP 96). Philadelphia, October 3-6, 1996. Vol. 2. P. 630-633. URL: http://www.asel.udel.edu /icslp/cdrom/vol2/604/a604.pdf (date of access: 20.03.2019).

Tamburini F., Caini C., 2005. An Automatic System for Detecting Prosodic Prominence in American English Continuous Speech // International Journal of Speech Technology. Vol. 8, iss. 1. P. 30-33. DOI: https://doi.org/10.1007/s10772-005-4760-z.

The Effect of Emphatic Stress on Consonant Vowel Coarticulation, 2007 / B. Lindblom [et al.] // Journal of Acoustical Society of America. Vol. 121, №>6. P. 3802-3813. DOI: https://doi.org/ 10.1121/1.2730622.

Ververidis D., Kotropoulos C., 2006. Emotional Speech Recognition: Resources, Features, and Methods // Speech Communication. Vol. 48, iss. 9. P. 1162-1181.

Zwicker E., Flottorp G., Stevens S. S., 1957. Critical Band Width in Loudness Summation // Journal of Acoustical Society of America. Vol. 29. P. 548557. URL: http://dx.doi.org/10.1121/L1908963 (date of access: 20.01.2019).

REFERENCES

Batalin S.V., 2019. Zavisimost formantnykh kharakteristik glasnogo ot pozitsii vo fraze i tipa

udareniya [The Effect of Phrasal Position and Type of Stress on the Formant Features of Vowels]. Vestnik Permskogo universiteta. Rossiyskaya i zarubezhnaya filologiya [Perm University Herald. Russian and Foreign Philology], vol. 11, iss. 4, pp. 5-15. DOI: https:// doi.org/10.1772/2073-6681-2019-4-5-15.

Valuytseva I.I., Khutuni G.T., 2016. Emotsii v zvuchashchey rechi: eksperimentalnoe issledovanie [Emotions in Speech: Experimental Research]. Voprosy psikholingvistiki [Journal of Psycholinguistics], iss. 3 (29), pp. 45-55.

Zlatoustova L.V., 1983. Intonatsiya i prosodiya v organizatsii teksta [Intonation and Prosody in Text Organization]. Berezin F.M., Potapova R.K., eds. Zvuchashchiy tekst: sb. nauch.-analit. obzorov [Oral Text: A Collection. of Scientific-Analytical Reviews]. Moscow, INION AN SSSR, pp. 11-21.

Nushikyan E.A., 1986. Tipologiya intonatsii emotsionalnoy rechi [Intonation Typology of Emotional Speech]. Minsk, Vyshcha shkola Publ., 157 p.

Fant G., 1964. Akusticheskaya teoriya recheobrazovaniya [Acoustic Theory of Speech Production]. Moscow, Nauka Publ., 284 p.

Chudnovskaya I.N., 1997. Issledovanie akusticheskikh parametrov zvukov russkoy rechi na mikrosegmentnom urovne: avtoref. dis. ... kand. filol. nauk [Investigation of Acoustic Parameters of Russian Speech Sounds at the Microsegmental Level. Cand. philol. sci. abs. diss.]. Moscow. 28 p. URL: http://cheloveknauka.com/v/402520/ a?#?page=1 (accessed 4 February 2020).

Easwar V., Scollie S., Purcell D., 2019. Investigating Potential Interactions Between Envelope Following Responses Elicited Simultaneously by Different Vowel Formants. Hearing Research, vol. 380, pp. 35-45. DOI: https://doi.org/10.1016/ j.heares.2019.05.005.

Benavides A.M., Murillo J.L.B., Pozo R.F., Cuadros F.E., Toledano D.T., Alcazar-Ramyrez J.D., Gomez L.A.H., Murillo J.L.B., Pozo R.F., Cuadros F.E., 2016. Formant Frequencies and Bandwidths in Relation to Clinical Variables in an Obstructive Sleep Apnea Population. Journal of Voice, vol. 30, no. 1, pp. 21-29. DOI: http://dx.doi.org/ 10.1016/j.jvoice.2015.01.006.

Glasberg B.R., Moore B.C.J., 2002. A Model of Loudness Application to Time Varying Sounds. Journal of the Audio Engineering Society, no. 50, pp. 331-342.

Gobl C., Chasaide A., 2003. The Role of Voice Quality in Communicating Emotion, Mood and Attitude. Speech Communication, vol. 40, pp. 189-212.

Hanna N., Smith J., Wolfe J., 2016. Frequencies, Bandwidths and Magnitudes of Vocal Tract and Surrounding Tissue Resonances, Measured Through the Lips During Phonation. Journal of Acoustical Society of America, vol. 139, no. 5, pp. 2924-2936. DOI: http://dx.doi.org/10.1121/ 1.4948754.

Kent R.D., Vorperian H.K., 2018. Static Measurements of Vowel Formant Frequencies and Bandwidths: A Review. Journal of Communication Disorders, no. 74, pp. 74-97. DOI: https://doi.org/10.1016/ j .jcomdis.2018.05.004.

Koolagudi S.G., Rao K.S., 2012. Emotion Recognition from Speech: A Review. International Journal of Speech Technology, vol. 15, iss. 2, pp. 99-117. DOI: https://doi.org/10.1007/s10772-011-9125-1.

Krishna Y., Rajashekhar B., 2013. Association Between Bandwidths of Vowel Formants and Age, Gender and Consonant Context in Telugu. Language in India, vol. 13, no. 3, pp. 574-584. URL: https:// docplayer. net/30951662-Association-between-bandwidths-of-vowel-formants-and-age-gender-and-consonant-context-in-telugu.html (accessed 5 February 2019).

Mannepalli K., Sastry P.N., Suman M., 2018. Analysis of Emotion Recognition System for Telugu Using Prosodic and Formant Features. Agrawal S., Devi A., Wason R., Bansal P., eds. Speech and Language Processing for Human-Machine Communications. Advances in Intelligent Systems and Computing, vol. 664, pp. 137-144. DOI: https://doi.org/10.1007/978-981-10-6626-9_15.

Medabilimi A.J.X., Seshadri G., Bayya Y., 2014. Extraction of Formant Bandwidths Using Properties of Group Delay Functions. Speech Communication, no. 63-64, pp. 70-83. DOI: https://dx. doi.org/10.1016/j. specom.2014.04.006.

Petrushin V.A., 2000. Emotion Recognition in Speech Signal: Experimental Study, Development, and Application. Sixth International Conference on Spoken Language Processing (ICSLP 2000), Beijing, October 16-20, 2000. Beijing, vol. 2, pp. 222-225. URL: https://www.isca-speech.org/ archive/archive_papers/icslp_2000/i00_4222.pdf (accessed 4 February 2019).

Scherer, K.R., 1986. Vocal Affect Expressions: A Review and a Model for Future Research. Psychological Bulletin, vol. 99, pp. 143-165.

Sluijter A.M.C., Heuven V.J. van, 1996. Acoustic Correlates of Linguistic Stress and Accent in Dutch and American English. The Fourth International Conference on Spoken Language Processing (ICSLP 96). Philadelphia, October 3-6,1996. Philadelphia, vol. 2, pp. 630-633. URL: http://www.asel.udel.edu/icslp/cdrom/vol2/604/ a604.pdf (accessed 20 March 2019).

Tamburini F., Caini C., 2005. An Automatic System for Detecting Prosodic Prominence in American English Continuous Speech. International Journal of Speech Technology, vol. 8, iss. 1, pp. 30-33. DOI: https://doi.org/10.1007/s10772-005-4760-z.

Lindblom B., Agwuele A., Sussman H.M., Cortes E.E., 2007. The Effect of Emphatic Stress on Consonant Vowel Coarticulation. Journal of Acoustical Society of America, vol. 121, no. 6, pp. 3802-3813. DOI: https://doi.org/10.1121/1.2730622.

Ververidis D., Kotropoulos C., 2006. Emotional Speech Recognition: Resources, Features, and Methods. Speech Communication, vol. 48, iss. 9, pp. 1162-1181.

Zwicker E., Flottorp G, Stevens S.S., 1957. Critical Band Width in Loudness Summation. Journal of Acoustical Society of America, vol. 29, pp. 548557. URL: http://dx.doi.org/10.1121/L1908963 (accessed 20 January 2019).

Information About the Author

Sergey V. Batalin, Candidate of Sciences (Philology), Associate Professor, Department of Foreign Languages, Volgograd State Technical University, Prosp. Lenina, 28, 400005 Volgograd, Russia, sbat_2009@mail.ru, https://orcid.org/0000-0002-3435-9797

Информация об авторе

Сергей Васильевич Баталин, кандидат филологических наук, доцент кафедры иностранных языков, Волгоградский государственный технический университет, просп. им. В.И. Ленина, 28, 400005 г. Волгоград, Россия, sbat_2009@mail.ru, https://orcid.org/0000-0002-3435-9797

i Надоели баннеры? Вы всегда можете отключить рекламу.