Научная статья на тему 'Позиционная обусловленность корреляции длительностей звуковых сегментов в слоге'

Позиционная обусловленность корреляции длительностей звуковых сегментов в слоге Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
43
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДЛИТЕЛЬНОСТЬ СЛОГА / ДЛИТЕЛЬНОСТЬ ЗВУКА / ПОЗИЦИОННАЯ ДЛИТЕЛЬНОСТЬ / СИНТЕЗ РЕЧИ ПО ПРАВИЛАМ / SYLLABLE DURATION / SEGMENTAL DURATION / POSITIONAL DURATION / SPEECH SYNTHESIS BY RULE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Баталин С. В.

В статье рассматривается механизм взаимодействия длительностей слогов, занимающих во фразе различные позиции, и звуковых сегментов, входящих в состав этих слогов. Результаты исследования могут быть использованы в системах синтеза речи по правилам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Позиционная обусловленность корреляции длительностей звуковых сегментов в слоге»

Баталин С.В. ©

Доцент, кафедра иностранных языков, Волгоградский государственный технический университет

ПОЗИЦИОННАЯ ОБУСЛОВЛЕННОСТЬ КОРРЕЛЯЦИИ ДЛИТЕЛЬНОСТЕЙ ЗВУКОВЫХ

СЕГМЕНТОВ В СЛОГЕ

Аннотация

В статье рассматривается механизм взаимодействия длительностей слогов, занимающих во фразе различные позиции, и звуковых сегментов, входящих в состав этих слогов. Результаты исследования могут быть использованы в системах синтеза речи по правилам.

Ключевые слова: длительность слога; длительность звука; позиционная длительность, синтез речи по правилам

Keywords: syllable duration; segmental duration; positional duration; speech synthesis by rule

Поскольку слог является базовой артикуляционной и перцептивной единицей, в системе просодических единиц он занимает особое место. С одной стороны, слог представляет собой последовательность звуковых сегментов; с другой, слог входит в состав более крупных фонетических единиц - фонетического слова и синтагмы (фразы). Вполне закономерно возникает вопрос: в какой степени функционирование слога определяется его сегментным составом, и каким образом слоговые характеристики определяются влиянием факторов позиционных (положением слога в составе фонетического слова/фразы) и просодических (ударением, мелодией)? Рассмотрим, как решаются поставленные вопросы при анализе временной организации слога. Отметим, что в литературе имеется несколько подходов к описанию указанного взаимодействия.

Первый подход основан на теории изохронии, предложенной И. Лехисте, в соответствии с которым говорящий старается поддерживать одинаковой длительности фонетических единиц одного уровня (слогов, фонетических слов или фраз). Как следствие, делается вывод, что длительность фонетической единицы не зависит от длительности входящих в ее состав компонентов [11]. В нашем случае это означает, что длительность слога определяется только действием просодических и позиционных факторов, и не зависит от количества и собственной длительности составляющих этот слог звуковых сегментов. Однако данные, полученные на материале различных языков, - Л.В. Бондарко [3] и Л.В. Златоустовой и др. для русского [5], Дж. Ван Сантеном и К. Шихом для английского и китайского [16] показывают, что длительность слога определяются как качеством самих звуков, входящих в состав слога, так и их количеством. Следовательно, принцип изохронии фонетических единиц не может быть использован для описания временной организации слога.

Рассмотрим, каким образом длительности слогов определяются позиционными факторами. Отметим, что данная зависимость наблюдается в целом ряде языков. Так, Р.К. Потапова выявила, что позиция конца фразы универсально маркирована удлинением слогов в германских языках - немецком, английском, шведском, датском, норвежском и нидерландском [6]. Д. Оллер также отмечает, что в английском языке увеличение длительности всего слога характерно для конечной позиции во фразе независимо от интонационного оформления фразы - повелительной, повествовательной или вопросительной интонации [12]. Однако как количественные, так и качественные оценки процесса удлинения весьма разнятся. По данным Н. Умеды и А. Куина, удлинение последнего ударного слога во фразе наблюдается в том случае, если этот слог является абсолютно конечным, а также, если за ним следует один или несколько безударных слогов [15]. Б. Ракерд отмечает существование двух разнонаправленных тенденций слоговой динамики в конечной позиции во фразе: ударные слоги в английском удлиняются перед синтаксическими границами, но сокращаются, если за ними следуют безударные слоги, входящие в состав той же фонетической группы (metrical foot) [13].

Что касается квантования длительностей неконечных слогов во фразе, то исследователи на материале различных языков отмечают удлинение начального слога фразы: позиции начала фразы универсально маркированы удлинением слогов в различных языках - германских [6], русском [7], иврите

© Баталин С.В., 2013 г.

[8], китайском [17]. При этом авторы отмечают, что между длительностью сегментов в срединной и конечной позициях фразы существует значительно большая разница, чем между длительностью сегментов в начальной и конечной позициях. Однако количественные характеристики темпоральной маркированности слогов в составе фразы могут определяться конкретноязыковой спецификой: По результатам, полученным В. И. Артемовым, значения начальных и срединных слоговых длительностей характеризуются меньшим временным контрастом в американском варианте английского языка по сравнению с британским вариантом [1]. И. Ксу также отмечает различную степень сокращения срединных слогов в китайском и английском языках [17]. Учитывая имеющиеся разночтения в оценке влияния позиционного фактора на длительность слога, С. Рао, например, в модель прогнозирования слоговой длительности в хинди вводит такие параметры, как удаленность слога как от начала, так и от конца фразы [14].

Целый ряд исследований показал существование зависимости между длительностью звука и его позицией в составе слога: в соответствии с результатами, полученными С. Гринбергом и др. [10], длительность сегмента определяется его положением в составе слога - начале, ядре или в конечной части. Приведенные данные подтверждаются результатами, полученными на материале английского языка Д. Оллером. Автор отмечает, что для начального положения в составе фразы характерно увеличение длительностей согласных, (фактически - удлинение начального согласного начального слога), в конце фразы происходит увеличение длительностей всех звуков в составе слога. Конечное удлинение всего слога, по наблюдениям автора, происходит именно за счет гласного; длительность согласных конечного слога увеличивается меньше, чем длительность гласных. Конечный согласный при этом удлиняется в среднем на 20 мсек. При этом максимальное удлинение наблюдается у фрикативных согласных в абсолютно конечной позиции [12]. Экспериментальные данные, полученные Р.К. Потаповой на материале ряда германских языков, позволяют сделать вывод о том, что значительная роль при позиционных изменениях длительности слога принадлежит согласным: при переходе от срединной позиции к конечной длительность ударного слога устойчиво изменялась в сторону увеличения во всех случаях (100%), а длительность ударного гласного - в 70% случаев. При переходе от начальной позиции к конечной аналогичные изменения были обнаружены для ударного слога в 54% случаев, а для ударного гласного - в 23% случаев [6]. Дж. Гейтенби отмечает одинаковую степень удлинения гласных и слоговых согласных в конечной позиции во фразе [4]. Ван Сантен и К. Ших, исследуя динамику звуков во фразоконечных слогах английского и китайского языков, наблюдали удлинение слоговых ядер слогов структуры СУ, а также ядерной части и коды слогов структуры СУС [16]. По данным Р. Берковитц, в иврите в конечном слоге происходило удлинение как конечного гласного, так и согласного. Однако в случае сочетания смычного согласного и гласного гласный удлинялся в большей степени, чем смычка согласного. В случае с фрикативными согласными, они в конечном положении во фразе удлинялись больше, чем предшествующий ударный гласный [8]. Аналогично вели себя смычки смычных согласных в этой же позиции во французском языке [9].

Таким образом, анализ имеющихся для целого ряда языков результатов позволяет предположить, что динамика длительностей звуков в слоге может определяться как качеством самого звука, так и его позицией в составе слога, а также позицией самого слога в составе фразы. К сожалению, нам не удалось обнаружить аналогичных данных для русского языка.

Описание экспериментального корпуса и методики организации эксперимента по изучению влияния позиции слога на длительности составляющих его звуковых сегментов приведено в [2]. Анализ слоговых длительностей выявил зависимость длительностей слогов от их позиции в составе фразы: для всех четырех дикторов характерно увеличение длительности слога в конечной позиции по отношению к длительности слога в начальной позиции; длительность слога, занимающего во фразе срединную позицию, является минимальной. Особо обратим внимание на тот факт, что графики длительностей слогов, рассчитанных относительно длительности начального слога, практически полностью совпадают для всех четырех дикторов. Соответствующие данные приведены на рисунке 1.

Рассмотрим динамику длительностей отдельных звуков в составе слогов, занимающих различные позиции в составе фразы - начальную, срединную и конечную. Соответствующие графики для каждого диктора представлены на рисунке 2. Отметим, что графики характеризуются определенной степенью сходства для всех четырех дикторов: наблюдаемое совпадение объясняется, на наш взгляд, так называемой собственной длительностью звуков, то есть временем, необходимым для артикуляции

данного конкретного звука. Методически удобнее проводить сравнение длительностей звуков в начальных и конечных слогах, характеризующихся большей длительностью, со слогами, занимающими во фразе срединную позицию и характеризующимися меньшей длительностью.

позиция слога во фразе

а) б)

Рис. 1 Абсолютные (а) и относительные (б) длительности слогов в зависимости от позиции во фразе в произнесении четырех дикторов

Для удобства сопоставления полученных результатов они сведены в таблицу №1; в таблице приведены как качественная оценка наличия/отсутствия удлинения конечных и начальных слогов по сравнению со слогами в срединной позиции во фразе, так и количественная - в процентах.

Как следует из табличных данных, увеличение абсолютных длительностей звуков в начальных и конечных слогах характеризуется рядом закономерностей: так, у всех дикторов наблюдалось удлинение как конечного гласного, так и конечного согласного; при этом степень удлинения гласного характеризуется большим разбросом: гласный в начальном слоге может удлиняться как в большей степени, чем гласный конечного слога (дикторы ПА и КН), так и в меньшей степени (диктор БС) или практически совпадать (диктор ХТ). Следует отметить, что конечный согласный в слоге, занимающем в фразе конечную позицию, превышает по длительности аналогичный согласный начального слога у всех четырех дикторов. Количественно, однако, удлинение варьирует в достаточно широких пределах - от 63 до 250%. Что касается начального согласного слога, то увеличение его длительности носит факультативный характер и наблюдается не у всех дикторов. Так, диктором БС этот параметр в анализируемом материале не используется; два диктора - ПА и КН - удлиняли начальный согласный в случае, если слог занимал во фразе конечную позицию; диктор ХТ удлинял начальный согласный в слоге, занимающем во фразе начальную позицию. У дикторов, увеличивающих длительность слога за счет начального согласного, этот прием используется довольно эффективно: длительность согласного возрастает от 23 до 35%. У всех дикторов наблюдается изменение длительности смычки [т] при удлинении слога; однако единое правило в данном случае вывести невозможно: длительность смычки увеличивается у трех дикторов в случае, если слог занимает во фразе конечную позицию; при этом степень удлинения достаточно велика - от 18 до 50%. Дикторы ПА и КН регулярно увеличивали длительности смычки и в слогах, занимающих во фразе начальную позицию, хотя и в меньшей степени: 16% и 31% соответственно. Отметим, что время взрыва является, по результатам нашего эксперимента, единственной величиной, не подверженной влиянию позиционных факторов и индивидуальных особенностей говорящих: во всех случаях она оставалась неизменной.

взрыв^] А

а) диктор БС

а [^ взрыв[t] А

взрыв[t] А С2

б) диктор ХТ

И взрые^] А С2

в) диктор ПА г) диктоР КН

Рис. 2 Абсолютные длительности звуков в слогах, занимающих различные позиции во фразе.

Таблица 1

Изменение абсолютных длительностей звуков в начальном и конечном слогах

диктор позиция слога направление изменения *

С1 Т (смычка) Т (взрыв) А С2

БС начальная 0 0 0 + 32% + 65%

конечная 0 + 50% 0 + 72% + 100%

ХТ начальная + 23% 0 0 + 43% + 63%

конечная 0 + 31% 0 + 45% + 226%

ПА начальная 0 + 16% 0 + 31% + 87%

конечная + 29% + 18% 0 + 12% + 137%

КН начальная 0 + 31% 0 + 31% + 76%

конечная + 35% 0 0 + 10% + 250%

* «+» - увеличение длительности звуков начального и конечного слогов по отношению к длительности звуков срединного слога; «0» - отсутствие изменений длительности звуков начального и конечного слогов по отношению к длительности звуков срединного слога.

В целом, полученные нами данные подтверждают существование определенной временной программы, определяющей взаимодействие длительностей слогов и звуковых сегментов, составляющих данные слоги. Кроме того, полученные результаты позволяют уточнить характер ее исполнения. Поскольку у всех четырех дикторов наблюдалось практически полное совпадение распределения относительных слоговых длительностей во фразе, можно с большой степенью уверенности сделать вывод о том, что основной уровень, на котором задается временная программа, является слоговой; при этом абсолютные значения длительностей каждого конкретного слога зависят от индивидуального темпа речи говорящего. Что касается поддержания соотношения относительных длительностей слогов в составе фразы, то говорящие пользуются целым набором приемов: у всех дикторов при артикуляции слогов, занимающих во фразе начальную и конечную позиции, наблюдается увеличение абсолютной длительности как конечного согласного слога, так и предшествующего ему гласного; увеличение длительностей остальных звуков в составе слога носит выраженный индивидуальный характер.

Литература

1. Артемов В.И. Структуры фразового ударения в американском и британском вариантах английского языка : дис. ... канд. филол. наук - Минск: МГПИИЯ, 1987. - 168 с.

2. Баталин С.В. О двух подходах к описанию длительностей звуковых сегментов в зависимости от их позиции в составе фразы // Lingua Mobilis. - 2012. - № 3 (36). - с. 43 - 56.

3. Бондарко Л.В. Слоговая структура речи и дифференциальные признаки фонем (эксп.-фонетическое исследование на материале русского языка): АДД - Л.: ЛГУ, 1969. - 32 с.

4. Гейтенби Дж.Х. Эластичные слова // Исследование речи. - Новосибирск: Наука, 1967. - с. 66 - 76.

5. Златоустова Л.В.,Фролова И.Г., Ленина Е.В. и др. Исследование длительности неударных гласных в зависимости от фразовых условий // Семантические и фонологические проблемы прикладной лингвистики. -М.: Изд. Моск. ун-та, 1968. - С. 74 - 134.

6. Потапова Р.К. Слоговая фонетика германских языков. - М.: ВШ, 1986. - 144 с.

7. Светозарова Н.Д. Интонационная система русского языка. - Л.: ЛГУ, 1982. - 176 с.

8. Berkovitz R. Duration and fundamental frequency in sentence-final intonation // Journal of Phonetics. - 1984. - No. 12. - P. 255-265.

9. Crompton A. Timing patterns in French // Phonetica. - 1980. - vol. 37. - No.4. - P.205-234.

10. Greenberg S., Carvey H., Hitchock L., Chang S. Temporal properties of spontaneous speech - a syllable-centric perspective // Journal of Phonetics. - 2003. - Volume 31. - P. 465 - 485.

11. Lehiste I. Isochrony revisited // Journal of Phonetics. - 1977. - No. 5. - P. 253-263.

12. Oller D. K. The effect of position in utterance on speech segment duration in English // Journal of Acoustical Society of America. - 1973. - vol. 54. - P. 1235-1247.

13. Rakerd B., Sennet W., Cooke P.: More on domain-final lengthening and foot-level shortening in spoken English // Journal of Acoustical Society of America. - 1989. - Vol. 86. - Suppl.1. - S.19.

14. Rao K.S., Yegnanarayana B. Modeling syllable durations using neural networks // Computer Speech and Language. -2007. - Vol. 21 - P. 282-295.

15. Umeda N., Quinn A.M.S. Word duration as an acoustic measure of boundary perception // Journal of Phonetics. -1981. - No. 9. - P. 19-28.

16. van Santen J. P. H., Shih C. Suprasegmental and segmental timing models in Mandarin Chinese and American English // Journal of Acoustical Society of America. - 2000. - Vol. 107. - No. 2 - P. 1012 - 1026.

17. Xu Y., Wang M. Organizing syllables into groups - Evidence from F0 and duration patterns in Mandarin // Journal of Phonetics. - 2009. - Vol. 37. - P. 502 - 520.

i Надоели баннеры? Вы всегда можете отключить рекламу.