УДК 81'34 Е. А. Бурая
канд. филол. наук, доц., проф. каф. фонетики английского языка ФГПН МГЛУ; e-mail: [email protected]
МЕТОДЫ ИССЛЕДОВАНИЯ ВОСПРИЯТИЯ РЕЧЕВОГО РИТМА
В статье дается обзор новейших публикаций по вопросам восприятия речевого ритма, представленных в британских и в американских лингвистических журналах. Ритм как воспринимаемое явление рассматривается как особая форма выделенности, которая достигается всеми компонентами просодии, сочетание и сбалансированность которых отражает специфику языка. В статье подчеркивается, что слушающие воспринимают ритм других языков через призму просодии родного языка.
Ключевые слова: речевой ритм; акустические корреляты ритма; PVI; вы-деленность; просодия; длительность; ЧОТ; интенсивность; спектр; межъязыковые различия.
Buraya E. A.
PhD, Professor, Department of English Phonetics, Faculty of Humanities and Applied Sciences, MSLU; e-mail: [email protected]
PERCEPTUAL STUDIES OF SPEECH RHYTHM
The paper is a survey of the latest publications on speech rhythm research on the perceptual level. Speech rhythm is viewed as a complex phenomenon, a form of prominence which is cued by a bunch of various acoustic properties of a speech signal. Acoustic cues are expected to be combined differently to create perceptual prominence patterns in different languages. The article stresses that listeners' perception of rhythm may be influenced by their native language.
Key words: speech rhythm; acoustic correlates of rhythm; PVI; prominence; prosody; duration; F0; intensity; spectrum; cross-linguistic differences.
Первыми в конце XIX - начале XX в. ритмом начали заниматься психологи, и их опыты были направлены на восприятие. На неречевом материале они установили, что слушающий объединяет, группирует последовательно воспринимаемые сигналы, и модель, по которой они группируются, крайне важна для восприятия ритма, особенно ритма языка и музыки. Уже тогда было замечено, что различные физические характеристики сигналов по-разному влияют на восприятие группировки. Например, при восприятии серии щелчков щелчки с более
сильной интенсивностью воспринимались как начальные в группе, а щелчки с увеличенной длительностью - как конечные [5]. К аналогичным результатам уже в наше время привели опыты, проведенные на речевом материале (исследовались модели объединения слогов ga-ga) [8].
На протяжении нескольких столетий, начиная от наблюдений Джошуа Стила (1775 г.), исследователи отмечали, что языки звучат, т. е. воспринимаются как ритмически разные. Типологическое разделение языков на ритмические классы также было основано на слуховых наблюдениях. А. Ллойд Джеймс [12] был, очевидно, первым, кто объяснил, что различие между такими языками, как французский, испанский, с одной стороны, и английский, немецкий, с другой стороны, основывается на равновеликости слогов для языков одного класса и на равновеликости межударных интервалов для языков другого класса. Гипотеза Пайка-Аберкромби о типологическом разделении языков на слого- и тактосчитающие стимулировала лингвистов к поиску изохронности интервалов и на долгие годы перевела исследования в области речевого ритма с уровня восприятия на уровень воспроизводства. При этом слишком большая роль в работах отводилась длительности. Исследования были направлены, по преимуществу, на изучение длительности речевых единиц таких, как слоги, ритмические группы. Появление новейших методик, вычисляющих акустические корреляты ритма1, в сущности, мало чем отличаются от классических попыток найти изохронность, так как они основаны на измерении длительности интервалов.
Новые наблюдения поставили перед лингвистами вопрос о целесообразности переосмыслить свой подход к понятию речевого ритма и рассматривать его как особую форму выделенности, которая достигается всеми компонентами просодии, а не одним лишь ее временным компонентом. Появились работы, посвященные роли невременных характеристик звучащей речи в создании эффекта выделенности таких, как ЧОТ, интенсивность, спектральные характеристики, и их сочетаний. Так, для выявления ритмических особенностей некоторых британских диалектов использовался не только РУ1 вокалических и консонантных интервалов, но и РУ1 средних показателей слоговой интенсивности. Было обнаружено, что данные по РУ1 интенсивности
1 См. [2].
оказались более информативными, чем по PVI длительности сегментов [14]. В связи с этим остается пока открытым вопрос, является ли длительность основным или только наиболее заметным фактором, влияющим на восприятие ритмических различий. Таким образом, исследования, проведенные в начале ХХ в., привели лингвистов к пониманию того, что параметры типа PVI измеряют не ритм, а только один из его компонентов, и они не в состоянии отразить регулярность, основанную на их комплексе.
Также было замечено, что при достижении эффекта выделенности отдельные просодические параметры способны отражать специфику языка, так как один и тот же параметр может в разных языках иметь разную функциональную нагрузку. Например, в нидерландском языке спектральный наклон убывания энергии (tilt) признан основным акустическим параметром словесного ударения, в то время как в английском языке спектральный наклон различает только акцентируемые и неакцентируемые (но ударные) слоги [14].
Если выделенность формируется пучком просодических параметров, типичным для каждого языка, то это означает, что его ритмический профиль является результатом не просто добавления или вычитания какого-либо параметра, а составляется из их совокупности и сбалансированности. Некоторые исследования показали, что такими показателями могут быть, кроме длительности, интенсивность и высотный уровень [3; 11]. Нельзя также игнорировать изменения в спектре. Так, К. Колер предлагает задуматься, почему английские ding-dong, ping-pong, sing-song, zigzag с закрытой-открытой последовательностью формы полости рта звучат более ритмично, чем если компоненты этих слов поменять местами [11]. Все языки, отмечает К. Колер, и с ним согласны У. Барри и др. [4], используют эти четыре просодических компонента для создания эффекта выделенности, но модель, по которой они их компонуют, у всех языков разная. В этом отражается специфика конкретного языка.
Осознание того, что ритм - это, прежде всего, выделенность, которая достигается не только за счет периодичности временных интервалов, но и за счет других просодических характеристик, возродило исследовательский интерес к ритму как к воспринимаемому явлению.
Эксперименты Р. Камминг [5; 6] показали, что длительность и ЧОТ являются взаимодополняющими показателями при восприятии ритма. В случае недостаточной величины одного из них величина другого
параметра возрастает до значения, необходимого для восприятия фразы как ритмичной. Аналогичную тенденцию обнаружили Дж. Ноукс и Дж. Хэй [13] при исследовании ритма новозеландского варианта английского языка. Их анализ показал, что при увеличении темпа речи нивелирование длительности ударных и безударных слогов компенсируется изменениями в сторону увеличения других параметров, для того чтобы сохранить контраст между ударными и безударными слогами. При этом мужчины и женщины применяют разные стратегии: мужчины используют интенсивность, а женщины - высотный уровень.
Р. Камминг [5] считает, что эти данные можно интерпретировать как отношения компромисса (trading relations), когда изменения в одном из показателей могут уравновешиваться, компенсироваться изменениями в другом. В случае недостаточной величины одного из этих двух параметров величина другого параметра возрастает до значения, необходимого для восприятия фразы, как ритмичной. Ни один из физических показателей не воспринимается слушающими изолированно, они воспринимаются одновременно, объединяясь в единый фонетический образ.
К. Колер призывает лингвистов исследовать межъязыковые различия в восприятии ритма [11]. С ним согласна и Р. Камминг. Она также предлагает обсудить вопрос о влиянии родного языка на восприятие ритма иноязычной речи. Еще в середине ХХ столетия было высказано предположение, что восприятие модели, по которой группируются сигналы, зависит от родного языка слушающего. Так, было установлено, что при восприятии серии ударов, в которой каждый третий удар был сильнее остальных, чешские, французские и польские испытуемые группировали их по-разному, помещая выделенный удар в начало, середину или в конец группы, в зависимости от размещения выделенного слога в слове в родном языке [10]. При восприятии чередования тонов разной длительности испытуемые-англичане воспринимали их как объединение «короткий-долгий», а испытуемые-японцы, как «долгий-короткий», очевидно, потому, что в английском языке короткие служебные слова предшествуют более долгим знаменательным, а в японском языке, наоборот, служебные слова следуют за знаменательными [9].
Уже собран материал, подтверждающий, что родной язык слушающего влияет на распознавание контрастов сегментного уровня иноязычной речи [6]. Это обстоятельство наводит исследователей на мысль, что родной язык может влиять и на восприятие просодии.
Например, французы, финны и венгры, в отличие от испанцев, оказались совершенно невосприимчивы к контрастам ударных / безударных слогов: испытуемые не смогли определить ударный слог в двусложных бессмысленных словах. Исследователи полагают, что, так как в этих языках отсутствует лексическое ударение, то у говорящих на них отсутствует когнитивный механизм для его отображения [7].
Последние годы отмечены растущим интересом исследователей к межъязыковой вариативности в восприятии, однако исследования по ритму в этой области практически не проводятся. Этот досадный пробел можно объяснить тем, что вот уже более ста лет в психологии доминирует мнение о том, что группировка элементов при восприятии определяется универсальными врожденными когнитивными процессами [9].
Если воспринимаемый ритм порождается объединением выделенных и невыделенных элементов, то необходимо выявить, какие акустические свойства слушающий воспринимает как выделенные в зависимости от своего родного языка. У. Барри и др. [4] установили, что определенные фонологические характеристики родного языка слушающего влияют на восприятие ритма иноязычной речи, становясь для него более информативными, чем другие. Для всех испытуемых - немцев, англичан и болгар - вторым по значимости показателем ритмичности звучания фразы были тональные изменения (первое место было отдано длительности), а для болгарских участников эксперимента и временные, и тональные показатели имели практически равный вес. Напряженность и спектральные изменения гласных (^а:] то ^э]) оказались весьма несущественными факторами для немецких испытуемых, но их значимость была выше для испытуемых-англичан, и оказалось, что для болгар различия в качестве гласных были так же значимы, как и различия в длительности.
Сходные результаты были получены Р. Камминг [6]. Ее опыты показали, что, несмотря на то, что длительность и тональные изменения являются взаимодополняющими параметрами, их значимость различается для говорящих на разных языках. Для немецкоговорящих швейцарцев «правильная» длительность вносит больший вклад в восприятие ритмичности фразы, чем «правильные» тональные изменения1. Это наблюдение находит объяснение в фонологических
1 Испытуемым предлагались фразы, в которых попеременно искажались показатели длительности и / или ЧОТ.
особенностях немецкого языка, для которого характерны скопление согласных в слоге и фонологические контрасты сегментного уровня. Для французских испытуемых и франкоговорящих швейцарцев изменения обоих параметров оказались существенными в равной степени, что вполне согласуется с особенностями французского языка, который демонстрирует низкую степень вариативности слогов по структуре и длительности. Показатели длительности могут быть самыми заметными признаками ритмичности для слушающих, язык которых допускает значительную временную вариативность соседних слогов. Данное обстоятельство объясняет, очевидно, почему для лингвистов-германистов длительность всегда играла такую большую роль в исследованиях по ритму.
Исследования Р. Камминг и У. Барри и др. предоставляют экспериментальные данные, свидетельствующие о том, что носители разных языков воспринимают комплексную природу ритма по-разному, что носители и не носители придают значение разным физическим параметрам. Можно сказать, что слушающие воспринимают ритм других языков через призму просодии родного языка. Поэтому необходимо исследовать особенности восприятия ритма с точки зрения межлингвистического ракурса.
К. Колер [11] считает, что необходимо создать такую методику по изучению ритмических особенностей языка, которая смогла бы учесть все особенности объединения просодических компонентов. Задача по разработке такой методики усложняется еще и тем, что ритмичность зависит и от речевого регистра (имеется ввиду поэтическая, прозаическая, спонтанная речь), который также необходимо учитывать. Кроме того, изучение роли просодических компонентов нельзя вести отдельно от исследования возможностей их восприятия. К. Колер справедливо замечает, что речь всегда обращена к слушающему, и изменения в физических свойствах речевого сигнала только тогда имеют значение, когда они им воспринимаются.
К. Колер приступил к созданию универсальной методики описания ритмических особенностей всех языков мира, которая будет учитывать регистр речи, и назвал ее Новой парадигмой исследования ритма (a New Paradigm of Rhythm Research). Он полагает, что это - задача сложная, но исключительно захватывающая и интригующая. Одновременный анализ структурно различных языков по единому экспериментальному
замыслу, проводимый параллельно как в области производства, так и в области восприятия, будет способствовать выявлению специфических для каждого языка особенностей применения физических параметров ритмичности при передаче речевых сообщений. Этот подход, в отличие от предыдущих методик, центром которых был анализ длительности - сегмента, слога, стопы, - сможет создать более широкую основу для исследования ритма в языке и в речи.
В заключение хотелось бы напомнить, что отечественные лингвисты еще в 30-е годы ХХ столетия рассматривали ритм как комплексное явление и выдвигали тезис о необходимости рассмотрения других компонентов просодии при изучении ритма, прежде всего высотных характеристик. Уже тогда А. Пешковским ставился вопрос о иерархическом характере ритма1.
Качественно иной подход к проблемам речевого ритма был разработан А. Антиповой [1] и затем был развит в работах ее учеников. А. Антипова определяет ритм как периодичность сходных и соизмеримых речевых единиц. Исследуя ритм английского языка на материале текстов большой протяженности, принадлежащих разным жанрам, она выдвинула идею о том, что практически любая структурно-смысловая единица текста может стать ритмической единицей, если она обладает сходностью и соизмеримостью и периодически повторяется в определенном речевом отрезке. Иными словами, была высказана мысль, что единицы ритма - это и единицы смысла.
Сходность и соизмеримость формируются просодией, всеми ее компонентами: высотным, силовым, темпоральным, поэтому ритм следует рассматривать как просодическое, комплексное, а не только как исключительно временное явление. Наименьшей смысловой единицей в прозе является синтагма, далее идут фраза и СФЕ; в поэтической речи выделяют строку и строфу. Любая из перечисленных семантических единиц текста, полагает А. Антипова, может одновременно стать его ритмической единицей при соблюдении критериев сходности и соизмеримости, и это означает, что ритмическая структура текста оказывается тесно связанной с его семантической структурой.
А. Антипова подчеркивает, что в речи повторяются лишь сходные, а не идентичные явления. Сходность единиц достигается высотными
1 В западной лингвистике вопрос о существовании иерархии ритмов в языках был поднят лишь в начале XXI столетия [14].
и силовыми компонентами просодии. Соизмеримость единиц достигается темпоральным компонентом просодии. Под соизмеримостью понимается перцептивная изохронность, временное однообразие. Понятие соизмеримости речевых единиц не предусматривает абсолютной точности, а предполагает определенный временной диапазон, в пределах которого варьируется длительность однотипных единиц.
Представляется, что длительность некоторых ритмических единиц может быть обусловлена физиологическими процессами, происходящими в сознании говорящего. Так, психологи установили, что порождение речи связано с формированием программ различных уровней. Программируемые единицы обладают различной протяженностью во времени. Минимальная единица составляет около 200 мс, что приблизительно соответствует длительности слога. Следующая по величине единица находится в пределах 1 с, и ею может быть ритмическая группа, которая часто совпадает со словом или со словосочетанием. Более крупная единица редко превышает 2 с, и ее можно приравнять к синтагме. Эти сведения дают основания полагать, что существует определенная временная сетка, заданная физиологией человека, на которую накладывается смысл и прагматика [1].
Итак, трактовка ритма как особой формы выделенности, которая достигается всеми компонентами просодии, а также идея об иерархическом характере ритма были высказаны российскими учеными еще в 30-е гг. и получили дальнейшее развитие в отечественной лингвистике в 80-е гг. ХХ столетия. Западные ритмологи, как это было показано выше, пришли к осознанию этих вопросов намного позже. При отсутствии надлежащей качественной, высокотехнологичной экспериментальной базы, используя несколько наивные методы анализа, отечественные исследователи речевого ритма опередили выводы своих западных коллег на несколько десятилетий.
СПИСОК ЛИТЕРАТУРЫ
1. Антипова А. М. Ритмическая система английской речи. - М. : Высшая школа, 1984. - 118 с.
2. Бурая Е. А. Ритмические средства выражения социальной и национальной идентичности // Фонетика: проблемы и перспективы. - М. : ФГБОУ ВПО МГЛУ, 2014. - С. 33-43. - (Вестн. Моск. гос. лингвист. ун-та; вып. 1 (687). Серия «Языкознание»).
3. ArvanitiA. Rhythm, Timing and the Timing of Rhythm // Phonetica. - 2009. -Vol. 66. - No 1-2. - P. 46-63.
4. Barry W., Andreeva B., Koreman J. Do Rhythm Measures Reflect Perceived Rhythm? // Phonetica. - 2009. - Vol. 66. - No. 1-2. - P. 78-94.
5. Cumming R. E. The Interdependence of Tonal and Durational Cues in the Perception of Rhythmic Groups // Phonetica. - 2010. - Vol. 67. - No. 4. -P. 219-242.
6. Cumming R. E. The Language-Specific Interdependence of Tonal and Durational Cues in Perceived Rhythmicality // Phonetica. - 2011. - Vol. 68. -No. 1. - P. 1-25.
7. Dupoux E., Peperkamp S., Sebastian-Galles N. A robust method to study stress 'deafness' // Journal of the Acoustical Society of America. - 2001. -Vol. 110. - No. 3. - P. 1608-1618.
8. Hay J. F., Randy L. D. Effect of Duration, Intensity, and F0 Alternations on Rhythmic Grouping. - 2007. - URL : utexas.edu>cola/files/1519220
9. Iversen J. R., PatelA. D., OhgushiK. Perception of rhythmic grouping depends on auditory experience // Journal of the Acoustical Society of America. -2009. - Vol. 124. - No. 4. - P. 2263-2271.
10. Jakobson R., Fant G., Halle M. Preliminaries to speech analysis: The Distinctive Features and their correlates. - Massachusetts : the MIT Press, 1952. -64 p. - URL : monoskop.org>...2...Jakobson_Fant_Halle_Preliminaries....
11. Kohler K. J. Rhythm in Speech and Language. A New Research Paradigm // Phonetica. - 2009. - Vol. 66. - No. 1-2. - P. 29-45.
12. Lloyd J. A. Speech Signals in Telephony. - London, 1940. - 49 p.
13. Nokes J., Hay J. Acoustic correlates of Rhythm in New Zealand English: A Diachronic Study // Language Variation and Change. - 2012. - Vol. 24. -No. 1. - P. 1-31.
14. Nolan F., Asu E. L. The Pairwise Variability Index and Coexisting Rhythms in Language // Phonetica. - 2009. - Vol. 66. - No. 1-2. - P. 64-77.