УДК 811.161.1
DOI: 10.17223/19986645/69/5
П.В. Дурягин, М.В. Фокина
ВОСПРИЯТИЕ ПРОСОДИИ БЕЗЛИЧНЫХ ФРАЗ СО ЗНАЧЕНИЕМ ОТКАЗА НОСИТЕЛЯМИ РУССКОГО ЯЗЫКА: ЛИНГВИСТИЧЕСКИЙ И ПАРАЛИНГВИСТИЧЕСКИЙ
АСПЕКТЫ1
Описаны результаты фонетического эксперимента, посвященного восприятию носителями русского языка восходяще-нисходящих тональных контуров в двух безличных фразах со значением отказа: «хватит» и «не надо». Исследование позволило определить влияние трех акустических параметров (тайминга и высоты пика, длительности ударного гласного) на идентификацию типа фразы, а также на категоризацию невопросительных высказываний по признакам нейтральности / ненейтральности и грубости / вежливости.
Ключевые слова: современный русский язык, интонация, общий вопрос, тональный акцент, длительность гласного, перцептивный эксперимент, вежливость.
Введение
Современные фонологические описания интонации, созданные в рамках автосегментной метрической модели [1, 2] (см. также обзоры в [3, 4]), выделяют два типа значений, которые могут передаваться в процессе устной коммуникации средствами просодии. С одной стороны, фразовая интонация может маркировать лингвистические, структурные компоненты значения (такие, как, например, противопоставление между общим вопросом и невопросительным предложением в русском языке [5]). С другой стороны, при помощи тех же средств носителями языка передаются пара-лингвистические компоненты значения, к которым обычно относится информация об эмоциональном состоянии говорящего и его отношении к высказыванию (например, заинтересованность, удивление, раздражение).
В современной интонологии проблема проведения границы между лингвистической и паралингвистической функциями интонации признается одной из центральных [3. Р. 40]. Теоретические основания для их разграничения предложены, например, в [4], где элементы значения, передаваемые при помощи интонации в различных языках мира, сравниваются на предмет их соответствия трем критериям из числа свойств человеческого языка, выделенных Ч. Хоккетом [6]: произвольности отношений между формой и значением, дискретности, а также структурной двойственности.
1 Работа выполнена частично в рамках проекта Dipartimento di Eccellenza, осуществляемого в департаменте лингвистики и сравнительной культурологии Университета Венеции Ка' Фоскари.
Таким образом, противопоставленные в восприятии носителей языка поверхностные формы, удовлетворяющие этим критериям (в первую очередь критерию дискретности), признаются отражающими фонологический контраст, существующий на глубинном уровне. Напротив, несоответствие указанным критериям свидетельствует о том, что формы являются фонетическими вариантами одной и той же структурной единицы.
Вопрос отнесения различных функций просодии к лингвистическим или паралингвистическим решается при помощи методов экспериментальной фонетики, в первую очередь путем проведения перцептивных экспериментов. В качестве классических примеров таких исследований, проведенных на материале западноевропейских языков и заложивших основы методологии, можно привести работы [7-9]. В рамках настоящего исследования представляется целесообразным подробнее остановиться на том, как к этой проблеме обращались исследователи интонации русского языка.
Традиционные описания русской интонации либо вовсе не ставят цель провести границу между лингвистическими и паралингвистическими компонентами [10], либо используют критерии, недостаточные для установления этого различия. Так, неоднократно подвергался критике [11-14] критерий «несовместимости» интонационных контуров, лежащий в основании широко используемой в русистике модели Е.А. Брызгуновой [15]. Не останавливаясь подробно на проблематике, повторим, что с точки зрения автосегментной метрической модели и близких к ней моделей описания интонации одна лишь способность интонационных различий «противопоставлять высказывания, смысловые различия которых несовместимы в одном и том же контексте» [Там же. С. 99], т.е. маркировать неодинаковые с точки зрения носителя языка значения при неизменности сегментного материала, не может выступать в качестве достаточного критерия для постулирования фонологического контраста. Другим часто критикуемым элементом теории Брызгуновой является неясный статус модальных реализаций интонационных конструкций, чья принадлежность к той или иной категории требует формального доказательства.
Перцептивные эксперименты, проводившиеся на просодическом материале русского языка, берут свое начало в 1980-х гг. [16]. В первую очередь среди них следует выделить исследования С. Оде ([17-19] и др.), созданные в рамках нидерландской интонологической модели IPO (Институт перцептивных исследований в г. Эйндховен). Суть этого метода изучения интонации, подробно описанного в [20], заключается в использовании данных корпуса звучащей речи для создания искусственных стилизованных интонационных контуров, перцептивно неотличимых от натуральных, но содержащих только необходимый минимум релевантной просодической информации: значимые изменения направления частоты основного тона (тональные акценты), соединенные прямыми линиями не несущих перцептивной выделенности движений тона (англ. non-prominence lending pitch movements). Затем с использованием экспериментальных методов на основании принципа «перцептивной эквивалентности» все стилизованные
контуры классифицируются по группам. В результате применения этого метода Оде выделила в русском языке шесть восходящих и семь нисходящих тональных акцентов [12, 17]. Каждый из тональных акцентов был охарактеризован по ряду перцептивно значимых для носителей языка признаков: по положению пика частоты основного тона (далее - ЧОТ) относи-
1
тельно границ сегментов , а также направлению и диапазону изменения ЧОТ до этой точки (собственно тональный акцент, в терминологии IPO) и после нее («постцентр»).
В ранней модели, предложенной Оде, задача функциональной интерпретации выделенных контуров не ставилась, следовательно, не проводилась и эксплицитная граница между лингвистическими и паралингвисти-ческими элементами значения, передаваемыми интонацией. Впоследствии исследовательницей была представлена обновленная модель описания русской интонации [19], включившая описание «коммуникативных функций» шести основных русских тональных акцентов. Однако в предложенных Оде описаниях функций тональных акцентов граница между лингвистическими и паралингвистическими компонентами значения также не проводится. В качестве примера можно привести описание акцента H*M, основной коммуникативной функцией которого предлагается считать «выражение незавершенности», но в то же время «этот акцент может выражать также реакцию удивления и раздумье» [19. Р. 443].
Ряд экспериментов с целью анализа восприятия носителями русского языка искусственно синтезированных восходяще-нисходящих контуров описан в работах В. Макаровой [21, 22]. Наиболее полно влияние просодических факторов на восприятие типа высказывания (повествовательное / вопросительное / восклицательное) продемонстрировано в [23] на материале однословной фразы Бананы / Бананы? / Бананы!. Эксперимент показал, что манипулирование позицией пика ЧОТ относительно границ сегментов, диапазоном и скоростью изменения ЧОТ влияет на восприятие типа высказывания. При раннем тайминге носители русского языка воспринимали фразы с низкими пиками ЧОТ как повествовательные, с высокими - как восклицательные. Фразы с поздним пиком воспринимались как вопросительные, причем чаще в том случае, если имели высокий пик. В работе отсутствуют выводы о категориальности восприятия описанных различий, поскольку, как отмечает автор, для получения таких результатов необходим не только эксперимент по идентификации контуров, но и эксперимент по их различению в парах (англ. discrimination experiment).
Такой классический двухэтапный эксперимент по установлению категориального восприятия двух типов русских фраз (утверждение / общий вопрос) описан в [5]. Автор работы на материале фразы Ее зовут Елена(?) продемонстрировала наличие границы между двумя категориями в вос-
1 В англоязычной литературе для описания этого параметра используется термин peak alignment, для его компактного перевода мы используем устоявшийся в русистике под влиянием работ Оде термин «тайминг».
приятии носителей русского языка, проанализировав влияние трех факторов. Эффект двух из них (тайминга и крутизны восходящего движения тона) оказался статистически значимым, в отличие от фактора высоты пика. В контексте настоящего исследования необходимо отметить, что результаты эксперимента Ратке также указывают на возможное существование третьей категории: стимулы с ранним высоким пиком и крутым восходящим движением тона интерпретировались информантами как выражающие контраст или эмфазу, а не нейтральное утверждение. Это предположение было отчасти проверено исследовательницей экспериментально в [24] на материале фразы Она раньше не ела малину (сравнивались только контексты, вызывающие интерпретацию этой фразы как повествовательной с контрастным фокусом на глаголе либо как общего вопроса). Эксперимент продемонстрировал значимое влияние позиции пика (в середине ударного гласного для контрастного фокуса или в середине первого согласного заударного слога для вопроса). Ратке предлагает интерпретировать противопоставление русских восходяще-нисходящих контуров не как бинарное, но как состоящее из трех противопоставленных тональных акцентов, которые в транскрипции, аналогичной ТоЫ1, могут быть записаны как Ы+Ь* (нейтральное повествование), Ы*+Ь (контрастный фокус, эмфаза, также Ы* в работе [28]) и Ь*+Ы (общий вопрос).
Иной тип эксперимента, позволяющий установить градуальность / дискретность интонационных противопоставлений с помощью порождения, а не восприятия речи, представлен в работе [29]. Автор модифицировал методику эксперимента [8], предложив информантам имитировать искусственно синтезированные произнесения фразы Марина Романовна с модифицированным таймингом плато ЧОТ. Результаты эксперимента также свидетельствуют в пользу гипотезы о существовании в русском языке двух категориально противопоставленных нисходящих тональных акцентов: с ранним таймингом пика и с таймингом в центре ударного слога. Игараши, как и Ратке, предлагает транскрибировать их как Ы+Ь* и Ы*+Ь (или Ы*). Наконец, сходные результаты были получены для невопросительных предложений при исследовании просодического маркирования разных видов фокуса в [30].
Таким образом, перцептивные исследования русской интонации были в основном сосредоточены на анализе русских тональных акцентов, фонетически реализующихся восходяще-нисходящим движением ЧОТ. Настоящая работа ставит целью продолжить эту линию исследований. Описанный в данной статье эксперимент представляет собой опыт изучения влияния трех просодических параметров на восприятие носителями русского языка восходяще-нисходящих движений тона в двух безличных фразах со
1 ToBI (от англ. Tones and Break Indices) - способ транскрипции просодии в рамках автосегментной метрической модели интонации, который изначально был разработан для английского языка [25], а впоследствии послужил основой для создания систем транскрипции для ряда других языков [26, 27].
значением отказа: не надо и хватит. Эти фразы обладают рядом преимуществ по сравнению с материалом, использовавшимся ранее в работах, посвященных восприятию русской интонации. В частности, они легко воспринимаются носителями русского языка без контекста и обладают потенциалом для выражения паралингвистических элементов значения. Таким образом, в результате исследования восприятия этих фраз представляется возможным оценить влияние просодических факторов на то, как носители языка воспринимают не только ранее исследованные типы значений (утверждение / вопрос, нейтральное / ненейтральное утверждение), но и некоторые элементы значения, связанные с эмоциональной окраской высказывания.
Эксперимент Просодия дискурсивной формулы да ну
Исходной точкой для настоящего эксперимента послужил опыт изучения полисемии русской дискурсивной формулы1 да ну. Ранее фонетический эксперимент [32], проведенный при участии восьми носителей русского языка, продемонстрировал, что в их речи (в качестве метода элици-тации использовалось воспроизведение прочитанных диалогов по памяти) наблюдаются две разные просодические реализации да ну, распределенные следующим образом в зависимости от контекста: 1) в контекстах, выражающих отрицание, несогласие, недоверие в ответ на сообщение ложной или сомнительной информации информанты использовали восходяще-нисходящий тональный контур с ранним относительно низким пиком ЧОТ; 2) в контекстах, выражающих отрицание, несогласие в ответ на опасение, комплимент, извинение или предложение помощи, информанты, помимо описанного выше движения тона, использовали восходящий тональный контур с поздним высоким пиком. При этом в речи одних информантов эти две реализации были последовательно противопоставлены, в то время как в речи других наблюдалась дополнительная дистрибуция, но только в контекстах второго типа. На рис. 1 представлены примеры норма-лизованных2 контуров ЧОТ в произнесении одного информанта в различных контекстах.
Данные, полученные на материале фразы да ну, не поддаются однозначной фонологической интерпретации.
Во-первых, ограничения накладывает сегментный состав фразы, так как в ней отсутствуют заударные слоги.
1 Подробнее о термине «дискурсивная формула» и критериях выделения этих единиц см. [31].
2 Для нормализации использовался алгоритм, предложенный в [33].
Рис. 1. Нормализованные контуры ЧОТ в произнесении одного из информантов
Поскольку для русского языка характерно усечение («трункация») тональных акцентов при отсутствии сегментного материала [18, 28], не представляется возможным однозначный выбор между интерпретациями тонального акцента в да ну второго типа1. Во-вторых, чтобы утверждать, что две реализации да ну отражают противопоставление двух разных тональных акцентов (а не фонетические варианты одного тонального акцента, нечто вроде «модальных реализаций» Е.А. Брызгуновой), необходимо экспериментально продемонстрировать категориальность противопоставления. Задача представляется трудновыполнимой в первую очередь потому, что фраза да ну, как и другие «дискурсивные формулы», в высокой степени идиоматична, ее значение с трудом формулируется носителями языка без контекста. Проведение экспериментов, в которых информанты оценивали бы контуры на «соответствие» предложенному контексту, также невозможно, поскольку во многих контекстах допустимы (хотя и не синонимичны) оба варианта.
Наконец, носитель языка может обратить внимание на то, что две реализации содержат паралингвистическую информацию об отношении говорящего к позиции собеседника. В контекстах первого типа (да ну в ответ на сообщение факта) говорящий достаточно категорично, даже грубо выражает несогласие с собеседником, в то время как в контекстах второго типа (да ну в ответ на опасение, комплимент, извинение или предложение по-
1 Да ну первого типа, вероятно, должен быть проанализирован как содержащий тональный акцент Н*+Ь или Н* [14, 28].
мощи) говорящий отрицает информацию в более вежливой форме, исключая возможность обидеть собеседника несогласием. Эти факты могут служить аргументом в пользу того, что, поскольку мы не располагаем данными о категориальности наблюдаемого противопоставления, оно также может быть интерпретировано как градуальное выражение паралингвистиче-ской информации по шкале «грубость - вежливость» в рамках одного и того же тонального акцента.
Материал эксперимента
По итогам анализа проблем, возникших в ходе исследования фразы да ну, в качестве материала для нового эксперимента была выбрана фраза не надо. С точки зрения сегментного состава она хорошо подходит для манипуляций ЧОТ (содержит заударный и предударный слоги, а также звонкие согласные). С точки зрения интерпретации она представляет собой частотный и немаркированный стилистически способ выражения отказа в русском языке, который способен приобретать дополнительные эмоциональные оттенки в зависимости от просодического оформления. Кроме того, в отличие от да ну, не надо может выступать в роли общего вопроса.
Сходными свойствами обладает вторая фраза, использованная в настоящем эксперименте: хватит. Она является также частотным, однако менее нейтральным, скорее резким способом отказа. Результаты, полученные в ходе эксперимента для фразы хватит, безусловно, должны рассматриваться с учетом этих лексических и стилистических особенностей. Кроме того, в ходе эксперимента выяснилось, что сегментный состав хватит, а именно, заударного слога, состоящего из редуцированного гласного, окруженного двумя глухими согласными, ограничивает возможности ресинтеза тонального контура.
Для создания экспериментальных стимулов обе фразы были записаны в тихом помещении на встроенный микрофон диктофона ZOOM H5 в произнесении мужчины, носителя литературного произношения, одного из авторов статьи. Фразы были произнесены сначала с нейтральной повествовательной интонацией, затем с интонацией общего вопроса. Эти «оригинальные», не модифицированные записи в дальнейшем были использованы в эксперименте только в качестве филлеров в коротком «обучении», предшествовавшем эксперименту. Произнесения фраз с повествовательной интонацией стали основой для ресинтеза собственно экспериментального материала, созданного в компьютерной программе Praat [34] с использованием функции PSOLA (англ. Pitch Synchronous Overlap and Add).
Список акустических параметров, способных влиять на восприятие носителями русского языка восходяще-нисходящих контуров, потенциально достаточно велик, в их число различными исследователями включались положение пика ЧОТ относительно границ ударного гласного или слога (во всех актуальных работах), высота пика [17, 23, 29, 30], наличие / отсутствие так называемого «локтя», «точки перелома» движения ЧОТ в предцентровой
части [29], крутизна восходящего движения тона [5], сегментная база «оригинальной записи», на материале которой проводятся манипуляции [23], и другие признаки. Также на основании анализа фонетической реализации фразы да ну нами была выдвинута гипотеза о том, что на восприятие контуров может оказывать влияние длительность ударного гласного. В материале эксперимента [32] в произношении информантов этот параметр варьировался в широких пределах, хотя статистически значимого различия между длительностью гласных в двух типах контуров да ну обнаружено не было.
Манипулирование каждым из этих факторов сделало бы эксперимент крайне продолжительным и утомительным для информантов. В связи с этим на основе данных, полученных в эксперименте [32], нами были выбраны три параметра: 1) положение пика относительно границ ударного слога (тайминг); 2) высота пика; 3) длительность ударного гласного. Возможное влияние остальных факторов (в особенности крутизны восходящего и нисходящего движений ЧОТ и наличия / отсутствия переломных точек в контуре) нами не исключается, но остается за рамками настоящего исследования. В данном эксперименте при создании стимулов эти параметры выступали в качестве констант.
Создание стимулов
Ниже приведены подробности манипуляций тремя акустическими параметрами на примере фразы не надо. Аналогичные манипуляции были произведены с контуром ЧОТ фразы хватит.
В записи не надо, послужившей основой для модификаций, длительность ударного гласного составила 125 мс. Поскольку исследование да ну показало, что для эмоционально окрашенных реализаций характерна увеличенная длительность ударного гласного, этот параметр было решено варьировать по трем уровням: гласный обычной длительности (125 мс), долгий (+33% длительности, около 166 мс) и сверхдолгий (+66% длительности, около 208 мс).
Затем для каждого уровня длительности были рассчитаны тайминги пика ЧОТ, пять точек в пределах ударного слога, разделенные одинаковыми временными промежутками: 1) пик в начале согласного ударного слога (рядом с этой точкой располагался пик ЧОТ в записи, послужившей основой для модификации); 2) пик на 25% длительности ударного слога; 3) пик в середине ударного слога; 4) пик на 75% ударного слога; 5) пик в конце ударного слога. Далее в статье номера 1-5 используются для указания на эти значения тайминга.
Для третьего параметра, высоты пика ЧОТ, были выбраны три уровня с интервалами в 6 полутонов1: низкий пик (около 147 Гц, примерно равный высоте пика в записи, послужившей основой для модификации, - 142 Гц),
1 Логарифмические шкалы рекомендуются к использованию в экспериментах по восприятию интонации, поскольку они точнее, чем линейная шкала в Гц, позволяют моделировать восприятие изменения ЧОТ человеческим ухом [35].
средний пик (на 3 полутона выше, около 176 Гц) и высокий пик (еще на 3 полутона выше, около 209 Гц).
После того как «координаты» всех пиков были определены, были рассчитаны также временная локализация и частота точек, соответствующих началу восходящего и концу нисходящего движения тона. Эти параметры были рассчитаны таким образом, чтобы скорость изменения ЧОТ (полутон/с) и, соответственно, крутизна восходящего и нисходящего движения ЧОТ оставались неизменными. Кроме этого, неизменными для всех стимулов были значения ЧОТ до точки начала восходящего движения тона (119 Гц) и после конечной точки падения тона (89 Гц), средняя интенсивность, а также сегментный состав фраз, за исключением длительности ударного гласного (в качестве базы для манипуляции использовалась одна и та же запись).
Таким образом были рассчитаны «координаты» трех точек (начало восходящего движения ЧОТ, пик, конец нисходящего движения ЧОТ) для ре-синтеза 90 контуров (3 уровня длительности гласного х 5 уровней «тайминга» пика х 3 уровня высоты пика х 2 фразы). Траектории движения тона между этими точками были рассчитаны при ресинтезе с помощью встроенной в Ргаа функции квадратичной интерполяции, позволяющей представить движения тона в виде параболической кривой, а не прямой линии. Для наглядности контур ЧОТ оригинальной записи, а также 9 полученных в результате ресинтеза контуров не надо с гласным нормальной длительности представлены на рис. 2 (изображены только пики с таймингом 1, 3 и 5 (начало, середина и конец ударного слога); точки расположения пика 2 и 4 опущены, чтобы обеспечить возможность прочтения графика).
0 0.6107
Time (s)
Рис. 2. Примеры синтезированных контуров фразы не надо, использовавшихся в качестве стимулов. Тосками обозначен фактор ЧОТ в оригинальной записи
Отдельно следует остановиться на ресинтезе контуров фразы хватит. В ее сегментный состав входят три глухих согласных, не способные нести
информацию о ЧОТ, тем не менее при ресинтезе нами было принято решение следовать тому же алгоритму, что и в случае с не надо. В результате ресинтеза были получены «усеченные» контуры хватит (рис. 3), которые содержат меньше тональной информации, чем контуры не надо.
О 0,764
Тппе (я)
Рис. 3. Примеры синтезированных контуров фразы хватит, использовавшихся в качестве стимулов. Тосками обозначен фактор ЧОТ в оригинальной записи
Эти особенности были учтены при анализе экспериментальных данных (см. разделы «Результаты» и «Обсуждение»).
Дизайн эксперимента
Для проведения эксперимента была использована компьютерная программа РхуеНоРу [36]. Все 90 синтезированных экспериментальных стимулов были предложены информантам для прослушивания в наушниках в случайном порядке. Информанты должны были прослушать каждый стимул дважды с промежутком около 3 секунд и ответить на вопрос: «С какой интонацией произнесена фраза?» Предлагались 5 вариантов ответов: «Это вопрос»; «Фраза звучит грубо, резко, категорично (приказ, резкий отказ)»; «Фраза звучит нейтрально, спокойно»; «Фраза звучит вежливо (просьба, вежливый отказ)»; «Интонация не имеет смысла». Каждому варианту ответа соответствовала клавиша на клавиатуре компьютера. Экспериментальной сессии, которая обычно длилась около 25 минут, предшествовало короткое обучение, в ходе которого информантам предлагалось выполнить то же самое задание на материале 10 тренировочных стимулов, включающих как «оригинальные», не модифицированные записи, так и ресинтези-рованные контуры.
В рамках настоящего исследования мы анализируем реакцию информантов на каждый стимул как последовательность из четырех решений с
двумя вариантами ответа. Прежде всего, информант должен был определить, (1) является ли интонация фразы «натуральной» («имеющей смысл», интерпретируемой). Если стимул признавался «имеющим смысл», то информант должен был определить, (2) фраза представляет собой общий вопрос или же невопросительное предложение (отказ, приказ, просьбу). Если стимул был идентифицирован как невопросительное предложение, информант должен был оценить его нейтральность: (3) фраза произнесена с нейтральной интонацией («спокойно») или с ненейтральной интонацией («грубо», «вежливо»). Наконец, для ненейтральных утверждений информант должен был сделать выбор: (4) фраза представляет собой грубый отказ (требование, приказ) или вежливый отказ (вежливую просьбу).
Информанты
В эксперименте приняли участие 28 носителей русского языка (18 женщин, 10 мужчин). Результаты для трех информантов (двух женщин и одного мужчины) были исключены из анализа на основании формальных критериев: два информанта, вероятно, неправильно поняли задание и ни одну из фраз не идентифицировали как вопрос, еще один информант 13 раз идентифицировал как вопрос стимулы, ни разу не отнесенные к этой категории другими испытуемыми. Средний возраст 25 информантов, чьи результаты были проанализированы, составил 30 лет (о = 12.1).
Испытуемые по-разному оценивали сложность выполненного задания. Некоторые описали эксперимент как трудный и утомительный, в то время как другие назвали предложенное задание интересным. Также отдельные испытуемые указали на то, что пяти предложенных вариантов ответа им было недостаточно, чтобы точно охарактеризовать услышанные стимулы, и предлагали иные интерпретации: «плаксивая интонация», «жалоба» и др.
Цели эксперимента
Перед проведением эксперимента на основании анализа имеющихся в литературе сведений о восприятии носителями русского языка фраз с восходяще-нисходящими тональными контурами нами были выдвинуты следующие гипотезы:
1) параметры «тайминг», «высота пика» и «длительность ударного гласного» оказывают влияние на восприятие типа высказывания в безличных фразах со значением отказа хватит и не надо (общий вопрос / невопросительное предложение);
2) параметры «тайминг», «высота пика» и «длительность ударного гласного» оказывают влияние на восприятие невопросительных произнесений фраз хватит и не надо как нейтральных / ненейтральных;
3) параметры «тайминг», «высота пика» и «длительность гласного» оказывают влияние на восприятие произнесений фраз хватит и не надо, отнесенных информантами к категории невопросительных и ненейтральных, как грубых или вежливых.
Помимо проверки перечисленных гипотез, была поставлена цель на основании полученных экспериментальных данных предварительно оценить исследуемые противопоставления на предмет категориальности / граду-альности. Речь идет только о предварительных выводах, поскольку эксперимент по различению стимулов в парах не проводился.
Результаты эксперимента
Результаты эксперимента (в общей сложности 2 250 ответов информантов) были проанализированы в программе R [37]. Для оценки статистической значимости влияния факторов на восприятие стимулов информантами использовался метод множественного регрессионного логистического анализа. С использованием статистического пакета lme4 [38] для каждой выборки была построена обобщенная смешанная логистическая регрессионная модель с бинарной зависимой переменной «ответ информанта», четырьмя фиксированными эффектами: «фраза» (с уровнями хватит и не надо), «тайминг» (1, 2, 3, 4, 5), «высота пика» (низкий, средний, высокий) и «длительность гласного» (100, 133, 166%), а также случайным эффектом (случайный свободный член) для переменной «информант». В соответствии с рекомендациями в [39. Р. 272] переменные всех моделей были проверены на мультиколлинеарность при помощи команды vif пакета car [40]. Во всех моделях показатель коэффициента вздутия дисперсии для всех переменных составил менее 1,6, что говорит об отсутствии коллинеарности предикторов. Полные данные о каждой из четырех моделей, включающие p-значения для каждого предиктора, приведены в табл. 1-4. Все таблицы созданы в R при помощи пакета sjPlot [41], рис. 1 и 4-6 - при помощи пакета ggplot2 [42]. Далее кратко описываются результаты статистического анализа, интерпретация результатов представлена в разделе «Обсуждение».
Натуральные и ненатуральные стимулы
В ходе эксперимента испытуемым предоставлялась возможность отказаться судить о принадлежности стимула к той или иной категории, ответив, что услышанная интонация «не имеет смысла». Количество таких ответов составило около 7% от общего числа (161 ответ) и существенно варьировалось от информанта к информанту (от 0 до 19). Построение логистической модели с бинарной зависимой переменной «натуральный / ненатуральный стимул» (табл. 1) продемонстрировало, что на суждения информантов о натуральности стимула оказывали влияние все четыре фактора, причем статистически значимыми (p < 0.01) оказались эффекты фразы, среднего и позднего тайминга, высокого пика, а также сверхдолгого гласного.
Таким образом, чаще признавались «неестественными» те контуры, которые сильнее отличаются от «оригинальной записи». Большое различие
между значениями предельного и условного коэффициентов детерминации говорит о том, что принятие решения о естественности стимула в высокой степени было обусловлено личностью испытуемого.
Т а б л и ц а 1
Анализ смешанной регрессионной модели для пары натуральный - ненатуральный стимул
Предикторы Ненату зальный / натуральный
Отношения шансов 95% доверит. интерв. Р
(Intercept) 326.98 114.25 - 935.79 <0.001
фраза: не надо 0.36 0.25 - 0.52 <0.001
длительность: 133% 0.94 0.59 - 1.50 0.806
длительность: 166% 0.42 0.28 - 0.64 <0.001
высота пика: средний 0.64 0.41 - 0.99 0.047
высота пика: высокий 0.48 0.31 - 0.75 0.001
тайминг: 2 0.67 0.33 - 1.36 0.267
тайминг: 3 0.27 0.14 - 0.51 <0.001
тайминг: 4 0.24 0.13 - 0.45 <0.001
тайминг: 5 0.30 0.16 - 0.57 <0.001
Случайные эффекты
а2 3.29
т00 информант 2.78
ICC 0.46
N информант 25
Всего наблюдений 2 250
Предельн. R2 / Условн. R2 0.119 / 0.523
AIC 968.064
В рамках настоящего эксперимента не ставилась цель оценить качество синтеза исследуемых контуров, для решения этой задачи необходим иной дизайн эксперимента. В связи с этим результаты для пары «натуральный / ненатуральный» далее подробно не анализируются.
Вопросительные и невопросительные предложения
Из 2 089 стимулов, признанных натуральными, 221 стимул был идентифицирован информантами как общий вопрос. Предварительный анализ
1 / данных показал, что почти все стимулы с ранними пиками (в начале слога
и на 25% длительности слога) были отнесены к категории невопроситель-
1 Исключение составили две реакции на стимул со словом хватит и пиком ЧОТ в начале слога. Большое время реакции испытуемых (в обоих случаях оно составило более 10 с) позволяет предположить, что такие ответы могут быть связаны с эпизодиче-
ской невнимательностью информантов.
ных предложений. Таким образом, наличие раннего пика в контуре указывает, на то, что стимул будет воспринят как невопросительное предложение. Чтобы избежать полного разделения (complete separation), все результаты для примеров с ранними пиками были исключены из регрессионного анализа, в итоге выборка составила 1 223 наблюдения.
Расчет логистической модели с бинарной зависимой переменной «вопросительное / невопросительное предложение» для стимулов таймингом пика 3, 4 и 5 (табл. 2) показал статистически значимый эффект (p < 0.01) четырех факторов на всех уровнях, за исключением средней длительности гласного. Таким образом, чем более поздним и высоким был пик ЧОТ, тем чаще стимулы воспринимались как вопросительные предложения. Фраза не надо воспринималась как вопросительная значительно чаще, чем фраза хватит. Наконец, стимулы со сверхдолгим гласным несколько реже идентифицировались как вопросительные предложения.
Т а б л и ц а 2
Анализ смешанной регрессионной модели для пары вопрос - невопросительное предложение
Предикторы Повествоват. / вопросит.
Отношения шансов 95% доверит. интерв. p
(Intercept) 0.00 0.00 -0.00 <0.001
фраза: не надо 31.26 17.32 - 56.42 <0.001
высота пика: средний 9.68 4.78 - 19.62 <0.001
высота пика: высокий 84.88 39.05 - 184.52 <0.001
тайминг: 4 6.52 3.26 - 13.02 <0.001
тайминг: 5 68.39 32.21 - 145.20 <0.001
длительность: 133% 0.72 0.44 - 1.20 0.208
длительность: 166% 0.47 0.27 - 0.80 0.006
Случайные эффекты
а2 3.29
т00 информант 1.08
ICC 0.25
N информант 25
Всего наблюдений 1 223
Предельн. R2 / Условн. R2 0.684 / 0.762
AIC 605.279
Нейтральный и ненейтральный отказ
Далее была построена регрессионная модель для 1 868 наблюдений, которые информанты отнесли к категории невопросительных предложений. В качестве зависимой бинарной переменной выступил выбор испытуемого отнести стимул к категории «фраза, звучащая нейтрально, спокойно» или не относить стимул к этой категории, выбрав два других варианта, возможных для невопросительного предложения («фраза звучит грубо» и «фраза звучит вежливо»).
Результаты построения модели логистической регрессии представлены в табл. 3.
Т а б л и ц а 3
Анализ смешанной регрессионной модели для пары нейтральное - ненейтральное утверждение
Предикторы Нейтральн. / ненейтральн.
Отношения шансов 95% довер. интерв. Р
(Intercept) 0.76 0.53-1.07 0.119
фраза: не надо 0.55 0.45 -0.67 <0.001
высота пика: средний 1.20 0.95 - 1.51 0.136
высота пика: высокий 2.32 1.79 - 3.01 <0.001
тайминг: 2 1.73 1.30 - 2.30 <0.001
тайминг: 3 4.08 2.99 - 5.57 <0.001
тайминг: 4 4.45 3.21 - 6.15 <0.001
тайминг: 5 3.15 2.23 - 4.44 <0.001
длительность: 133% 0.76 0.60 - 0.97 0.028
длительность: 166% 1.17 0.91 - 1.51 0.212
Случайные эффекты
<Г 3.29
т00 информант 0.20
ICC 0.06
N информант 25
Всего наблюдений 1868
Предельн. R2 / Условн. R2 0.149 / 0.197
AIC 2257.661
Статистически значимый эффект на реакцию информантов (р < 0,01) оказали факторы «фраза» (фраза не надо чаще воспринималась как нейтральная, чем хватит), «тайминг» (высказывания с ранними пиками чаще относились к категории нейтральных, чем высказывания с пиками в центре и во второй половине гласного) и «высота пика» (стимулы с низким и средним пиком ЧОТ чаще относились к нейтральным, чем стимулы с высоким пиком). Изменение длительности гласного оказывало слабое воздействие на суждения о нейтральности / ненейтральности высказывания: несколько чаще как нейтральные воспринимались стимулы с гласным, продленным на 33% (р = 0,028).
Грубый и вежливый отказ
Наконец, для 1 154 случаев, когда испытуемые относили услышанные стимулы к категориям «Фраза звучит грубо, резко, категорично (приказ, резкий отказ)» и «Фраза звучит вежливо (просьба, вежливый отказ)», также была построена регрессионная модель с бинарной зависимой переменной. Данные, представленные в табл. 4, демонстрируют, что информанты значи-
тельно чаще идентифицировали как «вежливые» стимулы с фразой не надо, а также пиками ЧОТ, локализованными в середине и во второй половине гласного.
Т а б л и ц а 4
Анализ смешанной регрессионной модели для пары грубый - вежливый отказ
Предикторы Грубый / вежливый
Отношения шансов 95% довер. интерв. Р
(Intercept) 0.53 0.33-0.85 0.008
фраза: не надо 2.23 1.69 - 2.95 <0.001
длительность: 133% 3.55 2.53 - 4.97 <0.001
длительность: 166% 7.22 5.13 - 10.17 <0.001
тайминг: 2 0.69 0.44 - 1.07 0.096
тайминг: 3 0.19 0.12 - 0.29 <0.001
тайминг: 4 0.23 0.15 - 0.36 <0.001
тайминг: 5 0.52 0.32 - 0.84 0.007
высота пика: средний 1.19 0.86 - 1.64 0.304
высота пика: высокий 0.92 0.66 - 1.27 0.602
Случайные эффекты
а2 3.29
Too информант 0.15
ICC 0.04
N информант 25
Всего наблюдений 1154
Предельн. R2 / Условн. R2 0.273 / 0.305
AIC 1347.329
Как видно из значений отношений шансов, наиболее сильное и последовательное воздействие на принятие решения о грубости / вежливости фразы оказывала переменная «длительность гласного»: с увеличением длительности гласного увеличивался шанс того, что фраза будет воспринята как вежливый отказ или просьба. Изменения высоты пика не оказывали статистически значимого влияния на восприятие вежливости фразы.
Обсуждение
Вопросительные и невопросительные предложения
Данные, полученные в нашем исследовании для пары «вопрос / утверждение», реплицируют выводы предыдущих экспериментальных исследований, посвященных восприятию общего вопроса носителями русского языка. Результаты эксперимента можно оценить на графиках взаимодействия всех четырех переменных на рис. 4.
Прежде всего следует обсудить данные, полученные для стимула хватит. Как видно из графиков на рис. 4, информанты редко воспринимали хватит как общий вопрос даже в стимулах с поздним пиком.
Рис. 4. График взаимодействия переменных для пары вопрос - невопросительное предложение
Как было отмечено выше в разделе «Создание стимулов», причиной этому, по всей видимости, является сегментный состав фразы, а именно малая длительность звонкой части заударного гласного, единственной части заударного слога, способной нести информацию о ЧОТ. Как видно из рис. 3, встроенный в Ргаа алгоритм обнаруживает ЧОТ на редуцированном гласном, однако то, насколько информанты могут воспринимать тон на таком коротком сегменте, требует дополнительной экспериментальной проверки. Следует также отметить, что в обучающую сессию, предшествовавшую экспериментальной, был включен один «натуральный» (созданный на основе произнесения вопросительной фразы диктором и лишь незначительно упрощенный за счет ресинтеза) контур хватит. Этот стимул идентифицировали как вопрос 19 из 25 информантов, что значительно превышает результаты для всех контуров хватит в экспериментальной сессии. Отличие «натурального» стимула заключается не только в несколько большей сложности его контура, но и в том, что в этом контуре пик ЧОТ и нисходящее движение тона диапазоном около 6 полутонов локализовано ровно на заударном гласном (ср. «искусственные» контуры на рис. 3, где заударный гласный всегда несет на себе ровный низкий контур, а нисходящее движение отсутствует, поскольку оно локализовано на глухом согласном). Вероятно, точная локализация падения тона при недостатке сегментного материала является необходимым условием для корректного восприятия общего вопроса в русском языке, и этот параметр должен в будущем учитываться при использовании стимулов, содержащих глухие согласные.
Проведенный эксперимент подтвердил, что основным фактором, определяющим восприятие общего вопроса носителями русского языка, является позиция пика относительно границ ударного слога. Этот факт ранее неоднократно демонстрировался экспериментально [5, 17, 23] и не требует
отдельного обсуждения. Наш эксперимент также показал, что на восприятие типа высказывания оказывает последовательное влияние высота пика, а именно: стимулы с высокими и средними поздними пиками чаще идентифицируются как общий вопрос, а стимулы с низкими пиками редко воспринимаются как вопросительные предложения даже в том случае, если пик ЧОТ расположен в конце ударного слога. Сведения о том, что высокий пик ЧОТ является важным сигналом для маркирования интонации общего вопроса в русском языке, имеются в традиционных описаниях русской просодии и неоднократно подтверждались экспериментальными исследованиями (см. обзор в [43. С. 179-180]). Однако в эксперименте [5] эффект высоты пика (использовались два значения: 320 и 360 Гц) оказался статистически незначимым, в отличие от эффекта крутизны восходящего движения тона. Наши данные поддерживают первую точку зрения, согласно которой носители русского языка могут последовательно использовать высокий пик восходяще-нисходящего движения ЧОТ как сигнал общего вопроса.
Наконец, эксперимент показал значительно меньшее влияние манипуляции длительностью ударного гласного на ответы информантов. Тем не менее результат для сверхдолгого (продленного на 66%) гласного оказался статистически значимым. Вероятно, испытуемые воспринимали сильное увеличение длительности гласного как некое отклонение от нормы, содержащее сигнал о предпочтительности иной, невопросительной интерпретации услышанного стимула.
В заключение следует отметить, что результаты эксперимента для пары «общий вопрос / невопросительное предложение» могут использоваться как дополнительный аргумент в пользу дискретности восприятия носителями русского языка различия между этими двумя категориями. При этом представляется возможным, что для характеристики границы между категориями необходимо учитывать не одну, а две переменные. Так, согласно нашим данным для различных контуров фразы не надо, граница в восприятии стимулов с высоким пиком пролегала скорее в третьей четверти гласного, в то время как граница для стимулов с пиком средней высоты - в последней четверти гласного.
Взаимодействие тайминга и высоты пика ЧОТ неоднократно демонстрировалось в экспериментальных исследованиях языков мира [4. Р. 9092]. Согласно экспериментальным данным во многих языках действует следующая закономерность: поскольку для достижения «цели» высокого пика в пределах одного слога при прочих равных необходимо большее время, высокие пики чаще имеют поздний тайминг. Носители языка неосознанно владеют информацией об этой закономерности и могут использовать ее, сталкиваясь с задачей интерпретации контуров с поздним пиком. Этой тенденцией можно объяснить и неодинаковое восприятие стимулов не надо со средней и высокой частотой пика в рамках настоящего эксперимента.
Нейтральный и ненейтральный отказ
Результаты, полученные для пары «нейтральный / ненейтральный отказ», представлены на графиках взаимодействия переменных на рис. 5. В связи с тем, что эффект длительности гласного оказался статистически незначимым (р > 0,01), графики построены без учета этой переменной.
Рис. 5. График взаимодействия переменных для пары нейтральное - ненейтральное утверждение
Как и ожидалось, стилистическая окраска слов, использованных в качестве стимулов, оказала влияние на суждения испытуемых. Фраза не надо значительно чаще, чем хватит, воспринималась как произнесенная «нейтрально, спокойно». Наиболее сильным, как и в случае с парой «вопрос / невопросительное предложение», оказался эффект тайминга. Стимулы с пиком в центре и во второй половине гласного, не отнесенные к категории общего вопроса, значительно чаще воспринимались испытуемыми как ненейтральные, содержащие информацию об эмоциональном состоянии говорящего (грубые или вежливые).
Информанты также чаще воспринимали как ненейтральные стимулы с высоким пиком, при этом разница между эффектами низкого и среднего пика оказалась статистически незначимой. Использование увеличенного диапазона ЧОТ для маркирования различных паралингвистических элементов значения неоднократно демонстрировалось экспериментально (см. подробный обзор работ на эту тему в [44]). Обычно для интерпретации таких наблюдений используется широко цитируемая в интонологии теория биологических кодов, основанная на работах Дж. Охалы [45] и впоследствии уточненная К. Гуссенховеном [4]. Согласно этой точке зрения все паралингвистические функции интонации имеют этологическую основу. Так, в природе более крупные (следовательно, более сильные и агрессивные) особи имеют более крупные органы голосового аппарата, производящие более низкие звуки. В связи с этим высота ЧОТ может иметь универ-
сальные паралингвистические интерпретации, связанные с эмоциями и положением говорящего (например, во многих языках мира высокий тон ассоциируется с подчиненностью говорящего, а низкий - с его доминирующей позицией), а также с информационной структурой высказывания (например, высокий тон ассоциируется с незавершенностью или вопросом, а низкий - с завершенностью или утвердительностью). В процессе развития языка некоторые функции этих биологических кодов могут подвергаться грамматикализации. В свете этой теории наши наблюдения могут быть интерпретированы как проявление описанного Гуссенховеном «кода усилия» (Effort code), согласно которому увеличенный диапазон движения ЧОТ ассоциируется с эмфазой, так как требует большего артикуляционного усилия со стороны говорящего. Таким образом, полученные результаты для пары «нейтральный / ненейтральный» могут рассматриваться как отражение универсальной закономерности, согласно которой носители различных языков мира воспринимают увеличение диапазона падения и подъема частоты тона как паралингвистический сигнал о важности высказывания для говорящего.
Тем не менее некоторые особенности полученных результатов (в частности, сильный последовательный эффект тайминга) позволяют выдвинуть иную интерпретацию результатов. Вероятно, данные для пары «нейтральный / ненейтральный отказ» имеют отношение к важному для русской ин-тонологии вопросу о существовании в русском языке дискретного противопоставления двух невопросительных восходяще-нисходящих контуров. Несмотря на то, что включенное в систему Е.А. Брызгуновой противопоставление ИК-1 и ИК-2 неоднократно критиковалось за недостаточную теоретическую обоснованность и неясность основного различительного признака («усиление словесного ударения») [11, 12, 14], авторы экспериментальных исследований неизменно возвращаются к необходимости постулирования отдельной категории для контуров с высоким пиком, локализованным в начале или середине ударного слога: ср. анализ «восклицательных предложений» в [21], «контрастного выделения» в [24, 28], различных видов фокуса в [30] и частного вопроса в [43]. Данные нашего эксперимента согласуются с выводами этих исследований и допускают возможность существования в инвентаре русских восходяще-нисходящих акцентов третьей категории, тонального акцента, фонетическая реализация которого, как и в случае с тональным акцентом общего вопроса, характеризуется взаимодействием тайминга и высоты пика ЧОТ. Некоторые признаки наличия категориального восприятия можно увидеть на рис. 5 на графике для фразы хватит (разница между высоким и остальными пиками для тайминга 1 и 2; значительное изменение распределения ответов информантов между точкой тайминга 2 и 3). Следует признать, что данных настоящего эксперимента недостаточно для принятия этой интерпретации. Полученные результаты требуют дальнейшей экспериментальной проверки в рамках более узконаправленных исследований.
Грубый и вежливый отказ
Анализ ответов информантов показал, что манипулирование высотой пика не влияло на то, как испытуемые оценивали эмоциональную окраску фраз, не отнесенных к нейтральным. Таким образом, фразы, различавшиеся только пиком ЧОТ, имели одинаковые шансы быть воспринятыми, с одной стороны, как резкий, грубый приказ, с другой - как вежливая просьба к собеседнику с целью прекратить выполнение какого-либо действия. Эти данные в некоторой степени противоречат теории «биологических кодов», согласно которой влияние «кода частоты тона» (Frequency code) предсказывает связь между высоким тоном и такими интерпретациями, как «вежливость» и «дружелюбие». Представляется возможным, что испытуемые не пользовались высотой тона для определения грубости / вежливости высказывания, поскольку им был предложен гораздо более заметный «ключ» к восприятию этого противопоставления: длительность ударного гласного. Действительно, сравнение силы эффектов предикторов показывает, что длительность гласного служила для информантов основным сигналом к принятию решения о грубости / вежливости услышанных фраз: с увеличением длительности гласного значительно увеличивались шансы того, что фраза будет идентифицирована испытуемыми как произнесенная с «вежливой» интонацией, и наоборот.
Маркирование вежливости при помощи просодических средств нередко становилось темой экспериментальных исследований, однако, как правило, объектом изучения в этих работах становились только параметры, связанные с контуром ЧОТ (см. выше). Так, в русском языке наиболее известным примером маркирования вежливости при помощи интонации является отмеченное еще в ранних работах Е.А. Брызгуновой использование мелодического контура общего вопроса для выражения подчеркнуто вежливой просьбы во фразах с императивом [46. С. 45]. Работы, в которых рассматривается связь между вежливостью и длительностью ударного гласного просодически выделенного слога, немногочисленны. Так, авторы исследования [47], изучая фонетическую реализацию греческих специальных вопросов в различных контекстах, обнаружили значимое влияние «вежливого контекста» на длительность ударного гласного выделенного слога (а также на длительность последнего гласного фразы) при отсутствии значимого эффекта этого параметра на диапазон ЧОТ1. Как и в настоящем эксперименте, в работе [47] долгие гласные и в целом более медленный темп речи ассоциировались с вежливостью говорящего, что может говорить об универсальном характере этой взаимосвязи.
1 Схожий результат описан в эксперименте [44], посвященном восприятию вежливости в общем вопросе в каталанском языке. Не обнаружив последовательного влияния высоты ЧОТ гласного пограничного тона, авторы пришли к выводу, что оно в высокой степени зависит от элементов лингвистического и паралингвистического контекста (в частности, мимики говорящего).
Другим параметром, значимым для восприятия контуров в настоящем эксперименте, стал тайминг пика. На рис. 6 изображены графики взаимодействия влияния двух факторов на суждения испытуемых.
Рис. 6. График взаимодействия переменных для пары грубый отказ - вежливый отказ
Как видно из графика для фразы хватит, одни и те же значения высоты ЧОТ и длительности гласного могут иметь противоположное воздействие на суждения испытуемых в зависимости от локализации пика относительно границ слога. Так, фраза хватит с продленным гласным (на 33 и на 66%) воспринималась как скорее грубая в том случае, если ее пик ЧОТ находился в точках, соответствующих середине ударного слога или 75% его длительности, но как скорее вежливая, если пик был расположен в первой половине гласного. Наиболее вероятным объяснением этого явления нам представляется описанное ранее возможное влияние некоей третьей категории, маркирующей в русском языке эмфазу или контрастный фокус. Вероятно, только будучи реализованной с этим тональным акцентом, оказавшись подчеркнуто «в фокусе» говорящего, фраза хватит в полной мере реализует заложенный в ней лексико-стилистический потенциал выступать в качестве грубого, категоричного высказывания. Изучение подобных потенциальных взаимодействий, учитывающих не только фонетические, но и лексические характеристики фраз, безусловно, представляет интерес для дальнейшего изучения.
Выводы
Проведенное исследование ставило своей целью изучить влияние различных акустических параметров на восприятие носителями русского языка фраз с восходяще-нисходящим тональным контуром за счет включения двух ранее не использовавшихся в этих целях элементов эксперименталь-
ного дизайна: использования безличных фраз со значением отказа и манипуляций длительностью ударного гласного.
Данные эксперимента подтвердили, что в русском языке важнейшим акустическим параметром, влияющим на восприятие мелодических контуров, является положение пика ЧОТ относительно границ слога. Выяснилось, что вокруг этого параметра строится не только противопоставление между категориями общего вопроса и невопросительного предложения, но и другие, менее изученные различия, вопрос отнесения которых к лингвистическим или паралингвистическим еще предстоит решить.
Манипуляция длительностью гласного позволила впервые описать влияние этого параметра на интерпретацию восходяще-нисходящих мелодических контуров в русском языке. По всей видимости, носители языка не используют этот акустический «ключ» для восприятия дискретных противопоставлений между разными тональными акцентами, однако последовательно пользуются им для идентификации паралингвистических элементов значения, в данном случае оценки высказывания по шкале «грубое / вежливое». Интерес также может представлять функция, которую испытуемые независимо друг от друга присвоили параметру высоты пика: в их восприятии высокий пик последовательно указывал только на факт отклонения высказывания от «нейтрального высказывания», но не на направление этого отклонения в сторону грубости или вежливости. Эти и другие полученные результаты согласуются как с имеющимися в литературе сведениями о «разделении труда» в сфере интонации между фонетикой и фонологией, так и с концепцией «биологических кодов», оказывающих влияние на восприятие носителями языка паралингвистической информации.
В заключение следует отметить, что в рамках настоящей работы мы осознанно избегали фонологических интерпретаций наблюдаемых явлений. Тем не менее именно попытки автосегментного анализа русской интонации на основе экспериментальных данных [14, 28] послужили исходными точками для настоящей работы. Проведение новых экспериментов позволит уточнить имеющиеся данные об инвентаре и функциях русских тональных акцентов, способствуя созданию в будущем последовательного автосегментного описания русской интонации.
Литература
1. Pierrehumbert J. The phonology and phonetics of English intonation : PhD thesis, MIT. Distributed 1988. Indiana University Linguistics Club, 1980.
2. Beckman M., Pierrehumbert J. Intonational Structure in Japanese and English // Phonology Yearbook III. 1986. Р. 15-70.
3. Ladd D.R. Intonational Phonology (Cambridge Studies in Linguistics). Cambridge : Cambridge University Press, 2008.
4. Gussenhoven C. The Phonology of Tone and Intonation. Cambridge : Cambridge University, 2004.
5. Rathcke T. A perceptual study on Russian questions and statements // Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung der Universität Kiel (AIPUK). 2006. № 37. Р. 51-62.
6. Hockett C.F. The Origin of Speech // Scientific American. 1960. № 203. Р. 88-111.
7. Kohler K.J. Categorical pitch perception // Proc. Xlth International Congress of Phonetic Sciences. Tallinn, 1987. Vol. 5. Р. 331-333.
8. Pierrehumbert J., Steele S. Categories of Tonal Alignment in English // Phonetica. 1990. № 47. Р. 181-196.
9. Ladd D.R., Morton R. The perception of intonational emphasis: Continuous or categorical? // Journal of Phonetics.1997. № 25. Р. 313-342.
10. Кодзасов С.В. Исследования в области русской просодии. М. : Языки славянских культур, 2009.
11. Keijsper C. Recent intonation research and its implications for teaching Russian // Studies in Slavic and General Linguistics. 1992. № 17. Р. 151-214.
12. Оде С. Перцептивная эквивалентность реализаций типов интонационных конструкций Е.А. Брызгуновой // Studies in Slavic and General Linguistics. 1992. № 17. С. 227-284.
13. Йокояма О.Ц. Нейтральная и ненейтральная интонация в русском языке: автосегментная интерпретация системы интонационных конструкций // Вопросы языкознания. 2003. № 5. С. 99-122.
14. Igarashi Y. Russian Interrogatives and Intonational Categories // The Discourse Potential of Underspecified Structures / ed. by A. Steube. Berlin ; New York : Walter de Gruyter, 2008. Р. 227-270.
15. Брызгунова Е.А. Интонация // Русская грамматика / гл. ред. Н.Ю. Шведова. М., 1980. Т. 1. С. 96-122.
16. Светозарова Н.Д. Интонационная система русского языка. Л. : Изд-во Ленингр. ун-та, 1982.
17. Ode C. Russian intonation: A perceptual description. Amsterdam : Rodopi, 1989.
18. Ode C. Neutralization or Truncation? The perception of two Russian pitch accents on utterance-final syllables // Speech Communication. 2005. № 47 (1/2). Р. 71-79.
19. Ode C. Transcription of Russian intonation ToRI, an interactive research tool and learning module on the internet // Studies in Slavic and General Linguistics. 2008. № 34.
20. 't Hart J., Collier R., Cohen A. A perceptual study of intonation: An experimental-phonetic approach to speech melody. Cambridge : Cambridge University Press, 2009.
21. Makarova V. Perceptual correlates of sentence-type intonation in Russian and Japanese // J. Phonetics. 2001. № 29. Р. 137-154.
22. Makarova V. The effect of F0 peak alignment, height and segmental base on sentence type perception across languages // Proc. XVth International Congress of Phonetic Sciences. Barcelona, 2003. Р. 1285-1288.
23. Makarova V. The effect of pitch peak alignment on sentence type identification in Russian // Language and speech. 2007. № 50, р! 3. Р. 385-422.
24. Rathcke T. Relevance of F0 peak shape and alignment for the perception of a functional contrast in Russian // Proc. of the 3rd Conference on Speech Prosody. 2006. р. 65-68.
25. Silverman K., Beckman M., Pitrelli J., Ostendorf M., Wightman C., Price P., Pierrehumbert J., Hirschberg J. TOBI: a standard for labeling English prosody // Proc. of Second International Conference on Spoken Language Processing. 1992. Р. 867-870.
26. Jun Sun-Ah. Editor. Prosodic Typology: The Phonology of Intonation and Phrasing. Oxford University Press, 2005.
27. Jun Sun-Ah. Editor. Prosodic Typology II: The Phonology of Intonation and Phrasing. Oxford University Press, 2014.
28. Rathcke T. How Truncating Are 'Truncating Languages'? Evidence from Russian and German // Phonetica. 2017. № 73. Р. 194-228.
29. Igarashi Y. How many falling intonation patterns in Russian?: categories of F0 alignment // Programme & Book of Abstracts: Between and Stress and Tone. 2005. Р. 32-33.
30. Meyer R., Mleinek I. How prosody signals force and focus - A study of pitch accents in Russian yes-no questions // Journal of Pragmatics. 2006. № 38. Р. 1615-1635.
31. Пужаева С.Ю., Герасименко Е.А., Захарова Е.С., Рахилина Е.В. Автоматическое извлечение дискурсивных формул из текстов на русском языке // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2018. № 16, 2. С. 5-18.
32. Дурягин П. В., Рахилина Е. В. Просодические средства маркирования полисемии дискурсивной формулы да ну // Тезисы VI Международной научной конференции «Культура русской речи». URL: https://drive.google.eom/file/d/1eXDZzrSpHqh YU3 fPqVkOKMSPGnKkTXuM (дата обращения: 10.10.2019).
33. Arantes P. Time-normalization of fundamental frequency contours: a hands-on tutorial // Courses on Speech Prosody / ed. by A.R. Meireles. Newcastle upon Tyne : Cambridge Scholars Publishing, 2015. Р. 98-123.
34. Boersma P., Weenink D. Praat: doing phonetics by computer [Computer program]. Version 6.1.04, retrieved 28 September 2019. URL: http://www.praat.org/
35. Nolan F. Intonational equivalence: an experimental evaluation of pitch scales // Proc. XVth International Congress of Phonetic Sciences. Barcelona, 2003. Р. 771-774.
36. Peirce J.W., Gray J.R., Simpson S., MacAskill M.R., Hochenberger R., Sogo H., Kastman E., Lindelov J. PsychoPy2: experiments in behavior made easy // Behavior Research Methods. 2019. № 51. Р. 195.
37. R Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna, Austria, 2018. URL: https://www.R-project.org/
38. Bates D., Maechler M., Bolker B., Walker S. Fitting Linear Mixed-Effects Models Using lme4 // Journal of Statistical Software. 2015. № 67 (1). Р. 1-48.
39. Levshina N. How to do linguistics with R: Data exploration and statistical analysis. Amsterdam; Philadelphia : John Benjamins Publishing Company, 2015.
40. Fox J., Weisberg S. An {R} Companion to Applied Regression, Third Edition. Thousand Oaks CA : Sage, 2019.
41. Ludecke D. sjPlot: Data Visualization for Statistics in Social Science. 2019. DOI: 10.5281/zenodo.1308157.
42. Wickham H. ggplot2: Elegant Graphics for Data Analysis. New York : SpringerVerlag, 2016.
43. Igarashi Y. Intonation patterns in Russian interrogatives - Phonetic analyses and phonological interpretations // Prosody and Syntax, Usage-Based Linguistic Informatics 3 / eds by Yuji Kawaguchi, Ivan Fonagy and Tsunekazu Moriguchi. Amsterdam : John Benjamins, 2006. Р. 175-196.
44. Nadeu M., Prieto P. Pitch range, gestural information, and perceived politeness in Catalan // Journal of Pragmatics. 2011. № 43. Р. 841-854.
45. Ohala J.J. An ethological perspective on common cross-language utilization of F0 of voice // Phonetica. 1984. № 41. Р. 1-16.
46. Брызгунова Е.А. Основные типы интонационных конструкций и их функционирование в русском языке. Статья вторая // Русский язык за рубежом. 1973. № 2. С. 44-52.
47. Gryllia S., Baltazani M., Arvaniti A. The role of pragmatics and politeness in explaining prosodic variability // Speech Prosody 2018. Urbana, Illinois : Speech Prosody Special Interest Group, 2018.
Perception of Prosody in Russian Impersonal Phrases with the Meaning of Refusal: Linguistic and Paralinguistic Aspects
Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya - Tomsk State University Journal of Philology. 2021. 69. 94-121. DOI: 10.17223/19986645/69/5
Pavel V. Duryagin, Ca' Foscari University of Venice (Venice, Italy). E-mail: pavel. duryagin@unive. it
Maria V. Fokina, Lomonosov Moscow State University (Moscow, Russian Federation). E-mail: [email protected]
Keywords: modern standard Russian, intonation, yes/no question, pitch accent, vowel duration, perception experiment, politeness.
The article examines the perception of Russian rising-falling pitch contours by native speakers. These contours have received much attention due to the fact that Russian does not mark grammatically the distinction between statements and yes/no questions; instead, prosod-ic features are used for this purpose. This study aimed to expand this line of research by using two impersonal phrases with the meaning of refusal as stimuli for a perception experiment. The main advantage of this choice is that these phrases can also convey paralinguistic elements of meaning, such as neutrality/non-neutrality and rudeness/politeness of request or refusal. An experiment was conducted in which 25 native speakers of Russian were asked to identify 90 artificial stimuli (phrases ne nado and khvatit with resynthesized rising-falling pitch contours presented in random order) as questions, neutral, rude or polite statements. The listeners could also mark the stimuli as "meaningless". During the resynthesis, three acoustic parameters were manipulated: pitch alignment, pitch height and stressed vowel duration. Then the answers of the participants were analyzed as four binary choices. Generalized mixed effects logistic regression models were used to assess the effect of predictors on categorization task. For the question/statement distinction, a significant effect of all fixed variables was found. These results generally replicate the findings of previous studies and show that Russian speakers use late peak alignment enhanced by high peak scaling as the principal acoustic cue for polar questions. For the neutral/non-neutral statement distinction, also a strong effect of peak height and alignment was found. These results conform Gussenhoven's theory of "biological codes" but at the same time do not contradict the recurrent claims that assume the existence of a distinct pitch accent used for focus-marking in Russian. Finally, to identify the non-neutral statements as "rude refusal, order" or "polite refusal, request", the participants consistently used the vowel duration cue. Phrases with longer stressed vowels were more often perceived as polite, and vice versa. A significant effect of peak alignment on "politeness" was found, while the analyses did not reveal the effect of peak height on this distinction. To sum up, the experiment demonstrates an interplay between different acoustic cues in the native perception of an artificially created Russian rising-falling pitch contours continuum. Further investigations are required in order to determine more precisely the linguistic and paralinguistic functions of these form-function relations.
References
1. Pierrehumbert, J. (1980) The phonology and phonetics of English intonation. PhD thesis, MIT. Distributed 1988, Indiana University Linguistics Club.
2. Beckman, M. & Pierrehumbert, J. (1986) Intonational Structure in Japanese and English. Phonology Yearbook III. pp. 15-70.
3. Ladd, D.R. (2008) Intonational Phonology (Cambridge Studies in Linguistics). Cambridge: Cambridge University Press.
4. Gussenhoven, C. (2004) The Phonology of Tone and Intonation. Cambridge: Cambridge University.
5. Rathcke, T. (2006) A perceptual study on Russian questions and statements. Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung der Universität Kiel (AIPUK). 37. pp. 51-62.
6. Hockett, C.F. (1960) The Origin of Speech. Scientific American. 203. pp. 88-111.
7. Kohler, K.J. (1987) Categorical pitch perception. Proc. XIth International Congress of Phonetic Sciences. Vol. 5. Tallinn. pp. 331-333.
8. Pierrehumbert, J. & Steele, S. (1990) Categories of Tonal Alignment in English, Phonetica. 47. pp. 181-196.
9. Ladd, D.R. & Morton, R. (1997) The perception of intonational emphasis: Continuous or categorical? Journal of Phonetics. 25. pp. 313-342.
10. Kodzasov, S.V (2009) Issledovaniya v oblasti russkoy prosodii [Research in the field of Russian prosody]. Moscow: Yazyki slavyanskikh kul'tur.
11. Keijsper, C. (1992) Recent intonation research and its implications for teaching Russian. Studies in Slavic and General Linguistics. 17. pp. 151-214.
12. Ode, S. (1992) Pertseptivnaya ekvivalentnost' realizatsiy tipov intonatsionnykh konstruktsiy E. A. Bryzgunovoy [Perceptual equivalence of realizations of types of E.A. Bryzgunova's intonation constructions]. Studies in Slavic and General Linguistics. 17. pp. 227-284.
13. Yokoyama, O.Ts. (2003) Neytral'naya i neneytral'naya intonatsiya v russkom yazyke: avtosegmentnaya interpretatsiya sistemy intonatsionnykh konstruktsiy [Neutral and nonneutral intonation in Russian: Auto-segment interpretation of the system of intonation structures]. Voprosyyazykoznaniya. 5. pp. 99-122.
14. Igarashi, Y (2008) Russian Interrogatives and Intonational Categories. In: Steube, A. (ed.) The Discourse Potential of Underspecified Structures. Berlin, New York: Walter de Gruyter. pp. 227-270.
15. Bryzgunova, E.A. (1980) Intonatsiya [Intonation]. In: Shvedova, N.Yu. (ed.) Russkaya grammatika [Russian grammar]. Vol. 1. Moscow: Nauka. pp. 96-122.
16. Svetozarova, N.D. (1982) Intonatsionnaya sistema russkogo yazyka [The intonation system of Russian]. Leningrad: Leningrad State University.
17. Odé, C. (1989) Russian intonation: A perceptual description. Amsterdam: Rodopi.
18. Odé, C. (2005) Neutralization or Truncation? The perception of two Russian pitch accents on utterance-final syllables. Speech Communication. 47 (%). pp. 71-79.
19. Odé, C. (2008) Transcription of Russian intonation ToRI, an interactive research tool and learning module on the internet. Studies in Slavic and General Linguistics. 34.
20. Hart, J.T., Collier, R. & Cohen, A. (2009) A perceptual study of intonation: An experimental-phonetic approach to speech melody. Cambridge: Cambridge University Press.
21. Makarova, V. (2001) Perceptual correlates of sentence-type intonation in Russian and Japanese. J. Phonetics. 29. pp. 137-154.
22. Makarova, V. (2003) The effect of F0 peak alignment, height and segmental base on sentence type perception across languages. Proc. XVth International Congress of Phonetic Sciences. Barcelona. pp. 1285-1288.
23. Makarova, V. (2007) The effect of pitch peak alignment on sentence type identification in Russian. Language and Speech, 50 (3). pp. 385-422.
24. Rathcke, T. (2006) Relevance of F0 peak shape and alignment for the perception of a functional contrast in Russian. Proc. of the 3rd Conference on Speech Prosody. pp. 65-68.
25. Silverman, K. et al. (1992) TOBI: A standard for labeling English prosody. Proc. of Second International Conference on Spoken Language Processing. pp. 867-870.
26. Jun, Sun-Ah (ed.) (2005) Prosodic Typology: The Phonology of Intonation and Phrasing. Oxford University Press.
27. Jun, Sun-Ah (ed.) (2014) Prosodic Typology II: The Phonology of Intonation and Phrasing. Oxford University Press.
28. Rathcke, T. (2017) How Truncating Are 'Truncating Languages'? Evidence from Russian and German. Phonetica. 73. pp. 194-228.
29. Igarashi, Y. (2005) How many falling intonation patterns in Russian?: Categories of F0 alignment. Programme & Book of Abstracts: Between and Stress and Tone. Leiden. pp. 32-33.
30. Meyer, R. & Mleinek, I. (2006) How prosody signals force and focus — A study of pitch accents in Russian yes-no questions. Journal of Pragmatics. 38. pp. 1615-1635.
31. Puzhaeva, S.Yu., Gerasimenko, E.A., Zakharova, E.S. & Rakhilina, E.V. (2018) Automatic Extraction of Formulaic Expressions From Russian Texts. Vestnik NGU. Seriya: Lingvistika i mezhkul'turnaya kommunikatsiya - NSU Vestnik. Series: Linguistics and Intercultural Communication. 16, 2. pp. 5-18. (In Russian).
32. Duryagin, P.V & Rakhilina, E.V. (2019) [Prosodic means of marking the polysemy of the discourse formula "da nu"].yes well. Kul'tura russkoy rechi [Culture of Russian Speech]. Abstracts of the VI International Conference. [Online] Available from:
https://drive.google.eom/file/d/1eXDZzrSpHqhYU3fPqVk0KMSPGnKkTXuM (Accessed: 10.10.2019).
33. Arantes, P. (2015) Time-normalization of fundamental frequency contours: a hands-on tutorial. In: Meireles, A.R. (ed) Courses on Speech Prosody. Newcastle upon Tyne: Cambridge Scholars Publishing. pp. 98-123.
34. Boersma, P. & Weenink, D. (2019) Praat: Doing phonetics by computer [Computer program]. Version 6.1.04, retrieved 28 September 2019 from http://www.praat.org/.
35. Nolan, F. (2003) Intonational equivalence: an experimental evaluation of pitch scales. Proc. XVth International Congress of Phonetic Sciences. Barcelona. pp. 771-774.
36. Peirce, J.W. et al. (2019) PsychoPy2: experiments in behavior made easy. Behavior Research Methods. 51. p. 195.
37. R Core Team (2018). R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing. [Online] Available from: https://www.R-project.org/.
38. Bates, D., Maechler, M., Bolker, B. & Walker, S. (2015) Fitting Linear Mixed-Effects Models Using lme4. Journal of Statistical Software. 67 (1). pp. 1-48.
39. Levshina, N. (2015) How to do linguistics with R: Data exploration and statistical analysis. Amsterdam; Philadelphia: John Benjamins Publishing Company.
40. Fox, J. & Weisberg, S. (2019) An {R} Companion to Applied Regression. 3rd ed. Thousand Oaks CA: Sage.
41. Ludecke, D. (2019) sjPlot: Data Visualization for Statistics in Social Science. DOI: 10.5281/zenodo.1308157
42. Wickham, H. (2016) ggplot2: Elegant Graphics for Data Analysis. New York: Springer-Verlag.
43. Igarashi, Y. (2006) Intonation patterns in Russian interrogatives - Phonetic analyses and phonological interpretations. In: Yuji Kawaguchi, Y., Fonagy, I. & Moriguchi, Ts. (eds) Prosody and Syntax, Usage-Based Linguistic Informatics 3. Amsterdam: John Benjamins. pp. 175-196.
44. Nadeu, M. & Prieto, P. (2011) Pitch range, gestural information, and perceived politeness in Catalan. Journal of Pragmatics. 43. pp. 841-854.
45. Ohala, J.J. (1984) An ethological perspective on common cross-language utilization of F0 of voice. Phonetica. 41. pp. 1-16.
46. Bryzgunova, E.A. (1973) Osnovnye tipy intonatsionnykh konstruktsiy i ikh funktsionirovanie v russkom yazyke. Stat'ya vtoraya [The main types of intonation structures and their functioning in the Russian language. Article Two]. Russkiy yazyk za rubezhom. 2. pp. 44-52.
47. Gryllia, S., Baltazani, M. & Arvaniti, A. (2018) The role of pragmatics and politeness in explaining prosodic variability. In: Speech Prosody 2018. Urbana, Illinois: Speech Prosody Special Interest Group.