УДК 81.23
эмоции в звучащей речи: экспериментальное исследование
валуйцева ирина ивановна,
профессор Московского государственного
В данной статье излагаются результаты экспериментального изучения эмоциональной речи на уровне сегментных и супрасегментных единиц. В ходе нескольких экспериментов на материале русского языка решаются две задачи: 1. определить акустические параметры, характеризующие позитивные и негативные эмоциональные состояния 2. подойти к классификации эмоциональных состояний по лингвистическим параметрам, тем самым установить инвариантные модели выражения эмоций в звучащей речи. В ходе исследования проводились две серии экспериментов с дикторами и аудиторами - носителями русского языка. В статье обосновывается возможность использования актерской речи в ходе изучения характеристик речевого сигнала при условии работы актеров в соответствии с принципами системы К.С. Станиславского, так как на втором этапе эксперимента анализируются при помощи компьютерной программы фрагменты записи спектакля МХАТ. Материалом исследования послужили фразы, выражающие 22 эмоциональных состояния в актерском и дикторском произнесении. Анализ спектральной картины исследуемых фрагментов звучащей речи позволил установить сочетания параметров: характер спектра, положение формант, частота основного тона, темпоральные характеристики, которые характерны для выражения тех или иных эмоциональных состояний.
Ключевые слова: эмоциональное состояние, звучащая речь, акустические параметры, формантная структура, субъективный и объективный эксперимент.
Эмоции и проблема их изучения уже не одно десятилетие входят в круг интересов лингвистов. Можно констатировать формирование отдельного направления лингвистических исследований - эмотиологии, которое сформировалось трудами отечественных и зарубежных ученых [Шаховский В.И., Wierzbicka А. и др.]. И если в начале XX века еще шли споры о том, должна ли лингвистика уделять внимание способам реализации эмоционально-экспрессивной функции языка, то значительный объем работ, появившихся в последнее время, тем более, в рамках антропоцентрического подхода к языку, свидетельствует о безусловном вхождении проблематики выражения эмоций в круг интересов лингвистики. Подробный анализ истории вопроса представлен в книге В.И. Шаховского [Шаховский 2013].
областного университета Москва, ул. Радио, д.10а e-mail: [email protected]
хухуни георгий теймуразович
профессор Московского государственного
областного университета Москва, ул. Радио, д.10а e-mail: [email protected]
В работах различных авторов неоднократно отмечалось, что эмоции отражаются на всех уровнях языковой структуры. В ряде экспериментальных исследований, начатых еще в конце XX века и активно развивающихся сейчас [Каржавина 2000, Картавенко 2005, Колымба, Нушикян и др. 1975, Романенко 2010, Федоров, Юрков 2009 и др.] было установлено, что человек способен различать тонкие градации эмоционального состояния говорящего, что свидетельствует о существовании в речевом сигнале определенных физических констант, а объективное изучение акустических характеристик звучащей речи позволяет рассматривать их как показатель состояния говорящего.
С целью определения акустических параметров, характеризующих позитивные и негативные эмоциональные состояния, которые позволяют адекватно их опознавать, был проведен следующий эксперимент. Были взяты три речевые единицы: одна обладала положительной коннотаций - молодец; другая - отрицательной - ужасно, третья вне контекста не несла ни положительной, ни отрицательной окраски - не может быть. Каждая из указанных речевых единиц произносилась в положительно или отрицательно эмоционально окрашенных контекстах дикторами, имеющими нормативное московское литературное произношение (всего восемь человек). Затем исследуемые речевые единицы вырезались из контекстов и вставлялись в противоположно эмоционально окрашенный контекст от тех же дикторов. Далее 20 аудиторов должны были определить, с какой эмоцией (положительной или отрицательной) произносились речевые единицы, таким образом были реализованы субъективные методы оценки данных.
Последующий анализ данных с помощью объективного метода - анализа спектральной картины, полученной при помощи программы PRAAT - позволил выявить группы эмоциональных состояний, каждой из которых соответствует зона сочетаний устойчивых значений акустических характеристик: характера спектра, положения формант, частоты основного тона, темпоральных характеристик. После сравнительного анализа положительно и отрицательно окрашенных единиц удалось определить пучок различительных признаков, характеризующих положительные и отрицательные эмоциональные состояния.
Ударный гласный речевой единицы, произнесенной с положительной эмоцией, характеризуется равномерно энергичным спектром до 4000 Гц. При этом Б2, Б3, Б4 сливаются. В случае с отрицательно произнесенной речевой единицей Б2, Б3, Б4 разделены и четко просматриваются. Положение формант в отрицательно эмоционально окрашенных речевых единицах ниже, чем в окрашенных положительно. Суммарная энергия речевой единицы, произнесенной с положительной эмоцией, значительно увеличена по сравнению с произнесенной отрицательно. При положительных эмоциях наблюдается, как правило, резкое нарастание частоты основного тона, главным образом, в пределах ударного слога, а при отрицательных - малые перепады частот при резкой модуляции частоты основного тона на каждом звуковом сегменте. Что касается временной реализации, то она указывает лишь на то, эмоционально или нейтрально произнесена данная речевая единица, возможность идентифицировать эмоцию по этому параметру отсутствует. Хотя в большинстве случаев наблюдается увеличение времени реализации речевых единиц, произнесенных с положительной эмоцией, и уменьшение - при отрицательных эмоциях
примерно на 150 мс, на нашем материале отмечаются и случаи уменьшения временной реализации положительно окрашенных речевых единиц. При этом уменьшение времени реализации компенсируется особенно резким нарастанием и падением фронта частоты основного тона. Однако существование стабильной закономерности маловероятно, так как очень трудно найти чистые типы положительных или отрицательных эмоций, а время произнесения, как наиболее стабильный признак в данном эксперименте, может сигнализировать о том или ином оттенке, модуляции эмоции. Например, в случае отрицательно произнесенной речевой единицы молодец можно говорить об оттенке пренебрежения, за счет которого увеличивается время реализации данной речевой единицы.
Для решения задачи классификации эмоциональных состояний по акустическим параметрам звучащей речи был проведен эксперимент с использованием метода актерского перевоплощения. Мы опирались на научный подход к общей теории произвольного управления непроизвольной экспрессией, разработанной в системе К.С. Станиславского.
Чтобы передать в художественных эмоциях то, что является общим для сходных переживаний многих людей, актер стремится выявить объективную основу эмоций. Он вживается в образ (имитирует все психологические особенности во всех их проявлениях) и в ситуацию, отбирает наиболее адекватные типы эмоций и проверяет их эффект опытным путем - по реакции зрительного зала. На основании этих положений мы сочли возможным использовать игровой, актерский момент при изучении эмоций.
Исходным материалом послужила запись спектакля «Гроза» А. Н. Островского в исполнении актерской труппы МХАТа. Как писал Ю.А. Сорокин «Национальная пьеса, созданная автором в некоторой культуре и ориентированная, прежде всего, на носителей этой культуры, является в известном смысле моделью данной культуры» [Сорокин, Марковина 1988: 16].
Для проведения эксперимента были отобраны эмоциональные отрывки различного объема и записаны в произвольном порядке, далее выбранным отрывкам из спектакля приписывались те или иные эмоциональные состояния в соответствии с интуицией экспериментатора. Вслед за Н.В. Витт [Витт 1965] мы предлагаем принять наименование «эмоциональное состояние» для обозначения любого компонента системы эмоций, имеющего свой аналог во внешних способах выражения.
Всего было выделено 29 эмоциональных состояний для 67 отобранных отрывков из пьесы. Следующий этап исследования заключался в анализе предложенных отрывков субъективным методом - с помощью аудитивного анализа. 10 аудиторов должны были приписать ту или иную эмоцию каждому из предъявленных предложений. Список эмоций не ограничивался. Анализ запротоколированных ответов показал, что 21 отрывку были приписаны одинаковые эмоциональные состояния 75% аудиторов. При этом число эмоциональных состояний, чаще всего выделяемых аудиторами, оказалось равным 22.
Результаты анализа субъективным методом можно представить в виде схематического распределения эмоциональных состояний по одной шкале. Если на одной прямой расположить эти эмоциональные состояния, то в центральной части окажутся те, которые были опознаны большинством аудиторов (см. схему №1).
Схема №1
Наиболее часто опознаваемые отрывки были предложены для прочтения четырем дикторам (как мужские, так и женские голоса). Таким образом, с учетом актерского исполнения, в нашем распоряжении был материал от одиннадцати дикторов. Все записи фраз, как в исполнении дикторов (ДИ), так и актеров (АИ) были проанализировали при помощи программы PRAAT, что позволило установить ряд акустических параметров, присущих каждому эмоциональному состоянию.
Основной задачей исследования было установить, какие эмоциональные состояния выражаются в определенных, существенно отличающихся друг от друга структурах акустических параметров.
Эмоциональное состояние восторг - восхищение
Максимум энергии приходится на диапазон от 40 до 4000 Гц. У всех
дикторов форманта ударного гласного приподнята на 100-200 Гц. Значительно увеличено время реализации ударного слога (660 мс в актерском произнесении, 330 - в неактерском) и шумного согласного (143 мс). Отмечено повышенное сосредоточение энергии в ударного гласного, причем оно увеличивается при закрытом гласном. В актерском исполнении каждый слог (ударный и неударный) реализуется как самостоятельная синтагма с резким нарастанием частоты основного тона и ее падением в пределах слога на 100 - 150 Гц. В случае ДИ аналогичное оформление отсутствует. При общем движении тона вниз, к концу синтагмы, наблюдается незначительное падение фронта ЧОТ.
Эмоциональное состояние восторг с удовольствием
Во всех случаях реализации (ДИ и АИ) наблюдается сосредоточение энергии от 40 до 4000 Гц. Время реализации ударного гласного увеличено. Фронт падения и нарастания ЧОТ идентичен (резкий подъем и спад на 100-150 Гц). В данном случае интерес представляет реализация слова со структурой - - '- (чудеса, красота). Ударный слог характеризуется увеличением звучания гласного, причем выделяется значительная область, в которой полностью исчезают все гармоники и увеличивается энергия.
Эмоциональное состояние радость
Здесь наблюдается максимум энергии - от 40 до 4000 Гц, а также увеличение на ударном и закрытом неударном гласном при повышении положения Б2. Каждый слог реализуется как законченная синтагма в случае АИ. В случае ДИ отмечены плавное нарастание и небольшой спад фронта частоты основного тона в пределах ударного гласного (130-200 Гц, 125-150 Гц). Наблюдается компрессия длительности согласных сегментов, вокализм доминирует над консонантизмом. Прослеживается замедление темпа произнесения всего высказывания.
Эмоциональное состояние печаль-тоска-сожаление
Для всех дикторов характерно изменение общей длительности фразы за счет увеличения общей длительности гласных. Энергия распределяется равномерно между всеми сегментами высказывания.
В случае АИ частота основного тона не меняется на протяжении всей синтагмы. В случае ДИ наблюдается резкое нарастание фронта частот (на 100-200 Гц) и незначительное его падение в пределах ударного слога (для слов с фонетической структурой - - '-. Для слов со структурой '- - отмечены резкое нарастание и падение частотного фронта (на 100-15- Гц) в пределах ударного слога.
Эмоциональное состояние печаль-тоска
Наблюдается неравномерное распределение энергии по спектру - в основном она концентрируется в области Б1. Б2, Б3, Б4 выражены слабо. Характерно возрастание общей длительности высказывания за счет увеличения времени реализации гласных. Каждый слог реализуется как завершенная синтагма. В случае АИ заударная часть редуцирована.
Эмоциональное состояние ехидство- издевка-пренебрежение
Общая длительность фразы близка к норме, но последний слог каждого слова в синтагме растянут - он имеет максимальную длительность по сравнению с
иными эмоциональными состояниями (до 545 мс). Энергия распределена равномерно - от 40 до 4000 Гц при яркой выраженности и Б2. Наблюдается волнообразное движение фронта ЧОТ с резким подъемом на первом предударном слоге (75-100 Гц).
Эмоциональное состояние упрек
Характерно неравномерное распределение энергии по спектру: во всех случаях четко выделяются отдельные области формант Б2, Б3, Б4. Энергия концентрируется в области ударного слога. В конце синтагмы повышается от 400 до 600 Гц. Временная реализация не отклоняется от нормы. Наблюдается плавное нарастание и падение ЧОТ на ударном слоге логически выделенного слова (от 25 до 40 Гц), а в конце синтагмы - понижение ЧОТ.
Эмоциональное состояние угроза
Энергия равномерно распределена по всему спектру от 40 до 4000 Гц. На протяжении всей синтагмы наблюдается ровное движение Б2 (АИ). Если словесное ударение совпадает с логическим, то отмечается движение Б2 и в случае ДИ. Во всех реализациях прослеживается компрессия согласных сегментов. Время реализации логически выделенного слога увеличено до 462 мс. Характерна значительная изрезанность фронта частотной огибающей с небольшими перепадами частот (2530 Гц), за исключением логически выделенных слогов с перепадами частот от 125 до 200 Гц. Завершение синтагмы отличается ровным движением ЧОТ.
Эмоциональное состояние ярость-гнев-ненависть
Наблюдается компрессия согласных и гласных сегментов в предударной части и растянутость ударного слога (до 578 мс). Все форманты ярко выражены и четко разграничены. Хорошо видна область третьей форманты. Характерно движение Б2 вниз (2000 - 1800 Гц). Наблюдается большая изрезанность фронта частотной огибающей с незначительными перепадами частот (максимальный - 15 Гц).
Эмоциональное состояние страх-испуг
Характерно неравномерное распределение энергии по спектру. Все высказывание произносится одинаково энергично. Движение частотной огибающей волнообразно. Отмечается компрессия длительности согласных сегментов. За исключением шумных согласных, время звучания которых в среднем увеличивается на 425 мс. Наблюдается большая изрезанность частотной огибающей при перепадах в 50-75 Гц.
Эмоциональное состояние мольба
В случае ДИ наблюдается равномерное движение энергии по спектру от 40 до 4000 Гц; в случае АИ, напротив, максимум энергии сосредотачивается на гласных сегментов (ударных и неударных). В двусловной синтагме отмечается повышение на 100 Гц на протяжении всего первого слова синтагмы. Второе слово синтагмы также характеризуется повышением ЧОТ на ударном слоге. Временная реализация не отклоняется от нормы. Для АИ характерны небольшие перепады ЧОТ при общем ее движении вниз к концу синтагмы. Для ДИ - значительные перепады ЧОТ на 100-150 Гц.
Эмоциональное состояние удивление
Вся энергия распределена равномерно - от 40 до 4000 Гц, причем Б2, Б3, Б4 сливаются. Наблюдается волнообразное движение первой форманты. Во времен-
ной реализации высказываний отклонений от нормы не наблюдается. Характерна сильная изрезанность частотной огибающей, резкое нарастание и падение фронта ЧОТ не только на ударных слогах, но и на каждом гласном. Эмоциональное состояние безразличие-разочарование Отмечена большая вариативность выражения данного эмоционального состояния разными дикторами. Временная реализация не отклонялась от нормы.
Результаты проведенного исследования акустических параметров звучащей речи на материале фрагментов пьесы А.Н. Островского «Гроза» в произнесении актеров МХАТ и дикторов (всего 11 человек) позволяют объединить эмоциональные состояния в следующие группы на основании определенного сочетания выделенных/установленных характеристик (см. табл. №1).
Таблица 1.
Эмоция общая характеристика спектра время Движение частоты основного тона
Восторг Восхищение Удовольствие Радость Печаль Тоска Спектр с равномерным распределением энергии по всем формантам Увеличение времени реализации Слог реализуется как синтагма
Сожаление Спектр с неравномерным распределением энергии Увеличение времени реализации
Страх Испуг Ярость гнев Спектр с неравномерным распределением энергии Уменьшение времени реализации
Ненависть угроза Спектр с равномерным распределением энергии по всем формантам Изрезанность с небольшими перепадами ЧОТ, резкие частотные модуляции
Мольба удивление Спектр с равномерным распределением энергии по всем формантам Время реализации не отклоняется от нормы Резкие перепады ЧОТ
Ехидство Издевка пренебрежение Спектр с неравномерным распределением энергии Время реализации не отклоняется от нормы Волнообразное движение ЧОТ
упрек Спектр с неравномерным распределением энергии Время реализации не отклоняется от нормы Плавное нарастание ЧОТ
Безразличие разочарование Вариативность реализации всеми дикторами
Полученные акустические характеристики фраз, произнесенных с соответствующей эмоцией актерами и дикторами, были соотнесены с результатами анализа по дифференциации эмоциональных состояний на положительные и отрицательные. Данные сопоставительного анализа позволяют утверждать, что некоторые эмоциональные состояния нельзя однозначно отнести только к одному конкретному классу. Границы между классами являются нечеткими, так как эмоции обладают разной степенью интенсивности и постепенно переходят одна в другую. Некоторые эмоции могут входить в одно более сложное эмоциональное состояние, другие всегда противостоят друг другу. Сказанное можно проиллюстрировать континуальной шкалой эмоциональных состояний, в основу которой положена круговая классификация эмоций Шлосберга [Woodworth, Schlosberg 1955]:
литература
Каржанова Н.В. Экспрессивная функция интонации в современном французском языке: Экспериментально-фонетическое исследование на материале высказываний, выражающих эмоции группы «радость»: автореф. дисс... канд. филол. наук. М., 2000. - 24 с.
Картавенко М.В. Об использовании акустических характеристик речи для диагностики психических состояний человека // Известия ЮФУ Технические науки. 2005, №5. - С. 164-180.
Колымба С.Н., Нушикян Э.А., Пирогова А.А. Акустические корреляты эмоционально окрашенных фраз, выражающих зону гнева, одобрения, иронии в современном английском языке // Речь и эмоции. Л.: Наука, 1975. - С. 95-100.
Романенко В.О. Эмоциональные характеристики речи и их связь с акустическими параметрами. // Общество. Среда. Развитие. 2010, №4. - С. 119-123.
Сорокин Ю.А., Марковина И.Ю. Культура и ее этнопсихолингвистическая ценность // Этнопсихолингвистика. М.: Наука, 1988. - С. 5-18.
Федоров В.М., Юрков П.Ю. Распознавание эмоционального состояния человека по акустическим параметрам речи. // Третий междисциплинарный семинар «Анализ разговорной русской речи». СПб., 2009. - С. 63-67.
Шаховский В.И. Голос эмоций в языковом круге homo sentiens. М., УРСС, 2015. - 144 с.
Шаховский В.И. Лингвистическая теория эмоций. М: Гнозис, 2008. 416 с.
Шаховский В.И. Эмоции: Долингвистика, лингвистика, лингвокультуроло-гия. М., Либроком, 2013. - 128 с.
PRAAT. Электронный ресурс. [URL]: http://praat.ru.uptodown.com/ (дата обращения 21.02.2016).
WierzbickaA. Emotions across Languages and Countries. Diversity and Universals (Studies in Emotion and Social Interaction). Cambridge University Press. 1999. - 364 p.
WoodworthR.S., SchlosbergH. Experimental psychology. NY, Holt, 1955. - 948 p.
EMoTioNs IN sPEEcH: EXPERIMENTAL REsEARcH
Irina i. Valuytseva
Moscow State Regional University, prof.
10a, Radio St., Moscow e-mail: [email protected]
Georgy T. Khukhuni
Moscow State Regional university, prof.
10a, Radio St., Moscow e-mail: [email protected]
The article sets forth the results of experimental studies of emotional speech at the segmental and suprasegmental level. Several experiments in Russian aim at two goals: 1. to determine which acoustic parameters describe positive and negative emotional states 2. to classify emotional states from a linguistic point of view and determine invariant models for expressing emotions in speech. Two series of experiments have been carried out with suprasegmental native Russians. The article justifies the usage of actors' speech while studying the characteristics of speech signal - as long as actors stick to Stanislavsky's system. Then the second stage of the experiment involves the analysis of the record of Moscow Art Academic Theater performance fragments. The material for the research included 22 phrases pronounced by both actors and speakers, showing various emotional states. The spectral analysis of the speech fragments from the performances has allowed to determine parameter combinations which are specific to certain emotional states: spectral patterns, formants, main tone frequency, temporal characteristics.
Keywords: emotional state, speech, acoustic parameter, formant structure, subjective and objective experiment.
references
KarzhanovaN.V. Jekspressivnaja funkcija intonacii v sovremennom francuzskom jazyke: Jeksperimental'no-foneticheskoe issledovanie na materiale vyskazyvanij, vyrazhajushhih jemocii gruppy «radost'» [Expressive Function of Intonation in Modern French: Phonetic Experiment of Utterances Expressing Emotions belonging to "JOY" group]: avtoref. diss... kand. filol. nauk. - M., 2000. 24 p.
Kartavenko M.V. Ob ispol'zovanii akusticheskih harakteristik rechi dlja diagnostiki psihicheskih sostojanij cheloveka [On using acoustic characteristics of speech for psychological state diagnosis] // Izvestija JuFU. Tehnicheskie nauki. Izd-vo Juzhnyj federal'nyj universitet, 2005, №5. pp. 164-180.
Kolymba S.N., Nushikjan Je.A., Pirogova A.A. Akusticheskie korreljaty jemocional'no okrashennyh fraz, vyrazhajushhih zonu gneva, odobrenija, ironii v sovremennom anglijskom jazyke [Acoustic correlates of emotional phrases representing anger, approval, irony in modern English] // Rech' i jemocii. - L.: Nauka, 1975. pp. 95-100.
Romanenko V.O. Jemocional'nye harakteristiki rechi i ih svjaz' s akusticheskimi parametrami [Emotional characteristics of speech in connection with acoustic parameters] // Obshhestvo. Sreda. Razvitie. 2010, №4. pp. 119-123.
Sorokin JuA., Markovina I.Ju. Kul'tura i ee jetnopsiholingvisticheskaja cennost' [Culture and its ethnopsycholingistic value] // Jetnopsiholingvistika. - M., Nauka. 1988. pp. 5-18.
Fedorov V.M., Jurkov P.Ju. Raspoznavanie jemocional'nogo sostojanija cheloveka po akusticheskim parametram rechi. [Identification of person's emotional state on basis of acoustic parameters] // Tretij mezhdisciplinarnyj seminar «Analiz razgovornoj russkoj rechi». - SPb., 2009. pp. 63-67
Shahovskij V.I. Golos jemocij v jazykovom kruge homo sentiens. [The voice of emotions in the homo sentiens language circle]. - M., URSS, 2015. 144 s.
Shahovskij V.I. Lingvisticheskaja teorija jemocij. [Linguistic theory of emotions]-M: Gnozis, 2008. 416 p.
Shahovskij V.I. Jemocii: Dolingvistika, lingvistika. Lingvokul'turologija. Emotions: prelinguistics, linguistics, linguoculturology]. - M., Librokom, 2013. 128 p.
PRAAT. Jelektronnyj resurs. [URL]: http://praat.ru.uptodown.com/ (data obrashhenija 21.02.2016).
WierzbickaA. Emotions across Languages and CountriesA Diversity and Universals (Studies in Emotion and Social Interaction). Cambridge University Press. 1999. 364 p.
Woodworth R.S., Schlosberg H. Experimental psychology. NY, Holt, 1955. 948 p.