Вестн. Моск. ун-та. Сер. 19. Лингвистика и межкультурная коммуникация. 2009. № 3
ТЕОРИЯ ЯЗЫКА И РЕЧИ Г.И. Бубнова, Е.И. Ратникова
УСТНОПОРОЖДАЕМАЯ РЕЧЬ: ИЗУЧЕНИЕ СИНЕРГЕТИЧЕСКИХ СВОЙСТВ НА АКУСТИЧЕСКОМ УРОВНЕ
Статья посвящена анализу устнопорождаемого высказывания, которое рассматривается как нелинейная система, характеризующаяся, с одной стороны, хаотической природой, а с другой - определенными детерминированными законами становления. В работе представлены результаты проведенного пилотного эксперимента, цель которого - выработка подхода к изучению устной речи, учитывающего как ее лингвистические характеристики, так и экстралингвистические свойства - диссипативность, становление во времени и др. В основе эксперимента находится анализ изменений интенсивности во времени. Общие тенденции и характер изменений интенсивности во всех изученных высказываниях подтверждают возможность рассматривать устную речь в качестве объекта лингвосинергетики. Полученные результаты послужат основой для дальнейшего исследования.
Ключевые слова: устнопорождаемая речь, лингвосинергетика, акустические характеристики, интенсивность, нелинейность.
The article deals with the analysis of spoken utterances regarded as a non-linear system that despite its general chaotic nature develops according to certain determined laws. The article describes a pilot experiment that was carried out with the aim of elaborating an approach to the study of oral speech. Along with linguistic features this approach takes into account the extra-linguistic properties such as dissipativeness, temporal development etc. The experiment analyses the changes in intensity that occur with time. The general character of intensity changes in all the studied utterances confirm the possibility of considering oral speech as a subject of linguosynergetics. The data obtained as the result of the experiment can serve as a basis for further studies.
Key words: orally produced speech, linguosynergetics, acoustic characteristics, intensity, non-linearity.
1. Введение
Статья посвящена анализу устнопорождаемой речи, которая в связи с многоканальным характером порождения1 и большой вари-
Бубнова Галина Ильинична - докт. филол. наук, проф., зав. кафедрой французского языка факультета иностранных языков и регионоведения МГУ имени М.В. Ломоносова; тел.: 8-917-522-17-65, e-mail: [email protected]
Ратникова Елена Игоревна - аспирант кафедры французского языка факультета иностранных языков и регионоведения МГУ имени М.В. Ломоносова; тел.: 8-903798-17-53, e-mail: [email protected]
1 В ситуации устного порождения смысл создается многоканально вербальными (лексико-синтаксический + фонетический каналы) и невербальными (визуальный
ативностью условий протекания представляет собой пограничную область исследования, интересующую не только лингвистов, но и когнитологов, социологов, психологов, культурологов. Очевидно поэтому, что описание такого сложного эмпирического объекта характеризуется множественностью подходов и дискуссионностью проблематики.
В настоящей статье устнопорождаемая речь рассматривается с позиций лингвосинергетики. Преимущество лингвосинергетического подхода заключается в том, что понятие "синергия", т.е. взаимодействие, лежащее в его основе, позволяет максимально непротиворечиво и экономно рассмотреть сложность и многоаспектность изучаемого объекта.
В центре внимания лингвосинергетики находится теория письменного текста. Текст рассматривается как сложная "синергетическая система"2, как "природный объект"3, обладающий такими синергети-ческими свойствами, как сложность, нелинейность, необратимость во времени и т.д. Изменения, происходящие в системе, обусловлены, по мнению исследователей, как ее собственными законами самоорганизации (языковыми параметрами), так и постоянным обменом энергией с "внешней средой" (с ситуацией коммуникации и ее участниками). Базовыми характеристиками текста признаются связность и цельность4. Таким образом, развивая идею синергетики о самоорганизации сложных систем, лингвосинергетический подход концептуально обогащает и экспериментально уточняет лингвистические и психолингвистические представления о тексте, выработанные в 70-е гг. XX в.5
Статья посвящена описанию экспериментального изучения устно-порождаемой речи на акустическом уровне. Цель эксперимента - показать, что устнопорождаемое высказывание обладает основными синергетическими свойствами. Для этого необходимо ответить на следующие вопросы: можно ли рассматривать его как нелинейную систему? влияют ли такие факторы, как продолжительность речевого акта, индивидуальные особенности говорящих, обсуждаемая ими проблематика и пр., на изменение акустических параметров, и если
+ кинесический + праксемический + такесический каналы) средствами. Основная задача говорящего - их корректное и эффективное совмещение с учетом конкретной ситуации общения.
2 Пищальникова В.А. Речевая деятельность как синергетическая система // Изв. Алтайского гос. ун-та. 1997. № 2.
3 МоскальчукГ.Г. Структура текста как синергетический процесс. М., 2003.
4 См.: Белоусов К.И., Блазнова Н.А. Введение в экспериментальную лингвистику. М., 2005.
5 См.: Гальперин И.Р. Лингвистика текста. М., 1981; Леонтьев А.А. Психолингвистические единицы и порождение речевого высказывания. М., 2003; Гак В.Г. Языковые преобразования. М., 1998.
да, то каким образом? существуют ли общие закономерности становления устного спонтанного высказывания или же это хаотичное, беспорядочное развертывание?
2. Гипотезы исследования
В рамках данного исследования были сформулированы две основные гипотезы.
Гипотеза 1. Основываясь на данных акустической фонетики, которая описывает физическую сторону процесса речепорождения в терминах экспоненциальных затухающих колебаний6, мы предполагаем, что в устнопорождаемом высказывании общий запас энергии уменьшается во времени, т.е. устнопорождаемое высказывание - дис-сипативная система.
Изменения, происходящие внутри системы, имеют нелинейный характер. Любые последовательные изменения, представляющие собой линейный процесс, являются лишь частью более крупного нелинейного процесса, т.е. устнопорождаемое высказывание - нелинейная система.
Гипотеза 2. Устнопорождаемое высказывание обладает двойственной природой. С одной стороны, для него характерны невоспроизводимость, непредсказуемость, фокусировка внимания на текущем моменте. С другой стороны, законы его становления жестко детерминированы материальными условиями порождения - многоканальностью, необратимостью, поступательностью, однонаправленностью, интерактивностью, синхронностью мысли и ее вербализации, объемом оперативной памяти7. Уровень, координирующий взаимодействие всех этих разнородных на первый взгляд факторов, управляет процессом порождения, задавая программу его речевого исполнения.
Очевидно, что эта программа является сложной и организована иерархически8: каждая из технических сторон и деталей выполняемого речевого акта находит для себя среди нижележащих подуровней такой, который может обеспечить ей наиболее адекватное исполнение. Ведущий уровень, управляя работой фоновых уровней, реализует только самые основные, решающие в смысловом отношении коррекции. Есть все основания полагать, что акустическая картина
6 В результате энергетических потерь амплитуда звуковой волны затухает вплоть до стационарного состояния (см.: Фант Г. Анализ и синтез речи. Новосибирск, 1970).
7 См.: Бубнова Г.И. Лингвистические проблемы экспериментального изучения звучащей речи: просодический аспект: Дисс. ... докт. филол. наук. М., 1992. С. 313-318.
8 Предложенная гипотеза опирается на модель уровневого построения движений, разработанную Н.А. Бернштейном (см.: Бернштейн Н.А. Физиология движений и активность. М., 1990. С. 42-43).
речевого развертывания содержит объективную информацию о реализации этой программы.
Для проверки сформулированных гипотез и выработки процедуры анализа устнопорождаемого высказывания был проведен пилотный эксперимент, в ходе которого изучалось изменение интенсивности во времени.
3. Эксперимент
3.1. Материал
В качестве материала эксперимента были произвольно отобраны три радиоинтервью на французском языке. Они не связаны между собой тематически, в них участвуют разные ведущие и интервьюируемые. Таким образом, в эксперименте учитывались индивидуальные особенности речи говорящих.
Интервью были записаны на пленку, а затем оцифрованы в программе GoldWave у5.25 с частотой дискретизации 41,100 Гц.
Как известно, интервью представляет собой ответы на вопросы ведущего. Несмотря на связь всех вопросов и ответов одного интервью между собой, в рамках данного эксперимента эта связь не изучается.
За единицу наблюдения в пилотном эксперименте принимаются только высказывания-ответы интервьюируемого (ВО), представляющие собой квазимонологические спонтанные высказывания.
В каждом интервью было отобрано по 2 ВО, т.е. всего анализировалось 6 ВО. Все ВО отбирались методом случайной выборки. Таким образом, продолжительность их звучания, а также их позиция в интервью исследователем не задавались9.
В каждом ВО с помощью звукового редактора AdobeAudition были выделены единицы порождения (ЕП). Термин "единица порождения" рабочий, в данной статье под ним понимается участок фонации, отграниченный двумя акустическими паузами, длительность которых превышает 300 мсек10.
В каждой ЕП были сделаны замеры всех максимальных значений интенсивности 1тах и их локализации на временной оси (в подавляющем большинстве случаев 1тах отмечались на ударном слоге).
9 Такой подход представляется необходимым для формализации процедуры эксперимента и выработки наиболее объективного метода анализа. Отказ от операции сознательного выбора позволяет исключить человеческий фактор при отборе материала.
10 См.: Блохина Л.П., Потапова Р.К. Перцептивная категоризация паузальной сегментации слитной речи // Науч. тр. Моск. гос. пед. ин-та иностр. яз. им. М. То -реза. 1986. Вып. 265; Бубнова Г.И., Гарбовский Н.К. Письменная и устная коммуникация: синтаксис и просодия. М., 1991.
Полученные данные были внесены в статистическую таблицу и анализировались в программе GraphPadPrism.
3.2. Методика
Для выявления наличия связи между 1тах и временем, а также характера и направленности этой связи были использованы следующие статистические методы:
• графический метод предполагает построение диаграммы рассеяния, т.е. поля корреляции. Диаграмма рассеяния наглядно иллюстрирует взаимосвязь двух параметров;
• корреляционный анализ количественно определяет тесноту и направление связи между параметрами;
• анализ линейной регрессии представляет собой моделирование взаимосвязи между изучаемыми параметрами. Модель аналитически выражает зависимость среднего значения 1тах от времени. Анализ также включал в себя расчет коэффициента регрессии и его статистической значимости. Коэффициент регрессии используется для оценки точности предсказуемости значений у из х.
3.3. Процедура исследования
Проиллюстрируем проделанный анализ на одном из ВО, в ко -тором была зафиксирована наибольшая контрастность изменений Imax (рис. 1). На диаграмме рассеяния время (Time) располагается на горизонтальной оси x, Imax - на вертикальной оси у. Пересечения линий, проводимых через эти оси, обозначаются соответствующими точками.
Как видно на графике, точки имеют вид облака с небольшим наклоном вниз и вправо. Наблюдаемый разброс точек может быть охарактеризован двояко. С одной стороны, разброс точек, несомненно, является значительным, а с другой - выделяется зона плотной груп-
-2-
•Q
ТЗ
8 £
-6-
-8-
* • • * t S
• . • v
0.0
—I—
0.5
—I— 1.0
—I—
1.5
—I 2.0
Time, sc
Рис. 1. Диаграмма рассеяния Imax
0
пировки в средней части ВО вдоль оси х. В конце ВО зафиксировано уплотнение, сближение точек. Таким образом, в расположении точек на графике прослеживается определенная закономерность.
Наблюдаемая отрицательная тенденция рассеивания (значения 1тах уменьшаются к концу ВО), а также распределение точек вдоль временной оси х позволяют сделать вывод о наличии связи между изучаемыми переменными.
Для количественного определения тесноты этой связи и ее направления был проведен корреляционный анализ. В корреляционном анализе теснота связи выражается величиной коэффициента корреляции г, который варьирует от 0 до ±1. В описываемом анализе г = -0,3860. Это означает, что связь изучаемых параметров слабая11. Это может объясняться тем, что время не единственный фактор, оказывающий влияние на изменение 1тах, а также тем, что эта связь нелинейна. Отрицательный знак при коэффициенте корреляции свидетельствует о том, что связь между 1тах и временем обратная, т.е. с увеличением одной переменной другая уменьшается.
Зависимость между 1тах и временем была установлена с помощью анализа линейной регрессии12. На графике линейная регрессия показана прямой наклонной линией, которая проходит через средние значения 1тах (рис. 2). Здесь и далее эта линия будет называться линией средних значений. Данная линия отражает связь между двумя переменными. Тот факт, что можно провести прямую линию, говорит о том, что 1тах находится в пропорциональной зависимости от времени. Наклон линии указывает на то, что связь между двумя переменными обратная, т.е. 1тах уменьшается во времени.
Рис. 2. Линейная регрессия: прямая наклонная линия показывает средние значения 1тах
11 Следует отметить, что данный коэффициент корреляции был установлен во всех изученных ВО независимо от их длины и значений 1тах.
12 Линейная регрессия - частный случай нелинейной регрессии. Построение линейной регрессии позволяет получить упрощенное представление о связи, что и требуется для проведения данного анализа.
0-
-8
0.0
0.5 1.0 1.5
Итв, во
2.0
9 ВМУ, лингвистика, № 3
Для количественного определения степени зависимости 1тах от времени и оценки точности полученной модели необходимо рассчитать линейный коэффициент регрессии г2. В данном случае г2 = 0,149. Таким образом, степень влияния времени на изменения значений 1тах составляет около 15% от всех факторов, влияющих на изменения 1тах.
На графике теснота связи определяется количеством точек, которые находятся вблизи линии средних значений или которые попадают на нее. Коэффициент стандартного отклонения невысокий (8Б = 1,4 дБ), т.е. отклонения значений 1тах от линии средних значений демонстрируют ту же тенденцию: значения 1тах уменьшаются во времени.
Для того чтобы наглядно представить локализацию всех точек относительно линии средних значений, а также отобразить их удаленность от этой линии, были построены 99%-й доверительный (рис. 3) и 95%-й вероятностный (рис. 4) интервалы.
0т
-2-
■С
Т!
8 £
-6-
-8-
• •• » ---
• • •
0.0
—I—
0.5
-1-
1.0
Пте, бс
—I—
1.5
—I 2.0
Рис. 3. 99%-й доверительный интервал: значения 1тах, близкие к средним, локализуются в верхней и нижней части относительно линии средних значений Условные обозначения: А - верхняя граница линии средних значений; В - нижняя граница линии средних значений
0-
-2-
.с
Т! -4-
£
л -6-
-8-
-10-
.С
— О
0.0
—I—
0.5
-1-
1.0
Пте, бс
—I—
1.5
—I 2.0
Рис. 4. 95%-й вероятностный интервал: возможные пределы дисперсии значений 1тах Условные обозначения: С - верхняя граница зоны 2; Б - нижняя граница зоны 2
В доверительный интервал попадают точки, наиболее точно выражающие связь между двумя переменными и соответственно наиболее близко расположенные к линии средних значений. Этот интервал будем называть зоной средних значений или зоной 1. На графике верхняя и нижняя границы этой зоны обозначены буквами А и В (рис. 5).
В отличие от доверительного интервала вероятностный интервал задает возможные пределы дисперсии. Все точки, "выскакивающие" за границы вероятностного интервала, рассматриваются как экстремальные. Этот интервал будем называть зоной 2, а ее границы обозначим буквами С (верхняя граница) и Б (нижняя граница) (рис. 5).
Как видно, основная тенденция распределения точек в пределах ВО такова: в начале точки группируются в пределах зоны 1, затем выходят за верхнюю и нижнюю границы зоны 2 и в конце локализуются между нижними границами зон 1 и 2 (границами В и Б), в ряде случаев выходя за нижнюю границу зоны 2.
Расположение точек на графике относительно границ двух зон, а также наблюдение за развертыванием 1тах во времени позволяют выделить в каждом из изученных ВО три периода (рис. 6). Периоды
0-|
-2-
.с
Т! -4-
£
л -6-
-8-
-10-
----------------------- С
______/Г^Б
-----й
0.0
—I—
0.5
-1-
1.0
Пте, бс
—I—
1.5
—I 2.0
Рис. 5. Суммарный график рис. 3 и 4 Условные обозначения: АВ - границы зоны 1; СБ- границы зоны 2
-2-
.а ■а
8-4" е
-6-
-8-
0.0
—I—
0.5
-1-
1.0
Пте, бс
—I—
1.5
—I 2.0
0
2
Рис. 6. Периоды ВО, выделяемые на основе контрастности значений 1тах
отражают специфику развертывания 1тах и различаются на основе следующих критериев:
• максимальные значения 1тах;
• контрастность значений 1тах;
• временные промежутки между 1тах.
Под контрастностью понимается размах значений 1тах по отношению к линии средних значений.
Максимальные значения 1тах распределяются следующим образом: первый период - 3,220 дБ, второй период - 1,810, третий период - 3,970 дБ (рис. 7).
-2-
■п
8 -4" £
-6-
-8-
—* ** а ааа±
А А А
А А
-1-
Рис. 7. Распределение 1тах относительно линии средних значений в трех периодах контрастности
Первый период - период наименьшей контрастности. Размах между максимальным и минимальным значением 1тах составляет 2,83 дБ. Как видно на графике, значения 1тах распределяются в пределах зоны 1 или рядом с ее границами. Значения могут "выскакивать" за границы этой зоны, но никогда не пересекают верхнюю или нижнюю границу зоны 2. При этом, как было показано выше, большая часть значений 1тах распределяется не на самой линии средних значений, а вокруг нее, т.е. в зоне 1.
В первом периоде регистрируются наибольшие интервалы между 1тах. Средняя их продолжительность 488 мсек.
Переход от первого периода ко второму происходит, по всей видимости, в тот момент, когда значение 1тах "выскакивает" за пределы верхней или нижней границы зоны 2 (С или Б14). Резкое увеличение или уменьшение значения 1тах по сравнению с предыдущими значениями можно интерпретировать как переход ко второму периоду (рис. 8).
13 В программе, которая проводит замеры, значения интенсивности располагаются на логарифмической шкале, содержащей отрицательные или нулевые значения. Чем ближе значение к нулю, тем больше интенсивность.
14 Локализация значений 1тах за пределами нижней границы Б, наблюдаемая в конце первого периода, характеризуется меньшей частотностью и требует дополнительного изучения.
0
Time, sc
Рис. 8. Начало второго периода ВО: точка максимального значения Imax
Второй период - это не только период наибольших значений Imax, но и период наибольшего контраста. Разница контрастного распределения между максимальным и минимальным значением Imax составляет 5,58 дБ. Второй период - единственный период, в котором значения Imax выходят за пределы как границы С, так и границы D. По сравнению с первым периодом количество значений Imax, локализующихся на линии средних значений, возрастает.
Что касается временных интервалов между Imax, то средняя величина составляет 274 мсек. Таким образом, во втором периоде наблюдается сближение Imax во времени.
В третьем периоде значения Imax не только группируются на линии средних значений, но и приближаются к нижней границе зоны 2, в ряде случаев выходя за ее пределы. Значения Imax практически никогда не "выскакивают" за верхнюю границу С. Контрастность значительно ниже контрастности, наблюдаемой во втором периоде, - 3,63 дБ. Среднее значение временных интервалов между Imax достигает 333 мсек.
4. Интерпретация результатов эксперимента
Полученные результаты в целом подтверждают гипотезы, сформулированные в начале статьи.
Устнопорождаемое высказывание обладает свойствами синерге-тического объекта. На акустическом уровне были установлены:
Зависимость изменений максимальных значений интенсивности Imax от времени. Во всех изученных ВО значения Imax уменьшаются при увеличении времени. Степень влияния времени на Imax была определена как 15%, что может объясняться тем, что время не единственный фактор, оказывающий влияние на изменения Imax, а также тем, что эта связь нелинейна.
Нелинейность. Диссипация, наблюдаемая в ВО, подтверждает предположение о нелинейности устнопорождаемого высказывания15. О нелинейности также свидетельствует характер и порядок изменений 1тах: большое значение 1тах сменяется малым значением и наоборот. Наблюдаемые в ряде случаев линейный рост или линейное уменьшение значений 1тах от одной ЕП к другой не продолжаются до бесконечности во времени, что может быть интерпретировано как часть более крупного нелинейного процесса.
Чередование больших и малых значений 1тах в сочетании с их общей отрицательной диссипацией к концу ВО подтверждает и вторую гипотезу о двойственной природе устнопорождаемого высказывания.
С одной стороны, природа устнопорождаемого высказывания хаотична и случайна. Об этом свидетельствует наблюдаемая дисперсия значений 1тах, ее уникальность в каждом конкретном ВО, невоспроизводимость, невозможность предсказать точные значения 1тах. С другой стороны, анализ значений 1тах, их контрастности и временных интервалов между ними позволяет сегментировать ВО на три стабильно выделяющиеся периода. Периоды отражают специфику становления интенсивности во времени: сначала наблюдается период так называемой "раскачки", затем пика и, наконец, спада. Изменения 1тах, таким образом, детерминированы некими факторами. Одним из таких факторов может быть координирующая роль, выполняемая ведущим уровнем по отношению к фоновым в процессе порождения устного высказывания. Дисперсия значений 1тах регулируется, помимо прочих параметров, временем.
Таким образом, развертывание ВО наглядно иллюстрирует синер-гетическое представление о "возникновении порядка из хаоса"16.
5. Заключение
Проведенное исследование показывает, что устнопорождаемое высказывание может быть рассмотрено как сложная нелинейная система, становление которой определяется взаимодействием целого ряда разнообразных факторов.
Одни из них выполняют координирующую роль и задают схему развертывания интенсивности во времени, которую выявил анализ: трехпериодное становление ВО, стабильно наблюдаемое во всех реализациях независимо от тематики устнопорождаемого высказывания, его продолжительности, индивидуальных особенностей говорящих и пр.
15 Диссипация энергии является свойством нелинейной системы (см.: Анищен-ко В.С. Знакомство с нелинейной динамикой. М., 2008).
16 Пригожин И., СтенгерсИ. Порядок из хаоса: Новый диалог человека с природой. М., 2005.
Роль других - обеспечить конкретные, сиюминутные действия, реализация которых осуществляется практически бессознательно, т.е. на фоновых уровнях, и выражается цифровыми значениями изученных параметров (1тах и времени). Их вариативность хаотична и непредсказуема как внутри одного ВО, так и тем более при сопоставлении ВО.
Таким образом, проведенный эксперимент выявил наличие си-нергетических свойств устнопорождаемого высказывания на акустическом уровне. Предложенная процедура исследования оказалась достаточно эффективной, однако ее дальнейшее использование предполагает необходимость:
• увеличить корпус исследования;
• ввести перцептивный анализ экспериментального корпуса;
• изучить взаимодействие трех акустических характеристик - частоты основного тона, интенсивности и времени. Синергетические свойства, обнаруженные на акустическом уровне устнопорождаемого высказывания, открывают возможности для изучения синергетических свойств на других уровнях ВО.
Список литературы
Анищенко В.С. Знакомство с нелинейной динамикой. М., 2008. Белоусов К.И.,БлазноваН.А. Введение в экспериментальную лингвистику. М., 2005.
Бернштейн Н.А. Физиология движений и активность. М., 1990. Блохина Л.П., Потапова Р.К. Перцептивная категоризация паузальной сегментации слитной речи // Науч. тр. Моск. гос. пед. ин-та иностр. яз. им. М. Тореза. 1986. Вып. 265.
Бубнова Г.И. Лингвистические проблемы экспериментального изучения звучащей речи: просодический аспект: Дисс. ... докт. филол. наук. М., 1992. Бубнова Г.И., Гарбовский Н.К. Письменная и устная коммуникация: синтаксис
и просодия. М., 1991. Гак В.Г. Языковые преобразования. М., 1998. Гальперин И.Р. Лингвистика текста. М., 1981.
Леонтьев А.А. Психолингвистические единицы и порождение речевого высказывания. М., 2003.
Москальчук Г.Г. Структура текста как синергетический процесс. М., 2003. Пищальникова В.А. Речевая деятельность как синергетическая система // Изв.
Алтайского гос. ун-та. 1997. № 2. Пригожин И., Стенгерс И. Порядок из хаоса: Новый диалог человека с природой. М., 2005. Фант Г. Анализ и синтез речи. Новосибирск, 1970.