Научная статья на тему 'Избыточность языка и избыточность текста: некоторые размышления'

Избыточность языка и избыточность текста: некоторые размышления Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
4110
279
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕКСТ / ЭКОНОМИЯ РЕЧЕВЫХ СРЕДСТВ / ЯЗЫКОВАЯ ИЗБЫТОЧНОСТЬ / ЭЛЛИПСИС / ВЕРОЯТНОСТНОЕ (КОНТЕКСТНОЕ) ПРОГНОЗИРОВАНИЕ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Грудева Елена Валерьевна

Статья посвящена рассмотрению связи и взаимозависимости языковой избыточности и тенденции к экономии речевых средств. Прослеживается отношение к указанным явлениям в лингвистической литературе на протяжении истории их изучения. Анализируются механизмы повышения / понижения избыточности текста. Мера избыточности определяется в соответствии с типом текста, от которого зависит, за счет каких составляющих складывается общая избыточность. Утверждается, что средства создания избыточности носят идиоэтнический характер — языки могут отличаться друг от друга не только тем, что они с большей легкостью опускают (правила эллипсиса), но и тем, что они с большей легкостью повторяют (правила избыточности). Избыточность текста так же, как механизмы вероятностного (контекстного) прогнозирования, работает в полной мере только при условии осмысленности сообщения, презумпции его связности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Language and text redundancy: some ideas

The paper focuses on the links and interdependencies between linguistic redundancy and the speech economy principle. It addresses the history of both concepts’ treatment in linguistic literature and the mechanisms governing the redundancy level dynamics in Russian written texts. Redundancy levels are determined for specific text types and components. It appears that the linguistic factors of redundancy level dynamics are language-specific: languages differ in both the types of text components subject to omission (rules of ellipsis), and the types of text components subject to repetition (rules of redundancy). Only coherent and meaningful texts make it possible to identify the text redundancy levels of a language or the (context-determined) forecasting mechanisms of its speakers.

Текст научной работы на тему «Избыточность языка и избыточность текста: некоторые размышления»

I. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ИЗБЫТОЧНОСТИ

Е. В. Грудева

ИЗБЫТОЧНОСТЬ ЯЗЫКА И ИЗБЫТОЧНОСТЬ ТЕКСТА: НЕКОТОРЫЕ РАЗМЫШЛЕНИЯ

Резюме. Статья посвящена рассмотрению связи и взаимозависимости языковой избыточности и тенденции к экономии речевых средств. Прослеживается отношение к указанным явлениям в лингвистической литературе на протяжении истории их изучения. Анализируются механизмы повышения / понижения избыточности текста. Мера избыточности определяется в соответствии с типом текста, от которого зависит, за счет каких составляющих складывается общая избыточность. Утверждается, что средства создания избыточности носят идиоэтнический характер — языки могут отличаться друг от друга не только тем, что они с большей легкостью опускают (правила эллипсиса), но и тем, что они с большей легкостью повторяют (правила избыточности). Избыточность текста так же, как механизмы вероятностного (контекстного) прогнозирования, работает в полной мере только при условии осмысленности сообщения, презумпции его связности.

Ключевые слова: текст, экономия речевых средств, языковая избыточность, эллипсис, вероятностное (контекстное) прогнозирование.

1. Введение

В литературе неоднократно отмечалось, что в естественном языке постоянно действуют две противоположные тенденции: тенденция к экономии усилий и тенденция к обеспечению избыточности. Действие этих тенденций напрямую связано с интенциями двух основных участников речевой деятельности — говорящего и слушающего. С точки зрения говорящего, конечно, лучше выбрать более экономное средство для выражения мысли, т.е. говорящий экономит «генеративные» средства. Слушающий же экономит «перцептивные» средства, т.е. заинтересован в самом простом из возможных переходов от текста к мысли (смыслу), чему и способствует оптимальный уровень избыточности; поэтому прямое противопоставление экономии и избыточности не вполне корректно; корректнее противопоставление того, что именно экономится каждым участником

Труды ИЛИ РАН. Том VI, часть 2. СПб., 2010

73

коммуникации. Однако, чтобы не нарушать традиции, в дальнейшем изложении мы будем использовать терминологическое словосочетание «принцип экономии» для обозначения механизмов и результатов деятельности этих механизмов по обеспечению «генеративной» экономии.

К сожалению, в истории лингвистики на сложное взаимодействие соответствующих принципов не обращалось должного внимания. Наиболее известным оказался принцип экономии ((///>/1949; Мартине 1960; Улъдаллъ 1960) и др.), хотя часто этот принцип, или закон, упоминается вместе с «противоположным» принципом избыточности. Причем если принцип экономии всегда подается на уровне языковой закономерности, то избыточность очень часто характеризуется отрицательно, как речевой недостаток.1 Об этом хорошо пишет японский лингвист Тояма Сигэхико, рассуждая об этих двух действующих в языке принципах и называя один из них гарантией в противоположность другому, с более традиционным названием, — принципу экономии. По мнению автора, принцип экономии порождает эллипсис, принцип гарантии — «многословие», повторение важных деталей для более надежной передачи информации. Тояма Сигэхико справедливо отмечает, что оба принципа имеют конкретные способы языкового выражения, но принцип гарантии не ощущается так ясно, как принцип экономии2 (разрядка моя. — Е. Г.; излагается по (Басс 2004:137)).

Исторически, уже в новое время, принцип экономии стал предметом внимания раньше, чем принцип избыточности. Так, например, Г. Пауль в «Принципах истории языка» посвятил целую главу экономии (Глава XVIII. Экономия языковых средств). В главе XIV, посвященной дифференциации значений, отмечая неизбежное образование в языке множества равнозначных слов, форм, типов сочетаний, Пауль замечает: «Хотя появление такого избытка является неизбежным, однако он не может сохраняться в языке длительное время. Языку чуждо какое бы то ни было излишество. Мне можно было бы возразить, что в таком случае язык должен был бы избегать возникновения излишеств. Однако язык вообще никогда не предотвращает возникновения отрицательного явления, он может лишь оказывать противодействие уже имеющемуся в наличии <...>» ((Пауль 1960: 301); разрядка Пауля; курс и I! мой. — Е. Г.).

1 Именно поэтому в лингвистических работах слово избыточность употребляется в двух разных значениях. Так, когда говорят об избыточности того или иного элемента, невольно вкладывают в значение этого слова оценочный компонент, имея в виду, что тот или иной элемент является липшим, ненужным. В контекстах же избыточность текста, избыточность языка (как кода) это слово используется вне оценочных категорий и приобретает статус термина.

2 Принцип гарантии, тем не менее, лежит в основе явления гендиадиса (прим. ред.).

Как видим, Г. Пауль прямо заявляет о том, что языку в принципе чуждо «какое бы то ни было излишество», и далее характеризует такого рода факты, встречающиеся в языке, как отрицательное явление. В главе XVIII, посвященной непосредственно экономии языковых средств и эллипсису, Пауль опять отмечает: «Нельзя, правда, отрицать того, что очень часто языковые средства используются излишне расточительно. В целом, однако, для языковой деятельности характерна определенная тенденция к бережливости» (Пауль 1960: 372).

Обращают на себя внимание слова, использованные при переводе книги Г. Пауля, которые выражают ангорскую 011011 к у этих двух тенденций: с одной стороны — «расточительно», а с другой — «бережливость». К сожалению, и до сих пор (за редким исключением) в лингвистической литературе, включая энциклопедические лингвистические словари, сохраняется такого рода оценка: экономия — это хорошо (или, во всяком случае, «естественно»), а избыточность — плохо.

На избыточность как на положительное свойство языка (и текста) в должной мере обратили внимание лишь в середине XX века в связи с появлением и развитием теории информации (Шеннон 1963; 1акоЪзоп 1961). В теории связи, а затем и в лингвистике избыточность стала рассматриваться как необходимое условие, обеспечивающее адекватный прием информации адресатом. А. Мартине, используя термины теории связи, в качестве основной функции избыточности называл борьбу с шумом, т.е. обеспечение восприятия сообщения, несмотря на помехи (Ьа I ищжГщие 1969: 332). Г. Глисон отмечал: «Хотя избыточность в языке приносит прямую пользу говорящим, она причиняет много неприятностей лингвисту при анализе и описании языка. Пытаясь дать добросовестное описание какого-либо словесного выражения, лингвист неизбежно тонет в массе деталей, не имеющих в силу высокой избыточности никакого значения. Основной метод в языкознании и заключается, собственно, в разграничении явлений избыточных и неизбыточных» (Глисон 1959: 373).

Наблюдения за языковой избыточностью, сделанные в 60-е годы, позволяют прийти к очень важным выводам о сущности языка. Так, В. А. Звегинцев обнаруживает разницу между естественным языком и логическим языком именно по признаку наличия / отсутствия избыточности (Звегинцев 1967: 29). Н. И. Жинкин, выдвигая гипотезу о языке внутренней речи, отмечал, что язык внутренней речи свободен от избыточности, свойственной всем естественным (натуральным — у Н. И. Жин-кина) языкам (Жинкин 1964: 36). Тагам образом, избыточность позволяет сущностно отграничить естественный язык от логического языка, с одной стороны, и от языка внутренней речи — с другой. Последнее замечание

как раз и показывает, что избыточность возникает в связи с появлением фигуры слушающего, т.к. на стадии внутренней речи (речи для себя, «без слушающего») никакой избыточности нет.

В зарубежной лингвистике вскоре после появления работ по теории информации понятие избыточности вошло и в учебники по языкознанию. Например, книга Г. Глисона «Введение в дескриптивную лингвистику»3 содержит, кроме прочих, традиционных для учебников по введению в языкознание, разделов, главу XIX под названием «Процесс коммуникации». Практически вся глава посвящена избыточности. Автор вводит понятие избыточности следующим образом: «<...> Нереализованная передающая способность кода возникает как следствие того, что мы повторяли сигналы, и ее можно назвать избыточной. Здесь мы опять встречаемся с таким употреблением термина, которое отличается от обычного. “Избыточность” — это специальный термин в теории информации, и он требует такого специального определения, которое могло бы согласовать его с термином “информация”. Мы определяем избыточность как разность между теоретически возможной передающей способностью какого-либо кода и средним количеством передаваемой информации. Избыточность выражается в процентах к общей передающей способности кода. Так, наше решение повторять каждый сигнал дважды создает избыточность в 50%» (Глисон 1959: 362). Глисон подчеркивает, что «избыточность — это не недостаток языка, но важная черта, без которой язык не мог бы функционировать» (Глисон 1959: 368).

В этом смысле отечественные учебники по языкознанию отличаются от указанного. По нашим наблюдениям, впервые понятие избыточности в терминологическом смысле представлено в учебнике «Семантика» М. А. Кронгауза4 (Кронгауз 2001), а также в книге Н. Б. Мечковской «Общее языкознание: Структурная и социальная типология языков» (Мечковская 2001).5 В учебнике И. П. Сусова по введению в языкознание в разделе «Информационные процессы и системы» также есть абзац, посвященный шумам и — как следствие — избыточности языка как кода. В частности, там отмечается: «Естественные языки обычно харак-

3 Книга Г. Глисона по сути является учебником по курсу «Введение в языкознание», впервые была издана в 1955 году в Нью-Йорке, а в 1959 году уже была переведена на русский язык и издана в Москве.

4 Следует отметить, что, в отличие от собственно учебников, в очерках и извлечениях по истории языкознания, составленных В. А. Звегинцевым и изданных в 1965 г., был представлен перевод статьи Р. О. Якобсона «Лингвистика и теория связи» (1961г.), которая практически вся построена на понятии избыточности (Якобсон 1965).

5 Впервые книга Н. Б. Мечковской была издана в Минске в издательстве «Амалфея» в 2000 году.

теризуются высокой избыточностью, позволяющей распознавать речевые сигналы с достаточной степенью надежности» (Сусов 2007: 33). Следует заметить при этом, что работы, связанные с изучением избыточности, велись и в нашей стране уже в 60-е годы (см., например, исследования Н. Н. Леонтьевой, Р. Г. Пиотровского, Т. Н. Никитиной, М. И. Откупщиковой, специально посвященные этой теме).

2. Избыточность языка и механизмы повышения / понижения избыточности текста

С момента зарождения теории информации, с середины 50-х годов, предпринимались попытки понятийно отграничить избыточность языка от повторов в тексте, ср.: «Избыточность — не то же, что повторение, она совсем не обязательно связана с повторением» (Глисон 1959: 362). Позже это разграничение оформилось в виде терминологической оппозиции «избыточность языка как кода ~ избыточность текста», см., например: (Якобсон 1965; Касевич 1986; 2006). Уже Г. Глисон отмечает: «Устранение избыточности могло бы произойти только за счет уничтожения всей структуры, и код как таковой оказался бы полностью разрушенным. Избыточность — следствие структуры языка и, вероятно, именно с этой точки зрения она прежде всего и интересует лингвистов. Однако избыточность выполняет и другую роль, в некоторых случаях весьма важную <...>» (Глисон 1959:372). Далее автор вводит понятие шума и ведет речь о необходимой степени избыточности самого сообщения, эта степень может быть увеличена при наличии большой порции шума или же уменьшена, если степень шума носит среднестатистический характер. Ср.: «Вне всякого сомнения, шум уменьшает эффективность системы связи. Любой идеальный код (т.е. использующий полностью передающую способность канала) невозможно применять при наличии помех, поскольку малейший шум исказит сообщение. Единственным средством, позволяющим избежать этого, является избыточность. Искажение сообщения можно предотвратить повторением данного сообщения, а также и некоторыми другими способами. Действенный код должен обладать достаточной избыточностью, чтобы компенсировать шум в системе. Поскольку в каждом языке обычно существует избыточность, свойственная его структуре, его можно использовать и при наличии умеренного количества шумов» ((Глисон 1959: 373); разрядка моя. — Е. Г.). Таким образом, следует различать два связанных друг с другом понятия — избыточность языка (как кода) и избыточность сообщения (текста).

Избыточность любого естественного языка составляет в среднем 50%. Это положение было с осторожностью (применительно к фонологи-

ческой системе) предложено авторами известного «Меморандума о языковых универсалиях» (Гринберг, Осгуд, Дженкинс 1970: 34). В настоящее время общепризнанной является дедуктивная универсалия: «Все естественные языки обладают свойством избыточности в передаче информации»; на основе статистических обследований текстов на разных языках утверждается, что в аспекте плана выражения (предсказуемости букв или фонем) мера избыточности языков также универсальна и составляет 60—70% (Мечковская 2007: 249). Если иметь в виду, что структурно языки могут значительно отличаться друг от друга, то, вероятно, эта мера — в 50—60% — достигается в каждом языке (типе языков) разными средствами. Так, например, в области морфологии в качестве средства повышения избыточности могут рассматриваться синтаксические падежи (по Е. Кури-ловичу), в то время как адвербиальные падежи обычно не связаны с этой функцией. В сингармонистических языках одним из средств создания избыточности является гармония гласных (Глисон 1959; Касевич 2006: 353), а в языках с развитой морфонологией — морфонологические явления (Касевич 1986; 2006). Универсальная мера избыточности языков определяется пределами оперативной памяти и порогами человеческой психики в распознавании знаков (Солсо 1996:153-154).6

Что же касается избыточности текста на естественном языке, то в литературе утверждается, что текст на любом естественном языке характеризуется средней избыточностью также в 50—55%, при этом отмечается, что «степень избыточности меняется в зависимости от вида сообщения (статья в газете, эссе, поэтическое произведение и т.д.), но на интуитивном уровне она осознается всеми носителями языка» (Дюбуа, Эделин, Клинкенберг и др. 1986: 75). Те же авторы отмечают: «Поскольку нормальный уровень избыточности относится к имплицитным знаниям любого носителя языка, изменение этого уровня, будь то в сторону увеличения или в сторону уменьшения, является маркером» (Дюбуа и др. 1986: 79). Иными словами, уровень избыточности не должен быть меньше допустимого (в таком случае автор текста рискует быть непонятым), но в то же время он не должен и превышать пороговой величины (как показывают эксперименты, связанные с развертыванием всех компрессированных форм, с заменой эллиптических конструкций полными, увеличение повторов в тексте затрудняет его восприятие и ведет к смысловым неточностям в его понимании; см., например: (Колобаев 1994)). В языке действуют специальные механизмы понижения избы-

6 Отсутствие единой системы вычисления показателя избыточности текста и значительные расхождения в значении этого показателя у разных авторов заставляют сомневаться в том, что такой всеобщий показатель в настоящее время является надежным (прим. ред.).

точности текста — например, эллипсис (подробнее о таком понимании эллипсиса см. в (Грудева 2008)) или «контекстная вытеснимость», под которой обычно понимается явление, связанное с запретом на дублирование лексической информации грамматическими средствами (Даниэль, Плунгян 1996; Плунгян 2000).

Необходимая мера избыточности текста создается не только за счет структурных свойств языка, но и при помощи разного рода повторов. К числу важнейших механизмов, связанных с формированием избыточности текста, относится механизм согласования, которое проявляется как на структурном, так и на семантическом уровне. Структура языка и его грамматические законы определяют, в каких случаях отдельные грамматические характеристики дублируются в составе высказывания. В отличие от обусловленного типом языка структурного согласования, закон семантического согласования, надо полагать, носит универсальный характер. Суть этого закона, по Ю. Д. Апресяну, заключается в том, что слова, образующие состав предложения, имеют в своих значениях общие — т.е. повторяющиеся — семантические компоненты (Апресян 1972; Гак 1972; Апресян 1995). Рассматривая предложение Хороший кондитер не жарит хворост на газовой плите, Ю. Д. Апресян отмечает, что общее число принципиально мыслимых комбинаций значений всех входящих в состав данного предложения слов (а следовательно, и принципиально возможных прочтений предложения в пределах заданной информации) достигает 72; в то же время из них лишь одно прочтение является оптимальным по своей информативности и естественности. «Чтобы сформулировать закон, на основании которого носитель языка безошибочно выбирает именно его, присмотримся внимательнее к значениям слов, дающим оптимальное осмысление предложения. Это значения кондитер 1, жарить 1, хворост 2, газовый 3 и плита 2; характерным для них является наличие ряда общих семантических элементов, а именно элемента «изготовлять» (‘тот, кто изготовляет’, ‘изготовлять пищу’, ‘изготовленное’, ‘для изготовления пищи’), элемента «нагревание» (‘нагреванием на / в масле’, ‘изготовленное кипячением’, ‘энергия сжигаемого газа’, ‘нагревательное устройство’), элемента «пища» (‘сласти’, ‘изготовлять пищу’, ‘кипячением в масле’). Выбор названных значений обеспечивает максимальную повторяемость семантических элементов в пределах предложения; легко убедиться, что при любом другом осмыслении предложения повторяемость семантических элементов будет менее высокой» (Апресян 1995:14). И далее: «Это и есть основной семантический закон, регулирующий правильное понимание текстов слушающим: выбирается такое осмысление данного предложения, при котором повторяемость семантических элементов достигает максимума (разрядка везде моя. — Е. Г.). Этот закон представляет собой строгую

формулировку старого принципа, в силу которого нужное значение многозначного слова «ясно из контекста»; иногда он называется правилом семантического согласования» (Там же).

В отличие от семантического согласования, механизм грамматического согласования, как известно, не носит универсального характера, но в тех языках, где такой способ связи слов присутствует, должная мера избыточности текста создается также и за счет грамматических повторов такого рода. Ш. Балли относил грамматическое согласование (типа мы любим) наряду с дублированием предлогами семантики управляющего глагола (типа направиться к, войти в, пройти через, вертеться вокруг) к явлениям обязательного грамматического плеоназма7 (Балли 1955: 169).

И. М. Берман в работе «Переработка грамматической информации при восприятии текста на уровне одиночного высказывания» называет три вида грамматических сигналов, «восприятие и переработка которых является необходимым условием преобразования графически зафиксированного предложения во фразу, передающую смысл высказывания» (Берман 1976: 97). Это 1) «формальные сигналы — признаки грамматической формы»; 2) строевые слова (предлоги, союзы, наречия, местоимения, модальные глаголы, частицы и т.п.); 3) относительное расположение слов и словосочетаний в предложении (Там же). Автор отмечает, что «в совокупности сигналы формы слова, строевые слова и синтаксические схемы (формулы строения словосочетаний и предложений) образуют грамматическую структуру предложения» (Берман 1976: 98). Названные три вида грамматических сигналов во многом выполняют по отношению друг к другу дублирующую функцию, создавая необходимую меру избыточности текста.

Л. В. Сахарный, доказывая текстовый характер текстов-примитивов (в частности, текста, представляющего собой набор ключевых слов), утверждает, что связность текста в минимальном виде реализуется уже в соположении элементов. Необходимость же в формальных релятивных показателях появляется прежде всего в связи с увеличением длины текста, ср.: «И лишь тогда, когда текст существенно увеличивается и большая расчлененность его (большое количество дискретных элементов) резко увеличивает неопределенность связей между ними, для снятия этой неопределенности неизбежно появление релятивных показателей как специальных средств связности» (Сахарный и др. 2006: 53). Как видим, основная функция релятивных показателей, по Л. В. Сахарному, заключается в снятии неопределенности связей. Мы бы сказали: в повышении надежности сигнала, в увеличении общей избыточности текста.8

7 Термины плеоназм и избыточность в данном случае синонимичны.

8 Любопытно, что в ситуациях усвоения языка (онтогенезе) или его распада (афазии) может избираться одно из дублирующих грамматических средств и подавляться другое.

3. Тип текста и мера избыточности

Авторы цитированной выше «Общей риторики» высказали предположение, что меру избыточности текста можно проверить путем лакуниза-ции текста по тем или иным принципам (лакунизация осуществляется за счет удаления из текста определенного количества информации) и последующего предъявления такого текста испытуемым с целью выяснения, насколько возможно извлечение исходного смысла из деформированного текста. Опираясь на выдвинутую гипотезу, мы провели широкомасштабное исследование (Грудева 2007; 2008) на материале текстов четырех типов: разговорный монологический; художественный (жанр — рассказ); газетный (аналитическая статья); научный (фрагмент из хрестоматии по психологии восприятия). Данные тексты были по-разному деформированы (удалялись темы высказывания; ядра рем; каждое шестое слово; словоизменительные морфемы), а затем последовательно каждый вариант деформированного текста предъявлялся большому числу испытуемых с просьбой восстановить пропущенное. Кроме того, каждый вариант деформации имел несколько модификаций, в частности связанных с сохранением / удалением знаков препинания и указанием / неуказанием на места пропусков. Степень избыточности текста рассматривалась как производная от его восстановимости при разных режимах деформации.

В исследовании обращалось внимание на зависимость между типом текста и степенью его избыточности, а также на вклад различных элементов текста в его общую избыточность. Прежде всего следует отметить, что разные типы текстов отличались друг от друга семантической и синтаксической структурой, и поэтому деформирование их по тому или иному принципу приводило к потерям, которые по-разному сказывались на понимании. По-видимому, можно сказать, что соотношение типов избыточности9 в текстах — величина переменная.

Из четырех типов текстов наименьшей степенью избыточности характеризуется разговорный текст. Естественной средой бытования разговорных текстов является устная коммуникация. Адекватное восприятие информации в данном случае в немалой степени обеспечивается совокупностью экстралингвистических факторов и просодических характеристик речи. Что же касается избыточности собственно текста

Так, по данным М. Д. Воейковой, «маленькие дети предпочитают пропускать предлога и сохранять падежные окончания», а в ситуациях смешанной афазии «наблюдается обратная картина — во всех падежах, обозначающих место и направление, наблюдается сохранение предлогов и пропуск окончаний» (Воейкова 2007:177).

9 В данном случае речь идет о таких традиционно выделяемых типах избыточности, как фонетическая и графическая избыточность; синтаксическая и грамматическая избыточность; семантическая избыточность; конвенциональная избыточность.

(в отрыве от экстралингвистических параметров и параметров, характерных для его устной реализации), то она невелика.

В этом отношении три других текста (газетный, художественный и научный) противопоставлены тексту разговорному: в письменных текстах средства создания избыточности сосредоточены прежде всего в самих текстах. Кроме того, грамматическая избыточность заведомо выше в письменных текстах,10 т.к. в разговорной речи смысловая организация высказывания явно превалирует над формально-грамматическим построением.

С точки зрения лексической избыточности, научный и разговорный тексты занимают верхние позиции (степень избыточности более 55%), в то время как газетный и художественный относятся к числу текстов, в которых степень избыточности такого рода составила менее 50% (44% и 48% соответственно). Картина представляется вполне правдоподобной: в силу того что научный текст стремится к однозначности (научное знание должно быть выражено максимально точно), степень его лексической избыточности достигает максимально возможной величины. Общая избыточность разговорного текста, как уже отмечалось, по сравнению с письменными текстами невелика, однако степень лексической избыточности в разговорном тексте предельно высока. Так, из четырех проанализированных текстов одинакового объема только в разговорном тексте одна и та же лексема может повторяться более 10 раз. Газетный и художественный тексты, с этой точки зрения, можно отнести к разряду стандартных, немаркированных текстов: в них сбалансированы средства выражения разных типов избыточности, и поэтому степень лексической избыточности не выходит за пределы 50-процентной отметки.

4. Избыточность текста и осмысленность его восприятия

При изучении проблемы избыточности текста важно помнить о том, что механизм избыточности работает только в условиях осмысленного приема сообщения, ср.: «Хотя избыточность текста как таковая существует объективно и независимо от субъекта, воспринимающего данный текст, но реальное использование этой избыточности может иметь место только тогда, когда существует субъект, владеющий данным языком и в силу этого имеющий возможность использовать избыточность для прогноза» (Прогноз 1974: 7—8).

10 Ср. об этом у Ж. Дюбуа с соавторами: «Избыточность такого типа (синтаксическая и грамматическая. — Е. Г.) особенно высока в письменной речи. Она проявляется, в частности , в повторяющихся маркерах — грамматических показателях (согласование по роду, числу, согласование глагольных форм и т.д.)» (Дюбуа и др. 1986:76).

Данное положение в полной мере подтвердилось в небольшом эксперименте, в ходе которого изучалась роль начала и конца словоформы в процессе ее опознания.11

В экспериментальных целях из небольшого фрагмента газетного текста были изъяты все указатели межсловных и межсинтагменных границ (удалены знаки препинания, пробелы между словами; прописные буквы, маркирующие начало высказывания, были заменены строчными). Далее текст был деформирован трояко: в Эксперименте 1 (Э1) удалялся первый (открытый) слог фонетического слова; в Эксперименте 2 (Э2) удалялся конечный гласный плюс (в случае наличия) правое консонантное завершение фонетического слова; в Эксперименте 3 (ЭЗ) удалялось и то, и другое, т.е. первый (открытый) слог и последний гласный (с последующим согласным) фонетического слова.12

Место пропущенных букв заполнялось прочерками. Таким образом, информация о месте пропуска и о числе пропущенных графических знаков сохранялась. Примером результата деформации может послужить начало фрагмента экспериментального текста: Про Петра Третьего, мужа Екатерины Второй, в учебниках истории написано как о слабоумном человеке, преклонявшемся перед прусскими порядками. Получается, что его убийство и <...>. После описанных выше операций этот фрагмент приобрел следующий вид:

в Э1:_____Петра______тъего____жа катерины_______рой___чебниках

стории____писано___кослабоумном_ ловеке______клонявшемся___редпрус-

скими рядками_ лучается__________го бийство <... >;

в Э2: проПетр Третъег муж Екатерин Втор_______вучебник _истори

написан_ какослабоумн___человек преклонявшемс передпрусским поряд-

кам_получаетс_чт_ ег_убийств <...>;

в ЭЗ:_____Петр_______тъег_____ж____катерин______р_______чебник__

стори_____писан______кослабоумн_______ловек________клонявшемс______

редпрусским_ рядкам_ _ лучаетс___________г бийств <...>.

Модифицированные таким образом тексты предъявлялись испытуемым.13 Инструкция выглядела следующим образом: «Не забегая вперед и

11В подготовке и организации эксперимента принимала участие зав. лабораторией моделирования речевой деятельности Санкт-Петербургского государственного университета Е. В. Ягунова.

12 При постановке данного эксперимента мы исходили из того, что при изучении восприятия письменных текстов можно рассматривать знаки препинания не только и не столько сами по себе, сколько как аналоги паузальных, просодических и иных фонетико-фонологических средств, выполняющих те же функции в звучащей речи.

13 Испытуемыми выступили студенты филологического факультета СПбГУ: в Э1 —

13 человек; в Э2 — 12 человек; в ЭЗ — 11 человек.

не возвращаясь назад для исправлений, заполните указанные пропуски и разбейте написанный “сплошной лентой” текст на слова».

В целом восстановление опущенной информации протекало вполне успешно. Как и предполагалось, результаты восстановления зависят от типа модификации текста (см. табл. 1).

Таблица 1

Результаты точного восстановления опущенных элементов фонетического слова (в %)

Эксперимент 1 Эксперимент 2 Эксперимент 3

80% 94% 27%

Как видим, лучше всего (94%) восстанавливается (а следовательно, и воспринимается) текст, в котором «закрыта» информация об ауслауте словоформы (Э2). Объяснения могут быть следующими. Во-первых, удаление ауслаута в том виде, как это было представлено выше, дает минимальное число удаленных графем: из 66 фонетических слов в 59% случаев (39 фонетических слов) опущена только одна буква — конечный гласный; в 36% случаев (24 фонетических слова) опущено две буквы — сочетание ГС; в 3% случаев (2 фонетических слова) удалено трехбуквенное сочетание (ГСС) и лишь в 2% случаев (1 фонетическое слово) удалено четырехбуквенное сочетание (ГССС). С этой точки зрения, объяснение носит количественный характер: чем меньше информации (измеряемой в данном случае числом букв) удалено из текста, тем лучше он достраивается до целого. (Ср. результаты восстановления в ЭЗ: увеличение числа удаленных пуки снижает вероятность опознания словоформ.)

С другой стороны, можно попытаться объяснить результаты с функциональных позиций. Начало слова по сравнению с концом (в русском языке) информационно более нагружено: именно по началу прежде всего опознается лексема или, по крайней мере, ее принадлежность к определенному классу однокоренных слов, тогда как в конце слова содержится информация грамматического свойства, устанавливающая связи слов в рамках высказывания. В большинстве случаев ауслаут словоформы в том виде, как он был определен выше, соответствовал флективным элементам: либо полностью совпадал с флексией (в основном в словоформах существительных, а также в ряде адъективных словоформ, см.: человек(е), убийств(о), Екатерин(ы), перв(ым), котор(ый), т(от) и под.), либо соответствовал лишь финальной части флексии — в тех случаях, где флексия не односложна (типа передпрусским(и), третъег(о), чудовищног(о) и под.; сюда же примыкают случаи с возвратными глаголами типа преклонявшемся)).

Представляется, что в случаях, когда удаляется лишь финальная часть флексии (а не вся флексия целиком), вся необходимая информация — не только лексемного свойства, но и морфологического — сохраняется. Поэтому и результаты восстановления стабильно высокие: третъег(о) (100%), преклонявшемся) (100%), передпрусским(и) (100%), порядкам(и) (100%), получаетс(я) (100%), ег(о) (100%), невыпячиваетс(я) (100%),разумеется) (100%), чудовищног(о) (100%).

Что касается удаления ауслаута при полном его совпадении с флексией, то в этом случае испытуемым необходимо было произвести выбор морфологических средств из числа подходящих, т.е. вероятность адекватного восстановления уже не равна единице. Но и при таких условиях в тексте имеются точки опоры, позволяющие реконструировать словоформу. Поскольку фонетическое слово трактовалось традиционно, в том числе как включающее в свой состав предложные клитики, то предсказать именную флексию по предлогу можно было достаточно легко; ср. приводившееся выше начало экспериментального текста, где открывающий высказывание изъяснительный предлог про, управляющий винительным падежом, определяет однозначный выбор флексии на участке пяти фонетических слов: проПетрА третьего мужА ЕкатеринЫвторОЙ.

В незначительном числе случаев ауслаут словоформы соответствовал не флективным элементам, а корневым или суффиксальным, что в принципе должно было бы усложнить процедуру опознания, особенно если (фонетическое) слово односложно.

Любопытно, что стопроцентно восстанавливается словоформа фАКТ в контексте почему-т(о) не выпячиваетс(я) т(от) ф(акт) <...>. По-видимому, сказывается незначительный объем класса слов с начальным Ф в русском языке; кроме того, опознанию лексемы способствует идио-матичность всего сочетания.

Восстановление имени собственного П(етр) также осуществлено в 100% случаев. Конечно, это связано с тем, что принадлежность лексемы к классу имен собственных маркирована написанием, а тема «Петр Третий» была введена в тексте ранее.

Недоступность информации об анлауте словоформы (Э1) в большей мере сказывается на адекватности восприятия текста. Если в Э2 варианты восстановления были связаны в основном с интерпретацией значения грамматической формы, что существенно не изменяет исходный смысл текста, то в Э1 любая другая (по сравнению с исходной) интерпретация начала слова приводит, как правило, к смене лексемы, и смысл исходного текста существенно искажается, ср.: (про)Петра — СЫН Петра, ДЛЯ Петра; (му)жа Екатерины — ПАжа Екатерины; (чу)тьли(не)счастье — ЕСть лиШЬ счастье; (до)носителъство — ПОносительство; (ро)ли — ВОли; (ви)дна — ДО дна.

В анлауте фонетического слова часто содержится информация, важная для семантической интерпретации всего высказывания в целом (например, показатель отрицания типа (не)выпячивается).

Идентификация (фонетического) слова обнаруживает существенную зависимость от его длины: опознание словоформы в условиях недоступности информации о ее анлауте становится стабильно высоким (80—90%), начиная со слов, длина которых равна 3 слогам или более.

Наконец, вполне закономерны результаты Э 3, где удалялся и а н л а -ут, и ауслаут фонетического слова. Заметим, что при таких условиях полностью исчезала информация об односложных словах14 (а это 11% от всех фонетических слов текста), а также оставался минимум информации (один или два согласных) от двусложных слов (Ж — (му)ж(а), Р — (Вто)р(ой), Г — (е)г(о), Т — (Тре)т(ий) и т.п.). Несмотря на столь «жесткие» условия, словоформы восстанавливаются. Особо трудный участок представляла последовательность четырех (полностью опущенных) односложных словоформ в чуть более прозрачном окружении, см.: (При) эт(ом)(по)чемут(о)(не)выпячиваетс(я)(тот)(факт)(что)(Петр)(Тре) т(ий)(был)(пе)рв(ым)(ро)ссийск(им)(пра)вителе(ем) <...>. Тем не менее, один испытуемый успешно декодировал первую половину текста, включая и этот фрагмент. Другой испытуемый был близок к исходному варианту, по крайней мере, восстановил сочетание Петр Третий и установил лексемную принадлежность участка РВ, см.: При этом почему-то не выпячивается то что и царь Петр Третий как пеРВом <...>. Этот испытуемый также успешно справился с первой половиной текста.

Другую группу составили испытуемые, которые не смогли полностью идентифицировать начало текста. Результатом их «восстановительной деятельности» является набор не связанных между собой (за редким исключением) словоформ. Как правило, это многосложные словоформы, т.е. такие, в которых при исключении анлаута и ауслаута достаточно графической информации для опознания лексемы. О том, что стратегия в данном случае заключалась в опознании лексемной принадлежности, свидетельствуют факты незаполнения конца слова при очевидной лексемной идентификации (см.: (Е)катерин(ы) — екатерин; (о)фициальн(о) — официальн; (ро)ссийск(им) — российск; (и)стори(и) — истори и т.п.).

Результаты рассмотренного эксперимента позволяют заключить, что при условии осмысленности сообщения, презумпции его связности текст, даже «разрушенный до основания», может быть адекватно реконструирован по минимальным опорам. При отсутствии общей осмысленности механизмы прогнозирования не работают, не спасает избы-

14 «Полностью» в том смысле, что ни одна буква слова не была представлена; при этом (напомним) числу пропущенных букв соответствовало число прочерков.

точность, и информация о месте расположения исключенных графических знаков не может быть полезной.

Такие результаты во многом оказались созвучны выводам, сделанным И. А. Зимней, которая применяла методику «посимвольного отгадывания» пропущенных слов в высказывании, предложенную К. Шенноном, и пришла к выводу, что «правило К. Шеннона — предсказание улучшается “по мере того, как возрастает знание предыдущего” (,Shannon 1951: 55), — соблюдается только при наличии смысловой гипотезы15» (Зимняя 2001: 230).

5. Заключение

Подводя итоги, следует сказать, что средства создания избыточности носят идиоэтнический характер. Прежде всего это относится к избыточности языка как кода. Так, в числе специфических средств создания избыточности русского языка находятся развитая флективная морфология (по-разному соотносящаяся с механизмами согласования и управления) и морфонологические чередования. В то же время есть основания утверждать, что средства создания избыточности текста также не носят универсального характера. Языки могут отличаться друг от друга не только тем, что они с большей легкостью опускают (правила эллипсиса), но и тем, что они с большей легкостью повторяют (правила избыточности).

Разные типы текстов обладают разной степенью избыточности. В зависимости от типа текста его общая избыточность может складываться за счет разных составляющих. Так, любой письменный текст противопоставлен разговорному: в письменных текстах средства создания избыточности сосредоточены прежде всего в самих текстах (а не в характеристиках контекста, включая контекст невербальный). Грамматическая избыточность заведомо выше в письменных текстах. В то же время уровень лексической избыточности в разговорных текстах может быть выше, чем в более стандартных (например, газетных) текстах.

Избыточность текста так же, как механизмы вероятностного (контекстного) прогнозирования, работает в полной мере только при условии осмысленности сообщения, презумпции его связности.

15 Напомним, что И. А. Зимняя выдвинула гипотезу о двухуровневом прогнозировании, выделяя уровень смысловых гипотез и уровень вербальных гипотез. Исходным явилось положение о том, что «если в процессе восприятия речи нет смысловой гипотезы, то реализация вербальной гипотезы идет методом планомерного (поалфавитного) перебора всех возможных символов или случайных проб и ошибок, что приводит к одному результату — большому количеству попыток» (Там же).

Литература

Апресян Ю. Д. Об одном правиле сложения лексических значений // Проблемы структурной лингвистики. 1971. М., 1972.

Апресян Ю. Д. Избранные труды. Т.1: Лексическая семантика: синонимические средства языка. М., 1995.

Балли Ш. Общая лингвистика и вопросы французского языка. М., 1955.

Басс И. И. Проблемы современного японского языкознания: Лингвистика текста. СПб., 2004.

Берман И. М. Переработка грамматической информации при восприятии текста на уровне одиночного высказывания // Смысловое восприятие речевого сообщения (в условиях массовой коммуникации) / Отв.ред. Т. М. Дридзе, А. А. Леонтьев. М., 1976.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Воейкова М. Д. Проявления языковой избыточности в области русских падежных противопоставлений (на материале спонтанной речи взрослых и детей с привлечением данных речевой патологии) // III Международный конгресс исследователей русского языка «Русский язык: исторические судьбы и современность» (МГУ им. М. В. Ломоносова, филологический факультет, 20— 23 марта 2007 г.). М., 2007. (http://www.philol.msu.ni/~rlc2007/pdf/6.pdf.)

Гак В. Г. К проблеме семантической синтагматики // Проблемы структурной лингвистики. 1971. М., 1972.

Глисон Г. Введение в дескриптивную лингвистику. М., 1959.

Гринберг Дж., Осгуд Дженкинс Дж. Меморандум о языковых универсалиях //

Новое в лингвистике. М., 1970. Вып.5.

Грудева Е. В. Избыточность и эллипсис в русском письменном тексте. Череповец, 2007.

Грудева Е. В. Избыточность текста, редукция и эллипсис (на материале русского языка). Дисс.... докт. филол. наук. СПб., 2008.

Даниэль М. А., Плунгян В. А. Обязательность и контекстная вытеснимость (к описанию грамматической периферии) // Известия РАН. Серия ЛиЯ. 1996. Т.55. Вып. 1.

ДюбуаЖ., Эделин Ф., Клинкенберг Ж.-М. идр. Общая риторика. М., 1986.

Жинкин Н. И. О кодовых переходах во внутренней речи // Вопросы языкознания. 1964. №6.

Звегинцев В. А. Теоретическая и прикладная лингвистика. М., 1967.

Зимняя И. А. Лингвопсихология речевой деятельности. М.; Воронеж, 2001.

КасевичВ. Б. Морфонология. Л., 1986.

Касевич В. Б. Труды по языкознанию. Т.1. СПб., 2006.

КронгаузМ. А. Семантика. М., 2001.

Колобаев В. К. Факторы, влияющие на восприятие и понимание иноязычного текста //Понимание и интерпретация текста: Сб. науч. трудов. Тверь, 1994.

Мартине А. Принцип экономии в фонетических изменениях. М., 1960.

Мечковская Н. Б. Общее языкознание: Структурная и социальная типология языков. М., 2001; 5-еизд. М., 2007.

Пауль Г. Принципы истории языка. М., 1960.

Плунгян В. А. Общая морфология. М., 2000.

Прогноз в речевой деятельности. М., 1974.

Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // ...Слово отзовется: памяти А. С. Штерн и JI. В. Сахарного. Пермь, 2006.

Солсо Р. П. Когнитивная психология. М., 1996.

Сусов И. П. Введение в языкознание. М., 2007.

Ульдалль X. И. Основы глоссематики //Новое в лингвистике. М., 1960. Вып.1. Шеннон К. Теория связи в секретных системах // Шеннон К. Работы по теории информации и кибернетике. М., 1963.

Якобсон Р. О. Лингвистика и теория связи // Звегинцев В. А. (отв. ред.). История языкознания XIX—XX веков в очерках и извлечениях. 4.II. М., 1965.

Jakobson R. Linguistics and Communication Theory // Structure of Language and its Mathematical Aspects. Providence, 1961.

La Linguistique. Guide alphabetique / Sous la direction d'Andre Martinet. Paris, 1969. Shannon С. E. Prediction and Entropy of Printed English // The Bell System Technical Journal. 1951.Vol.30. №1.

ZipfG. K. Human behavior and the principle of least effort. Cambridge, 1949.

Summary

The paper focuses on the links and interdependencies between linguistic redundancy and the speech economy principle. It addresses the history of both concepts’ treatment in linguistic literature and the mechanisms governing the redundancy level dynamics in Russian written texts. Redundancy levels are determined for specific text types and components. It appears that the linguistic factors of redundancy level dynamics are language-specific: languages differ in both the types of text components subject to omission (rules of ellipsis), and the types of text components subject to repetition (rules of redundancy). Only coherent and meaningful texts make it possible to identify the text redundancy levels of a language orthe (context-determined) forecasting mechanisms of its speakers.

i Надоели баннеры? Вы всегда можете отключить рекламу.