Вестник Челябинского государственного университета. 2009. № 30 (168).
Филология. Искусствоведение. Вып. 35. С. 143-147.
А. Н. Тиханович
ЛЕКСИЧЕСКАЯ ФУНКЦИЯ МАЄМ: ВЕРОЯТНОСТНЫЙ ПОДХОД
Статья посвящена изучению лексической функции Magn с точки зрения частотных характеристик. На примере лексической функции Magn предлагается методика проведения исследований по изучению распределения конкретных вероятностей средств выражения лексических функций. С обязательным использованием одновременно корпусного и экспериментального методов и словарных данных появляется возможность получить надежную информацию о реализации лексических функций в современном русском языке.
Ключевые слова: лексическая функция Magn, средства выражения, эксперимент, Национальный корпус русского языка, вероятность употребления.
Концепция лексических функций была разработана И. А. Мельчуком и А. К. Жолковским в рамках модели семантического синтеза «Смысл ^ Текст» в 1960-1970-е годы1. Лексической функцией (ЛФ) в современной лингвистике называется абстрактное значение, которое при разных словах выражается разными лексическими средствами. Лексическая функция Magn (лат. magnus «большой») соответствует значению интенсификации, высокой степени проявленности признака или «далеко зашедшей» ситуации.
Авторы модели «Смысл ^ Текст» никогда не отрицали возможности существования двух и более значений2 лексической функции от одного и того же аргумента. Так, например, в созданном ими «Толково-комбинаторном словаре современного русского языка»3 представлены следующие значения ЛФ Magn от аргумента дождь - как из ведра, проливной, сильный, обложной, затяжной и другие; от аргумента бояться - ужасно, жутко, до смерти, как огня, как чёрт ладана и другие; от аргумента дружный - необычайно, удивительно, на редкость, на удивление и другие.
Авторы словаря попытались объединить в словарных статьях для соответствующих лексем все найденные ими значения лексических функций, то есть в каждой словарной статье приводится, как правило, множество сочетаний, в которых фигурирует заглавное слово. Однако никаких сведений о частотности указанных значений функции, и соответственно, о предпочтительности или вероятности того или иного словоупотребления словарь не дает.
На современном этапе изучения лексических функций речь должна идти не только об описании и анализе всех возможных средств
их выражения, но и о вероятности употребления того или иного средства. В математической теории вероятностей «понятие вероятности события в самой своей основе связано с опытным, практическим понятием частоты события»4.
В нашем случае событием следует считать употребление определённого средства выражения ЛФ Magn с конкретным опорным словом. Оценить вероятность такого употребления представляется возможным статистически, опытным путём: через определение частоты этого события в специально проведённом эксперименте с носителями языка, а также в корпусе русского языка.
Поскольку средства выражения лексических функций определяются в терминах теории «Смысл ^ Текст», первичный языковой материал исследования должен гарантированно удовлетворять всем требованиям данной теории. Очевидно, что такой материал представлен в трудах её авторов - и в первую очередь, в толково-комбинаторном словаре. Нас в данном словаре интересовала зона лексических функций и, конкретно, средства выражения ЛФ Magn. Достаточная степень представленности этих средств в словаре, позволяющая провести дальнейшее сравнение с результатами эксперимента, была главным и фактически единственным критерием отбора лексики для его проведения.
Нами была выбрана следующая схема проведения исследования: 1) для достижения определённого уровня объективности отобранный из толково-комбинаторного словаря языковой материал, результат субъективной работы профессиональных лингвистов, сопоставлялся с субъективными данными обычных носителей языка, не имеющих филоло-
гического образования (для получения этих данных был проведён психолингвистический эксперимент); 2) затем словарные и экспериментальные данные проверялись на частотность по «максимально объективному» источнику - корпусу русского языка. Сравнение трёх видов источников (лексикографического, экспериментального и корпусного) позволяет, на наш взгляд, получить наиболее объективные результаты и наилучшим образом достичь цели исследования.
Чтобы облегчить испытуемым ход работы, отобранная из словаря лексика была сгруппирована по частеречной принадлежности. В первую группу вошли десять существительных: агрессия, борьба, ветер, выстрел, гнев, дождь, друг, дружба, кофе, надежда; во вторую - десять глаголов: бороться, бояться, допрашивать, надеяться, обещать, победить, помнить, понимать, промокнуть, рассматривать; в третью - десять прилагательных: агрессивный, безграмотный, безнадёжный, восхищённый, грамотный, дружный, надёжный, неграмотный, опытный, удивлённый.
Названные слова послужили языковым материалом для несложного психолингвистического эксперимента с заполнением анкет. Цель эксперимента заключалась в получении данных о существующих в языковом сознании носителей русского языка средствах выражения ЛФ Magn от заданных опорных слов, а также, благодаря массовости эксперимента, о частоте встречаемости того или иного средства усиления.
В эксперименте принимали участие 150 носителей русского языка. Испытуемыми были курсанты Череповецкого военного инженерного института радиоэлектроники в возрасте от 17 до 23 лет. Эксперимент проводился в группах из 10-15 человек. Время на выполнение задания никак не ограничивалось. Деление отобранного нами языкового материала на группы по частеречной принадлежности было отражено в трёх вариантах экспериментального бланка (анкеты). Каждый испытуемый получал один из вариантов с соответствующей инструкцией5. Таким образом, над каждым словом-стимулом работало 50 человек.
В ходе эксперимента с учётом повторяющихся ответов было получено 1538 усилительных словосочетаний на основе 30 опорных слов. Эти словосочетания образовали первый - экспериментальный - источник нашего исследования.
Вторым источником - лексикографиче-
ским - стали специальные словари, отражающие реализацию в русском языке ЛФ Magn. Это толково-комбинаторный словарь и словарь усилительных словосочетаний И. И. Убина6. К исследуемым опорным словам в этих словарях дано 384 разных средства усиления, 200 из которых совпали с данными эксперимента.
В совокупности по первым двум источникам - экспериментальному и лексикографическому - было выявлено 1722 усилительных словосочетания на основе 30 исследуемых опорных слов. Эти словосочетания послужили языковым материалом для проведения исследования в Национальном корпусе русского языка (НКРЯ)7. Поиск осуществлялся по основному корпусу со снятой и неснятой омонимией в двух направлениях: «прямом» (значение предшествует аргументу, например, близкий друг) и «обратном» (аргумент предшествует значению, например, друг близкий), то есть каждое из 1722 словосочетаний проверялось дважды.
Всего было просмотрено более 25 тысяч контекстов, из которых 21996 были признаны положительными, то есть реализующими ЛФ Magn именно в сочетании запрашиваемых слов. Обработка этих контекстов позволила получить данные о наличии в корпусе изучаемых выражений и о частоте их встречаемости, сформировав тем самым третий источник исследования - корпусный.
Таким образом, были получены данные
о средствах выражения ЛФ Magn на основе трёх источников: экспериментального, лексикографического и корпусного. Сравнение трёх источников показало, что данные каждого из них достаточно существенно отличаются не только по частотности, но и по наличию конкретных средств выражения ЛФ Magn. Стало очевидно, что наиболее достоверную информацию о вероятности реализации того или иного средства усиления можно получить только на основе сопоставления данных трёх источников.
Принадлежность полученных средств выражения ЛФ Magn к разным источникам наглядно изображена на рис. 1 .
Цифрами на рис. 1 обозначены следующие области средств выражения ЛФ Magn:
1. Средства выражения, представленные во всех трёх источниках.
2. Словарные средства выражения, представленные в эксперименте.
Рисунок 1. Области совпадения данных словарей, эксперимента и корпуса.
3. Словарные средства выражения, представленные в корпусе.
4. Экспериментальные средства выражения, представленные в корпусе.
На наш взгляд, представленные во всех трёх (весьма различных и независимых) источниках средства выражения ЛФ Magn будут наиболее устойчивыми и надёжно реализующимися в языке, наиболее узуальными. Представленные в двух источниках средства выражения также можно считать устойчивыми, надёжными, узуальными, хотя и не в такой степени, как первые. Средства выражения, встретившиеся только в словаре, в эксперименте или корпусе, то есть не верифицированные в каком-либо другом источнике, безусловно, имеют право на существование и могут быть использованы в речи, однако вряд ли характеризуются широкой употребительностью.
Отношения между полученными областями средств выражения ЛФ Magn подталкивают к аналогии с понятием поля и связанными с ним понятиями ядра, центра и периферии. Незначительная трансформация рис. 1 позволяет наглядно отобразить получившиеся отношения (см. рис. 2).
Необходимым условием определения вероятности употребления конкретного средства выражения ЛФ Magn мы посчитали наличие его хотя бы в двух источниках. Из 1722 исследовавшихся словосочетаний этому условию удовлетворяли 511 словосочетаний, т. е. около 30 %.
На основе данных о частоте встречаемости в каждом из источников и положений математической теории вероятностей8 была определена общая (суммарная) вероятность употре-
бления средств выражения ЛФ Magn в трёх источниках, что на наш взгляд, максимально близко отражает реальную вероятность употребления того или иного средства усиления в языке.
Общая (суммарная) вероятность Р^ употребления каждого средства выражения ЛФ Magn вычисляется по формуле:
Р2 = С + Э + К - СЭ - СК - КЭ + СЭК, где
С - частота встречаемости данного средства в словарях,
Э - частота встречаемости данного средства в эксперименте,
К - частота встречаемости данного средства в корпусе,
СЭ - произведение частот словаря и эксперимента,
СК - произведение частот словаря и корпуса,
КЭ - произведение частот эксперимента и корпуса,
СЭК - произведение частот словаря, эксперимента и корпуса.
Частота встречаемости Р данного средства А в каждом источнике вычисляется по общей формуле: м
Р(А) = м , п
где для словарей МА равно числу употреблений данного средства в словарях; для эксперимента - числу употреблений данного средства в эксперименте; для корпуса - числу употреблений данного средства в корпусе; п - общее число средств выражения для дан-
Рисунок 2. Распределение вероятности употребления средств выражения ЛФ Magn по их представленности в различных источниках (в виде модели поля).
ного опорного слова в соответствующем источнике.
Приведём пример подсчёта общей вероятности употребления для средства усиления сильный от опорного слова ветер.
Применительно к проведённому нами эксперименту частота (статистическая вероятность) употребления конкретного средства выражения ЛФ Magn будет равна отношению числа испытуемых, давших такой ответ на данное опорное слово, к общему числу ответов на это опорное слово, включая повторяющиеся. Например, на слово ветер 26 испытуемых дали ответ сильный. Всего на это слово было зафиксировано 153 ответа, реализующих ЛФ Magn. Таким образом, вероятность употребления слова сильный в сочетании со словом ветер по данным эксперимента составила 26 : 153 = 0,17.
Применительно к корпусному исследованию статистическая вероятность вычислялась следующим образом. За число опытов п была принята сумма полученных в корпусе положительных контекстов всех средств выражения ЛФ Magn на данное опорное слово; числом наступивших событий МА считалось количество положительных контекстов у данного средства выражения. Например, сумма контекстов всех усилителей к слову ветер по данным корпуса составила 951, из них слово сильный получило 296 контекстов. В результате, вероятность употребления слова сильный со словом ветер по данным корпуса оказалась равна 296 : 951 = 0,31.
Применительно к лексикографическим источникам статистическая вероятность основывается на данных всего двух словарей9. Соответственно, число опытов п будет равно общему количеству средств усиления конкретного опорного слова, приведённому в этих двух словарях, возможным событием А следует считать наличие слова хотя бы в одном из них, и число наступивших событий МА может принимать значения лишь 0 (нет ни в одном словаре), 1 (слово зафиксировано в одном словаре) и 2 (слово зафиксировано в двух словарях). Например, на слово ветер в двух словарях приведено в общей сложности 38 средств усиления. Слово сильный зафиксировано в обоих словарях. Таким образом, вероятность употребления слова сильный со словом ветер по данным словарей составила 2 : 38 = 0,05.
Вычислим общую (суммарную) вероятность для средства выражения ЛФ Magn
сильный от опорного слова ветер. Значения вероятности для данного средства выражения по каждому из источников уже вычислялись выше и составили соответственно: для словарей Р(С) = 0,05; для эксперимента Р(Э) = 0,17; для корпуса Р(К) = 0,31. Подставим эти данные в формулу:
Р2 =0,05+0,17+0,31-0,05-0,17-0,05-0,31-
0,17-0,31+0,05-0,17-0,31=
= 0,53-0,0085-0,0155-0,0527+0,002635=0,455935
Итак, вероятность употребления слова сильный для усиления слова ветер составляет примерно 0,46. Другими словами, в среднем в 46 случаях из 100 носитель языка предпочтёт слово сильный всем другим возможным способам передачи значения «очень» для слова ветер. Учитывая большое разнообразие в русском языке лексических средств интенсификации, такая вероятность является весьма высокой.
Для примера приведём здесь лидирующие по показателю вероятности средства выражения ЛФ Magn для опорного слова ветер: ветер - сильный (0,462572); ураганный (0,24095); свежий (0,18229); порывистый (0,143005); штормовой (0,13580); резкий (0,10376).
Таким образом, нами была предпринята попытка комплексной квантитативной оценки частотности средств выражения ЛФ Magn с обязательным использованием одновременно корпусного и экспериментального методов и словарных данных. Эта оценка отражает вероятность употребления конкретных значений функции, что должно учитываться при описании языковых средств в терминах концепции лексических функций. Только с помощью такого подхода, на наш взгляд, появляется возможность получить надежные данные о реализации лексических функций в современном русском языке.
Примечания
1 Подробнее о лексических функциях см.: Апресян, Ю. Д. Лексическая семантика : синонимические средства языка // Апресян, Ю. Д. Избранные труды. М. : Шк. «Языки рус. культуры», 1995. Т. 1.; Иорданская, Л. Н. Смысл и сочетаемость в словаре / Л. Н. Иорданская, И. А. Мельчук. М. : Языки славян. культур, 2007; Мельчук, И. А. Русский язык в модели «Смысл ^ Текст» // Wiener slawistischer А1ташск Sonderband 39. М. ; Вена, 1995.
2 Здесь и далее в соответствующих контекстах термин «значение» используется так, как это принято в рамках теории ЛФ, разработанной И. А. Мельчуком и А. К. Жолковским: значение ЛФ - это множество (более или менее) синонимичных между собой лексических единиц, поставленных в соответствие аргументу, или ключевому (опорному) слову.
3 Мельчук, И. А. Толково-комбинаторный словарь современного русского языка / И. А. Мельчук, А. К. Жолковский. Вена, 1984.
4 Вентцель, Е. С. Теория вероятностей : учеб. для студентов вузов. 9-е изд., стер. М. : Издат. центр «Академия», 2003. С. 17.
5 Инструкция для испытуемых была следующей: «В русском языке значение, которое чаще всего выражается словом “очень”, в разных словосочетаниях может передаваться также и другими словами и словосочетаниями примерно того же значения. Выбор этих слов (словосочетаний) определяется опорным словом. Например, оскорбить (опорное слово) -глубоко оскорбить, мчаться (опорное слово) - стремительно мчаться. При одном и том же опорном слове значение типа “очень” может выражаться разными средствами (например, мчаться (опорное слово) - мчаться стремительно, быстро, во весь дух). Приведите по 5 слов со значением “очень” для каждого из представленных ниже опорных слов». Приведенная инструкция сопровождала анкеты с глаголами. Текст инструкции варьиро-
вался в области примеров в зависимости от частеречной принадлежности опорных слов. Для анкет с существительными и прилагательными в инструкции приводились примеры с опорными словами соответствующих частей речи.
6 Убин, И. И. Словарь усилительных словосочетаний русского и английского языков. М., 1995.
7 Национальный корпус русского языка -электронное собрание текстов на русском языке, насчитывает более 140 млн. словоупотреблений, создается в Москве (http://www. ruscorpora.ru).
8 Подробнее о математической теории вероятностей см.: Вентцель, Е. С. Теория вероятностей и её инженерные приложения : учеб. пособие для студентов вузов / Е. С. Вентцель, Л. А. Овчаров. 3-е изд., перераб. и доп. М. : Издат. центр «Академия», 2003.
9 Строго говоря, для вычисления вероятности, изначально предполагающей массовость возможных событий, недостаточно использовать данные только двух словарей. Однако большего количества словарей, отражающих интересующее нас явление, в настоящее время просто нет. Кроме того, будем считать, что недостаточное количество словарей компенсируется высоким уровнем языковой интуиции и авторитетом их авторов, что и не позволяет нам исключить словари из рассмотрения.