с.и. горохова УДк 81'23
использование вероятностно-статистической информации о грамматических формах слов
при порождении речи: корпусное исследование речевых ошибок1
Сопоставление данных речевых ошибок русской речи и данных Национального корпуса русского языка позволяет предположить, что во внутреннем лексиконе хранится вероятностно-статистическая информация о частоте использования словоформ и что высокочастотные грамматические формы слов имеют приоритет при порождении высказывания.
Ключевые слова: речевые ошибки, грамматическая форма слова, частота словоформы, искомая словоформа, заменяющая словоформа.
svetlana I. Gorokhova
the use of probabilistic information about inflected word forms in sentence production: a corpus study of speech errors
A comparison of Russian speech error evidence with the Russian National Corpus data suggests that probabilistic information about the frequency of inflected word forms is available in the speaker's production lexicon, and higher-frequency inflected forms are more likely to be selected during language production.
Keywords: speech errors, inflected word form, word form frequency, target word form, error word form.
введение
Роль эффекта частоты при порождении и восприятии речи уже давно является предметом довольно оживленного обсуждения. Два противоположных подхода к грамматическому компоненту языковой способности - «порождающие грамматики» и разрабатываемые в последнее время так называемые «пользовательские грамматики» - отводят вероятностно-статистической информации на этой стадии порождения/восприятия речи совершенно разную роль.
Пользовательские ("usage-based") грамматики основаны на предположении, что всякий раз при использовании определенной формы слова или грамматической конструкции во внутреннем лексиконе активируется соответствующий «узел» или группа «узлов» и частота активации словоформы или грамматической конструкции оказывает влияние на способ ее хранения в лексиконе [см. Croft & Cruse 2004].
С другой стороны, сторонники генеративных грамматик признают, что особенности порождения нерегулярных форм слов (например, форм прошедшего вре-
1 Работа выполнена при поддержке гранта РФФИ № 13-06-00353 вопросы психолингвистики
мени неправильных глаголов) и способ их хранения в лексиконе зависят от частоты их использования в речи, но при этом предполагают, что при образовании регулярных форм слов (например, форм прошедшего времени правильных глаголов) информация о частоте их использования неактуальна для механизма речепорож-дения. Согласно этой точке зрения, получившей название «теории двойственного процессинга», регулярные формы слов каждый раз порождаются заново с помощью определенных грамматических правил, а низкочастотные нерегулярные формы хранятся целиком [Caramazza et al. 1985; Pinker & Prince 1988, 1994; Pinker 1991, 1997; Clahsen et al. 1992; Prasada & Pinker 1993; Marcus et al. 1995; Ullman 1999]. Многие приверженцы этой теории - авторы авторитетных экспериментальных исследований порождения речи - утверждают, что можно говорить лишь о выборе лексических единиц, но никак не о выборе грамматических форм слов, поскольку грамматические характеристики приписываются лексическим единицам автоматически. Таким образом, роль вероятностно-статистических характеристик грамматической формы слова в речепроизводстве изначально отвергается [см., например, Caramazza et al. 2001; Costa et al. 2003; Schiller and Caramazza 2002, 2003; Bordag and Pechmann 2008].
Сторонники «пользовательских» моделей подвергли «модели двойственного процессинга» критике, утверждая, что, наряду с низкочастотными нерегулярными формами, во внутреннем лексиконе полностью хранятся и многие высокочастотные формы слов [Dabrowska 2008]. Было показано, что «эффект частоты использования» регулярных форм слова наблюдается при восприятии речи на английском [Sereno & Jongman 1997; New et al. 2004], финском [Lehtonen & Laine 2003], французском [New et al. 2004] и голландском [Baayen et al. 1997; Baayen et al. 2002 -исследования восприятия речи; Tabak et al. 2005; Bien et al. 2005 - исследования порождения речи] языках. Сходные результаты получены при исследовании речи больных с аномией [Bi et al. 2007]. Эти экспериментальные исследования свидетельствуют в пользу гипотезы о хранении в лексиконе высокочастотных форм слов как самостоятельных единиц [Stemberger & McWhinney 1986].
Важность частоты использования грамматических конструкций как детерминанты лингвистической структуры и языкового употребления признается всеми «пользовательскими» моделями грамматики [Croft & Cruse 2004; Bybee 2006; Diessel 2007]. Высказываются предположения о том, что информация о частоте использования различных грамматических структур является частью языковой способности [Demuth 2007]. По-видимому, можно говорить как о частоте словоформы (т.н. «частоте экземпляра» - token frequency), которая является одним из показателей устойчивости представления этой словоформы во внутреннем лексиконе, так и о частоте данного грамматического явления (т.н. «частоте типа» - type frequency - например, о частоте регулярного/нерегулярного образования формы прошедшего времени глаголов), свидетельствующей о «потенциале» данной когнитивной схемы [см. Bybee 2006].
Х. Диссель [Diessel 2007: 124] считает информацию о частоте использования лингвистических структур движущей силой нескольких психологических механизмов, действующих при порождении и восприятии речи. Однако, как отмечал Д. Джурафски [Jurafsky 2003: 84], хотя большинство вероятностных моделей языково-
го употребления и признают роль показателя частоты использования синтаксической структуры как при порождении, так и при восприятии речи, до сих пор существует очень мало исследований, подтверждающих психологическую реальность этого параметра, особенно в процессе порождении речи.
Экспериментальные работы в обсуждаемой области, проводившиеся в последние годы, относились в основном к использованию вероятностно-статистической информации о грамматических формах слов при восприятии речи. Например, результаты исследования восприятия падежных форм существительных на материале сербского языка [Kostic & Mirkovic 2002] свидетельствуют о том, что средняя частота использования данной падежной формы влияет на ее восприятие. Получены также данные о том, что частотное распределение вариантов падежных окончаний внутри определенной грамматической парадигмы оказывает влияние на распознавание слов [Milin et al. 2007]; ср. исследование [Clahsen et al. 2001], в котором высказывается предположение о психологической реальности словоизменительных парадигм.
Данные, подтверждающие существование зависимости между распознаванием слова и частотными характеристиками его грамматических форм, получены и при изучении речи больных с моторным аграмматизмом [Stemberger 1984, 1985; Faroqi-Shah & Thompson 2004]; см., однако, противоположные результаты исследования речи больных с аграмматизмом: [Janssen & Penke 2002]. Кроме того, экспериментально показано, что (относительная) частота форм множественного числа существительных и глаголов оказывает влияние на скорость реакции при выполнении экспериментальных заданий [Baayen et al 2003], а это можно считать весомым аргументом в пользу теории независимого хранения во внутреннем лексиконе грамматических форм слов, в том числе образуемых регулярным способом.
Проведенные в последние годы корпусно-статистические исследования свидетельствуют о том, что вероятностно-статистическая информация об отдельных грамматических формах слова может храниться в лексической памяти человека [Baayen 2007; Smolka et al. 2007].
Недавние исследования закономерностей детской речи [Tomasello 2003; Lieven & Tomasello 2008] и усвоения иностранных языков [Ellis 2008] показывают, что частотные характеристики языковых конструкций влияют на их усвоение; особенно это касается развития синтаксиса детской речи [Demuth 2007].
Разумно предположить, что часто используемые конструкции более прочно закрепляются в долговременной памяти, что, в свою очередь, облегчает их активацию, распознавание и актуализацию при восприятии и порождении речи. Имея подтверждение того, что при порождении речи говорящий использует информацию о частотности той или иной структуры языка, мы получаем возможность преодолеть жесткое разграничение грамматики и языкового употребления и получить более полное представление о работе механизма поиска синтаксических характеристик слова. В этом смысле многообещающими кажутся «пользовательские» грамматические теории, предполагающие, что чем чаще говорящий сталкивается с определенной формой слова или грамматической конструкцией, тем глубже она «укореняется» в языковой системе, и что, таким образом, частота использования
словоформы или конструкции оказывает безусловное влияние на организацию и функционирование единиц лексикона и языковых конструкций [Evans & Green 2006; Schmid 2010; Bybee 2006 и др.].
Данные
В данной работе исследуется роль т.н. «эффекта частоты» в порождении поверхностно-синтаксической структуры высказывания. Для оценки того, используется ли вероятностно-статистическая информация при поиске грамматической формы слова, были использованы данные речевых ошибок (оговорок) русской речи. Преимущество речевых ошибок как объекта исследования заключается в том, что они раскрывают особенности работы речевых механизмов в «естественных условиях» и не ограничены жесткими условиями эксперимента.
В отличие от экспериментальных исследований механизма поиска грамматических признаков, посвященных изучению ограниченного набора грамматических категорий - в основном числа и рода [см., например, Schriefers 1993; Caramazza et al. 2001; Costa et al 2003; Schiller & Caramazza 2002, 2003; Bordag & Pechmann 2008], исследование речевых ошибок позволяет охватить гораздо большее число грамматических категорий и, таким образом, расширить наше представление о принципах хранения и поиска грамматических форм слова.
В данной работе исследуются 198 речевых ошибок (оговорок) устной русскоязычной речи, приводящих к неадекватной замене грамматических форм существительных, местоимений, глаголов и прилагательных. Анализу подвергались контекстно-свободные замены грамматического признака, т. е. замены, возникшие не под влиянием грамматической формы другого слова данного высказывания. Примеры включают замены падежа, числа, рода, лица, времени и вида.
Примеры контекстно-свободных замен грамматических признаков были отобраны из корпуса, включающего около 6000 речевых ошибок русской речи.
Чтобы отграничить понятие речевой ошибки от других сходных типов лингвистических явлений (ошибок, возникающих вследствие несовершенства лингвистических «знаний» говорящего; намеренных искажений нормы; проявлений функционально-стилистической вариативности разговорной речи и, наконец, от известного явления затрудненного поиска слова, т.н. "tip of the tongue"), в данном исследовании под речевой ошибкой понимается результат отклонения от речевой интенции говорящего, если это отклонение не становится актуально осознанным в процессе грамматико-семантической реализации речевого действия (об уровнях осознаваемости в спонтанной речи см. [Леонтьев 1970: 12]).
Материал исследования составили тексты спонтанной устной речи носителей русского литературного языка (с высшим или незаконченным высшим образованием), включающие ту или иную речевую ошибку. Тексты были зафиксированы в ситуациях непринужденного и полуофициального общения. Кроме того, в анализируемый корпус вошли тексты синхронных репортажей и тексты спонтанной речи участников «неподготовленных» радио- и телепередач типа «Что? Где? Когда?».
В анализируемый корпус текстов были включены тексты, репрезентирующие как систему разговорного языка, так и систему кодифицированного литературного языка [см. Земская и др. 1981: 5-6], поскольку, как было обнаружено, характер
рассматриваемых речевых ошибок (т.е. явлений, соответствующих данному выше определению речевой ошибки) не зависит от типа устной речи.
Методика сбора материала исследования состояла в систематической фиксации текстов устной речи на магнитные и цифровые носители информации и вычленении из этих записанных массивов отрезков текста с речевыми ошибками. В спорных случаях, особенно в тех, когда говорящий, допустив ошибку, не исправлял ее самостоятельно, ему задавались вопросы, уточняющие наличие/отсутствие и характер ошибки с точки зрения самого говорящего. Разумеется, подобная процедура не представляется возможной, если мы имеем дело с текстами теле- и радиопередач: в таких случаях спорные или вызывающие сомнения примеры не включались в анализируемый корпус.
примеры
Ниже приведены некоторые примеры контекстно-свободных замен различных грамматических признаков (до знака - фраза с искомым словом; после знака - заменяющее слово; искомое и заменяющее слова выделены заглавными буквами).
(1) Замена падежной формы: предл. ^ род.
Очень хорошо сэкономлю на ПРОЦЕНТАХ ^ ... на ПРОЦЕНТОВ
(2) Замена падежной формы: дат. ^ вин./род. (точную заменяющую падежную форму невозможно идентифицировать из-за омонимии форм вин. и род. падежей)
Ты ЕЙ позвонила? ^ Ты ЕЁ позвонила?
(3) Замена падежной формы: тв. ^ род.
Под нормой или ЗДОРОВЬЕМ понимают такую форму жизнедеятельности ^ ... ЗДОРОВЬЯ...
(4) Замена падежной формы: род. ^ им./вин.
- Я тут прочла в газете, что зефир...
- Без БЕЛКА? ^ Без БЕЛОК?
Помимо падежных форм существительных и личных местоимений, другие грамматические признаки лексических единиц также подвержены контекстно-свободным заменам, хотя примеры таких ошибок не столь многочисленны, как примеры замен падежных форм.
(5) Замена формы числа: мн. ^ ед.
У каждого брокера всегда есть на руках определенное количество акций. Вот можно взять у него взаймы ЭТИ АКЦИИ ... ^ ... ЭТУ АКЦИЮ ...
Пример (6) - интересный случай склонения существительного среднего рода и всех определяющих его слов по типу существительного женского рода:
(6) Замена формы рода: ср. ^ жен.
Я возьму вот ЭТО БЛЮДЦЕ: ОНО САМОЕ МАЛЕНЬКОЕ ^ Я возьму вот ЭТУ БЛЮДЦУ: ОНА САМАЯ МАЛЕНЬКАЯ
(7) Замена формы лица: 2 ^ 3
Послезавтра БУДЕШЬ отдохнувший ^ ... БУДЕТ ...
(8) Замена временной формы: буд. ^ прош.
Я думаю, я вынуждена БУДУ выслушать пламенную тираду ^ ...вынуждена БЫЛА выслушать...
Характерно, что формы прошедшего и настоящего времени доминируют в русской разговорной речи и в этом смысле противостоят формам будущего времени: частота использования форм прошедшего и настоящего времени составляет, соответственно, 45% и 45%, тогда как частота использования форм будущего времени - всего 10% [Санджи-Гаряева 2003].
Имеются, однако, и противоположные примеры, подобные примеру замены искомой формы прошедшего времени формой будущего времени:
(9) Замена временной формы: прош. ^ буд.
В начале восьмидесятых годов Уран ПРИШЕЛ на это место ^ ... ПРИДЁТ
(10) Замена видовой формы: свш. ^ нсвш. (искомая форма глагола совершенного вида заменяется супплетивной формой несовершенного вида)
Могла прекрасную путевку ВЗЯТЬ ^ ... БРАТЬ
В то же время, имеются и противоположные примеры замены искомой формы глагола несовершенного вида формой совершенного вида:
(11) Замена видовой формы: нсвш. ^ свш.
Мы помним, как нервничала Алена и ДОПУСКАЛА ошибки ^ ... ДОПУСТИЛА .
Следует отметить, что замены таких грамматических категорий, как время и вид искомого слова, иногда с трудом поддаются интерпретации из-за тесного взаимодействия признаков времени и вида; в результате заменяющая форма глагола может отличаться от искомой как по времени, так и по виду (ср. пример 12, где искомая форма совершенного вида будущего времени глагола удаваться заменяется формой несовершенного вида настоящего времени):
(12) Замена видо-временной формы буд. свш. ^ наст. нсвш.:
Может быть, все-таки ему УДАСТСЯ довести свою идею до конца ^ ... УДАЁТСЯ .
сравнение с данными национального корпуса русского языка
Примеры 1-12 позволяют предположить, что некоторые из форм, составляющих словоизменительную парадигму данного слова, с большей вероятностью могут быть выбраны говорящим при порождении речи.
Для проверки того, подвержены ли контекстно-свободные замены грамматических признаков влиянию частоты использования словоформ, для каждого из примеров было произведено сравнение частот встречаемости заменяющего и искомого слов в Национальном корпусе русского языка. Поскольку анализируемые речевые ошибки принадлежат устной речи, поиск проводился в подкорпусе устной речи. В некоторых случаях результаты поиска корректировались вручную для снятия грамматической омонимии.
За абсолютную частоту использования словоформы принималось общее число ее употреблений в подкорпусе устной речи Национального корпуса русского языка. Поскольку принято считать, что логарифмированные значения частоты более корректно, чем ее абсолютные значения, отражают различные аспекты речевой деятельности [О^еИ & Wingfield 1965; Vitevitch 1997], а также поскольку логарифмирование является стандартным способом приведения распределения к нормальному виду, при сравнении использовались логарифмированные значения частот.
Сравнение абсолютных частот искомого и заменяющего слов показывает, что в устной речи существует тенденция замены низкочастотных словоформ высокочастотными ( (197) = 2.35, р < .05) (рис. 1).
150 2.« 2.40
2.35
г эо
2.25 2.20 2.15 2.10
Искомая Заменяющая
словоформа словоформа
Рис. 1. Частоты (логарифмированные) искомой и заменяющей словоформ
104 из 198 проанализированных примеров, т.е. 52,5% от общего числа контекстно-свободных замен словоформ составляют примеры замен падежных форм существительных/личных местоимений. Это число оказалось достаточным для оценки статистической значимости различия между относительными частотами искомой и заменяющей падежных форм в пределах словоизменительной парадигмы данного слова. За относительную частоту использования словоформы в пределах словоизменительной парадигмы принималась доля употреблений данной падежной формы слова (в процентах) по отношению к общему числу употреблений данного слова во всех падежных формах в подкорпусе устной речи Национального корпуса русского языка.
В таблице 1 представлены выборочные результаты сравнения частот искомого и заменяющего слов для замен падежных форм существительных/личных местоимений. Таблица показывает абсолютные частоты падежных форм искомого и заменяющего слов (измеряемые числом словоупотреблений) и их относительные частоты внутри словоизменительной парадигмы (измеряемые в процентах по отношению к общему числу употреблений данного слова во всех падежных формах) по данным подкорпуса устной речи Национального корпуса русского языка. Данные, представленные в таблице, свидетельствуют о том, что, как правило, низкочастотная падежная форма существительного/местоимения заменяется формой, имеющей более высокую частоту. Эта тенденция прослеживается как в случае падежных форм, образованных регулярным способом (существительные), так и в случае нерегулярно образуемых падежных форм (местоимения). Сравнение относительных частот искомой и заменяющей падежных форм указывает на статистическую значимость этой тенденции для всех замен падежных форм ^ (103) = 3.39, р < .001) (рис. 2).
Рис. 2. Относительные частоты (логарифмированные) искомой и заменяющей падежных форм существительных и личных местоимений
Таблица 1. Частоты искомой и заменяющей словоформ в контекстно-
слово искомая форма Абсолютная частота относительная частота (%) Заменяющая форма Абсолютная частота относительная частота (%)
белок род. 7 41,2 им./вин. 9 52,9
точки род. 56 21,7 им./ вин. 161 62,4
он род. 20294 21,63 им. 48856 52,08
туристы дат. 9 5,7 вин./ род. 28 17,72
родственники дат. 122 11,11 вин./ род. 158 14,39
она дат. 3,241 7,93 вин./ род. 9396 22,98
мы дат. 9,506 12,21 вин./ род. 24419 31,36
они дат. 4,511 7,6 вин./ род. 11009 41,13
вы дат. 14833 16,27 вин./ род. 18305 20,08
папа дат. 105 4,2 род. 133 5,3
проекты дат. 8 3,61 предл. 15 6,78
этап тв. 9 1,51 им./ вин. 89 14,93
здоровье тв. 39 5,4 род. 181 25
холодильник предл. 48 15,1 им./ вин. 82 25,78
проценты предл. 26 1,05 род. 1087 44,77
литература предл. 146 21,95 род. 211 31,73
коллектив род. 62 19,13 предл. 54 16,66
стол предл. 330 13,68 дат. 212 8,79
свободных заменах падежных форм существительных и личных местоимений
Точная идентификация падежной формы заменяющего слова не всегда возможна из-за омонимии падежных форм существительных: так, в примере 2 форма личного местоимения её может быть как формой винительного, так и формой родительного падежа, а в примере 4 белок может быть либо формой именительного, либо формой винительного падежа существительного.
Общее распределение частот использования падежных форм в русской разговорной речи показано на рис. 3 (данные заимствованы из работы [Мартыненко
1«
ИМ. РОЛ. ДЛ1, В1/1Н. ТВ. ГН'ЬДЛ.
2003]).
Рис. 3. Распределение частот использования падежных форм в русской разговорной речи (в процентах)
Сравнение результатов, представленных в таблице 1, с данными рис. 3 позволяет предположить, что в русской разговорной речи существует тенденция замены менее частотных форм косвенных падежей (дательного, творительного и предложного) наиболее часто используемыми падежными формами (именительным, винительным и родительным). В то же время формы родительного падежа заменяются более частотными формами именительного и винительного падежей. Сравнение относительных частот показывает, что эта тенденция является статистически значимой для замен род. ^ им./ вин. ( t (37) = 3.58,р < .001) (рис. 4) и для замен дат. ^ вин. / род. (? (39) = 3.08, р < .01) (рис. 5).
РОД
им,/ы/н.
Рис. 4. Относительные частоты (логарифмированные) искомой формы родительного падежа и заменяющей формы именительного/винительного падежа существительных и личных местоимений внутри словоизменительной парадигмы слова
1*1
Рис. 5. Относительные частоты (логарифмированные) искомой формы дательного падежа и заменяющей формы винительного/родительного падежа существительных и личных местоимений внутри словоизменительной парадигмы слова
Поскольку формы винительного падежа существительных и личных местоимений часто омонимичны формам именительного и родительного падежей, частота использования заменяющей словоформы фактически представляет собой суммарную частоту использования соответственно форм им./ вин. или же форм вин./ род., то есть потенциал заменяющей словоформы в таких случаях «удваивается», что повышает вероятность возникновения речевой ошибки-замены.
К сожалению, число примеров замен иных грамматических признаков (примеры 5-12) недостаточно велико и не позволяет оценить статистическую значимость различия относительных частот использования искомой и заменяющей словоформ. Кроме того, имеющиеся примеры весьма разнообразны - например, случаи замен таких грамматических признаков, как род и число, относятся к разным частям речи, и поэтому определение точных границ словоизменительной парадигмы для определенного грамматического признака часто является проблематичным. Взаимодействие различных грамматических признаков, например, времени и вида (см. выше пример 12) в некоторых примерах также затрудняет анализ ошибок. На сегодняшний день статистически достоверные данные о различии относительных частот использования искомой и заменяющей словоформ получены лишь для падежных форм существительных и личных местоимений.
обсуждение результатов
Целью работы было использование данных речевых ошибок для исследования механизма выбора грамматических форм лексических единиц при порождении речи и, в частности, для ответа на вопрос об актуальности вероятностно-статистической информации о грамматических формах слов при порождении спонтанной устной речи.
Прежде всего, данные речевых ошибок свидетельствуют о том, что грамматическая форма слова не обязательно конструируется автоматически, а может выбираться из числа нескольких конкурирующих форм. Это заключение идет вразрез с выводами большинства экспериментальных исследований, использующих методику интерференции грамматических признаков для изучения механизма поиска грамматических форм слова. Авторы этих исследований считают, что «конкуренция» присуща лишь процессу выбора самих лексических единиц, тогда как грамматические признаки приписываются им автоматически [Caramazza et а1.
2001; Schiller & Caramazza 2002, 2003; Costa et al. 2003; Bordag & Pechmann 2008]. Данные речевых ошибок русской разговорной речи, напротив, указывают на вероятностный характер поиска грамматических форм слова, что скорее подтверждает выводы, сделанные в работе [Schriefers 1993]. Однако, в отличие от экспериментальных исследований, в которых изучается конкуренция двух словоформ, возникающая под воздействием грамматического признака (обычно грамматического рода или числа) интерферирующей словоформы, примеры 1-12 указывают на то, что конкуренция грамматических форм внутри словоизменительной парадигмы слова имеет место даже при отсутствии интерферирующего контекста. Более того, примеры контекстно-свободных замен грамматических форм слова показывают, что список грамматических категорий, вовлеченных в эту конкуренцию, не ограничивается категориями числа и рода: падежные формы, видовременные формы и формы лица (см. примеры 1-4, 7-12) также могут выбираться из числа нескольких конкурирующих форм. Таким образом, данные речевых ошибок подтверждают гипотезу о конкуренции грамматических форм слов при порождении речи.
Сравнение абсолютных частот использования искомой и заменяющей словоформ в Национальном корпусе русского языка показывает, что существует общая тенденция замены низкочастотных словоформ высокочастотными. Это свидетельствует о роли эффекта «частоты экземпляра» (token frequency) в процессе речепо-рождения.
Полученные данные сопоставимы с результатами некоторых экспериментальных исследований, подтверждающими, что информация о частоте словоформы используется при восприятии лексических единиц [см., например, Kostic & Mirkovic 2002; Milin et al. 2007], а также с экспериментальными данными об усвоении родного и иностранного языков [Tomasello 2003; Lieven & Tomasello 2008; Ellis 2008] и о речи больных с аграмматизмом [Stemberger 1984, 1985; Faroqi-Shah & Thompson 2004].
Итак, судя по данным речевых ошибок, эффект «частоты экземпляра» играет существенную роль при порождении речи. Если предположить, что контекстно-свободные замены грамматических признаков происходят вследствие конкуренции различных грамматических форм искомого слова при поиске во внутреннем лексиконе, разумно предположить, что некоторые формы доминируют в словоизменительной парадигме, т.е. определенные типы грамматических форм будут выбраны говорящим с большей вероятностью. Используется ли при порождении речи информация о «частоте типа» (type frequency)?
Сравнение относительных частот искомой и заменяющей словоформ в пределах словоизменительной парадигмы слова показывает, что при заменах падежных форм существительных и личных местоимений относительная частота заменяющей падежной формы слова, как правило, превышает относительную частоту искомой формы в пределах парадигмы склонения данного слова.
Результаты сравнения позволяют предположить, что при выборе грамматической формы слова некоторые его формы имеют преимущество над другими. Так, оказывается, что наиболее часто используемые в разговорном русском языке падежные формы существительных и личных местоимений (именительный, родительный и винительный) часто становятся заменой менее частотных форм косвенных
падежей, таких как дательный. В то же время формы родительного падежа заменяются более высокочастотными формами именительного и винительного падежей. В этих случаях можно говорить об эффекте «частоты типа». Вероятно, омонимия некоторых падежных форм существительных и местоимений усиливает потенциал заменяющей падежной формы; так, например, омонимия самых высокочастотных падежных форм — именительного и винительного падежей — увеличивает вероятность возникновения замены род. ^ им. / вин., а омонимия форм винительного и родительного падежей повышает вероятность возникновения замены дат. ^ вин. /род.
Возникает закономерный вопрос: идет ли в данном случае речь о приоритете определенной падежной формы слова над другими падежными формами или же мы можем говорить о приоритете определенного грамматического признака, например признака родительного падежа, над другими грамматическими признаками, например над признаками дательного и творительного падежей?
Представляется, что говорить об иерархии грамматических признаков, а не грамматических форм слова преждевременно, поскольку во многих примерах исследуемого типа речевых ошибок заменяющую падежную форму невозможно определить однозначно из-за омонимии падежных форм, — например, в случае, когда заменяющая форма род. / вин. имеет более высокую суммарную частоту по сравнению с искомой формой дат. п. Подобные примеры не позволяют с уверенностью объяснить наблюдаемый эффект доминированием грамматического признака родительного или винительного падежа относительно дательного, поскольку он может быть вызван высокой суммарной частотой форм родительного и винительного падежей данного слова. Поэтому из двух возможных объяснений — иерархия грамматических признаков или частота использования грамматических форм — приходится, видимо, предпочесть второе, а именно, что при порождении речи некоторые грамматические формы слова могут быть выбраны говорящим с большей вероятностью, чем другие.
Действие «эффекта частоты» при поиске грамматических форм слов можно объяснить с помощью гипотезы, что различные грамматические формы слова хранятся во внутреннем лексиконе вместе с информацией о частоте их использования в речи и что более «сильные» высокочастотные формы более легко доступны как потенциальные заменители «слабых» низкочастотных форм. В случае, если искомая низкочастотная форма слова по какой-то причине недоступна в момент порождения, по умолчанию может использоваться высокочастотная форма. Используя понятийный аппарат «моделей распространяющейся активации» [Dell 1986; Dell et al. 1997], можно предположить, что информация о частотах грамматических форм слов может быть закодирована в лексической памяти в виде информации о пороговых значениях активации той или иной словоформы [см. Jurafsky 2003].
Результаты исследования свидетельствуют в пользу динамичных, «пользовательских» моделей ментальной грамматики и подтверждают гипотезу, что как «частота экземпляра», так и «частота типа» играют существенную роль в организации внутреннего лексикона [ср. Bybee 2006] и что частота использования лингвистических конструкций является частью языковой компетенции говорящего.
Заключение
Данные речевых ошибок указывают на то, что процесс порождения речи сопровождается конкуренцией различных грамматических форм данного слова, и позволяют предположить, что вероятностно-статистическая информация о каждой из грамматических форм слова хранится во внутреннем лексиконе человека. Выбор определенной грамматической формы обусловлен, в частности, частотой ее использования в речи, и чем выше частотность формы, тем больше вероятность ее выбора говорящим. Полученные результаты делают более предпочтительными «пользовательские» модели ментальной грамматики.
список литературы
Земская Е.А., Китайгородская М.В., Ширяев Е.Н. Русская разговорная речь. Общие вопросы. Словообразование. Синтаксис. - М.: Наука, 1981. - 276 с.
Леонтьев А.А. Некоторые проблемы обучения русскому языку как иностранному. - М.: МГУ, 1970. - 88 с.
Мартыненко Н.Г. Существительное: Категория падежа // Разговорная речь в системе функциональных стилей современного русского литературного языка. Грамматика [под ред. О.Б.Сиротининой]. - М.: УРСС, 2003. - С. 47-64.
Национальный корпус русского языка. URL: http://ruscorpora.ru (дата обращения: 30.04.14)
Санджи-ГаряеваЗ.С. Глагол: Категория времени // Разговорная речь в системе функциональных стилей современного русского литературного языка. Грамматика [под ред. О.Б.Сиротининой]. - М.: УРСС, 2003. - С. 110-124.
Baayen R.H. Storage and computation in the mental lexicon // The Mental Lexicon: Core Perspectives [eds. Jarema, G., & Libben, G.]. - Amsterdam: Elsevier, 2007. - P. 81104.
BaayenR. H., Dijkstra T., & SchreuderR. Singulars and plurals in Dutch: Evidence for a parallel dual route model // Journal of Memory and Language. - 1997. - Vol. 36. - P. 94-117.
Baayen R.H., McQueen J., Dijkstra T., & Schreuder R. Frequency effects in regular inflectional morphology: Revisiting 'Dutch plurals' // Morphological Structure in Language Processing [eds. Baayen, R.H., & Schreuder, R.]. - Berlin: Mouton de Gruyter, 2003. - P. 355-390.
Baayen R. H., Schreuder R., De Jong N. H., & Krott A. Dutch inflection: the rules that prove the exception // Storage and Computation in the Language Faculty [eds. Nooteboom, S., Weerman, F., & Wijnen, F.]. - Dordrecht: Kluwer Academic Publishers, 2002. - P. 61-92.
Bi Y., Han Z., & Shu H. Compound frequency effect in word production: Evidence from anomia // Brain and Language. - 2007. - Vol. 103. - P. 8-249.
Bien H., Levelt W., & Baayen R. H. Frequency effects in compound production // Proceedings of the National Academy of Sciences of the USA. - 2005. - Vol. 102. - P. 17876-17881.
Bordag D., & Pechmann T. Grammatical gender in speech production: Evidence from Czech // Journal of Psycholinguistic Research. - 2008. - Vol. 37. - P. 69-85.
Bybee J.L. Frequency of use and the organization of language. - Oxford: Oxford University Press, 2006. - 376 p.
Caramazza A., Miceli G., Silveri M.C., & Laudanna A. Reading mechanisms and the organisation of the lexicon: Evidence from acquired dyslexia // Cognitive Neuropsychology. - 1985. - Vol. 2 - P. 81-114.
Caramazza A., Miozzo M., Costa A., Schiller N., & Alario F.X. A crosslinguistic investigation of determiner production // Language, Brain, and Cognitive Development: Essays in Honor of Jacques Mehler [ed. Dupoux E.]. - Cambridge, MA: MIT Press, 2001. - P. 209-226.
Clahsen H., Hadler M., Eisenbeiss S. & Sonnenstuhl-Henning I. Morphological Paradigms in Language Processing and Language Disorders // Transactions of the Philological Society. - 2001. - Vol. 99, No. 2. - P. 247-277.
Clahsen H., Rothweiler M., Woest A. and Marcus G.F. Regular and Irregular Inflection in the Acquisition of German Noun Plurals // Cognition. - 1992. - Vol. 45. - P. 225-255.
Costa A., Kovacic D., Fedorenko E., & Caramazza A. The gender congruency effect and the selection of freestanding and bound morphemes: Evidence from Croatian // Journal of Experimental Psychology: Learning, Memory, and Cognition. - 2003. - Vol. 29. - P. 1270-1282.
Croft W., & Cruse D.A. Cognitive Linguistics. - Cambridge: Cambridge University Press, 2004. - 356 p.
Dqbrowska E. The effects of frequency and neighbourhood density on adult speakers' productivity with Polish case inflections: An empirical test of usage-based approaches to morphology // Journal of Memory and Language. - 2008. - Vol. 58. - P. 931-951.
Dell G. S. A spreading-activation theory of retrieval in sentence production // Psychological Review. - 1986. - Vol. 93, No. 3. - P. 283-321.
Dell G.S., SchwartzM.F., Martin N., Safran E.M., & Gagnon D.A. Lexical access in aphasic and nonaphasic speakers // Psychological Review. - 1997. - Vol. 104. - P. 801-838.
Demuth K. The role of frequency in language acquisition // Frequency effects in language acquisition [eds. Gülzow, I. & Gagarina, N.] (Studies on Language Acquisition (SOLA) series). - Berlin: Mouton De Gruyter, 2007. - P. 383-388.
Diessel H. Frequency effects in language acquisition, language use, and diachronic change // New Ideas in Psychology. - 2007. - Vol. 25. - P. 108-127.
Ellis N. C. The dynamics of second language emergence: cycles of language use, language change, and language acquisition // Modern Language Journal. - 2008. - Vol. 92. - P. 232-239.
Evans V., & Green M. Cognitive Linguistics: An Introduction. - Edinburg: Edinburgh University Press, 2006. - 830 p.
Faroqi-Shah Y. & Thompson C.K. Semantic, lexical, and phonological influences on the production of verb inflections in agrammatic aphasia // Brain and Language. -2004. - Vol. 89. - P. 484-498.
Janssen U. & Penke M. How are inflectional affixes organized in the mental lexicon? Evidence from the investigation of agreement errors in agrammatic aphasics // Brain and Language. - 2002. - Vol. 81. - P. 180-191.
JurafskyD. Probabilistic modeling in psycholinguistics: Linguistic comprehension and production // Probabilistic Linguistics [eds. Bod, R., Hay, J., & Jannedy, S.]. -Cambridge, MA: MIT Press, 2003. - P. 39-95.
Kostic A. & Mirkovic J. Processing of inflected nouns and levels of cognitive sensitivity // Psihologija. - 2002. - Vol. 35. - P. 287-297.
Lehtonen M., & Laine M. How word frequency affects morphological processing in monolinguals and bilinguals // Bilingualism: Language and cognition. - 2003. - Vol. 6. - P. 213-225.
Lieven E., & Tomasello M. Children's first language learning from a usage-based perspective // Handbook of Cognitive Linguistics and Second Language Acquisition [eds. Robinson, P., & Ellis, N.C.]. - New York: Routledge, 2008. - P. 168-196.
Marcus G.F., Brinkmann U., Clahsen H., Wiese R., WoestA., & Pinker S. German inflection: The exception that proves the rule // Cognitive Psychology. - 1995. - Vol. 29. - P. 189-256.
Milin P., Filipovic Djurdjevic D., & Moscoso del Prado Martin F. The simultaneous effects of inflectional paradigms and classes on lexical recognition: Evidence from Serbian. 2007. URL: http://cogprints.org/6188/ (дата обращения: 30.04.14).
New B., BrysbaertM., Segui J., FerrandL., & Rastle K. The processing of singular and plural nouns in French and English // Journal of Memory and Language. - 2004. -Vol. 51. - P. 568-585.
OldfieldR.C., & Wingfield A. Response latencies in naming objects // The Quarterly Journal of Experimental Psychology. - 1965. -Vol. 17. - P. 273-281.
Pinker S. Rules of language // Science. - 1991. - Vol. 253. - P. 530-535.
Pinker S. Words and rules in the human brain // Nature. - Vol. 387. - P. 547-548.
Pinker S. & Prince A. On language and connectionism: Analysis of a parallel distributed processing model of language acquisition // Cognition. - 1988. - Vol. 28. - P. 73-193.
Pinker S. & Prince A. Regular and irregular morphology and the psychological status of rules of grammar // The reality of Linguistic Rules [eds. Lima, S.D., Corrigan, R.L., & Iverson, G.K.]. - Amsterdam: Benjamins, 1994. - P. 321-351.
Prasada S. & Pinker S. Generalizations of regular and irregular morphology // Language and CognitiveProcesses. - 1993. - Vol. 8. - P. 1-56.
Schiller N. O., & Caramazza A. The selection of grammatical features in word production: The case of plural nouns in German // Brain and Language. - 2002. - Vol. 81. - P. 342-357.
Schiller N.O., & Caramazza A. Grammatical feature selection in noun phrase production: Evidence from German and Dutch // Journal of Memory and Language. -2003. - Vol. 48. - P. 169-194.
SchmidH.-J. Entrenchment, salience, and basic levels // The Oxford Handbook of Cognitive Linguistics [eds. D. Geeraerts, H.Cuyckens]. - New York: Oxford University Press, 2007. - P. 117-138.
Schriefers H. Syntactic processes in the production of noun phrases // Journal of Experimental Psychology: Learning, Memory, and Cognition. - 1993. - Vol. 19. - P. 841-850.
Sereno J.A., & Jongman A. Processing of English Inflectional Morphology // Memory & Cognition. - 1997. - Vol. 25. - P. 425-437.
Smolka E., Zwitserlood P., & Rosier F. Stem access in regular and irregular inflection: Evidence from German participles // Journal of Memory and Language. -2007. - Vol. 57. - P. 325-347.
Stemberger J.P. Structural errors in normal and agrammatic speech // Cognitive Neuropsychology. - 1984. - Vol. 1, No. 4. - P. 281-313.
Stemberger J.P. Bound morpheme loss errors in normal and agrammatic speech: One mechanism or two? // Brain and Language. - 1985. - Vol. 50. - P. 225-239.
Stemberger J., & McWhinney B. Form-oriented inflectional errors in language processing // Cognitive Psychology. - 1986. - Vol. 18. - P. 329-54
Tabak W., Schreuder R. & Baayen R.H. Lexical statistics and lexical processing: semantic density, information complexity, sex, and irregularity in Dutch // Linguistic Evidence [eds. Reis, M., & Kepser, S.]. - Berlin: Mouton de Gruyter, 2005. - P. 529-555.
Tomasello M. Constructing a language: A usage-based account of language acquisition. - Cambridge, MA: Harvard University Press, 2003. - 388 p.
Ullman M.T. Acceptability ratings of regular and irregular past-tense forms: Evidence for a dual-system model of language from word frequency and phonological neighborhood effects // Language and Cognitive Processes. - 1999. - Vol. 14. - P. 47-67.
Vitevitch M.S. The neighborhood characteristics of malapropisms // Language and Speech. -1997. - Vol. 40. - P. 211-228.