УДК 81'271.14'23'37'32
С.И. Горохова
СЕМАНТИЧЕСКИЕ ЗАМЕНЫ В НОРМАЛЬНОЙ РЕЧИ: ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЧЕВЫХ ОШИБОК1
Речевые ошибки (оговорки) семантического типа анализируются с точки зрения частоты, возраста усвоения и длины искомого и заменяющего слов. Результаты исследования показывают, что частота использования и возраст усвоения слова (рассматриваемые как корреляты степени его когнитивной закрепленности) относятся к числу факторов, определяющих выбор семантического представления слова при поиске во внутреннем лексиконе. Это опровергает распространенную точку зрения, что «эффект частотности» проявляется лишь на стадии морфофо-нологического представления слов.
Ключевые слова: речевые ошибки, семантическая связь, частота слова, возраст усвоения, длина слова, когипонимы, антонимы.
1. Введение
В когнитивной лингвистике и психолингвистике признается, что доступность единицы информации, хранящейся в долговременной памяти, является функцией частоты использования этой единицы говорящими. «Пользовательские» (usage-based) когнитивно-лингвистические теории языка постулируют, что частота использования лингвистической единицы коррелирует со степенью ее когнитивной закрепленности (entrenchment) [Rosch et al. 1987; Evans & Green 2006; Hudson 2007; Schmid 2007].
Модели семантической памяти, основанные на принципе «распространяющейся активации», предполагают, что при порождении речи активируются не отдельные лингвистические единицы, /а целые фрагменты «сети» единиц, и в конечном итоге для порождения выбирается единица, получившая наибольшее число импульсов активации [Collins & Loftus 1975; Anderson 1983; Dell 1986; McNamara 1992]. Существует точка зрения, что глубина «закрепленности» лингвистической единицы в долговременной памяти является одним из факторов, определяющих интенсивность активации этой единицы при речепорождении, и, таким образом, более глубоко закрепленные единицы с большей вероятностью будут выбраны говорящим [Schmid 2007].
Существенно, что закрепленность лингвистических единиц считается зависящей не только от частоты их активации отдельными людьми, но и от частоты их использования в языковом коллективе в целом, поскольку общая частота использования лексической единицы определяет
1 Работа выполнена при поддержке гранта РФФИ № 13-06-00353.
и то, как часто отдельные говорящие будут с ней сталкиваться [Schmid 2007]. В этом смысле частота встречаемости лингвистической единицы в большом и представительном языковом корпусе, несомненно, должна коррелировать с глубиной закрепленности этой единицы в данном языке.
Несмотря на то, что понятие частоты является важным объяснительным механизмом когнитивно-лингвистических теорий, вопрос о том, какие стадии порождения речи подвержены этому так называемому «эффекту частотности», до сих пор является предметом оживленной дискуссии. Многие авторы полагают, что «эффект частотности» не проявляется на стадии поиска леммы, т.е. семантического представления лексических единиц, а начинает действовать позже, только на стадии поиска лексем, т.е. морфофонологического представления лексических единиц [Jescheniak & Levelt 1994; Jurafsky 2003 и др.]. В то же время результаты некоторых экспериментальных исследований позволяют предположить, что информация о частотных характеристиках слова актуальна и на более ранних стадиях его поиска, т.е. уже при выборе лемм [Finocchiaro & Caramazza 2006; Navarrete et al. 2006].
Одним из способов изучения роли «эффекта частотности» при порождении речи является сравнение частотных характеристик искомого и заменяющего слов при семантических парафа-зиях в нормальной речи и речи больных с афазией. Исследования семантических замен на материале англо- и испаноязычных речевых ошибок в норме и патологии [Hotopf 1980; Del Viso et al. 1991; Gerhand & Barry 2000; Harley & MacAndrew 2001] не выявили какого-либо статистически значимого различия между частотами искомого и заменяющего слов при семантических заменах.
С другой стороны, одно из исследований детской речи [German & Newman 2004] показало, что дети, страдающие речевой патологией, в большинстве случаев заменяли слово, которое не могли подобрать, более высокочастотным словом. Таким образом, при речевых патологиях частота лексической единицы, возможно, является одним из факторов, определяющих вероятность ее замены в процессе лексического поиска, однако насколько это справедливо для нормальной речи, остается неясным [Gordon 2002].
Недавнее исследование семантических замен при афазии [Kittredge et al. 2008] дало более обнадеживающие результаты, обнаружив положительную корреляцию между логарифмированными величинами частот искомого и заменяющего слов. Результаты исследования показывают, что выбор слов в процессе порождения речи основан, в частности, и на вероятностно-статистических характеристиках лексических единиц. Это позволяет сделать заключение о большей доступности как семантических, так и фонологических представлений высокочастотных слов по сравнению с низкочастотными. Анализ пауз и заминок в потоке речи также свидетельствует о том, что высокочастотные слова более доступны, быстрее порождаются и в меньшей степени подвержены заминкам в речи [Kapatsinski 2010: 102].
Наряду с частотой использования, одним из основных коррелятов когнитивной закрепленности можно считать возраст усвоения слова. Ряд авторов полагает, что именно возраст усвоения, а не частота оказывает влияние на скорость его поиска при выполнении экспериментальных заданий, направленных на называние предметов [Morrison et al. 1992; Turner et al. 1998]. В то же время некоторые экспериментальные данные свидетельствуют о том, что фактор возраста усвоения слова влияет лишь на поиск его фонологических характеристик, тогда как влияние фактора частоты распространяется и на более ранние стадии лексического поиска [Kittredge et al. 2008]. С другой стороны, существует точка зрения, что оба эти фактора имеют одинаково фундаментальное значение для поиска во внутреннем лексиконе [Meschyan, Hernandez 2002; Catling et al. 2010], причем возраст усвоения слова играет роль не только на этапе поиска его фонологического представления, но и на стадии семантического поиска [Brysbaert et al. 2000].
2. Данные
В работе представлены результаты корпусного анализа 1378 речевых ошибок (оговорок) ре-
чи здоровых носителей русского языка. Ошибки были зафиксированы в процессе бытового общения, телефонных разговоров и радио- и телевизионных программ, идущих в прямом эфире. Примеры ошибок представляют собой отрезки спонтанной устной речи носителей русского языка, зафиксированные с помощью цифровой записи или записи на магнитную ленту и выделенные в результате профессионального лингвистического анализа.
Рассматриваемые речевые ошибки представляют собой семантические замены существительных, т.е. случаи замены в речи искомого существительного другим существительным, связанным с ним по значению. Чтобы отграничить понятие речевой ошибки от других сходных типов лингвистических явлений (ошибок, возникающих вследствие несовершенства лингвистических «знаний» говорящего; намеренных искажений нормы; проявлений функционально-стилистической вариативности разговорной речи и, наконец, от известного явления затрудненного поиска слова, т.н. "tip of the tongue"), в данном исследовании под речевой ошибкой понимается результат отклонения от речевой интенции говорящего, если это отклонение не становится актуально осознанным в процессе грамматико-семантической реализации речевого действия (об уровнях осознаваемости в спонтанной речи см.: [Леонтьев 1970: 12]).
Если рассматривать традиционно выделяемые основные типы семантических отношений между лексическими единицами, то в имеющемся в распоряжении автора корпусе семантических замен с очевидностью выделяются два подкласса замен, соответствующие двум из основных типов семантических отношений, - антонимические замены, т.е. замены искомого слова на его антоним, и когипонимические замены, т.е. замены искомого слова его когипонимом (нелишним будет упомянуть о том, что, как неоднократно отмечалось исследователями, такие виды семантических отношений между искомым и заменяющим словами, как гипонимия и синонимия, не наблюдаются в речевых ошибках). Остальные имеющиеся в нашем распоряжении примеры семантических замен можно условно назвать «ассоциативными заменами» (заменяющее слово принадлежит к семантическому полю искомого слова, но связано с искомым словом ассоциативно, а не таксономически) или, используя терминологию В.Г. Гака (1972), «выявлением потенциальной семы». Более дробная классификация этого
подкласса замен нецелесообразна в контексте задач данного исследования, поскольку большое разнообразие относящихся к нему примеров не дает возможность получить статистически значимые результаты анализа. Поэтому на данном этапе исследования было принято решение ограничиться анализом трех перечисленных типов семантических замен.
Все примеры семантических замен были расклассифицированы по типу понятийно-семантической связи между искомым и заменяющим существительными и отнесены соответственно к категории когипонимов, к категории антонимов либо к категории «иных» типов связи. Классификация выполнялась двадцатью студентами-лингвистами и четырьмя профессиональными лингвистами, имеющими высшее специальное образование. Учитывая существование довольно обширной типологии антонимических отношений, экспертам была дана инструкция учитывать все пары слов, которые можно отнести к антонимам любого типа. Результатом классификации стал корпус семантических замен существительных, включающий 724 когипонимические замены, 187 антонимических замен и 467 замен, представляющих иные типы семантической связи (далее в тексте - «ассоциативные замены»).
Примеры когипонимических, антонимических и ассоциативных семантических замен приведены ниже (до знака «^» - фраза с искомым словом; после знака «^» - заменяющее слово; искомое и заменяющее слова выделены заглавными буквами).
2.1. Когипонимические замены
(a) Как ты думаешь, если я этот торт украшу дольками АПЕЛЬСИНА? ^ ...ЛИМОНА? (категория «фрукты»)
(b) Ой, как здорово! Как ЖИРАФ! ^ ...КЕНГУРУ! (категория «животные»)
(c) ... А во сколько - вы уже узнали - ПОЕЗД? ^ ... САМОЛЕТ? (категория «транспорт»)
(ё) Я их уже в прошлый раз купила и две НЕДЕЛИ я их уже ем ^ ... два ДНЯ (категория «единицы времени»)
(е) Я сейчас их в КАСТРЮЛЕ буду жарить ^ ... на СКОВОРОДКЕ (категория «посуда»)
2.2. Антонимические замены
(a) Может быть, у нас лента тоже перемоталась в НАЧАЛО ^ ...в КОНЕЦ
(b) Вознесение Христа на НЕБО ^ ...на ЗЕМЛЮ
(c) А потом, представляете, наши ПОТОМКИ обнаружат эту книгу ^ ...ПРЕДКИ...
(d) Лучше всего сдавать экзамены [в аспирантуру] сразу после ПОСТУПЛЕНИЯ ^ ...после ОКОНЧАНИЯ [университета]...
(e) Я, пока до РАБОТЫ шла, чего только не насмотрелась ^ ...до ДОМА...
2.3. Ассоциативные замены
(a) А ты РЕЗИНКУ-то нашел? ^ ...ПРОБКУ
(b) А это пальто она еще ЗИМОЙ будет носить ^ .. НОЧЬЮ...
(c) Накануне ПОБЕДЫ тоже погибали наши солдаты ^ Накануне ВОЙНЫ...
(d) Хороший свитер. Надо в него НАФТАЛИНА побольше положить ^ .. МОЛИ...
(e) Распродажа в ЯНВАРЕ ^ ...в ПОНЕДЕЛЬНИК
3. Методы исследования
Для анализа роли «эффекта частотности» в процессе лексического выбора было проведено сравнение частот лексемы (т.е. частоты словоформы, задействованной в семантической замене) и леммы (т.е. суммарной частоты всех словоформ данной лексической единицы) искомого слова с соответствующими частотами заменяющего слова (ошибки). За абсолютное значение частоты слова принималась частота его встречаемости в Национальном корпусе русского языка [НКРЯ URL: http://ruscorpora.ru]. Результаты сравнения анализировались раздельно по трем группам семантических замен - когипонимических, антонимических и ассоциативных. Для исследования влияния длины слова (измеряемой числом слогов и числом фонем) на речевые ошибки длина искомой лексемы сравнивалась с длиной заменяющей лексемы.
Поскольку принято считать, что логарифмированные значения частоты более корректно, чем ее абсолютные значения, отражают различные аспекты речевой деятельности [Oldfield & Wingfield 1965; Vitevitch 1997], а также поскольку логарифмирование является стандартным способом приведения распределения к нормальному виду, в большинстве сравнений использовались логарифмированные значения частот (там, где логарифмирование оказывалось неприменимой из-за слишком большого числа нулевых значений частот, для нормализации распределения использовалось квадратно-коренное преобразование величин). В разделе, посвященном сравнению
частот искомого и заменяющего слов, для полноты картины приведены результаты сравнения как абсолютных, так и логарифмированных значений частот. При сравнении длины (слоговой и фонетической) искомого и заменяющего слов использовались логарифмированные значения длин. Показатели совместной встречаемости искомого и заменяющего слов вычислялись по соответствующим формулам на основании величин абсолютных частот. Дублирующие примеры не учитывались в анализируемой выборке.
4. Результаты
4.1. Частота искомого и заменяющего слов
В отличие от результатов существующих исследований речевых ошибок, не обнаруживших статистически значимого различия частот искомого и заменяющего слов в семантических заменах, в русскоязычных речевых ошибках существует тенденция замены низкочастотных слов более высокочастотными.
Сравнение абсолютных частот искомого и заменяющего слов в группе ассоциативных замен показывает весьма существенное различие частот (для лемм р = 0,0019, средняя частота искомого
слова Рш = 8868,5, средняя частота заменяющего слова Регг = 15595 и для лексем р = 0,001, средняя частота искомого слова /Шг = 1657,1, средняя частота заменяющего слова /егг = 3241,2) (рис. 1).
Сравнение абсолютных частот искомого и заменяющего слов в группе когипонимических замен дает совершенно противоположный результат: различие частот оказывается статистически незначимым, более того - как для лемм, так и для лексем средние значения частоты искомого слова превосходят средние значения частоты заменяющего
слова (для лемм р = 0,2914, РЫг = 36593, Тегг = 32957; для лексем р = 0,0732, = 9710,7, 1ГГ= 9328,5) (рис. 2).
Рис. 2. Когипонимические замены: абсолютные частоты лемм искомого и заменяющего слов
Сравнение логарифмированных величин частот искомого и заменяющего слов показало существенное различие в обеих группах семантических замен: в группе ассоциативных замен I = 4,246, р < 0,0001 для лемм (рис. 3), I = 3,923, р = 0,0002 для лексем; в группе когипонимических замен t = 2,644, р = 0,0092 для лемм (рис. 4), t = 2,84, р = 0,0051 для лексем.
Рис. 3. Ассоциативные замены: логарифмированные частоты лемм искомого и заменяющего слов
Рис. 1. Ассоциативные замены: абсолютные частоты лемм искомого и заменяющего слов
Рис. 4. Когипонимы: логарифмированные частоты лемм искомого и заменяющего слов
В отличие от когипонимических и ассоциативных замен, в группе антонимических замен не обнаружено существенного различия ни абсолютных, ни логарифмированных значений величин искомого и заменяющего слов: для лемм сравнение абсолютных частот дает р = 0,1828, а сравнение логарифмированных частот -р = 0,932; для лексем сравнение абсолютных час-
тот дает р = 0,597, а сравнение логарифмированных частот - р = 0, 319 (рис. 5, 6).
Рис. 5. Антонимы: абсолютные частоты лемм искомого и заменяющего слов
Рис. 6. Антонимы: логарифмированные частоты лемм искомого и заменяющего слов
4.2. Корреляция частот искомого и заменяющего слов
Оценка с помощью метода линейной регрессии выявила наличие сильной положительной корреляции между значениями частот искомого и заменяющего слов в группах когипонимических и ассоциативных замен: для когипонимических замен г = 0,7434, р < 0,0001 (рис. 7); для ассоциативных замен г = 0,6031,/? < 0,0001 (рис. 8).
Рис. 8. Корреляция частот искомого и заменяющего слов: ассоциативные замены
4.3. Длина искомого и заменяющего слов Сравнение длин (измеряемое числом слогов) искомого и заменяющего слов в группе ко-гипонимических замен (рис. 9) не показало статистически значимого различия (р = 0,7324, средняя логарифмированная длина искомого слова
Ъаг = 0,4012, средняя логарифмированная длина
заменяющего слова 1егг = 0,3923), равно как и аналогичное сравнение в группе антонимических замен (р = 0,617, 1ШГ = 0,4258, 1егг = 0,3915) (рис. 10).
Рис. 9. Когипонимы: логарифмированные длины лексем искомого и заменяющего слов
Рис. 7. Корреляция частот искомого и заменяющего слов: когипонимические замены
Рис. 10. Антонимы: логарифмированные длины лексем искомого и заменяющего слов
Однако в группе ассоциативных замен
средняя длина искомого слова значительно больше средней длины заменяющего слова (рис. 11) (p = 0,0287, ltar = 0,4616, lerr = 0,4127).
Рис. 11. Ассоциативные замены: логарифмированные длины лексем искомого и заменяющего слов
Аналогичным образом различие длин искомого и заменяющего слов, измеряемое числом фонем, статистически значимо в группе ассоциативных замен (p = 0,0124, средняя логарифмированная длина искомого слова Ltar = 0,8633, средняя логарифмированная длина заменяющего слова Lerr = 0,8174), не значимо в группе когипони-мических замен (p = 0,3608, Ltar = 0,7997, Lerr = 0,7882) и не значимо в группе антонимических замен (p = 0,784, Ltar = 0,7866,
Lerr = 0,7733).
Таким образом, в случаях, когда искомое слово заменяется его когипонимом и антонимом, длина искомого и заменяющего слов различается несущественно, а в случаях, когда искомое и заменяющее слова не являются когипонимами или антонимами, длина искомого слова существенно больше длины заменяющего слова.
4.4. Влияние возраста усвоения слова на замену
Экспериментальное исследование оценки возраста усвоения искомых и заменяющих слов проводилось в соответствии с методикой, описанной в работе [Kuperman et al. 2012]. Анализируемые слова были случайным образом распределены по спискам, каждый из которых включал 300 слов. Кроме того, в соответствии с общепринятой методикой эксперимента, в начало каждого списка были добавлены 10 так называемых «калибровочных» слов, представляющих весь оценочный спектр шкалы возраста усвоения (по данным Бристольской шкалы [Stadthagen-Gonzalez, Davis 2006]. Таким образом, участники эксперимента получали представление о лексических единицах, характеризующихся различным возрастом усвоения.
Участники эксперимента получали инструкцию указать возраст (в целом числе лет), в котором, по их мнению, они усвоили то или иное слово. В инструкции специально оговаривалось,
что под «усвоением слова» подразумевается пассивное усвоение, т.е. способность узнавать то или иное слово, употребленное кем-то другим, и понимать его смысл, даже если сам участник не использовал это слово активно. Заполнение одного списка занимало у участника в среднем около 20 минут. Каждый список заполнялся 20 участниками. Общее число участников эксперимента составило 256 носителей русского языка в возрасте от 21 до 76 лет, с высшим образованием.
Сравнение значений возраста усвоения искомого и заменяющего слов показывает, что в группах когипонимических и ассоциативных замен возраст усвоения заменяющего слова значительно меньше возраста усвоения искомого слова: t = 2,93, p = 0,004, средний возраст усвоения искомого слова Atar = 6,20, средний возраст
усвоения заменяющего слова Aerr = 5,47 для когипонимов (рис. 12) и t = 2,05, p = 0,043,
Atar = 6,57, Aerr = 5,83 для ассоциативных замен (рис. 13).
Рис. 12. Когипонимы: возраст усвоения искомого и заменяющего слов
Рис. 13. Ассоциативные замены: возраст усвоения искомого и заменяющего слов
В то же время в группе антонимических замен не обнаруживается сколько-нибудь существенного различия между возрастом усвоения искомого и заменяющего слов: t = 0.71, p = 0,4845,
Atar = 5,88, Aerr = 6,14 (рис. 14).
Рис. 14. Антонимы: возраст усвоения искомого и заменяющего слов
Таким образом, возраст усвоения искомого и заменяющего слов существенно различается лишь в тех случаях, когда искомое слово заменяется его когипонимом или ассоциативно связанным словом, но не тогда, когда заменяющее слово является антонимом искомого.
4.5. Ассоциативная связь между искомым и заменяющим словами
Анализ пар «искомое слово-замена» проводился на основе данных Русского ассоциативного словаря [Русский ассоциативный словарь 2002], включающего 7000 слов-стимулов и около 105000 ассоциативных реакций. Словарь составлялся методом свободного ассоциативного эксперимента, поэтому он отличается чрезвычайным разнообразием ассоциативных реакций, а в связи с тем, что число участников каждого из экспериментов, как правило, не превышало 100 человек, величины частот ассоциаций в словаре обычно невелики.
Поскольку не все искомые слова из совокупности имеющихся семантических замен включены в Русский ассоциативный словарь в качестве стимулов, был проведен свободный ассоциативный эксперимент для получения ассоциативных реакций на не вошедшие в Ассоциативный словарь искомые слова. Эксперимент проводился с использованием той же методики, которая использовалась при сборе материала для Ассоциативного словаря: списки искомых существительных предъявлялись участникам эксперимента (студентам 3-4 курсов различных факультетов СПбГУ) с инструкцией написать рядом с каждым словом другое слово, первым пришедшее в голову по ассоциации с данным. В эксперименте участвовали 214 студентов, от которых было получено в общей сложности 8987 ассоциативных реакций.
Для сравнения пар «искомое слово-замена» с данными ассоциативного словаря искомое слово принималось за слово-стимул, а заменяющее слово -за ассоциативную реакцию. Сравнивались величины частоты появления заменяющего слова в качестве ас-
социативной реакции на искомое слово в трех анализируемых группах семантических замен. Сравнение показало, что в группе когипонимических замен частота появления заменяющего слова в качестве ассоциативной реакции на искомое слово значительно выше, чем в группе ассоциативных (р = 0,0004, для когипонимических замен средняя абсолютная частота = 2,207 %; для ассоциативных замен
^авво == 1,2506 %). В группе антонимических замен
частота появления заменяющего слова в качестве ассоциативной реакции на искомое слово не только существенно выше, чем в группе ассоциативных (р = 0,0012, для антонимических замен
^а^о с= 4,918 %; для ассоциативных замен
^авво == 1,2506 %), но и значительно выше, чем в группе когипонимических замен (р = 0,0040) (рис. 15).
Ассоциативная связь искомого и заменяющего слов
и
Рис. 15. Ассоциативные замены, когипонимы, антонимы: ассоциативная связь между искомым и заменяющим словами
Полученные результаты свидетельствуют о том, что искомое и заменяющее слова, являющиеся когипонимами и антонимами, находятся в более тесной ассоциативной связи по сравнению с ассоциативными заменами.
4.6. Совместная встречаемость искомого и заменяющего слов
Для вычисления коэффициента взаимной информации, или частоты совместной встречаемости, искомого и заменяющего слов в трех исследуемых группах семантических замен использовались данные Национального корпуса русского языка.
Частота совместной встречаемости искомого и заменяющего слов измерялась с помощью коэффициента взаимной информации (М1) и коэффициента распределения Т. Коэффициент М1 отражает результат сравнения частоты совместной встречаемости двух слов с частотой незави-
симого использования каждого из них, в то время как коэффициент T учитывает в первую очередь абсолютную частоту совместной встречаемости двух слов. Поскольку коэффициент MI имеет тенденцию переоценивать низкочастотные слова, он был использован совместно с коэффициентом T, который является надежным показателем высокой частоты совместной встречаемости двух слов. Таким образом, коэффициент MI является мерой совместной встречаемости, а коэффициент T - критерием надежности этой меры. В данной работе принималось, что два слова обладают достаточно высокой степенью взаимной информации (т.е. появление одного из этих слов в предложении увеличивает вероятность появления в том же предложении второго слова), если значения обоих коэффициентов MI и T превышали свои минимальные приемлемые значения: MI > 3 и T > 2 (см.: [Stubbs 1995; Hunston 2002]). Для каждой из пар «искомое слово-замена» значения коэффициентов MI и T вычислялись с шириной контекстного окна +10 слов (средняя длина предложения в русском языке) по формулам (1) и (2), соответственно (см. [Church etal. 1991]):
MI,
( n,c)
log
f(
т =
(n,c) N
f(n)f(c)
f(n)f(c)
N2
Д
(1)
(2)
(n,c)
N
где п и с - совместно употребляемые слова, N - размер языкового корпуса (измеряемый числом словоформ), /(п) - частота встречаемости одного из слов в корпусе, /(с) - частота встречаемости второго слова и /п с) - частота совместной
встречаемости этих двух слов в корпусе.
Коэффициенты М1 и Т для выборочных ко-гипонимических, антонимических и ассоциативных замен приведены в таблицах 1, 2 и 3.
Таблица 1
Коэффициенты М1 и Т для некоторых когипонимических замен
Искомое слово Замена MI T
неделя месяц 3,18 28,67
дня ночи 2,77 74,86
огурцов помидоров 9,79 15,41
чай сок 2,65 6,18
блюдце тарелку 6,49 4,84
автобус поезд 3,80 8,76
варежки перчатки 8,01 3,59
ужин завтрак 6,39 15,15
Таблица 2
Коэффициенты MI и T для некоторых антонимических замен
Искомое слово Замена MI T
вечер утро 4,09 59,77
на небо на землю 4,04 56,60
в начало в конец 2,94 60,23
после окончания после поступления 3,51 4,37
потомки предки 7,04 11,44
продавца покупателя 8,69 24,77
тренеров воспитанников 4,84 3,34
ответ вопрос 4,41 78,60
Таблица 3
Коэффициенты MI и T для некоторых ассоциативных замен
Искомое слово Замена М1 T
весной в субботу -0,62 -1,07
волосы голову 3,44 42,62
желанием удовольствием 1,63 7,14
зимой ночью 1,49 10,50
магазин холодильник 2,68 3,78
резинку пробку 0 0
случай вариант 0,99 7,55
экзамены каникулы 4,39 3,81
Сравнение показателей частоты совместной встречаемости лемм искомого и заменяющего слов в исследуемых группах семантических замен показало, что значения коэффициента совместной встречаемости М1 в группах когипонимических и антонимических замен значительно превышают соответствующее значение в группе ассоциативных замен (р < 0,0001, для когипонимических замен среднее значение М1 = 4,794, для антонимических замен М1 = 4,712, для ассоциативных замен М1 = 3,213). В то же время значения коэффициента М1 в группах когипонимов и антонимов существенным образом не различаются (р = 0,8994) (рис. 16).
Рис. 16. Ассоциативные замены, когипонимы, антонимы: коэффициенты взаимной информации М1 искомого и заменяющего слов
В результате сравнения групп когипони-мических и ассоциативных замен по числу пар «искомое слово-замена», обладающих высокой степенью взаимной информации (MI > 3 и T > 2), с использованием критерия Фишера оказалось, что число таких пар значительно выше в группе когипонимических замен (p < 0,0001, OR = 3,351). Сравнение групп антонимических и ассоциативных замен также показывает существенно большее число пар с высокой степенью взаимной информации в группе антонимических замен по сравнению с группой ассоциативных замен (p = 0,0194). В то же время между группами когипонимических и антонимических замен не обнаружено статистически значимого различия по числу пар с высокой степенью взаимной информации (p = 1,0000).
Таким образом, результаты сравнительного анализа свидетельствуют о том, что искомое и заменяющее слова гораздо чаще встречаются вместе в одном и том же предложении (т.е. обладают высокой степенью взаимной информации), если они находятся в когипонимических либо антонимических отношениях.
5. Обсуждение результатов
Результаты исследования показывают, что в устной речи существует тенденция замены низкочастотных слов семантически связанными словами более высокой частотности. Эта тенденция является более выраженной, когда искомое и заменяющее слова НЕ находятся в когипонимиче-ских и антонимических отношениях, но также, хотя и в меньшей мере, проявляется, когда заменяющее слово представляет собой когипоним искомого (хотя «эффект частотности» не наблюдается при сравнении абсолютных величин частот слов, он оказывается весьма статистически значимым при сравнении логарифмированных величин). Существование положительной корреляции между частотами искомого и заменяющего слов свидетельствует о том, что частота искомого слова оказывает влияние на вероятность ошибки в процессе семантического поиска во внутреннем лексиконе: чтобы успешно конкурировать с искомой лексической единицей, другое (семантически связанное с ней) слово должно обладать более высокой частотой использования, т.е., в терминах когнитивной лингвистики, должно быть более глубоко закреплено.
В соответствии с теорией распространяющейся активации [Anderson 1983; Dell 1986], в процессе лексического поиска активируется целая сеть лексических единиц, причем степень ак-
тивации более глубоко закрепленного слова (в данном случае - слова-замены) превосходит степень активации искомого слова, и в результате вероятность выбора именно заменяющего слова повышается. Полученные данные позволяют предположить, что вероятностно-статистическая информация о лексических единицах становится доступной на ранних стадиях поиска слов, в частности, на этапе поиска лемм (основных форм слов). Таким образом, фактор частоты использования слова оказывается значимым на протяжении всего процесса поиска слов, что опровергает гипотезу об актуальности этого фактора лишь на этапе морфофонологического поиска лексических единиц [^сЬешак, ЬеуеЬ 1994; .Тшазку 2003 и др.].
Возраст усвоения слова играет существенную роль при его поиске: в случае, когда с искомым словом конкурирует ассоциативно связанная с ним лексическая единица или же его когипоним, усвоенное раньше слово с большей вероятностью будет выбрано говорящим. Иными словами, данные речевых ошибок нормальной речи свидетельствуют о том, что фактор возраста усвоения слова может влиять не только на поиск его фонологических характеристик [Kittredge et а1. 2008], но и на поиск его семантического представления.
Если использовать понятийный аппарат когнитивной лингвистики, результаты исследования свидетельствуют о том, что степень когнитивной закрепленности, рассматриваемая как психологический коррелят частоты использования и возраста усвоения той или иной лингвистической единицы, имеет ключевое значение в процессе поиска лексических единиц при порождении речи.
В случаях, когда заменяющее существительное ассоциативно связано с искомым, исход речевой ошибки определяется как частотой, так и слоговой длиной искомого слова. В подобных случаях заменяющее слово, как правило, является частью создаваемого искомым словом когнитивного фрейма, но в то же время часто находится на периферии его семантического поля.
Напротив, искомое и заменяющее слова, являющиеся когипонимами, несущественно различаются по длине, и длина искомого слова не является значимым предиктором замены. Замена-когипоним более тесно связана с искомыми словом, т.е. характеризуется более высокими показателями ассоциативной связанности и совместной встречаемости с искомым словом, и поэтому, как правило, находится ближе к центру его семантического поля. В этом случае как искомое, так
и заменяющее слово представляют собой базовые категории своей таксономии [Яо8сЬ е! а1. 1976], которые считаются наиболее рано усваиваемыми членами таксономий [Тоша8е11о 2000; ОеегаеГз 2010] и, соответственно, глубже всего закрепляются во внутреннем лексиконе [Schmid 2007]. В семантических заменах этого типа влияние фактора длины слова на исход речевой ошибки, по всей вероятности, оказывается менее существенным, чем тесная ассоциативная связь между искомым и заменяющим словами и опыт их частого совместного использования. Полученные результаты указывают на особый психологический статус когипонимиче-ских отношений в семантическом поле слова и позволяют предположить, что степень взаимной информации лексических единиц существенна при формировании парадигматических связей между значениями внутри семантической категории.
Особняком стоят антонимические замены. При замене искомого слова на его антоним ни частота, ни возраст усвоения, ни длина слова не являются сколько-нибудь существенными предикторами замены. Исход ошибки обусловлен исключительно тесной ассоциативной связью между искомым и заменяющим словами. Это единственная из проанализированных групп семантических замен, в которой «эффект частотности» проявляется лишь в форме частоты совместного использования искомого и заменяющего слов в речи, а не в форме различия их абсолютных частот.
6. Заключение
Итак, данные семантических речевых ошибок в нормальной речи подтверждают гипотезу, что частота использования и возраст усвоения слова (рассматриваемые как корреляты степени его когнитивной закрепленности) относятся к числу факторов, определяющих выбор семантического представления слова при поиске во внутреннем лексиконе. Длина слова также может оказаться существенным фактором в том случае, если конкурентом искомого слова не является его когипоним или антоним. В случаях же замен на когипоним и антоним фактор длины слова оказывается менее существенным, чем речевой опыт говорящего; иными словами, значение опыта частого совместного использования искомого слова и его «конкурента» - когипонима или антонима (и сформированная в результате этого опыта более сильная ассоциативная связь между искомым и заменяющим словами) перевешивает значение фактора длины слова.
Безусловно, для получения более точной картины вероятностно-статистических характери-
стик семантических замен в нормальной речи потребуется более «тонкое» членение видов семантической связи между искомым и заменяющим словами и раздельный анализ относящихся к ним примеров. К сожалению, имеющийся в нашем распоряжении корпус речевых ошибок не позволяет получить статистически значимые результаты при более детальной классификации речевых ошибок из-за слишком небольшого числа примеров каждого из видов семантической связи, вошедших в группу «ассоциативных замен». В то же время выявление тенденции использования вероятностно-статистических характеристик слов на этапе семантического поиска и связанного с этим особого статуса когипонимических отношений между лексическими единицами расширяет наше представление о том, как происходит лексический выбор при порождении речи в норме.
Список литературы
Гак В. Г. Семантические основы парафазий в нормальной речи // Психолингвистика и обучение иностранцев русскому языку. М.: Изд-во МГУ, 1972. С. 143-162.
Леонтьев А. А. Некоторые проблемы обучения русскому языку как иностранному. М.: МГУ, 1970.
НКРЯ - Национальный корпус русского языка. URL: http://www.ruscorpora.ru
Русский ассоциативный словарь. Т. I / под ред. Ю.Н. Караулова, Г.А. Черкасовой, Н.В. Уфим-цевой, Ю.А. Сорокина, Е.Ф. Тарасова. М.: Астрель, 2002.
Anderson J.R. A spreading activation theory of memory // Journal of Verbal Learning and Verbal Behavior. 1983. Vol. 22. № 3. P. 261-295.
Brysbaert M., Wijnendaele I.V., De Deyne S. Age-of-acquisition effects in semantic processing tasks // Acta Psychologica. 2000. Vol. 104. P. 215-226.
Catling J. C., Dent K., Johnston, R. A., Baldin R. Age of acquisition, word frequency, and picture-word interference // The Quarterly Journal of Experimental Psychology. 2010. Vol. 63. № 7. P. 1304-1317.
Church K., Gale W., Hanks P., Hindle D. Using statistics in lexical analysis // Lexical Acquisition / ed. U. Zernik. Englewood Cliff: Erlbaum, 1991. P.115-164.
Collins A.M., Loftus E.F. A spreading-activation theory of semantic processing // Psychological Review. 1975. Vol. 82. P. 407-428.
Dell G.S. A spreading-activation theory of retrieval in sentence production // Psychological Review. 1986. Vol. 93. № 3. P. 283-321.
Del Viso S., Igoa J.M., Garcia-Albea J.E. On the autonomy of phonological encoding: Evidence from slips of the tongue in Spanish // Journal of Psy-cholinguistic Research. 1991. Vol. 20. P. 161-185.
Evans V., Green M. Cognitive Linguistics: An Introduction. Edinburg: Edinburgh University Press, 2006.
Finocchiaro C., Caramazza A. The production of pronominal clitics: implications for theories of lexical access // Language and Cognitive Processes.
2006. Vol. 21. P. 141-180.
Geeraerts D. Theories of Lexical Semantics. N.Y.: Oxford University Press, 2010.
Gerhand S., Barry C. When does a deep dyslexic make a semantic error? The roles of age- of-acquisition, concreteness, and frequency // Brain and Language. 2000. Vol. 74. P. 26-47.
German D.J., Newman R.S. The impact of lexical factors on children's word-finding errors // Journal of Speech, Language, and Hearing Research. 2004. Vol. 47. P. 624-636.
Gordon J.K. Phonological neighborhood effects in aphasic speech errors: Spontaneous and structured contexts // Brain and Language. 2002. Vol. 82. P. 113-145.
Harley T.A., MacAndrew S.B.G. Constraints upon word substitution speech errors // Journal of Psycholinguistic Research. 2001. Vol. 30. P. 395-418.
Hotopf W. H.N. Semantic similarity as a factor in whole-word slips of the tongue // Errors in linguistic performance: Slips of the tongue, ear, pen and hand / V. Fromkin (ed.). N.Y.: Academic Press, 1980. P. 97-109.
Hudson R. Word grammar. // The Oxford Handbook of Cognitive Linguistics / D. Geeraerts, H. Cuyckens (eds.). N.Y.: Oxford University Press,
2007. P. 509-539.
Hunston S. Corpora in Applied Linguistics. Cambridge: Cambridge University Press, 2002.
Jescheniak J.D., Levelt W.J.M. Word frequency effects in speech production: Retrieval of syntactic information and of phonological form // Journal of Experimental psychology: Learning, Memory, and Cognition. 1994. Vol. 20. № 4. P. 824-843.
Jurafsky D. Probabilistic modeling in psycholin-guistics: Linguistic comprehension and production // Probabilistic Linguistics / R. Bod, J. Hay, S. Jannedy (eds.). Cambridge, MA: MIT Press, 2003. P. 39-95.
Kapatsinski V. Frequency of use leads to auto-maticity of production: Evidence from repair in con-
versation // Language and Speech. 2010. Vol. 53. № 1. P. 71-105.
Kittredge A.K., Dell G.S., Verkuilen J., Schwartz M.F. Where is the effect of frequency in word production? Insights from aphasic picture-naming errors // Cognitive Neuropsychology. 2008. Vol. 25. P. 463-492.
Kuperman V., Stadthagen-Gonzalez H., Brys-baert M. Age-of-acquisition ratings for 30,000 English words // Behavior Research Methods. 2012. Vol. 44. P. 978-990.
Langacker R. W. Foundations of cognitive grammar. Vol. 1.Theoretical Prerequisites. Stanford, CA: Stanford University Press, 1987.
McNamara T. P. Theories of priming: I. Associative distance and lag // Journal of Experimental Psychology: Learning, Memory, & Cognition. 1992. Vol. 18. P. 1173-1190.
Meschyan G., Hernandez A. Age of acquisition and word frequency: Determinants of object-naming speed and accuracy // Memory & Cognition. 2002. Vol. 30. № 2. P. 262-269.
Morrison C.M., Ellis A.W., Quinlan P.T. Age of acquisition, not word frequency, affects object naming, not object recognition // Memory & Cognition. 1992. Vol. 20. № 6. P. 705-714.
Navarrete E., Basagni B., Alario F.-X., Costa A. Does word frequency affect lexical selection in speech production? // The Quarterly Journal of Experimental Psychology. 2006. Vol. 59. P. 1681-1690.
Oldfield R.C., Wingfield A. Response latencies in naming objects // The Quarterly Journal of Experimental Psychology. 1965. Vol. 17. P. 273-281.
Rosch E., Mervis C.B., Gray W.D., Johnson D.M., Boyes-Braem P. Basic objects in natural categories // Cognitive Psychology. 1976. Vol. 8. P. 382-439.
Schmid H.-J. Entrenchment, salience, and basic levels // The Oxford Handbook of Cognitive Linguistics / D. Geeraerts, H. Cuyckens (eds.). N.Y.: Oxford University Press, 2007. P. 117-138.
Stadthagen-Gonzalez H., Davis C.J. The Bristol norms for age of acquisition, imageability, and familiarity // Behavior Research Methods. 2006. Vol. 38. P. 598-605.
Stubbs M. Collocations and semantic profiles: on the cause of the trouble with quantitative studies // Functions of Language. 1995. Vol. 2. № 1. P. 23-55.
Tomasello M. First steps toward a usage-based theory of language acquisition // Cognitive Linguistics. 2000. Vol. 11. № 1-2. P. 61-82.
Turner J. E., Valentine T., Ellis A. W. Contrasting effects of age of acquisition and word frequency on auditory and visual lexical decision // Memory & Cognition. 1998. Vol. 26. № 6. P. 1282-1291.
Vitevitch M. S. The neighborhood characteristics of malapropisms // Language and Speech. 1997. Vol. 40. P. 211-228.
S.I. Gorokhova
SEMANTIC SUBSTITUTIONS IN NORMAL SPEECH: A PROBABILISTIC ANALYSIS OF SPEECH ERRORS
The author analyzes semantic substitution errors (slips of the tongue) for word frequency, age of acquisition, word length, target-error co-occurrence strength, and word association norms.
For non-antonym substitutions, target word frequencies appear to be significantly lower than error word frequencies and the age of acquisition of target words is older than that of error words; besides, there is a very significant positive correlation between target and error frequency values.
Contrary to the view that the frequency effect is located at the stage of morphophonological encoding, the results suggest that frequency is also coded at the semantic lemma level. Word length is another significant variable that determines the outcome of the error for non-cohyponym and nonantonym target-error pairs. At the same time, cohyponym and antonym target-error pairs are characterized by much higher co-occurrence measures and stronger associative links compared to other substitution types.
The author discusses theoretical implications of these findings.
Keywords: speech errors, semantic relatedness, word frequency, age of acquisition, word length, cohyponyms, antonyms.