Научная статья на тему 'Криптоклассный анализ лексики: этапы и перспективы'

Криптоклассный анализ лексики: этапы и перспективы Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
462
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИПТОКЛАССНЬГЙ АНАЛИЗ / КЛАССИФИКАТОР / МОДЕЛИРУЮЩЕЕ ЯДРО / МОДЕЛЬ СЛОВОСОЧЕТАЕМОСТИ / CRYPTOTYPE ANALYSIS / CLASSIFIER / MODELING CORE / NOUN COMBINATORY MODEL

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Борискина О. О.

В статье рассматривается технология выявления криптоклассной системы языка методом криптоклассного анализа именной лексики. В зоне внимания процедурные особенности и возможности метода, используемого в проекте «Моделирование сочетаемости абстрактной лексики английского языка».

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Cryptotype analysis of noun lexis: stages and perspectives

The article considers the technological aspects of Cryptotype noun system revelation by the method of Cryptotype Analysis of noun Lexis. The procedure peculiarities and possibilities of the method applied in the project "Modelling of the combinatory power of abstract lexis of the English language" in the focus of attention.

Текст научной работы на тему «Криптоклассный анализ лексики: этапы и перспективы»

9. Словарь русского языка XI-XVII вв. М., 1987. Вып. 13. С. 158.

Поступила в редакцию 22.04.2008 г.

Safonova I.A. Semantic transformations of Old Russian verb as a means of reality conceptualization. In the

article the features of functioning the verbs of perception in the eleventh - fourteenth centuries manuscripts are considered. In the process of multi-aspectual investigation the interrelation of the results of conceptualization of reality and semantic transformations in semantic structure of the verb has been brought to light.

Key words: perception, semantic structure, semantic transformations, conceptualization.

КРИПТОКЛАССНЫЙ АНАЛИЗ ЛЕКСИКИ: ЭТАПЫ И ПЕРСПЕКТИВЫ

О.О. Борискина

В статье рассматривается технология выявления криптоклассной системы языка методом криптоклассного анализа именной лексики. В зоне внимания - процедурные особенности и возможности метода, используемого в проекте «Моделирование сочетаемости абстрактной лексики английского языка».

Ключевые слова: криптоклассный анализ, классификатор, моделирующее ядро, модель словосо-четаемости.

В процессе работы над языковой категоризацией первостихий в русском и английском языках [1, 2] был разработан метод исследования языка, имеющий целью распределение именной лексики по криптоклассам, получивший название криптоклассного анализа. Технология и процедура выявления криптоклассов имен уже были описаны нами [3-5], как и результаты криптоклассного распределения отдельных лексических образований английского, русского и немецкого языков [4, 6-8].

Идеи криптоклассной категоризации имен легли в основу проекта кафедры теоретической и прикладной лингвистики Воронежского госуниверситета «Моделирование сочетаемости абстрактной лексики английского языка». Для проверки рабочих гипотез проекта, связанных с криптоклассным статусом именной лексики, формируется корпус, отражающий потребности исследования из полнотекстовых электронных информационных ресурсов и конкордансов электронных баз данных национальных корпусов (в частности, Bank of English http://sara.natcorp. ox.ac.uk/lookup.html, http://view.byu.edu, http:// thesis.bl.uk./lookup.html), привлекаются и частотные возможности ресурсов.

При обращении к проблемам системного описания и формального моделирования со-

четательных свойств лексики мы предлагаем обратить внимание на информативность криптоклассного представления знаний о природе языковых явлений.

За отсутствием убедительных оснований для отрицания системности сочетательных процессов в языке и в связи с тем, что формального представления лексико-синтаксической сочетаемости, насколько нам известно, не предлагалось, мы предприняли попытку создать компьютерную модель комбинаторных свойств абстрактных имен английского языка. Однако достичь этой конкретной цели оказалось непросто; она, как линия горизонта, коварно ускользала от нас, уводя в глубины языкового бытия.

Для выявления, объяснения и прогнозирования существования такого языкового феномена, как «сети лексико-синтаксической сочетаемости», нами используются технологические возможности электронных баз данных и методика криптоклассного анализа именной лексики.

Криптоклассный анализ лексики

Предложенный анализ в силу трудоемкости и объективной условности принимаемых решений не претендует ни на исчерпывающую полноту, ни на универсальность, ни на непротиворечивость, ибо логическая непротиворечивость любого членения лексики

в идеографическом аспекте «остается принципиально недостижимой» [9]. И все же, несмотря на агностические настроения некоторых метров лингвистической науки (ср., например, точку зрения Дж. Халлидея, считающего языковые категории неуловимыми для истолкования, несмотря на наши сознательные усилия достичь его), хочется верить, что и метод, и результаты исследования (модель лексико-синтаксической сочетаемости) будут технологически востребованы для автоматической обработки текстов и решения задач понимания естественных языков в компьютерно-опосредованной коммуника-

ции; для повышения эффективности языкового образования и мониторинга языковой политики; а в перспективе и для разработки интеллектуальных компьютерных систем.

В основу предлагаемого метода положен тезис о взаимосвязи скрытой категориальной активности языковой единицы и семантикосинтаксической валентности слова. В самом общем виде метод криптоклассного анализа состоит в изучении лексической синтагматики с целью выявления распределения предметно-неориентированной лексики по криптоклассам.

Криптоклассом мы называем скрытую (не имеющую специальных, стандартных грамматических показателей) категорию языка, образованную по полевому принципу моделирующего ядра и моделируемой периферии. Имена, входящие в состав криптокласса, на первый взгляд, не разделяют общих признаков. К примеру, что может быть общего между таким социально-значимым явлением как население и водой? Или между политикой и живым существом, способным самостоятельно перемещаться? Ср., Российская политика перешла на западные финансовые стандарты; население бывших республик Союза хлынуло в Россию. Очевидно, одно явление (политика, население) моделируется или категоризуется языком по типу и подобию другого (ходячего живого, водяного тела), что находит отражение в синтагматике. В терминах криптоклассного анализа, имена живых существ, способных самостоятельно перемещаться, образуют моделирующее ядро криптокласса русского языка «Самостоятельно перемещающиеся», тогда как имя политика принадлежит моделируемой периферии данного криптокласса. Соответ-

ственно, имя население находится на периферии криптокласса «Водяное тело». По-видимому, объединяющим началом для членов криптокласса служат сходства в реализации их сочетательного потенциала. Фактически, признак, связывающий разные по тематике и семантике имена, имеет когнитивную природу и принадлежит к глубинному уровню языковой категоризации, характеризующемуся подвижностью, гибкостью, естественностью, обязательной долей универсальности, непоследовательностью, нестабильностью и лакунарностью.

Криптокласс, выступая в функции системологически ориентированной единицы организации лексико-синтаксической сочетаемости, представляется нам удобным средством изучения узуального и окказионального употребления словарных сочетаний, обусловленного особенностями языковой картины мира англоязычного сознания.

Выбор криптоклассной системы для моделирования лексической синтагматики диктуется двумя факторами: практическими целями построения динамической модели лексической синтагматики и характером связей между единицами криптокласса, «навязываемых» языковой системой в соответствии с механизмом наследования «архетипических» свойств языковых единиц. Остановимся подробнее на процедурных особенностях криптоклассного анализа.

1. Вынужденная фрагментарность метода

Поскольку лексический состав языка -по масштабу и разнообразию единиц и отношений - фактически необозрим в рамках одного исследования, исследователь вынужден прибегать к процедуре ограничения или отбора материала, релевантного поставленным целям. Так, например, при формировании корпуса классифицируемых элементов (КЭ) именной лексики английского языка (по данным словаря Collins Cobuild English Dictionary for Advanced Learners, 2001) нами отбирались так называемые абстрактные имена.

Анализ сочетательной ценности Nomina Abstracta - «обязательной и значительной по объему части словаря» [10] представляется нам актуальным, по крайней мере, в двух аспектах.

Во-первых, подавляющее большинство таких имен, не имея собственной субъектной, объектной или адъективной сочетаемости, вынуждены реализовывать свою синтагматическую значимость, в рамках несобственной сочетаемости, что определено в работе В. В. Морковкина [11]. В отличие от «денотативно ориентированных знаков», сочетаемость которых часто предсказуема, «умопостигаемые сущности вторичной реальности сознания» [10] менее предсказуемы. Именно это обстоятельство делает их потенциальными представителями периферии любого криптокласса.

Во-вторых, выбор материала исследования обусловлен частым использованием данной лексики в метафорических сочетаниях, ее широким употреблением в текстах, имеющих целью воздействие на сознание и мировоззрение потенциального адресата.

В целях обозримости материала в качестве ограничителя корпуса абстрактных имен может использоваться критерий частотности, например, имена, относящиеся ко второму из шести уровней частотности, имеют помету (****) в словаре Collins Cobuild English Dictionary for Advanced Learners, 2001.

2. Обращенность метода к наивной картине мира

Предлагаемый подход к моделированию лексико-синтаксической сочетаемости ориентирован терминологически и методологически на систему координат языковой категоризации мира. Криптоклассный анализ лексики должен базироваться на глубинной иерархии когнитивно-прагматических универсалий и оппозиций, с помощью которых человек конструирует действительность.

Построение криптоклассной таксономии диктует необходимость выделения коммуникативно-значимых и классо-формирующих свойств объектов реальной действительности, таких как свойство объекта вмещать в себя другие объекты; иметь малый (сопоставимый с размером ладони и легко перемещаемый мускульной силой человека) размер; свойство остроконечной формы колоть или резать; свойства живой VS. неживой материи и т. д.

Каждое из таких свойств, жизненно важных для древнего человека, представляется нам когнитивно-ценным и надежным для категоризационных целей. Вероятно, на этапе осмысления человеком мира, когда появи-

лась необходимость обмениваться при общении не только предметными именами, но и «оперировать вторичной реальностью мира», оказалось удобно категоризовать, к примеру, честь по типу и понятию мелкого предмета (которую полагалось всегда носить с собой (omnia mea...) и заявлять об этом (честь имею), беречь смолоду, правда, при определенных обстоятельствах с ней приходилось расставаться: отдавать, терять, отбирать или лишать). Именно это обстоятельство позволяет исследователю современного этапа становления языка наблюдать как подобные имена «приспособились» обходиться без собственной субъектной или объектной сочетаемости, избирательно «наследуя» при этом сочетательные свойства определенных предметноориентированных языковых единиц.

3. Привлечение данных о внутренней формальности языка

Чтобы выделить криптокласс, необходимо установить, какие лексемы могут служить его классификаторами. Способность глагольных лексем проецировать другим единицам позиции для замещения выступает в виде категоризующей или классифицирующей функции глаголов [12]. Метод криптоклассного анализа предполагает учитывать не только категоризующую способность глаголов, но и имен прилагательных и существительных в качестве дополнительного ресурса восстановления стертых или утерянных связей между членами криптокласса.

Каждый классификатор интересен нам как обладающий определенной значимостью (т. е. занимающий определенное место в системе связей и отношений). Значимость проявляется в синтаксических свойствах физических коммуникативных единиц, т. е. в текстах как единственно доступных непосредственному «наблюдению». Сравним убеждение Ю.Н. Караулова в том, что вся информация о языке «записана» при слове, которое проецирует все свои, в том числе и синтаксические, свойства в формирующееся высказывание в процессах порождения речи [11].

Для определения количественного и качественного состава классификаторов, кате-горизующая функция которых способна указывать на принадлежность имени к определенному криптоклассу, исследователь с необходимостью обращается к внутренней форме предполагаемых глагольных, адъек-

тивных или субстантивных классификаторов, ибо «в каком-то смысле все семантические дериваты слова заложены в его исходном значении» [13]. Мы позволили себе абстрагироваться от принятого в лексикографии деления значений на исходные / производные, прямые / переносные. Значения анализируемых лексем интересуют нас как сложные целостные образы с определенным набором свойств, из которых мы принимаем к рассмотрению составляющие внутренней формы слова. Ведь именно внутренняя форма слова составляет тот «хребет», который в меньшей степени подвержен разрушениям на обозримом отрезке времени, ибо формировался такой хребет веками из наивных, но, тем не менее, жизненно важных и коммуникативно-значимых представлений человека об окружающем мире.

Представить процесс отбора классификаторов можно на примере криптокласса имен английского языка (АЯ) «Самостоятельно перемещающееся».

Глагольные значения, имеющие интегральным признаком ‘самостоятельное передвижение в пространстве’ обозначаются 109 глагольными лексемами АЯ. После восстановления их внутренней формы (где это возможно) лишь 77 были отобраны в качестве надежных классификаторов данного криптокласса. Среди них глаголы англо-саксонского, латинского, французского и неизвестного происхождения, заимствованные английским языком в разное время, с разной степенью функциональной нагруженности в современном английском языке. Ср., например, to troll (ходить, прогуливаться) < O.Fr. troller в значении “to wander, to go in quest of game without purpose” < O.H.G. trollen в значении “to walk with short steps”], to roam (бродить, скитаться) < probably related to Middle Dutch rammelen to ROAM (of animals). Каждый из них требует для замещения в позиции субъекта (S-позиция) имени субъекта самодвижущейся природы. Соответственно, имена живых существ составляют моделирующее ядро данного криптокласса (a man, a hunter, a sheep, a deer и т. п.). Периферия данного криптокласса включает имена «умопостигаемых сущностей вторичной реальности сознания». К ним относятся явления психического и физического миров человека, категоризуемые английским языком подоб-

ными перемещающимся «на своих ногах». Ср., Anger sprints through your body, the Great Idea scampered away, children’s ...idea was walking hand in hand with Dinah.

Практика криптоклассного анализа показала, что в категоризационных процессах языкового сознания в функции классификаторов задействованы не отдельные лексемы или граммемы, а их кластеры, которые служат показателем скрытой активности криптокласса в речи и ориентиром для исследователя языковой категоризации. Так, одним из показателей скрытой активности имен периферии данного криптокласса является их способность замещать S-позицию глагольных классификаторов кластера, в семантике которых заложен признак ‘перемещаться украдкой’ to slide (скользить, бесшумно двигаться) [< O.E. slidan "move smoothly, glide'”], to slink (уползти потихоньку) [< O.E. slincan "to creep, crawl" (of reptiles)] < P.Gmc. *slenkanan (cf. Swed. slinka "to glide"], to slip (двигаться бесшумно), to sneak (красться) [< M.E. sniken в значении “to creep, crawl” <

O.E. snican в значении “to desire, reach for sneakily” < P.Gmc. *sneikanan]. Имена ядра данного криптокласса также способны в большей или меньшей степени замещать S-позицию глагольных классификаторов кластера ‘перемещаться, испытывая сложность’: to limp (идти хромая), to stumble (идти спотыкаясь) [< a Scand. source

(cf. dialectal Norw. stumla, Swed. stambla в значении “to trip or miss one's footing”')].

4. Конструкторские возможности метода

Реконструкция периферии криптоклассов представляет собой процедуру установления членства КЭ в криптоклассах имен английского языка. Этот этап криптоклассного анализа предполагает использование поисковых возможностей электронных баз данных и других ИПС всемирной сети WWW по запросу пользователя. В поисках свидетельств замещения КЭ S-позиции классификаторов выделенных криптоклассов нами проверяются все потенциальные пересечения списка классификаторов и списка КЭ.

Результаты криптоклассного анализа лексики заносятся в электронную таблицу, где по горизонтали расположены классификаторы, а по вертикали представлены имена (рис. 1).

Задача заполнения таблицы решается нами параллельно с созданием банка контекстов несобственной сочетаемости КЭ. Использование информации о частотности узуальных словосочетаний английского языка также может найти отражение в таблице в виде цифрового обозначения количества замещений КЭ S-позиции определенного классификатора. Сравнение показателей частотности реализации криптоклассного сочетательного потенциала абстрактных имен английского языка поможет нам выявить закономерности сочетательной избирательности КЭ и представить результаты анализа в виде формулы. Обработка табличных данных криптоклассного анализа также откроет возможности высчитывания меры представленности имени в криптоклассе в целях прогнозирования сочетательной (синтагматической) мобильности имени. Данные криптоклассного анализа на выходе (output data) должны стать (input data) данными для создания компьютерной модели лексико-синтаксической сочетаемости.

1. Борискина О. О. Знание о первостихиях по данным русского и английского языков //

Труды молодых ученых Воронеж. ун-та. Воронеж, 1999. Вып. 1. С. 409-416.

2. Борискина О.О. Криптоклассы первостихий как элемент онтогностического описания языка // Проблемы лингвистической прогностики. Воронеж, 2000. Вып. 1. С. 121-126.

3. Борискина О.О., Кретов А.А. Теория языковой категоризации: национальное языковое сознание сквозь призму криптокласса. Воронеж, 2003.

4. Борискина О.О. Введение в когнитивную лингвистику / под ред. М.В. Пименовой. Кемерово, 2004.

5. Борискина О.О. Лексико-синтаксическая сочетаемость в криптоклассном измерении // Филология и культура: материалы VI Между-нар. науч. конф. Тамбов, 2007. С. 340-344.

6. Борискина О. О. «Полет мысли» или методика исследования криптоклассов // Вестн. ВГУ. Сер. Лингвистика и межкультурная коммуникация. Воронеж, 2004. № 1. С. 61-66.

7. Борискина О.О. Моделирование лексикосинтаксической сочетаемости // Теоретические и прикладные аспекты описания языка и межкультурной коммуникации: сб. науч. тр. Воронеж, 2007.

8. Молчанова Л. В. Языковая категоризация пер-востихий огня и воды в немецком языке // Проблемы германских и романских языков:

лингвистика, методика, лингвострановеде-ние. Воронеж, 2006.

9. Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка. М., 1981.

10. Кубрякова Е.С. В генезисе языка, или размышления об абстрактных именах // Вопр. когнитивной лингвистики. 2006. № 3. С. 5-15.

11. Морковкин В. В. Семантика и сочетаемость слова // Сочетаемость слов и вопросы обучения русскому языку иностранцев: сб. ст. / под ред. В.В. Морковкина. М., 1984.

12. Кретов А.А. Съедобное - несъедобное или криптоклассы русских существительных // Ьш^ієйса Зііеєіапа. 1992. № 14. С. 104-114.

13. Падучева Е.В. К структуре семантического поля ‘восприятие’ (на материале глаголов восприятия в русском языке) // Вопр. языкознания. 2001. № 4. С. 23-44.

Поступила в редакцию 3.03.2008 г.

Boriskina O.O. Cryptotype analysis of noun lexis: stages and perspectives. The article considers the technological aspects of Cryptotype noun system revelation by the method of Cryptotype Analysis of noun Lexis. The procedure peculiarities and possibilities of the method applied in the project “Modelling of the combinatory power of abstract lexis of the English language” in the focus of attention.

Key words: Cryptotype analysis, classifier, modeling core, noun combinatory model.

ХАРАКТЕРИСТИКА ФРАЗЕОЛОГИЗМОВ В СИСТЕМЕ ЛЕКСИКО-ФРАЗЕОЛОГИЧЕСКИХ ПОЛЕЙ ПО НАЦИОНАЛЬНО-КУЛЬТУРНОМУ ПРИЗНАКУ (НА МАТЕРИАЛЕ НЕМЕЦКОГО И РУССКОГО ЯЗЫКОВ)

А.Е. Гусева

В статье рассматриваются национально-культурные особенности фразеологизмов, сгруппированных по принципу принадлежности к одному лексико-фразеологическому полю. Исследование проводится в рамках четырех лексико-фразеологических полей, вербально отражающих основные коммуникативные процессы познания человеком окружающей действительности: слуховая / зрительная / мыслительная / речевая деятельность. Проводится характеристика ФЕ с точки зрения оценочного знака, поскольку изучение познавательных процессов, связанных с формированием различных типов знания о мире, включает, в частности, рассмотрение того, как человек определенной культуры осознает и категоризирует наблюдаемый мир.

Ключевые слова: устойчивый словесный комплекс, немецкий и русский языки, нормативностилистическая окраска, локально-темпоральные принадлежности, просторечие.

Фразеология языка является универсальным средством и ценнейшим лингвистическим наследием, отражающим национальную культуру, историю, обычаи, верования народа.

Накопление внеязыковой информации во фразеологии представляет собой длительный и исторически обусловленный процесс, в результате которого фразеологизмы становятся средоточием фоновых знаний о стране и народе-носителе языка, так как «в любом фразеологизме заложено своеобразие восприятия мира через призму языка и национальной культуры» [1].

Культура связана с сознанием, со сложным комплексом небиологических, социально транслируемых знаний и отношений, со стереотипами поведения, в том числе и рече-

вого, с системой знаков и значений, т. е. с языком.

Язык, в свою очередь, пронизывает культуру, развивается в ней, выражает ее. Оба феномена - язык и культура - характеризуются общими свойствами и признаками:

1. Язык и культура - это формы сознания, которые отражают мировоззрение человека и народа.

2. Язык и культура - это созданные человеком, обществом артефакты, которые связывают человека и природу, но также и разделяют их (культура и природа противопоставляются друг другу).

3. Оба феномена обладают индивидуальными и общественными формами существования; субъектом языка и культуры является

i Надоели баннеры? Вы всегда можете отключить рекламу.