Научная статья на тему 'КОРПУСНЫЕ ТЕХНОЛОГИИ ИЗУЧЕНИЯ РУССКОЙ ЛИНГВОКУЛЬТУРЫ В АСПЕКТЕ РКИ'

КОРПУСНЫЕ ТЕХНОЛОГИИ ИЗУЧЕНИЯ РУССКОЙ ЛИНГВОКУЛЬТУРЫ В АСПЕКТЕ РКИ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
175
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
русский язык / лингвокультура / корпусные технологии / русский язык как иностранный / Russian language / linguoculture / corpus technologies / Russian as a foreign language

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Н.В. Семёнова

Изучение лингвокультуры – необходимое условие успешного формирования вторичной языковой личности, способной к эффективной коммуникации в условиях разных культурных фонов. Такое изучение всегда опиралось на аутентичные и оригинальные тексты, демонстрирующие специфику менталитета носителей изучаемого языка и особенности его языковой картины мира. Наибольшей лингвистической и методической ценностью в этом плане, считает автор, сейчас обладают тексты-высказывания, которые содержатся в языковых корпусах, в том числе в «Национальном корпус русского языка» (НКРЯ). Уточнение лингвистических принципов работы с корпусными данными НКРЯ и определяет актуальность исследования. Цель статьи – продемонстрировать возможности корпусных технологий НКРЯ в изучении русской лингвокультуры и описать корпусные инструменты, помогающие охарактеризовать парадигматические и синтагматические свойства русской лексики с «культуроносными» смыслами. К такой лексике автор относит «лингвоспецифичные слова», общеславянскую лексику, несущую культурно значимую для русского этноса информацию, а также топонимы, прежде всего те, которые актуализируют в языковой форме разные коды русской культуры. Анализ фактического материала проводился методами корпусного и контекстуального анализа с использованием элементов статистического метода при выявлении частотности той или иной лексической единицы. Основным результатом исследования является характеристика процедуры работы с лингвокультурной лексикой в НКРЯ, предполагающей простые поисковые запросы и лексико-грамматический поиск по особым параметрам с уточняющими семантическими и грамматическими признаками. Данная процедура позволяет устанавливать условия естественной «контекстуализации» для тех слов, которые определяют «образ» русской лингвокультуры в сознании инофонов и носителей русского языка. К таким условиям автор относит хронологию вхождения лексических единиц, развитую синонимию, окказиональное использование имеющихся словообразовательных моделей, «кодирование» культурных смыслов разными группами лексических единиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CORPUS TECHNOLOGIES FOR STUDYING RUSSIAN LINGUISTIC CULTURE IN THE ASPECT OF RFL

Learning about a linguoculture is a prerequisite for successfully acquiring a second or foreign language, or developing a personality profile by means of this language that will enable the speaker to communicate effectively and efficiently in different cultures. Such learning has always been based on authentic texts demonstrating the particular features of the mentality and the linguistic world view that the native speakers of a language have. The author believes that of the greatest linguistic and methodological values in this respect are narratives included in the Russian National Corpus (RNC). The relevance of the article lies in clarifying the linguistic principles of working with corpus data presented in RNC. The purpose of the article is to demonstrate the opportunities that RNC provides to those studying Russian linguoculture and to describe corpus tools that help to determine the paradigmatic and syntagmatic properties of Russian words that are culture-loaded. This set of vocabulary includes culture-specific words, words common for all Slavic cultures and culturally significant for Russians, and toponyms. Their key feature is that they are associated with cultural values. The language material used in the research is studied by means of corpus and contextual analysis. Also, elements of the statistical method are used when identifying word frequencies. The major result of the research is a description of the procedure for working with linguocultural vocabulary using RNC. It involves simple search queries as well as lexical and grammatical search by particular parameters clarifying semantic and grammatical features. This procedure allows for determining the contextualization conditions for the words that define the “image” of Russian linguoculture in the minds of both foreigners and native speakers of the Russian language. Such conditions include the occurrence chronology, a wide range of synonyms, occasional use of existing word-formation models, and “coding” culture-loaded meanings by different groups of lexical units.

Текст научной работы на тему «КОРПУСНЫЕ ТЕХНОЛОГИИ ИЗУЧЕНИЯ РУССКОЙ ЛИНГВОКУЛЬТУРЫ В АСПЕКТЕ РКИ»

3. Barashkov G.M. Analogovye formy grazhdanskogo obschestva (na primere afrikanskih stran). Izvestiya Saratovskogo universiteta. Novaya seriya. Seriya Sociologiya. Politologiya. 2016; T. 16, Vypusk № 2: 208 - 215.

4. Horol'skij V.V. Medijnost' tekstov v sredstvah massovoj informacii (istoricheskie i teoreticheskie problemy): monografiya. Voronezh, 2016.

5. Bekaj S. Vozdejstvie politicheskih konfliktov na razvitie mediasistemy Mali v usloviyah «kontroliruemoj demokratii» (2013 - 2021 gody). Mir nauki, kultury, obrazovaniya. 2021; № 4 (89): 429 - 434.

6. Brunet R. Opération Barkhane: Les problèmes sur place ne sont pas réglés. France24. 2017; 22 dekabrya Available at: http://www. france24.com/fr/20171221-niger-emmanuel-macron-operation-barkhane-g5-sa hel-mali-burkina-faso-tchad-mauritanie

7. Kejta K. Vliyanie islama na politiku i SMI v respublike Mali. Vestnik Voronezhskogo gosudarstvennogo universiteta. Seriya: Filologiya. Zhurnalistika. 2016; № 4: 103 - 106.

8. Horol'skij V.V. «Sobytie» v zhurnalistike i teorii massovyh kommunikacij: shodstvo i razlichiya v podhodah. Vestnik Novosibirskogo gosudarstvennogo universiteta. Seriya 10: Zhurnalistika. Novosibirsk, 2013; T. 12: 23 - 30.

9. Sangare Sh.K. Razvitie zakonodatel'stva o SMI v Mali kak faktor demokraticheskogo razvitiya v period tret'ej respubliki. Sbornik statej mezhdunarodnoj nauchno-prakticheskoj konferencii: v 3 t. Novopolock: Uchrezhdenie obrazovaniya «Polockij gosudarstvennyj universitet», 2016: 93 - 96.

10. Horol'skij V.V. Zapad i ne-Zapad. Povorotnye punkty v istorii mirovoj zhurnalistiki nashego vremeni. Zhurnalistika razvivayuschihsya stran: perehodnyj 'etap 'evolyucii. Voronezh, VGU, 2019: 4 - 8.

11. Thiriot C. Rôle de la société civile dans la transition et la consolidation démocratique en Afrique: éléments de réflexion à partir du cas du Mali. Dans Revue internationale de politique comparje. 2002; Vol. 9 (2): 277 - 278.

12. Perret T. Le Temps des journalistes. L'invention de la presse en Afrique francophone. Paris: Karthala, 2005.

13. Yazykovaya sem'ya mande. Muzej antropologii i 'etnografii im. Petra Velikogo. Available at: http://mandelang.kunstkamera.ru/index/mandelang/semya_mande

14. Baché D. Mali: la lutte sans fin contre les djihadistes. Le Figaro. 2015; 27 noyabrya. Available at: https://www.lefigaro.fr/international/2015/11/27/01003-20151127ARTFIG00234-mali-la-lutte-sans-fin-contre-les-djihadistes.php

15. Bekaj S., Malahovskij A.K. SMI Mali: novye tendencii vtorogo desyatiletiya XXI veka. Mirovaya zhurnalistika: edinstvo mnogoobraziya: sbornik nauchnyh trudov: v 2 t. Moskva: RUDN, 2018; T. II: 253 - 258.

16. Sangare Sh.K. SMI Mali: struktura, obschestvennaya znachimost' i tendencii razvitiya. Mediaskop. 2016; Vypusk 4: 34 - 47. Available at: http://www.mediascope.ru/2201

17. Portyakova N. Pechali Mali: iz-za chego voennye smestili prezidenta strany. Izvestiya. 2020; 20 avgusta.

18. Pravitel'stvo Mali i povstancy-tuaregi zaklyuchili peremirie. RIA Novosti. Available at: https://ria.ru/20130618/944210986.html

19. Pavlov K. Reportazh so dna mirovoj civilizacii. Available at: https://www.tourister.ru/responses/id_36595

20. Zhambikov A.M. Politicheskij krizis v Burkina Faso. Aziya iAfrika segodnya. 2015; № 8: 50 - 55.

Статья поступила в редакцию 26.02.22

УДК 811.161.1

Semenova N.V., Doctor of Sciences (Philology), Professor, Saint Petersburg State University of Civil Aviation, Peter the Great St. Petersburg Polytechnic

University (St. Petersburg, Russia), E-mail: nvsemenova@mail.ru

CORPUS TECHNOLOGIES FOR STUDYING RUSSIAN LINGUISTIC CULTURE IN THE ASPECT OF RFL. Learning about a linguoculture is a prerequisite for successfully acquiring a second or foreign language, or developing a personality profile by means of this language that will enable the speaker to communicate effectively and efficiently in different cultures. Such learning has always been based on authentic texts demonstrating the particular features of the mentality and the linguistic world view that the native speakers of a language have. The author believes that of the greatest linguistic and methodological values in this respect are narratives included in the Russian National Corpus (RNC). The relevance of the article lies in clarifying the linguistic principles of working with corpus data presented in RNC. The purpose of the article is to demonstrate the opportunities that RNC provides to those studying Russian linguoculture and to describe corpus tools that help to determine the paradigmatic and syntagmatic properties of Russian words that are culture-loaded. This set of vocabulary includes culture-specific words, words common for all Slavic cultures and culturally significant for Russians, and toponyms. Their key feature is that they are associated with cultural values. The language material used in the research is studied by means of corpus and contextual analysis. Also, elements of the statistical method are used when identifying word frequencies. The major result of the research is a description of the procedure for working with linguocultural vocabulary using RNC. It involves simple search queries as well as lexical and grammatical search by particular parameters clarifying semantic and grammatical features. This procedure allows for determining the contextualization conditions for the words that define the "image" of Russian linguoculture in the minds of both foreigners and native speakers of the Russian language. Such conditions include the occurrence chronology, a wide range of synonyms, occasional use of existing word-formation models, and "coding" culture-loaded meanings by different groups of lexical units.

Key words: Russian language, linguoculture, corpus technologies, Russian as a foreign language.

Н.В. Семёнова, д-р филол. наук, проф., Санкт-Петербургский государственный университет гражданской авиации,

Санкт-Петербургский политехнический университет Петра Великого, г. Санкт-Петербург, E-mail: nvsemenova@mail.ru

КОРПУСНЫЕ ТЕХНОЛОГИИ ИЗУЧЕНИЯ РУССКОЙ ЛИНГВОКУЛЬТУРЫ В АСПЕКТЕ РКИ

Изучение лингвокультуры - необходимое условие успешного формирования вторичной языковой личности, способной к эффективной коммуникации в условиях разных культурных фонов. Такое изучение всегда опиралось на аутентичные и оригинальные тексты, демонстрирующие специфику менталитета носителей изучаемого языка и особенности его языковой картины мира. Наибольшей лингвистической и методической ценностью в этом плане, считает автор, сейчас обладают тексты-высказывания, которые содержатся в языковых корпусах, в том числе в «Национальном корпус русского языка» (НКРЯ). Уточнение лингвистических принципов работы с корпусными данными НКРЯ и определяет актуальность исследования. Цель статьи - продемонстрировать возможности корпусных технологий НКРЯ в изучении русской лингвокультуры и описать корпусные инструменты, помогающие охарактеризовать парадигматические и синтагматические свойства русской лексики с «культуроносными» смыслами. К такой лексике автор относит «лингвоспецифичные слова», общеславянскую лексику, несущую культурно значимую для русского этноса информацию, а также топонимы, прежде всего те, которые актуализируют в языковой форме разные коды русской культуры. Анализ фактического материала проводился методами корпусного и контекстуального анализа с использованием элементов статистического метода при выявлении частотности той или иной лексической единицы. Основным результатом исследования является характеристика процедуры работы с лингвокультурной лексикой в НКРЯ, предполагающей простые поисковые запросы и лексико-грамматический поиск по особым параметрам с уточняющими семантическими и грамматическими признаками. Данная процедура позволяет устанавливать условия естественной «контекстуализации» для тех слов, которые определяют «образ» русской лингвокультуры в сознании инофонов и носителей русского языка. К таким условиям автор относит хронологию вхождения лексических единиц, развитую синонимию, окказиональное использование имеющихся словообразовательных моделей, «кодирование» культурных смыслов разными группами лексических единиц.

Ключевые слова: русский язык, лингвокультура, корпусные технологии, русский язык как иностранный.

Обучение русскому языку как иностранному (РКИ) в современной русской лингводидактике рассматривается как процесс успешного формирования вторичной языковой личности. Конечным результатом такого обучения является не только овладение инофоном вербальным русским кодом и способность эффективно применять его в разных коммуникативных ситуациях, но и освоение особенно-

стей русской лингвокультуры. Лингвокультура как «воплощенная и закрепленная в знаках живого языка и проявляющаяся в языковых процессах культура» [1, с. 60] в последнее время все чаще ассоциируется лингвистами с неким реестром культурных кодов, которых, по разным данным, насчитывается уже около сорока: артефактный (предметный), астрономический, растительный, колори-

стический, природно-ландшафтный и др. Культурные коды являются едва ли не главным объектом внимания современной лингвокупьтурологии - научного направления, которое оформилось в конце 90-х годов XX века и нашло самый активный отклик в коммуникативно-культуроведческой концепции, последовательно развиваемой в отечественной языковой педагогике [2].

Языковое образование в условиях разных культурных фонов, что и характерно для преподавания РКИ, всегда опиралось в первую очередь на аутентичные и оригинальные тексты, демонстрирующие специфику менталитета носителей изучаемого языка и особенности его языковой картины мира. В конечном итоге, именно учебные тексты в совокупности со всеми внетекстовыми компонентами составляют ту основу содержания межкультурного образования, которая способствует «усвоению фоновой информации о фактах данной культуры в виде произведений культуры» [3, с. 22]. Наибольшей лингвистической и методической ценностью в этом плане обладают аутентичные тексты, демонстрирующие живую речевую практику в условиях естественной «контекстуализации».

Актуальное собрание таких текстов содержат современные языковые корпусы, в частности - «Национальный корпус русского языка» (НКРЯ) [4], включающий сейчас уже более миллиарда слов. Тексты НКРЯ относятся к разряду текстов-высказываний носителей языка, они соответствующим образом автоматически размечены. Их безусловное преимущество для инофонов с разным уровнем владения русским языком - небольшой размер и валидность (так как все они прошли отбор специалистами). Кроме того, они общедоступны и могут быть «востребованы» пользователем практически в любое время. Однако было бы неверным утверждать, что данные НКРЯ полезны только для изучающих РКИ. Живой языковой материал НКРЯ, безусловно, имеет высокую ценность для разных лингвистов-исследователей, преподавателей русского языка как родного и иностранного, которые, владея современными корпусными технологиями, получают в свое распоряжение уникальный цифровой продукт для научных исследований и конструирования собственных методических материалов. В настоящей статье предпринята попытка показать «в действии» этот «цифровой продукт». Уточнение принципов работы с корпусными данными определяет актуальность проводимого исследования.

Цель статьи - продемонстрировать возможности корпусных технологий НКРЯ в изучении русской лингвокультуры и описать корпусные инструменты, помогающие охарактеризовать: 1) парадигматические и синтагматические свойства русской лексики, включая базовые лингвокультурные единицы, 2) «стилистический портрет» русского слова, лингвокреативность его носителей, 3) контекстуальное разнообразие словоупотреблений в ракурсе русской лингвокультуры и, наконец, 4) языковую статистику, подтверждающую верность полученных результатов.

Корпусное изучение языковых явлений, выступающих как своеобразные «индексы» русской лингвокультуры, разных кодов русской культуры, лежит на пересечении теоретической и прикладной лингвистики. Самое непосредственное отношение к появлению языковых корпусов имели начавшиеся в 70-х годах прошлого века прикладные исследования по электронным средствам обработки текстов. Первоначально эта работа шла в направлении уточнения формы представления конкордансов, которые, в общем-то, были не новы в филологии. Ее результатом стали первые языковые корпусы, которые были репрезентативны, но мало сбалансированы. К 90-м годам, однако, когда в практический обиход входят электронные корпусы второго поколения, мегакорпусы, уже представлены стандарты морфологической разметки, а затем и программы для других уровней разметок, новые электронные ресурсы начинают отвечать общепринятым сейчас требованиям: максимальному охвату разных сфер речевой практики, сбалансированности, большому объему словоупотреблений (не менее ста миллионов) [5; 6]. Их основной целью становится репрезентация всего многообразия письменной и устной речи [7, с. 150]. «Именно в этот период, - считает К.П. Чилинга-рян, - электронные корпусы превращаются в обязательный ресурс исследования языка, создания лингвистических гипотез и построения систем обработки данных естественного языка» [8, с. 203].

В распоряжении лингвистов, таким образом, оказываются новейшие инструменты изучения языка, параллельно снимающие проблему трудоемкости поиска необходимой информации. Расширение эмпирического поля исследования имело своим следствием, во-первых, окончательное оформление особого направления лингвистической науки - корпусной лингвистики, а во-вторых - открыло новые возможности для традиционных лингвистических направлений. В России корпусные исследования, как и в целом компьютерный анализ русского языка, стали чрезвычайно популярны в последние десятилетия и охватывают практически все теоретические вопросы современного языкознания: на материале корпусов рассматривают пара- и невербальные средства, проводят фонологические, лексикографические, семантические, прагматические и др. изыскания, причем как на синхронном срезе, так и в диахронии [9; 10]. Особую научную линию в этом плане представляют лингвокультурные исследования. В отечественной науке ее активно развивают А.Д. Шмелев и А.А. Зализняк, занимающиеся описанием и реконструкцией языковой картины мира. В центре внимания исследователей - лингвоспецифичные слова [11; 12]. А зарубежная лингвистика идет по пути разработки новых методов корпусной лингвистики для изучения историко-культурных явлений, зафиксированных в языке. Одним из таких новых методов является культурометрия (culturomics) [13].

Следует отметить, что лингвистический и лингводидактический потенциал корпусов, в том числе НКРЯ, также не раз становился предметом анализа специалистов, которые предлагали систему упражнений на его материалах, анализировали возможные методические приемы работы с корпусом [14; 15]. Эта область применения НКРЯ может быть существенно уточнена, особенно -в плане использования корпусных технологий для изучения русской линвокуль-туры.

Теоретическая ценность подобного исследования заключается в том, что полученные результаты могут быть использованы в дальнейшем изучении культурно обусловленных компонентов языка, а также способов их актуализации в живой речевой практике. Практическая значимость состоит в возможности использования предложенной процедуры анализа лингвокультурного материала по данным НКРЯ в практике преподавания РКИ, в лингвометодических и специализированных лингвистических научных исследованиях. Научная новизна исследования видится, во-первых, в попытке разработать новую методику изучения языковых фактов с помощью новейших цифровых инструментов, во-вторых, в развитии новых интегративных направлений исследования языковой системы, в-третьих, в уточнении ключевых вопросов многоаспектного взаимодействия языка и культуры.

При анализе фактического материала применялись методы корпусного и контекстуального анализа, а также элементы статистического метода при выявлении частотности употребления той или иной лексической единицы.

Говоря о возможностях НКРЯ в иллюстрации русской лингвокультуры, точнее - разных культурных кодов в лексике русского языка, следует уточнить понимание последнего термина и стоящего за ним понятия. В.В. Красных отмечает, что понятие «код культуры» имеет две перспективы рассмотрения. Если ставить акцент на «культурной составляющей», то тогда он может рассматриваться «как "сетка", которую культура "набрасывает" на окружающий мир, с помощью которой человек членит, категоризует, оценивает и т.д. мир, в котором он живет, а также осмысляет себя самого в этом мире» [16, с. 397]. Если же, подчеркивает исследователь, «отталкиваться от языковой составляющей, то код культуры предстает как совокупность имен и их сочетаний, которые обладают, помимо собственного денотативного значения, культуроносными смыслами» [там же]. При этом в центре рассмотрения лингвокультурологии находятся не только лингвоспецифичные языковые явления, но все знаки языка «как вербальная "часть" кода культуры, как экспоненты закодированных в них культурных смыслов» [17, с. 41].

Отталкиваясь от этого понимания основного объекта лингвокультурологии, можно составить примерный список лексических групп, которые максимально продемонстрируют «культуроносные смыслы».

«Лингвоспецифичные слова», или слова, «заключающие в себе уникальную концептуальную конфигурацию, т.е. такую, которая «в готовом виде» не представлена ни в какой языковой единице других языков» [18, с. 196]. Эту лексику также называют лексикой «ключевых идей русской языковой картины мира». Имеются в виду такие слова, как тоска, воля, жалость, надрыв, доля и др.

Общеславянская лексика, несущая культурно значимую для русского этноса информацию. Сюда относится большая часть «базовых лингвокультурных единиц» (термин О.И. Халупо). Имеются в виду такие слова, как родина, отечество, держава, дом и др. Именно эта группа слов, обладающая однокоренными славянскими параллелями (см., например, блр. родзш, слвц. rodina, польск. Rodzina, означающие «семья»), подтверждает мнение о том, что «в сфере лингвокультуры язык выполняет функцию означающего, а в роли означаемого выступают культуроносные смыслы, культурно-маркированные образы сознания, культура как таковая» [19, с. 235].

Топонимы, прежде всего те, которые актуализируют в языковой форме разные коды русской культуры. Этим геопространственным компонентам лексической системы русского языка национально-культурный компонент свойствен ничуть не менее чем апеллятивам.

Процедура работы в НКРЯ с лингвокультурной лексикой предполагает применение различных корпусных технологий в разных типах случаев.

Простые поисковые запросы. Сюда относится, в частности, выяснение хронологии вхождения лексемы и статистики бытования. Так, считается, что лингвос-пецифичное слово «надрыв» как семантическое новообразование, вошедшее в русский литературный язык, принадлежит Ф.М. Достоевскому: именно он употреблял его в специфичном значении «'болезненность, экзальтированность, неестественность в проявлении каких-л. чувств, эмоций или при совершении какого-л. поступка'» [20, с. 10]. Но когда эта лексема вообще впервые появляется в литературном языке?

Поиск в НКРЯ выдает результат в 810 вхождений, и первое вхождение фиксируется 1788 годом. Словоупотребление зафиксировано в тексте Я.П. Козельского, и анализ показывает, что специфичного значения слово «надрыв» здесь еще не несет: «Я по страсти к секретам рад служить ей до надрыву, только б испытать ее таинства» (Я.П. Козельский. Рассуждения двух индийцев Калана и Ибрагима о человеческом познании (1788)). Особая семантика у «надрыва» фиксируется с 1871 года, начиная с произведений Ф.М. Достоевского: «Вы женились по страсти к мучительству, по страсти к угрызениям совести, по сладострастию нравственному. Тут был нервный надрыв... Вызов здравому смыслу был уж слишком прельстителен!» (Ф.М. Достоевский. Бесы (1871-1872)). А максимальная частотность словоупотребления приходится на 50-е годы XX века.

не будете поносить и свою Родину "что значит по-ВАШЕМУ «поносить сеоы РОДИНУ съемок и спецэффектов на нашей Родине мужества, а именно любить свою Родину а именно любить свою Родину, Родину скроьшо трудится во благо своей Родины глубже — о чувстве долга, о Родине что этот великий фильм о Родине [soapbubbie, nick] Штирлиц — разведчик который защищал Родину Он не может называть своей Родиной мере насладиться тем, что его Родина он называл Германию, Третий Рейх — Родиной Именно с «Песней о далекой Родине добиваться скорейшего возвращения; россиян на Родину сейчас служат образцом беззаветной преданности Родине возложения цветов х памятникам защитников Родины Сегодня носит Адидас, а завтра Родину право призывать в арь£ию. За Родину ни был режим — Россия наша ?одина любит и ненавидит. Для кого Родина и другим просторам бывшей общей Родины потеют, а думают, что за Родину сплеча: ".Я всю жизнь защищал Родину не мог решиться вернуться на Родину

Щ» <-...-»

, не было слепого подражания Америке <—...—>

, Родину победившую фашизм. ...—>■

победившую фашизм. —...—*

и незаметно разрушает благостный порядок ..

говорит понятнее, чем какие-нибудь проповеди

и о чувстве долга. ...—^>

ценой собственной жизни. <—...—^>

Россию (СССР). <-...->

загнала фашистскую армию в угол — _ —-

; когда он вскидывал рутсу, чтобы

>: у меня ассоциируется весеннее время —... —

, воли к пооеде, храоростк, стоикосги .

продаст».

можно отдать жизнь. За эту •

— не пустой звук. Упомянутый вами :

(в хорошем смысле этого слова ;

, но нынешней осенью наконец попытался <—.

Рис. 1. Демонстрация результатов поиска: S, r:abstr, capital

Данные сведения - результат использования корпусного инструмента «Распределение по годам» на странице поиска. Этот результат можно получить в графическом или табличном варианте. С помощью другого корпусного инструмента «Статистика» на поисковой странице пользователь может получить полную информачиюяО авторах, в чьих произведенияхэто слово встречается, сфере функционирования, типе и теме текста, жанровой «предраспо-ложэнносси», Соответстввющвпиисковые эараметрчдаютчнформацию о том, что наиболее частотно слово «надрыв» в произведениях В.В. Бибихина (12 документов, 43 вхождения, что составляет 5,31% от общего числа), в произ-веденвях1еюргив Флорочсиого и Ф.М.Длстоввсволл(2ввхоцдевий (30ию)иш вхождения (2,96%), соответственно). Преобладающая сфера вхождения - худо-жествоннач(253 двку»онюа,РЗ»циоыенай(01,8Р%)),тиа тевста ц|йоотн((ЗР документ, 204 вхождений (25,19%)), тема текста - искусство и культура (108 до-кументоэ,143еиод1 ен ия0ДМ%НС^/^эдт^|^иэтом чсиРолне чаатовно ело во «надрыв» в нежанровой прозе - 1б9 документов по всему корпусу, вплоть до 2019ттда,424 юхт>%рнич)27,а5%10Нщою чвствтносюьлснгвнспацифичнвгэ слова «надрыв» можно уточнить по данным «Нового частотного словаря русской лексики» [21], согласно которому общее число его употреблений на миллион едтв рКРЯ сосвавияет 2,

К простому поиску можно отнести и использование различных подкорпу-сов аезотптлниоелчниэваэамтвков. Спвоне выявненипдинрвоспеци»11чнк-сти весьма эффективными оказывается, например, параллельный подкорпус. Впрочем, Н1СЯ»аов оoзаoжзoнвьвoлвзлвквeлюcфo5мйpoврвопoцкoрпнйы по собственным научным запросам: например, если исследователя заинтересует история становления графических и орфографических норм, то, используя корпусный инструмент «Задать подкорпус», он может задать параметр «Только тексты в старой орфографии». Так, исследуя лингвоспецифичное слово «доля», мы получаем список его вариантов в старом написании, которые, помимо всего прочего, отражают и историю формирования парадигмы склонения данного имени существительного: долЪ, долей - долею и т.д.

Формулировка «параметрических» поисковых запросов. Они задаются в лексико-грамматическом поиске по особым параметрам с уточняющими семантическими и грамматическими признаками. Например, изучая понятие «родина», характерное для русской лингвокультуры, инофон обязательно встретится с двояким написанием этого слова - со строчной и прописной первой буквой «Р».

В первом случае будет подразумеваться малая родина как «личностное» пространство, т.е. то место, та территория, тот населенный пункт, где родился человек. Во втором случае речь будет идти о родине как о стране гражданства, родной стране. Для того чтобы уточнить контексты для слова «родина» в этом значении, требуется задать дополнительный признак «слово с заглавной буквы», при этом ограничив сам поиск примерами со снятой грамматической омонимией. Итоговый поисковый запрос будет выглядеть следующим образом: S, r:abstr, capital и покажет 75 документов, 140 вхождений. Результаты поиска, которые, кстати, можно сохранить в таблице Excel, удобнее просматривать в формате KWIC, который представляет корпусную технологию «keywords in context» («ключевые слова в контексте) (рис. 1).

К особым поисковым запросам можно отнести и поиск синонимов. Так, в русской лингвокультуре существуют слово «отечество», находящееся в синонимических парадигматических отношениях к слову «родина». Для того чтобы выяснить контексты, проявляющие сходства и различия двух синонимов, поисковый параметр формулируется следующим образом: «родина | отечество». Да-

лее рекомендуется производить анализ по п-граммам. Предпочтителен в данном случае будевпоиекпомножееввенным п-граммам,вчасвности -поЗ-граммам, который продемонстрирует «левый» и «правый контекст» и позволит составить пмедмвамлжмижне велнксалоросипоажвческив своВсавахэвих синонимов, но и об их синвагматике, авакже испсльзованиивусвойчивых словосочетаниях, часто становящимися прецедентными высказываниями (рис. 2).

родина I отечество

№ Документы Вхождения ipm Фрагмент

1 12 17 2.83 сеоя на родине

2 3 4 0.67 вернуться на родину

3 3 4 0.67 вернулся на родину

4 2 4 0.67 на родину н

5 4 4 0.67 столице нашей родины

6 4 4 0.67 в нашем отечестве

7 3 4 0.67 менл на родине

S 4 4 0.67 на родину в

9 4 4 0.67 своего отечества и

10 3 3 0.50 заслуги перед отечеством

11 2 3 0.50 тоски по родине

12 3 3 0.50 е своем отечестве

Рис. 2. Демонстрация результатов поиска: «родина |овечесвво»(3-граммы)

Чрезвычайно продуктивным для лингвокультурных исследований является и выяснение т.н. «аномальных» и «искаженных» форм в НКРЯ. Именно эти формы дают нпимоаесяркмю картп^аанрвлмфеавжвносв и аов|ее мевнжгорюссрйского общества в сфере словопроизводства, словообразовательных новшеств.

Тмк,еазомвж для р«рспого язжкового вознвналоунгмж^льв^ная адисица «дом» по соответствующим параметрам лексико-грамматического поиска, зада-кееммезмреепрлммав иnecви«п«ирнaпв«*онoмлльзояфаз«а»««*иаказeнзaя форма», выдаст результат - форму «домы». Для того чтобы избежать вкрапле-яияcмy-епрнlгп0врaвeннр,в-мбз0вc-пaравррмдв0pпрз00знек0«|■p0м«авнчe-ской омонимией и добавить семантический признак «вместилища»: полный поисковый запрос: д мо,S&(aеom|е¡stoм),r:coроrм tеп:сontа|п.

^с^мнзмр^м^и в другие подкорпксы,мо оа ползси-впаэвипоссоакмдкярг гyc-фoмзy«д-маx», а ^веай , дк°онтолмгипессий пз^с-ь^^1^«^аэгпныс подвеян, сориааювекяазаонельныдверпжовыслПяoаоaoыaaавм ! иодоау^еам^всдем, дд-пмаи д°.фис. «у

[Валентина Петровна С., жен] Детский до-дом сена Александровна, жен, ученый, океанолог] Понимаете/с... до-дом

моя там старый у них доом разных привозили/ там уже более домая , жен, доктор филологических наук, профессор] Вы уехали из дому С меня хватит необходимостн экономить до-ма Ничего не хочется. [№ 1, жен, 40, филолог] Потому что до-ома в нескольких шагах от своего до-ма всего заседали вот у нас ома зго не хочется. [№ 1, жен, 48, преподаватель вуза] Потому что до-ома ногласно. [Роза Каткова(В ера Кароова),жлн,26,К93е] Поооо домаааам

почте марки покупают, [поет] В ваа-шеем доо-мее [ Блюменталь-Тамарнна), жен, 79,1859] Аа/ вот и сестрнчкин доом

был тоже у нас в <—...—» такой то-толстый/ что я не * ну старые ну как ещё «—...—

такие более-менее// <—..

и рассказываете о том/ что <—...—»

! [Мистер Бэнкс (Альберт Филозов), муж, 46, 1937] Если бы вас/ если бы « . Потому что дома. А Вы ...—»

и у Калитинского/ у Германовой ■<—...—> . Потому что дома. А Вы ...—*■

! [Вциху] [Собираягоя идти наобадН[Ви1д ГромНклв ДАлркнай Кожевдиков), м> узнал я впервыы-е... Понимаешь/ Петя

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

. [дом рушится] Батюушкп! [Бабушка (Мария Блюменталь-Тамарнна), жен, 79, 18

Рис. 3. Демонстрация результатов поиска: дом, S & (anom | distort), r:concr & top:contain

Вообще же, если убрать из поискового запроса слово «дом» и попытаться выяснить, какиил вовременной речесой пкакже ортребоюдся обовняиелие для вместилищ, то получим совершенно уникальные наименования. Они будут демонстроровать ораимитиоескьх уу^с^я^шйхоожноем, слоооофязо-

вательныо, н^ов то йка лоемдиворческоя испвльдооония всехимьощихоя сжявоо-бразовательных я^дюуо!^ (д9^в).

Особый поИскЯвЫНЛопрКс теьббояся и для п062кЭ тооонимов. Парамяррб! задаются в лексико-грамматическом поиске по двум словам: слово, идентифицирующее природнл-аяьдшвфрнбш оОбоор ланнимео, «рекь», а дия отовргю слова только грамматический параметр «на расстоянии 1 до 2 от ^роп». Поиск топо-нимовведетжиоояно в иякпркя оо скотод янамраойчеинон ооон рмруо. Псрунонд ные результаты требуют ручной проверки (рис. 5).

Лингвокультурная информация, передаваемая русской гидронимичской лексикой,-чрезвычайно интересный материал. Причем гидронимы способны актуализировать не только природно-ландшафтный, но и другие культурные коды. Например, потамоним Медведица выступает индексом зооморфного кода. Более подробнообэтом вработеН.В.Семеновой[22].

Ценную информацию о русской лингвокультуре дает и синтаксический подкорпус НКРЯ. Так, для того чтобы проверить тезис о том, что русское слово «держава», ушедшее в свое время из активного словаря, возвращается в речевой обиход, но уже в новом значении - «ведущая мировая, спортивная, политическая и экономическая страна», достаточно сформулировать поисковый запрос по параметрам «держава, root», т.е. лексема «держава + грамматический дополнительный признак «корень синтаксического дерева». Полученный резуль-

— а салаш, в салаш ему, Владимир Николаевич, и пять комнатов желудочным голосом: "Вы б какею квартеру — Корову. Вот с таким вымем руками. — Корову надо не по вымго а очутился вона где — возле цайхгауза плачу пока кто свалакет с магилы Нада выкорчёвывать нэ по адиночке (Кашу ест ротом себя вниз» в бомбоубежище. "В убезися и збымась под его тяжес тью. — Па по-чка Стрижи улетают на юг! Освобождается скворечник-чник Чрремшйлкво-реч-ни к

— Скворе-чник-чшак Ну.б иьгро!Дать ?пепл яйка Так я тебе спокой наще слюза Нина свдеиаум в ЬйтПЭ прямо из крынки, — сколько принесут горшечков не слыхать, толытпар т ротп мне Володя: — Зачем ты столько комнатей вокзал-то весьссобкшл Кр-д-ддпу ему показалось даже, что в ущелья нарушение полного единения со Святою Церковию Johann вытащил дурной нумер о

!.. — заворчал я. Но Булыга уже -*—...—> мало. <—...—>

? "В Брускове был дом, безалаберный

выбирать. Если она ещё молодая ±

— а целыми группами! ...—» бесчувственным, она ему не впрок <—.. 11, — говорил он. <—...—> прьтетел! Чииным нашП-п^-м

! — зачирикала радостно воробьиха. — Моя меч-та < , молеко! Мнюай л « того даю: завтра баб тех ...—» ,радом о Брюювым. д-, . ,2 , столько и выпьет,

рсубка—и о вира зюлодногоморози ■ -м это настроил? Ты бы их <—...—>

и по уступам знакомой горы ...—» , с точным сохранением, однако, истинного ± — он должен быть Soldat, я <—...—>

Рис. 4. Демонстрация результатов поиска: S & (anom | distort), r:concr & top:contain

Трескин, например, задумал выровнять русло реки жестокое поражение в битве на реке в Кашинском районе, на берегу реки орудия) переправились на правый берег реки

Иркут из-за ее, как ему .—» Шелонь. ...—»

Медведица, около деревни Туровино, в < Ворскла, а уже 25 июня ...—>•

pi^(^.p. Демонртркцлллрз—лттьтооионска: «иа.асил—^нио 1 до д—т to°лп»

Россия-----------/предик)^! 1. РОССИЯ | ЭЕД ЖЕН ИМ НЕОД

мир овал />;' о пред 2. МИРОВОЙ | А ЕД ЖЕН И И держава З.ДЕРЖДВД | s ЕД ЖЕН И И НЕОД по-----------4, ПО | PR

территории,------------------УУпредл »1 5. ТЕРРИТОРИЯ | S ЕД ЖЕН ДАТ Н ЕОД

по-----------------------------\срчин>^| 6. ПО | PR

запасам------------------------------------У4^ предл 7. ЗАПАС | S МН МУЖ ДАТ НЕОД

топлива-------------------------------------1-------------^S^I-kdm^T)^! S. ТОПЛИВО | S ЕД СРЕД РОД НЕОД

------------------1^S(co4hH>^| 9. И | CON J

сырья, V ^:"соч-сооз(Г>^1 10. СЫРЬЕ | S ЕД СРЕД РОД НЕОД

^сочин^| t1.no | PR

потенциалу-----------------------------------------------^(предп"^| 12. ПОТЕНЦИАЛ | S ЕД МУЖ ДАТ НЕОД

своих-------------------------------------------------------------------V--------------------{ опред 1 13. СВОЙ | А МН РОД

Вооруженных---------------------------------------------------------------------------// опред~)-^| 14. ВООРУЖАТЬ | V СОВ CTRAfl ПРИЧ ПРОШ МН РОД

Сип.-----------------------------------------------------------------------\квазиагент>ф-1 15.СИЛА | S МН ЖЕН РОД НЕОД

Рис. 6. Демонстрация результатов поиска: «держава, root»

тат - Россия - мировая держава по территории, по запасам топлива и сырья, по потенциалу своих Вооруженных Сил (СЛУЖИТЬ БЫ РАД...) разворачивает актантную структуру предложения, наглядно подтверждая выдвинутое предположение (рис. 6).

Итак, процедура применения корпусных технологий при изучении русской лексики с культуроносными смыслами предполагает простые поисковые запросы и лексико-грамматический поиск по особым параметрам с уточняющими семантическими и грамматическими признаками. Разные типы случаев требуют формулировки разных запросов. Особый интерес в этом плане представляет работа с подкорпусами, где происходит уточнение параметрических формулировок. В зависимости от поставленных учебных или исследовательских задач из НКРЯ может быть извлечена информация об истории лексической единицы, хронологии ее вхождения в русский литературный язык, форма и орфография написания, системные характеристики (парадигматика и/или синтагматика,

Библиографический список

подразумевающие анализ синонимических, антонимических и др. отношений, включая устойчивые коллокации и самый широкий контекст), окказиональное словоупотребление и даже «закодированный» русский портрет культуры. Вся эта информация составляет условия естественной «контекстуализации» для тех слов, которые определяют «образ» русской лингвокультуры в сознании ино-фонов и носителей русского языка. Естественно, перечень запросов, которые были описаны в статье, не могут быть названы исчерпывающими, как и не может считаться абсолютно окончательной характеристика полученных результатов. Однако они позволяют увидеть характерные черты русского мировидения сквозь призму языка, причем такого языка, который заключен в цифровую форму современных мегакорпусов. Перспективными направлениями в намеченной процедуре изучения русской лингвокультуры по данным НКРЯ являются исследования пара- и невербального поведения, диалектных различий русской речи, исторических вариантов.

1. Красных В.В. Основные постулаты и некоторые базовые понятия лингвокультурологии. Русский язык за рубежом. 2011; № 4 (227): 60 - 66.

2. Теремова РМ., Гаврилова В.Л., Игошина О.А. и др. Лингвокультурология в теории и методике обучения русскому языку как иностранному. Санкт-Петербург: Российский государственный педагогический университет им. А.И. Герцена, 2019.

3. Бердичевский А.Л., Гиниатуллин И.А., Тарева Е.Г. Методика межкультурного иноязычного образования в вузе. Москва: Флинта, 2019.

4. Национальный корпус русского языка. Available at: https://ruscorpora.ru/

5. Baker P., Hardie A. and McEnery T. A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press Ltd. 2006. Available at: https://doi.org/10.4000/lexis.1319

6. McEnery T., Hardie A. Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press. 2012. Available at: https://doi.org/10.1093/llc/fqt010

7. Солнышкина М.И., Гатиятуллина ГМ. История развития корпусной лингвистики (на примере англоязычных корпусов). Вестник Томского государственного университета. Филология. 2020; № 63: 132 - 160.

8. Чилингарян К.П. Корпусная лингвистика: теория vs методология. Вестник Российского университета дружбы народов. Теория языка. Семиотика. Семантика. 2021; Т. 12, № 1: 196 - 218.

9. Ляшевская О.Н. Корпусные инструменты в грамматических исследованиях русского языка. Москва: Языки славянской культуры, 2016.

10. Литвинцева К.В., Ляшевская О.Н. Применение квантитативных корпусных методик для выявления церковнославянизмов в современном русском языке. ВестникПСТ-ГУ. Филология. 2017; № 53: 43 - 55.

11. Шмелев А.Д. Еще раз о русских словах свобода и воля. Вестник Российского университета дружбы народов. Лингвистика. 2018; Т. 22, № 3: 675 - 700.

12. Shmelev A. Russian language-specific words in the light of parallel corpora. Meaning, Life and Culture: In conversation with Anna Wierzbicka. Canberra: The Australian National University, ANU Press, 2020: 403 - 419.

13. Масевич А.Ц., Захаров В.П. Методы корпусной лингвистики в исторических и культурологических исследованиях. Компьютерная лингвистика и вычислительные онтологии: труды XIX Международной объединенной научной конференции. Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, 2016: 24 - 43.

14. Ольховская А.И. Корпусное преподавание русского языка. Вестник ТГПУ. 2019; № 2 (199): 98 - 107.

15. Лебедева М.Ю. Дано мне тело - что мне делать с ним? Применение корпусных технологий в лингводидактике РКИ. Русский язык за рубежом. 2020; № 6 (283): 4 - 13.

16. Красных В.В. Словарь и грамматика лингвокультуры: основы психолингвокультурологии. Москва: Гнозис, 2016.

17. Ковшова М.Л., Гудков Д.Б. Словарь лингвокультурологическихтерминов. Москва: Гнозис, 2017.

18. Zalizniak A.A. Russian Language-specific Words as an Object of Contrastive Corpus Analysis. Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference "Dialogue". 2015; Vol. 1, № 14 (21): 683 - 695.

19. Зыкова И.В., Бубнова И.А., Красных В.В., Уфимцева Н.В. (Нео)психолингвистика и (психо)лингвокультурология: новые науки о человеке говорящем. Москва: Гнозис, 2017.

20. Ружицкий И.В. «Надрыв» Достоевского: словарное представление. Гуманитарная парадигма. 2021; № 3 (18): 6 - 18.

21. Ляшевская О.Н., Шаров С.А. Ляшевская О.Н. Новый частотный словарь русской лексики (на материалах Национального корпуса русского языка). Москва: Азбуковник, 2009. Available at: http://dict.ruslang.ru/freq.php

22. Семенова Н.В. Лингвокультурный потенциал русских лимнонимов. Филологические науки. Вопросы теории и практики. 2021; Т. 14, № 11: 3398 - 3403.

References

1. Krasnyh V.V. Osnovnye postulaty i nekotorye bazovye ponyatiya lingvokul'turologii. Russkijyazykza rubezhom. 2011; № 4 (227): 60 - 66.

2. Teremova R.M., Gavrilova V.L., Igoshina O.A. i dr. Lingvokul'turologiya v teorii i metodike obucheniya russkomu yazyku kak inostrannomu. Sankt-Peterburg: Rossijskij gosudarstvennyj pedagogicheskij universitet im. A.I. Gercena, 2019.

3. Berdichevskij A.L., Giniatullin I.A., Tareva E.G. Metodika mezhkul'turnogo inoyazychnogo obrazovaniya v vuze. Moskva: Flinta, 2019.

4. Nacional'nyj korpus russkogo yazyka. Available at: https://ruscorpora.ru/

5. Baker P., Hardie A. and McEnery T. A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press Ltd. 2006. Available at: https://doi.org/10.4000/lexis.1319

6. McEnery T., Hardie A. Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press. 2012. Available at: https://doi.org/10.1093/llc/fqt010

7. Solnyshkina M.I., Gatiyatullina G.M. Istoriya razvitiya korpusnoj lingvistiki (na primere angloyazychnyh korpusov). Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya. 2020; № 63: 132 - 160.

8. Chilingaryan K.P. Korpusnaya lingvistika: teoriya vs metodologiya. Vestnik Rossijskogo universiteta druzhby narodov. Teoriya yazyka. Semiotika. Semantika. 2021; T. 12, № 1: 196 - 218.

9. Lyashevskaya O.N. Korpusnye instrumenty v grammaticheskih issledovaniyah russkogo yazyka. Moskva: Yazyki slavyanskoj kul'tury, 2016.

10. Litvinceva K.V., Lyashevskaya O.N. Primenenie kvantitativnyh korpusnyh metodik dlya vyyavleniya cerkovnoslavyanizmov v sovremennom russkom yazyke. Vestnik PSTGU. Filologiya. 2017; № 53: 43 - 55.

11. Shmelev A.D. Esche raz o russkih slovah svoboda i volya. Vestnik Rossijskogo universiteta druzhby narodov. Lingvistika. 2018; T. 22, № 3: 675 - 700.

12. Shmelev A. Russian language-specific words in the light of parallel corpora. Meaning, Life and Culture: In conversation with Anna Wierzbicka. Canberra: The Australian National University, ANU Press, 2020: 403 - 419.

13. Masevich A.C., Zaharov V.P. Metody korpusnoj lingvistiki v istoricheskih i kul'turologicheskih issledovaniyah. Komp'yuternaya lingvistika i vychislitel'nye ontologii: trudy XIX Mezhdunarodnoj ob'edinennoj nauchnoj konferencii. Sankt-Peterburg: Sankt-Peterburgskij nacional'nyj issledovatel'skij universitet informacionnyh tehnologij, mehaniki i optiki, 2016: 24 - 43.

14. Ol'hovskaya A.I. Korpusnoe prepodavanie russkogo yazyka. Vestnik TGPU. 2019; № 2 (199): 98 - 107.

15. Lebedeva M.Yu. Dano mne telo - chto mne delat's nim? Primenenie korpusnyh tehnologij v lingvodidaktike RKI. Russkij yazyk za rubezhom. 2020; № 6 (283): 4 - 13.

16. Krasnyh V.V. Slovar' igrammatika lingvokul'tury: osnovypsiholingvokul'turologii. Moskva: Gnozis, 2016.

17. Kovshova M.L., Gudkov D.B. Slovar'lingvokul'turologicheskih terminov. Moskva: Gnozis, 2017.

18. Zalizniak A.A. Russian Language-specific Words as an Object of Contrastive Corpus Analysis. Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference "Dialogue". 2015; Vol. 1, № 14 (21): 683 - 695.

19. Zykova I.V., Bubnova I.A., Krasnyh V.V., Ufimceva N.V. (Neo)psiholingvistika i (psiho)lingvokul'turologiya: novye nauki o cheloveke govoryaschem. Moskva: Gnozis, 2017.

20. Ruzhickij I.V. «Nadryv» Dostoevskogo: slovarnoe predstavlenie. Gumanitarnaya paradigma. 2021; № 3 (18): 6 - 18.

21. Lyashevskaya O.N., Sharov S.A. Lyashevskaya O.N. Novyj chastotnyj slovar'russkoj leksiki (na materialah Nacional'nogo korpusa russkogo yazyka). Moskva: Azbukovnik, 2009. Available at: http://dict.ruslang.ru/freq.php

22. Semenova N.V. Lingvokul'turnyj potencial russkih limnonimov. Filologicheskie nauki. Voprosy teorii i praktiki. 2021; T. 14, № 11: 3398 - 3403.

Статья поступила в редакцию 23.02.22

i Надоели баннеры? Вы всегда можете отключить рекламу.