Научная статья на тему 'Модели частотного поведения русской политической лексики XX века'

Модели частотного поведения русской политической лексики XX века Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
230
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУСЫ ТЕКСТОВ / ДИАХРОНИЧЕСКИЕ ИССЛЕДОВАНИЯ / ЧАСТОТНОСТЬ ЛЕКСИЧЕСКИХ ЕДИНИЦ / МОДЕЛИ ЧАСТОТНОГО ПОВЕДЕНИЯ / СЕМАНТИЧЕСКОЕ ПОЛЕ / CORPORA OF TEXTS / DIACHRONIC STUDIES / FREQUENCY OF LEXIСAL UNITS / MODELS OF WORDS BEHAVIOR / SEMANTIC FIELD

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Масевич Андрей Цезаревич, Захаров Виктор Павлович

Представлены результаты диахронического исследования русской политической лексики XX в. Исследование проводилось на базе русского корпуса Google Books c использованием программного инструмента Google Books Ngram Viewer, который позволяет строить графические модели частотного поведения лексических единиц слов и коллокаций в заданный период времени. Выявлено, что графики некоторых лексических единиц имеют выраженные черты сходства. Описаны две модели частотного поведения слов и словосочетаний и показана их корреляция с историческим процессом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Масевич Андрей Цезаревич, Захаров Виктор Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIACHRONIC RESEARCH OF THE RUSSIAN POLITICAL LEXICON OF THE 20th CENTURY

The paper presents the results of a diachronic research of the Russian political lexicon of the 20th century based upon the Russian corpus of the Google Books using the Google Books Ngram Viewer. This tool is used to create charts of changing frequency of lexical items words and collocations within a given period. We found that certain lexical units have similar pattern of frequency behavior. Two graphic models of the words’ behavior and their correlation with the historical process are described.

Текст научной работы на тему «Модели частотного поведения русской политической лексики XX века»

УДК 81-13

А. Ц. Масевич 1, В. П. Захаров 2

1 Санкт-Петербургский государственный институт культуры

Дворцовая наб., 2, Санкт-Петербург, 191186, Россия

2 Санкт-Петербургский государственный университет Университетская наб., 7-9, Санкт-Петербург, 199034, Россия

2Институт лингвистических исследований РАН Тучков пер., 9, Санкт-Петербург, 199034, Россия

andmasev@mail.ru, v.zakharov@spbu.ru

МОДЕЛИ ЧАСТОТНОГО ПОВЕДЕНИЯ РУССКОЙ ПОЛИТИЧЕСКОЙ ЛЕКСИКИ XX ВЕКА

Представлены результаты диахронического исследования русской политической лексики XX в. Исследование проводилось на базе русского корпуса Google Books c использованием программного инструмента Google Books Ngram Viewer, который позволяет строить графические модели частотного поведения лексических единиц - слов и коллокаций в заданный период времени. Выявлено, что графики некоторых лексических единиц имеют выраженные черты сходства. Описаны две модели частотного поведения слов и словосочетаний и показана их корреляция с историческим процессом.

Ключевые слова: корпусы текстов, диахронические исследования, частотность лексических единиц, модели частотного поведения, семантическое поле.

Введение

Настоящая публикация описывает некоторые результаты диахронического исследования частотного поведения слов и коллокаций русской политической лексики на основе корпуса Google Books. Под частотным поведением лексической единицы мы понимаем изменения частоты встречаемости лексических единиц во времени.

В статье описывается часть результатов длительного исследования, в ходе которого были созданы и проанализированы графики частотного поведения около 600 №рамм за период с 1900 по 2000 г. Некоторые результаты этой работы опубликованы в [Масевич, Захаров, 2016а]. Кроме того, полностью с результатами исследования (свыше 500 графиков и комментарии) можно ознакомиться на ресурсе Research Gate [Масевич, Захаров, 2016б; 2016в].

Частота употребляемости лексических единиц языка меняется в ходе исторического процесса, и ее изменения могут оказаться весьма ценными количественными индикаторами, полезными для исторических и культурологических исследований. Наличие представительных корпусов, оснащенных соответствующим программным инструментарием, позволяет получать такие показатели.

Масевич А. Ц., Захаров В. П. Модели частотного поведения русской политической лексики ХХ века // Вестн. Ново-сиб. гос. ун-та. Серия: Лингвистика и межкультурная коммуникация. 2017. Т. 15, № 2. С. 30-46.

ISSN 1818-7935

Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2017. Том 15, № 2 © А. Ц. Масевич, В. П. Захаров, 2017

Исследование проводилось на основе русского корпуса Google Books (590 тыс. текстов русских книг, более 67 млрд словоупотреблений). В качестве инструмента использовалась система Google Books Ngram Viewer [Michel et al., 2011], детально описанная нами в нескольких публикациях [Захаров, Масевич, 2014; Масевич, Захаров, 2016г]. В Интернете свободный доступ к системам открыт с 2010 г. Она позволяет строить графики встречаемости слов и коллокаций за выбранный временной период.

На горизонтальной оси графика показываются годы, входящие в заданный временной период. По вертикальной оси откладывается выраженная в процентах относительная частота встречаемости в корпусе заданной №раммы в соответствующем году. Относительная частота встречаемости №раммы за определенный год подсчитывается следующим образом: число употреблений Nграммы в данном году делится на общее число словоупотреблений в корпусе в этом же году, результат умножается 100 [Michel et al., 2011].

При построении графика имеется возможность задать ряд условий, позволяющих делать графики более наглядными, сопоставлять кривые поведения нескольких №рамм, выявлять наиболее частотные словосочетания с данной словоформой и их поведение во времени и др.

Лексико-семантическое поле «борьба - враги».

Частотное поведение доминирующих лексем

Текст печатного документа советского времени, в особенности комментировавший исторические или текущие политические ситуации, ставил перед собой не столько информационную, сколько идеологическую цель: он должен был формировать у читающих граждан коммунистическое мировоззрение. В связи с этим возник особый язык, в котором наряду с базовой коммуникативной функцией значимость приобретают экспрессивная и апеллятивная функции [Костомаров, 1994].

Для исследования были отобраны словосочетания с двумя существительными, часто употребляемыми и характерными для советской лексики, - «враг» и «борьба». Значение этих существительных подразумевает характерную для языка советского времени семантическую оппозицию «свое / чужое» [Рождественский, 2000].

Построены графики частотного поведения членов словоизменительной парадигмы для каждой из этих лексем. Используемый инструментарий позволил выявить наиболее употребительные грамматические формы для этих существительных (рис. 1). Кроме того, Google Ngram Viewer позволяет автоматически генерировать наборы из десяти наиболее частотных биграмм и триграмм и при этом строить графики их частотного поведения. Таким образом, были проанализированы более 70 графиков частотного поведения фиксированных коллокаций из двух и трех слов за период с 1900 по 2000 г.

19Ю 1920 1930 Гай 1950 1900 1970 19S0 1990 Ш)

Рис. 1. Частотное поведение членов словоизменительной парадигмы лексемы «враг»

На рис. 1 видно, что форма «врага», соответствующая родительному и винительному падежам, является наиболее частотной. Легко заметить также, что рост частоты употребления в годы Второй мировой войны, который характерен для всех членов парадигмы, особенно выражен в этой форме.

Формы единственного числа существительного «враг» преимущественно относятся к противнику в военном противостоянии, в данном случае к нацистской Германии. Употребление единственного числа обусловлено, по-видимому, тем, что в политических и пропагандистских текстах военный противник чаще представлялся как единый объект, явление однородное, единообразное, не нуждающееся в структурировании.

Словоформа «борьбы» на всем протяжении периода более частотна, чем словоформа «врага». На рис. 2 можно видеть общую тенденцию динамики изменения частотности, а именно рост частотности до середины 1930-х, а затем плавное снижение. Отмечаются периодические подъемы частотности (1907, 1923, 1933, 1952-1953) с последующими спадами. Кривая словоформы «врага» имеет выраженный подъем частотности в 1941-1944 гг., т. е. в годы Второй мировой войны.

npftffitn (turim»-*tparjtod ijnri.fiüpbfibj Г case-insflnsi&vs

г-'«(; ____________

4t*t(n I HQ ana JOOO frirtiSit д] with imflOtheig _lJ Щ

ОСО0ОЧ 00350%

олмо* «№ ooxtrn шивж

ОЛЮ* 001«% 00120* О 01 GO* 0 0080% 000604. 000*0% OOOQO* 0 0000%

Рис. 2. Частотное поведение словоформ «врага» и «борьбы» с 1900 по 2000 г.

Семантическое поле слова «враг».

Некоторые коллокации

Система Google Ngram Viewer позволяет с помощью подстановочных знаков отобрать наиболее частотные коллокации с данной словоформой как в правой, так и в левой позиции. При этом существует возможность задавать часть речи коллокатов (рис. 3).

Частота встречаемости биграммы «классового врага» достигает наиболее высоких значений в середине 1930-х гг., затем отмечается ее снижение и некоторый рост в начале 1950-х гг.

Относительная частота встречаемости биграмм «общего врага», «ненавистного врага» и «злейшего врага» достигает наиболее высоких значений в 1944 г., причем рост ее по сравнению с 1901 г. составляет 776 раз («общего врага»), 432 раза («ненавистного врага»), 293 раза («злейшего врага»). Все три выражения в данном контексте можно считать синонимичными, так как они относятся к одному объекту - нацистской Германии.

«Классовый враг» - распространенное идеологическое клише и имеет очевидную связь с внутренней репрессивной политикой советской власти, поэтому частота употребления этой биграммы возрастает во время сопровождающих репрессии пропагандистских кампаний. Во время войны 1941-1945 гг. употребление ее резко снижается, зато значительно растет употребляемость других коллокаций со словоформой «врага» (рис. 4, а).

с1к*< С» г«]«! cfijiTl

б

Рис. 3. Десять наиболее частотных биграмм со словоформой «врага» и прилагательными в левой позиции (а). Фрагменты кривых для наиболее характерных биграмм со словоформой «врага» (б)

1944 Н<1 В|МГ Л

тылу Брага общего врага от врага

классового врага своего врага у врага

разгрома врага для врага против врага

0.0004786831^

00002933559% 0.0003749631% 0.0003510117% 0.0000476712%

0.0000904392% 0.0002202977% 00003189588% 0 0002202751% 0.0001 6711 48%

1Ф52 на врага тыпу&рагз общею врага от е para

классового врага своего врага у врага

(мзфоил врага для врага против Ёрагэ

0 0001297471%

0 0000913557% 0 0001025039% 0 0000944710% 0 0000722371% 0 0000556910% 00000544206% 0.0000 605537* * 0.0000372047% 0.0000437453%

б

а

Рис. 4. Относительная частота встречаемости биграмм со словоформой «врага»: а - в 1944 г.; б - в 1952 г

На рис. 4, а видно, что биграмма «классового врага» в 1944 г. хотя и вошла в десять самых частотных, но занимает среди них самое последнее место по относительной частоте (0,0000476712 %). После войны соотношение меняется. Как видно на рис. 4, б, в 1952 г. употребляемость биграммы «классового врага» возросла в полтора раза по сравнению с 1944 г.

При сопоставлении поведения биграмм «классового врага» и «классовых врагов» видно, что на всем протяжении кривые практически совпадают, кроме 1930-х гг., когда при росте частотности обоих выражений пик биграммы «классового врага» существенно выше (рис. 5). Исторически эти годы обозначались коммунистической идеологией как годы «обострения классовой борьбы», и поэтому возможно, что «классовые враги» в разных ипостасях, подобно военному противнику, начали рассматриваться и представляться в текстах как единый объект.

1910 1920 1930 1940 1950 1950 1970 1950 1990 20!

Рис. 5. Сопоставление частотного поведения биграмм «классового врага» и «классовых врагов»

На рис. 6 видно, что рост употребляемости словоформы «врага» и биграммы «классового врага» приходится на разные годы и что рост употребляемости «врага» в годы войны значительно выше роста употребляемости биграммы «классового врага» в 1930-е гг.

Частотность форм множественного числа в данном случае намного выше частотности форм единственного числа. Очевидно, так называемые «враги народа», в отличие от «классовых врагов», представлялись в печати как множество дискретных и многообразных объектов (лиц). Возможно, этим же можно объяснить несколько отличающееся от других членов словоизменительной парадигмы поведение словоформы «врагов» (см. рис. 1, 7).

При сопоставлении биграмм «врагов народа» и «классового врага» (рис. 8) очевидно, что в целом тенденции поведения этих биграмм сходны: рост употребляемости в 1920-х гг. при практическом совпадении кривых до середины 1920-х, пики обеих кривых (с некоторыми различиями в высоте и времени пиков) в 1930-е гг., затем снижение частотности в военные годы и некоторый рост в начале 1950-х. Причем в этот момент рост частоты употребляемости биграммы «врагов народа» выражен сильнее.

Рост в 1950-е, очевидно, соответствует послевоенной волне репрессий. В 1960-е гг. частота встречаемости выражения «врагов народа» ниже, чем выражения «классового врага», хотя разница невелика, а тенденция к плавному снижению совпадает в обоих случаях. Существенные различия в поведении кривых возникают во второй половине 1980-х и до конца 1990-х. В этот период частота встречаемости биграммы «врагов народа» заметно растет (см. рис. 8). Это, по-видимому, отражает появление большого количества текстов, содержащих критику сталинизма, - так сказать, «эхо» минувших исторических событий.

-«J

19Ю 1920 1930 19J0 1990 1960 1970 19S0 1990 Л"

Чмьъесоввго Ü|mí.I ' 10)

б

Рис. 6. Сопоставление частотного поведения: а - биграммы «классового врага» и словоформы «врага»; б - словоформы «врага» с биграммой «классового врага» с умножением ее относительной частоты на 10

Рис. 7. Сопоставление частотного поведения биграмм «враг народа», содержащих различные грамматические

формы существительного «враг»

ВрЛГОЕ Ин1 |К> Дil

Н1 'К СОЕ О Н' I;.- ?Г 1

(970 13ГО 1990 ШI

а

Рис. 8. Сопоставление частотного поведения биграмм «врагов народа» и «классового врага»

Синонимы, квазисинонимы и антонимы

Модель 1 и Модель 2

Как сказано выше, «враги народа» представлялись пропагандой в виде множества различных объектов (лиц). Их объединяли в группы, для обозначения которых использовались слова (по существу, синонимы), в некоторых случаях обозначавшие классовую или политическую принадлежность, иногда их именовали по фамилии лица, которому приписывались лидерство в некоторых оппозиционных действиях или разработка политической теории. В других случаях используется просто эмоционально-экспрессивная, пейоративная лексика.

Все три кривые для словоформ «троцкистов», «зиновьевцев», «бухаринцев» (рис. 9, а) почти изоморфны, т. е. при различных числовых значениях имеют сходную форму. При сравнении с кривой для биграммы «врагов народа» (см. рис. 7, 9, б) отмечается сходство кривых этих словоформ с вышеуказанной биграммой. Отметим характерную форму кривых: каждая из них имеет «большой пик» во второй половине 1930-х гг., затем спад употребляемости до середины 1940-х гг. В начале 1950-х гг. появляется «малый пик», за которым следует плавное снижение, а затем рост употребляемости в одних случаях выраженный, а в других едва заметный, начиная с середины 1980-х до конца 1990-х гг.

пакт-ооооят-аооо«о*

шведам»

Ш№5ЯН(

ашноо».

0ССС№-о сотво%-

О гш:щ';в

/ /

/

А \> 'Л-

л V ^

л

900 1910 1920 1930 19« 1950 1ЯШ 1970 1990 19Н Ж

0000650% 0000500% 00004Ы%

оадат%

0030360%

0000300% 0000550% 0ШШ№ 00301т 0000100% 0000050% 0000000%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

00 1910 1Я0 19а 1940 19Й 1960 19Щ 1900 199А ¡й

и[|,|мчг II.']-:^ I

ри 1|Н1< 1->11

а

б

Рис. 9. Словоформы «троцкистов», «бухаринцев», «зиновьевцев»: а - частотное поведение (с умножением относительной частоты на 2); б - сопоставление с частотным поведением биграммы «врагов народа»

Рис. 10. Сопоставление графиков частотного поведения словоформ «кулаков» и «кулачества»

1939

деревенских_АШ кулаков бывших_АСи кулаков местных ADO кулаков ecex_ADJ кулаков русских_АШ кулаков крупных_АСМ кулаков этих_АСМ кулаков C80HX_AOJ кулаков Tanix_ADJ кулаков сельских_АОи кулаков

0 0000087001%

0 0000059136% 00000038141% 0 0000014918% 0 0000015190%

0 0000025897% 0 0000029748% 0 0000012898% 0 0000019989% 0 0000005052%

Рис. 11. Десять наиболее частотных биграмм со словоформой «кулаков» и прилагательным (местоимением) в левой позиции

Следующая лексическая единица - «кулаки», относящаяся к категории «чужой». «Кулак» - лексема, имеющая много значений (кисть руки со сжатыми пальцами, группировка военных сил, часть механизма, скупой человек и др.). Однако в исследуемый исторический период словоформа «кулаков» чаще всего употреблялась в «сталинском» значении: богатые крестьяне, использующие наемный труд.

Это подтверждается двумя наблюдениями: во-первых, сопоставлением частотного поведения словоформ «кулаков» и «кулачества» (рис. 10). Лексема «кулачество» представляет собой однозначный политический термин. Графики поведения кривых, тем не менее, сходны. Во-вторых, из десяти биграмм, отобранных системой автоматически из всего массива русских текстов, шесть имеют характерную идеологическую окраску (рис. 11).

Даже в тех случаях, когда в левой позиции биграммы находятся нейтральные местоимения, при выборочном просмотре текстов идеологические коннотации очевидны, например: «Беспощадная война против этих кулаков! Смерть им! Ненависть и презрение к защищающим их партиям: правым эсерам, меньшевикам и теперешним левым эсерам!» (Емельян Ярославский, 1938).

Сопоставим поведение словоформ «кулаков» и «кулачества» с поведением словоформы «колхозов». Для наглядности сопоставления всех трех кривых выполним операцию умножения относительной частоты употребления словоформ «кулачества» и «кулаков» на 5 (рис. 12).

Слово «колхоз» в исследуемый период, безусловно, относилось к категории «свой». Обратим, однако, внимание на сходство конфигурации трех кривых при первом подъеме и при снижении употребляемости во время войны. Послевоенный пик кривой словоформы «колхозов» отмечается позже, чем пики двух других кривых. При этом значение второго пика (1960 г.) выше, чем значение первого (1934 г.). Тем не менее мы считаем, что все три кривые в данном случае следуют общей модели (см. рис. 12).

На рис. 13 показаны графики частотного поведения слов «буржуазия» и «пролетариат» -«идеологических антонимов», в двух грамматических формах - в именительном и родительном падежах.

10050014 оловоок ааодя оаш% о.яим оамш% о.оазоо%

О.ЙКОО^ 0.00100% О.ООИМ

И 1«

и 1X0 19 И 1540 1950 1560 №0 1980 15® Я)

(кугтАВ 1

((ЯОиМ* . ■ ^ н

Рис. 12. Графики частотного поведения словоформ «кулаков», «кулачества» и «колхозов»

Рис. 13. Графики частотного поведения словоформ «буржуазия», «буржуазии», «пролетариат», «пролетариата»

Вновь обращает на себя внимание то, что формы родительного падежа на всем временном отрезке более частотны, чем формы именительного падежа. Кривые же для именительного падежа двух слов практически сливаются. Кривые родительного падежа несколько отличаются, их пики более выражены. Отметим, что эти кривые на рис. 13 по своей конфигурации сходны с кривыми, представленными на рис. 7-11. Условно назовем такую модель частотного поведения лексических единиц Моделью 1. Для нее характерны подъем частоты словоупотреблений в 1930-е гг., выраженный спад во время Второй мировой войны и новый подъем в послевоенные годы. Обратим внимание, что Модели 1 соответствуют кривые лексических единиц, относящихся не только к категории «чужой», но и к категории «свой».

Далее, на одном графике построено 30 кривых для трех биграмм со словоформами «кулацких», «троцкистских» и «гитлеровских» (рис. 14).

Самый высокий пик кривой для биграмм со словоформой «кулацких» наблюдается у биграм-мы «кулацких хозяйств» в 1931 г., для биграмм со словоформой «гитлеровских» - у биграммы «гитлеровских захватчиков» в 1944 г., для биграмм со словоформой «троцкистских» - у двух практически сливающихся биграмм «троцкистских агентов» и «троцкистских вредителей» в 1934-1940 гг.

Рис. 14. Графики частотного поведения наиболее частотных биграмм со словоформами «кулацких», «троцкистских» и «гитлеровских» в левой позиции

Отметим также, что пик графика поведения биграммы «гитлеровских захватчиков» значительно выше, чем пики двух других биграмм. Иначе говоря, частота бранных словосочетаний, относящихся к военному противнику в период войны, выше, чем относящихся к так называемым внутренним врагам.

На рис. 15 видно, что для обозначения военного противника в годы войны намного чаще употреблялось нейтральное слово «противник», чем экспрессивно-пейоративное выражение «фашистские захватчики». Частота употребления биграммы «Красной Армии» в годы войны много выше, чем словоформы «противника» и биграммы «фашистских захватчиков». Тем не менее конфигурация кривых сходна. Условно назовем такую конфигурацию Моделью 2. Для нее характерен, прежде всего, выраженный рост частоты встречаемости лексических единиц в период войны, затем в некоторых случаях заметный рост в 1960-1970-е гг., что мы связываем с большим количеством исторических и мемуарных текстов, изданных в этот период. Сравним несколько кривых, соответствующих произвольно выбранным словоформам, означающим реалии войны. Видно (рис. 16), что кривые для указанных слов соответствуют Модели 2, которую условно в контексте данной статьи можно назвать «военной». По-видимому, как среди лексики Модели 1, которую условно назовем «классовой», так и среди лексики Модели 2 могут встречаться типичные и нетипичные случаи.

Рис. 15. Частотное поведение словоформы «противника», биграмм «Красной Армии» и «фашистских захватчиков»

Рис. 16. Частотное поведение словоформ, означающих реалии войны

Кривая для биграммы «приспешников буржуазии» соответствует Модели 1, а для биграммы «приспешников Гитлера» - Модели 2 (рис. 17). Обе кривые, на наш взгляд, типичны для своих моделей. Столь же типичными для Модели 1 являются кривые для слов «пролетариат» и «буржуазия» (см. рис. 13). С другой стороны, кривая для словоформы «колхозов» (см. рис. 12) нам представляется нетипичным вариантом Модели 1, так как второй пик у нее значительно выше первого. Обращаем внимание, что кривая поведения словоформы «борьбы» на рис. 2 также следует Модели 1, хотя и в невыраженном виде.

1945 г.

приспешников Гитлера

приспешников буржуазии

1934 г, а

' 1 -1

1930 1940 1360 1960 1Э70

Рис. 17. Частотное поведение биграмм со словоформой «приспешников» и существительным в правой позиции

Семантическое поле со словом «борьба»

Из десяти биграмм, сгенерированных системой, биграмма «классовой борьбы» наиболее частотная (рис. 18). Кривая этой биграммы соответствует Модели 1.

0.МШ

0 0050%

ошш

ома»

о нош

шшк

О.ОСШ

1310 ОТ ОТ 1И ОТ Ш МО

С' й н. ГИ*1 $ 4 I»

мрьоы митичеши Ыи ооръоы

пойIШ|1ы" ы

0<80ЛОДШРПЬИЙМ ЧМ ОЛ

цдешпч еа си_ ЯК? мрым раИТИЫЯЙАШ мрьйы ^ШЯК-ЦИ.-'ИНОИМУ

.>коНФиическ»н АШ йрьоы

Рис. 18. Поведение наиболее частотных биграмм со словоформой «борьбы» и прилагательным в левой позиции

_* I М1 .1С ССНВИ I»' 11] ?, [> Ь '

^.КПЛСГОЦЛГО Ы|м1Г.1 ' 5)

яки

б

Рис. 19. Сопоставление частотного поведения: а - словоформа «борьбы» и биграммы «классовой борьбы», «классового врага»; б - словоформы «борьбы», «классовой» и биграмма «классовой борьбы»

3360000%

К» 1Я0 I960 1530 IM ПН Ш 1910 1S 80 1990 ЯК

Oto|Ki«ü_NCHJH ЦЩСОЫЙ 60pb6i

Рис. 20. Частотное поведение триграмм с разными грамматическими формами слова «обострение» в сочетании «обострение классовой борьбы»

o6ocTpet<HH_NOUN классовом борьбы

обострение^ГЮин классовой борьбы истории NOUN классовой борьбы теории_М01Ш классовой борьбы обостренней NOUN классовой борьбы фориы ЫОиМ классовой борьбы cbopM_NOUN классовой борьбы 06ocTpeHHe_NOUN классовой борьбы развнтия НОиМ классовой борьбы

Поведение словоформы «борьбы» в различных сочетаниях особенно наглядно демонстрирует характерные особенности Модели 1 (рис. 19-21).

Эквиваленты в английском, немецком, французском и китайском языках

Рис. 21. Десять наиболее частотных триграмм со словосочетанием «классовой борьбы» и существительным в левой позиции

Интересно также сравнить частотное поведение единиц русской политической лексики XX в. с поведением их эквивалентов в других языках. Это отдельная большая тема (особенно если рассматривать лексику во всей ее полноте и в разных языках), поэтому здесь мы лишь покажем некоторые отличия и наметим возможные направления исследования.

Google books Ngram Viewer позволяет посредством применения специальных тегов строить на одном графике кривые поведения слов в корпусах разных языков. В некоторых публикациях мы уже показывали результаты применения этого приема [Масевич, Захаров, 2016а; 2016г].

В случае языков с разными словоизменительными системами некорректно рассматривать поведение лексических единиц на материале отдельных словоформ, нужно составлять запрос на основе полной парадигмы.

Прежде всего, отметим, что частотное поведение эквивалентов слова «враг» в немецком, английском, французском, китайском языках отличается от поведения этого слова в русском языке. При этом поведение слов-эквивалентов в трех европейских языках имеет при некоторых различиях в числовых значениях выраженные черты сходства, т. е. следует общей модели. Китайская модель, что естественно, отличается как от русской, так и от европейской (рис. 22). В этом еще одно подтверждение связи между частотным поведением слов и историко-полити-ческой реальностью.

В трех европейских языках кривые употребляемости лексемы «враг» имеют две особенности: для них характерны два пика (первый приходится на 1918 г., т. е. на конец Первой мировой войны, второй - на время Второй мировой войны, причем второй пик ниже первого); все три имеют тенденцию к снижению - значение конечной точки кривой (2000 г.) ниже значения исходной точки в английском языке в 3 раза, во французском в 2,2 раза, в немецком в 1,7 раза.

-,-,-,-,-,-,-Т-1-Т-1 >0 1910 1920 1930 1940 1950 1960 1970 1960 1990 2000

10 1)10 Ш 1И0 I» ДО ДО 1)10 М I» ¡но

в г

Рис. 22. Частотное поведение совокупности грамматических форм слова «враг» в русском корпусе

и слова-эквивалента в других языках: а - в немецком; б - в английском; в - во французском; г - в китайском корпусе

Частота встречаемости лексемы «враг» в русском языке в годы Второй мировой войны значительно выше, чем ее эквивалентов в трех европейских языках.

Очень характерно то, что в русском языке не удалось выявить отражения событий Первой мировой войны.

Китайский язык демонстрирует совершенно другую модель, которая отражает известную общественно-политическую реальность, имевшую место в Китайской Народной Республике. Причем на графике (см. рис. 22) мы видим, что интенсивность пропаганды в Китае, особенно в период культурной революции 1966-1976 гг., была даже выше, чем антифашистской пропаганды в СССР.

Заключение

Частота встречаемости слов зависит от многих факторов: общественно-политических, исторических, психологических.

Графики, отражающие частотное поведение лексических единиц (словоформ и коллокаций), позволяют выявить группы лексических единиц, частотное поведение которых имеет опреде-

ленные черты сходства. Разумеется, нет и не может быть двух лексических единиц, имеющих идентичное частотное поведение во времени. На наш взгляд, следует говорить о прототипе частотного поведения лексических единиц для данного языка и для данного исторического периода. Прототип может быть условно выбран из ряда сходных типов поведения (конфигураций графиков). По всей вероятности, если принять за реальность прототипическую модель частотного поведения лексических единиц, то возникнет вопрос выработки критерия соответствия условному прототипу или же критерия сходства кривых.

Как было показано, общая модель частотного поведения слов-эквивалентов наблюдается и в разных языках при сходных историко-культурных ситуациях.

Две рассмотренные модели русского языка, как нам представляется, принципиально различаются прежде всего тем, что в одном случае встречаемость лексической единицы в период войны уменьшается (Модель 1), в другом возрастает (Модель 2). В послевоенные годы встречаемость исследуемых единиц несколько растет, но по разным причинам: в случае Модели 1 это реальный возврат в жизнь явлений, обозначаемых исследуемыми единицами, а в случае Модели 2 - «текстовое эхо» реальных событий, отраженное в печати, при этом в большинстве случаев она не достигает военного или довоенного пика.

Мы продемонстрировали две модели поведения лексических единиц на определенном отрезке времени на материале лексики русского языка, которая свойственна политическому, пропагандистскому и агитационному дискурсу в пределах ограниченного семантического поля. Однако наш опыт показывает, что и в других лексических категориях можно осуществлять подобную систематизацию лексики на основе частотного поведения. Это позволяет говорить об эффективности применения количественных методов к описанию семантического пространства.

Что касается исследований на материале других языков, то следует учитывать, что их морфология, причем как словоизменение, так и словообразование (например, в немецком языке), а также наполнение лексико-семантических полей отличаются от русского языка.

Частотное поведение лексических единиц, безусловно, обусловлено действием многих социально-психологических, политических и других факторов. Эти факторы и их корреляция с полученными данными требуют также описания специалистами соответствующей предметной области. Однако и чисто лингвистический подход добавляет, на наш взгляд, новые аспекты в осмысление исторических процессов.

Список литературы

Захаров В. П., Масевич А. Ц. Диахронические исследования на основе корпуса русских текстов Google Books Ngram Viewer // Структурная и прикладная лингвистика. СПб., 2014. Вып. 10. С. 303-327.

Костомаров В. Г. Языковый вкус эпохи. М.: Педагогика-пресс, 1994. 247 с.

Масевич А. Ц. Захаров В. П. Методы корпусной лингвистики в исторических и культурологических исследованиях // Компьютерная лингвистика и вычислительные онтологии: Тр. XIX Междунар. объединенной научн. конф. «Интернет и современное общество» (IMS-2016), СПб.: Изд-во Университета ИТМО, 2016а. С. 24-43.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Масевич А. Ц., Захаров В. П. Методы корпусной лингвистики в исторических исследованиях. 2016б. URL: https://www.researchgate.net/publication/309386435_Metody_korpusnoj_lingvis-tiki_v_istoriceskih_issledovaniah_Corpus_Linguistics_Methods_in_Historical_Studies_(дата обращения 30.01.2017).

Масевич А. Ц., Захаров В. П. Лингвистическая картина российской истории. 2016в. URL: https://www.researchgate.net/publication/309386514_Lingvisticeskaa_kartina_rossijskoj_istorii_ Linguistic_portrait_of_20th_century_Russian_history_a_corpora-based_study (дата обращения 30.01.2017).

Масевич А. Ц., Захаров В. П. Опыт корпусно-ориентированного историко-культурного исследования исторической и политической лексики // Библиосфера. 2016г. № 2. С. 47-55.

Рождественский Ю. В. Принципы современной риторики. 2-е изд. М.: Аргус, 2000. 135 с.

Michel J.-B. et al. Quantitative Analysis of Culture Using Millions of Digitized Books science // Science. 2011. Vol. 331. P. 176. DOI 1126/Science. 1199644. URL: http://www.sciencemag.org/ content/331/6014/176.full.html (дата обращения 30.01.2017).

Материал поступил в редколлегию 07.04.2017

Andrey Ts. Masevich 1, Victor P. Zakharov 2

1 St. Petersburg State Institute of Culture

2 Dvortsovaya Emb., St. Petersburg, 191186, Russian Federation

2 St. Petersburg State University 7-9 Universitetskaya Emb., St. Petersburg, 199034, Russian Federation

2 Institute for Linguistic Studies of the RAS

9 Tuchkov Lanc., St. Petersburg, 199053, Russian Federation

andmasev@mail.ru, v.zakharov@spbu.ru

DIACHRONIC RESEARCH OF THE RUSSIAN POLITICAL LEXICON

OF THE 20th CENTURY

The paper presents the results of a diachronic research of the Russian political lexicon of the 20th century based upon the Russian corpus of the Google Books using the Google Books Ngram Viewer. This tool is used to create charts of changing frequency of lexical items - words and collocations -within a given period. We found that certain lexical units have similar pattern of frequency behavior. Two graphic models of the words' behavior and their correlation with the historical process are described.

Keywords: corpora of texts, diachronic studies, frequency of lexkal units, models of words behavior, semantic field.

References

Kostomarov V. G. Yazykovyy vkus epokhi [Language taste of an epoch]. Moscow, Pedagogics-press, 1994. 247 p. (In Russ.)

Masevich A. Ts., Zakharov V. P. Metody korpusnoy lingvistiki v istoricheskikh i kul'turolog-icheskikh issledovaniyakh [Corpus linguistics methods in historical and culturomics studies].

Komp'yuternaya lingvistika i vychislitel'nye ontologii. Trudy XIX Mezhdunarodnoy ob"edinennoy nauchnoy konferentsii «Internet i sovremennoe obshchestvo» (IMS-2016) [Computational linguistics and computerized ontologies (IMS-2016)]. St. Petersburg, ITMO University, 2016, pp. 24-43. (In Russ.)

Masevich A. Ts., Zakharov V. P. Metody korpusnoy lingvistiki v istoricheskikh issledovaniyakh [Corpus linguistics methods in historical studies]. 2016. URL: https://www.researchgate.net/publi-cation/309386435_Metody_korpusnoj_lingvistiki_v_istoriceskih_issledovaniah_Corpus_Linguis-tics_Methods_in_Historical_Studies_(last access 30.01.2017).(In Russ.)

Masevich A. Ts., Zakharov V. P. Lingvisticheskaya kartina rossiyskoy istorii [Linguistic portrait of 20th century Russian history: a corpora-based study]. URL: https://www.researchgate.net/publi-

cation/309386514_Lingvisticeskaa_kartina_rossijskoj_istorii_Linguistic_portrait_of_20th_century_ Russian_history_a_corpora-based_study (last access 30.01.2017). (In Russ.)

Masevich A. Ts., Zakharov V. P. Opyt korpusno-orientirovannogo istoriko-kul'turnogo issledo-vaniya istoricheskoy i politicheskoy leksiki [An experience of the corpus-oriented historical and cultural research of a historical and political lexicon]. Bibliosphere, 2016, no. 2, p. 47-55. (In Russ.)

Michel J.-B. et al. Quantitative Analysis of Culture Using Millions of Digitized Books science. Science, 2011, vol. 331, p. 176. DOI 1126/Science. 1199644. URL: http://www.sciencemag.org/con-tent/331/6014/176.full.html (last access 30.01.2017).

Rozhdestvenskiy Yu. V. Printsipy sovremennoy ritoriki [Principles of modern rhetoric]. 2nd ed. Moscow, Argus, 2000. 135 p. (In Russ.)

Zakharov V. P., Masevich A. Ts. Diakhronicheskie issledovanija na osnove korpusa russkikh teks-tov Google Books Ngram Viewer [Diachronic research on the base of the Russian corpus of the Google Books Ngram Viewer], Strukturnaja i prikladnaja lingvistika [Structural and Applied Linguistics], St. Petersburg, 2014, vol. 10, p. 303-327. (In Russ.)

i Надоели баннеры? Вы всегда можете отключить рекламу.