УДК 81'37:82
ЧАСТОТА СЛОВА В ТЕКСТЕ И ШТРИХИ К КОНЦЕПТУАЛЬНОЙ СИСТЕМЕ МИХАИЛА ШОЛОХОВА
М.Ю. Мухин
LEXICAL FREQUENCY AND SOME IDEAS ON THE CONCEPTUAL SYSTEM OF MIKHAIL SHOLOKHOV
M.Yu. Mukhin
Рассматривается попытка формализованного построения концептуальной системы автора художественного текста на основании лексической частотности и последующего идеографического анализа. Концептуальная система М. Шолохова представлена как набор денотативных сфер, выраженных в его текстах в большей степени, чем у современных ему прозаиков. Наиболее важным сферам дан необходимый филологический комментарий.
Ключевые слова: идиостиль, концептуальная система, частотный анализ, идеографический анализ, М. Шолохов.
The author makes an attempt to consider the formalized structure of the conceptual system of fiction writers based on word frequency and further ideographic analysis. Thus M. Sholokhov's conceptual structure is presented as a set of denotative spheres expressed in his works to a greater extent than that in the works of contemporary writers. The most important spheres are provided with the necessary linguistic commentary.
Keywords: individual style, conceptual system, statistical analysis, ideographic analysis, M. Sholokhov.
Дискуссия об авторстве романа «Тихий Дон» и других шолоховских произведений явилась причиной того, что они стали частым объектом применения количественных методов. При этом узкая задача атрибутирования текста далеко не всегда предполагает исследование стилистических и концептуальных особенностей. Некоторые модели определения авторства привлекают, например, графематический уровень1, что вовсе не снижает их прагматическую эффективность. Для идиости-левого анализа, однако, они малопродуктивны, если только речь не идет о фоносемантике. Конечно, применимость статистики в плане изучения идиостилей гораздо шире атрибуции текста. В разное время количественные методы при анализе текста использовали, например, B.C. Баевский, M.JL Гаспаров, А.П. Журавлев, Ю.Н. Караулов, А.Н. Колмогоров, А.Я. Шайкевич и многие др., изучавшие грамматические и семантические аспекты текста, звуко-буквенные ассоциации, модели стихотворного ритма и рифмы, тематическую структуру художественных текстов и даже структуру литературной ситуации2. Элементы автоматического анализа и статистики применяют в таком случае для ускорения работы с большим объемом материала, при стилевом сопоставлении и
Мухин Михаил Юрьевич, канд. филол. наук, доцент, докторант кафедры современного русского языка Уральского госуниверситета им. A.M. Горь-кого (г. Екатеринбург). E-mail: [email protected]_
т.д., но их использование подчиняется основной филологической задаче.
Поиск методов формализованного выявления индивидуально-авторских особенностей текста приводит, в частности, к вопросу о том, насколько набор самых частотных слов неанонимного произведения может характеризовать идиостиль автора, отличать его от других. Заметим, что существуют слова, которые часто употребляются практически в любом художественном тексте и у любого автора {быть, говорить, надо, человек, время, место и др.). Их частота не связана с особенностями конкретного идиостиля, поэтому для выделения набора индивидуально-авторских слов предложим идею сопоставительной выборки материала, предполагающей привлечение текстов других авторов.
Следует сразу сказать, что это исследование отличается методологическим направлением от работ по атрибуции текста. В нем поддерживается традиционная точка зрения на авторство М. Шолохова3; во всяком случае, мы будем здесь исходить из того, что у привлекаемых для анализа произведений «Тихий Дон» (и всех его частей), «Поднятая целина», «Они сражались за Родину» и «Судьба человека»4 автор один. Аргументированной и доказанной концепции другого на-
Mikhail Yu. Mukhin, candidate of philological sciences, the senior lecturer of the Chair of Modern Russian Language, The Ural State University
(Yekaterinburg). E-mail: [email protected]_
Мухин М.Ю.
Частота слова в тексте и штрихи к концептуальной системе Михаила Шолохова
званного автора обсуждаемых текстов сегодня не существует. За громкой дискуссией о шолоховском авторстве, за понятными биографо-социологическими вопросами часто остаются в тени индивидуальные особенности творчества. Есть и еще одна причина, по которой филологи сегодня реже обращаются к творчеству Шолохова, - общее падение интереса к литературе, получившей официальное признание в советский период. Поэтому, несмотря на публикации шолоховских сборников и библиографических указателей, издание «Словаря языка Михаила Шолохова»5, подготовку энциклопедии6, сегодня рано говорить, что идиостиль Шолохова всесторонне изучен. Между тем направления системного исследования концептуальной системы автора можно выстроить на базе корпуса контекстов частотной лексики.
Рассмотрим перечисленные произведения Шолохова в сопоставлении с корпусом 12 текстов его современников (М. Булгакова, В. Набокова и А. Платонова)7. Каждый текст представлен тысячей самых частотных знаменательных лексем, и эти наборы слов сопоставлены. Отражающими идиостиль автора признаны слова, попадающие в пик частотности двух и более его произведений и не более чем одного произведения другого писателя. Вот шолоховский список слов: казак, хутор, полк, дед, зараз, станица, бык, фронт, казачий, крыльцо, парень, седло, рубаха, дивизия, шашка, курень, дюже, кинуть, бугор, окоп, подвода, выстрел, сено, батарея, выезжать, забирать, амбар, махнуть, плеть, юбка и т.п. (всего 197 в 21314 контекстах). Даже без контекстологического анализа очевидно, что уже этот набор лексем отражает идиостилевые особенности.
О концептуальной системе писателя можно судить по индивидуальному набору фрагментов действительности, отраженному в его произведениях. Для выявления этого набора проведем идеографический анализ контекстных значений «ав-
торских» слов и получим иерархию денотативных сфер, характерную для Михаила Шолохова.
Каждое словоупотребление приписано к той или иной сфере (у Шолохова представлено 25) и далее идеографической группе8. В случаях пересечения семантики классов со словом соотнесены 2 (иногда 3) маркера. Так, характерное для Шолохова слово курень в разных контекстах означает и строение, и помещение, и проживающую в нем семью: плотники срубили курень; Коршунов-ский просторный курень; проведала мелехов-ский курень другая беда и т.п. Разрядкой здесь и далее выделяются частотные слова, из-за которых весь контекст попадает в рассмотрение.
Шолоховскую иерархию денотативных сфер по убыванию значимости можно представить в виде таблицы.
Интерпретация этого списка также должна производиться в сопоставлении с творчеством других писателей. В самом деле, доля контекстов, отнесенных к сфере «Физическое воздействие», у Шолохова невелика: 2,77 %. Однако у прочих авторов - менее процента. С другой стороны, сфера «Эмоции» у Шолохова занимает вроде бы много контекстов (более 4 %), зато у Платонова - более 11 %.
Исходя их сопоставления с текстами других авторов представим денотативную иерархию Михаила Шолохова в виде поля:
1) ядерные сферы, в которых Шолохов лидирует (в сопоставлении с другими писателями): «Военная служба», «Человек как живое существо», «Движение, перемещение, помещение», «Населенный пункт», «Сельское хозяйство», «Физическое воздействие», «Живая природа», «Родственные и семейные отношения»;
2) сферы ближайшей периферии (в которых Шолохов уступает одному из других авторов): «Быт», «Речь», «Техника, производство» и др.;
3) сферы дальнейшей периферии: «Оценка», «Интеллект», «Форма» и др.;
Иерархия денотативных сфер по убыванию значимости
Сфера % Сфера % Сфера %
1. Военная служба 22,54 10. Социальные отношения 3,55 19. Строительство, здание 2,31
2. Человек как живое существо 14,26 11. Техника, производство 3,4 20. Предмет 1,54
3. Движение, перемещение, помещение 5,65 12. Физическое воздействие 2,77 21. Родственные и семейные отношения 1,44
4. Населенный пункт 4,81 13. Живая природа 2,75 22. Интеллект 0,88
5. Эмоции 4,24 14. Время 2,65 23. Форма 0,81
6. Сельское хозяйство 4 15. Неживая природа 2,63 24. Количество 0,51
7. Оценка 3,94 16. Речь 2,63 25. Материя и вещество 0,24
8. Восприятие органами чувств 3,76 17. Пространство 2,52
9. Быт 3,71 18. Универсальные представления, смыслы, отношения 2,42
Лингвистика текста и поэтический дискурс
4) вообще не реализованные количественно сферы-лакуны: «Сверхъестественное», «Искусство», «Развлечение», «Сфера обслуживания», «Наука и образование».
Последующий филологический анализ с привлечением конкретных лексических контекстов позволяет интерпретировать эту информацию. Например, из того, что Шолохов и Набоков лидируют в сфере «Движение, перемещение, помещение», конечно, не следует, что они пользуются одинаковыми языковыми средствами и текстовые функции этой сферы у писателей совпадают. Комментарий к ядерным сферам позволяет набросать «штрихи» к концептуальной системе Михаила Шолохова, заявленные в названии статьи.
Сфера «Военная служба». Сюжет трех из четырех рассматриваемых шолоховских произведений напрямую связан с военными действиями; в романе «Поднятая целина» военная тематика также присутствует. Ярко представлены в текстах Шолохова идеографические группы «Боеприпасы» (бомба, осколок, патрон, снаряд), «Место военных действий» (окоп, позиция, тыл, участок, фланг, фронт), «Одежда» (гимнастерка, мундир, ремень), «Оружие» (автомат, артиллерийский, наган, пулеметный, шашка, штык), «Подразделение» (батарея, дивизия, пехота, полк, рота), «Процесс и результат военных действий» (атака, боевой, воевать, гнать, лезть, наступление и многие др.), «Военная техника» (самолет, танк), «Человек» (автоматчик, есаул, казачий, майор, пленный, полковник, пулеметчик, солдатский, фриц, штыки — последнее о количестве людей в подразделении). Иными словами, рассматриваемая сфера реализовалась в текстах М. Шолохова подробнейшим образом. Встречаемость слов таких приоритетных для автора групп абсолютно интенциональна, т. е. отражает сознательную авторскую установку на отражение именно этого фрагмента действительности в своем произведении. Такие показатели составляющих концептуальной системы никак нельзя отнести к «фоновым», проявляемым бессознательно. Военная лексика является ведущей, базовой для индивидуально-авторской составляющей шолоховских произведений. В то же время роль таких сюжетно обусловленных сфер слишком очевидна, и ее констатация мало что добавляет к уже существующим читательским и филологическим представлениям.
Сфера «Человек как живое существо» занимает более 14 % шолоховских контекстов. В романах Шолохова преобладают слова, непосредственно называющие человека: казак, казачий, дед (в смысле возраста, а не родства), парень, бабий, мужской. Несколько слов употребляются исключительно как разговорные обращения (братец, браток, мамаша, сынок), и их количество обусловлено долей диалогов, внешней речи персонажей - простых людей.
«Части тела» - группа лексических универсалий текста. Поэтому частотность таких слов, как рука, нога, голова, не является идиостилевой чертой. Другое дело - ноздри, как в шолоховских романах (около 90 словоупотреблений): В нозд-р и его ударил тяжелый запах горелого железа и бензина, смешанный с горьким, золистым духом жженой травы (ЗР); В ноздри Нагульнову ударил теплый запах жилья и свежих хмелин (ПЦ); Запах недалекой воды ударил ей в ноздри; ...хмелем невыбродившим бьет в ноздри острый сладковатый бабий пот'. Запах ладана, плесени и гнили, запах старого неопрятного человека густо ударил ему в ноздри (ТД). Сильный, «ударяющий» запах пота, табака, мыла, ружейного масла, спирта, лука, сырой земли, лекарств и т.д. вызывает резкую реакцию персонажей и по-своему натурализует действие. Как пишет С.Г. Семенова, «зрительная фиксация мира у Шолохова значительно расширяется за счет всех человеческих рецепторов: и слуха... и тех чувственных показаний, которые дают в прямом контакте с предметом самые животно-непосредственные органы чувств: вкус, осязание, но особенно — обоняние»9. Сенсорические впечатления Шолохова по характеру бытовые, физиологичные, натуралистичные.
Кроме того, шолоховские герои (чаще мужчины) постоянно «раздувают ноздри», «шевелят ноздрями», «дрожат ноздрями» и т.п., переживая сильные эмоции: Вот как надо их бить! — сказал он, раздувая побелевшие ноздри, уже не скрывая своего торжества (ЗР); Раздувая ноздри, она по-мужски грубо воскликнула низким, рвущимся голосом... (ПЦ); Но широкие ноздри красноармейца зашевелились, взгляд непримиримо скользил по Григорию...', Гад! — вполголоса сказал Иван Алексеевич и коротко подрожал ноздрями (ТД). Жестовый характер (и как бы намеренность движения ноздрями) подчеркивается не совсем типичным употреблением глагола совершенного вида раздуть: Макар раздул ноздри, подмигнул Разметнову\ Нагульнов раздул ноздри (ПЦ).
Лексические группы сферы «Населенный пункт и административные единицы» имеют вполне конкретную семантику и очень важны для выражения пространственных отношений в различных художественых текстах. В произведениях Шолохова находим огромное количество словоупотреблений, обозначающих административно-территориальные единицы (округ, область, участок) в соответствующем значении (Старо-Ивановский, тавричанский участок), а также населенные пункты и их части (хутор, станица, проулок, хуторской). Они составляют почти 5 % от всех контекстов (у прочих писателей - в районе одного процента). Слово хутор попадает в частотный список всех рассматриваемых произведений. Сфера «Населенный пункт и административные единицы» необходима для географического
Мухин М.Ю.
Частота слова в тексте и штрихи к концептуальной системе Михаила Шолохова
оформления таких масштабных текстов, какими являются «Тихий Дон» и «Поднятая целина». Рассматриваемые слова выступают в конкретных прямых значениях, делая повествование реалистичным и историко-географически достоверным.
Сфера «Движение, перемещение, помещение». Исходя из количественного фактора решено было объединить в эту сферу три частных группы слов конкретной физической деятельности10. Для шолоховских произведений характерна в первую очередь лексика собственно движения и перемещения {гнать, возить, выезжать, махнуть, переправляться, тянуться, сворачивать и т.п.). Ее частотность - следствие динамичного эпического повествования, отражающего постоянное перемещение большого количества людей. «Шолоховские глаголы, - констатирует С. Г. Семенова, -лепят мир людей, не созерцающих или отвлеченно размышляющих, а действующих постоянно - от физической работы и военного дела до немедленного воплощения в реальный жест порывов и чувств»11. Соотнесенность военной службы, сельского хозяйства, трудовой деятельности с движением действительно вполне естественна: Потому вдоль пробороздишь, а потом вывернешь плуг и гонишь пятнадцать сажен порожнем; Навоз идите возить на огороды (ПЦ); Взвод за взводом выехали на дорогу (ТД). Типична для Шолохова и связь движения и выражения различных эмоций: Морщась, Григорий уронил [убитого] утенка, злобно махнул косой (ТД); [Давыдов] шел широкими шагами, а навстречу ему уже т я ну л ись руки и светились улыбками дочерна сожженные солнцем лица мужчин и матово-смуглые, тронутые легким загаром лица девушек и женщин (ПЦ).
В отличие от произведений Шолохова, реализацию данной сферы в текстах Владимира Набокова характеризует внимание к частным видам движений и эмоционально-психологической подоплеке физических действий. Это внимание, конечно, противопоставлено буквальному словоупотреблению и, следовательно, преобладающей прямой функциональности движения и перемещения в эпосе Михаила Шолохова.
Сфера «Сельское хозяйство». 4 % в среднем - объем сферы в произведениях Шолохова, но основную часть этих контекстов «поставляет» роман «Поднятая целина». Частотность слов сельскохозяйственной тематики {бык, овца, сено, участок, амбар, гумно, конюшня, вожжа, гнать (быков, плуги), распахивать, арба, подвода, трактор) однозначно обусловлена сюжетами текстов самых крупных шолоховских произведений. Рассматриваемая сфера создает необходимый фон для основного романного действия.
Сфера «Физическое воздействие». При анализе контекстов выделились следующие частные группы сферы: «Обработка объекта», «Давление», «Прикосновение», «Отрицательное воздействие»,
«Лишение жизни». Шолохов - лидер в этой категории (2,77 %), так как существенная часть лексики, представляющей сферу, - глаголы отрицательного воздействия и лишения жизни: рубить, побивать, расстреливать, ранить, сбивать (например, с лошади) и т. п. У прочих авторов такие глаголы не попадают в число частотных, несмотря на актуальность идеи убийства в романах В. Набокова («Король, дама, валет» и «Камера обскура») или А. Платонова («Чевенгур»). Сцены убийства есть и в романах М. Булгакова.
Сфера «Живая природа». Группы «Животное», «Растение», «Признак живого существа», «Процесс, связанный с живым существом» пересекаются в произведениях Шолохова с рубрикой «Сельское хозяйство», так как речь постоянно идет о сельскохозяйственных и ездовых животных {бык, жеребец, кобыла, овца), частях тела животного {копыто, хвост, ноздря), процессах {кормить, жевать). Из растений наболее часто упоминаются тополь и бурьян. Картина, которую создают перечисленные слова, не совпадает с читательским представлением о том внимании, которое уделяет М. Шолохов миру природы. Например, Г.С. Ермолаев пишет: «В целом ряде значительных пейзажных описаний, связанных с войной, особо подчеркивается в природе не борьба, а красота и изобилие жизненных сил в ней...»12. Почему у Шолохова, склонного к подробным эсте-тизированным описаниям природы, в этой категории оказываются столь «прозаичные» слова? Наши рассуждения строятся на критерии лексической и — далее - семантической частотности. Следовательно, или в своих описаниях природы писатель использует слова, употребляемые многими авторами, или же сами эти описания уступают по значимости другим смысловым категориям. Вероятно, оба эти объяснения справедливы. В итоге, если судить по частоте слов и значений, в концептуальной системе Шолохова на первом месте оказывается все же «борьба», т. е. (в наших терминах) «Военная служба», «Физическое воздействие», «Движение».
Сфера «Родственные и семейные отношения». Основные слова, обозначающие родство, попадают в общий фонд, поэтому эта рубрика в плане отражения любого идиостиля, наверно, всегда будет выглядеть бедно. Шолоховские слова сферы занимают 1,44 %: детишки, сынок, мамаша (в знач. «мать»), дед (практически не встречается в знач. «отец отца или матери», поэтому в основном попадает не в эту рубрику), курень (в знач. «семья»): В куренях лишь шла скрытая, иногда прорывавшаяся наружу, семейная междоусобица: старики не ладили с фронтовиками', В коршунов-ском курене предсвадебная суета (ТД). Очевидно, что попали они в список вследствие «этно-графичности» {курень) или сниженности, т. е. точного отражения речи простого человека: У меня три сына и зять на фронте, а четвертого, млад-
Лингвистика текста и поэтический дискурс
шего сынка, убили в Севастополе-городе, понял? (ЗР); Отец помер от воспаления нутра, мамаша с сеструшкой там (ПЦ); Почти все с хутора выехали, а я с детишками сижу, как дура! (ТД).
Итак, влияние сюжетов произведений на распределение денотативных сфер проявляется у М. Шолохова сильнее, чем у других авторов. Наиболее очевидно оно для базовых сфер «Военная служба» и «Сельское хозяйство», не просто составляющих фон жизни персонажей, а отражающих саму эту жизнь. С рубрикой «Сельское хозяйство» связано и употребление многих слов сферы «Живая природа». Динамичное повествование, характерное для шолоховского эпоса, выражается в значительном преобладании лексики конкретного физического действия. Для Шолохова характерно доминантное сенсорическое мировосприятие. Его сенсорические впечатления по характеру бытовые и натуралистичные. Причиной актуальности сферы «Населенный пункт» является исто-рико-географическая реалистичность шолоховских текстов. Стремление к достоверности изображения человека проявляется, в частности, в разговорности слов, которые употребляются в функции обращений.
Концептуальная система Михаила Шолохова характеризуется следующими параметрами: приоритетность отображения конкретно-физических процессов; стремление к историко-географи-ческой реалистичности и выраженный этнографизм; интерес к описанию военных действий и быта; натуралистичность и сенсорические черты авторской картины мира. В центре внимания писателя физическая сторона человеческой жизни, бытовые особенности, исследование казачества как особого этноса, обращенность человека к миру природы, констатация перемещения большого количества людей, подробная характеристика военных действий - в общем, тесно переплетенные физиологические и социальные аспекты человеческого бытия.
Эти чисто филологические заключения сделаны на основании первичной количественной обработки лексики и сопоставления с другими авторами. Идеографический анализ индивидуально-авторского набора слов позволяет систематизиро-ванно представить концептуальную систему авто-
ра в виде уникального ряда денотативных приоритетов и задать направления для дальнейшей филологической интерпретации.
1 Кукушкина О.В., Поликарпов A.A., Хмелев Д.В. Определение авторства текста с использованием буквенной и грамматической информации. URL: http://www.philol. msu.ru/~lex/articles/grco_r.htm
2 См.: Баевский В. С. Лингвистические, математические, семиотические и компьютерные модели в истории и теории литературы. М.: Яз. славян, культуры, 2001. С. 218-225.
3 Ермолаев Г.С. Михаил Шолохов и его творчество = Michail Sholokhov and his art. СПб.: Акад. проект, 2000; Кузнецов Ф.Ф. «Тихий дон»: судьба и правда великого романа. М.: ИМЛИ РАН, 2005; Хьетсо Г., Густавссон С. и др. Кто написал «Тихий Дон»? М.: Книга, 1989 и др. источники.
4 Далее в работе применяются сокращенные названия произведений: «Тихий Дон» (ТД), «Поднятая целина» (ПЦ), «Они сражались за Родину» (ЗР) и «Судьба человека» (СЧ).
5 Словарь языка Михаила Шолохова. М.: Азбуковник, 2005.
6 Фонд «Шолоховская энциклопедия». URL: http:// www.sholohov.su/ (дата обращения: 10.11.2009).
7 Всего в сопоставляемых текстах около 1,5 млн словоупотреблений, из которых шолоховская часть составляет почти половину - 687981 слово.
8 Выявление лексических классов осуществлялось с опорой на идеографические словари, вышедшие под редакцией проф. Л.Г. Бабенко: Большой толковый словарь русских существительных: Идеографическое описание. Синонимы. Антонимы / под общ. ред. Л.Г. Бабенко. М.: АСТ-ПРЕСС КНИГА, 2005; Словарь-тезаурус синонимов русской речи / под общ. ред. Л.Г. Бабенко. М.: АСТ-ПРЕСС КНИГА, 2007; Большой толковый словарь синонимов русской речи: идеографическое описание, антонимы, фразеологизмы / под общ. ред. Л.Г. Бабенко. М.: АСТ-ПРЕСС КНИГА, 2008.
9 Семенова С.Г. Мир прозы Михаила Шолохова. От поэтики к миропониманию. М.: ИМЛИ РАН, 2005. С. 96.
10 Детальная классификация лексико-семантических групп русских глаголов представлена в Большом толковом словаре русских глаголов: Идеографическое описание. Синонимы. Антонимы. Английские эквиваленты / под ред. проф. Л.Г. Бабенко. М.: АСТ-ПРЕСС КНИГА, 2007.
11 Семенова С.Г. Цит. соч. С. 91.
12 Ермолаев Г.С. Михаил Шолохов и его творчество = Michail Sholokhov and his art. СПб.: Акад. проект, 2000. С. 96.
Поступила в редакцию 15 марта 2010 г.