УДК 81
О ГЕНДЕРНО-МАРКИРОВАННЫХ ЕДИНИЦАХ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ КАК СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИКАХ СЛУЖЕБНЫХ ЧАСТЕЙ РЕЧИ
Н. Д. Голев, Д. А. Реттих
ABOUT GENDER-MARKED UNITS IN RUSSIAN TEXTS AS STATISTIC CHARACTERISTICS OF LINK PARTS OF SPEECH N. D. Golev, D. A. Rettikh
Статья посвящена проблеме наличия в русском языке гендерно-маркированных лексем. Ставится и обсуждается вопрос о степени такой маркированности у разных лексем, разрабатывается методика измерения лексических единиц в данном аспекте. Статья выполнена на материале служебные части речи - частиц и союзов. Источник материала - авторские профили, принадлежащие авторам-мужчинам и авторам-женщинам, на одном дискуссионно-информативном портале русского Интернета. Для решения поставленных задач авторами применяется лексико-квантитативный метод, связанный с определением частотности избранных лексем в текстах разных авторских профилей с их дальнейшим ранжированием в данном параметре для определения степени маркированности.
The article is devoted to the problem of gender-marked lexemes in the Russian Language. The question about the degree of marked lexemes is introduced and discussed, the methods of lexical units measuring being worked out. The article is done on the materials of link parts of speech - conjunctions and particles. The source of the materials is author profiles belonging to men and women on the discussion-informative portal of Russian Internet. The research is done by means of lexical-quantitative method which is connected with the definition of chosen lexemes frequency in the texts of different author profiles, further ranking to define the degree of marked lexemes being carried out.
Ключевые слова: гендерная лингвистика, идентификационная лингвистика, частицы русского языка, лек-сико-квантитативный метод, мужская и женская речь, гендерно-маркированные тексты.
Keywords: gender linguistics, identification linguistics, Russian particles, lexical-quantitative method, male and female speech, gender-marked texts.
Статья включена в парадигму сибирской лингво-персонологии, она продолжает линию разработки лингвоперсонологической гипотезы языка, согласно которой между оппозициями типов языковой личности и значимостями, формируемыми оппозициями в системе языка, существуют устойчивые коррелятивные отношения [2, с. 512 - 522]. В данной статье осуществляется попытка выстроить гендерную оппозицию языковых личностей и представить ее как оппозицию гендерно-маркированных лексем. Попытка противопоставления лексем по гендерному признаку осуществлена нами в статье «Общий род» и гендерная семантика русских имен существительных: бигендер-ность или агендерность?» [3, с. 14 - 28], в которой гендерная сема понималось в системно-языковом плане как узуальная «способность» персоной лексемы обозначать лиц мужского и женского пола, а зоолек-семы - самцов и самок. В данной статье поиск ген-дерной семы переведен в речевую плоскость, ее проявления авторы стремятся обнаружить не в объекте обозначения, а в субъекте речи, точнее, в образе автора в тексте, который так или иначе проявляет себя в нем, в том числе и в плане его гендерной принадлежности. Текст, таким образом, выступает как персоно-текст. Гендерные персонотексты исследовались нами ранее в работе «К основаниям гендерной типологии читателей (на материале рефлексий о художественном тексте младших подростков)» [6, с. 119 - 125].
Основной способ обнаружения гендерных проявлений автора в тексте в настоящей статье - квантитативный, связанный с определением частотности избранных лексем в текстах разных авторов (относи-
тельно которых известна их гендерная принадлежность) с их дальнейшим ранжированием в данном параметре для определения степени маркированности. Квантитативное измерение системных оппозиций в языке также имеет свою линию в исследованиях авторов [1; 4; 5].
Изучение языка в аспекте гендерных различий имеет в российской лингвистике достаточно давнюю традицию, начало которым положили социолингвистические исследования. Гендерная лингвистика изучает языковые явления, связанные с различием носителей языка по полу. Среди факторов, определяющих дифференциацию языковых единиц, используемых мужчинами и женщинами, могут быть социальные, религиозные и др. Чаще всего различия проявляются в речи, на лексическом уровне, но могут также проявляться на орфоэпическом, фонологическом уровнях [16, с. 42]. В большинстве исследований гендерных проявлений в речи под мужским и женским полом подразумевается «...не биологический пол, а скорее, социальная роль (быть мужчиной/женщиной и совершать в связи с этим соответствующие данной культуре действия, в том числе и речевые)» [11, с. 46 - 47].
Существует множество работ, связанных с исследованием закономерностей в мужской и женской речи, среди них: Т. В. Гомон, Е. И. Горошко, Е. А. Земская, А. В. Кирилина, Е. С. Ощепкова [8 - 11; 15]. В результате исследований учёные приходят к выводу, что чётких дифференцирующих признаков, способных идентифицировать мужскую и женскую речь, не существует, однако, можно говорить о степени проявленности тех или иных единиц, указывающих на принадлеж-
ность автора к мужскому или женскому полу. Среди этих исследований мы выделяем работу А. В. Кирилиной, в которой говорится об определенных особенностях речевого стиля мужчин и женщин, который проявляется на двух уровнях, которые с известной долей условности мы назвали симптомами первого и второго порядка. К симптомам первого порядка относятся признаки, обнаруживаемые более четко. Они могут быть замечены непосредственно в период речевого общения: перебивания, длительность речевого периода, категоричность высказывания и связанные с ней предпочтения в выборе типа речевого акта, управление тематикой диалога и т. д. К симптомам второго порядка относятся особенности речи, для выявления которых требуется специальная статистическая процедура: частотность употребления определенных частей речи, частиц, синтаксических конструкций. Данное исследование имеет своим предметом, по терминологии А. В. Кирилиной, симптомы второго порядка.
Целью настоящего исследования является выявление в тексте симптомов второго порядка на основе служебных слов русского языка (прежде всего частиц), которые несут в себе признак гендерной принадлежности языковой личности автора данного текста. Основным способом обнаружения названного признака является количественный подсчет интересующих нас лексем в текстах, написанных мужчинами и женщинами, и дальнейшим их сопоставлением, направленным на выявление лексем, которые можно было бы квалифицировать как преимущественно мужские или женские. Маркированные по тендерному признаку тексты мы называем персонотектами. Обращение к формально количественным методам обусловлено тенденциями развития лингвоперсонологии вообще (см. опыты квантитативных исследований в [13 - 14]) и гендерной лингвистики в частности. А. Г. Фомин писал в связи с последней: «Введение статистических принципов обработки данных в лин-гвогендерные исследования не является новым для мировой науки, но современная российская лингвистика находится на таком уровне обобщения лингвистических данных, когда обнаруживается необходимость обязательной, точной обработки данных для получения репрезентативных выводов» [17, с. 5].
Исходной установкой исследования послужило предположение о том, что в русском языке существуют слова, которые в плане частотности имеют ген-дерную маркированность. Следовательно, в текстах, написанных женщиной, будут чаще встречаться одни слова, а в текстах, написанных мужчиной, другие слова. На основе данной гипотезы за основу исследования был взят лексико-квантитативный метод изучения (см. о нём: [13; 14; 17]).
Материалом послужили 9 текстов (средней размер текста - 10 тыс. слов.) пользователей портала "Newsland", при этом известно, что 3 из них принадлежат мужчинам (м1, м2, м3), 3 - женщинам (ж1, ж2, ж3) и 3 текста на начальном этапе идентифицированы не были.
Newsland - информационно-дискуссионный портал, в котором пользователи могут оставлять комментарии к новостным статьям. У каждого зарегистриро-
ванного пользователя сайта имеется профиль. За основу материала исследования были отобраны профили пользователей данного портала, и из данных профилей извлечены авторские комментарии. Комментарии были извлечены подряд, без деления на темы и т. п.
Для исследования были выбраны наиболее частотные частицы и союз русского языка [18]: же, ведь, бы, вот, только, ещё, если, ну, не.
На начальном этапе работы было подсчитано количество слов, принадлежавших данному пользователю, и по формуле:
Количество частиц в тексте х 100
общее количество слов = частотность частиц, выраженная в %
найдена частотность употребления заданных частиц в соотношении с общим числом слов.
Ниже представлены результаты подсчётов, которые показывают процентное соотношение исследуемого слова ко всему тексту (все данные указаны в %):
ЖЕ
1 »2 3
0,496
0,5 _ 0,34 0,359 ^^ 0319
0,112
0
Женский Мужской
Рис. 1. Частотность употребления частицы ЖЕ
0;4 0 2 0
ВЕДЬ ■1ч 2 з
0:241
0:137 0:137
■■I 0:032 И0=031
Женский Мужской
Рис. 2. Частотность употребления частицы ВЕДЬ
БЫ
0.5
и
0.433
0.253,
0.212
| 0.279°=336
III
1 ■ 2 ■ 3
Женский Мужской
Рис. 3. Частотность употребления частицы БЫ
вот
0.4
0,198 п 177 0 2 _0=146
1 ■ 2 3
0=22 0.2120=221
0
ШшШ
Женский Мужской
Рис. 4. Частотность употребления частицы ВОТ
ЕСЛИ
о Л 0=344
0.195
1 Я2 шз
0279
02 0
'0,168
10.24
I 1-1
Женский Мужской
Рис. 7. Частотность употребления союза ЕСЛИ
ТОЛЬКО
1 "2 ■ 3
НУ
1 я2 "3
0,6 0=521 ОА
0^2 О
§0=327 0798
0346
| |н
0,31
I
Женский
Мужской
Рис. 5. Частотность употребления частицы ТОЛЬКО
ЕЩЁ
0=283 0_261
■ 1 Ч 3
02990292
0=4
02 0
Женский Мужской
Рис, б. Частотность употребления частицы ЕЩЁ
0=206 р8а
■
0=4 0=2 0
0.212
0=059 ■ 0=049 0.038 0.037
0=119
Женский Мужской
Рис. 8. Частотность употребления частицы НУ
Женский Мужской
Рис. 5. Частотность употребления частицы НЕ
Результаты позволяют провести линию гендера у трёх частиц: же, вот, не.
Рис. 10. Сопоставление частотностей употребления частицы ЖЕ в женских и мужских текстах
вот
0,25
0.2
0.15
0.1
0.05
0
0.22
ТШГ
■ 1 ■2 "3
р Мужской тендер
Женский тендер
Женский Мужской
Рис. 11. Сопоставление частотностей употребления частицы ВОТ в женских и мужских текстах
НЕ ■ 1 -2 "3
2,324 2з78 2,79 Мужской тендер
Женский тендер
Женский
Мужской
Рис. 12. Сопоставление частотностей употребления частицы НЕ в женских и мужских текстах
Данная линия говорит о возможной гендерной маркированности данных частиц русского языка. Следующим этапам исследовательской работы является апробация полученных результатов. Проверка проводилась на основе трёх текстов других авторов, взятых из того же источника. Для частоты проверки изначально пол авторов известен не был.
Принцип проверки: в проверочных текстах (п1, п2, п3) высчитывалась частотность гендерно-маркированных частиц по той же формуле, что в исходных текстах. Далее результаты соотносились с предыдущими данными. Реальный пол авторов был проверен по глаголам прошедшего времени: все тексты были написаны мужчинами.
Результаты проверки: рис. 13 - 15.
Рис. 13. Сопоставление частотностей проверочных текстов с имеющимися данными по частице ЖЕ
ВОТ
1 2 3
0,35 0,3 0,25 0,2 0,15 0,1 0,05 0
0,321
0,198
0,22 0,212 0,221
0,177
Женский
Мужской
Проверка
Рис. 14. Сопоставление частотностей проверочных текстов с имеющимися данными по частице ВОТ
3
2,5 2 1,5 1
0,5 0
2,74
2,475
НЕ
2,824 2,78 2,79
2,725
1 2 3
2,538
Женский
Мужской
Проверка
Рис. 15. Сопоставление частотностей проверочных текстов с имеющимися данными по частице НЕ
Результаты анализа позволяют сделать следующие обобщения: п1 = женский (по частице не), мужской (по частице вот), мужской (по частице же), следовательно п1 = 1/3 женский, 2/3 = мужской; п2 = женский + мужской + женский, следовательно п2 = 2/3 женский, 1/3 мужской; п3 = женский + женский + мужской, следовательно п3 = 2/3 женский, 1/3 мужской. Что говорит нам о том, что текст № 1 принадлежит мужчине, № 2 и № 3 - женщине.
Данные результаты получены на ограниченном материале (и в плане массива «просчитанных» текстов и в плане набора «просчитанных» лексем и языковых личностей - авторов текстов), поэтому экстраполировать эти результаты в плоскость системной лингвистики и говорить об устойчивости гендерной семы для той или иной лексемы преждевременно. Также из того, что полученные результаты не соответствуют реальному полу автора, следует: из приведённых частиц нет такой, которая смогла бы чётко определить гендер автора. Есть лишь некоторые проявления различий, носящих слабо выраженный градуальный характер, так, частица же проявляет достаточно сильную позицию в гендерно-идентифи-кационном аспекте. Это во многом объясняется специфическими функционально-семантическими характеристиками служебных слов, употребление которых обусловлено не столько семантикой (тем более номи-
нативной), сколько синтагматикой. По терминологии представителей Пражской лингвистической школы, они являются номинативно слабыми, но синтагматическими сильными (в большей мере последнее касается предлогов и союзов). Продолжая линию обоснования слабости гендерной семы, заметим также, что среди проанализированных частиц и союза: же, ведь, бы, вот, только, ещё, если, ну, не - нет такой, с помощью которой можно чётко идентифицировать пол автора. В это плане значимы результаты, полученные в исследовании Т. Б. Крючковой [12], в поле зрения которой попадает частица не. Согласно данному исследованию «в речи женщин также наблюдалась тенденция к более частому употреблению частицы "не"». Нетрудно убедиться, что в нашем исследовании получены данные, позволяющие интерпретировать частицу «не» как гендерно (слабо) маркированную. Нарушение закономерности можно объяснить разными дискурсами текстов, взятых для исследований. Все сказанное приводит к выводу о необходимости продолжения исследований в рамках сформулированной гипотезы на другом (дискурсном, жанровом, персон-ном) материале.
Литература
1. Голев Н. Д. О возможностях Интернета в количественном описании лексической семантики // Славянская филология: исследовательский и методический аспекты: материалы I Международной научной конференции (23 - 24 марта 2006 г.) / под ред. Н. Б. Лебедевой. Вып. 1. Кемерово: Меркурий, 2006. С. 41 - 49.
2. Голев Н. Д. О корреляционных связях между системой типов языковых личностей и системой категорий русского языка // VI Международная научная конференция «Русский язык в языковом и культурном пространстве Европы и Мира: Человек. Сознание. Коммуникация. Интернет». 22 - 25 мая 2014 года. Лёвен, Бельгия. Department of Slavonic and Eastern European. Studies of the University of Leuven. Instytut Rusycystyki Uniwersytetu Warszawskiego). С. 512 - 522.
3. Голев Н. Д. «Общий род» и гендерная семантика русских имен существительных: бигендерность или агендерность? // Вестник Томского государственного университета. (Серия: Филология). 2013. № 6(26). С. 14 -28.
4. Голев Н. Д. Поисковые системы Интернета как лингвистический источник (на примере решения некоторых теоретических и прикладных вопросов русского словообразования) // Новые явления в славянском словообразовании: система и функционирование: Доклады XI Международной научной конференции Комиссии по славянскому словообразованию при Международном комитете славистов (Москва, МГУ им. М. В. Ломоносова, филологический факультет, 24 - 26 марта 2009 г.) / под ред. Е. В. Петрухиной. М.: Изд -во Моск. ун-та, 2012. С. 197 - 212.
5. Голев Н. Д. Понятие «квантитативная мощность языковых единиц» и его исследовательские возможности (по статистическим данным поисковых систем Интернета) // Метаязык науки: мат. Международной научной конференции / гл. ред. С. В. Лесников. Сыктывкар: СыкГУ, 2012. С. 245 - 254.
6. Голев Н. Д., Максимова С. А. К основаниям гендерной типологии читателей (на материале рефлексий о художественном тексте младших подростков) // Вестник Кемеровского государственного университета. 2008. № 4. С. 119 - 125.
7. Головина Т. А. Лингвоперсонологическое функционирование частей речи: статистический аспект: на материале художественных текстов: дис. ... канд. филол. наук. Барнаул, 2008.
8. Гомон Т. В. Судебно-автороведческая экспертиза текстов документов, составленных с намеренным искажением письменной речи: автореф. дис. ... канд. юрид. наук. М., 1992.
9. Горошко Е. И. Особенности мужского и женского вербального поведения: (психолингвистический анализ): автореф. дис. ... канд. филол. наук. М., 1996.
10. Земская Е. А., Китайгородская М. А., Розанова Н. Н. Особенности мужской и женской речи // Русский язык в его функционировании / под ред. Е. А. Земской, Д. Н. Шмелева. М.: Наука, 1993.
11. Кирилина А. В. Гендер: лингвистические аспекты: монография. М., 1999.
12. Крючкова Т. Б. Некоторые экспериментальные исследования особенностей использования русского языка мужчиной и женщиной // Проблемы психолингвистики. М., 1975. С. 186 - 200.
13. Напреенко Г. В. Идентификация текста по его авторской принадлежности на лексическом уровне (формально-количественная модель) // Вестник Томского государственного университета. 2014. № 379. С. 17 -23.
14. Напреенко Г. В. Интернет-дневники и проблема идентификации личности // Языковая личность: моделирование, типология, портретирование. Сибирская лингвоперсонология. М.: ЛЕНАНД, 2014. С. 544 - 559.
15. Ощепкова Е. С. Идентификация пола автора по письменному тексту (лексико-грамматический аспект): автореф. ... дис. канд. филол. наук. М., 2003.
16. Словарь социолингвистических терминов / отв. ред. В. Ю. Михальченко. М., 2006.
17. Фомин А. Г. Психолингвистическая концепция гендерной языковой личности: дис. ... д-ра филол. наук. Барнаул, 2004.
18. Частотный словарь русского языка / под ред. Л. Н. Засориной. М., 1977.
Информация об авторах:
Голев Николай Данилович - доктор филологических наук, профессор кафедры русского языка КемГУ, [email protected].
Nikolay D. Golev - Doctor of Philology, Professor at the Russian Language Department of Kemerovo State University.
Реттих Дмитрий Александрович - студент по направлению «Отечественная филология» КемГУ, [email protected].
Dmitriy A. Rettikh - student of Kemerovo State University.
(Научный руководитель - Н. Д. Голев). (Research advisor - N. D. Golev).
Статья поступила в редколлегию 01.06.2015 г.