Научная статья на тему 'Частотность как значимый регистр лексикографии и фразеографии'

Частотность как значимый регистр лексикографии и фразеографии Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1205
183
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧАСТОТНОСТЬ / ЛЕКСИКОГРАФИЯ / ЛИНГВОДИДАКТИКА / СТИЛИСТИКА / НОРМАЛИЗАЦИЯ / FREQUENCY / LEXICOGRAPHY / EDUCATIONAL LINGUISTICS / STYLISTICS / STANDARDIZATION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Глинкина Лидия Андреевна

Частотность как лексикографический параметр имеет большую прагматическую и научную значимость в синхронном и диахронном языковом описании. Употребительность слов учитывается при составлении словарей-минимумов, используемых при обучении иностранцев русскому языку. В сфере стилистики она является показателем идиостиля автора. Частотность как регистр исторической лексикографии позволяет судить о динамике русской лексики, формировании узуальной нормативности в прошлом и о глубинных истоках современного словарного состава.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FREQUENCY AS AN IMPORTANT CHARACTERISTIC OF LEXICOGRAPHY AND PHRASEOGRAPHY

Frequency as a lexicographic parameter is of great pragmatic and academic significance both for synchronic and diachronic language description. Word frequency is taken into account in dictionaries of basic vocabulary for foreigners learning Russian. In stylistics frequency is used as a marker for the author's idiom. Frequency as a parameter of historical lexicography gives an insight into the development of the Russian vocabulary, the process of usage standard formation in the past and the sources underlying modern Russian vocabulary.

Текст научной работы на тему «Частотность как значимый регистр лексикографии и фразеографии»

ФИЛОЛОГИЯ

ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ СЛАВЯНСКОЙ ЛЕКСИКОГРАФИИ И ФРАЗЕОГРАФИИ

© 2011

Л. А. Глинкина

ЧАСТОТНОСТЬ КАК ЗНАЧИМЫЙ РЕГИСТР ЛЕКСИКОГРАФИИ

И ФРАЗЕОГРАФИИ

Частотность как лексикографический параметр имеет большую прагматическую и научную значимость в синхронном и диахронном языковом описании. Употребительность слов учитывается при составлении словарей-минимумов, используемых при обучении иностранцев русскому языку. В сфере стилистики она является показателем идиостиля автора. Частотность как регистр исторической лексикографии позволяет судить о динамике русской лексики, формировании узуальной нормативности в прошлом и о глубинных истоках современного словарного состава.

Ключевые слова: частотность, лексикография, лингводидактика, стилистика, нормализация.

Развитие вычислительной техники и статистики во второй половине ХХ в. коснулось и языкознания. Использование количественной (статистической) методики при изучении языковых и речевых объектов разного типа и разного уровня становится многоаспектным прикладным направлением в психолингвистике, социолингвистике, математической лингвистике, лексикографии при изучении текста и его языковых единиц, жанров, вариативности и т. д. «Поверив алгеброй» языковую «гармонию», структурно-вероятностный подход усиливает эффективность лингвистического анализа, делая его достоверным и убедительным. Особенно велика его значимость для исследования обширных массивов текстов при создании с помощью ЭВМ масштабных машинных языковых фондов и картотек. В разных сферах лингвистики количественные данные имеют разное назначение. В одних случаях они определяют точные цифровые критерии отбора материала для анализа по минимальному или максимальному употреблению языковых единиц, в других случаях берётся во внимание неопределённое множество в противоположность единичности. Целевая направленность обработки языкового материала не всегда требует указания на частотность единиц. Поэтому названный критерий необязателен в регистре многих типов словарей, но, получая эксплицитность, он становится определяющим и обычно входит в название лексикографического издания (см. библиографию). В зависимости от материала и его осмысления в целом частотность позволяет достоверно судить о степени нормативности явления, его значимости и выделении среди других однородных фактов, о повторяемости в индивидуальном стиле, об эволюции синонимичных и вариантных единиц

Глинкина Лидия Андреевна — доктор филологических наук, профессор кафедры русского языка и методики преподавания русского языка Челябинского государственного педагогического университета. E-mail: boyarskayaov@yandex.ru

и т. д. Напр., для Л. К. Граудиной, В. А. Ицковича, Л. П. Катлинской, авторов первого в российской лексикографии «Опыта частотно-стилистического словаря вариантов. Грамматическая правильность русской речи» статистические показатели употребления грамматических вариантов в речи служат свидетельством их конкуренции и формирования кодифицированных литературных норм [Граудина 1976]. Количественное сравнение в цифрах и процентах подробно комментируется. Напр., оппозиция деепричастий возникнув — возникши (37 / 2 — 94, 60 % 5,40 %) рассматривается с позиций нормативности языка и процесса архаизации вариантов. Источником словаря послужила картотека в 100 000 употреблений, взятых из современной художественной литературы, публицистики, из ответов на вопросник по современной русской морфологии.

Обзор частотных словарей современного русского языка и их типология даны в самом полном учебном пособии по русской лексикографии А. Н. Козырева и В. Д. Черняк (см. [Козырев, Черняк 2004]). Числовые характеристики слов в текстах определённой длины предназначены главным образом для отбора самых распространённых слов языка, которые могли стать основой при изучении и усовершенствовании преподавания иностранного языка или стиля, идиостиля отдельных авторов. Первым в русистике является частотный словарь Э. А. Штейнфельдт по материалам текстов современной литературы, прессы и радиопередач [Штейнфельдт 1968]. Более полный (9 044 единицы) «Частотный словарь русского языка» под редакцией Л. Н. Засориной широко охватывает язык художественной литературы, публицистическую и деловую речь [Засорина 1977]. На их основе создавались более узкие частотные словари-минимумы в учебных и методических целях. Таков, напр., учебный словарь для зарубежных школ под редакцией Н. М. Шанского, действительного члена АПН СССР, «4 000 наиболее употребительных слов русского языка» [Шанский 1979].

В 1985 г. коллективом авторов под редакцией В. В. Морковкина был создан сводный словарь обобщающего типа с учётом степени употребительности и тематики лексем и словосочетаний (14 000 единиц). Его назначение — также учебно-методическое. В 1993 г. за рубежом был опубликован Л. Лённгреном «Частотный словарь русского языка» [Лённгрен 1993].

Другую направленность имеют частотные словари, в которых собраны редко употребляющиеся слова. Таков уникальный «Толковый словарь "Редкие слова в произведениях авторов XIX века. Около 3500 единиц"». В словаре использованы: 1) данные словоуказателей к произведениям классической литературы (Н. А. Некрасова, Д. Н. Мамина-Сибиряка, Л. Н. Толстого, М. Ю. Лермонтова, И. А. Крылова, Ф. И. Тютчева); 2) словоуказатели, полученные на ЭВМ в ИЛИ РАН по произведениям Н. В. Гоголя, И. С. Тургенева, А. П. Чехова, М. Е. Салтыкова-Щедрина и др. Всего обследовано более 1 500 000 словоупотреблений из текстов XIX века. Выявлено около 3 200 слов, не вошедших по разным причинам в современные толковые словари, составивших корпус названного словаря. Частично такие лексемы со временем были архаизованы и сегодня при «реанимации» нуждаются в толковании. Таковы, напр., архивный юноша ('представитель привилегированной группы молодых чиновников из дворянства, служивших в Московском архиве Государственной коллегии иностранных дел'), богадельня ('благотворительное заведение для содержания и досмотра престарелых, больных нищих'), камер-фу-

рьер ('придворный чин XI класса по Табели о рангах, ведавший прислугой и наблюдавший за приготовлением парадных столов') и др.

Наряду с частотными словарями общеупотребительных слов, объектом статистической обработки во второй половине XX в. стали жанрово и стилистически ограниченные источники: детская речь, газетная лексика, научно-учебная литература, язык массовой коммуникации, разговорная речь. Авторы ряда словарей создавали возможность для решения информационно-поисковых задач и автоматизации лексикографической работы.

Типология статистической обработки языка обычно строится с учётом употребительности единиц по нарастающей или по убывающей.

Опора на частотность употребления языковых единиц хотя и не фиксируется, становится отправным параметром для отбора толкуемого материала в «Большом словаре крылатых слов и выражений русского языка» В. П. Беркова, В. М. Моки-енко, С. Г. Шулежковой [БСКСиВ 2008-2009]. Словарь представляет собой одно из самых полных собраний русских крылатых единиц, широко употребляющихся современными носителями русского языка ярких, образных слов и выражений, авторы или источники которых хорошо известны или доказуемы [Шулежкова 2008]. Критерием для авторов была даже минимальная фиксация (до 10 раз) каждой единицы, её употребительность не единожды, известность, распространённость и воспроизводимость. Условно можно назвать этот лексикографический подход «имплицитной» частотностью. Подобным образом в ортологии определяется орфоэпическая кодификационная норма по варианту, принятому кодификаторами за наиболее массовый и употребительный.

Толковые словари языка писателей и поэтов (см. выше о статистическом обследовании произведений русских авторов) позволяют с помощью частотности решать множество частных исследовательских задач, касающихся стилистики текстов, окказионализмов, авторского отношения к иноязычным словам, церковнославянизмам, архаизмам, неологизмам и в целом судить об идиостиле писавших. Не случайно акад. Л. В. Щерба называл подобные словари словарями-справочниками. Замечательный образец такого типа — «Словарь языка А. С. Пушкина».

Частотность как лексикографический параметр в историко-лингвистических словарях — явление исключительное. Первые подступы к частотному обследованию древних текстов находим в статье Л. В. Вялкиной и Г. Н. Лукиной [Вял-кина, Лукина 1966]. Первый частотный словарь по старорусским текстам создал А. А. Грузберг. Автор «Частотного словаря русского языка второй половины XVI — начала XVII века» учитывает все стилистические разновидности лексики 27 памятников этого периода, не включает редкие слова с частотой от одного до пяти употреблений. В итоге обработан лексикон в 127 476 слов общей длиной текста 406 150 словоупотреблений [Грузберг 1974].

Особое место занимает десятитомный академический «Словарь древнерусского языка XI-XIV вв.». В русской лексикографии это единственный истори-ко-лингвистический словарь с чётко очерченным хронологическим полем, охватывающим 784 источника XI-XIV вв. в списках до середины XV в. В нём под редакцией Р. И. Аванесова сделан строгий отбор текстов, в который не входят Ветхий и Новый завет в восточнославянском, болгарском и сербском изводах. Тексты представлены территориально — от Галича до Суздаля. В жанрово-стили-

стическом плане — включены государственные грамоты и частные грамотки на берёсте, приписки и зачины, тексты юридической, агиографической, литературно-повествовательной литературы. Числовые характеристики употребительности слов дают возможность установить объективную картину жизни древнерусского языка от ранних источников до общевосточнославянского языка, материнского для русского, украинского и белорусского, до его распада и появления ранних источников старорусского, староукраинского и старобелорусского языков.

Частотность соотносительна со степенью продуктивности лексических единиц, отдалённых от нас столетиями. Она служит показателем активности или пассивности лексем и устойчивых словесных комплексов. Анализ 1 000 слов из I тома «Словаря древнерусского языка» с учётом первой и последней фиксации в сравнении с современным лексиконом по «Толковому словарю современного русского языка» С. И. Ожегова, Н. Ю. Шведовой позволяет сделать обобщения относительно динамики по трём категориям частотности: высокой (от 500 употреблений и выше), средней (от 10 до 500 употреблений), низкой (от 1 до 10 употреблений). Наблюдения приводят к выводам:

— низкочастотные слова, хотя и преобладают количественно, в эволюции языка, обычно архаизируются и постепенно исчезают;

— высокочастотные и среднечастотные единицы входят в активный словарный запас, сохраняя основные значения. Они составляют основу традиционного исторического пласта русской лексики.

Пути эволюции в отдельных случаях касались всего лексико-структурного гнезда. Слова с высокой и средней частотностью употребления составляют основу традиционного, исторического пласта русской лексики:

— беззаконный (268), беседа (217), бес^довати (360), благо (336), болезнь (506), бол^ти (324), Богородица (1000), Бог (более 11 000), брат1я (менее 2000), братъ (менее 3 000), благыи (менее 1 000), блаженный (13 101), божественьныи (2 000), божии (5000), болен (1 300), быти (50 000),

— вр^мя (менее 1 000), воля (11 611), вещь (1 186), вина (1 167), вода (1 137), великий (1 400), вашь (1 915).

Низкочастотные слова относятся в основном к высокой лексике. В отдельных случаях их сохранности в языке способствовала церковь, которая увековечила их в своём канонизированном языке: безбожьникъ (1), благонравие (1), благообразие (1), благоухати (2), богословие (64) и др.

Созданные разнотипные частотные словари показали массу достоинств и преимуществ таких изданий. С появлением широкой информации в Интернете и нарастанием «цифрового бума» многократно вырастают возможности прикладного использования частотности при анализе лексических единиц. Достаточно сослаться на рождение нового направления «Компьютерная лингвистика» и на разработки информационно-программных систем Ю. Н. Филипповича и его коллег, которые работают «солидарно» с учёными-«словарниками» ИРЯ РАН им. В. В. Виноградова и дарят нам новые полезные учебно-научные издания [Астахина 2006]. Мы стоим на пороге перспективных новых лингвистических исследований прикладного и теоретического характера, построенных на достоверном фундаменте современного и диахронического языкового материала.

ЛИТЕРАТУРА

Астахина Л. Ю. Слово и его источники. Русская историческая лексикология: источниковедческий аспект / c послесл. Ю. Н. Филипповича. — М.: МГУП, 2006. — 368 с.

БСКСиВ: Берков В. П., Мокиенко В.М, Шулежкова С. Г. Большой словарь крылатых слов и выражений русского языка: ок. 5 000 ед.: в 2 т. / под ред. С. Г. Шулежковой. — Изд. 2-е, исправл. и доп. — Магнитогорск: МаГУ; Greifswald: Ernst-Moritz-Arndt-Universität, 2008-2009.

Вялкина Л. В., Лукина Г. Н. Материалы к частотному словарю древнерусских текстов // Лексикология и словообразование древнерусского языка. — М.: Наука, 1966. — С. 263-292.

Граудина Л. К., Ицкович В. А., Катлинская Л. П. Грамматическая правильность русской речи: опыт частотно-стилистического словаря вариантов. — М.: Наука, 1976. — 453 с.

Грузберг А. А. Частотный словарь русского языка второй половины XVI — начала XVII в. — Пермь: ПГУ, 1974. — 462 с.

Засорина Л. Н. Частотный словарь русского языка / под ред. Л. Н. Засорина. — М.: Рус. яз, 1977. — 936 с.

Козырев В. А., Черняк В. Д. Русская лексикография: пособие для вузов. — М.: Дрофа, 2004. — 288 с.

Лённгрен Л. Частотный словарь современного русского языка. — Uppsala, 1993. — 188 с. [Lönngren, Lennart. The Frequency Dictionary of Modern Russian. Acta Univ. Ups., Studia Slavica Upsaliensia 32. — Uppsala, 1993 — 188 s.].

Редкие слова в произведениях авторов XIX века: словарь-справочник: около 3 500 ед. / сост. Р. П. Рогожникова, К. А. Логинова, С. А. Пономаренко и др.; отв. ред. Р. П. Рогожни-кова. — 2-е изд., стереотип. — М.: Рус. слов.: Астрель, 2000. — 976 с.

Словарь древнерусского языка (XI-XIV вв.): в 10 т. / глав. ред. чл.-кор. АН СССР Р. И. Аванесов. — М.: Рус. яз.: Азбуковник, 1988-2008. — Т. 1-8 (изд. продолжается).

Штейнфельдт Э. А. Частотный словарь современного русского литературного языка: 2 500 наиболее употребительных слов / под ред. В. А. Ицковича. — Таллинн: НИИ педагогики СССР, 1968. — 316 с.

Шанский: 4 000 наиболее употребительных слов русского языка / Н. М. Шанский, З. П. Даунене, Н. З. Бакеева, М. П. Гайдарова, Н. Б. Карашева, Л. В. Судавичене; под ред. действ. члена АПН СССР Н. М. Шанского. — М.: Рус. яз., 1979. — 712 с.

FREQUENCY AS AN IMPORTANT CHARACTERISTIC OF LEXICOGRAPHY

AND PHRASEOGRAPHY

L. A. Glinkina

Frequency as a lexicographic parameter is of great pragmatic and academic significance both for synchronic and diachronic language description. Word frequency is taken into account in dictionaries of basic vocabulary for foreigners learning Russian. In stylistics frequency is used as a marker for the author's idiom. Frequency as a parameter of historical lexicography gives an insight into the development of the Russian vocabulary, the process of usage standard formation in the past and the sources underlying modern Russian vocabulary.

Key words: frequency, lexicography, educational linguistics, stylistics, standardization.

i Надоели баннеры? Вы всегда можете отключить рекламу.