www.volsu.ru
DOI: http://dx.doi.Org/10.15688/jvolsu2.2016.2.20
УДК 811.16'374 Дата поступления статьи: 20.04.2016
ББК 81.41-4 Дата принятия статьи: 27.04.2016
О СЛОВАХ, КОТОРЫМ НЕ ПОВЕЗЛО В АКАДЕМИЧЕСКИХ СЛОВАРЯХ
Ян Вавжинчик
Доктор филологических наук, профессор, Варшавский университет [email protected]
Краковское предместье, 26/28, 00-927 г. Варшава, Польша
Аннотация. В статье рассматриваются традиции составления академических словарей, заложенные и воплощенные в авторитетных лексикографических трудах середины XX века. Многотомные алфавитные словари русского и польского языков анализируются с точки зрения информации, относящейся к различным уровням структуры языка и опирающейся в процессе составительской и редакторской работы как на реальные, так и на потенциальные словники. Предлагаются возможные пути решения проблемы исчерпывающего выбора вокабул из текстов источников, использованных для эксцерпции заголовочных слов и иллюстративных цитат, что является ключом к созданию принципиально нового академического издания данного типа.
В полемичной форме обсуждаются принципы отбора лексем, которые дают возможность «перешагнуть» старый, хорошо знакомый лексикографам, рубеж заголовочных слов и приблизиться к полумиллионному количеству словарных статей. Выявляются лакуны (в среднем каждая вторая единица потенциального словника), связанные, в частности, с цитатным материалом и позволяющие значительно расширить объем академических словарей за счет включения лексем, пропущенных или не попавших в них по разным причинам. Подвергается критике непоследовательность и случайность выбора слова как конститутивный признак уже изданных словарей и вновь составляемых в настоящее время, лишающий пользователя не только полезной, но и дополнительной в семантическом и синтаксическом планах информации о богатстве славянских языков.
Ключевые слова: славянская лексикография, академические словари, словник, словарные иллюстрации, заголовочное слово.
Составление словарей, называемых академическими, имеет давнюю, прекрасную традицию во многих странах мира. Они полезны и дороги филологам всех наций. Я, например, как 3 филолог был воспитан на двух академических
^ словарях: «Дорошевском» и БАСе. Эти заметем
^ ки посвящены одному академическому слова-е рю польского языка - j?zyka polskiego»
| под редакцией В. Дорошевского - и одному ака-^ демическому словарю русского языка - «Боль© шому академическому словарю русского язы-
ка» (гл. ред. К.С. Горбачевич; науч. координатор издания А.С. Герд).
Многотомные алфавитные словари академического типа содержат большое количество лексикографической информации, относящейся к различным уровням структуры языка. Основная, семантическая, информация связана в обоих словарях, естественно, с информацией количественной, характеризующей их реальные словники по отношению к потенциальным словникам.
Потенциальные словники «Дорошевско-го» и БАСРЯ авторами-составителями данных словарей не описаны, о них не говорится в предисловиях, несмотря на то, что с ними постоянно имели дело составители и редакторы. Ситуация странная, но объяснительный ключ к ней простой: необходимость выбора слов из текстов источников, использованных для эксцерпции заголовочных слов и иллюстративных цитат. Выбор вокабул - это некоторый процесс, однако его полные, детальные характеристики ни в словаре Дорошевского, ни в БАСРЯ не указаны.
Потенциальный словник есть сумма заголовочных слов, которые можно извлечь из текстов, использованных в ходе эксцерпцион-ных работ над словарем Дорошевского и БАСРЯ, если бы эксцерпция была исчерпывающей, тотальной. Вопрос о том, какая часть единиц потенциального словника попадает в словарь и предлагается пользователям на его страницах, интересный и принципиально важный. Теоретически эта часть измерима, но в настоящее время определить ее можно лишь приблизительно, неточно: тотальная эксцерп-ция позволила бы «перешагнуть» хорошо знакомый рубеж 125-130 тысяч заголовочных слов, «полные» словари под редакцией В. До-рошевского и БАСРЯ могли бы насчитывать, соответственно, до 250 тысяч слов каждый.
Новый горизонт увидеть нетрудно. Практическое знакомство с цитатным материалом обсуждаемых словарей на фоне текстов, указанных в списках источников этих словарей, позволяет предположить, что слов, пропущенных, не попавших по разным причинам в их словники, столько же, сколько и вошедших в них: исключалась в среднем каждая вторая единица потенциального словника. Доказательством этой пропорции служат следующие факты. Как известно, составители словаря под ред. В. Дорошевского эксцерпциировали около 3 200 текстов-источников весьма различной длины (цифра 3 200 указана в предисловии к 11-му, дополнительному, тому «Дорошевского», см. также: [5]). Можно предположить, что в среднем в каждом из них зафиксировано 30 слов, не включенных в словник (см. примерные списки таких единиц и комментарии к ним в: [3; 4]). Для БАСРЯ такого подробного анализа мною пока не проводилось, но пред-
варительные просмотры его текстов-источников дают сходные в количественном отношении результаты (отдельные, но показательные примеры единиц, «которым в БАСРЯ не повезло», см. в: [1]).
Делались ли исключения сознательно, продуманно? Несомненно, но не всегда и не все. Непоследовательность, случайность выбора -конститутивный признак «Дорошевского» и БАСРЯ. Например, в одном из текстов-источников «Дорошевского» соседствуют два структурно и семантически родственных слова: сштоорг^пу и czerwonooprawny, но в словник попало только одно из них. В БАСРЯ нет статьи азотнокислый, но слово зафиксировано в тексте, использованном для документации в статье агроклиматический. Конечно, ограниченность, нехватка места, необходимость его экономии в печатном словаре -логически приемлемое оправдание таких пропусков, но о существовании этих пропусков забывать нельзя.
Польский и русский языки значительно богаче, чем это показывают академические словари. Не вдвое богаче! Многие потенциальные заголовочные слова скрываются в текстах, не включенных в списки источников словарей под ред. В. Дорошевского и БАСРЯ. Списки этих источников тоже ограничены по длине, и фактор случайности выбора в них, конечно, тоже налицо. Количество текстов для эксцер-пции легко удвоить, притом новые тексты в жанровом отношении не будут отличаться от старых, уже подвергнутых частичной эксцер-пции (художественные, научные и научно-популярные тексты, публицистика, газетные тексты, эпистолярное наследие), так как запасы печатной продукции на обоих языках эпохи «от Пушкина / Мицкевича и до наших дней» практически неисчерпаемы.
Расширение списка текстов-источников позволит, несомненно, построить полумиллионные словники. Указанный рубеж вполне реален. Что касается количественных данных в отношении русской лексики, необходимо вспомнить уникальный коллективный труд под ред. Р.П. Рогожниковой, в котором зарегистрировано более 170 тысяч слов, слов с обширнейшей поисточниковой документацией. Предположение, что эта документация скрывает 200-300 тысяч слов, не попавших в слов-
ники существующих больших словарей, никак не фантазия.
Выдвинутый квантитативный тезис можно поддержать наблюдениями, сделанными мною над содержанием словаря под ред. В. Дорошевского [3; 4]: в нем, то есть в его иллюстративных цитатах, содержится много слов, не попавших в словник. Такое «невключение» слова в словник «обиднее» для слова, чем «невключение» в словник слова, выступающего в цитате, не выбранной из текста-источника (то есть в потенциальной цитате).
Аналогичное явление характерно для БАСРЯ. Примеры, подтверждающие существование такого рода пропусков-потерь, обнаружить нетрудно. Их интенсивный поиск еще впереди, пока можно привести лишь следующие случаи (после «черного слова» указывается соответствующая словарная статья БАСРЯ):
автоколебательный НЕРАЗРЫВНЫЙ
анатомо-физиологический ГИНЕКОЛОГИЯ
архангелогородец ПЯТИТЬСЯ
асдик РАДАР
аспидистра ДРАЦЕНА
ацтеко-таноанский АЦТЕКИ
барабанка МЕДВЕДИЦА [нет в словаре Р.П. Рогож-
никовой]
бильбергия ДРАЦЕНА
бледно-зеленый АРБУЗИК
веселореченец ВОЗДЕЛЫВАТЬ
восьмиорудийный ПРИСЛУГА
древесно-кустарниковый АРБОРИЦИД
гарнолужский ОТЖИВАТЬ
желтовато-розовый ВЫЦВЕТАТЬ
живоловка ДАВИЛКА
заформовать 2. БРАК
знатко РАСКУСАТЬ
истомно-торжествующий РАССТИЛ
клавишеструнник МОНОХОРД
ковалечек ПРОСЯЩИЙ
колунишко 1. НАКАЛЫВАТЬ
консольно-балочный КОНСОЛЬНЫЙ [такого типа
сложные прилагательные отмечены в словаре
Р.П. Рогожниковой, 2 случая]
крепостица БЕРЕЖЕНИЕ
майнаться ПОВЫПОЛЗАТЬ
менакит ИЛЬМЕНИТ
многохвостый ВЫЧЕРЧИВАТЬ
нетревожный РАССТЕЛИТЬ
обестабачиться НЕЧА
одевальщица 3. НАКАЛЫВАТЬ
оплеснивать НАЙТОВ оппель ПЯТИТЬ подвальник ПОВЫПОЛЗАТЬ полуидиотский ЛЕПЕТ пондравиться ВОЗДВИГАТЬ попутно-боковой БАКШТАГ псевдонежный ЛЮБЕЗНИК [в цитате из И. Гончарова, слова нет, как ни странно, в индексе словаря Р.П. Рогожниковой] псевдопоэт НИЗКОПОКЛОННЫЙ пятисильный ПЕРЕТОРГОВЫВАТЬ
Приведенный краткий список нетрудно увеличить. Его длина прямо пропорциональна количеству времени, которое решится посвятить его продолжению составитель. Данная выборка сделана, конечно, «под знаменем» фактора случайности, предопределяющего польскую и русскую академическую лексикографию. По особой игре случайности в списке нет, например, единицы косоротенький -она имеется в цитатном материале БАСРЯ, то есть «спрятана».
Следует отметить, что подавляющее большинство выбираемых наугад примеров отсутствуют в неоценимом сводном индексе словаря Р.П. Рогожниковой, а те, которые в нем представлены, зафиксированы лишь, как правило, в орфографических словарях, то есть в текстах-источниках, совсем не пригодных для извлечения полноценных иллюстративных цитат. Кстати, само задание - составить полный список потенциальных заголовочных слов БАСРЯ, не отмеченных в коллективном труде Р.П. Рогожниковой, - интереснейшее для лексикографа-документалиста.
Интересен также факт отсутствия ряда потенциальных заголовочных слов БАСРЯ в НКРЯ. Примеры предлагаю найти самим читателям этих заметок. Особая тема - ономастический материал в БАСРЯ. В словнике его практически нет, в цитатах он представлен достаточно обильно. Ср.:
Беркли МЕНДЕЛЕВИЙ Исландия РАДАРНЫЙ Кукрыниксы ИЛЛЮСТРАЦИОННЫЙ Ломоносов НЕОБЪЯТНЫЙ Люба БЕРЛОЖНЫЙ Моссельпром ЛОТОЧНИЦА Нильи ИЛЛЮСТРИРОВАННЫЙ Пушкин ИЛЛЮСТРИРОВАТЬ и др.
Невозможно, конечно, представить себе литературные цитаты БАСРЯ без имен прилагательных, образованных от разных категорий имен собственных. Ср.:
араратский ПРИБРЕЖНИЦА гоголевский МОРАЛИСТИЧЕСКИЙ ладожский ОТДУШИНА ленинградский МОРЕ одесский ЛИМАН
Место в словнике заслужили лишь адъ-ективы типа МАЛАЙСКИЙ, ПУЭРТО-РИ-КАНСКИЙ, относящиеся к зарубежному ареалу.
Цитаты, включенные в БАСРЯ, можно использовать также как полезный источник дополнительной информации в семантическом и синтаксическом планах. Те или иные заголовочные слова нередко выступают как потенциальные в совершенно других цитатах в словарных статьях с иным «черным» словом. Например, существительное бухточка документируется в статье повыносить цитатой из П. Загребельного, тогда как в статье бухточка оно подается лишь с одной единственной цитатой (из И. Соколова-Микитова). Одновременно во многих статьях БАСРЯ даются, как правило, по две литературные цитаты, благодаря чему пользователи словаря получают более развернутую справку о синтаксисе, лексической сочетаемости и оттенках значения данной словарной единицы. Ср. аналогичное положение дел с возможностью извлечения дополнительной информации для заголовочного слова бидон (из статьи дуршлаг), для слова выступка (из статьи повыпялить-ся), для слова кардиограмма (из статьи перпетуум-мобиле), для слова 2. ластиковый (из статьи косоворотый), для слова мастеровщина (из статьи повыползать) и многих других. Ряд статей БАСРЯ вообще лишен документационных литературных цитат. Такова, например, статья жигули (недостающую цитату пользователи могут, если хватит терпения, найти в статье распредвал), бес-цитатны статьи жидеть (соответствующую цитату в тексте БАСРЯ мне найти не удалось) и котангенс (подходящую цитату см. в статье плаксивый) и др. Обнаружены в БАСРЯ случаи, когда литературная цитата дается только для существительного мужского рода
(бизнесмен, но не для бизнесменка; германец, но не для германка; македонец, но не для македонка; перуанец, но не для перуанка и др.).
Идея составления толкового словаря русского языка, как и словаря польского языка (см. [6]), с полумиллионным словником вполне реальна. Любители польского и русского слова ждут...
СПИСОК ЛИТЕРА ТУРЫ
1. Вавжинчик, Я. О сайте ruscorporainpoland.pl (Национальный фотокорпус русского языка) / Я. Вавжинчик. - Warszawa : М. Hoshi, 2014. - 96 s.
2. Морковкин, В. В. Русские агнонимы (слова, которые мы не знаем) / В. В. Морковкин, А. В. Морковкина. - М. : [б. и.], 1997. - 414 с.
3. Wawrzynczyk, J. Nad Slownikiem j^zyka polskiego 1958-1969 / J. Wawrzynczyk ; Uniw. Mikolaja Kopernika, Inst. filologii slowianskiej. - Torun, 1989. -117 s.
4. Wawrzynczyk, J. O wyrazeniach niehaslowych w Siowniku jqzyka polskiego pod redakj Witolda Doroszewskiego. Z wyborem przykladow / J. Wawrzynczyk. - Cz^stochowa : WSP, 1995. - 36 s.
5. Wawrzynczyk, J. Z e-brudnopisow Slownika bibliograficznego j^zyka polskiego (Ku polmilionowemu szybkiemu rejestrowi hasel) / J. Wawrzynczyk. -Warszawa : M. Hoshi, 2016. - 8 s.
6. Wierzchon, P. Depozytorium leksykalne j^zyka polskiego. T. 11-40. Fotosuplement do Slownika warszawskiego / P. Wierzchon.- Warszawa : BEL Studio, 2014.
ИСТОЧНИКИ И СЛОВАРИ
БАС - Словарь современного русского литературного языка : в 17 т. - М. ; Л. : Наука, 1948-1965.
БАСРЯ - Большой академический словарь русского языка / гл. ред. К. С. Горбачевич; науч. координатор издания А. С. Герд. - М. ; СПб. : Наука, 2004-2014 [издание продолжается]. - Т. 1-23.
Дорошевский - Slownik j^zyka polskiego / W. Doroszewski (red.). - Warszawa : Wydawnictwo Naukowe PWN, 1958-1969. - T. 1-11.
НКРЯ - Национальный корпус русского языка. - Электрон. текстовые дан. - Режим доступа: www.ruscorpora.ru. - Загл. с экрана.
Рогожникова - Сводный словарь современной русской лексики : в 2 т. / под ред. Р. П. Рогожни-ковой. - М. : Русский язык, 1991.
REFERENCES
1. Vavzhinchik Ya. O sayte ruscorporainpoland.pl (Natsionalnyy fotokorpus russkogo yazyka) [About the Site ruscorporainpoland.pl. National Photocase of the Russian Language]. Warszawa, M. Hoshi Publ., 2014. 96 p.
2. Morkovkin V. V., Morkovkina A. V. Russkiye agnonimy (slova, kotorye my ne znayem) [Russian Agnonimy (Words That We Do not Know)]. Moscow, 1997. 414 p.
3. Wawrzynczyk J. Nad Slownikiem j^zyka polskiego 1958-1969 [On a Dictionary of the Polish Language 1958-1969]. Torun, Uniw. Mikolaja Kopernika, Inst. filologii slowianskiej, 1989. 117 p.
4. Wawrzynczyk J. O wyrazeniach niehaslowych w Slowniku jqzyka polskiego pod redakcjq Witolda Doroszewskiego. Z wyborem przykladow [About not Header (not Being Header for the Dictionary Entry) Expressions in the Dictionary of Polish Under Witold Doroshevsky's Edition. With the Chosen Examples]. Cz^stochowa, WSP Publ., 1995. 36 p.
5. Wawrzynczyk J. Z e-brudnopisow Slownika bibliograficznego j^zyka polskiego (Ku polmilionowemu szybkiemu rejestrowi hasel) [From Drafts Bibliographical Dictionary of the Polish Language (Half a Million Original Registry of Headwords)]. Warszawa, M. Hoshi Publ., 2016. 8 p.
6. Wierzchon P. Depozytorium leksykalne j^zyka polskiego. T. 11-40. Fotosuplement do Slownika warszawskiego [Lexical Storage of Polish. Vol. 11-40. Photoaddition to the Warsaw Dictionary]. Warszawa, BEL Studio Publ., 2014.
SOURCES AND DICTIONARIES
Slovar sovremennogo russkogo literaturnogo yazyka: v 171. [Dictionary of Modern Russian Literary Language. In 17 vols]. Moscow, Leningrad, Nauka Publ., 1948-1965.
Gorbachevich K.S., ed., Gerd A.S., sci. coordinator of the ed. Bolshoy akademicheskiy slovar russkogo yazyka. T. 1-23 [Big Academic Dictionary of Russian. Vol. 1-23]. Moscow, St. Petersburg, Nauka Publ., 2004-2014.
Doroszewski W., ed. Siownik jqzyka polskiego. T. 1-11 [Dictionary of Polish. Vol. 1-11]. Warszawa, Wydawnictwo Naukowe PWN, 1958-1969.
Natsionalnyy korpus russkogo yazyka [Russian National Corpus]. Available at: www.ruscorpora.ru.
Rogozhnikova R.P., ed. Svodnyy slovar sovremennoy russkoy leksiki: v 2 t. [Summary Dictionary of Modern Russian Lexicon. In 2 vols]. Moscow, Russkiy yazyk Publ., 1991.
ABOUT UNLUCKY WORDS IN THE ACADEMIC DICTIONARIES
Yan Vavzhinchik
Doctor of Philological Sciences, Professor, University of Warsaw [email protected]
Krakowskie Przedmiescie, 26/28, 00-927 Warsaw, Poland
Abstract. The article deals with the academic tradition of compiling dictionaries, incorporated and embodied in the authoritative lexicographical works ofthe mid XX century. Multi-volume alphabetical dictionaries of the Russian and Polish languages are analyzed from the point of view of information related to different levels of language structure and resting in the process of plotting and editing work for real and the potential vocabularies. Some solutions to the problem of an exhaustive selection of vocables from text sources for the choice of header words and illustrative quotations are proposed as the key to creation of fundamentally new academic publication of this type.
Some new principles of token selection are offered. It is stated that the time has come to step over old and traditional for lexicographers approach to the line header choice and to reach the number of articles equal to half a million. The analysis allowed to find some gaps in the number of citations (every second unit of potential glossary on average); their inclusions can enlarge the academic dictionaries. The author criticizes the inconsistency and random selection of words as a false consecutive way to build a dictionary and claims that it deprives the user of some valuable information about semantic and grammatical richness of Slavic languages.
Key words: Slavic lexicography, academic dictionaries, vocabulary, dictionary illustration, header word.