Научная статья на тему 'Новый облик современной лексикографии: будет ли существовать словарь через 20 лет?'

Новый облик современной лексикографии: будет ли существовать словарь через 20 лет? Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
386
108
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛЕКСИКОГРАФИЯ / ЭЛЕКТРОННЫЙ СЛОВАРЬ / ЛИНГВИСТИЧЕСКИЙ КОРПУС / ТЕЗАУРУС / ЛЕКСИЧЕСКАЯ БАЗА ДАННЫХ / LEXICOGRAPHY / THESAURUS / LEXICAL DATABASE / E-DICTIONARY / CORPORA

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Голубкова Е. Е.

В статье прослеживается эволюция лексикографических источников за последние 40 лет. Анализируются преимущества и возможности современных электронных словарей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The new image of contemporary lexicology: will there be a dictionary in 20 years?

The article traces the evolution of lexicographic sources over the last 40 years. It also speaks about the advantages and potentialities of electronic dictionaries.

Текст научной работы на тему «Новый облик современной лексикографии: будет ли существовать словарь через 20 лет?»

УДК 81'374 Е. Е. Голубкова

доктор филологических наук

профессор кафедры лексикологии английского языка факультета ГПН МГЛУ e-mail: [email protected]

НОВЫЙ ОБЛИК СОВРЕМЕННОЙ ЛЕКСИКОГРАФИИ: БУДЕТ ЛИ СУЩЕСТВОВАТЬ СЛОВАРЬ ЧЕРЕЗ 20 ЛЕТ?

В статье прослеживается эволюция лексикографических источников за последние 40 лет. Анализируются преимущества и возможности современных электронных словарей.

Ключевые слова: лексикография; электронный словарь; лингвистический корпус; тезаурус; лексическая база данных.

Golubkova E. E.

Doctor of Philology, Professor, Chair of English Lexicology e-mail: [email protected]

THE NEW IMAGE OF CONTEMPORARY LEXICOLOGY: WILL THERE BE A DICTIONARY IN 20 YEARS?

The article traces the evolution of lexicographic sources over the last 40 years. It also speaks about the advantages and potentialities of electronic dictionaries.

Key words: lexicography; e-dictionary; corpora; thesaurus; lexical database.

Вопрос, вынесенный в заголовок статьи, о будущем словарей явился предметом обсуждения на семинаре в рамках лексикографической конференции в словенском г. Бледе в 2011 году. Если бы его услышал А. В. Кунин, основоположник фразеологической школы в отечественной англистике и автор «Большого англо-русского фразеологического словаря», переиздававшегося пять раз, он бы иронично поднял брови и сказал что-нибудь типа: «Это первоапрельская шутка, не так ли?» Александру Владимировичу в этом году исполнилось бы 105 лет, наши кафедральные чтения (2014) мы посвятили его памяти.

За последние десятилетия в лексикографии произошло много революционных событий, коренным образом поменявших облик основного продукта ее деятельности - словаря. Возможности использования лексикографических источников существенно расширились.

Долгое время лексикография, раздел лингвистики «отвечающий» за составление и усовершенствование словарей, находилась в рамках традиционного подхода, разработанного ее основоположниками, великими лексикографами времен королевы Виктории (Самьюэл Джонсон (1755), Джеймс Мюррей (1884). С внедрением новых технологий, Интернета и лингвистических корпусов лексикография кардинальным образом изменилась, столкнувшись с новыми возможностями, новыми потребностями пользователя и новой «средой обитания» и новыми трудностями.

В статье мы приведем краткую историю эволюции лексикографии от словаря-книги до современных мультимедийных баз данных, все больше расширяющих возможности и объем электронных источников информации и приближающих их к депозитариям информации тезаурусного типа, максимально приближенных к способу хранения информации о словах в ментальном лексиконе человека. В связи с этим мы хотели бы показать изменившийся статус лексикографии, именующейся наукой об информации (informology или information science) [2], и привести примеры некоторых электронных словарей (типа Wordnet) [13], обсудить их устройство, достоинства и недостатки, некоторые перспективы развития. Мы хотим затронуть также вопросы взаимодействия лексикографии и других наук когнитивного и некогнитивного цикла и показать, что современные электронные словари представляют собой гибкую интерактивную систему, обеспечивающую доступ к информации самого разного характера, выходящей далеко за пределы сугубо лингвистических знаний.

Сегодня принято говорить, что ни одно лингвистическое исследование не может проводиться без опоры на корпусные данные. Однако хорошо известно, что, как правило, корпус задействуется исследователями на этапе верификации теории или на этапе сбора примеров и статистических данных, т. е. большинство исследований являются основанными на корпусе (corpus-based), а не движимые корпусами (corpus-driven). Именно поэтому на первых этапах лингвистических изысканий основой предположений и гипотез по-прежнему является словарь. После корпусной революции и миграции словарных материалов в интернет-среду последние претерпели кардинальные изменения. Новая информационная парадигма потребовала от составителей серьезной переквалификации, переоценки стратегий составления лексикографических источников, содержания информации и способов

взаимодействия с «новым» типом пользователя «digital native» - «уроженцем Интернета».

Составитель, воплощает собой две ипостаси: ученого-лингвиста и разработчика программного обеспечения (tool-builder). Лингвист по-прежнему стремится анализировать и описывать факты языка, в то время как разработчик пытается облегчить пользователю поиск информации [3]. В орбиту лексикографических проблем вовлечены три взаимосвязанных аспекта: информация, доступ к ней и пользователь. Информация обеспечивается лингвистикой, профиль пользователя - социологией, доступ - информационными науками. Тогда raison d'être лексикографии становится доступ к информации, адаптированный к пользователю при сбалансированном взаимодействии трех упомянутых аспектов [12]. К триаде добавляется еще один аспект в силу динамического характера поступающей к пользователю информации и индивидуальных особенностей «профиля» самого пользователя: взаимодействие пользователя и поисковой системы. Ожидается, что первый обладает минимумом навыков поисковой работы, а вторая - подстраивается под индивидуальные нужды каждого пользователя.

Для того чтобы отвечать этим высоким требованиям «конструкторы» словарей должны обладать рядом лингвистических, когнитивных и концептуальных компетенций (например в разделах наук), а также навыками создания удобных для пользователя интерфейсов, поисковых систем и программного обеспечения.

Таким образом, чтобы идти в ногу со временем лексикография должна выйти далеко за пределы традиционных рамок и стать «наукой об информации» [11, с. 5]. Она включает три подраздела: собственно лексикографию, «энциклопедику» и раздел без названия, отвечающий за составление справочников, каталогов, компендиумов [7]. При этом она не теряет связи с другими лингвистическими и нелингвистическими дисциплинами. Семейное объединение этих наук метафорически описывается в терминах родственных отношений [11]. Лексикография рассматривается как дочерняя наука для лингвистики, семиотики, библиографоведения / библиографической науки (reference science), объединена сестринскими отношениями с терминологией, теорией перевода, методикой преподавания, библиотековедением, изучением СМИ и породила «детей» в лице системы индексации, текстовой обработки, полиграфии, издательского дела. Информационные технологии

выполняют все роли одновременно, а к дисциплинам, снабжающим лексикографические носители информацией, относятся лингвистика, диалектология, философия и все остальные отрасти знания.

Важно отметить, что в результате эволюции лексикографии сложились особенные отношения пользователя и «носителя информации», или составителей словаря. Расширились возможности интерактивного «вмешательства» пользователя в процесс формирования информационной среды.

Каким образом лексикография превратилась в науку о хранении, извлечении и обогащении информации? В самом примерном приближении эволюция словарей может быть представлена как переход от бумажного носителя к его электронной версии и революционный поворот в сторону его погружения в интернет-среду. Многие лексикографы предсказывали еще в 1990 году прекращение деятельности словаря в традиционном понимании [8; 9].

Схематично этот процесс может быть описан по схеме Жиля-Мориса Шривера: первый этап ознаменовался перекачиванием словарной информации на диск (сначала малого, а потом значительного объема), затем последовал период совместного пользования словарем несколькими пользователями на одном сервере, а затем с выходом в Интернет словарь стал частью онлайнового сервера, к которому имеют доступ все пользователи Интернета [10]. Известный авторитет в современной лексикографии датский ученый Свен Тарп, метафорически изображая процесс эволюции словаря на электронном носителе, сравнивает его с двойником, подражателем бумажной версии, затем процесс пользования сравнивается с передвижением на лошадях, с первыми образцами автомобилей и, наконец, с современным «Роллс-Ройсом», имеющим все «навороты» и изыски [12].

Преимущества электронных словарей и их незначительные недостатки, основным из которых является отсутствие Интернета, перевешивают скромные возможности традиционных. Именно поэтому еще в 1992 году Б. Аткинз писал: «If new methods of access (breaking the iron grip of the alphabet) and a hypertext approach to the data stored in the dictionary do not result in a product light years away from the printed dictionary, then we are evading the responsibilities of our profession» [1, с. 520]. Преимуществами электронные словари во многом обязаны компьютерно-корпусной революции. Сначала компьютеры скромно ассистировали процессу составления словарей, затем способствовали перекачиванию бумажной информации на компьютерный носитель

и, наконец, стали основой составления электронных словарей, что называется, с нуля. В современных работах по теоретической лексикографии отмечается, что уже тридцать лет лингвистические корпусы служат основой составления словарей. Они фактически вместе с системой поиска стали неотъемлемой частью того, что называют «lexicographic tool» [11].

Некоторые дополнительные преимущества, которые предоставляет пользователю электронный словарь, включают: отсутствие каких-либо ограничений на объем информации; доступ к корпусам; возможности анимации; огромное количество ссылок на другие базы данных, например ссылки на обучающие упражнения, игры; обновляемый характер информации; возможность так называемой one-stop consultation - поиск информации в большом количестве двуязычных или толковых словарей; доступность и дешевизна пользования.

Во многом этими свойствами современные электронные словари обязаны среде своего существования, а также тому факту, что уже в течение 30 лет они черпают данные из корпусов, составляются на их основе и имеют доступ к ним с сайтов словарей.

Важно отметить, что путь слова или словосочетания в словарь, в том числе и электронный, достаточно долог и тернист. Языковая единица проходит несколько этапов верификации своей валидности, характера употребления, дискурса употребления, чтобы быть включенной в словарь. Если это происходит, то о слове собирается всевозможная информация, доступность которой обеспечивается различными поисковыми системами и ссылками, корпусными данными и интуицией составителя.

В качестве примера работы нового поколения словарей онлайнового типа, полезных как для целей преподавания, так и для лингвистических исследований приведу лексическую базу данных «Wordnet», создаваемую в Принстонском университете с 1985 года в Cognitive Science Laboratory of Princeton University под руководством профессора психологии Джорджа Миллера. «Wordnet» словарь особого типа, его называют лексической базой данных по нескольким причинам. Во-первых, она обеспечивает доступ к разного рода информации как лингвистического, так и когнитивного и коммуникативного характера. Так, по замыслу Миллера, система задумана как своеобразный тезаурус, пользование которым максимально отражает особенности обработки информации в ментальном лексиконе. Для этого создана

специальная поисковая система Visual Thesaurus, которая дает доступ к информации только о четырех главных частях речи: существительном, прилагательном, глаголе и наречии, которые для удобства помечены каждый своим цветом. Как предполагает название такой тезаурус организован в виде так называемой паутины (spider net), содержащей информацию об искомом слове и связи данного слова с ему подобными. Фактически каждая картинка-сетка связей показывает слово или словосочетание в его семантической парадигме. Вся система основана на synsets, своеобразных кластерах синонимов, которые, в свою очередь, обеспечивают семантические отношения антонимии и гиперо-гипонимические кластеры для глаголов (см. пример слова retrograde). Дефиниция выскакивает в окошке (pop up) при однократном нажатии на мышь. Нажав на нее, можно выйти в список всех значений многозначного слова как в обычном словаре. Двукратное нажатие приводит к помещению синонима в центр сетки, которая автоматически перефокусируется уже на его свойства. Таким образом, цель этого гибрида словаря и тезауруса предоставить информацию, которой удобно пользоваться, основываясь на интуиции пользователя [13].

Кто является основным пользователем «Wordnet»? Какие цели преследует пользователь? Важным достижением электронной лексикографии является возможность обеспечения обратной связи с пользователем и построение так называемого профиля пользователя. Регистрация в системе позволяет учитывать интересы, уровень подготовки и другие особенности каждого получающего доступ к «Wordnet». Так, в результате опросов и выведения профиля пользователей выявлены основные категории посетителей «Wordnet» и их цели.

К целям относятся попытка избежать повтора слов, сменить регистр повествования, поиск синонимичного выражения или слова.

Категории пользователей включают рекламодателей, писателей, студентов, маркетологов, преподавателей, представителей разных профессий, стремящихся разнообразить свои презентации, и, разумеется, лингвистов.

Преимуществами Visual Thesaurus является быстрота поиска языковой единицы, динамический характер самой паутины синонимов, которая готова предоставить по мановению мышки информацию и о значении слова, и о близких по значению словах. К недостаткам можно отнести некоторую субъективность информации, связанную

с привязанностью системы только к корпусу Принстонского университета и непривычностью способа подачи материала. Пути усовершенствования Visual Thesaurus его создатели видят в более глубокой проработке семантических и стилистических различий синонимов, попытке отразить некую «шкалу» синонимичности, которая бы наглядно отражала вариации и коннотативную нагрузку близких по значению слов, также продолжается изучение спроса пользователей, с тем чтобы приблизить словарь к их индивидуальным потребностям.

Таким образом, используя еще одну метафору [6], эволюцию словаря можно сравнить с гастрономическим способом подачи пищи: от отдельно взятого блюда, к стойке с отдельными видами салатов, и, наконец, к блюду, включающему сразу много ингредиентов, извлечь которые не представляет большого труда.

Итак, актуальными вопросами для составителей электронных словарей являются: создание и использование надежной базы данных (в основном опираясь на корпусы), отбор и ограничение объема информации, расширение проблемного кругозора за рамки составления словарей, удовлетворение запросов нового поколения компьютерно грамотных пользователей.

Пытаясь ответить на вопрос о целесообразности создания такого важного информационного источника, как словарь, приходится учитывать все возрастающие потребности пользователей, которые вправе ожидать от своего интерактивного «друга» предвосхищения вопросов и даже ответов на еще не поставленные. Вполне возможно, что делегировавший свои обязанности цифровой среде словарь-книга, исчезнет из обихода, однако это не устранит необходимости постоянно усовершенствовать его современного последователя - lexicographic tool.

СПИСОК ЛИТЕРАТУРЫ

1. Atkins B. T. S. Putting lexicography on the professional map. Training needs and qualifications of career lexicographers in M. Alvar Ezquerra (ed.). -1992. - Р. 519-526.

2. Bergenholtz H., Theo J. D. Bothma. Needs-adapted Data Presentation in e-Information Tools. - URL: http://books9.org/h/henning-bergenholtz-s45/

3. Fuertes-Olivera Pedro A., Sven Tarp. Lexicography for the third millennium: Cognitive-oriented specialised dictionaries for learners. - URL: http://www. aelfe.org/documents/07_21_Fuertes.pdf

BecmHUK MfHy. BbnycK 20 (706) / 2014

4. Fuertes-Olivera Pedro A., Henning Bergenholtz (eds.). e-Lexicography. The Internet, Digital Initiatives and Lexicography. - L.-N. Y. : Continuum, 2011. -XIV. - 341 p.

5. Hartmann R. R. K. Twenty-five Years of Dictionary Research: Taking Stock of Conferences and Other Lexicographic Events since LEXeter '836 2008. - URL: http://www.euralex.org/elx_proceedings/Euralex2008/005_Euralex_2008_ Plenary_RRK%20Hartmann_Twenty five%20years%20of%20Dictionary %20Research_Taking%20Stock%20of%20Conferences%20and%20 other%20Lex.pdf

6. Leroyer P. 'Les renvois externes comme ressources lexicographiques fonctionnelles // Cahiers de lexicologie 93.2. - 2008. - P. 27-54.

7. McArthur T. What then is reference science? / McArthur, T. Living // Words, Language, Lexicography and the Knowledge Revolution. - Exeter : University of Exeter Press, 1998. - P. 215-222.

8. Meijs W. J. Morphology and word-formation in a machine-readable dictionary: Problems and possibilities // Folia Linguistica: Acta Societatis Linguisticae Europaeae 24.1-2. - 1990. - P. 45-71.

9. Sharpe P. A. Electronic Dictionaries with Particular Reference to the Design of an Electronic Bilingual Dictionary for English-speaking Learners of Japanese // International Journal of Lexicography 8.1. - 1995. - P. 39-54.

10. Schryver Gilles-Maurice. Lexicographers' dreams in the electronic dictionary age. - URL: http://tshwanedje.com/publications/dreams.pdf

11. Tarp S. Beyond Lexicography: New Visions and Challenges in the Information Age // H. Bergenholtz, S. Nielsen & S. Tarp (eds.) Lexicography at a Crossroads: Dictionaries and Encyclopedias Today, Lexicographical Tools Tomorrow. - Bern : Peter Lang, 2009. - P. 17-32.

12. Verlinde S., Leroyer P. Search and you will find. From stand-alone lexicographic tools to user driven task and problem oriented multifunctional leximats // International Journal of Lexicography. - Vol. 23. - No. 1. - 2009. -P. 1-17.

13. WordNet. - URL: http://wordnet.princeton.edu/

i Надоели баннеры? Вы всегда можете отключить рекламу.