Научная статья на тему 'К построению лингвистической теории тезауруса'

К построению лингвистической теории тезауруса Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
237
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕЗАУРУС / УСТОЙЧИВОЕ СОЧЕТАНИЕ СЛОВ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Осокина Светлана Анатольевна

В статье обосновывается необходимость создания теории тезауруса языка. Обсуждается категориальный аппарат данной теории и ее научный потенциал. Исходной лингвистической базой разрабатываемой концепции признается учение об устойчивых сочетаниях слов. В качестве примера предлагается анализ тезаурусов Президента РФ Д. Медведева и Президента США Б. Обамы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К построению лингвистической теории тезауруса»

Вестник Челябинского государственного университета. 2010. № 21 (202).

Филология. Искусствоведение. Вып. 45. С. 86-90.

К ПОСТРОЕНИЮ ЛИНГВИСТИЧЕСКОЙ ТЕОРИИ ТЕЗАУРУСА

В статье обосновывается необходимость создания теории тезауруса языка. Обсуждается категориальный аппарат данной теории и ее научный потенциал. Исходной лингвистической базой разрабатываемой концепции признается учение об устойчивых сочетаниях слов. В качестве примера предлагается анализ тезаурусов Президента РФ Д. Медведева и Президента США Б. Обамы.

Ключевые слова: тезаурус, устойчивое сочетание слов.

Исследования языкового тезауруса представляют в настоящее время одно из наиболее актуальных направлений лингвистики и гуманитарных наук в целом. Практически ежегодно в свет выходят новые тезаурусные словари, стремительно увеличивается количество информационно-поисковых тезаурусов на цифровых носителях и работающих он-лайн. Вместе с ростом тезаурусных словарей развивается число лингвистических исследований, анализирующих семантические структуры языкового тезауруса1, моделирующих различные способы организации тезаурусных словарей2, изучающих сущность тезауруса как такового, его роль в языковом развитии индивида, социума, культуры в целом3. По мнению ряда ученых, можно говорить о формировании особого научного направления - тезаурологии (термин введен Вал. А. и Вл. А. Луковыми), особенно активно набирающего обороты в рамках культурологии, но, несомненно, затрагивающего и другие гуманитарные дисциплины.

Огромное множество работ, так или иначе связанных с изучением тезауруса языка, а также кажущийся на первый взгляд концептуальный разнобой в представлении его сущности является неотъемлемым фрагментом постмодернистской парадигмы и закономерным продуктом ее развития.

Множество представлений о том, что такое тезаурус, можно объединить: тезаурус

- это некое устройство (обычно словарь) по поиску информации. Различие между словарями состоит в том, что они эксплицируют разные типы связи - синонимические, тематические, контекстуальные и другие. В связи с этим встает вопрос, какой тип связи стоит признать ведущим с точки зрения отношения слов в пространстве тезауруса.

Изучение семантических связей слов в тезаурусе и моделирование новых способов

организации тезаурусных словарей позволяют провести некоторые параллели между устройством тезауруса и искусственного интеллекта, с одной стороны, и устройством тезауруса и человеческого мышления, с другой. С искусственным интеллектом тезаурус связывает строгая рубрикация лексики и иерархическая парадигматическая организация поиска информации. С особенностями человеческого мышления тезаурус связан нелинейностью поиска информации: она напоминает ассоциативные скачки человеческого мышления, восстанавливающего семантические связи между словами не по единому заданному направлению, а по нескольким направлениям одновременно.

Таким образом, в современной науке сложилась ситуация, когда различие представлений о сущности тезауруса породило такую избыточность и разнородность информации, что настало время систематизировать имеющиеся знания о тезаурусе в строго оформленную теорию. Мы предлагаем к рассмотрению лингвистические основания формирующейся теории.

Мы полагаем, что тезаурус - нечто большее, нежели словарь. На самом деле, тезау-русные словари и поисковые системы - не более чем искусственно созданные человеком продукты, моделирующие объективно существующую языковую данность. Эта данность представляет собой словесный массив, давящий на органы восприятия (главным образом, слух и зрение) человека каждый день, проникающий в сознание и полностью заполняющий его, структурирующий ход мышления и формирующий продукты словесной деятельности человека - тексты.

В более широком понимании, тезаурус -это информационная сеть культуры, способ семантической организации мира. Вместе с

тем, как объективная доступная для исследования данность тезаурус существует только в своих индивидуальных проявлениях - тезаурус Достоевского, Путина и т. д. Однако индивидуальный тезаурус формируется не только и не столько волей личности, сколько волей окружающего эту личность языка4.

С данными выводами, сделанными в рамках лингвистического исследования, соотносятся выводы Вал. А. и Вл. А. Луковых, изучающих сущность тезауруса с социокуль-турологических позиций5. Узловыми элементами индивидуальных тезаурусов, по мнению авторов концепции, являются «тезаурусные конструкции», которые можно сравнить с корнями слов, к которым в процессе общения пристраиваются нужные для контекста приставки и суффиксы, или с идиоматическими выражениями.

Ключом к построению лингвистической теории тезауруса, на наш взгляд, должно быть учение об устойчивых сочетаниях слов. Отечественные языковеды внесли наибольший вклад в разработку представления о сущности и функционировании словосочетаний по сравнению с лингвистами других стран. Классическими работами в данной области признаются труды В. В. Виноградова, однако в основе нашей концепции тезауруса лежит учение об устойчивости всех возможных на том или ином языке сочетаний слов И. Е. Аничкова6. Представление о том, что устойчивое сочетание слов является узловым сегментом языкового тезауруса сформировано в упомянутом выше исследовании 2007 года4.

В последней работе доказывается, что тезаурус представляет собой сложную информационную систему, организованную устойчивыми сочетаниями слов. Проанализировано развитие тезауруса русского языка во времени и выделен актуальный тезаурус современных художественных и публицистических текстов. Однако для большей достоверности полученных выводов возникла необходимость провести исследование на материале как минимум двух языков, результаты которого излагаются в данной статье. Анализ текстов на двух языках предоставляет более богатый материал для доказательства положения о том, что обязательным условием успешной коммуникации является наличие общего языкового тезауруса у говорящего и слушающего.

Мы полагаем, что два человека смогут понять друг друга и смогут договориться, только если в речи каждого из них имеются одинаковые устойчивые сочетания слов или сочетания слов с одним и тем же узловым словом.

Под узловым словом понимается лексема, формирующая наиболее часто употребляемые в речи определенного человека словосочетания. Так, например, одним из наиболее важных узловых слов в тезаурусе Ф. М. Достоевского является слово человек, так как устойчивые сочетания с данным словом очень часто встречаются в его романах (деловой человек, молодой человек, благородный человек, опасный человек и др.).

Методика отбора устойчивых сочетаний слов из текстов - эпистемологическая методика анализа текстов - подробно описана в работе 2006 года7 и апробирована применительно к различным видам текстов.

Используя данную методику, мы проанализировали тексты на английском и русском языках. Материалом исследования послужили тексты публичных выступлений и пресс-конференций Дмитрия Медведева и Барака Обамы во время визита последнего в Москву 6-7 июля 2009 года. Тексты речей взяты с официальных сайтов президента России (www.kremlin.ru) и президента США (www. whitehouse.gov). Целью исследования было выявить, совпадают ли, и если да, то насколько, тезаурусы российского и американского лидеров, и можно ли говорить о возможности взаимопонимания между ними.

В результате проделанного исследования можно констатировать следующие факты.

Наиболее часто встречающимися сочетаниями слов в актуальном тезаурусе президента РФ в рамках встречи в Москве являются сочетания со словами отношения (российско-американскиеотношения, историяроссийско-американских отношений, наши отношения, развитие отношений, укрепление отношений, персональные отношения, личные отношения, строить отношения, межгосударственные отношения, отношения между странами), проблема (сталкиваться с проблемами, решать проблемы, экономические проблемы, проблемы межгосударственной безопасности, накопившиеся проблемы, груз проблем, колоссальная проблема и др.), позиция (принципиальная позиция, стоять на позиции, сближение позиций, излагать позицию и др.), вопрос (остановиться на вопросе, об-

суждать вопросы, решать сложные вопросы и др.), сотрудничество (продолжать сотрудничество, направление сотрудничества, российско-американское сотрудничество).

Каждое из приведенных сочетаний употребляется в выступлениях Д. Медведева неоднократно.

Наиболее часто встречающимися устойчивыми словосочетаниями в выступлениях Б. Обамы являются сочетания со словами cooperation (nuclear security cooperation, great cooperation, improved cooperation, to broaden cooperation, a foundation for cooperation, the pursuit of cooperation), security (to strengthen our security, global security, nuclear security, security of the country), step (to take steps, steps forward, concrete steps, important steps, call for strong steps), relations/relationship (the relationship between Russia and the US, to set/reset relations, bilateral relationship).

В высказываниях обоих президентов с почти одинаковой частотой употребляются словосочетания с именем прилагательным ядерный/nuclear (ядерное оружие/nuclear weapons, ядерный арсенал/nuclear arsenal, ядерные боеголовки/nuclear warheads, ядерные державы/nuclear powers и др.). Данные сочетания можно признать ключевыми в актуальном тезаурусе президентов во время российско-американской встречи в Москве.

Как видно из приведенных примеров, тезаурусы американского и российского лидеров, по крайней мере, в рамках указанной встречи, совпадают более чем на 50 %, что, по выдвигаемой концепции, свидетельствует о возможности достижения договоренности между ними.

Кроме того, в приведенных выше примерах мы указали сочетания наиболее частотные в выступлениях каждого из президентов, но это не означает, что сочетания, например, с узловым словом вопрос характерны только для текстов Д. Медведева и не встречаются в репликах Б. Обамы. Во фразах американского президента неоднократно употребляются устойчивые сочетания important question, international question, а также сочетания со словом issue, которое является синонимом слову question. Просто эти сочетания не столь частотны, как в речи Д. Медведева. Аналогично, устойчивые сочетания со словом безопасность (security) также характерны не только для тезауруса Б. Обамы, они имеются и в высказываниях Д. Медведева, (например, не-

однократно употребляется сочетание международная безопасность), но общая частота употребления этих фраз в речи российского президента гораздо ниже, и потому слово безопасность не может претендовать на роль одного из наиболее важных в его актуальном тезаурусе в рамках данной встречи. Таким образом, так или иначе, сочетания практически со всеми перечисленными выше словами имеются в высказываниях обоих президентов, и с этой точки зрения, можно констатировать изначальную языковую предрасположенность к достижению взаимопонимания.

Однако при более пристальном анализе употребления указанных словосочетаний выявляются заметные отличия.

Во-первых, тот факт, что абсолютно лидирующими по частоте употребления словосочетаниями в репликах Д. Медведева являются сочетания со словом отношения (английские эквиваленты - relation, relationship), а в репликах Б. Обамы - со словом cooperation (сотрудничество), позволяет сделать выводы о различии в предварительных коммуникативных установках лидеров двух стран: демонстрируется довольно сдержанная позиция российского президента и открытая к взаимодействию позиция американского лидера.

Во-вторых, выделяются такие сочетания слов, которые характерны только для речи президента России или только для речи президента США. Так, только для тезауруса Д. Медведева характерны устойчивые сочетания со словом ответственность (нести ответственность, осознавать ответственность, перекладывать ответственность), и только для тезауруса Б. Обамы характерны сочетания со словом commitment (to keep commitment, to abandon commitment, international commitment). С одной стороны, слова ответственность (английский эквивалент

- responsibility) и commitment (русский эквивалент - обязанность) являются близкими синонимами, но с другой, свидетельствуют

о разном оценивании ситуации, разном видении собственной позиции по отношению к другим участникам коммуникации: слово ответственность означает готовность взять на себя вину, в то время как использование слова обязанность предполагает только декларирование твердых обещаний.

Главным итогом тезаурусного анализа по предложенной методике можно признать факт наличия изменений в актуальном тезаурусе

президентов к концу встречи. Если сопоставить вступительное слово каждого из президентов перед началом встречи (6 июля) и заключительные фрагменты встречи (7 июля), то обнаруживаются существенные сдвиги в частоте употребления ряда словосочетаний, которые могли произойти только под взаимным словесным влиянием президентов друг на друга. Так, во вступительном слове Д. Медведева преобладают сочетания со словами отношения (когда речь идет о контактах между Россией и Америкой) и ответственность (когда речь идет о ядерном арсенале), а в выступлении Б. Обамы - со словами сотрудничество и обязанность соответственно. В конце встречи Д. Медведев чаще употребляет сочетания со словом сотрудничество, а также со словами прогресс (наблюдается прогресс), ситуация (изменить ситуацию), усилия (приложить усилия); Б. Обама заканчивает встречу сочетаниями со словом cooperation, а также употребляет сочетания со словами progress (to make progress), situation (to improve the situation), effort (military efforts, diplomatic efforts). Более того, в начале беседы с президентом Соединенных Штатов 7 июля Д. Медведев заменяет слово сотрудничество на слово кооперация в значении «сотрудничество», то есть воспроизводит фрагмент тезауруса американского президента в англоязычной огласовке: Выступление в [Российской] школе экономики было очень интересным, мне понравилось: системное изложение позиции по российско-американскому сотрудничеству, взгляды на мировые процессы... Это означает, что визит получился во всех отношениях насыщенным и включает в себя все элементы российско-американской кооперации: и по внешнеполитическому направлению, и наши двусторонние отношения, и экономику, и гуманитарную сферу. Это очень хорошо.

Таким образом, можно сделать вывод, что к концу российско-американской встречи президенты двух стран в буквальном смысле нашли общий язык.

Построение лингвистической теории тезауруса - дело будущего. В настоящей работе мы лишь наметили некоторые ключи к формированию этой теории.

Ключ к определению сущности языкового тезауруса состоит в линейности развертывания семантических отношений - по аналогии с линейностью развертывания человеческой

речи. Языковой, или словесный, тезаурус строится, скорее, на синтагматических, нежели на парадигматических отношениях и предполагает последовательное развитие во времени, а не скачки в гиперпространстве.

Ключом к поиску единицы языкового тезауруса является устойчивое сочетание слов. В системе тезауруса устойчивые сочетания с одинаковым словом являются узловыми элементами, а само это слово, соответственно, можно назвать узловым.

Методика тезаурусного исследования предполагает выявление из текстов наиболее частотных устойчивых сочетаний слов, а не наиболее частотных слов. Такой подход подчеркивает мысль, что тезаурус - это не лексикон, то есть не набор употребляемых человеком слов, а система семантических взаимоотношений между словами, и выявляемые из текстов устойчивые сочетания - фрагменты экспликации этих отношений. Вместе с тем, роль узловых слов в тезаурусе отдельного человека чрезвычайно велика, и лингвистическая теория тезауруса должна ее объяснять.

Словесный тезаурус - принципиально открытая к развитию система, и теория тезауруса должна объяснять принципы этого развития. На каждом отрезке времени можно говорить о существовании актуального языкового тезауруса, то есть о системе устойчивых сочетаний, релевантной для конкретной языковой ситуации в данное время.

Таким образом, выделены некоторые единицы категориального аппарата и подчеркнуты нюансы методики исследования в рамках формирующейся теории, охарактеризован ее научный потенциал. Необходимость и своевременность создания лингвистической теории тезауруса не вызывает сомнения. Возможно, это будет частный вариант более общей теории тезауруса. Но очевидно то, что эта теория сможет не только дать новое объяснение явлениям языка, и шире - явлениям общества и культуры, но и предсказывать развитие этих явлений в будущем.

Примечания

1 Караулов, Ю. Н. Лингвистическое конструирование и тезаурус русского языка. М. : Наука, 1981. 368 с.

2 Ролофф, Г. Новые средства каталогизации : от фасетной классификации к дескриптеру и тезаурусу. М. : Книга, 1980. 56 с.

3 Тезаурусный анализ мировой культуры : сб. науч. тр. Вып. 1. М. : Изд-во Моск. гуманитар. ун-та, 2005. 76 с.

4 Осокина, С. А. Языковые механизмы воздействия на человека. Барнаул : Графикс, 2007. 224 с.

5 Луков, Вал. А. Тезаурусный подход: исходные положения / Вал. А. Луков, Вл. А. Луков // Знание. Понимание. Умение : электрон. журн. 2008. № 9. Комплексные исследования : тезаурусный анализ мировой культуры. иЯТ : http://www.zpu-joumal.rU/e-zpu/2008/9/ Ьикоу8_ТЬезаиги8_АрргоасЬ.

6 Аничков, И. Е. Труды по языкознанию. СПб. : Наука, 1997. 512 с.

7 Осокина, С. А. Об эпистемологической методике анализа художественного текста // Художественный текст : варианты интерпретации : тр. XI Всерос. науч.-практ. конф. (Бийск. 12-13 мая 2006 г.) : в 2 ч. Ч. 2. Бийск : Изд-во БПГУ им. В. М. Шукшина, 2006. С. 57-61.

i Надоели баннеры? Вы всегда можете отключить рекламу.