УДК: 811.111 ББК: 81.2 Англ - 923
Жучкова И.И.
МЕТОДИКА ПОСТРОЕНИЯ ТЕЗАУРУСА АНГЛИЙСКОЙ ТЕРМИНОЛОГИИ
ЛИНГВИСТИКИ ТЕКСТА
Zhuchkova I.I.
METHODOLOGY FOR CONSTRUCTING TERMINOLOGICAL ENGLISH-RUSSIAN "TEXT LINGUISTICS" THESAURUS
Ключевые слова: предметная область, лингвистика текста, тезаурусное моделирование, тезаурус, термин, терминологический знак, терминологическое поле, терминологическая система, денотат, десигнат, семантическое отношение, ассоциативное отношение, словарная статья.
Keywords: object domain, text linguistics, thesaurus modelling, thesaurus, term, terminological sign, terminological field, terminological system, denotation, signified, semantic relation, associative relation, dictionary entry.
Аннотация: в статье рассматриваются этапы конструирования словаря английских терминов, обозначающих основные объекты изучения и разделы предметной области «Англоязычная лингвистика текста». Опираясь в своем исследовании на семиотический подход к рассмотрению природы и сущности термина, мы изучаем термин как языковую единицу, имеющую означаемое и означающее, позволяющее раскрыть значение и семантические отношения термина. Использование тезаурусного подхода к моделированию лингвистических объектов предусматривает конструирование терминологической сети определенной области научного знания, в которой термины располагаются в соответствии с их значением. В результате применение тезаурусного подхода позволило выявить иерархические, эквивалентные и ассоциативные отношения, соединяющие терминологические знаки в единое терминополе. Каждый термин, включенный в данное терминополе, является частью семантического целого и описывается посредством разнообразных семантических отношений, присутствующих в его словарной статье.
Abstract: the article deals with the study of main stages in modelling English Text Linguistics Thesaurus, which consists of basic terms naming different linguistic notions and approaches related to the above mentioned object domain. Our understanding of the notion "term" is based on the se-miotic approach, i.e. on the idea that any linguistic sign is composed of the signifier and the signified, the components of the latter revealing semantic relations among terms. In this regard, we apply the thesaurus approach to the modelling of linguistic objects, which presupposes the arrangement of terms according to their meaning. As a result, the thesaurus technique reveals numerous types of hierarchical, associative and equivalent relations that connect isolated terminological signs into a coherent terminological field. Each term included in the terminological field can be described via different semantic relations shown in its dictionary entry.
Целью настоящего исследования является разработка процедуры конструирования словаря английских терминов по лингвистике текста. В качестве основной задачи конструирования англо-русского тезауруса по лингвистике текста выступает комплексное изучение и систематизация английских терминов, обозначающих объекты изучения, разделы и смежные филологические дисциплины предметной области (ПО) «Ан-
глоязычная лингвистика текста». Поскольку значительные достижения в лингвистическом изучении текста связаны с англоязычным научным пространством, особый исследовательский интерес представляет англоязычная терминология данной предметной области, отражающая эволюцию взглядов зарубежных лингвистов, изучающих текст с разных позиций. Наличие большого количества филологических дисциплин и
направлений, тем или иным образом затрагивающих проблемы текста и имеющих собственную терминологию, приводит к возникновению терминов-дублетов, вариантов, квазисинонимов и свидетельствует о необходимости более глубокого изучения системы понятий данной ПО.
Изучение терминологии любой ПО предполагает прежде всего выбор подхода к определению сущности термина. В нашем исследовании, посвященном изучению семантики английских терминов лингвистики текста, наиболее целесообразно следовать семиотическому подходу, рассматривающему термин как языковой знак в смысле Соссюра, то есть языковую единицу, имеющую означаемое и означающее. Семиотическая модель термина «выступает в качестве инструмента, раскрывающего детали знакообразования, а также механизма формирования терминополя и терминоси-стемы»1. Терминологические единицы, выступающие как часть семантического целого и входящие в то или иное поле, мы, вслед за Р.Г. Пиотровским2, называем терминологическими знаками (ТЗ). В означающем ТЗ выделяется два компонента -денотат (целостное, не расчленяемое сознанием на составляющие части отражение объекта / референта) и десигнат (смысл), выражающий через совокупность определенных концептов сущность данного объекта. Первостепенную роль в данном процессе знакообразования играет классификационно-абстрагирующая способность десигната ТЗ и связанные с ним семантические и грамматические значимости, смысловые валентности, которые позволяют выделить наиболее важные компоненты значения ТЗ и четко определить место термина в терминологической системе ПО.
Представить понятийную картину ПО значит представить информацию об объектах, процессах, явлениях, рассматриваемых в данной ПО, а также рассмотреть отноше-
1 Горбунов Е.Ю. Тезаурусное моделирование английских грамматических терминов морфологии и морфосинтаксиса: дис. ... канд. филол. наук: 10.02.21. - СПб., 2008. - С. 172.
2 Пиотровский Р.Г. Лингвистический автомат (в исследовании и непрерывном обучении). 2-е изд., доп. и испр. - СПб.: Изд-во РГПУ им. А.И. Герцена, 2008. - 256 с.
ния и проявившиеся или возможные взаимодействия между ними, возникшие в результате деятельности человека. Одним из способов конструирования понятийной картины ПО является метод тезаурусного моделирования терминологической системы. Важно отметить, что в настоящем исследовании тезаурус рассматривается как усовершенствованная разновидность словарей общего или специального словарного состава, в которой прослеживается наличие разнообразных семантических связей и которая имеет совершенно иное расположение заглавных слов (заглавные слова расположены в тематически организованном порядке).
Методика построения англо-русского тезауруса по лингвистике текста предполагает выделение основных этапов конструирования тезауруса, которые заключаются в следующем:
- определении принципов отбора терминов-кандидатов в тезаурус;
- конструировании терминологического поля тезауруса;
- классификации семантических отношений терминологии;
- организации структуры словарной статьи тезауруса.
При построении любого тезауруса уже на первоначальном этапе необходимо решить проблему отбора словарных единиц в словарь. Основными единицами тезаурусов выступают термины предметной области, обозначающие понятие какой-либо области знания. С целью поиска материала для исследования необходимо обратиться к источникам, в которых происходит фиксирование терминов и понятий рассматриваемой ПО, то есть определить терминологическую систему ПО. Эта задача может быть решена путем обращения к корпусу научно-лингвистических текстов, включающего в себя лингвистические словари, учебную литературу, монографии, а также научные статьи по лингвистике текста, написанные на английском языке. Во всех вышеперечисленных источниках особое внимание уделяется определениям или дефинициям терминов, поскольку в словарных дефинициях заключены те признаки, из которых строится значение слова. Данные лингвистические тер-
мины и их определения в текстах сопоставляются с дефинициями этих терминов, приводимых в толковых англоязычных словарях и энциклопедиях, таких как «Routledge Dictionary of Language and Linguistics» Х. Бусмана1, «A Dictionary of Linguistics and Phonetics» Д. Кристала2, «The Concise Oxford Dictionary of Linguistics» П. Мэтьюса , «Key Terms in Discourse Analysis» П. Бей-кера4, «International encyclopedia of linguistics» В. Брайта5 и другие.
Основные принципы отбора терминов происходили с учетом следующих критериев и требований:
1. Термин употребляется для наименования понятия.
2. Термин обладает содержательной точностью, то есть имеет дефиницию.
3. Термин относительно однозначен или стремится к однозначности.
4. Термин до известной степени независим от контекста, что вызвано практическим отсутствием у термина эмоционального, экспрессивного и модального оттенков.
5. Посредством выделения терминов-дескриторов становится возможным описать темы большинства текстов ПО (Дескриптор обозначает класс объектов конкретной предметной области и играет роль сигнального термина, который лежит в основе поиска нужной информации в автоматизированной информационно-поисковой системе6).
6. Множество дескрипторов не должно включать совокупности близких де-
1 Bussman, H. Routledge Dictionary of Language and Linguistics / H. Bussman. - London: Routledge, 1996. - 1335 p.
2 Crystal, D. A dictionary of linguistics and phonetics. 6th ed. / D. Crystal. - Oxford: Basil Blackwell, 2008. - 389 p.
3 Matthews, P.H. The concise Oxford dictionary of linguistics / P.H. Matthews. - Oxford: Oxford University Press, 2007. - 443 p.
4 Baker P., Ellece S. Key Terms in Discourse Analysis. - A&C Black, 2011. - 234 p.
5 Bright W. International encyclopedia of linguistics. Vol. 3 / W. Bright. - New York: Oxford univ. press, 1992. - 1533 p.
6 Горбунов, Ю.И. Французская грамматическая терминология: Опыт тезаурусного исследования / Ю.И. Горбунов. - СПб.: РГПУ им. А.И. Герцена, 2004. - С. 43.
скрипторов.
7. Термин, взятый в качестве дескриптора, снабжается релятором в случае, если не удается подобрать однозначный дескриптор (Под термином «релятор» подразумевается слово, используемое для различения значений многозначного термина).
В результате в ходе исследования было проанализировано более 400 англоязычных лексических единиц по лингвистике текста. Из всего многообразия выбранных для исследования терминов были определены заглавные термины, обозначающие основные понятия англоязычной лингвистики текста и называющие тему отдельного информационного поиска в разрабатываемом тезаурусе: ТЗ linguistics (лингвистика), basic notions (основные понятия), interdisciplinary perspectives (междисциплинарный обзор), text (текст), textuality (текстуальность), discourse grammar (грамматика текста), cohesion (связность), coherence (цельность), text classification (классификация текстов), text type (тип текста) genre (жанр), register (функциональный стиль). Взаимосвязи заглавных терминов в терминологическом поле англоязычной лингвистики текста полностью отражают структуру конструируемого тезауруса (рисунок 1).
Из приведенного ниже рисунка видно, что верхний ярус лингвистического терми-нополя содержит общенаучные и общелингвистические понятия (ТЗ basic notions, interdisciplinary perspectives, subdisciplines, text, linguistics и др.), которые впоследствии подразделяются на термины, присущие лишь англоязычной лингвистике текста (ТЗ textuality, discourse grammar, text type, coherence и др.). Тем не менее все эти группы терминов оказываются вертикально и горизонтально связанными между собой сетью семантических отношений. Так, ТЗ text является основным объектом изучения как лингвистики текста, так и других лингвистических дисциплин, изучающих проблемы, тем или иным образом связанные с текстом. Такая же взаимосвязь прослеживается и у терминов textuality и discourse grammar, первый из которых представляет основой объект изучения подобласти лингвистики текста, называемой вторым термином. Таким же образом пересекаются и
остальные ТЗ, обозначающие основные понятия лингвистики текста и ее подобласти, а
именно ТЗ text type с ТЗ text typology и ТЗ interaction of stylistics and rhetoric.
Рисунок 1 - Терминополе англоязычной лингвистики текста
Стоит отметить, что терминополе, представленное выше содержит лишь заглавные термины англоязычной лнгвистики текста, которые, в свою очередь, делятся на подклассы или микрополя, а подклассы на более мелкие группы. Подобное деление продолжается до тех пор, пока не будет исчерпана тема.
Итак, тезаурусное моделирование терминополя дает возможность объединить отдельные группы терминов в семантические поля, выявив семантические отношения, свойственные рассматриваемой предметной области и отражающие парадигматические и синтагматические связи, присущие терминам данной науки. Семантические отношения объединяют совокупность терминов в единую систему и связывают, с одной стороны, термины внутри семантического поля, а с другой стороны, семантические поля - в единое терминологическое поле.
Ниже приведены семантические от-
ношения, присущие терминологическим знакам конструируемого тезауруса:
- отношение «род-вид», «вид-род». К примеру, у термина reference (референция, отсылка) устанавливается гиперо-гипони-мическое отношение с терминами, которые обозначают различные виды референции, а именно с ТЗ exophora (экзофора) и en-dophora (эндофора);
- отношение «часть-целое», «целое-часть». Так, подобное семантическое отношение прослеживается у ТЗ text linguistics (лингвистика текста) и ТЗ discourse grammar (дискурсивная грамматика), text typology (типология текста), поскольку ТЗ discourse grammar и ТЗ text typology называют отдельные разделы, составляющие отдельные части ПО «Англоязычная лингвистика текста» в целом;
- отношение «вариантности». Примером данного типа отношений является ТЗ textuality (текстуальность) со своим вариантом, ТЗ textness (текстовость);
- отношение «антонимии». Так, ТЗ cataphora (катафора) имеет антоним, в качестве которого выступает ТЗ anaphora (анафора). В данном случае речь идет об интерпретации некоторого выражения, которое зависит от другого выражения, ранее встретившегося в тексте или встречаемого в тексте по мере дальнейшего чтения;
- отношение «синонимии». Помимо отношения «антонимии» в терминополе ТЗ cataphora (катафора) наблюдается и отношение «синонимии» с ТЗ cataphoric reference (катафорическая отсылка), forward-reference (обратная анафоризация), anticipatory anaphora (упреждающая анафоризация) и backward anaphora (обратная анафориза-ция);
- отношение «квазисинонимии». Примером подобного рода отношений служат ТЗ «spatial deixis» (локативный дейксис), найденный в нескольких лингвистических словарях, и его квазисиноним ТЗ «demonstrative reference» (указательные местоимения), широко используемый в лингвистической концепции М.А.К. Хэллидея и Р. Хазана1.
Также в англо-русском тезаурусе по лингвистике текста традиционно можно отметить несколько типов ассоциативных отношений, объединяемых в сознании говорящего или пишущего некоторыми ассоциациями. В настоящем исследовании были выделены нижеследующие ассоциативные отношения, характерные для английской терминологии лингвистики текста:
- по признаку <unit - means> (единица и средство/способ ее реализации): ТЗ reference (референция) может быть представлен в виде ТЗ recurrence (рекурренция), isotopy (изотопия), contiguity (ассоциативная связь), pronominalization (прономинализация);
- по признаку <unit - process> (единица и происходящий с ней процесс): ТЗ elliptical sentence (эллиптичное предложение) выступает в качестве результата, произошедшего с ним процесса, выраженного ТЗ ellipsis (эллипсис), а также ТЗ theme (тема) вступает в такие же отношения с ТЗ thematization (тематизация);
- по признаку <unit - relation> (еди-
1 Halliday, M.A.K., Hasan R. Cohesion in English. - London: Longman, 1976. - 374 p.
ница и связанные с нею отношения): ТЗ theme vs rheme (тема-рематическое отношение) находится в ассоциативном отношении по данному признаку с ТЗ word order (порядок слов) и stress (ударение), а также ТЗ connective (соединительный элемент) состоит в функции «член отношения» с ТЗ syndeton (союзная связь);
- по признаку <unit - theory> (единица и связанная с ней теория): ТЗ theme (тема) ассоциируется с теорией актуального членения предложения посредством ТЗ actual division of the sentence (актуальное членение предложения);
- по признаку <unit - feature> (единица и ее основное свойство): ТЗ text (текст) обладает существенными признаками, выражаемыми через ТЗ coherence (цельность) и cohesion (связность);
- по признаку <discipline/subdiscipline
- object> (наука/раздел науки и их основной объект изучения): ТЗ cohesion (связность) является объектом ТЗ text grammar (грамматика текста);
- по признаку <discipline - sources of the discipline> (лингвистическая дисциплина
- истоки возникновения данной дисциплины): ТЗ text linguistics (лингвистика текста) связан данным отношением с ТЗ rhetoric (риторика), stylistics (стилистика), syntax (синтаксис);
- по признаку - <unit - rel. approaches> (лингвистическая единица - взаимосвязанные лингвистические направления): ТЗ text linguistics (лингвистика текста) связан посредством основного объекта изучения с ТЗ sociolinguistics (социолингвистика), cognitive linguistics (когнитивная лингвистика), pragmatics (лингвистическая прагматика), psycholinguistics (психолингвистика), herme-neutics (герменевтика), semiotics (семиотика), lexicology (лексикология), anthropology (антропология), literary studies (литературоведение).
При этом следует отметить, что каждая научная терминология имеет свой набор ассоциативных связей. При моделировании тезауруса в данной работе разнообразные ассоциативные связи выделяются только при условии, что подобное отношение устанавливается между несколькими парами слов. Так, к примеру, ассоциативным отно-
шением по признаку <discipline/subdiscipline - object> (наука/раздел науки и их основной объект изучения) связаны как ТЗ text linguistics (лингвистика текста) и ТЗ text (текст), так и ТЗ discourse analysis (дискурс-анализ) и ТЗ discourse (дискурс).
Последний этап моделирования тезауруса заключается в определении структуры статьи конструируемого словаря (рисунок 2). В структуре словарных статей можно отметить поля, обозначенные следующими пометками: Trans. - русскоязычный тер-
мин, Syn. - синоним, Ant. - антоним, Qua-sisyn. - квазисиноним, Hyper. и Mer. - вышестоящий термин (гипероним и мероним), Hyp. и Hol. - нижестоящий термин (гипоним и голоним), Var. - вариант термина, далее следуют ассоциативные отношения (Discipline - лингвистическая дисциплина, в рамках которой изучается термин, Subdiscipline - раздел лингвистической дисциплины, Source - истоки возникновения дисциплины, Means - средства реализации лингвистической единицы в языке и т.д.).
Рисунок 2 - Словарная статья ТЗ genre (жанр) в англо-русском тезаурусе
по лингвистике текста
Важно отметить, что все термины в моделируемом тезаурусе связаны друг с другом не только системой семантических отношений, но и системой гиперссылок. Так, нижнее подчеркивание терминов в словарной статье свидетельствует о том, что подведя курсор и нажав на клавишу, можно быстро перейти к статье данного термина. Благодаря системе гиперссылок пользователь может без труда обращаться к статьям денотативно связанных терминов, терминов-гипонимов, синонимов, гиперонимов и так далее, а также получить быстрый доступ к схемам с изображением семантических
полей заглавных терминов. Иными словами, пользователь англо-русского тезауруса по лингвистике текста способен прокладывать собственный маршрут по словарю, становясь его соавтором. В то же время не стоит преуменьшать роль автора словаря, который создал гипертекст, определил его структуру, указал связи между его структурными частями, тем самым создав лишь видимость свободы пользователя. Ведь следуя по созданным автором гиперссылкам, пользователь реализует лишь одну из заложенных в словаре возможностей множественности маршрутов по нему.
Другим важным преимуществом моделируемого тезауруса является возможность изменять, добавлять контролируемый словарь терминов, т.е. тезаурус отличается открытым характером своей системы, который состоит в том, что словарные статьи могут быть расширены за счет введения новых терминов с использованием семантических отношений альтернативности или принадлежности к новой теории.
Таким образом, конструирование тезауруса английской терминологии лингвистики текста проходило в 4 этапа. На первом из них была построена терминологическая система тезауруса. Далее посредством отбора заглавных терминов конструируемого тезауруса была составлена основа терминологического поля словаря. Предложенная классификация семантических отношений, представленных в тезаурусе, дала возможность не просто четко увидеть связи, объединяющие терминологию ПО «Англо-
язычная лингвистика текста» в единое тер-минополе, но и выявить структуру соответствующей области научного знания, систематизировать и унифицировать ее терминологию. Вышеупомянутые семантические отношения нашли свое отражение в структуре словарной статьи моделируемого тезауруса, где каждая лексическая единица представлена в виде набора морфологических, семантических и синтаксических характеристик. Таким образом, была разработана новая модель тезаурусной словарной статьи, которая отражает семантическое поле отдельного термина ПО «Англоязыч-ная лингвистика текста» с указанием его семантической значимости, включающей не только традиционные семантические отношения - гиперо-гипонимические, меронимические, но и специфические ассоциативные отношения, свойственные исключительно терминам в пределах исследуемой области научного знания.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Горбунов, Е.Ю. Тезаурусное моделирование английских грамматических терминов морфологии и морфосинтаксиса: дис. ... канд. филол. наук. - СПб., 2008. - 213 с.
2. Горбунов, Ю.И. Французская грамматическая терминология: Опыт тезаурусного исследования. - СПб., 2004. - 188 с.
3. Пиотровский, Р.Г. Лингвистический автомат (в исследовании и непрерывном обучении). - 2-е изд., доп. и испр. - СПб., 2008. - 256 с.
4. Baker, P. Key Terms in Discourse Analysis. - A&C Black, 2011. - 234 p.
5. Bright, W. International encyclopedia of linguistics. Vol. 3 / W. Bright. - New York: Oxford univ. press, 1992. - 1533 p.
6. Bussman, H. Routledge Dictionary of Language and Linguistics. - London: Routledge, 1996. - 1335 p.
7. Crystal, D. A dictionary of linguistics and phonetics. 6th ed. - Oxford: Basil Blackwell, 2008. - 389 p.
8. Halliday, M.A.K., Hasan R. Cohesion in English. - London: Longman, 1976. - 374 p.
9. Matthews, P.H. The Concise Oxford Dictionary of Linguistics. - Oxford: Oxford University Press, 2007. - 443 p.