Научная статья на тему 'Принципы работы с электронными текстовыми корпусами при составлении словаря современных профессионализмов'

Принципы работы с электронными текстовыми корпусами при составлении словаря современных профессионализмов Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
220
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОННЫЙ ТЕКСТОВЫЙ КОРПУС / TEXT CORPORA / СЛОВАРЬ СОВРЕМЕННЫХ ПРОФЕССИОНАЛИЗМОВ / DICTIONARY OF MODERN PROFESSIONALISMS / ЛЕКСИЧЕСКИЙ РЯД / LEXICAL ROWS / УЗКОСПЕЦИАЛИЗИРОВАННАЯ ЛЕКСИКА / HIGHLY SPECIALIZED VOCABULARY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Леонова О.С.

В статье приводятся результаты исследования, направленного на определение принципов и методов работы с электронными текстовыми корпусами для составления словаря современных профессионализмов. Для достижения поставленной цели автором был проведен анализ нескольких «лексических рядов» специальной автомобильной лексики, сходной по семантике, но принадлежащей к разным уровням. В результате исследования были сделаны выводы о роли текстовых корпусов в процессе составления словаря современных профессионализмов и о необходимости применения дополнительных средств в случае с узкоспециализированной лексикой.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article elaborates on the results of the research carried out to define the main principles of working with text corpora in order to create a dictionary of modern professionalisms. To achieve this objective some special automobile lexical rows have been analyzed. Such lexical rows contain lexical units with similar meaning, but belonging to different layers. As a research result conclusion was made about the role of text corpora in the process of creating a dictionary of modern professionalisms and about the necessity to use additional sources in case of highly specialized vocabulary.

Текст научной работы на тему «Принципы работы с электронными текстовыми корпусами при составлении словаря современных профессионализмов»

ПРИНЦИПЫ РАБОТЫ

С ЭЛЕКТРОННЫМИ ТЕКСТОВЫМИ КОРПУСАМИ ПРИ СОСТАВЛЕНИИ СЛОВАРЯ СОВРЕМЕННЫХ ПРОФЕССИОНАЛИЗМОВ

О.С. Леонова

Аннотация. В статье приводятся результаты исследования, направленного на определение принципов и методов работы с электронными текстовыми корпусами для составления словаря современных профессионализмов. Для достижения поставленной цели автором был проведен анализ нескольких «лексических рядов» специальной автомобильной лексики, сходной по семантике, но принадлежащей к разным уровням. В результате исследования были сделаны выводы о роли текстовых корпусов в процессе составления словаря современных профессионализмов и о необходимости применения дополнительных средств в случае с узкоспециализированной лексикой.

Ключевые слова: электронный текстовый корпус, словарь современных профессионализмов, лексический ряд, узкоспециализированная лексика

Summary. The article elaborates on the results of the research carried out to define the main principles of working with text corpora in order to create a dictionary of modern professionalisms. To achieve this objective some special automobile "lexical rows" have been analyzed. Such "lexical rows" contain lexical units with similar meaning, but belonging to different layers. As a research result conclusion was made about the role of text corpora in the process of creating a dictionary of modern professionalisms and about the necessity to use additional sources in case of highly specialized vocabulary.

Keywords: Text corpora, dictionary of modern professionalisms, lexical rows, highly specialized vocabulary.

313

В стилистике слово «профессиональный» означает довольно широкий слой лексики: это не только профессионализмы - слова, которые «служат для обозначения различных производственных процессов, орудий производства, сырья, получаемой продукции и т.д.», но и узкоспециальные термины, а также особо выделяются «профессионально-жаргонные слова,

которые имеют сниженную экспрессивную окраску» [1, с. 80]. Существует точка зрения, что, например, язык автомобилистов отличается обилием неологизмов и окказионализмов, не зафиксированных в специальной литературе и словарях. А на основе подобных примеров нельзя исследовать и доказывать какие-либо закономерности. Тем не менее необходимость

314

исследования и изучения таких единиц признается учеными: «Окказионализмы показывают, на что способен язык при порождении новых слов, каковы его творческий потенциал, глубинные силы» [2, с. 180].

В настоящее время не существует четкого определения «профессионального» языка, более того, мнения исследователей по данному вопросу расходятся. В некоторых работах профессиональный язык рассматривается как особая терминологическая система определенного вида деятельности, профессии, отрасли производства. В других работах, например, у О.С. Ахмановой, профессиональный язык - это «то же, что жаргон. Социальные диалекты данного языка, бытующие среди лиц, принадлежащих к одно и той же профессии» [3, с. 534]. Тем не менее, исходя из того, что жаргон представляет собой язык коммуникации определенной группы людей, связанных общностью интересов, способом проведения свободного времени и др., в данном значении жаргон крайне близок профессиональному языку. Существует также третья точка зрения, когда в профессиональный язык включается как терминологическая, так и профессионально-жаргонная лексика. Мы рассматриваем профессиональный язык как совокупность терминологической, жаргонной и общеязыковой лексики. Причем, в зависимости от определенных особенностей и специфики группы специалистов (разработчики, специалисты по ремонту, механики, профессиональные водители и просто автомобилисты-любители) варьируется процентное соотношение данных составляющих.

Глобальный автомобильный рынок развивается стремительными темпами: постоянно растет число автомобилей, а вместе с ним увеличивается доля автовладельцев. Автомобиль помогает своему владельцу в той или иной мере приобщиться к группе «специалистов» данной отрасли. В ходе ежедневной эксплуатации владелец автомобиля постепенно знакомится с «профессиональным» языком данной группы. Отдельные стилистически окрашенные единицы «автомобильного» языка фиксируются в печатных источниках: в литературных произведениях - для лучшего воссоздания описываемых условий, обстановки. Все чаще данные единицы, наряду с другой эмоционально-экспрессивной лексикой и стилистическими приемами встречаются в СМИ, особенно в тематических изданиях:

«В каком же мультике я видела это чудо - Matiz? Я знаю твердо: у него есть душа, характер и колоссальное стремление доказать, что он тоже автомобиль, хотя и крошечный» [4], «...Широко оскалившись воздухозаборником и строго глядя "орлиными глазами» головных фар"» [5, с. 32], «...скажет: "Какой он у тебя глазастень-кий, симпа-а-тичный!"» [6, с. 22] и др.

Все большую популярность у автомобилистов приобретают электронные СМИ, среди которых особое место занимает Интернет, объединяющий как виртуальные версии печатных СМИ, так и собственно электронные мультимедийные источники массовой информации. Как показало исследование, в отличие от напечатанных газет или журналов, их электронные версии в Интернете имеют определенные преимущества. У большин-

ства ресурсов доступно комментирование и обсуждение публикуемых на сайте материалов - виртуальная коммуникация определенной группы специалистов, характеризующейся общностью интересов или родом деятельности, в некоторых случаях, даже «особым», не понятным обычному человеку языком. Особое место занимают автомобильные форумы - яркий пример профессиональной виртуальной коммуникации.

Тематика и специфика форумов различна: существуют форумы любителей определенной марки автомобиля, форумы по автомобилям отечественного / иностранного производства, форумы по тюнингу, форумы для гонщиков и многие другие. Тематическая соотнесенность форума иллюстрирует принадлежность его участников к одной «профессиональной» группе, общность их интересов и способ проведения свободного времени.

Вышеописанные источники предоставляют обширный материал для анализа и исследования: тут встречается как терминологическая, разговорная, жаргонная лексика, так и окказионализмы, неологизмы и другие эмоционально-окрашенные лексические единицы, которые через некоторое время либо зафиксируются в языке, либо, не прижившись, исчезнут. Одним из способов проверки зафик-сированности лексической единицы в языке являются словари, которые помимо грамматической информации указывают на принадлежность слова к определенной группе лексики (например, автомобильная лексика).

Тем не менее, новые единицы появляются в языке гораздо быстрее, чем происходит процесс обновления словарей. Поэтому часто словари не в пол-

ной мере отражают современное состояние языка. Кроме того, если речь идет об узкоспециализированной системе профессионального автомобильного языка, то исследователи признают сложность процесса создания такого словаря. Возможным способом решения вышеуказанных трудностей как при составлении словарей, так и для получения разнообразных справок об определенной лексической единице, становится использование текстовых корпусов, демонстрирующих возможности употребления данной лексической единицы в контексте со ссылкой на источник. Что касается словарей автомобильной лексики, то их немного и, как правило, это двуязычные словари, немного устаревшие или не содержащие единицы современного профессионального языка автомобилистов. Такие единицы встречаются частично в словарях жаргона, энциклопедиях, учебных и справочных материалах, руководствах по эксплуатации для специалистов и любителей. Таким образом, на сегодня не существует полного словаря современной профессиональной автомобильной лексики. Такое положение дел обуславливает необходимость постоянного обновления существующих и создания новых словарей, отражающих реальное состояние профессионального языка автомобилистов.

Текстовые корпуса могут оказать значительную помощь в процессе создания вышеописанных словарей, поскольку они представляют собой большой объем экспериментальных данных; в них представлены тексты различных периодов истории, жанров и стилистических уровней.

Корпусная лингвистика представляет собой достаточно молодую нау-

315

316

ку, поэтому до сих пор не существует единого четкого определения корпуса, а также точного разграничения корпусной лингвистики как теории (описание основных принципов создания и использования корпусов) и как метода (исследования) [7, с. 105]. В представленной работе корпусная лингвистика рассматривается скорее как метод лингвистического исследования профессиональных единиц автомобильной лексики: «Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач» [8, с. 4-5].

Кроме того, внимание в данной работе уделяется также описанию программного обеспечения, корпусных менеджеров, разработанных для упрощения взаимодействия пользователя с текстовым корпусом и для корректной интерпретации полученных данных. В данном случае, описывая при помощи информационных технологий принципы создания и применения корпусов, корпусная лингвистика выступает как наука.

Несмотря на то, что первый текстовый корпус (Brown Corpus) появился в 60-е гг. XX в., сегодня лингвистические корпуса существуют для многих языков, в том числе разрабатывается Национальный корпус русского языка. За эти годы значительные изменения претерпела методология работы с корпусом, его создания, увеличился охват материала, и расширились возможности применения корпусов для лингвистических исследований.

Рассмотрим подробно некоторые примеры на основе Мангеймского корпуса немецкого языка, сайт которого расположен по адресу http:// www.ids-mannheim.de/cosmas2/ [9]. Цель проведенного исследования заключалась в определении специфики специальных лексических единиц, сходных по значению, но принадлежащих к разным уровням языка, путем анализа информации и примеров, предоставленных электронным текстовым корпусом COSMAS II, разработанным Институтом немецкого языка г. Мангейм. Данный корпус представляет собой самое большое в мире электронное собрание современных текстов на немецком языке. В нем представлены различные типы текстов, в том числе существует подкор-пус устной речи. Объем корпуса в настоящее время составляет более 5 млн. книжных страниц.

Взаимодействие пользователя с электронной базой корпуса осуществляется через корпусный менеджер, специальную программу, доступную для установки после бесплатной регистрации. Данный корпусный менеджер имеет настраиваемые расширенные возможности поиска как отдельных слов, так и словосочетаний, грамматических конструкций, контекстов, в которых употребляется данное слово и прочее. Результатом поиска становится количество найденных случаев употребления заданной единицы в контекстах, перечень таких изданий с годом выпуска, региональной принадлежностью и количеством встречающихся случаев. Результаты заданного поиска представлены в виде конкорданса, когда искомая единица представлена в своем контекстном окружении со ссылками на источник.

ЕК

Для достижения поставленной в данном исследовании цели был проведен анализ нескольких «лексических рядов» специальной автомобильной лексики - сходных по значению единиц разного уровня языка. Были рассмотрены следующие ряды автомобильных лексических единиц: 1) Akkumulator, Akku, Accu, Batterie; 2) Katalysator, Kat; 3) Klimaanlage, Klima, Klimagerät, Klimaautomat; 4) Gaspedal, Gas. Их анализ осуществлялся по следующим параметрам: частотность использования данной лексической единицы в языке, ее основные (наиболее часто встречающиеся) значения, исходя из контекста. Кроме того, было проведено сравнение с аналогичными лексическими рядам в русском языке.

Сравним результаты по единицам лексического ряда, обозначающего «аккумуляторную батарею». Согласно корпусу, чаще всего в контекстах встречается Batterie (6779 случаев), далее по частотности следует Akku (3153 случая), затем Akkumulator (102 случая) и Accu (всего 29 случаев). Несмотря на кажущееся для не-носителя немецкого языка сходство значений (значение используемой в автомобиле аккумуляторной батареи), различия все же существуют. Так, например, контексты с лексической единицей Batterie в большинстве случаев связаны непосредственно с автомобилем (то есть Batterie используется в значении аккумуляторная батарея), тем не менее, в некоторых случаях Batterie обозначает батарею в целом, в ее техническом применении.

Напротив, под Akku часто подразумевается аккумулятор в мобильных телефонах, навигаторах, ноутбуках и других аналогичных широко распространенных электронных устрой-

ствах. Кроме того, встречается достаточно много случаев применения данной лексической единицы в значении самочувствия/усталости человека. Akkumulator встречается преимущественно в контекстах технического содержания (речь идет скорее о применении аккумуляторной батареи в промышленности, хотя встречаются единичные случаи применения данной лексической единицы в отношении автомобиля). Реже всех аналогов встречается Accu. Вероятно, это связано с тем, что данная лексическая единица появилась в результате влияния английского языка (accumulator англ. - аккумулятор). При наличии его немецкого аналога, данный неологизм не прижился (или только начинает распространяться) в немецком языке, о чем свидетельствует количество случаев его применения.

В рассмотренных выше примерах представленная информация о частотности употребления лексических единиц основана на зафиксированных в печатных источниках данных и не ограничивается автомобильной отраслью. Как отмечалось ранее, не всегда печатные источники точно отражают состав и структуру «профессионального» языка специалистов определенной отрасли. Поэтому обратимся к автомобильным форумам, как к частному случаю корпусов. Анализ частотности употребления лексического ряда Akkumulator, Akku, Accu, Batterie на крупном немецком автомобильном форуме www.motor-talk.de [10] показал, что чаще всего в «профессиональной» среде в значении аккумуляторной батареи используется Batterie (384 662 случая), далее следует Akku (26 768), затемAccu (676) и Akkumu-

317

318

lator (496). Таким образом, в корпусе и в «профессиональном» словоупотреблении по частотности совпали только наиболее распространенные единицы, а по значению - единицы совпали лишь частично.

Аналогично рассмотрим употребление единиц лексического ряда, обозначающих катализатор: Katalysator, Kat. Частотность использования данных двух лексических единиц в контекстах практически аналогична 4591 случай у Katalysator и 4445 случая у Kat. Чаще всего данные единицы употребляются в контексте, связанном с автомобилем. Тем не менее, Katalysator также употребляется в значении импульса / ускорителя. В разговорах «специалистов» чаще употребляется сокращенный вариант Kat, что объясняется законом экономии речевых усилий.

Также интересен для рассмотрения лексический ряд единиц, обозначающих автомобильный кондиционер / климат-контроль: Klimaanlage, Klima, Klimagerät, Klimaautomat. Согласно данным, полученным из текстового корпуса, среди единиц данного лексического ряда по частотности лидирует Klima (104 259 случаев), но преимущественно в значении климат (жаркий климат, изменение климата). Гораздо реже в контекстах встречается Klimaanlage (12078 случаев), но данная лексическая единица используется непосредственно в описаниях автомобилей, причем появились такие статьи относительно недавно, с распространением и доступностью кондиционера более широким кругам населения. Klimagerät представлен лишь в 113 контекстах и обозначает "бытовой" кондиционер. Всего в двух случаях можно найти Klimaautomat, но в обоих случа-

ях данная единица употребляется в описаниях автомобиля.

Что касается виртуальной коммуникации специалистов, то тут дела обстоят иначе. Все вышеперечисленные лексические единицы обозначают автомобильный кондиционер/ климат-контроль, разница заключается лишь в частотности их использования: было обнаружено 241 458 случаев употребления Klima; за ним следует Klimaanlage 153 190 случаев; затем Klimagerät (865 случаев) и замыкает данный лексический ряд Klimaautomat (388 случая).

В данном случае можно провести аналогию с лексическим рядом с тем же значением в русском языке (на материале Национального корпуса русского языка) - www.ruscorpora.ru [11]. Так в русском языке есть кондиционер, а есть его разговорные варианты кондишн, кондей, кондёр, климат и др. В результате поиска в Национальном корпусе русского языка обнаруживается 309 совпадений для кондиционера в основном корпусе и 418 - в газетном, как правило, в значении автомобильного кондиционера; в аналогичном значении, как в основном (14 случаев совпадения), так и в газетном корпусе (12 случаев совпадения), употребляется кондишн. Кондей и кон-дер употребляются в таком значении только в газетном корпусе; в основном корпусе его значение - национальное русское блюдо. Также встречаются отдельные упоминания данных лексических единиц в значении кондиционер для волос и белья.

Тем не менее, в «профессиональной» среде все вышеуказанные лексические единицы используются для обозначения автомобильного кондиционера.

Аналогичная ситуация в случае с лексическим рядом, обозначающим педаль акселератора. В немецком языке в среде «профессионалов» употребляются такие варианты как Gaspedal (63 284 совпадений) и Gas (399 797 случая). Аналогичные варианты используются в русском языке педаль газа и газ. У немецкого Gas встречается также дополнительное значение - топливо. Тем не менее, в основном корпусе, как в немецком, так и в русском языке, наиболее частотное значение газа как полезного ископаемого.

Таким образом, подводя общий итог работы, следует отметить, что значение текстовых корпусов в процессе составления словаря современных профессионализмов крайне велико, поскольку они представляют собой дополнительный инструмент исследования языка, источник практического материала, на основе которого можно получить дополнительную лингвистическую информацию по заданной единице. Тем не менее, они не создают полной картины словоупотребления в случае с узкоспециализированными «профессиональными» лексическими единицами. Поэтому при составлении словаря современных автомобильных профессионализмов не достаточно применения одно-

го корпуса, необходима комбинация различных источников информации, а главное непосредственно содержащих «профессиональную» автомобильную лексику, чтобы лучше определить ее специфику и отличающееся от официального словоупотребление.

СПИСОК ИСТОЧНИКОВ И ЛИТЕРАТУРЫ

1. Голуб И.Б. Стилистика русского языка. -7-е изд. - М.: Айрис-пресс, 2006. - 448 с.

2. Земская Е.А. Словообразование как деятельность. - Изд. 3-е. - М.: Изд-во ЛКИ, 2007. - 224 с.

3. Ахманова О. С. Словарь лингвистических терминов. - Изд. 4-е, стереотипное. - М.: КомКнига, 2007. - 576 с.

4. АвтоРевю - интернет-версия автомобильного журнала. - URL: www.autoreview.ru

5. Автомир. - 2011. - № 10.

6. Автомир. - 2006. - № 49.

7. Ганиева И.Ф. Об использовании корпусов в лингвистических исследованиях // Вестник Башкирского университета. -2007. - Т. 12. - № 4. - С. 104-106.

8. Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. - СПб., 2005. -48 с.

9. Проект Cosmas II (Мангеймский корпус немецкого языка). - URL: www. ids- 319

mannheim.de/cosmas2/

10. «Автомобильный» форум в Германии. -URL: www.motor-talk.de

11. Образовательный портал Национального корпуса русского языка. - URL: www. ruscorpora.ru ■

i Надоели баннеры? Вы всегда можете отключить рекламу.