Научная статья на тему 'Проблема контекстной обусловленности смыслового содержания лексических единиц, выражающих основные понятия области знания'

Проблема контекстной обусловленности смыслового содержания лексических единиц, выражающих основные понятия области знания Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
183
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТЕКСТ / ПОЛИСЕМИЯ / КОНТЕКСТНАЯ СЕМАНТИКА / ПОИСК / МЕТОД ОЧНОЙ СТАВКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Онегов М.В.

Даны эффективные способы разрешения проблемы контекстной обусловленности лексических единиц. Прежде всего это поиск недостающего контекста с помощью имеющихся элементов контекста и метод очной ставки. Данные методы были испытаны на практике и показали надежные результаты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Онегов М.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблема контекстной обусловленности смыслового содержания лексических единиц, выражающих основные понятия области знания»

УДК 81'371

М.В. Онегов

Пермский национальный исследовательский политехнический университет

ПРОБЛЕМА КОНТЕКСТНОЙ ОБУСЛОВЛЕННОСТИ СМЫСЛОВОГО СОДЕРЖАНИЯ ЛЕКСИЧЕСКИХ ЕДИНИЦ, ВЫРАЖАЮЩИХ ОСНОВНЫЕ ПОНЯТИЯ ОБЛАСТИ ЗНАНИЯ

Даны эффективные способы разрешения проблемы контекстной обусловленности лексических единиц. Прежде всего это поиск недостающего контекста с помощью имеющихся элементов контекста и метод очной ставки. Данные методы были испытаны на практике и показали надежные результаты.

Ключевые слова: контекст, полисемия, контекстная семантика, поиск, метод очной

ставки.

Одной из важнейших проблем перевода является проблема выбора значений лексических единиц. Использование семантики слова представляется неэффективным инструментом перевода, поскольку одно и то же слово может иметь десятки эквивалентов в разных дисциплинах. Г.В. Колшанский [1, с. 15] отмечает, что «отдельное слово как таковое никогда не может быть соотнесено с каким-либо конкретным предметом, если оно не будет включено в коммуникативный акт, который заранее предполагает построение и передачу некоторого сообщения». В связи с этим возникает необходимость изучения семантики лексических единиц только в их отношениях, то есть всех видов окружения этих единиц (всех контекстных связей), а это область изучения контекстной семантики - одного из разделов лингвистики.

Согласно В.Н. Ярцевой [2], «контекст (от лат. еоМвхШ - "соединение, связь") - фрагмент текста, включающий избранную для анализа единицу, необходимый и достаточный для определения значения этой единицы, являющегося непротиворечивым по отношению к общему смыслу данного текста». Г.В. Колшанский также указывает, что «возможен и такой подход к определению контекста, который выводит сам контекст из языковой структуры и отводит ему роль интерпретатора высказывания, определяемого объемом неязыковых знаний коммуниканта. Другими словами, понятие контекста должно рассматриваться как возможный круг знаний коммуниканта, воспринимающего тот или иной текст в соответствии с этими значениями и на их основе, а не на основе непосредственно языковых данных» [1, с. 25-26].

Контекст в этом смысле есть некоторое ситуационное значение текста или его фрагмента, его глубинное значение, стоящее за языковой формой. Таким образом, контекст в этом смысле есть как бы второй уровень знания языка, ориентированный на знание внеязыковых фактов, реалий и так далее, компетенция второго уровня [1, с. 26]. Б.М. Лейкина [3, с. 98] также называет этот уровень глубинным или надъязыковым, ситуационным значением текста, для выявления которого требуются не только языковые, но и неязыковые значения и ассоциации и учет разнообразных факторов речевой ситуации, например специфики предметной области, с которой связано высказывание.

Данная теория подтверждается следующими примерами, в которых показано, что значение проблемной лексической единицы определяется контекстом меньшего или большего размера.

Пример № 1.

Приведем основные словарные значения слова cure, выступающего, например, в роли существительного [4]:

- (медицина) лечение; лекарственное средство;

- (полимеры) отверждение; вулканизация;

- (техника) выдержка; устранение (дефектов).

При этом выражение starvation cure будет переводиться как лечение голодом, cure of plastic как отверждение пластмассы, а cure of concrete как выдержка бетона.

Пример № 2.

Варианты перевода приведены в табл. 1.

Таблица 1

Варианты перевода лексемы integration

Оригинал Неправильный перевод Правильный перевод

1 2 3

The exothermic heat flow produced by the reaction is recorded as a function of temperature and time by a differential scanning calorimeter Экзотермический тепловой поток, образующийся в процессе реакции, регистрируется как функция температуры и времени на дифференциальном сканирующем калориметре

Окончание табл. 1

1 2 3

Integration of the exothermic heat flow over time yields the heat of reaction Интеграция экзотермического теплового потока в течение долгого времени приводит к выделению теплоты во время химической реакции Интегрирование экзотермического теплового потока по времени дает теплоту реакции

На основе первого предложения мы можем построить схематический график зависимости теплового потока от времени (рис. 1).

Мы понимаем, что теплота реакции будет равна сумме всех значений теплового потока, которые имели место в процессе химической реакции. Графически теплота реакции будет равна площади под графиком функции теплового потока. Соответствующая математическая операция называется интегрированием по времени, которое в английском языке описывается устойчивым выражением integration over time. Здесь словосочетание over time является индикатором, обусловливающим выбор значения слова integration как «интегрирование», а не «интеграция», «объединение», «суммирование», «сумма» и т.д.

Пример № 3.

Варианты перевода приведены в табл. 2.

Таблица 2

Варианты перевода лексемы reactive

Оригинал Неправильный перевод Правильный перевод

This test method determines the exothermic heat of reaction of thermally reactive chemicals or chemical mixtures, using milligram specimen sizes, by differential scanning calorimetry Данный метод испытаний определяет количество теплоты, выделяющееся в процессе экзотермической реакции термореактивных химических реагентов или химических смесей, используя образцы миллиграммовых размеров путем дифференциальной сканирующей калориметрии Данный метод испытания позволяет определить количество экзотермической теплоты реакции термически активных химических реагентов или химических смесей с использованием образцов в миллиграммовых количествах методом дифференциальной сканирующей калориметрии

Such reactive materials may include thermally unstable or thermoset materials Такие термопластичные материалы могут включать в себя нестабильные или термоотверждающиеся материалы Такие активные материалы могут включать в себя термически нестабильные или термореактивные материалы

В словаре [4] имеются следующие основные вхождения:

- thermally reactive - термореактивный;

- reactive material - термопластичный материал; реакционно-способный материал;

- reactive - реагирующий, реакционно-способный, реактивный, химически активный, активный, способный вступать в реакцию;

- thermoset - термореактивный, термоотверждающийся, отверждае-мый нагреванием; реактопласт, термореактопласт.

Возникает следующий вопрос: чем отличается термореактивный thermally reactive от термореактивного thermoset? Причем согласно второму предложению примера thermally reactive («such reactive») включает в себя thermoset.

Известно [5], что пластмассы делятся на два вида: термопластичные (термопласты) и термореактивные (или термоотверждающиеся; реактопла-

сты). Точные эквиваленты будут соответственно: thermosoftening plastic (thermoplastic) и thermosetting plastic (thermoset). Исходя из этого, мы не можем использовать термин «термореактивный» для английского thermally reactive, иначе мы получаем отождествление понятий, имеющих различный смысл, что недопустимо. Значит, для прилагательного reactive выбираем эквивалент «активный» (в значении «химически активный»), а для thermally reactive - «термически активный» (в значении «химически активный при воздействии температуры»).

Примененный метод введен автором и называется методом очной ставки. В этом методе два и более эквивалентных соответствия сравниваются одновременно, чтобы не допустить отождествления понятий.

Пример № 4.

Варианты перевода приведены в табл. 3.

Таблица 3

Варианты перевода лексемы tangent

Оригинал Неправильный перевод Правильный перевод

Construct a tangent to the leading edge of the exothermic peak at the point of maximum rate of change and extrapolate that tangent to the baseline constructed in 9.5 Постройте тангенс к переднему краю экзотермического пика в точке максимального значения коэффициента изменения и экстраполируйте данный тангенс к основной линии, построенной в п. 9.5 Постройте касательную к переднему краю экзотермического пика в точке максимальной скорости изменения и экстраполируйте данную касательную до базовой линии, построенной в п. 9.5

Посмотрим на оригинальный график (рис. 2). В переводе имеется две ошибки: в слове tangent, которое является ложным другом переводчика, и в словосочетании rate of change. Выбор правильных значений основывается на том, что в этом предложении tangent и rate of change являются контекстами друг для друга, присутствует явный индикатор construct («построить») и приведен рисунок, который также является частью контекста.

229.1 "С

120 170 220 Z70

тг с

Рис. 2. Оригинальный график

Пример № 5.

Варианты перевода приведены в табл. 4.

Таблица 4

Варианты перевода

Оригинал Неправильный перевод Правильный перевод

Standard Test Method for Resin Flow of Carbon Fiber-Epoxy Prepreg Стандартная методика испытаний растекания смолы углеродистых препрегов с эпоксидным волокном Стандартный метод испытания препрега «углеволокно - эпоксидная смола» для определения характеристик растекания смолы

Микроконтекст, образуемый словами resin, carbon, fiber, epoxy и prepreg, однозначно определяет перевод названия материала. Учитывая, что названия композитов в английском языке имеют специфическую структуру (табл. 5) строим перевод следующим образом: «препрег "углеволокно - эпоксидная смола"». Существует развернутый вариант перевода: «препрег из

эпоксидной смолы, армированной углеволокном». Обычно он применяется, когда в оригинале имеется слово reinforced, например carbon fiber-reinforced epoxy prepreg.

Таблица 5

Структура названия композитов в английском языке

Наполнитель Связующее Тип

(волокно) (матрица) материала

Preform

Carbon Epoxy Prepreg

Glass Fiber - Polyester (Resin) Polymer

Aramid Phenol Plastic

Composite

Мы пришли к выводу, что значение слова определяется контекстом, причем контекстом в широком смысле слова, то есть охватывающим возможный круг знаний коммуниканта. Таким образом, процесс обучения, или получения знаний, сводится к накоплению контекста, достаточного для понимания смысла лексических единиц, которые без этого контекста могут иметь множество значений.

Таким образом, решением проблемы контекстной обусловленности лексических единиц является нахождение недостающего контекста, при этом недостающий контекст может быть получен как в ходе предварительного обучения (формального или неформального), так и в ходе обучения во время перевода (мгновенного обучения).

Методика нахождения недостающего контекста (в порядке увеличения сложности поиска) следующая:

1) изучение эквивалентов проблемной лексической единицы в двуязычных словарях;

2) если эквивалент не найден, то изучение словосочетаний или фраз, включающих проблемную лексическую единицу, в двуязычных словарях (например, в словаре [4]);

3) если эквивалент не найден, то поиск контекста на языке перевода (например, в информационных изданиях, поисковых системах Интернета и т.д.);

4) если эквивалент не найден, то поиск контекста на языке оригинала (например, в информационных изданиях, поисковых системах Интернета и т.д.);

5) при необходимости использование метода очной ставки.

Рассмотрим применение данной методики на примерах.

Пример № 6.

Имеется текст на английском языке. Проблемные лексические единицы: HPC, HPT, LPT.

The following sensors and detectors monitor the oil system parameters: tank oil level sensor (with a measuring rule); oil filter pressure differential sensor; engine inlet oil pressure sensor; engine inlet oil temperature sensor; HPC ball bearing (#4), HPT roller bearing (#5) and LPT roller bearing (#6) scavenge oil temperature sensors; engine inlet minimum oil pressure detector; maximum breather line pressure detector; HPC ball bearing (#4) scavenge oil magnetic debris (chip) detector; slot type debris and magnetic plug detectors in the intermediate case, gearbox and oil scavenge lines from the HPT (#5) and LPT (#6) roller bearings.

Шаг 1. Выполняем поиск HPC в словаре [4] и находим примерно 30 эквивалентов, что не дает результата.

Шаг 2. В словаре [4] имеется 17 фраз, содержащих HPC, в тематиках «вычислительная техника» (здесь HPC - высокопроизводительные вычисления) и «авиация» (здесь HPC - компрессор высокого давления). Компрессор высокого давления подходит к нашему контексту, поскольку у компрессора высокого давления могут быть шарикоподшипники (ball bearings). Для проверки нашей гипотезы продолжим поиск.

Шаг 3 пропускаем, поскольку по терминам языка перевода у нас пока не возникло вопросов.

Шаг 4. Выполняем поиск в Google [6]. Поисковые запросы следующие:

- HPC ball bearing - нет значимых результатов;

- HPC bearing - нет значимых результатов;

- в оригинальном тексте речь идет о двигателе (engine), поэтому выполняем такой запрос: HPC engine - получаем ссылку на статью Turbofan в англоязычной Википедии [7]. В этой статье имеется раздел «Терминология», в котором мы находим расшифровку наших аббревиатур: HPC - high pressure compressor, HPT - high pressure turbine, LPT - low pressure turbine. Расшифрованные аббревиатуры теперь переводим обычным способом. Для этого выполняем шаги методики в обратном порядке:

Шаг 3. Выполняем поиск в Google [6] для того, чтобы определить, используются ли в России подобные аббревиатуры: КВД для HPC, ТВД для HPT, ТНД для LPT. Поисковой запрос: «компрессор высокого давления КВД». В результатах поиска видим, что аббревиатуры используются.

Шаг 2 и 1. На данных шагах вносим результаты нашего исследования в словарь Multitran [4] или в свой собственный словарь, чтобы не выполнять исследование повторно, когда эти термины встретятся вновь.

Пример № 7.

Поиск недостающего контекста может иметь высокую сложность, которая зависит от распространенности и публичности данного контекста и определяется количеством шагов методики, а также количеством поисковых запросов в поисковой системе, если таковая используется. Примером высокого количества запросов в поисковой системе может служить следующий.

Оригинальный текст представляет собой презентацию по теме снижения шума от сверхзвуковых струй в авиационном двигателе. На одном из слайдов приводятся параметры NPR и IPR в следующем виде:

IPR = 1.0, IPR = 2.5, IPR = 4.0

NPR = 1.61, NPRf = 2.23

Шаги 1-3 не дают однозначного результата, поэтому переходим к шагу 4. Выполняем поиск в Google [6]. Поисковые запросы следующие:

- NPR engine - нет значимых результатов;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- NPR engine fan core - нет значимых результатов;

- NPR IPR - нет значимых результатов;

- NPR pressure - нет значимых результатов;

- NPR noise - получен результат: NPR - noise power ratio.

Поскольку IPR и NPR - аббревиатуры схожие, то применим метод очной ставки. Для этого выполним поиск IPR и сравним результат с NPR на предмет какого-либо сходства. Поисковые запросы в Google [6] следующие:

- IPR power ratio - нет значимых результатов;

- IPR noise - нет значимых результатов;

- NPR IPR power ratio - нет значимых результатов;

- IPR engine - нет значимых результатов;

- IPR engine noise - обнаруживаем относительно релевантные ссылки:

http: //www .thedie selstop.com/forums/f23/ipr-valve -bench-test-269152/

http://www.ebay.com/itm/ws/eBayISAPI.dll?ViewItem&item=26136054812

1&catId=6000&item=261360548121.

Нет результатов, продолжаем поиск:

- IPR frequency - нет значимых результатов.

На том же слайде оригинала встречается аббревиатура SPL = уровень звукового давления. Используем ее в поиске:

- IPR SPL - находим ссылку на презентацию NASA по воздействию впрыска воздуха на уровень шума реактивного двигателя:

http://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/20080002268_20080007 65.pdf.

В данной презентации нет расшифровки IPR, но IPR здесь находится в контексте со словом nozzle. Используем его в поиске:

- IPR nozzle - определяем, что IPR - injection pressure ratio. Проверим в Google [6], как связаны понятия NPR и IPR:

- NPR IPR pressure ratio - по первой ссылке выходим на научную статью NASA, которая по форме и содержанию очень похожа на переводимую презентацию. Здесь NPR = nozzle pressure ratio, IPR = injection pressure ratio.

Выполняя шаги 2 и 1, вносим данные понятия в словарь Multitran [4].

В переводе данных аббревиатур осталось определить значение индексов c и f. На основе контекста презентации допускаем, что c = core, f = fan. Поиск завершен.

Пример № 8.

При разрешении проблемы полисемии большую ценность представляет метод очной ставки. Рассмотрим применение данного метода на ярком примере.

Переводу подлежит стандарт ASTM под названием «Стандартные методы испытания для определения массы (веса) текстильного полотна на единицу площади». В разделе по оборудованию указано три устройства, два из которых представляют проблему для переводчика: scale и balance. Контекст следующий:

Scale, имеющие предел взвешивания и чувствительность, достаточные для взвешивания всего куска, рулона, стандартного рулона или отреза с точностью в пределах ±0,1 % от общей массы.

Balance, имеющие предел взвешивания и чувствительность, достаточные для взвешивания с точностью в пределах ±0,1 % от массы испытываемых образцов.

Шаги 1 и 2. Очевидно, что и scale, и balance - это весы, но вопрос в том, чем они отличаются?

Шаг 3. Выполняем поиск в Google [6] на тему классификации весов. Находим, например, что весы разделяются на рычажные, пружинные, тензо-метрические, гидростатические, гидравлические [8]. Затем находим интересную задачку по физике: «Что будут показывать рычажные и пружинные весы на Луне?». Ответ: «Рычажные весы на Луне (и вообще на любой планете) покажут ровно то же, что и на Земле, потому что фактически рычажные весы измеряют не силу, а массу взвешиваемого тела. Пружинные весы на Луне покажут вес, в 6 раз меньший, так как они измеряют именно силу, которая на Луне стала в 6 раз меньше» [9]. Из этого делаем вывод, что базовая класси-

фикация весов представляет собой разделение весов на рычажные (измеряющие массу) и пружинные (измеряющие вес).

Шаг 4. Используя Google [6], находим, что balance измеряют массу, значит, balance = рычажные весы, а scale измеряют вес, значит, scale = пружинные весы.

Шаг 3 был выполнен ранее.

Шаги 2 и 1. Вносим термины в словарь.

Таким образом, в данной статье мы показали эффективные способы разрешения проблемы контекстной обусловленности лексических единиц -поиск недостающего контекста с помощью имеющихся элементов контекста и метод очной ставки. Эти методы были испытаны на практике и неизменно показывали высокие результаты. Предлагается их введение в практику подготовки профессиональных переводчиков.

В статье не рассмотрено, но необходимо отметить, что при разрешении неоднозначности лексических единиц также следует применять толковые словари на иностранном языке [10, 11], тематические словари на иностранном языке [12, 13], тематические двуязычные словари [14, 15].

Список литературы

1. Колшанский Г.В. Контекстная семантика. - М.: Наука, 1980.

2. Языкознание. Большой энциклопедический словарь / гл. ред. В.Н. Ярцева. - 2-е изд. - М.: Большая Российская энциклопедия, 1998.

3. Лейкина Б.М. К проблеме взаимодействия языковых и неязыковых знаний при осмыслении речи // Лингвистические проблемы функционального моделирования речевой деятельности / ред. М.И. Откупщикова. - Л.: Изд-во Ленингр. ун-та, 1974. - Вып. 2. - С. 97-109.

4. Словарь Мультитран [Электронный ресурс]. - URL: http://www.multitran.ru/ (дата обращения: 20.12.2013).

5. XuMuK.ru. Пластические массы. - URL: http://www.xumuk.ru/ encyklopedia/2/3397.html (дата обращения: 20.12.2013).

6. Поисковая система Google. - URL: https://www.google.ru/ (дата обращения: 20.12.2013).

7. Turbofan // Wikipedia. - URL: http://en.wikipedia.org/wiki/Turbofan (дата обращения: 20.12.2013).

8. Весы [Электронный ресурс] // Википедия. - URL: http://ru.wikipedia. org/wiki/%D0%92%D0%B5%D1%81%D1%8B (дата обращения: 20.12.2013).

9. Ответы@mail.ru. - URL: http://otvet.mail.ru/question/80181185 (дата обращения: 20.12.2013).

10. Longman Dictionary of Contemporary English. - URL: http://www.ldoceonline.com/ (дата обращения: 20.12.2013).

11. Merriam-Webster Online. - URL: http://www.merriam-webster.com/ (дата обращения: 20.12.2013).

12. Годман А., Пейн ЕМФ. Толковый словарь английской научной лексики. - М.: Рус. яз., 1989.

13. Aviation Glossary. - URL: http://www.aerofiles.com/glossary.html (дата обращения: 20.12.2013).

14. Шварц В.В. Краткий иллюстрированный русско-английский словарь по машиностроению. - М.: Рус. яз., 1983.

15. Авиационный словарь-справочник [Электронный ресурс]. - URL: http://irjamming.ru/help/uchebnoe_posobie.pdf (дата обращения: 20.12.2013).

Получено 04.03.2014

M.V. Onegov

THE PROBLEM OF THE CONTEXT DEPENDENCE OF SEMANTIC CONTENT OF THE LEXICAL UNITS EXPRESSING MAIN CONCEPTS OF AN AREA OF EXPERTISE

The paper gives effective ways of resolving the problem of the context dependence of lexical units. First of all, they include the search of missing context using provided context items and the confront method. These methods were tested in practice and produced remarkable results in every case.

Keywords: context, polysemy, context semantics, search, confront method.

i Надоели баннеры? Вы всегда можете отключить рекламу.