Научная статья на тему 'Резервы повышения эффективности обработки лексической информации в электронных словарях'

Резервы повышения эффективности обработки лексической информации в электронных словарях Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
229
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОННЫЙ СЛОВАРЬ / ELECTRONIC DICTIONARY / МУЛЬТИМЕДИЙНЫЕ ЭЛЕМЕНТЫ / MULTIMEDIA ELEMENTS / БУМАЖНЫЙ СЛОВАРЬ / PAPER DICTIONARY / ОН-ЛАЙН СЛОВАРЬ / ON-LINE DICTIONARY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Чумарина Гузель Раисовна

Для обучения языкам, а также для консультации слов в словаре, в современной лексикографии существует особый вид словаря электронный словарь. Для интенсивного изучения языков инфокоммуникационные технологии являются значительной поддержкой, позитивно влияющие на разные типы языковой работы. Интерфейс электронного словаря, а также глобальные позитивные характеристики современных электронных словарей благотворно влияют на эстетическую перцепцию лексики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESERVES OF EFFICIENCY INCREASE OF LEXICAL INFORMATION PROCESSING IN ELECTRONIC DICTIONARIES

In contemporary lexicography there is a special type of a dictionary, it is an electronic dictionary used both for teaching languages and consulting words. For an intense language learning, info communication technologies are an important support affecting positively on different types of language work. The interface of an electronic dictionary as well as global positive characteristics of modern electronic dictionaries affect well of esthetic perception of lexicon.

Текст научной работы на тему «Резервы повышения эффективности обработки лексической информации в электронных словарях»

гуманитарное направление

Н.В. Стоева

ИСТОРИЧЕСКИЙ ФОН И ПЕРЕДАЧА ОНОМАСТИЧЕСКИХ РЕАЛИЙ ...

чувства или постараться передать общее в частном - в одном кратком разговоре. Я пишу только о деталях, но стараюсь говорить о деталях детально». Действие романа хронологически укладывается в три дня. И, наверное, Хемингуэй не только пытался реализовать свой принцип: показывать общее через отдельное, когда вместил такое огромное моральное содержание в столь незначительный боевой эпизод. Этот роман не о войне - её он насмотрелся, и считал, что «война - это зло. Но иногда необходимо сражаться». Это книга о жизни, о тех моментах невыразимого, когда перехватывает дыхание, и слова застревают в горле, о человеческом достоинстве и о праве работать и не голодать, о людях, которые становятся ближе, чем родные, там, где-то далеко, и о том, как нелепо и просто умирать за то, чтобы те, другие, жили.

СПИСОК ЛИТЕРАТУРЫ

1. Хэмингуэй, Эрнест. По ком звонит колокол. Пер. Волжиной М., Калашниковой Е., М. Гудьял Пресс, 1999

2. Хэмингуэй, Эрнест. По ком звонит колокол. Пер.

Волжиной М.и др. Воронеж, Центр.Чернозем. кн. изд-во, 1987

3. Собрание сочинений в 4-х томах под общей ред. Е Калашниковой, М., Худ. лит-ра, 1968. Пер.Волжиной М., Калашниковой Е.

4. Хэмингуэй, Эрнест. По ком звонит колокол. Праздник, который всегда с тобой. Библиотека зарубежной классики. Издательство «Правда», 1988.

5. Хэмингуэй, Эрнест. По ком звонит колокол. М. Прогресс, 1980

6. Ernest Hemingway. For whom the bell tolls. М. Прогресс, 1981.

7. Грибанов Борис Тимофеевич. Эрнест Хемингуэй: герой и время. М. Худож. лит-ра, 1980

8. Реформатский А.А. Введение в языковедение

9. Виноградов В.С.. Перевод. Общие и лексические вопросы.

10. Стоева Н.В. Историческая подоплека и лексико-стилистические особенности романа хемингуэя «По ком звонит колокол» // Балтийский гуманитарный журнал. 2013. № 4. С. 107-110.

HISTORICAL BACKGROUND AND RENDERING ONOMASTIC REALIA IN VARIOUS TRANSLATIONS OF THE NOVEL «FOR WHOM THE BELL TOLLS» BY ERNEST HEMINGWAY

© 2014

N.V. Stoeva, assistant of the chair of the English language and translation

Institute of Economics, Management and Law, Kazan (Russia)

Annotation: Showing up all the characters of the novels in full requires comprehension of the implied sense the essential part of which appears to be conversational aspect. To render the uniqueness of a language in the authentic text original at translating is a primary objective of a special hardness. It is put into practice owing to not so much the patterns of background information rendering as conveying the author's perception of environment. A part of alien words serves rather for creating and perceiving of the stereotyped images of the nation's core essence than for rendering national peculiarity of a country or region. This is the reason why in the novel the characters' speaking characterizes them in a greater degree than their actions.

Keywords: translating, rendering, national peculiarity of a country, World War II, dramatic perception of environment, background information, onomastic realia.

УДК 81

РЕЗЕРВЫ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ОБРАБОТКИ ЛЕКСИЧЕСКОЙ ИНФОРМАЦИИ В ЭЛЕКТРОННЫХ СЛОВАРЯХ.

© 2014

Г.Р. Чумарина, кандидат филологических наук, доцент кафедры иностранных языков и перевода

Институт экономики, управления и права, Казань (Россия)

Аннотация: Для обучения языкам, а также для консультации слов в словаре, в современной лексикографии существует особый вид словаря - электронный словарь. Для интенсивного изучения языков инфокоммуникаци-онные технологии являются значительной поддержкой, позитивно влияющие на разные типы языковой работы. Интерфейс электронного словаря, а также глобальные позитивные характеристики современных электронных словарей благотворно влияют на эстетическую перцепцию лексики.

Ключевые слова: электронный словарь, мультимедийные элементы, бумажный словарь, он-лайн словарь.

Достижения научно-технического прогресса направлены на расширение человеческих возможностей в различных сферах деятельности. Стремительное развитие современной жизни напрямую отражается в языке — возникают новые слова, термины и выражения, меняется смысл старых слов. Словари имеют разные задачи, из чего и выходит их разделение на типы. Например:

На смену традиционным "бумажным" словарям приходят словари электронные — компьютерные программы на компакт-дисках, позволяющие справиться с иностранным текстом или перевести на чужой язык необходимую информацию. Берём, к примеру, словарь abby lingvo x3. Данный электронный словарь содержит в себе «книжную полку» на которой размещаются не только переводные словари, но энциклопедические и толковые. При включении всех словарей lingvo по слову «ворона» мы имеем следующий результат:

Перевод на английский язык с учётом смысловой неоднозначности:

1) (птица) crow [-эи]

2) (ротозей) gawk, gaper, loafer •• ворона в павлиньих перьях — ~ jackdaw in peacock's feathers ворон считать — gape белая ворона — odd type; square peg in a round hole пуганая ворона куста боится — ~ a burnt child dreads the fire.

Резервом повышения эффективности общественного производства является автоматизация интеллектуальных процессов деятельности, заключающихся главным образом в создании, распространении и использовании разнообразной информации. Это, несомненно, относит-

Г.Р. Чумарина гуманитарное

РЕЗЕРВЫ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ОБРАБОТКИ ЛЕКСИЧЕСКОЙ ... направление

ся и к гуманитарной науке. Изучение опыта автоматизации процедур обработки информации показывает, что в настоящее время необходимо создание специальных технологий, позволяющих оптимальным образом использовать предоставляемые компьютером возможности в области татарской лексикографии и лексикологии. Современный уровень информатизации предоставляет важное преимущество - гипертекстуальный доступ. Словарь может быть связан с другими информатизиро-ванными словарями, с базами данных, которые послужили основой для его составления. Структура электронного словаря должна удовлетворять многим условиям, так как этот тип словаря предназначен только для пользователя компьютера. Лексическая база данных, которую он включает в себя, должна быть абсолютно формализованной. Поэтому эффективное решение проблемы осуществимо на стыке двух научных дисциплин: лексикографии, имеющей большие традиции, и информативной лингвистики, которая является относительно молодой областью науки. Развитие любой науки происходит в тесном взаимодействии теории и практики. Теоретические достижения лексикографии приводят к рождению нового словаря, дальнейшая жизнь которого позволяет, в свою очередь, проверить и уточнить теорию.

В настоящее время проблема лексикографической презентации метаязыковых единиц признается «одной из важнейших как в теоретическом, так и в практическом плане» [Гак, 1990: 462]. Электронный словарь рассматривается специалистами как «важный шаг на пути нормализации и унификации языка..., как основное средство систематизации» [Герд, 1996: 288]. Задачи внедрения национальных языков в информационные технологии актуальны практически для всех языков народов Российской Федерации, в том числе для тех языков, которые представлены в Республике Татарстан [Аюпов, 2006: 36-39].

Достигнув определенного уровня развития, научное знание стремится к более компрессированным формам, к переходу на более удобный тип научной информации [В1аш, 1997: 35-38].

Структура электронного словаря должна удовлетворять многим условиям. Так как этот тип словаря предназначен только для пользователя компьютеров, лексическая база данных, которую он включает в себя, должна быть абсолютно формальной. Лексические свойства, которые определяют каждый из входов, должны быть максимально ясными и доступными для автоматического распознавания любого письменного текста. Это приводит к тому, что сходство базы данных должно быть максимально исчерпывающим для идентификации не только слов, которые уже занесены в список, но также для слов, не включенных в словарные работы или для новых слов, о значении которых можно догадаться по конструкции. По мнению В.В.Дубчинского, основной задачей при формировании словарной статьи является устранение неопределенности относительно значения слова [Дубчинский, 1998: 35]. Проблема семантизации лексем в словарях вообще, и в татарских словарях, в частности, до сих пор не решена. В.Д.Табанакова отмечает, что существует два варианта понимания семанти-зации. В более широком смысле, речь идет об осмыслении обнаружении смысла. В более узком смысле - понимается совокупность способов раскрытия значения [Табанакова, 1997: 177].

Встает вопрос об отношениях, которые можно установить между составом лексической единицы и электронными словарями. Очевидно, что, с одной стороны, даже если разберем все словари, энциклопедии, глоссарии, тезаурусы и бесчисленные технические словари, будь то бумажные или электронные, этого было бы не достаточно. Состав лексической единицы языка, с другой стороны, является важным рычагом для ее узнавания и распространения, а представление лексического 42

богатства данного языка как можно полнее не может ограничиться анализом процесса образования лексической единицы с целью ее интеграции в систему.

Нужно напомнить, что общие словари и энциклопедии имеют неизбежные, объективные по характеру пробелы и упущения. Компиляция лексических входов этих работ, по данным прикладной статистики в лексикоме-трии или квантитативной лексикологии, более всего отвечает критериям частоты, чем наличию и возможности использования, и нескольких тысяч слов, которые они содержат, вполне достаточно, чтобы обеспечить потребности пользователей. Также известно, что возможности разработки словарей в настоящее время очень сильно зависят от социально-экономических противоречий, накладываемых на бумажную работу, документальные, редакционные и издательские проблемы, которые появляются в издательствах. Уважая концепции нормы, отклоняются слова, которые считаются оскорбительными, а также устаревшие слова, специфические технические термины и т.д. С момента появления словарей наш менталитет изменился, и считаем сейчас словари или энциклопедии единственным авторитетным источником слов, которые действительно относятся к литературному языку, вследствии чего «словарь устраняет расхождение между индивидуальным знанием и знанием всего коллектива» [Гак 1977: 12].

Электронный словарь является сам по себе пропозицией, которая предполагает огромные трудности не столько в определении необходимых инструментов для структуры такого словаря, сколько его реализация должна учитывать прогресс в лингвистической информатике. Нужно отдавать отчет в том, что недостаточно известно о репрезентации особенностей лексики, и что лексические исследования общего характера в области компьютерной обработки слов редки, часто фрагментарны и выборочны. Актуальные тенденции работ направлены на большую интеграцию технической информатики с исследованиями недостатков в лексикографии, и вносят вклад в улучшение формальной обработки лексики.

Идеи о концепции и структуре электронных словарей, вероятно, повлекут за собой совершенствование методов лексикографии, главные продукты которых - словари, предназначенные широкой публике, должны быть усовершенствованы в плане когерентности. Взаимовыгодное изучение принципов анализа, свойственных лексикологии должны идти одновременно с изучением механизмов описания, что позволит лучше интегрировать свойства лексики. Классические словари уже начали пользоваться этими инновациями: можно посмотреть вербальные входы современного Татарско-русского словаря, который составлен исследователями в эксплицитной манере релевантных оригинальных и частично формализуемых свойств.

Благодаря феномену создания лексики, который становиться все более и более важным в настоящее время, электронные словари проложат путь словарям для широкой публики с целью лучшего обеспечения великолепными инструментами для создания новых слов, которыми располагает татарский язык. Можно предположить, что в любых словарях, будь то общие или специализированные, пользователь сможет самостоятельно заполнить парадигму, исходя из одного элемента серии, когда речь идет об аффиксации. Элементы более лекси-кализованные могут иногда находиться в особом положении в парадигме (как в случае с аффиксальными лексемами), например, матурлык, урынсыз и т.п. или могут быть представлены внутри одного входа (как составные слова), например: тамчы гвл, тавык Yлэне и т.п. По мнению К.Р.Галиуллина, одно из основных направлений в информатизации татарской лингвистики - создание машинного (компьютерного) фонда татарского языка [Галиуллин, 1992: 131-133]. Информатизированная версия словаря для широкой публики будет менее зависима от экономических проблем, чем бумажная версия и смо-Карельский научный журнал. 2014. № 1

гуманитарное направление

Г.Р. Чумарина

РЕЗЕРВЫ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ОБРАБОТКИ ЛЕКСИЧЕСКОЙ ...

жет интегрировать сполна новые формы, то есть виртуальные формы. Внедрение Машиного фонда татарского языка в сеть Интернет дало бы ощутимый толчок для дальнейших разработок в области электронной лексикографии, развитию электронных образовательных технологий и обеспечению программными средствами поддержки обучению татарскому языку [Аюпов, 2006: 36-39]. На основе использования возможностей языка идут непрерывные процессы создания новых слов, но их появление остается неисследованным с точки зрения компьютерной лексикографии. Если неологизмы появляются обособленно в нашем субъективном понимании расширения письменного татарского языка, их присутствие в тексте, предоставленном для автоматического анализа, проявляет абсолютную необходимость в средствах, чтобы распознать их в тех же аспектах, что и другие «обычные» слова лексики. Эти процессы, которые способствуют обогащению языка, не всегда релевантны, когда речь идет о структуре электронного словаря. Некоторые явления, описанные Дюшес и Леге (1985 и 1988) или Гесбуа (1986), такие как дистантное расположение или перестановка слов (или букв в слове), замена слов, взятых из другого текста или произведенных по какому-то расчету, и другие противопоставления, замены могут привести к противоречиям в фонетическом и синтаксическом порядке. Таким образом, все нетипичные случаи использования средств языка любого уровня непосредственно отражаются на функциональных возможностях электронного словаря. Если обратить более пристальное внимание на новообразования, вызывающие сложности при машинном распознавании, можно выделить два источника, которые обеспечивают сконструированными лексическими единицами. В первую группу можно включить все лексемы, характер которых точный или не перманентный, относящиеся к неологизмам речи или неязыковым неологизмам. Анаграммы (клоун с осенью в сердце - о Л.Янгибарове), жаргонизмы или слова-сэндвичи (конструкции с инфиксом) являются таковыми; эти образования менее интересны, чем те, которые могут иметь более постоянный характер. Во втором классе, арго и жаргон благоприятствуют рождению новых слов, которые становятся предметом словарей все чаще, и которые свидетельствуют об определенной сильной манере создания лексической единицы и ее распространения. Такие лексемы как сбетонировать: упасть, покалечиться и др., которые являются частью этого класса, также очень разнообразны.

Итак, идеи о концепции и структуре электронных словарей, вероятно, повлекут за собой совершенствова-

ние методов лексикографии, главные продукты которых - словари, предназначенные широкой публике, должны быть усовершенствованы в плане когерентности. Взаимовыгодное изучение принципов анализа, свойственных лексикологии должны идти одновременно с изучением механизмов описания, что позволит лучше интегрировать свойства лексики. Классические словари уже начали пользоваться этими инновациями: можно посмотреть вербальные входы современного Татарско-русского словаря Lingvo, который составлен исследователями в эксплицитной манере релевантных оригинальных и частично формализуемых свойств.

СПИСОК ЛИТЕРАТУРЫ

1. Мультилекс [Электронный ресурс]. URL: www. medialingua.ru

2. ABBYY Lingvo 14. Многоязычная версия. Электронный словарь,2009

3. World Wide Words [Электронный ресурс]. URL: http://www.worldwidewords.org/

4. Герд А.С. Информационно-поисковый тезаурус как объект лексикографии / А.С. Герд, В.В. Богданов и др. // Структурная и прикладная лингвистика. Л.: ЛГУ, 1978. - Вып.1. - С. 160-171.

5. Герд А.С. К определению понятия «словарь»/ А.С. Герд // Проблемы лексикографии. СПб., 1997. - С. 191-203.

6. Герд А.С. Метаязык современной лексикографии / А.С. Герд// Вестн. Воронеж. Гос. Ун-та, сер. Гуманитарные науки. Воронеж, 2004. - №2. - С. 33-40.

7. Селегей В. Электронные словари и компьютерная лексикография [Электронный ресурс]. URL: http://www. lingvoda.ru/transforum/articles/pdf/selegey_a1.pdf

8. Труды казанской школы по компьютерной и когнитивной лингвистике TEL- 2005. Казань: изд-во Каз. гос.ун-та, 2006. - Вып.9. - 216 с.

9. Дубчинский В.В. Теоретическая и практическая лексикография. Wien, Charkow, 1998. - С. 20-50.

10. Гак, В. Г. О некоторых закономерностях развития лексикографии (учебная и общая лексикография в историческом аспекте) Текст. / В. Г. Гак // Актуальные проблемы учебной лексикографии: Сб. статей. - М.: Русский язык, 1977. - С. 11-27.

11. Табанакова В.Д. Средства семантизации слова и слова-термина в словаре / В.Д.Табанакова // Терминоведение. М.: Московский лицей, 1997. - Вып. 1-3. - С. 177-178.

12. Blain R. Le Petit Robert sur cederom / R.Blain, J.-F. Mostert // Q^bec frarcais. 1997. n 105. - P. 35-38.

RESERVES OF EFFICIENCY INCREASE OF LEXICAL INFORMATION PROCESSING

IN ELECTRONIC DICTIONARIES

© 2014

G.R. Chumarina, candidate of philological sciences, associate professor of the chair «Foreign languages and translation»

Institute of Economics, Management and Law, Kazan (Russia)

Annotation: In contemporary lexicography there is a special type of a dictionary, it is an electronic dictionary used both for teaching languages and consulting words. For an intense language learning, info communication technologies are an important support affecting positively on different types of language work. The interface of an electronic dictionary as well as global positive characteristics of modern electronic dictionaries affect well of esthetic perception of lexicon.

Keywords: Electronic dictionary, multimedia elements, paper dictionary, on-line dictionary.

i Надоели баннеры? Вы всегда можете отключить рекламу.