Научная статья на тему 'Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online'

Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
6912
655
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Концепт
ВАК
Ключевые слова
КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ / ОНЛАЙН-СЛОВАРЬ / ЭЛЕКТРОННЫЙ СЛОВАРЬ / COMPUTATIONAL LEXICOGRAPHY / ELECTRONIC DICTIONARY / ONLINE DICTIONARY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Марус Максим Леонидович

В статье рассматриваются основные параметры многоязычных онлайн-словарей Мультитран и ABBYY Lingvo Online, а также производится их сравнительный анализ, на основе которого формулируются выводы об их области применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Comparative analysis of modern multilingual online dictionaries, evidence from Multitran and ABBYY Lingvo Online dictionaries

This article deals with the main characteristics of Multitran and ABBYY Lingvo Online multilingual online dictionaries, comparative analysis of the said dictionaries is undertaken, and the conclusions concerning their applicability are drawn.

Текст научной работы на тему «Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online»

ART 14511

научно-методический электронный журнал

УДК S1-1B

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14511.htm. -Гос. per. Эл № ФС 77-49965. - ISSN 2304-120Х.

Марус Максим Леонидович,

кандидат филологических наук, доцент кафедры иностранных языков и прикладной лингвистики ФГБОУ ВПО «Омский государственный аграрный университет им. П. А. Столыпина», г. Омск. max marus@rambler.ru

Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online

Аннотация. В статье рассматриваются основные параметры многоязычных онлайн-словарей Мультитран и ABBYY Lingvo Online, а также производится их сравнительный анализ, на основе которого формулируются выводы об их области применения.

Ключевые слова: компьютерная лексикография, электронный словарь, онлайн-словарь.

Раздел: (05) филология; искусствоведение; культурология.

Компьютерная лексикография в настоящее время уверенно становится приоритетным направлением, «задвигая» классическую, «бумажную» лексикографию на второй план. Это и не удивительно, учитывая, насколько прочно вошли в нашу жизнь информационные технологии. При этом, компьютерная лексикография является не просто механической заменой классической лексикографии, а новой ступенью её развития, вводя в обиход совершенно новые понятия, методы и приёмы организации словника. Эта мысль, конечно, тривиальна, но тем более удивительно, что доводится нередко слышать суждения, свидетельствующие о полном непонимании этого. Хотя, вероятно, удивляться здесь нечему, поскольку компьютерная лексикография, как и многие подобные ей инновационные отрасли науки, находятся в самом начале своего развития (причём развития весьма бурного), производя своеобразную революцию в лингвистике и способствуя образованию новой совершенно парадигмы, которая ещё окончательно не сформирована и, следовательно, до конца не осознаётся. Электронные словари часто воспринимаются сквозь призму обычных, бумажных, «по старым правилам». Ключевой момент здесь заключается в том, что старые правила не применимы к новой ситуации в полной мере, эти правила тоже подлежат пересмотру, модернизации. Образно говоря, уравнивать электронный словарь с бумажным - это то же самое, что уравнивать печатную машинку с текстовым редактором Microsoft Word. Их можно рассматривать и сравнивать только в диахронном аспекте, но ни в коем случае не в синхронном.

Из всего вышесказанного можно сделать закономерный вывод, что поскольку компьютерная лексикография является совершенно новой областью прикладной лингвистики, то и нерешённых проблем здесь огромное множество. В числе первых можно отметить проблему классификации электронных словарей, проблему достоверности, содержащейся в них информации, проблему принципов построения как всего словаря в целом, так и отдельных словарных статей, и это только верхушка айсберга. В таких условиях необходимо вырабатывать принципиально новый подход к новым феноменам, изменять, трансформировать имеющиеся критерии, принципы и правила.

В настоящий момент этот процесс уже начинается, хотя, как уже отмечалось, он осложнён многими особенностями периода «перехода» от классической лексикографии к электронной. Тем не менее во многих работах, в особенности в статьях зарубежных коллег, уже намечается этот «принципиально новый подход», который, вероятно, и определит будущую лексикографическую парадигму.

http://e-koncept.ru/2014/14511.htm

ART 14511

научно-методический электронный журнал

УДК S1-1B

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14511.htm. -Гос. per. Эл № ФС 77-49965. - ISSN 2304-120Х.

Отличия этого подхода заключаются как во введении новых понятий, терминов, характеризующих новые феномены, так и в освоении новых приёмов, принципов организации и функционирования электронных словарей. В качестве примеров можно привести понятия гипертекста и гипертекстовой разметки словаря, а также принцип самоадаптации словаря к нуждам конкретного пользователя, которые подробно описывает Дени Арнос Куори в своей работе «Adaptive Hypermedia and User-Oriented Data for Online Dictionaries» [1].

Вместе с тем необходимо изучать уже имеющиеся электронные словари, причём не только для их улучшения (что является, несомненно, основной целью такого исследования), но и для формирования теоретической базы в сфере компьютерной лексикографии. Основой для подобного рода анализа служат классическая лексикографическая теория, модернизированная и приспособленная к новым явлениям лексикографической практики. В данной работе осуществляется анализ онлайн-словарей Мультитран и ABBYY Lingvo Online.

Оба упомянутых словаря являются крупнейшими русскоязычными ресурсами, и в некотором роде конкурентами, к тому же они являются частью коммерческих проектов и имеют свои платные версии.

Для сопоставления выбранных онлайн-словарей используется метод параметрического анализа, предложенный Ю. Н. Карауловым в его работе «Лингвистическое конструирование и тезаурус литературного языка» [2, с. 74-108]. Необходимо отметить, что схема и набор параметров для анализа в работе Ю. Н. Караулова предназначались для исследования идеографических словарей, поэтому в данной работе набор параметров был изменен на более подходящий для анализа онлайн-словарей.

Таким образом, были отобраны следующие параметры.

1. Объём словника. Здесь необходимо уточнить, что объём словника в случае с электронным словарём (и в том числе онлайн-словарём) является неоднозначным показателем, в отличие от традиционных бумажных словарей, по нескольким причинам: во-первых, подавляющее большинство двуязычных электронных словарей имеют сразу два направления перевода, например, англо-русский и русско-английский, а некоторые электронные словари к тому же многоязычные, что даёт ещё большее количество вариантов. Во-вторых, многие электронные словари имеют в своём составе дополнительный терминологический тезаурус, что резко увеличивает объём словника. Например, электронный словарь ABBYY Lingvo x5 «20 языков» включает в себя в общей сложности около 18,3 миллиона словарных статей. Такой объемный электронный словарь более корректно сравнивать не с одним, а с целым набором бумажных словарей. Кроме того, нельзя забывать, что многие онлайн-словари являются «открытыми», то есть они могут пополняться как создателями данного словаря, так и авторизованными пользователями. Таким образом, словник онлайн-словарей постоянно увеличивается, что создаёт дополнительные сложности для его оценки.

2. Количество языковых пар. Оба рассматриваемых словаря служат преимущественно для перевода слов и словосочетаний с иностранного языка на русский, или обратно, однако они имеют и другие направления. В большей мере это развито в ABBYY Lingvo Online, где предоставляется возможность выбора обеих языков из выпадающих списков. В Мультитране имеется только две языковые пары, не включающие в себя русский язык: англо-немецкий и англо-эстонский словари. Впрочем, кажущаяся, на первый взгляд, свобода выбора языков в ABBYY Lingvo Online на деле весьма ограничена: далеко не для всех доступных языковых пар имеются словари, например, можно выбрать для работы испанский и татарский языки, но словари для такого направления отсутствуют. В

пи 'Л пи

http://e-koncept.ru/2014/14511.htm

ART 14511

научно-методический электронный журнал

УДК S1-1B

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14511.htm. -Гос. per. Эл № ФС 77-49965. - ISSN 2304-120Х.

данном словаре языковые пары так же, как и в Мультитране, строятся преимущественно между русским и одним из иностранных языков. Имеется также несколько языковых пар английского и некоторых других иностранных языков, но в целом направления перевода с одного иностранного языка на другой весьма ограничены. Здесь необходимо отметить, что англо-русское (и соответственно русско-английское) направление является приоритетным как в Мультитране, так и в ABBYY Lingvo Online. Несмотря на многоязычность данных словарей, почти половина словника в Мультитране и приблизительно треть словника в ABBYY Lingvo Online приходится на английские и русские словари.

3. Наличие и количество специализированных словарей. В принципе, такие словари присутствуют в виде дополнений практически в любом крупном электронном словаре, и данные онлайн-словари не являются исключением. Здесь несколько разнится только способ представления статей специализированных словарей при выводе результатов запроса: в ABBYY Lingvo Online они представлены в виде набора отдельных карточек, каждая из которых имеет собственную структуру, пронумерованные варианты значений и словосочетания, тогда как в Мультитране та же самая информация представлена в виде одной большой статьи, где данные тематических словарей перечисляются в разных строках, обозначенных соответствующими пометами, а словосочетания приведены в самом конце такой статьи. Это несколько затрудняет оценку, поскольку многие из таких «тематических словарей» включают в себя буквально 2-3 слова, поэтому при анализе учитывались словари, состоящие, как минимум, из 100 словарных статей. Впрочем, и таких словарей в Мультитране насчитывается приблизительно 2500 по причине значительного тематического дробления словника. Например, если в состав ABBYY Lingvo Online входит словарь медицинской терминологии, то в Мультитране ему соответствуют тематические словари по хирургии, офтальмологии, ортопедии и т.п. Таким образом, ABBYY Lingvo Online располагает гораздо меньшим количеством специальных словарей, однако каждый из них весьма значительного объёма, в то время как Мультитран состоит из большого количества узкоспециализированных тематических словарей, содержащих весьма небольшой объём лексики.

4. Наличие и характер гиперссылок. Некоторые электронные словари, являющиеся простым аналогом бумажных словарей, но реализованным в электронном виде не имеют гиперссылок в словарных статьях, однако в настоящий момент такое встречается уже довольно редко. Подобная практика существовала на раннем этапе развития электронных словарей, однако сейчас ни один электронный словарь уже не обходится без гипертекста. Разница преимущественно заключается в том, насколько этот гипертекст развит и для каких целей используется. Чаще всего гиперссылки используются для перехода от одного слова из данной словарной статьи к статье, где это слово будет заглавным. Такой подход используется, например, в словаре Мультитран, где гиперссылки ведут к переводу данного слова, то есть открывают словарную статью на другом языке. В словаре ABBYY Lingvo Online гиперссылки имеют другую функцию: они помогают выводить список примеров употребления данного слова.

5. Наличие мультимедийной информации в словарных статьях. Возможности электронных словарей позволяют приводить иллюстративный материал в абсолютно новой форме, по сравнению с классическими бумажными словарями. В словарных статьях может быть использована мультимедийная информация, то есть аудио-и видеофайлы. В онлайн-словарях используется аудиоинформация для представления произношения слов. В исследуемых словарях такая функция имеется только у ABBYY Lingvo Online, с помощью которого пользователь может прослушать произ-

http://e-koncept.ru/2014/14511.htm

ART 14511

научно-методический электронный журнал

УДК S1-13

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14511.htm. -Гос. per. Эл № ФС 77-49965. - ISSN 2304-120Х.

ношения 76000 слов и словосочетаний в словарях английского, немецкого, французского, итальянского, испанского, китайского и украинского языков.

6. Наличие примеров употребления слов. Многие современные электронные словари предоставляют пользователю примеры употребления запрашиваемых слов, что позволяет наиболее полно представить смысловое содержание слова. В случае с онлайн-словарями это представляет особую ценность, поскольку базы примеров постоянно пополняются. В рассматриваемых словарях данная функция реализована по-разному. В словаре Мультитран примеры даются в самом конце общей словарной статьи, причём они рассортированы по тематикам. В словаре ABBYY Lingvo Online примеры употребления слов доступны через гиперссылки при щелчке мышью на требуемое слово.

7. Возможность расширения словаря пользователями. Данная функция является весьма ценной и представляет собой настоящий прорыв в лексикографии. Словарь, постоянно пополняемый достаточно большим количеством людей, среди которых не только лингвисты, но и специалисты в других областях знания, несомненно, будет гораздо более полно отвечать запросам пользователей. Впрочем, здесь есть и определённые недостатки. Во-первых, информация, добавляемая людьми «со стороны», не являющимися профессиональными лексикографами, может быть не точной или вообще не верной. Здесь, безусловно, необходим строгий контроль со стороны составителей данного словаря. Во-вторых, информация, вносимая разными пользователями, подчас не унифицирована и нередко вносит чрезмерное многообразие. Пользователю предоставляется множество сходных вариантов перевода какого-либо слова без всякого пояснения, что крайне затрудняет выбор наиболее подходящего эквивалента.

8. Наличие интеллектуального ввода и проверки орфографии. Данная функция появилась в онлайн-словарях относительно недавно, но в настоящий момент она является весьма востребованной, поскольку значительно облегчает работу пользователя со словарём. На данном этапе эти функции во многих онлайн-словарях всё ещё далеки от идеала. Такая проблема существует не только в отечественной компьютерной лексикографии, но и в зарубежной, где внедрение систем интеллектуального ввода в онлайн-словари началось раньше, о чём пишут в своей работе «Online English Learners’ Dictionaries and Misspellings: One Year On» Роберт Лью и Роджер Миттон [3]. Интеллектуальный ввод, то есть подстановка вариантов слова при его наборе является весьма мощным инструментом, упрощающим работу пользователя со словарём и ускоряющим процесс перевода. Сопряжение данной функции с подбором возможных вариантов при орфографической ошибке в наборе слова также весьма важно, поскольку пользователь далеко не всегда уверен в том, как пишется то или иное слово на чужом для него языке. В исследуемых онлайн-словарях такое сопряжение полностью реализовано только в Мультитране, поскольку в ABBYY Lingvo Online отсутствует интеллектуальный ввод текста, и это весьма удивительно, учитывая, что в компьютерных словарях ABBYY Lingvo такая функция присутствует с самых ранних версий.

В соответствии с вышеперечисленными параметрами была построена матрица параметрического анализа словарей Мультитран и ABBYY Lingvo Online, наглядно представленная в табл. 1. К сожалению, как уже указывалось при подробном описании параметров, некоторые данные могут быть представлены только приблизительно. Причиной этого является прежде всего тот факт, что онлайн-словарь - это открытая система с огромным количеством элементов, находящаяся в постоянном развитии. Кроме этого, при создании разных онлайн-словарей применяются довольно разнящиеся методики, что ведёт к сложностям в сопоставлении сходных элементов. Примером этого могут служить тематические словари в каждом из рассматриваемых онлайн-словарей.

гм yj nj

http://e-koncept.ru/2014/14511.htm

КОНТ ТРПТ

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4

наичмо-методический~электоонньш. жионал п' л' “ URL: http://e-koncept.ru/2014/14511.htm. научно метооическии электронный журнал ^. per. Эл № ФС 77-49965. - ISSN 2304-120X.

ART 14511 УДК S1-13 р

Таблица 1

Результаты параметрического анализа онлайн-словарей Мультитран и ABBYY Lingvo Online

Параметр Словари

Мультитран ABBYY Lingvo Online

1. Объём словника Приблизительно 12 млн. слов Приблизительно 18 млн. слов

2. Количество языковых пар 13 языковых пар Рабочие языки: русский, английский, немецкий, французский, испанский, итальянский, нидерландский, латышский, эстонский, африкаанс, эсперанто, калмыцкий 28 языковых пар Рабочие языки: английский, венгерский, греческий, датский, испанский, итальянский,казахский, китайский, латинский, немецкий, нидерландский, норвежский, польский, португальский, русский, татарский, турецкий, украинский, французский, финский

3. Наличие и количество специализированных словарей Приблизительно 2500 словарей 217 словарей

4. Наличие и характер гиперссылок Гиперссылки используются для перехода между словарными статьями противоположного направления перевода Гиперссылки используются для перехода к примерам словоупотребления

5. Наличие мультимедийной информации в словарных статьях Часть заглавных слов озвучена

6. Наличие примеров употребления слов Даны в словарной статье отдельным блоком с тематическим разбиением Выдаются во всплывающем окне при нажатии на гиперссылку

7. Возможность расширения словаря пользователями + +

8. Наличие интеллектуального ввода и проверки орфографии. Имеется интеллектуальный ввод и подбор вариантов при орфографической ошибке Отсутствует интеллектуальный ввод, имеется подбор вариантов при орфографической ошибке

Из результатов сравнительного анализа видно, что ABBYY Lingvo Online обладает более солидной словарной базой и превосходит Мультитран по количеству рабочих языков и языковых пар. Другими преимуществами данного словаря являются наличие озвученных заглавных слов в некоторых словарных статьях, более простой доступ к примерам словоупотребления для конкретного слова. Учитывая также тот факт, что результаты перевода слова раскладываются в виде набора словарных статей из нескольких словарей, в виде, весьма напоминающем классический бумажный словарь, можно предположить, что данный словарь рассчитан на самый широкий круг пользователей и может быть успешно использован как для профессионального перевода иноязычных текстов, так и при обучении иностранному языку, чтении и написании иноязычных текстов.

Словарь Мультитран располагает интеллектуальным вводом текста, имеет более детальное тематическое членение словника, обеспечивает более быстрый переход между рабочими языками и при таких характеристиках удобен в большей мере для профессионального перевода текстов различной тематики.

http://e-koncept.ru/2014/14511.htm

ART 14511

научно-методический электронный журнал

УДК S1-13

Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Концепт. - 2014. - Спецвыпуск № 01. - ART 14511. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14511.htm. -Гос. per. Эл № ФС 77-49965. - ISSN 2304-120Х.

Ссылки на источники

1. Kwary D. A. Adaptive Hypermedia and User-Oriented Data for Online Dictionaries: A Case Study on an English Dictionary of Finance for Indonesian Students // International Journal of Lexicography. - 2012. -Vol. 25. - Issue 1 (March). - URL: http://ijl.oxfordjournals.org/content/25/1/30.full. - [Дата обращения 26.10.2013].

2. Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка. - М.: Наука, 1981. - 368 с.

3. Lew R., Mitton R. Online English Learners’ Dictionaries and Misspellings: One Year On // International

Journal of Lexicography. - 2013. - Vol. 26. - Issue 2 (June). - URL:

http://ijl.oxfordjournals.org/content/26/2/219.full. - [Дата обращения 28.10.2013].

Maxim Marus, issn 2304-120X

candidate of Philological Sciences, Associate Professor at the chair of foreign languages and applied linguistics, Omsk State Agrarian University named after P. A. Stolypin, Omsk

Comparative analysis of modern multilingual online dictionaries, evidence from Multitran and ABBYY Lingvo Online dictionaries

9772304120142

Abstract. This article deals with the main characteristics of Multitran and ABBYY

Lingvo Online multilingual online dictionaries, comparative analysis of the said dictionaries is undertaken, and the conclusions concerning their applicability are drawn.

Key words: computational lexicography, electronic dictionary, online dictionary.

References: 1, 3 - English Sources; 2 - Russian Source.

Рекомендовано к публикации:

Горевым П. М., кандидатом педагогических наук, главным редактором журнала «Концепт»

977230412014213

http://e-koncept.ru/2014/14511.htm

i Надоели баннеры? Вы всегда можете отключить рекламу.