Научная статья на тему 'Специфика использования корейского языка в системах машинного перевода'

Специфика использования корейского языка в системах машинного перевода Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
392
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинный перевод / программы машинного перевода / Интернет / онлайн-переводчики / компьютерная лингвистика / восточные языки / корейский язык / machine translation / machine translation programs / Internet / online translators / computer linguistics / oriental languages / Korean language

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — И А. Постоенко

Статья рассматривает машинный перевод с позиции его истории, развития и применения. Машинный перевод анализируется как процесс перевода некоторого текста с одного естественного языка на другой, реализуемый компьютером полностью или почти полностью. Автор анализирует проблемы машинного перевода с использованием восточных языков, исходя из их лексической и грамматической структуры, а также особенностей письменности. На материале корейского языка показаны достоинства и недостатки использования наиболее популярных систем машинного перевода. Проанализирован перевод текста публицистического жанра с корейского языка на английский и русский языки системами машинного перевода Google Translate и PROMT Translation Office, а также подробно рассмотрен алгоритм процесса перевода текста в системе NAVER, которая является сегодня наиболее профессиональным инструментом для перевода с корейского языка и наоборот. Показана актуальность автоматизированных средств переработки информации в современном мире.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — И А. Постоенко

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SPECIFICITY OF THE USE OF THE KOREAN LANGUAGE IN MACHINE TRANSLATION SYSTEMS

The article considers machine translation from the perspective of its history, development and application. Machine translation is analyzed as a process of translating some text from one natural language to another, implemented by a computer completely or almost completely. The author analyzes problems of machine translation using oriental languages based on their lexical and grammatical structure, as well as the features of writing. The material of the Korean language shows the advantages and disadvantages of using the most popular machine translation systems. The article analyzes the translation of journalistic text from Korean into English and Russian by Google Translate and PROMT Translation Office machine translation systems, as well as a detailed analysis of the text translation algorithm in the NAVER system, which is today the most professional tool for translating from Korean and vice versa. The relevance of automated information processing tools in the modern world is shown.

Текст научной работы на тему «Специфика использования корейского языка в системах машинного перевода»

промышленный, торговый и культурный центр. Второе значение, зафиксированное в толковых словарях русского и китайского языков, населенное место, огороженное и укрепленное стеной; крепость. В толковых словарях русского языка семантический объем расширяется за счет включения значения: центральная часть этого населенного пункта в отличие от окраин и пригородов. Отличительными особенностями китайского города являются высокая плотность населения и наличие рынка (торговой улицы). Также у лексемы город в китайском языке выделяется национально-специфическое значение принадлежащий к китайской системе мер и весов. Сопоставление понятийной составляющей лексемы деревня в русском и китайском языках, по данным толковых словарей, позволяет сделать вывод о некоторой идентичности рассматриваемой лексемы. В толковых словарях русского и китайского языков у лексемы деревня зафиксирован антропоморфный перенос (сельское население, крестьяне) и выделяется

Библиографический список

переносное значение с негативной оценкой (ср.: о простоватом глупом человеке; вульгарный человек). Однако можно выделить несколько национально-специфических особенностей: в русском языке деревня - крестьянское селенье, в котором нет церкви, что объясняется принадлежностью русской культуры к православию; в китайском языке для деревни характерны специфические природные ландшафты и социально-экономические условия. Показательно, что в русских и китайских толковых словарях зафиксировано значение, в котором выявляется противопоставление города и деревни, что позволяет говорить о наличии в русской и китайской лингвокультурах оппозиции городской и сельской местности. Соответственно, семантический потенциал лексем город и деревня в русском и китайском языках отличается несимметричностью, что объясняется историческими, культурными, религиозными и другими особенностями России и Китая.

1. Воробьев В.В. Лингвокультурология (теория и методы). Москва, РУДН, 1997.

2. Кузнецова А.В., Петрулевич И.А. Концепт города: код культуры и нарратив. Вестник АГУ. 2018; Выпуск 4 (229): 212 - 210.

3. Бурмистрова Т.А. Ассоциативно-вербальный потенциал лексемы деревня: лексикографическая кодификация и текстовые реализации. Ученые записки Орловского государственного университета. 2014; № 5 (61): 192 - 195.

4. Словарь современного русского литературного языка: в 20 т. Москва: Русский язык, 1991 - 1996.

5. Ожегов С.И., Шведова Н.Ю. Толковый словарь русского языка: 8О ООО слов и фразеологических выражений. Российская академия наук. Институт русского языка имени В.В. Виноградова. Москва: ООО «А ТЕМП», 2007.

6. Даль В.И. Толковый словарь живого великорусского языка: в 4 т. Москва: РИПОЛ классик, 2006.

7. Словарь китайского языка. Пекин: Шану, 2005.

8. Словарь Синьхуа. Главный редактор Хань Цзоли. Пекин: Издательство «Commercial Press», 2013.

9. Малявин В.В. Китайская цивилизация. Москва: «Издательство Апрель», ООО «Издательство АСТ», Издательско-продюсерский центр «Дизайн. Информация. Картография», 2000.

10. Даль В.И. Пословицы русского народа. Москва: ННН ЭКСМО-Пресс, 2002.

11. Словарь китайских пословиц. Под редакцией Чжоу Цзинци. Пекин: Шану, 2006.

12. Словарь современных китайских пословиц. Под редакцией Вэнь Дуаньчжэн. Шанхай: Цишу, 2009.

13. Котов А.В. Новый китайско-русский словарь. Москва: Русский язык-Медиа, 2007.

References

1. Vorob'ev V.V. Lingvokul'turologiya (teoriya i metody). Moskva, RUDN, 1997.

2. Kuznecova A.V., Petrulevich I.A. Koncept goroda: kod kul'tury i narrativ. VestnikAGU. 2018; Vypusk 4 (229): 212 - 210.

3. Burmistrova T.A. Associativno-verbal'nyj potencial leksemy derevnya: leksikograficheskaya kodifikaciya i tekstovye realizacii. Uchenye zapiski Orlovskogo gosudarstvennogo universiteta. 2014; № 5 (61): 192 - 195.

4. Slovar' sovremennogo russkogo literaturnogo yazyka: v 20 t. Moskva: Russkij yazyk, 1991 - 1996.

5. Ozhegov S.I., Shvedova N.Yu. Tolkovyj slovar' russkogo yazyka: 8О ООО slov i frazeologicheskih vyrazhenij. Rossijskaya akademiya nauk. Institut russkogo yazyka imeni V.V. Vinogradova. Moskva: OOO «ATEMP», 2007.

6. Dal' V.I. Tolkovyj slovar'zhivogo velikorusskogo yazyka: v 4 t. Moskva: RIPOL klassik, 2006.

7. Slovar' kitajskogo yazyka. Pekin: Shanu, 2005.

8. Slovar' Sin'hua. Glavnyj redaktor Han' Czoli. Pekin: Izdatel'stvo «Commercial Press», 2013.

9. Malyavin V.V. Kitajskaya civilizaciya. Moskva: «Izdatel'stvo Aprel'», OOO «Izdatel'stvo AST», Izdatel'sko-prodyuserskij centr «Dizajn. Informaciya. Kartografiya», 2000.

10. Dal' V.I. Poslovicyrusskogo naroda. Moskva: NNN 'EKSMO-Press, 2002.

11. Slovar' kitajskih poslovic. Pod redakciej Chzhou Czinci. Pekin: Shanu, 2006.

12. Slovar'sovremennyh kitajskih poslovic. Pod redakciej V'en' Duan'chzh'en. Shanhaj: Cishu, 2009.

13. Kotov A.V. Novyj kitajsko-russkij slovar'. Moskva: Russkij yazyk-Media, 2007.

Статья поступила в редакцию 26.О5.2О

УДК 811.531

Postoenko I.A., Cand. of Sciences (Philology), senior lecturer, Pacific National University (Khabarovsk, Russia), E-mail: ipostoenko@mail.ru

SPECIFICITY OF THE USE OF THE KOREAN LANGUAGE IN MACHINE TRANSLATION SYSTEMS. The article considers machine translation from the perspective of its history, development and application. Machine translation is analyzed as a process of translating some text from one natural language to another, implemented by a computer completely or almost completely. The author analyzes problems of machine translation using oriental languages based on their lexical and grammatical structure, as well as the features of writing. The material of the Korean language shows the advantages and disadvantages of using the most popular machine translation systems. The article analyzes the translation of journalistic text from Korean into English and Russian by Google Translate and PROMT Translation Office machine translation systems, as well as a detailed analysis of the text translation algorithm in the NAVER system, which is today the most professional tool for translating from Korean and vice versa. The relevance of automated information processing tools in the modern world is shown.

Key words: machine translation, machine translation programs, Internet, online translators, computer linguistics, oriental languages, Korean language.

И.А. Постоенко, канд. филол. наук, доц., Тихоокеанский государственный университет, г. Хабаровск, E-mail: ipostoenko@mail.ru

СПЕЦИФИКА ИСПОЛЬЗОВАНИЯ КОРЕЙСКОГО ЯЗЫКА В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА

Статья рассматривает машинный перевод с позиции его истории, развития и применения. Машинный перевод анализируется как процесс перевода некоторого текста с одного естественного языка на другой, реализуемый компьютером полностью или почти полностью. Автор анализирует проблемы машинного перевода с использованием восточных языков, исходя из их лексической и грамматической структуры, а также особенностей письменности. На материале корейского языка показаны достоинства и недостатки использования наиболее популярных систем машинного перевода. Проанализирован перевод текста публицистического жанра с корейского языка на английский и русский языки системами машинного перевода Google Translate и PROMT Translation Office, а также подробно рассмотрен алгоритм процесса перевода текста в системе NAVER, которая является сегодня наиболее профессиональным инструментом для перевода с корейского языка и наоборот. Показана актуальность автоматизированных средств переработки информации в современном мире.

Ключевые слова: машинный перевод, программы машинного перевода, Интернет, онлайн-переводчики, компьютерная лингвистика, восточные языки, корейский язык.

История машинного перевода берет начало в XVII веке, когда была выдвинута идея о некоем техническом приспособлении для помощи в понимании текста на иностранном языке. Однако первые конкретные разработки в данной области появились в середине 30-х годов ХХ века, и только в 1954 году фирма IBM осуществила успешную демонстрацию системы машинного перевода. К 80-м годам начали использоваться переводческие системы, основывающиеся на технологии универсальной вычислительной машины, появился рынок бюджетных программ машинного перевода. Многие компании Европы, Японии и США воспользовались данной возможностью. Системы были также представлены на рынке Китая, Восточной Европы, Кореи и СССР [1].

Япония стала первой страной с восточным языком и иероглифической письменностью, которая занялась созданием программ для перевода в паре восточный (японский)/английский языки. Многие известные японские компании выделили для этого большие средства: Fujitsu, Toshiba, Sharp, Hitachi и прочие. В это время был создан так называемый «Проект Мю» - первая успешная система машинного перевода для японского и английского языков. Японский язык является самым разработанным языком из восточных языков в современных системах машинного перевода.

В Китае в это же время происходила разработка теории и практики для построения системы китайско-русского машинного перевода. Однако отсутствие фундаментальных исследований в сфере автоматизированных средств работы с обработкой, хранением и передачей информации тормозило процесс, который, кроме того, чрезвычайно усложнялся специфичностью китайской письменностью. Лишь в конце ХХ века был преодолен барьер между иероглифом и компьютером, что позволило использовать китайский язык в современных программах машинного перевода.

Что касается корейского языка, то его автоматизированная разработка началась чуть позже, если сравнивать с японским и китайским языками. Это было связано с историческими и экономическими условиями развития корейского государства, которому пришлось пережить раздел страны и появление на карте мира двух новых государств - Республики Корея (Южная Корея) и Корейской народно-демократической республики (КНДР - Северная Корея).

Микрокомпьютерная революция в начале XXI века привела к массовому выпуску всевозможных персональных гаджетов, что, естественно, стало огромным стимулом для разработки разнообразных компьютерных программ для потребителя. Появилось большое количество принципиально новых систем машинной переработки информации, которые стали доступны и небольшим организациям, и даже отдельным лицам, в том числе так называемые «личные переводчики». Это привело к более эффективной разработке систем машинного перевода с использованием восточных языков [2].

Машинный перевод - это процесс перевода некоторого текста с одного естественного языка на другой, реализуемый компьютером полностью или почти полностью. В ходе данного процесса на вход машины подается текст, словесная часть которого не сопровождается никакими дополнительными указаниями, а на выходе получается текст на другом языке, являющийся переводом входного текста, причем преобразование входного текста в выходной текст происходит без вмешательства человека (иногда допускается постредактирование). Машинный перевод можно классифицировать по нескольким критериям: степень участия переводчика-человека; тип перевода - общий или специализированный; используемая системная архитектура [3].

Существуют две наиболее известные системы машинного перевода, способные работать с текстами в полном объеме. Этими системами являются Google Translate и PROMT. Google Translate - веб-служба компании Google, предназначенная для автоматического перевода части текста или веб-страницы на другой язык. В отличие от других сервисов перевода, Google использует собственное программное обеспечение и самообучаемый алгоритм машинного перевода. По количеству словарей и доступных функций, Google-переводчик -самый функциональный и универсальный сервис на сегодняшний день, который позволяет переводить тексты более чем на сто языков мира.

PROMT Translation Office 2000 (далее - PROMT) - это набор профессиональных инструментов, обеспечивающих перевод с основных европейских языков на русский и обратно. С его помощью можно не только переводить, но и редактировать перевод, а также работать со словарями всех языковых направлений одновременно. В системе PROMT реализованы грамматические правила используемых языков, что повышает качество перевода [4].

Перед тем, как рассмотреть особенности машинного перевода с использованием корейского языка, следует представить характеристики собственно корейского языка. Корейский язык - изолированный язык, некоторые ученые относят его к алтайской группе языков, но исторически и территориально имеющий тесные связи с японским и китайским языками. Жители Республики Корея называют свой язык (хангуго), а жители КНДР - (чосонмаль). Изначально письменность корейского языка была основана на китайских иероглифах. В 1444 году по инициативе короля Седжона Великого было разработано корейское фонетическое слоговое письмо (хангыль). Современный литературный язык был кодифицирован в 1933 г. как «стандартный язык» (пхьоджунмаль), в основе которого лежит сеульский говор центрального диалекта. В 1966 году в КНДР вместо «стандартного языка» был введен статус «культурная речь» (мунхвао). В настоящее время различия в вариантах корейского языка Южной и Северной

Кореи являются достаточно ощутимыми, и процесс расхождения продолжается.

С точки зрения типологии, корейский язык - язык агглютинативного типа номинативного строя. Грамматический строй характеризуется прямым порядком слов, все определяемые слова стоят перед главным словом. Словообразование характеризуется тем, что все аффиксы «приклеиваются» к корневой морфеме. Числительные в корейском языке имеют собственную классификацию. Для ряда чисел (например, для обозначения десяти тысяч) существует отдельная лексема. В пунктуации полностью отсутствует такие пунктуационные знаки, как точка с запятой и двоеточие. Своеобразием корейского языка является наличие категории вежливости, которая выражается формальными грамматическими и лексическими показателями [5].

Указанные выше характеристики соответственно должны быть отражены в программах машинного перевода и влияют на алгоритм перевода. Например, в паре русский язык/корейский язык трудность представляет порядок слов, который в русском языке, в отличие от корейского, не является фиксированным. Очень сложна в переводе категория вежливости: машинному переводу пока недоступны в полной мере социальные аспекты речи, которые чрезвычайно важны в корейском языке и очень чувствительны к социальному статусу, возрасту и отношениям между собеседниками. В то же время большое количество англоязычных заимствований, которые активно используются в современном корейском языке, в какой-то мере облегчают процесс машинного перевода. Необходимо подчеркнуть, что термин «корейский язык» в данной статье обозначает вариант корейского языка, на котором говорят в Южной Корее. Именно этот вариант корейского языка лежит в основе подавляющего большинства программ автоматизированного перевода.

Итак, далее представлен анализ перевода текста с корейского языка на русский язык и с корейского на английский язык различными системами машинного перевода, в данном случае известными переводческими системами Google Translate и PROMT Translation Office. Текст относится к публицистическому стилю и представляет собой газетную новостную статью.

if iüqW ?IS2DJ$ ЧЭД Ш§ Х^ё ЕА|оо oJ§0| Lp ВД§0| 101 f i Л|Е|ВД£ щ цавд *7f

ЕА|0ЮA I АЦ ЛЦ^ (SNS)||b 24 Ш °°ёЧ i А|Е| 101 f ЗДЧИ LLamq Чё ASO

A I § 2 8ё 9 Ш 2? 8А| $ 40 f 2П|±1 ё&И

ve s° $ я чад§ ид oe ча ^ ю чт aq.

0§ё а qfi 1|| 30 £АЦ£ oe al 42 f V

IM LE|£ iq. 12 Ш OH t^i 10 ШВ ЗОДд ^iq.

0§ё 500 ШН 41*1$ я IB 22 Ш t^IA

З^ё «ÍAtAS OfO i IE VB A^l

SU A ASI SNSI1 $ li|e|s| ^l йй ciill «

дад i« д ^ i IE a° asi ^ iE

^д aq.

Перевод текста на русский язык с помощью Google Translate выглядит следующим образом:

Как только русские, которые были наказаны за то, что получили удовольствие от опасного парашютного спуска в высотном здании в Хэундэ-гу, Пусан, были оштрафованы и отбыли, они выпрыгнули из Эль-Сити на 101-м этаже и потребовали дополнительных преступлений. Российская социальная служба (SNS) опубликовала фотографию города с видом на море с крыши 101-го этажа Haeundae El City, Пусан, 24-го. Два человека, включая г-на А., подозреваются в том, что они ворвались на крышу близлежащего крупномасштабного киоска с парашютом после вторжения на крышу здания офисного здания на 40-м этаже Хэундэ-гу, Пусан, в 8 часов вечера 9-го. Они также прыгнули в крышу на 42-м этаже гостиницы возле станции Хэундэ на городской железной дороге в 13:30 на следующий день. Полиция приостановила их на 10 дней и провела расследование 12-го. Они покинули страну 22-го числа после внесения штрафа в размере 5 миллионов вон. Полиция сказала: «В результате расследования они подтвердили, что проникли на крышу Эль-Сити и применили преступление, связанное с вторжением в здание». Тем не менее, г-н А. сказал в комментарии к своему SNS, что пользователь сети «Не разве он оштрафован?» Прокомментировал: «Это отдельно от него».

Из приведенного примера видно, что результат перевода текста с корейского языка с помощью Google Translate является сложным для понимания, допущено много лексических и грамматических неточностей. Перевод небольших предложений является более или менее дезиративно-адекватным - смысл предложения в общем понятен. Но что касается перевода больших предложений, адекватность отсутствует полностью, понимание даже общего смысла текста вызывает трудности.

Например, одним из примеров лексических неточностей, полностью меняющих содержание предложения, является перевод второй части первого предложения i А|Е|||Л£ ЧаВД gfi которую система

перевела как выпрыгнули из Эль-Сити на 101-м этаже и потребовали дополнительных преступлений. Выражение xSiq переводится как совершили преступление, а не потребовали. То же касается и перевода реалий, на-

пример словосочетание A Щ АЦ 310 (SNS) переведено как

Российская социальная служба (SNS), хотя речь идет о социальной сети. Трудности вызывают лексические значения слов, машинный переводчик не всегда находит соответствующие эквиваленты. Однако в целом смысл текста перевода понятен.

Перевод исходного текста на английский язык с помощью системы машинного перевода Google Translate выглядит следующим образом:

As soon as the Russians, who were punished for enjoying the dangerous parachute downhill in the high-rise building in Haeundae-gu, Busan, were fined and departed, they jumped out of El City on the 101st floor and claimed additional crimes. Russian A's Social Network Service (SNS) released a photo of the city overlooking the sea from the rooftop of the 101st floor of Haeundae El City, Busan on the 24th. Two people, including Mr. A, are suspected of breaking into a rooftop of a nearby large-scale mart with a parachute after trespassing on the roof of an officetel building on the 40th floor of Haeundae-gu, Busan, at 8 pm on the 9th. They also jumped into the roof on the 42nd floor of the hotel near Haeundae Station on the urban railway at 1:30 pm the next day. The police suspended them for 10 days and investigated them on the 12th. They left the country on the 22nd after depositing a fine of 5 million won. The police said, "As a result of the investigation, they confirmed that they had infiltrated the rooftop of El City and applied the crime of building intrusion." However, Mr. A said in a comment on his SNS that a netizen's "Isn't he fined?" Commented, «It is separate from it.»

При анализе перевода исходного текста на английский язык также можно выделить большое количество грамматических и лексических ошибок. Как и при переводе на русский язык, Google Translate перевел словосочетание XS

как claimed additional crimes, что искажает значение словосочетания. Еще одним из примеров лексического и грамматического несоответствия, является перевод фразы йм ЬЦ'Ь..., как Isn't he fined? Во-первых, она пере-

ведена как вопрос, с применением неправильной грамматической конструкции, во-вторых она меняет понимание данного фрагмента текста. Следует отметить, что в целом перевод текста на английский язык является более близким к исходному тексту, чем перевод на русский язык.

Следующая система машинного перевода, с помощью которой был переведен исходный текст, - PROMT Translation Office. Текст перевода выглядит следующим образом:

Как только скользить, как и в город Пусан хаанда небоскребы из 101 этаже также утверждал, что штраф за их преступления были наказаны добавить Сказанный упал опасная в Эль русских. Пропуск в море на 24-м этаже A хаанда El City (SNS) за услуги различными мыслями общество г-на 101 фотографии, и общественности. Это как два дня на один район A хаанда крыши в супермаркете на один после проникновения в 8 в 9 и обвиняемый спрыгнуть на крыше будут около 40 парашюта. Он также подскочило на крыше отеля в другой день они в метро на 30 минут и 42 этажей мудэн Хэундэ около 1. Полиция провела 10 дней, чтобы расследование было 12, что остановка. Он ехал после последнего депонирована штраф в размере 5 000 000 южнокорейских вон они 22 дней. «Дополнительное расследование, чтобы определить, что они до крыши El City вторжение применилась памятники до проникновения», сказал, что. Но оказывается, что она в комментарии на одного пользователя сети El City был применен A SNS в полиции от комментариев и его «вы не штраф» и «независимо от его», а также вторжения.

Как видно из приведенного текста перевода, его содержание грамматически и лексически не отвечает принципам адекватности и эквивалентности. Понимание смысла текста затруднено.

Результат перевода исходного текста на английский язык системой машинного перевода PROMT Translation Office выглядит следующим образом:

Those fines as soon as they left the country's dangerous because your Busan skyscrapers in additional crimes said fell on the 101 stories El city said. Russians A gwangyemang Mr society in the last 24 days on the roof overlooking the sea floor in 101 El Paragon city services (SNS) pictures were made public. Two people, including Mr. A 9, 8 p.m. in the rooftop intrusion after 40 floors in a nearby supermarkets haeundae-gu, wearing a parachute jump down towards the roof officetels accused. On the roof of the 42nd floor of 30 minutes into a nearby hotel at 1 p.m. the next day they also make a run against Metro Haeundae station. The police investigation and stop these past 12 days left for 10 days. They left for a deposit of 5,000,000 won a penalty after the last 22 days. "Police said additional investigations to look to the fact that they had applied for trespassing to rooftop like El Sistema chimipjoe monuments," he said. But Mr. own A SNS comments that "it's independent" people to a "not fines" El City views with description of the police and other dwaetdaneun apply intru charges.

В тексте перевода имеется большое количество лексических и грамматических несоответствий. К ним добавилась транслитерация некоторых слов, лексическое значение которых невозможно понять, например, слово 3110 передано как gwangyemang. Это повлияло на передачу смысла текста перевода в целом, хотя, если сравнить с переводом на русский язык, информация является более доступной для понимания.

На основе результатов текстов-переводов можно сделать вывод, что перевод текстов с корейского языка на русский и английский языки с помощью систем машинного перевода Google и PROMT является несоответствующим и искаженным как в лексическом, так и в грамматическом планах. Вышеуказанные

системы машинного перевода не учитывают многозначность корейских слов и особенности грамматики корейского языка. Перевод с помощью Google Translate является более адекватным в плане передачи смысла, чем перевод с помощью системы PROMT.

К сожалению, в настоящее время не существует систем машинного перевода, которые переводят качественно и адекватно тексты с корейского языка на английский, русский и другие языки мира, и наоборот Необходимо отметить, что это касается процесса машинного перевода большинства восточных языков.

Современные ученые в области компьютерной лингвистики продолжают работать над созданием более совершенной системы машинного перевода, которая бы учитывала специфику восточных языков, в том числе и корейского. И это приводит к определенным результатам: например, существует профессиональный словарь NAVER для перевода слов, устойчивых выражений и фразеологизмов, которые часто встречаются в корейских текстах.

NAVER Corporation (||0|^ - ведущая южнокорейская Интер-

нет-компания, оператор самого популярного в Южной Корее портала, а также детского портала JR. NAVER и сервиса мгновенного обмена сообщениями LINE. Компания начала работу 2 июня 1999 года. Штаб-квартира находится в городе Соннам (Южная Корея). По состоянию на сентябрь 2019 года, поисковая система обрабатывает 74,7% всех поисковых запросов в Южной Корее, а число пользователей превышает 42 млн. [6].

NAVER как система машинного перевода является крупнейшим приложением для перевода с корейского языка на 34 языка мира и наоборот, включая английский, корейский, китайский, японский, русский и другие. Поддерживается распознавание рукописного ввода на японском и китайском языках. Перевод в системе NAVER предоставляет следующие возможности: перевод изображения; режим разговора с помощью распознавания речи; поиск омонимов; возможность написания слов от руки для дальнейшего перевода; предоставление контекстов переводимого слова; перевод фразеологизмов и идиом; множество предметных областей для перевода. Имеющиеся недостатки процесса перевода при использовании системы NAVER: невозможность корректного перевода больших текстов; небольшой спектр языков перевода.

Рассмотрим процесс перевода текста с использованием вышеописанного электронного словаря NAVER. В связи с тем, что NAVER является электронным словарем, за единицу перевода следует брать либо слово, либо устойчивое словосочетание. Слова в переводчик необходимо вводить без падежных окончаний и грамматических конструкций. Например, алгоритм перевода предложения В^А|

A Щ| А| ДВД АЦ- (SNS)||b 24 Ш 1 |Е| 101 §

AA ü^f щгрМЧ представлен следующим образом: для

перевода словосочетания А| 3310 АЦ- (SNS) в слове АЦ- (SNS)||b необходимо убрать окончание дательного падежа || и выделительную частицу b и вводить слово АЦ- (SNS), которое обозначает обслуживание/услуга/сервис, тогда словосочетание будет переводиться как сервис сети общественных отношений, но, исходя из контекста, речь идет о социальной сети. В слове Цг^ необходимо убрать грамматическое окончание одновременности действия Ч и поставить глагол в форму инфинитива щгрМД который переводится как смотреть сверху вниз, однако в целом контекстуальное значение словосочетания ü^f ЦгрМЧ, где Ü^- море (без окончания винительного падежа §) можно понять как с видом на море. Для перевода причастия следует убрать окончание £ и вводить слово ^^ как глагол фотографировать, что помогает понять словосочетание АЭ в значении сделанная фотография. Очень важен правильный перевод реалий, например под 1 II понимается здание в районе Хэундэгу.

В корейском языке последнее слово в предложении является главным, несет основную информацию, а также показывает время, когда действие было совершенно, в данном случае это глагол без окончания прошедшего времени §7|E|ch который переводится как открываться, но, исходя из контекста, получает значение разместить (то есть, разместить в Интернете). Итак, вариант перевода вышеуказанного предложения можно представить в следующем виде: 24 числа русский г-н А. на своей страничке в социальной сети опубликовал фото с видом на море, сделанное с крыши 101 этажного здания, расположенного в районе города Пусан Хэундэ.

Таким образом, используя систему машинного перевода NAVER, был получен следующий текст перевода исходного текста:

Русские, своевольно совершившие крайне опасный прыжок с парашютом, что является преступлением, со 101 этажного здания Эльсити, распо ложенного в городе Пусан, в районе Хэундэгу, заплатили штраф и выехали из страны. 24 числа русский господин А. на своей страничке в социальной сети опубликовал фото с видом на море, сделанное с крыши 101 этажного здания, расположенного в районе города Пусан Хэундэ. Также господин А. и еще 2 человека подозреваются в том, что 9 числа в 8 часов вечера самовольно забрались на крышу 40-этажного здания в Пусане, район Хэундэгу, и спрыгнули с парашютом на крышу, расположенного поблизости гипермарке-та. Более того, они и на следующий день в 13.30 спрыгнули с крыши 42 этажного отеля, расположенного поблизости станции Хэундэгу. 12 числа полиция приостановила их выезд из страны и проводила расследование в течении 10 дней. Они выехали 22 числа, заплатив штраф в размере около 5 миллионов вон, что в эквиваленте составляет триста четыре тысячи рублей. Полиция

объявила, что дополнительное расследование подтвердило их незаконное проникновение на крышу здания Эльсити, что повлекло за собой незаконное проникновение на крышу здания. Тем не менее, господин А на своей страничке в социальных сетях написал, что не согласен с обвинениями полиции на счет вторжения на крышу Эльсити, заявив, что «это было не с ним» и штраф он не получал.

Представленный алгоритм переводческого процесса текста с корейского на русский язык дает возможность получить в результате адекватный текст перевода. Однако следует учитывать, что такой процесс имеет определенные сложности и является весьма трудоемким, так как предполагает использование не системы машинного перевода как таковой, а имеющегося на данный момент электронного словаря для работы в области перевода с корейского и на корейский язык. В данном случае переводчик должен обладать базовыми знаниями в области лексики и грамматики корейского языка.

Библиографический список

Таким образом, из проведенного анализа очевидно, что машинный перевод с корейского на английский язык является более разработанным и предоставляет тексты перевода с более или менее адекватными и эквивалентными характеристиками. К сожалению, в настоящее время не существует систем машинного перевода, способных осуществлять качественный перевод текстов с корейского языка на русский. Это связано с внутренней структурой, лексическими и грамматическими особенностями корейского и русского языков. Существующий электронный словарь NAVER выполняет перевод не текста, а слов, фразеологизмов и словосочетаний с корейского языка. Необходимо отметить, что данный словарь имеет высокие профессиональные характеристики и незаменим в работе переводчика, работающего в области корейского языка.

Следовательно, как видно из проведенного анализа, системы машинного перевода с корейского на русский и английский языки (и, соответственно, на другие языки мира) являются несовершенными и находятся в стадии разработки.

1. Машинный перевод. Available at: http://studyenglish.info/article065.php#ixzz6GMGLnNje

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Новожилова А.А. Машинные системы перевода: качество и возможности использования. Вестник Волгоградского государственного университета. Серия 2: Языкознание, Волгоград, 2014: 67 - 70.

3. Семенов А.Л. Современные информационные технологии и перевод: учебное пособие для студентов переводческих факультетов вузов. Москва: Академия, 2008.

4. Системы машинного перевода текстов и словари. Available at: https://compress.ru/article.aspx?id=11757#02

5. Лим В.Н. Стилистика корейского «культурного» и «стандартного» языка как результат влияния лингвистического и экстралингвистического факторов: монография. Хабаровск: Издательство Тихоокеанского государственного университета, 2016.

6. NAVER - NAVER. Available at: https://ru.qwe.wiki/wiki/Naver

References

1. Mashinnyjperevod. Available at: http://studyenglish.info/article065.php#ixzz6GMGLnNje

2. Novozhilova A.A. Mashinnye sistemy perevoda: kachestvo i vozmozhnosti ispol'zovaniya. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 2: Yazykoznanie, Volgograd, 2014: 67 - 70.

3. Semenov A.L. Sovremennye informacionnye tehnologiiiperevod: uchebnoe posobie dlya studentov perevodcheskih fakul'tetov vuzov. Moskva: Akademiya, 2008.

4. Sistemy mashinnogo perevoda tekstov i slovari. Available at: https://compress.ru/article.aspx?id=11757#02

5. Lim V.N. Stilistika korejskogo «kulturnogo» i «standartnogo» yazyka kak rezultat vliyaniya lingvisticheskogo i 'ekstralingvisticheskogo fakiorov: monografiya. Habarovsk: Izdatel'stvo Tihookeanskogo gosudarstvennogo universiteta, 2016.

6. NAVER - NAVER. Available at: https://ru.qwe.wiki/wiki/Naver

Статья поступила в редакцию 26.05.20

УДК 81-44

Agarkova O.A., Cand. of Sciences (Philology), senior lecturer, Orenburg State University (Orenburg, Russia), E-mail: agarkova1612@rambler.ru

Khalday K.S., MA student, Orenburg State University (Orenburg, Russia), E-mail: miss.khalday@mail.ru

ANALYSING THE FORMATION OF LANGUAGE COMPETENCIES IN ARTIFICIAL BILINGUALISM. The article is dedicated to analysis of the formation of linguistic competence (phonetic, lexical, grammatical, semantic) in artificial bilingualism. The research material is bilingual speech activity of children who learn Russian and English from birth in a monoethnic family. The authors studied the characteristic features of the development of a bilingual child's vocabulary, taking into account four language competencies. Conducting a detailed analysis of the declared competencies of a bilingual child, the qualitative and quantitative characteristics of the bilingual's dictionary under three years, speaking Russian and English, are revealed. There is also a tendency to influence the volume of a child's vocabulary on the peculiarities of language competence formation.

Key words: artificial bilingualism, language competence, bilingual child, Russian language, English language, intercultural communication.

О.А. Агаркова, канд. филол. наук, доц., Оренбургский государственный университет, г. Оренбург, E-mail: agarkova1612@rambler.ru

К.С. Халдай, магистрант, Оренбургский государственный университет, г. Оренбург, E-mail: miss.khalday@mail.ru

АНАЛИЗ ФОРМИРОВАНИЯ ЯЗЫКОВЫХ КОМПЕТЕНЦИЙ В ИСКУССТВЕННОМ БИЛИНГВИЗМЕ

Статья посвящена анализу формирования языковых компетенций (фонетической, лексической, грамматической, семантической) в искусственном билингвизме. Материалом исследования послужила билингвальная речевая деятельность детей, осваивающих русский и английский языки с рождения в моноэтнической семье. Авторы изучили характерные особенности развития словаря ребенка-билингва с учетом четырех языковых компетенций. На основе детального анализа заявленных компетенций ребенка-билингва выявлены качественные и количественные характеристики словаря билингва до трех лет, говорящего на русском и английском языках. Также установлена тенденция влияния объема словаря ребенка на особенности формирования языковых компетенций.

Ключевые слова: искусственный билингвизм, языковые компетенции, ребенок-билингв, русский язык, английский язык, межкультурная коммуникация.

История изучения искусственного детского билингвизма берет свое начало более чем 100 лет назад, большинство всех работ, посвященных этому вопросу, были опубликованы зарубежными исследователями (Д. Барнс, А. Баррена, С. Допке, В. Марчман, Д. Синглтон) [1].

Итоги анализа теоретического материала по проблеме детского билингвизма, вопросы двуязычия «перемещались» на протяжении развития научных идей. Концепция коммуникации как самостоятельная гипотеза начала оформляться с середины XX века. В дальнейшем была выделена концепция межкультурной коммуникации, поэтому локализация проблем билингвизма в предметной сфере этих научных направлений стала неоспоримой [2].

Данные, полученные в ходе анализа количественной динамики публикаций российских и зарубежных авторов по наукометрии и библиометрии (2012 -

2020 гг) тематического исследовательского поля (искусственный билингвизм), занесены в таблицу (см. табл. 1).

Таблица 1

Количественная динамика тематического исследовательского поля

Год Web of Science Scopus E-library

2012 2324 168 267

2013 2265 182 301

2014 2331 173 234

i Надоели баннеры? Вы всегда можете отключить рекламу.