Научная статья на тему 'ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА ПРИ ПЕРЕВОДЕ НА УЗБЕКСКИЙ ЯЗЫК'

ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА ПРИ ПЕРЕВОДЕ НА УЗБЕКСКИЙ ЯЗЫК Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
306
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / GOOGLE TRANSLATE / НЕДОСТАТКИ АВТОМАТИЧЕСКОГО ПЕРЕВОДА / ПЕРЕВОД НА УЗБЕКСКИЙ ЯЗЫК / ПЕРЕВОД НА РУССКИЙ ЯЗЫК / “BAT” / “KO’RSHAPALAK” / “BELKURAK” / “TO’QMOQ” / “KICHIK ZIYOFAT” / ОНЛАЙН ПЕРЕВОД / ВИКИПЕДИЯ / ВЕБ-КОНТЕНТ / ВЕБ-САЙТ / MACHINE TRANSLATION / DISADVANTAGES OF AUTOMATIC TRANSLATION / UZBEK TRANSLATION / RUSSIAN TRANSLATION / ONLINE TRANSLATION / WIKIPEDIA / WEB CONTENT / WEBSITE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Тураева Гулбахор Халимовна

В статье разъясняются ошибки и недочеты машинного перевода, добавление узбекского языка в Google Translate, проблемы с переводом системы на узбекский язык, роль узбекского языка в мировом сообществе, ошибки поясняются примерами. Также обсуждается качество узбекского контента на узбекском языке, отсутствие функции проверки орфографии в программах и функции редактирования текста в кириллице и латинском алфавите.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROBLEMS OF MACHINE TRANSLATION WHEN TRANSLATING TO THE UZBEK LANGUAGE

The article explains the mistakes and shortcomings of machine translation, the addition of the Uzbek language to Google Translate, the problems with translating the system into the Uzbek language, the role of the Uzbek language in the world community, the errors are explained by examples. It also discusses the quality of Uzbek content in the Uzbek language, the lack of a spell check function in programs, and the function of editing text in Cyrillic and Latin alphabets.

Текст научной работы на тему «ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА ПРИ ПЕРЕВОДЕ НА УЗБЕКСКИЙ ЯЗЫК»

№ 10 (79)

AUNÎVE

TEXHI

UNIVERSUM:

ТЕХНИЧЕСКИЕ НАУКИ

октябрь, 2020 г.

ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА ПРИ ПЕРЕВОДЕ НА УЗБЕКСКИЙ ЯЗЫК

Тураева Гулбахор Халимовна

преподаватель, Бухарский государственный университет, Республика Узбекистан, г. Бухара E-mail: evrikiy@Jist.ru

PROBLEMS OF MACHINE TRANSLATION WHEN TRANSLATING TO THE UZBEK LANGUAGE

Gulbahor Turaeva

Lecturer, Bukhara State University, Republic of Uzbekistan, Bukhara

АННОТАЦИЯ

В статье разъясняются ошибки и недочеты машинного перевода, добавление узбекского языка в Google Translate, проблемы с переводом системы на узбекский язык, роль узбекского языка в мировом сообществе, ошибки поясняются примерами. Также обсуждается качество узбекского контента на узбекском языке, отсутствие функции проверки орфографии в программах и функции редактирования текста в кириллице и латинском алфавите.

ABSTRACT

The article explains the mistakes and shortcomings of machine translation, the addition of the Uzbek language to Google Translate, the problems with translating the system into the Uzbek language, the role of the Uzbek language in the world community, the errors are explained by examples. It also discusses the quality of Uzbek content in the Uzbek language, the lack of a spell check function in programs, and the function of editing text in Cyrillic and Latin alphabets.

Ключевые слова: машинный перевод, Google Translate, недостатки автоматического перевода, перевод на узбекский язык, перевод на русский язык, "bat", "ko'rshapalak", "belkurak", "to'qmoq", "kichik ziyofat", онлайн перевод, Википедия, веб-контент, веб-сайт.

Keywords: machine translation, Google Translate, disadvantages of automatic translation, Uzbek translation, Russian translation, "bat", "ko'rshapalak", "belkurak", "to'qmoq", "kichik ziyofat", online translation , Wikipedia, web content, website.

Резкое увеличение объемов данных, основанных на геометрической прогрессии, привело к необходимости систем, позволяющих быстро переводить их на другие языки. В ответ начали появляться практические исследования в области машинного или автоматического перевода. Самое главное, что исследования в области машинного перевода стали базовой точкой возникновения компьютерной лингвистики.

В 1954 году Джорджтаунский университет в США протестировал первый в мире автоматический перевод. Это называется система GAT (аббревиатура от Georgetown Automatic Translation). Эти эксперименты проводились на компьютере IBM701. В основе этого эксперимента лежали алгоритмы, переводящие 50 000 слов (60 предложений) с русского на английский.

В результате развития Интернета автоматический перевод был также установлен в глобальной сети, то есть сейчас активно действует система онлайн-пере-вода. Искусственные нейронные сети, управляемые

данными, с каждым годом улучшают качество перевода. Но даже в этом случае недостатков у автоматического перевода еще много. На сегодняшний день одной из наиболее широко используемых систем автоматического перевода является Google Translate.

Согласно Википедии, в настоящее время система поддерживает 90 языков. В декабре 2014 года в Google Translate был добавлен узбекский язык. Это было сделано с помощью узбекскоязычных волонтеров и узбекского словаря Шавката Бутаева. Это, конечно, отрадно, но в узбекском переводе машинного перевода есть ряд недостатков.

У Google Translator, как и у других автоматических переводчиков, есть свои ограничения. Эта система помогает пользователю понять общее содержание текстового контента на иностранном языке. Однако, часто он не дает точных переводов. Поэтому постоянно ведется работа над качеством перевода, будут переведены на другие языки.

Библиографическое описание: Тураева Г.Х. Проблемы машинного перевода при переводе на узбекский язык // Universum: технические науки : электрон. научн. журн. 2020. 10(79). URL: https://7universum.com/ru/tech/archive/item/10816

№ 10 (79)

UNIVERSUM:

ТЕХНИЧЕСКИЕ НАУКИ

октябрь, 2020 г.

Недостатки автоматического перевода:

1. Слова переводятся непосредственно в процессе автоматического перевода. Поэтому перевод выполняется практически без соблюдения грамматических правил;

2. Нужно редактировать автоматически переведенный текст;

3. Современные системы автоматического перевода также переводят сочетание слов практически неправильно.

Например, переводя английскую фразу «The bat looks like a mouse with wings» на узбекский, он переводит ее как «Yarasa qanotli sichqonchaga o'xshaydi». Я не лингвист, но не думаю, что понимание сложности предложения требует глубоких знаний (рис.1):

Рисунок 1. Пример перевода с английского на узбекский язык

В переводе на русский язык словосочетание «Летучая мышь выглядит как мышь с крыльями" (рис.2.).

Ук Текст Документы

ОПРЕДЕЛИТЬ ЯЗЫК АНГЛИЙСКИЙ РУССКИЙ НЕМЕЦКИЙ V «г» УЗБЕКСКИЙ РУССКИЙ АНГЛИЙСКИЙ V

The bat looks like a mouse with wings х Летучая мышь выглядит как мышь с крыльями

<ь 1_е1ис11ауа туэ^ ууд1уасШ как туэЬ" б кгуГуагт 37/5000 п - О ^ <

Рисунок 2. Пример перевода с английского на русский язык

Из вышесказанного видно, что русская версия переводов намного понятнее и чище. С другой стороны, узбекские переводы расплывчаты и понятны только семантически.

При переводе предложений следует учитывать его одноименные особенности. В противном случае перевод не будет успешным. Слово «bat» в предложении означает «ko'rshapalak», «belkurak», «to'qmoq», «kichik ziyofat», а слово «look» означает «qaramoq», «nigoh», «ko'rinish».

Дугой пример, предложение «Have you ever wanted to make some extra money?» переводится следующим образом: «Hech qachon qo'shimcha pul ish-lashni xohladingizmi?». По-русски выглядит как «Вы когда-нибудь хотели заработать немного денег?». Даже в этом предложению можно понять только в смысле значения. Но перевод был немного близок к оригиналу из-за использования синонимов.

Имея это в виду, можно сказать, что автоматический перевод выполняется успешно, особенно в пределах официального языка. Автоматический перевод разговорных и художественных текстов не решено на максимальном уровне.

Конечно, высочайшее качество перевода происходит при участии человека. Потому что переводчик подходит к переводу, учитывая тонкости, семантические, грамматические и прагматические аспекты человеческого языка.

Тем не менее, с быстрым увеличением количества веб-контента информационные системы, однако тот факт, что большая часть информации в глобальной сети находится на русском или английском языке, ограничивает способность узбекоязычного населения правильно получать необходимую информацию. Несмотря на то, что на этом языке говорят около 30 миллионов человек в мире, роль узбекского языка в мировом сообществе по-прежнему незначительна. Сложно сказать, что качество существующих узбекоязычных сайтов удовлетворительно. Предложения в опубликованных статьях, которые были взяты напрямую с иностранных сайтов и переведены напрямую, можно встретить несвязанные слова друг с другом, и в словах можно обнаружить много орфографических ошибок (рис.3):

№ 1G (79)

UNIVERSUM:

ТЕХНИЧЕСКИЕ НАУКИ

октябрь, 2G2G г.

HI bk^ tizim nimaV

Q Linux Mint distributivida E-imzo modulini oYnatish

Androidda SMS yuborish

Java dasturlash tili bo'yicha onlayn darslar

B-l. I Interface - PHPda interfeyslar bilar ishlash

C++ da grafika

Android ilovalar

hozirgi kunda internet, juda katta tezlikda rivojlanib ketmoqda. Shj bilan birga internetga oid har xil terminlar ko'paymoqda. Misol uchun, sayt, portai, veb sahifa, veb serrer,.... Bu terminlarni o'rganish, hozirgi zamon uchun muhim hisoblanmoqda. Biror inson bilan internet haqida gaplashsangiz, bu terminlarni bilmasangiz, boshqa tildagi inson bilan gaplashganday bo'lasiz va uni tushunmaysiz. Bu maqolada shunday terminlardan biri - veb server haqida to'xtalib o'taman.

Biror bir internet saytga kirish uchun, brouzerga manzil yozsanglz, brouzer shu sayt joylashgan kompyuterga, saytdagi ma'lumotlarni ko'rsatish haqida so'rov jo'natadi, kompyuter addiy temir bo'lgani uchun bu so'rovni tushunmaydi. Shuring uchun, ya'ni bu so'rovni tushunishi uchun, kompyuterga dastur o'rnatiladi. Mana shu dasturveb dastur deyiladi. Bu kompyuter esa, veb serverga aylanadi. Hozirda veb dastur deyilmasdan, umumiy holda veb server deyilmoqda.

Demak, veb server — foydalanuvchidan kelayotgan so'rovlarni qabul qilib, tegishlj javobn jo'natadlgan dasturdir. Foydalanuvchi sifatida veb brouzer(http, https protokoli orqali}, mobil teleforfwap protokoli orqali), ba'zi dasturlar(antiviruslar) bo'lishi mumkin. Veb server orqali butur sayt boshqariladi, ya'ni sayt kataloglariga ruxsatlarni beradi, xavfsizlik jihatldan IP manzillarn blakka cladi, foydalaruvchilarri ro'yxatdan o'tkazish va boshqa ko'plab ishlarnl amalga oshiradi.

Рисунок 3. Пример переведённой статьи на узбекский язык

Проблемы с узбекским языком можно наблюдать не только в онлайн переводах, но и в обычных программах Office. Кириллица и латинский алфавит не имеют функций редактирования текста на узбекском языке. Для преобразования кириллического текста в латинский алфавит требуется отдельная программа-конвертер, и преобразованный текст необходимо повторно редактировать. Хорошо известно, что Microsoft Word обнаруживает орфографические ошибки в английских и русских словах.

Из вышеуказанных проблем можно сделать вывод, что одной из наиболее актуальных проблем, стоящих перед программистами, веб-программистами, экспертам компьютерной лингвистики и лингвистами, является создание качественного веб-контента на узбекском языке, разработка специальных программных приложений для обучения иностранцев узбекскому языку. Постепенное решение этих вопросов положительно скажется на росте информационной осведомленности населения.

Список литературы:

1. Атаева Г.И., Тураева Г.Х. Перевод как средство взаимосвязи мировой культуры //Academy № 12 (51), 2019. С.65-67.

2. Атаева Г.И., Ядгарова Л.Д. Оценка прикладных свойств обучающей платформы Moodle в Бухарском государственном университете // Universum: технические науки : электрон. научн. журн. 2020. № 6 (75). URL: https://7universum.com/ru/tech/archive/item/9593 (дата обращения: 03.10.2020).

3. Буранова Г.Ё., Носирова Ш.Э. Сущность применения метода кейс-технологий в организации учебного процесса // Academy. №9 (60). 2020. С. 17-20.

4. Зарипова Г.К., Сайидова Н.С., Тахиров Б.Н., Хайитов У.Х. Пдагогическое сотрудничество преподавателя и студентов в кредитно-модульной системе высшего образования // Наука, образование и культура. 2014. № 1 (1). С. 22-25.

5. Жалолов О.И. Верхняя оценка нормы функционала погрешности кубатурной формулы типа Эрмита в пространстве С.Л.Соболева // Проблемы вычислительной и прикладной математики. Научный журнал. -№ 3. 2017. -Ташкент. -70-78 ст.

6. Жалолов О.И., Хаятов Х.У. Понятие SQL и реляционной базы данных // Universum: технические науки : электрон. научн. журн. 2020. № 6 (75). URL: https://7universum.com/ru/tech/archive/item/9711 (дата обращения: 03.10.2020).

7. Тахиров Б.Н. Понятие виртуальной реальности // Наука, образование и культура. 2014. № 1 (1). С. 12-14.

8. Abdurakhmonova N. O'zbek tili lotin alifbosi uchun klaviatura yoki "49nicode" masalasi //Til va adabiyot ta'limi jurnali. №6. 2018.

9. Fayzieva D.Kh. USING SOFTWARE FOR TEACHING FOREIGN LANGUAGES //Academy. №9 (60). 2020. С. 13-16.

10. Rahimov.A Kompyuter lingvistikasi. Toshkent, 2011. 205в.

i Надоели баннеры? Вы всегда можете отключить рекламу.