Научная статья на тему 'Проблема поддержки бурятского языка в компьютерных технологиях'

Проблема поддержки бурятского языка в компьютерных технологиях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
320
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕКСТЫ НА БУРЯТСКОМ ЯЗЫКЕ / КОДОВЫЕ СТРАНИЦЫ / УСТАНОВКА ЯЗЫКОВЫХ ПАРАМЕТРОВ / РАСКЛАДКА КЛАВИАТУРЫ / THE BURYAT LANGUAGE TEXTS / CODEPAGES / LANGUAGE SETTINGS / KEYBOARD LAYOUT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дармаева Р. Д.

В статье содержатся конкретные практические методы решения проблемы поддержки бурятского языка в компьютерных технологиях. Дается разъяснение, что такое кодовые страницы (стандарты кодировки) для разных платформ, стандарт Unicode и юникодовые шрифты. В конце статьи дается пошаговая инструкция, как на своем компьютере настроить языковые параметры и установить нужную раскладку клавиатуры для корректного ввода текстов на бурятском языке.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of support of the Buryat language in computer technologies

This article contains the practical methods of solution the problem of the buryat language support in computer technologies. The author takes steps to reveal the matter of codepages for different platforms, the Unicode standard and the Unicode fonts. A step-by-step tutorial on the configuration of language settings and set of the necessary keyboard layout is given at the end of this article.

Текст научной работы на тему «Проблема поддержки бурятского языка в компьютерных технологиях»

- формирует системно-информационную картину мира, алгоритмическое мышление, умение использовать информационные технологии в своей будущей специальности учителя бурятского языка, развивать интерес не только к предмету «Информационные технологии», но и к получению знаний вообще.

Студенты 4-го курса НГИ в процессе работы над проектом в курсе "Использование современных информационных технологий" постигают реальные процессы, учатся использовать информационные и телекоммуникационные технологии в своей будущей профессии. Проект позволяет реализовать творческое сотрудничество преподавателя и студента, интеллектуальное партнерство и активную деятельность со стороны обучаемого. При использовании проектного метода становится возможной подготовка квалифицированных специалистов - учителей бурятского языка, обладающих навыками осознанного применения современных информационных и коммуникационных технологий в своей профессиональной области.

Литература

1. Алешин Л.И. Гуманитарная информатика: аспекты проблемы // 6-я Всерос. объединенная конф. “Технологии информационного общества - Интернет и современное общество” (IST/ IMS-2003) 3-6 ноября 2003 г.- СПб.: Изд-во СПбГУ, 2003.

2. Ветрова М.Н. Гуманитарные проблемы информатики: зачем они нужны гуманитариям? //Alma Mater.- 2003.

3. Демкин В., Можаева Г. Гуманитарная информатика // Высшее образование в России.-2003.-№2.-С. 82-84.

4. Основы открытого образования / А.А.Андреев, С.Л. Каплан, Г.А. Краснова и др. - М., 2002. - С. 75-77.

5. Учебные проекты с использованием Microsoft Office: метод. пос. - М.: БИНОМ. Лаборатория знаний, 2006.

Дамбиева Жаргалма Дамбиевна, старший преподаватель кафедры вычислительной техники и информатики, Бурятский государственный университет.

Dambieva Zhargalma Dambievna, senior teacher of department of computer sciences, Buryat State University.

670000, г. Улан-Удэ, ул. Смолина, 24а, e-mail:ardabi@mail.ru

УДК811.512.31:004 Р.Д. Дармаеви

Проблема поддержки бурятского языка в компьютерных технологиях

В статье содержатся конкретные практические методы решения проблемы поддержки бурятского языка в компьютерных технологиях. Дается разъяснение, что такое кодовые страницы (стандарты кодировки) для разных платформ, стандарт Unicode и юникодовые шрифты. В конце статьи дается пошаговая инструкция, как на своем компьютере настроить языковые параметры и установить нужную раскладку клавиатуры для корректного ввода текстов на бурятском языке.

Ключевые слова: тексты на бурятском языке, кодовые страницы, установка языковых параметров, раскладка клавиатуры.

R.D. Darmaeva

The problem of support of the Buryat language in computer technologies

This article contains the practical methods of solution the problem of the buryat language support in computer technologies. The author takes steps to reveal the matter of codepages for different platforms, the Unicode standard and the Unicode fonts. A step-by-step tutorial on the configuration of language settings and set of the necessary keyboard layout is given at the end of this article.

Key words: the buryat language texts, codepages, language settings, keyboard layout.

Большинство пользователей, набирающих и обрабатывающих электронные тексты на бурятском языке, сталкиваются с проблемой корректного ввода бурятских слов. Мы пришли к выводу, что использование бурятского языка в компьютерных технологиях - очень актуальная, требующая наискорейшего решения и государственной поддержки проблема.

Суть проблемы состоит в том, чтобы корректно вводить и отображать в компьютерных программах три бурятские буквы - Y y, 0 в, h h. В ней кроется множество нюансов, которые не изложить, просто написав статью. Данная статья не претендует на полное истолкование столь

насущной проблемы, но решения, которые здесь собраны, должны помочь в большинстве рядовых случаев, связанных с вводом данных букв в современных текстовых редакторах. Решение, предлагаемое в данной статье, основывается на использовании юникодовых шрифтов и юникодовых кодировок (UTF-8, UTF-16).

Хотя современный алфавит бурятского языка основан на кириллице, в нем существуют три дополнительные буквы, которые, к сожалению, не вошли в состав кодировок, используемых в России:

• Windows-1251

• Koi8-r

• Ср-866(альтернативная).

Исторически сложилось так, что в семействах операционных систем (ОС) Microsoft Windows отсутствует бурятская раскладка клавиатуры. На данный момент не существует единого решения проблемы. На самом деле проблему поддержки бурятского языка в Windows и других операционных системах можно разделить на две составляющие:

1. Ввод (набор) электронного текста на бурятском языке.

2. Использование бурятских символов в более специфических областях информационных технологий (ИТ), таких как программирование (визуальные компоненты, поддерживающие данные символы), разработка веб-сайтов и т.д.

Большинство пользователей решает данную задачу, заменяя три «заветных» символа на подобные им, используя разные способы:

1. Строчная h и заглавная h заменяются на латинскую h либо на h;

2. Строчная y и заглавная Y заменяются на греческую у (epsilon) или на латинскую заглавную Y ;

3. Строчная е и заглавная 0 заменяются на греческую 0 (theta).

При этом искажается грамматическая и эстетическая корректность бурятских текстов. Мы будем рассматривать пути решения первой проблемы, т.к решение второй проблемы требует дополнительного детального рассмотрения.

Кодовая страница

Любой текст в ОС представляется с помощью программ, предназначенных для отображения и редактирования электронного текста, именуемых редакторами. Такими редакторами являются всеми известный Notepad (Блокнот), Microsoft Word, входящий в пакет Microsoft Office, WordPad и т.п. Сохраняется же такой текст в виде кодированного текстового файла с определенным, в зависимости от редактора, расширением. Например, *.txt (Notepad), *.doc (Microsoft Word) и т.д. Когда текстовый файл закодирован, он сохраняется в соответствии со стандартом кодировки - определенным набором правил, в соответствии с которыми каждому текстовому знаку присваивается числовое значение. При открытии текстового файла в редакторе стандарт кодировки (кодовая страница) помогает программе определить, каким образом следует вывести символы текста.

Корпорация Microsoft разработала собственные стандарты кодировки символов различных языков в семействах ОС Windows. Так, к примеру, для отображения китайских иероглифов используется стандарт кодировки GB2312-80 в случае упрощенного письма и стандарт кодировки Big5 - традиционного письма. Для отображения русских символов используется кодировка Windows-1251 (кириллица). Наряду с вышеназванной кодировкой существуют и другие кодовые таблицы для представления кириллицы в других ОС:

• KOI8 (в системах на основе UNIX);

• MacCyrillic (на компьютерах Macintosh);

• альтернативная кодировка (IBM code page 866 в системах DOS) и т.д.

Юникод (Unicode)

Помимо вышеперечисленных стандартов кодирования символов в мире был изобретен стандарт, позволяющий кодировать все существующие и несуществующие (исчезнувшие) в мире языки! Имя этого стандарта - Unicode. Суть этого стандарта заключается в том, что любому символу любого языка поставлен в соответствие определенный код. К примеру латинская буква A имеет код U+0041, а английское слово «Hello» будет иметь вид: «U+0048 U+0065 U+006C U+006C U+006F» в

этом коде. Вы можете просмотреть код любого символа в Microsoft Word - нужно лишь набрать интересующий символ, а затем нажать комбинацию клавиш: Alt+ X.

Также в Microsoft Windows начиная с версии Windows2000 существует утилита charmap, позволяющая просматривать коды всех символов. К нашему счастью, Microsoft Word по умолчанию кодирует символы, благодаря чему в данном редакторе совершенно спокойно могут соседствовать китайские и японские иероглифы наряду с греческими и латинскими символами.

Поддержка шрифтов

Не все шрифты поддерживают столь необходимые нам символы. Дело в том, что создатели шрифтов должны буквально прорисовать все основные символы латиницы и в том числе все символы тех языков, поддержку которых они хотят обеспечить в создаваемом им шрифте. Отсюда становится ясно, почему многие дизайнерские шрифты имеют в своей поддержке только латинские символы. Вы можете сами проверить, какие из шрифтов поддерживают наши «заветные» три символа, в том же Microsoft Word, изменяя шрифт набранных вами символов.

Как включить многоязыковую поддержку

Далее хотелось бы продемонстрировать вам, как включить многоязыковую поддержку в Microsoft Office 2003. Она нужна пользователям для корректного отображения бурятских символов. На самом деле это компонента, расширяющая данный офис. Устанавливая это расширение, мы убиваем сразу несколько зайцев, т.к. устанавливаются дополнительные шрифты (юникодовые, китайский SimSun и др.), позволяющие без труда отображать/редактировать тексты на большинстве языков народов мира.

Для начала запускаем панель управления:Пуск - Панель управления - Установка и удаление программ. Откроется диалоговое окно. Среди установленных программ ищем MicrosoftOffice -профессиональный выпуск версии 2003. Нажимаем кнопку Изменить. В следующем окне выбираем пункт Добавить или удалить компоненты. Далее откроется следующее окно, в котором ставим галочку напротив опции Расширенная настройка приложений. Раскрываем пункт меню Средства Office и ищем пункт Языковые параметры. Открываем данный пункт меню. Выбираем вкладку Запускать все с моего компьютера. Теперь осталось только нажать кнопку Обновить.

Настройка языковых параметров и раскладки клавиатуры

Дело в том, что существующая раскладка клавиатуры RU не позволяет вводить пользователю три «заветных» символа е, h, y. В монгольской раскладке отсутствует буква h. Мы пришли к выводу, что данная проблема решается с помощью казахской раскладки. В отличие от бурятского языка Windows поддерживает казахскую раскладку и поэтому временным на данном этапе и в то же время оптимальным решением является использование казахской раскладки (KK), т.к. в ней все буквы кириллицы остаются на тех же местах, что и в русской раскладке (RU). Это очень удобно для тех, кто набирает десятипальцевым методом. Нужно уточнить, что данная раскладка оправдывает себя лишь в текстовых редакторах с поддержкой юникода. Например, при сохранении текста на бурятском языке, набранного в редакторе Блокнот, нужно обязательно выбирать в параметрах сохранения кодировку UTF-8 или Юникод, иначе при следующем открытии файла вместо заветных букв вы получите заменяющие их значки.

Далее для установки нужной раскладки клавиатуры вызываем панель управления: Пуск -Панель управления - Язык и региональные стандарты. В открывшемся диалоговом окне выбираем вкладку Языки. Нажимаем кнопку Подробнее. В следующем диалоговом окне Языки и службы текстового ввода по кнопке Добавить выберите из списка языков ввода Казахский и такую же раскладку клавиатуры. Теперь у вас на панели задач появилась дополнительная раскладка (КК), в которой во втором ряду расположены необходимые нам символы:

Таким образом, настроив языковые параметры и установив дополнительную раскладку клавиатуры на своем компьютере, вы можете набирать тексты на бурятском языке легко и с удовольствием. Например, после установки всех настроек попробуйте набрать несколько пословиц на бурятском языке в редакторе Блокнот и сохраните файл в кодировке Юникод. Закройте редактор, заново откройте файл и убедитесь, что все символы корректно отображены без заменяющих значков. Желаем успехов в деле развития родного языка!

Дармаева Роза Дашидондоковна, старший преподаватель кафедры вычислительной техники и информатики Бурятский государственный университет.

Darmaeva Roza Dashievna, senior teacher of department of eomputer sciences, Buryat State University.

670000, г. Улан-Удэ, ул. Смолина, 24а, e-mail: darmro@yandex.ru

УДК 811.512.3 НГ Замбулаева

Лингвистический аспект обучения литературному бурятскому языку в диалектных условиях

В статье рассматривается лингвистическая основа обучения литературному бурятскому языку в диалектных условиях (на материале тункинского говора). Автор считает, что учет диалектных особенностей в обучении литературному языку является одной из основных задач.

Ключевые слова: бурятский язык, диалект, обучение, диалектные особенности, фонетика, грамматика, лексика.

N.G. Zambulaeva

The linguistic aspect of teaching the literary Buryat language in dialect conditions

The article deals with the linguistic basis of teaching the literary Buryat language in dialect conditions (on a materials of Tunka dialect). The author considers that the account of dialect features in teaching the literary language is one of the basic problems.

Key words: the Buryat language, dialect, education, dialect particularities, phonetics, grammatics, lexis.

Качественно новые подходы к осуществлению национальной языковой политики требуют обновления методики обучения бурятскому языку. Общеизвестно, что ведущее место в обучении родному языку занимает начальный этап, который, с одной стороны, наиболее труден в силу отсутствия у младших школьников необходимой языковой подготовки, несформированных речевых умений, а с другой стороны, приобретенные учащимися знания, умения, навыки на этом этапе служат базой для дальнейшего овладения системой родного языка. Именно на начальном этапе обучения литературному языку перед учителем стоит важная задача - научить письменной форме литературного язык, которым они уже владеют устно.

В лингвистике определены два уровня овладения литературным языком:1) овладение правильной речью, подчиненной нормам литературного языка; 2) овладение коммуникативноцелесообразной речью и ее качествами. В соответствии с этим в диалектных условиях обучение

169

i Надоели баннеры? Вы всегда можете отключить рекламу.