Научная статья на тему 'Автоматическое исправление ошибок в якутском языке с помощью гармонии гласных'

Автоматическое исправление ошибок в якутском языке с помощью гармонии гласных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
76
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЧЕСКОЕ ИСПРАВЛЕНИЕ ОШИБОК / ЯКУТСКИЙ ЯЗЫК / ГАРМОНИЯ ГЛАСНЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Леонтьев Н.А.

В статье представлен метод автоматического исправлении ошибок в текстовых сообщениях на якутском языке с помощью гармонии гласных. Для автоматического исправления ошибок в Интернет-форумах создана программа на языке PHP.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматическое исправление ошибок в якутском языке с помощью гармонии гласных»

Спутники ДЗЗ работают по большей части на круговых орбитах, что позволяет получать изображения объектов наблюдения примерно одного качества и масштаба.

Часто эта орбита солнечно-синхронная, необходимая для съемки районов наблюдения с постоянной освещенностью, то есть при одной и той же высоте Солнца над горизонтом на заданной широте. За сутки спутник совершает около пятнадцати витков, раз в несколько дней делая полный обзор поверхности Земли.

Список литературы:

1. Сухих В.И. Аэрокосмические методы в лесном хозяйстве и ландшафтном строительстве.

2. Сайт научного центра оперативного мониторинга земли (НЦ ОМЗ) [Электронный ресурс]. - Режим доступа: http://www.ntsomz.ru.

3. Разработка геоинформационных систем [Электронный ресурс]. - Режим доступа: http://www-sbras.nsc.ru.

АВТОМАТИЧЕСКОЕ ИСПРАВЛЕНИЕ ОШИБОК В ЯКУТСКОМ ЯЗЫКЕ С ПОМОЩЬЮ ГАРМОНИИ ГЛАСНЫХ

© Леонтьев Н.А.*

Северо-Восточный федеральный университет им. М.К. Аммосова,

г. Якутск

В статье представлен метод автоматического исправлении ошибок в текстовых сообщениях на якутском языке с помощью гармонии гласных. Для автоматического исправления ошибок в Интернет-форумах создана программа на языке PHP.

Ключевые слова: автоматическое исправление ошибок, якутский язык, гармония гласных.

Развитие информационных технологий в области обработки текста позволило внедрить в программы редактирования национальные алфавиты. Широко развиваются мультиязычные системы, поддерживающие различные языки и диалекты. В настоящее время почти все европейские языки и языки мира, имеющие широкое распространение внедрены в системы обработки текста. Информационная поддержка языков народов России пока только развивается, одним из языков распространенных на северо-востоке России, является якутский язык. На якутском языке или языке cаха говорят, пишут и читают порядка полумиллиона человек. Основная часть говорящих

* Доцент кафедры Радиотехники и информационных технологий, кандидат технических наук.

26

ПЕРСПЕКТИВЫ РАЗВИТИЯ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

на якутском языке живут в Республике Саха (Якутия). Системы автоматической обработки текста на якутском языке только начали развиваться, но автоматическая коррекция текста отсутствует.

На Интернет серверах развита система обсуждений на якутском языке, но довольно часто в текстовых сообщениях идет использование транслитераци-онной записи якутских национальных букв. В якутском алфавите используются кириллические буквы русского алфавита и дополнительно пять букв национального алфавита (в, Ь Y, к). В ходе транслитерации часто используют букв «у» и «е», вместо национальных букв «р> и «в», соответственно. Особенностью якутского языка является создание новых форм слова с помощью аффиксов, что затрудняет поиск по словарю, как в других языках.

В данной статье рассматривается способ автоматической исправления ошибок с помощью правил языка, в частности исправления гласных с помощью правила гармонии гласных.

Употребление гласных в якутском языке регулируются правилами звуковой гармонии Произношение задних (а, ы, о, у) и передних (э, и, в, Y) гласных различается по положении языка, также разделяют на узкие (ы, и, у, Y) и широкие (а, э, о, в) [1, с. 17].

Звуковая гармония гласных:

1. Если в первом слоге имеется задний гласный, то и в следующих слогах должны быть задние гласные. И соответственно, если в первом слоге передние гласные, то и в следующих слогах передние гласные.

2. За широким гласным может последовать такой же широкий или соответствующим ему узкий гласный. За узким гласным может последовать такой же узкий или соответствующий ему широкий [1, с. 20].

В литературе [2, с. 10] приведена табл. 1, где расписаны сочетания гласных букв в слове.

Таблица 1

Сочетание гласных

Если, в предыдущем слоге стоит В следующем слоге Примеры

и, э, иэ и, э, иэ Билии, кэлиэ, биэриэм,

ы, а ыа ы, а, ыа Ылыам, талыым, кыайыам

у Уо о У, о, уо Булуум, буойуум, сотуум

Y, ув Y, э, Ye сYвPYYм, CYeрээр, CYeрYe

в Y, в, Ye керуум, кврввр

Автором была написана программа для автоматической коррекции гласных с помощью правила гармонии гласных на языке PHP с использование

библиотеки Multibyte String Functions, которая поддерживает стандарт Unicode и кодировку UTF-8 [3].

Программа осуществляет проверку входного текста на принадлежность к якутскому языку. Проверка осуществляется через подпрограмму использующие методы словарного сравнения и анализа диграмм якутского языка.

Все слова, в которых имеют от двух гласных, должны быть проверены на гармонию гласных.

Такая проверка позволяет провести быструю проверку гласных на правильность и автоматически исправить ошибки, в словах, где количество гласных начинается от двух.

После анализа текста было выявлено, что в текстовых сообщениях имеются повторяющиеся опечатки . В частности, вместо букв «y» пишут букву «у». Вместо «е» пишут букву «е». Иногда встречается сочетание «уо» вместо «уе», но такую ошибку трудно обнаружить, так как в слове заменяют все буквы «y» на «у», из-за такой замены невозможно применить правило гармонии гласных. Поэтому порядок обнаружение ошибок был изменен, в случае ошибки сочетания букв «у» и «э», полагалось, что ошибка заключается в букве «у» и происходило замена его на букву «y».

Метод показал, что таким способом можно автоматически исправлять ошибки в случае нарушения правила гармонии гласных. Для дальнейшего развития автоматической коррекции ошибок в тексте на якутском языке, необходимо разработка методов действующих согласно грамматики языка и также с помощью статистических методов.

Список литературы:

1. Харитонов Л.Н. Самоучитель якутского языка. - Якутск: Кн. изд-во, 1987. - 232 с.

2. Дьячковский Н.Д. и др. Поговорим по-якутски. Самоучитель якутского языка. - Якутск: Кн-ж изд-во. 1987. - 160 с.

3. http://www.php.net.

УПРАВЛЕНИЕ РАЗРАБОТКОЙ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ТРЕНАЖЕРА ИНФОРМАЦИОННО-УПРАВЛЯЮЩЕЙ СИСТЕМЫ МКС

© Логиневский П.С.*

Московский государственный университет леса, г. Мытищи

Разработка программного обеспечения тренажера информационно-управляющей системы МКС предполагает участие в совместной работе большого количества специалистов. Для обеспечения их успешной

* Магистрант кафедры Вычислительной техники.

i Надоели баннеры? Вы всегда можете отключить рекламу.