Научная статья на тему 'Программа распознавания шрифта Брайля'

Программа распознавания шрифта Брайля Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1047
171
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ШРИФТ БРАЙЛЯ / РАСПОЗНАВАНИЕ ОБРАЗОВ / КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ / СИСТЕМА ЗНАКОВ ДЛЯ СЛЕПЫХ / НЕЗРЯЧИЕ ЛЮДИ / BRAILLE / PATTERN RECOGNITION / COMPUTER MODELING / SYSTEM OF SIGNS FOR BLIND PEOPLE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Конобеева Наталия Николаевна, Полунина Александра Анатольевна, Кругляков Александр Викторович, Белоусов Антон Владимирович

Изучены методы распознавания образов, а также принцип написания шрифта Брайля. Составлен алгоритм, который послужил основой для написания программы. Разработана и протестирована программа распознавания шеститочечного шрифта Брайля для русских и английских символов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Конобеева Наталия Николаевна, Полунина Александра Анатольевна, Кругляков Александр Викторович, Белоусов Антон Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROGRAMM OF BRAILLE RECOGNITION

The Braille system has been used by the visually impaired for writing and reading. According to limited availability of the Braille text books an efficient usage of the books becomes a very important. This paper considers a problem to convert a scanned Braille document to text. The Braille cells are segmented. And the dots from each cell is extracted and converted in to a number sequence. These are mapped to the suitable alphabets of the language. The Braille cell has a standard representation but the mapping differs for each language. In this paper mapping of English, and Russian are considered. We use the method of comparison to the prototype. In the process of recognition of Braille in the preparatory phase we determine the completeness of a group of cells on the basis of which we obtain data about the width and height of the group. And knowing the distance between the groups, we analyze the results of Braille detection. In this paper the algorithm that formed the basis for creating optical character recognition program was compiled. Six-point recognition software Braille for Russian and English characters was developed and was tested. Our application provides the ability to customize the grid on the document. In the result we can increase the number of recognized characters.

Текст научной работы на тему «Программа распознавания шрифта Брайля»

© Конобеева Н.Н., Полунина А.А., Кругляков А.В., Белоусов А.В., 2015

www.volsu.ru

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

DOI: http://dx.doi.org/10.15688/jvolsu1.2015.2.6

УДК 004.93 ББК 32.973.26-018.2

ПРОГРАММА РАСПОЗНАВАНИЯ ШРИФТА БРАЙЛЯ

Конобеева Наталия Николаевна

Кандидат физико-математических наук, доцент кафедры информационных систем и компьютерного моделирования,

Волгоградский государственный университет yana_nn@inbox.ru, infomod@volsu.ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Полунина Александра Анатольевна

Магистрант, кафедра информационных систем и компьютерного моделирования, Волгоградский государственный университет polunina_a@mail.ru, infomod@volsu.ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Кругляков Александр Викторович

Студент, кафедра информационных систем и компьютерного моделирования,

Волгоградский государственный университет infomod@volsu. ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Белоусов Антон Владимирович

Огудент, кафедра информационных систем и компьютерного моделирования,

Волгоградский государственный университет infomod@volsu. ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Аннотация. Изучены методы распознавания образов, а также принцип написания шрифта Брайля. Составлен алгоритм, который послужил основой для написания программы. Разработана и протестирована программа распознавания шеститочечного шрифта Брайля для русских и английских символов.

Ключевые слова: шрифт Брайля, распознавание образов, компьютерное моделирование, система знаков для слепых, незрячие люди.

ISSN 2222-8896. Вестн. Волгогр. гос. ун-та. Сер. 1, Мат. Физ. 2015. № 2 (27) 53

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Введение

Шрифт Брайля - это рельефно-точечный текстильный стиль, предназначенный для письма и чтения незрячими людьми; система обозначения букв, цифр, математических, химических и нотных знаков для слепых [3; 11; 13].

Для изображения букв в шрифте Брайля используются 6 точек, расположенных в два столбца, по 3 в каждом. Одной из особенностей шрифта Брайля является то, что пишется текст справа налево, затем страница переворачивается, и текст читается слева направо. При письме прокалываются точки, и поскольку читать можно только по выпуклым точкам, «писать» текст приходится с обратной стороны листа. В этом заключается одна из сложностей при обучении этому шрифту [8].

В шеститочечном шрифте Брайля существует 64 разных символа (26): 63 информативных и пробел, а в расширенном восьмиточечном - 256 (28): 255 информативных и пробел [1; 10].

Специфика распознавания брайлевского текста заключается в том, что брайлевский символ не является замкнутой структурой, как обычный печатный символ, а является совокупностью отдельных точек. Взаимное геометрическое положение точек и определяет сам символ. На однозначность восприятия брайлевского символа в значительной степени влияют соседние символы, а то и вся брайлевская строка. Эти, а также другие особенности, потребовали разработки уникальных для брайлевского текста алгоритмов распознавания и построения работы оператора в целом [5; 6; 8; 12].

1. Методы распознавания образов

Выделяется два основных способа представления знаний:

- интенсиональное, в виде схемы связей между атрибутами (признаками);

- экстенсиональное, с помощью конкретных фактов (объекты, примеры).

Интенсиональное представление фиксируют закономерности и связи, которыми объясняется структура данных. Применительно к диагностическим задачам такая фиксация заключается в определении операций над атрибутами (признаками) объектов, приводящих к требуемому диагностическому результату. Интенсиональные представления реализуются посредством операций над значениями атрибутов и не предполагают произведения операций над конкретными информационными фактами (объектами) [2; 4].

В свою очередь, экстенсиональные представления знаний связаны с описанием и фиксацией конкретных объектов из предметной области и реализуются в операциях, элементами которых служат объекты как целостные системы [7; 9].

Способы, описанные выше, позволяют предложить следующую классификацию методов распознавания образов:

- интенсиональные методы, которые основаны на операциях с признаками;

- экстенсиональные методы, которые основаны на операциях с объектами.

Важно то, что существование этих двух групп методов распознавания: оперирующих с признаками и оперирующих с объектами, закономерно. С такой точки зрения никакой из этих методов не позволяет сформировать адекватное отражение предметной области. Перспективные системы распознавания должны обеспечивать реализацию двух этих методов, а не только какого-либо одного из них [5; 8; 10].

Методы распознавания образов:

1. Интенсиональные методы.

2. Методы, основанные на оценках плотностей распределения значений признаков.

54 Н.Н. Конобеева, А.А. Полунина, А.В. Кругляков, А.В. Белоусов. Программа распознавания шрифта Брайля

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

3. Методы, основанные на предположениях о классе решающих функций.

4. Логические методы.

5. Лингвистические, структурные методы.

6. Экстенсиональные методы.

7. Метод сравнения с прототипом.

8. Метод k ближайших соседей.

В данной работе используется метод сравнения с прототипом. В процессе распознавания шрифта Брайля на подготовительном этапе будем определять полноту группы ячеек, на основе чего получим данные о ширине и высоте группы, и, зная расстояние между группами, проведем анализ для распознавания шрифта Брайля.

Полнота группы - группа, удовлетворяющая полноте первой и второй степени.

Первая степень полноты группы - группа, в которой максимальная ширина достигается суммой двух ячеек (в группе должны присутствовать ячейки в 1-м или 2-м или 3-м секторе и в 4-м или 5-м или 6-м секторе).

Вторая степень полноты группы - группа, в которой максимальная высота достигается суммой трех ячеек (в группе должны присутствовать ячейки в 1-м или 4-м секторе, во 2-м или 5-м секторе и в 3-м или 6-м секторе).

2. Результаты компьютерного моделирования

Стандартная страница с текстом Брайля вмещает до 25 строк по 40-43 ячейки. Наличие или отсутствие точек в ячейке (продавленных грифелем в специальной плотной бумаге) дает определенный символ. Высоты точки в 0,5 мм достаточно для ее распознавания на ощупь [6].

Для написания шрифта Брайля используют специальный трафарет с подложкой, в который вкладывается специальный лист плотной бумаги, который хорошо держит форму. На рисунке 1 представлен порядок чтения и написания точек в ячейке.

Рис. 1. Нумерация мест положения точек в ячейке

ISSN 2222-8896. Вестн. Волгогр. гос. ун-та. Сер. 1, Мат. Физ. 2015. № 2 (27) 55

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Реализованная программа распознает шрифт Брайля и транслирует его как в английский, так и в русский алфавит. Алгоритм распознавания приведен в виде блок-схемы (см. рис. 2). Рассмотрим основные этапы процесса распознавания шрифта Брайля.

Для начала находим и анализируем все ячейки, двигаясь относительно анализируемой ячейки вправо, влево, вверх и вниз (рис. 3).

Рис. 2. Блок-схема программы

* • * * • • ф ф ф'

* * ф ф

* * • * * ф

• * ф * ф ф

ф'ф ф * * * ф ф

* * * * ф ф ф ф

• ф ф'ф • • ф ф ф ф

* * • # ф ф

• * * * ф ф ф

* • * * ф ф

• • • * * • * [«1 ф « ф ф ф ф ф ф

• * * ф ф ф ф ф фф ф

* * ф * • ф

* * * * * • ф * * * # ф ф ф ф ф ф

• ф • * • * •1 • * ф ф ф ф ф

* * ф • * * ф ф ф ф фф фф

*'

* ф' 1# * 1# * ф ф ф ф ф

* * ф ф * ф * * *

Рис. 3. Начало анализа

56 Н.Н. Конобеева, А.А. Полунина, А.В. Кругляков, А.В. Белоусов. Программа распознавания шрифта Брайля

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Затем производим группировку ячеек, объединяя в группу ячейки, находящиеся в непосредственной близости друг от друга. Проверяем полученные группы на полноту.

Анализируя группу, удовлетворяющую полноте первой степени, находим расстояние по горизонтали между группами ячеек (рис. 4).

* * 4'4 4 4

4 4 4 ф

• 4 4 4 4 4 4 4 4 4 4 4 4

• 4 4 4 'А 4 4 4

4 4 4 4 4 4 4 4

# 4 4 4 '4 4 4 4 4 ф|

<4 4 4 4 4 41 4

* 4 4 4 4 4 4

* 4 4 4 4 4<

* • 4 4 4 4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4 4 4i 4 4 4 4 Ф 4'

4 41 4 4 4 4 4 4 4 4 •

* 4 4 4 4 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• ■ 4 4 4 4 4 & 4 4 4 4 4 4 4 4 4

* * 4 4 4 4 4 4 <4 4 4 4 4 4

4 4 4 4 4 4 4 4 4 4 4 4 4 4

*

4 4 4 4 ф 4 4 4 4 4 4

4 4 4 4 4 4 4 4

Рис. 4. Полнота первой степени

Анализируя группу, удовлетворяющую полноте второй степени, находим расстояние по вертикали между группами ячеек (рис. 5).

4 4 *4 4 4 4' "4 4

4 4 4 4

4 4 4 4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4

4 4 4 4 4 4 4

4' 4 4 ■ 4 4

4« А1 4 4 4 4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4

4 4 4' 4 4 4 4' 4 4 4 4 4 4 4 4 4

4 4 4' 4 4 4 4 4 4 4 4' 4 4 Ф

4 4 4 4 4 4 4 '4 4 4 4 4 4 4

4

4 4 4 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 4 4

Рис. 5. Полнота второй степени

Находим группу, удовлетворяющую правилу полноты. На основе найденной группы определяем высоту и ширину группы.

55

ISSN 2222-8896. Вестн. Волгогр. гос. ун-та. Сер. 1, Мат. Физ. 2015. № 2 (27)

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Имея данные о ширине и высоте группы, а также зная расстояние между группами, накладываем аналитическую сетку для последующего распознавания шрифта Брайля.

Сверяя список всех ячеек, с аналитической сеткой производим перегруппировку групп. Анализируя группы, распознаем шрифт Брайля.

В результате работы программы текст успешно распознан и выведен на экран (рис. 6).

Выделим необходимые условия работы алгоритма:

1. Ячейки не должны быть полыми внутри.

2. Текст должен соответствовать определенному стандарту. Символы и ячейки должны находиться на одинаковом расстоянии друг между другом.

3. Одна из групп должна удовлетворять полноте.

СПИСОК ЛИТЕРАТУРЫ

1. Айзерман, М. А. Метод потенциальных функций в теории обучения машин / М. А. Айзерман, В. Н. Вапник, Л. И. Розоноэр. - М. : Наука, 1970. - 386 с.

2. Вапник, В. Н. Алгоритмы обучения распознавания образов / В. Н. Вапник. -М. : Советское радио, 1973. - 200 с.

3. Васильев, В. И. Распознающие системы. Справочник. - 2-е изд. - Киев : Наукова думка, 1983. -

424 с.

4. Горелик, А. Л. Методы распознавания / А. Л. Горелик, В. А. Скрипкин. - 4-е изд. - М. : Высшая школа, 2004. - 262 с.

5. Минский, М. Персептроны / М. Минский, С. Пейперт. - М. : Мир, 1971. - 262 с.

6. Никулина, Г. А. Обучение письму и чтению по системе Брайля / Г. А. Никулина. - СПб. : КАРО, 2006. - 576 с.

7. Скит, Дж. C# для профессионалов: тонкости программирования / Дж. Скит. 3-е изд., новый перевод = C# inDepth, 3rd ed. - М. : Вильямс, 2014. - 608 с.

8. Смирнов, С. И. Шрифт и шрифтовой плакат / С. И. Смирнов. - М. : Плакат, 1977. - 148 с.

58 Н.Н. Конобеева, А.А. Полунина, А.В. Кругляков, А.В. Белоусов. Программа распознавания шрифта Брайля

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

9. Стокман, Дж. Компьютерное зрение = ComputerVision / Дж. Стокман, Л. Шапиро. - М. : Бином. Лаборатория знаний, 2006. - 752 с.

10. Фомин, Я. А. Статистическая теория распознавания образов / Я. А. Фомин, Г. Р. Тарловский. -М. : Радио и связь, 1986. - 624 с.

11. Padmavathi, S. Conversion of Braile to text in English, Hindi and Tamil languages / S. Padmavathi, K.S.S Manoja, S. Sphoorthy Reddy, D. Meenakshy // Int. J. Copm. Science, Engineering and Applications. -2013. - Vol, 3, № 3. - 14 p.

12. Rassel, J. Computer font. / J. Rassel // Book on demand. - N. Y., 1978. - 102 p.

13. Ruder, E. Typography / E. Ruder // Book on demand. - N. Y., 1980. - 288 p.

REFERENCES

1. Aizerman M.A., Vapnik V.N., Rozonoer L.I. Metod potentsialnykh funktsiu v teorii obucheniya mashin [The Potential Functions Method in the Theory of Machine Learning]. Moscow, Nauka Publ., 1970. 386 p.

2. Vapnik V.N. Algoritmy obucheniya raspoznavaniya obrazov [Learning Algorithms for Pattern Recognition]. Moscow, Sovetskoe radio Згидю, 1973. 200 p.

3. Vasilyev V.I. Raspoznayushchie sistemy. Spravochnik [Recognizing Systems. Reference Book]. Kiev, Naukova dumka Publ., 1983. 424 p.

4. Gorelik A.L., Skripkin V.A. Metody raspoznavaniya [Methods of Recognition]. Moscow, Vysshaya shkola Publ., 2004. 262 p.

5. Minskii M., Peipert S. Perseptrony [Perceptrons]. Moscow, Mir Publ., 1971. 262 p.

6. Nikulin G.A. Obuchenie pismu i chteniyu po sisteme Brailya [Learning to Read and Write by Braille System]. Saint Petersburg, KARO Publ., 2006. 576 p.

7. Skit Jon. C# dlya professionalov: tonkosti programmirovaniya [C# for Professionals. Programming Skills]. Moscow, Vilyams Publ., 2014. 608 p.

8. Smirnov S.I. Shrift i shriftovoyplakat [Font and Font Poster]. Moscow, Plakat Publ., 1977. 148 p.

9. Stokman Dzh., Shapiro L. Kompyuternoe zrenie [Computer Vision]. Moscow, Binom. Laboratoriya znaniy Publ., 2006. 752 p.

10. Fomin Ya.A., Tarlovskiy G.R. Statisticheskaya teoriya raspoznavaniya obrazov [Statistical Theory of Pattern Recognition]. Moscow, Radio i svyaz Publ., 1986. 624 p.

11. Padmavathi S., Manoja K.S.S., Reddy Sphoorthy S., Meenakshy D. Conversion of Braile to Text in English, Hindi and Tamil languages. Int. J. Copm. Science, Engineering and Applications, 2013, vol. 3, no. 3. 14 p.

12. Rassel J. Computer font. Book on demand. N. Y., 1978. 102 p.

13. Ruder E. Typography. Book on demand. N. Y., 1980. 288 p.

PROGRAMM OF BRAILLE RECOGNITION

Konobeeva Natalia Nikolaevna

Candidate of Physical and Mathematical Sciences,

Associate Professor,

Department of Information Systems and Computer Modeling,

Volgograd State University yana_nn@inbox.ru, infomod@volsu.ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

59

ISSN 2222-8896. Вестн. Волгогр. гос. ун-та. Сер. 1, Мат. Физ. 2015. № 2 (27)

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ----

Polunina Aleksandra Anatolyevna

Master Student, Department of Information Systems and Computer Modeling,

Volgograd State University polunina_a@mail.ru, infomod@volsu.ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Kruglyakov Aleksandr Viktorovich

Student, Department of Information Systems and Computer Modeling,

Volgograd State University infomod@volsu. ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Belousov Anton Vladimirovich

Student, Department of Information Systems and Computer Modeling,

Volgograd State University infomod@volsu. ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Abstract. The Braille system has been used by the visually impaired for writing and reading. According to limited availability of the Braille text books an efficient usage of the books becomes a very important. This paper considers a problem to convert a scanned Braille document to text. The Braille cells are segmented. And the dots from each cell is extracted and converted in to a number sequence. These are mapped to the suitable alphabets of the language. The Braille cell has a standard representation but the mapping differs for each language. In this paper mapping of English, and Russian are considered.

We use the method of comparison to the prototype. In the process of recognition of Braille in the preparatory phase we determine the completeness of a group of cells on the basis of which we obtain data about the width and height of the group. And knowing the distance between the groups, we analyze the results of Braille detection.

In this paper the algorithm that formed the basis for creating optical character recognition program was compiled. Six-point recognition software Braille for Russian and English characters was developed and was tested. Our application provides the ability to customize the grid on the document. In the result we can increase the number of recognized characters.

Key words: Braille, pattern recognition, computer modeling, system of signs for blind people, blind people.

Н.Н. Конобеева, А.А. Полунина, А.В. Кругляков, А.В. Белоусов. Программа распознавания шрифта Брайля

i Надоели баннеры? Вы всегда можете отключить рекламу.