Научная статья на тему 'Выделение признаков в задаче распознавания рукописных текстов'

Выделение признаков в задаче распознавания рукописных текстов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
245
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗОВЫЕ ФРАГМЕНТЫ ИЗОБРАЖЕНИЙ / РАСПОЗНАВАНИЕ РУКОПИСНЫХ СИМВОЛОВ / ПРИЗНАКИ РУКОПИСНЫХ СИМВОЛОВ / ПРЕДПОЧТИТЕЛЬНОСТЬ ПРИЗНАКОВ РУКОПИСНЫХ СИМВОЛОВ / СИЛЬНОСВЯЗАННОСТЬ ПРИЗНАКОВ / BASIC IMAGES PATCHES / HANDWRITTEN CHARACTERS RECOGNITION / FEATURES OF HANDWRITTEN CHARACTERS / FEATURES PREFERENCE OF HANDWRITTEN CHARACTERS / FEATURES STRONG COHESION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фазылов Ш. Х., Мирзаев Н. М., Каримов И. К., Даминов О. А.

Рассматриваются вопросы построения алгоритмов выделения признаков при распознавании рукописных текстов. При этом используется эвристический подход, основанный на анализе этих изображений. На базе этого подхода предлагаются алгоритмы формирования характерных признаков рукописных символов. Основная идея предлагаемых алгоритмов состоит в формировании набора предпочтительных признаков, характеризующих статистические характеристики рукописных символов, и принятия решений на основе сопоставления этих признаков. Эти характеристики определяются для каждого фрагмента исходного изображения рукописных символов. Для проверки работоспособности предложенных алгоритмов проведены экспериментальные исследования при решении задачи распознавания рукописных символов по их изображениям.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фазылов Ш. Х., Мирзаев Н. М., Каримов И. К., Даминов О. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Feature extraction in the problem of handwritten text recognition

The article deals with making feature extraction algorithms while recognizing handwritten texts. For this purpose we use heuristic approach based on the analysis of these images. Algorithms of specific character formation of handwritten symbols are proposed on the base of this approach. The basic idea of the proposed algorithm is to build a set of preferred features which are typical of statistical characteristics of handwritten characters and to make decisions based on the comparison of these features. These characteristics are determined for each fragment of the given image of handwritten symbols. To test the efficiency of the proposed algorithms experimental studies were conducted in solving the problem of recognizing handwritten characters by their images.

Текст научной работы на тему «Выделение признаков в задаче распознавания рукописных текстов»

УДК: 004.932.75'1

ВЫДЕЛЕНИЕ ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ РУКОПИСНЫХ ТЕКСТОВ

Ш.Х. Фазылов1, Н.М. Мирзаев1, И.К. Каримов2, О.А. Даминов1

1Центр разработки программных продуктов и аппаратно-программных комплексов при Ташкентском университете информационных технологий,

Ташкент, 100125 2Камчатский государственный технический университет, Петропавловск-Камчатский, 683003

e-mail: karimov_ik@kamchatgtu. ru

Рассматриваются вопросы построения алгоритмов выделения признаков при распознавании рукописных текстов. При этом используется эвристический подход, основанный на анализе этих изображений. На базе этого подхода предлагаются алгоритмы формирования характерных признаков рукописных символов. Основная идея предлагаемых алгоритмов состоит в формировании набора предпочтительных признаков, характеризующих статистические характеристики рукописных символов, и принятия решений на основе сопоставления этих признаков. Эти характеристики определяются для каждого фрагмента исходного изображения рукописных символов. Для проверки работоспособности предложенных алгоритмов проведены экспериментальные исследования при решении задачи распознавания рукописных символов по их изображениям.

Ключевые слова: базовые фрагменты изображений, распознавание рукописных символов, признаки рукописных символов, предпочтительность признаков рукописных символов, сильносвязанность признаков.

Feature extraction in the problem of handwritten text recognition. Sh.Kh. Fazilov1, N.M. Mirzaev1,

I.K. Karimov2, O.A. Daminov1 (1Centre for the development of software and hardware-program complexes of the Tashkent university of information technologies, Tashkent, 100125; 2Kamchatka State Technical University, Pe-tropavlovsk-Kamchatsky, 683003)

The article deals with making feature extraction algorithms while recognizing handwritten texts. For this purpose we use heuristic approach based on the analysis of these images. Algorithms of specific character formation of handwritten symbols are proposed on the base of this approach. The basic idea of the proposed algorithm is to build a set of preferred features which are typical of statistical characteristics of handwritten characters and to make decisions based on the comparison of these features. These characteristics are determined for each fragment of the given image of handwritten symbols. To test the efficiency of the proposed algorithms experimental studies were conducted in solving the problem of recognizing handwritten characters by their images.

Key words: basic images patches, handwritten characters recognition, features of handwritten characters, features preference of handwritten characters, features strong cohesion.

В последние годы стоимость хранения текстовых документов на современных компьютерах постоянно снижается. Вместе с тем объемы их обработки непрерывно увеличиваются, а разработанные системы автоматизированного ввода подобной информации в компьютер не обеспечивают удовлетворительного выполнения данной работы. Исключением являются лишь печатные документы хорошего качества [1]. Поэтому вопросы разработки, модификации и усовершенствования алгоритмов распознавания рукописных текстов являются актуальными.

Известно [2, 3], что задача распознавания произвольного текстового документа оказывается настолько сложной, что в общем виде решить ее пока невозможно. Однако при введении ряда ограничений данная задача значительно упрощается.

В работе рассматривается задача распознавания рукописных текстов, написанных разными людьми при выполнении тестовых заданий по различным предметам. При этом курс, группа, Ф.И.О студента и название предмета, а также соответствующие цифровые коды для этих атрибутов написаны печатным шрифтом на определенном участке документа, что позволяет распознать данную часть документа достаточно точно.

Цель данной работы - разработка алгоритмов формирования признаков, характеризующих рукописные буквы.

Основные понятия и обозначения. Опираясь на [4], введем некоторые понятия и обозначения. Рукописную букву Н назовем допустимым рукописным объектом, а совокупность всех H - множеством допустимых рукописных объектов и обозначим через H . Описание рукописного объекта Н задается в виде щ х пж -мерной матрицы. Множество матриц, соответствующих всем допустимым рукописными объектам, назовем пространством исходных признаков и обозначим через X : X = х. .

I .\пкп„

Тогда каждому рукописному объекту Н (Н е Н) в пространстве исходных признаков X соответствует его описание (матрица числовых характеристик) /„ (И) : /х (И) = щ .

I ■\пкп„

Пусть множество Н состоит из I непересекающихся подмножеств (классов) К,К2К . При этом следует отметить, что любой допустимый объект может быть одной буквой, написан конкретным человеком и принадлежит некоторому классу К . Таким образом, в каждом подмножестве рукописных объектов представлена информация только об одной букве, написанной разными людьми:

I

Н = и К,, К пК =0, ■ * ] , , е{1,...,1} .

.=1 .

В задачах распознавания рукописных объектов предполагается, что разбиение Н определено не полностью, а имеется некоторая начальная информация Е0 о классах К1,К2,...,Кг.

Пусть в пространстве исходных признаков X задано т объектов Нх,...,Нм,...,Нт (УИя е И, и = 1,т). Введем следующие обозначения [3]:

Нт = {Н15...5Нг,...,Нт}, К; = Ит пК, СК; = Ит \К;.

Тогда начальную информацию Е0 зададим в виде

Е0 = {Н1,...,Нг,...,Нт; а(Н1>,...,а(Нг)......«(Нщ)}, (1)

где a(Hi) - информационный вектор объекта Hi:

_ 11, если Н е К};

~(Нг ) = (аг\,...,ау ,...,а.1 ) , аг} =\ ~

|^0, если Н е СК}.

Совокупность информационных векторов, соответствующих объектам Нт , образует информационную матрицу а,, .

II г\\тх1

Постановка задачи. Имеется начальная информация Е0, заданная в виде (1). Требуется построить такой оператор, который позволяет сформировать пространство признаков, характеризующее каждый рассматриваемый класс объектов:

р : 1х(Н) = J(H), J(H) = (X!,...,Хг,...,Хщ),

где р - оператор, отображающий исходное изображение в пространстве признаков J(Н) .

Определение набора признаков {х1;...,хг,...,хп } осуществляется по заданной начальной информации Е0 на основе анализа исходных изображений рукописных объектов. При этом эти признаки должны в достаточной мере характеризовать различия рукописных объектов, принадлежащих к разным классам, и давать возможность для оценки сходства рукописных объектов, принадлежащих одному и тому же классу.

Метод решения. В настоящей работе рассматривается подход к решению задачи выделения признаков при распознавании рукописных объектов по их изображениям, основанный на статистическом анализе. На базе этого подхода предлагается модель операторов выделения признаков рукописного объекта, заданного в виде изображений. Основная идея предлагаемой модели со-

стоит в формировании пространства предпочтительных признаков при распознавании рукописных объектов. Для описания каждого исходного изображения вычисляются соответствующие статистические характеристики [5].

Предлагаемая модель операторов выделения характерных признаков включает следующие основные этапы.

1. Формирование опорных подмножеств. Первым этапом задания модели операторов является формирование системы опорных подмножеств исходных признаков Ъ (Ъ = {Г,...,Г}), зависящей от параметра к (k = кь х к^, где кй - число делений изображения по высоте; кж - число делений изображения по ширине). Данный параметр указывает мощность опорных подмножеств. Требуется, чтобы мощность всех подмножеств была одинакова.

В результате выполнения данного этапа формируется к одинаковых прямоугольных фрагментов. Если размерность исходного изображения составляет пя х пж пикселей, то полученные фрагменты изображения будут состоять из тк х пк (тк = пь/кь , пк = ^ ) пикселей. При

наличии остатков от деления размеры фрагментов изображения увеличиваются на один пиксель, начало остальных сдвигается влево (вверх) на один пиксель.

В зависимости от способа формирования системы базовых фрагментов Гк (к = 1, к) можно получить разнообразные алгоритмы выделения признаков.

2. Определение набора характерных признаков. На данном этапе формируется набор характерных признаков, которые определяются как выборочные моменты. Известно [6], что момент

порядка т (т = (р + д)) случайной величины /(х, у) ((х, у) е Ни) определяется как

трч = ^ 2хPy9f(х,у), N =1Гк1, аде[0,1,...,£].

^ (х,у)еН„

Кроме рассмотренных характеристик в качестве характерных признаков объекта можно вычислить энтропию, автокорреляцию, центральные моменты и др.

В результате выполнения данного этапа получаем набор характерных признаков. Сформированное пространство признаков обозначим через У (У = (ух,...,у*хР )).

3. Выделение подмножеств сильносвязанных признаков. На этом этапе определяется система «независимых» подмножеств сильносвязанных признаков [7].

В результате выполнения данного этапа определяется совокупность «независимых» подмножеств сильносвязанных признаков = {Г, Г2 ,...,ГИ,}. Число выделенных подмножеств будет зависеть от параметра п . Задавая этому параметру различные целочисленные значения, можно получить различные алгоритмы.

4. Определение предпочтительных признаков. Рассмотрим подмножества { Г ,...,Г? ,•••, Г' },

которые определены на предыдущем этапе. Для каждого подмножества сильносвязанных признаков Г на данном этапе определяется предпочтительный признак, который обозначается через % . В

результате формируется набор предпочтительных признаков. При этом каждый предпочтительный признак из этого набора будет представлять только одно подмножество сильносвязанных признаков.

Вопросы выделения предпочтительных признаков более подробно рассмотрены в [8]. Таким образом, определена модель операторов формирования набора признаков по изображению рукописных объектов. Для оценки работоспособности рассмотренной модели проведены экспериментальные исследования.

Экспериментальная проверка. В целях оценки работоспособности рассмотренной модели разработаны функциональные схемы и соответствующие алгоритмы, которые определяют структуру создаваемой программы. Программная реализация этих алгоритмов осуществлена на языке Delphi. Работоспособность разработанных программ проверена при решении задачи распознавания рукописных объектов.

Тестовая задача распознавания рукописных объектов сформирована следующим образом. Дано несколько (в данном эксперименте - 300) изображений рукописных букв, которые разделены на пять подмножеств (классы): 1) изображения буквы “а” (К); 2) изображения буквы “б” (К2);

3) изображения буквы “в” (К3); 4) изображения буквы “г” (К4); 5) изображения буквы “д” (К5).

= 60.

К 2

К з

К 4

К 5

При этом мощность каждого подмножества одинакова: Кх

Следует отметить, что разбиение этих изображений на контрольную и обучающую выборки осуществляется по стандартной методике перекрестной проверки: генерируется 10 случайных разбиений выборки на 10 блоков примерно равной длины и с равными долями классов, и каждый блок поочередно становится контрольной выборкой, остальные - обучающей. Точность распознавания определялась как среднее.

Проведенные экспериментальные исследования показали эффективность разработанной модели выделения характерных признаков при решении данной задачи. В результате эксперимента сформирован набор характерных признаков, которые позволяют разбить объекты обучающей выборки на пять классов с приемлемой ошибкой. Распознавание рукописных букв по выделенным признакам осуществлялось с применением алгоритмов, приведенных в работе [9].

Выводы. Предложена модель формирования характерных признаков в задачах распознавания рукописных объектов по их изображениям. При этом формирование характерных признаков опирается на вычисление различных статистических характеристик для каждого фрагмента исходного изображения.

В процессе решения практической задачи определено, что этапы формирования подмножеств «независимых» признаков, а именно вопросы определения числа этих подмножеств и набора предпочтительных признаков по изображению рукописных объектов, имеют наиболее важное значение. Поэтому необходимо продолжить исследования с учетом выявленных направлений.

Разработанная модель может быть использована при составлении различных программных комплексов, ориентированных на решение задачи распознавания рукописных объектов, заданных в виде изображений.

Литература

1. Горский Н.Д., Анисимов В.А., Горская Л.М. Распознавания рукописного текста. - СПб.: Политехника, 1997. - 126 с.

2. Переверзев-Орлов В.С. Модели и методы автоматического чтения. - М.: Наука, 1976. -216 с.

3. Plotz T., Fink G.A. Markov Models for Handwriting Recognition. - New York: Springer, 2011. -75 p.

4. ЖуравлевЮ.И. Избранные научные труды. - М.: Магистр, 1998. - 420 с.

5. Мирзаев Н.М. Модель выделения признаков в задаче диагностики фитосостояния растений по изображениям листьев // Вестник Рязанского государственного радиотехнического университета. - Рязань, 2012. - № 3. - С .17-21.

6. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М.: Техносфера, 2005. - 1072 с.

7. Мирзаев Н.М. Алгоритмы выделения подмножеств сильносвязанных признаков // Вопросы кибернетики: Сб. науч. тр. - Ташкент: ИМИТ АН РУз, 2008. - Вып. 177. - С. 99-104.

8 Модель распознающих операторов, основанных на принципе ближайшего соседа, в условиях взаимосвязанности признаков / Ш.Х. Фазылов, Н.М. Мирзаев, С.С. Раджабов, И.К. Каримов // Информатика и системы управления. - Благовещенск, 2012. - № 4 (34). - С. 34-42.

9. Фазылов Ш.Х., Мирзаев Н.М., Раджабов С.С. Построение модели алгоритмов вычисления оценок с учетом большой размерности признакового пространства // Вестник СГТУ. - Саратов, 2012. - № 1 (64). Вып. 2. - С. 274-279.

i Надоели баннеры? Вы всегда можете отключить рекламу.