Научная статья на тему 'Анализ эффективности метода геометрических моментов в задачах распознавания цифрового текста'

Анализ эффективности метода геометрических моментов в задачах распознавания цифрового текста Текст научной статьи по специальности «Математика»

CC BY
187
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ эффективности метода геометрических моментов в задачах распознавания цифрового текста»

- создание высокопроизводительных технологических схем разработки по принципу "шахта-лава" с нагрузкой 5000-10000 т/сутки с параметрами: длина лавы - 300-400 м; длина столба 3.5-6.0 км.

- сокращение объема проводимых и поддерживаемых выработок в 2-3 раза на 1000 т добычи угля за счет создания нарезных выработок путем крепления части выработанного пространства очистного забоя (рекомендуется

при ограниченных размерах выемочных полей).

Реализация методических принципов совершенствования технологии разработки пластов, теоретические и экспериментальные исследования показали, что предложенные варианты технологических схем очистных работ с высокой нагрузкой и оптимальными параметрами обеспечивают высокую эффективность добычи и конкурентоспособность угольной продукции в условиях рыночных отношений.

— Коротко об авторах ------------------------------------------------

Алиев С.Б. - Российская Академия государственной службы при Президенте РФ. Кушеков К.К. - Карагандинский государственный технический университет (Казахстан).

--------------------------------------- © С.С. Кубрин, А.Б. Исаев,

С. А. Мастеров, 2005

УДК 51

С. С. Кубрин, А.Б. Исаев, С.А. Мастеров

АНАЛИЗ ЭФФЕКТИВНОСТИ МЕТОДА ГЕОМЕТРИЧЕСКИХ МОМЕНТОВ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ЦИФРОВОГО ТЕКСТА

Семинар № 11

роблема оптического распознавания ж. Л. текста, являющаяся в настоящее время одной из важнейших проблем в такой широкой области научных исследований как распознавание образов, решается в настоящее время методов, в том числе различными модификациями метода моментов [1, 2].

В данной работе разработан алгоритм распознавания цифровых символов, реализованный на вычислительной основе метода геометрических моментов, а эффективность работы созданного алгоритма, его универсальность, оценивалась в процессе выполнения вычислительного эксперимента. В ходе выполнения этого эксперимента системе распознавания, состоящей из 1ВМ РС совместимого ПК и программного

обеспечения, разработанного специально для этих задач в среде МЛТЬЛБ. Были предъявлены выборки, состоящие из набора печатных цифр от 0 до 9, причем цифры предварительно были подвергнуты аффинными преобразованиями: растяжению, сжатию, изменению масштаба по осям ОХ и ОУ декартовой системы координат и повороту на различные углы. Разработанный алгоритм продемонстрировал устойчивость к целому ряду искажений текста.

В основе алгоритма распознавания лежит механизм формирования ряда характерных признаков распознаваемых символов. Из этих характерных признаков формируется эталонная база для предъявляемого конечного ряда печатных цифр, и рассчитываются геометрические моменты по-

рядка (р+я) для специальной функции А^х,у), соответствующей бинарным матрицам цифровых эталонов для ряда от «0» до «9». Геометрические моменты порядка (р+я) функции Цх,у) определяются следующим образом [2]:

+да +да

мр п =|| хРУ‘'■? (х, у ) (1)

—да —да

где р,я = 0,1,2,—,да.

Пусть заданно двумерное изображение МхМ {f(x,y); х,у = 0,—,М-1}, тогда (р+я)-й геометрический момент тря определяется как

м—1 м—1

трЧ = 'Е^хРу“/(х, у ). (2)

х=0 у=0

Чтобы сохранить динамический диапазон тря устойчивым к изменению размеров изображений, плоскость изображения МхМ отображается на квадрат (х,у):хе[-1,+1], уе[-1,+1], при этом координатами (х,у) являются действительные числа в интервале [-1,+1]. Тогда определение геометрического момента тря будет следующим:

трЧ = Т Т *ру9/(х, у) (3)

х=-1 у=-1

Центральный момент инвариантный к сдвигу, равен:

Мр9 = Т - х)р(у - y)qf{x,у) (4а)

где

=тк и у = ^.

тг

тп

У =

(4б)

т0

Ю0 "Ю0

Чтобы получить моменты пря, инвариантные к масштабу, нормализуем центральные моменты следующим образом:

п = ^РЧ Р + Ч

РЧ

2 . (5)

^г00

Из пРя можно получить множество нелинейных функций, инвариантных к повороту, сдвигу и масштабу:

Блок-схема алгоритма распознавания символов

Рх =П20 + П

Рі = (П20 -П02)2 + 4ПЛ

Р3 = (п30 — 3п12 ) + (3п21 — П03 )

(Р4 = (П30 +П12)2 + (П +П03)2?

П03)2]

Р5 = (П30 — 3П )(П30 + П2ЖП0 — П12) — 3(П

+(3п21 — П03)(П21 +П03) Х [3(П30 +П12) — (П21 + П30 ) ],

Рб = (П20 — П02 )[(П30 — П12 )2 — (П + П03 )2 ] +

+4^11(п30 +п12)(п21 +П03).

Числовые значения функций рі,...,Рб могут быть малы. Поэтому, чтобы избежать возможных проблем, связанных с разрядностью числа, в качестве признаков, характеризующих изображение, используются логарифмы абсолютных значений этих функций [3].

Для тестирования метода геометрических моментов был выбран набор цифр от «0» до «9». Как объект распознавания они обладают двумя принципиальными особенностями. Первая особенность состоит в том, что по самому способу составления числа из цифр, соседние цифры в числе обычно независимы, то есть взаимно не коррелируются как буквы в словах. Следовательно, для опознавания каждой данной цифры можно воспользоваться только информацией, заклю-

Начало

Загрузка графического файла с эталонами

Применение аффинных преобразований

Преобразование полученного изображения в бинарное СО/1)

Вычисление моментов для преобразования символов

Сохранение полученных данных на диске

Сравнение полученных значений с эталонными

Вывод результатов на экран

’Ч г

Конец

Значение параметра m, % Изменение масштаба, % Растяжение/сжатие по оси OX, % Растяжение/сжатие по оси OY, % Значение параметра m, град Поворот %

-3O 7Q 7Q 8Q O 1QQ

-2S 7Q 8Q 8Q l 1QQ

-2O 8Q 9Q 8Q 2 1QQ

-lS 8Q 9Q 9Q 3 1QQ

-lO 9Q 9Q 9Q 4 1QQ

-S 1QQ 1QQ 9Q S 9Q

O 1QQ 1QQ 1QQ б 9Q

S 1QQ 1QQ 1QQ 7 9Q

lO 1QQ 1QQ 1QQ 8 8Q

lS 9Q 1QQ 1QQ 9 8Q

2O 8Q 9Q 1QQ lO 8Q

2S 7Q 9Q 9Q lS 7Q

3O 7Q 9Q 9Q 2O 7Q

ченной в ней самой.

Вторая особенность состоит в том, что цифры по самому их существу, по той роли, которую они играют в документах, требуется распознать с высокой надежностью, далеко превосходящую надежность, нужную в большинстве других задач распознавания.

Эти перечисленные особенности в большей степени определили метод получения характерных признаков, представленный формулами (1-6). Блок-схема разработанного алгоритма представлена на рисунке. Как видно из блок-схемы алгоритма для реализации процесса распознавания необходимо создать базу эталонов распознаваемых объектов. Были созданы наборы графиче-

1. Файн В.С. Опознавание изображений (основы неперывно-групповой теории и ее приложения). - М.: Наука, 1992. - 296 с.

2. The Cho-Huak, Roland T. Chin. On image analysis by methods of moments // IEEE transactions on pat-

ских файлов, содержащих эталоны цифр от «Q» до «9».

Для исследования эффективности разработанного алгоритма, цифры от «Q» до «9» были подвергнуты изменению масштаба, растяжению/сжатию по оси OX декартовой системы координат, растяжению/сжатию по оси OY декартовой системы координат и повороту на различные углы.

Результатов тестирования (таблица) позволяют сделать вывод об устойчивости разработанного метода геометрических моментов к аффинным преобразованиям (изменение масштаба, растяжение/сжатие по осям координат, поворот) в достаточно большом диапазоне их измерения.

---------------- СПИСОК ЛИТЕРАТУРЫ

tern analysis and machine intelligence. - 1998. - Vol. 1Q. -P. 41Q-423

3. Hu M.K. Visual pattern recognition by moment invariants // IRE transactions on information theory. - 1962. - Vol. 8. - P. 179-187.

— Коротко об авторах -------------------------------------------------------------------------

Кубрин Сергей Сергеевич - профессор, доктор технических наук, Московский государственный горный университет,

Исаев Андрей Борисович - кандидат технических наук, РУДН.

Мастеров Сергей Александрович - магистр, РУДН.

УДК 622.281.74 Е. С. Кулешов

ОЦЕНКА СОСТОЯНИЯ ВЫРАБОТОК С АНКЕРНОЙ КРЕПЬЮ НА ШАХТАХ РОССИЙСКОГО ДОНБАССА (ПРОБЛЕМЫ И РЕШЕНИЯ)

lS7

i Надоели баннеры? Вы всегда можете отключить рекламу.