Научная статья на тему 'Особенность асимптотических свойств интегральных инвариантов'

Особенность асимптотических свойств интегральных инвариантов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
55
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ALGORYTHM / ALPHABET / ASYMPTOTICS / RECOGNIZING / INTEGRAL MOMENTA / INVARIANTS / NON-UNIFORMITY / IDENTIFICARION / АЛГОРИТМ / АЛФАВИТ / АСИМПТОТИКА / ИДЕНТИФИКАЦИЯ / ИНВАРИАНТЫ / ИНТЕГРАЛЬНЫЕ МОМЕНТЫ / НЕРАВНОМЕРНОСТЬ / РАСПОЗНАВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жигалко Е.Ф.

Для инварианта, где центрированный интегральный момент порядка p,q плоской фигуры, определена последовательность некоторых форм фигур, таких, что при, но. Этот результат объясняет неравномерность алгоритмов распознания текстов в некоторых алфавитах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Жигалко Е.Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A Singularity of Integral Moment Invariants

For the geometric invariants, being a centered integral momentum of a plane figure S, a sequence of characters, has been suggested, providing since, while. Image processing algorithms utilizing integral invariants may become nonuniform in presence of characters, close to, within the object set.

Текст научной работы на тему «Особенность асимптотических свойств интегральных инвариантов»

Intellectual Technologies on Transport. 2015. No 4

Особенность асимптотических свойств интегральных инвариантов

Жигалко Е. Ф.

ПГУПС

Санкт-Петербург, Россия kprikmat@pgups.edu

Аннотация. Для инварианта np q =

pq

«0,0

, где mpq - цен-

трированный интегральный момент порядка p, q плоской фигуры, определена последовательность некоторых форм фигур {Sn}, таких, что ||Sn|| = An,An ^ 0 при n ^<», но

( 1 1

. Этот результат объясняет неравномер-

П

p,q

v(An)P+q

ность алгоритмов распознания текстов в некоторых алфавитах.

Ключевые слова: алгоритм, алфавит, асимптотика, идентификация, инварианты, интегральные моменты, неравномерность, распознавание.

Введение

Обнаружено, что в некоторых алфавитах величина интегральных инвариантов некоторых букв существенно больше значений этих инвариантов, подсчитанных для других букв [1, 2]. Понимание этого вопроса важно для построения эффективных алгоритмов распознавания, использующих интегральные инварианты [3-5]. В статье указывается одна последовательность специально подобранных фигур - такая, что значения инвариантов для них неограниченно возрастают.

Интегральные инварианты Рассматриваются инварианты плоских фигур [1]

mp q

np,q = p+q+2 , (1)

(mo,o) 2

где mpq- центрированный интегральный момент порядка p, q фигуры S, задаваемой скалярным полем плотности f (х, у) в декартовых координатах х, у,

mp,q =jj f (х,у)xpyqds ; p,q e{0,1,2,...}; (2)

S

Pi = П2,0 + П0,2 , P2 = (Пз,0 + ni,2)2 + (П2,1 + П0,3)2

и др. [2, 3].

В простом случае плотность фигуры S: f = 1 внутри контура, вне -

f = 0, (3)

а величина интегрального момента mp зависит только от формы фигуры.

Тоновое изображение тоже выражают такими элементарными слоями, производя «векторное квантование» уровня серого или RGB [6].

По свойствам определённого интеграла, если две фигуры Si и S2 равны, то и значения момента mp для них одинаковы (mp q )1 = (mp q )2„ но из (mp,q )1 = (mp,q )2 не следует^,

что Si = S2, поэтому идентификацию S нельзя строить только на значении конкретного mp q.

Распознавание букв

В геометрии, механике, физике применяют интегральные моменты и инварианты для репрезентации главных свойств объектов. Инварианты np q могут быть использованы в алгоритмах идентификации и распознавания элементов из конкретного конечного набора (алфавита) по их изображениям [1], в задачах автоматики, робототехники и информатики.

Применение алгоритмов на интегральных инвариантах для чтения буквенных текстов имеет важные особенности. За редкими исключениями (например, ГОСТ на шрифт чертёжный [7]) для языковых алфавитов не указываются нормативные идеалы. Помимо этого, для букв в принципе допускается вариантность исполнения и погрешность.

В одном из подходов для буквы s подсчитывают значения j первых инвариантов из (1), затем получившийся набор интерпретируют как координаты точки Р (образа s) в j-мерном пространстве с расстоянием, например эвклидовым [8]. По величине расстояния

Я xds

S____

Я ds

■; у = у-

jj yds

s____

Я ds

Формулы (1) определяют для плоских фигур последовательность инвариантов, сохраняющих значения при параллельном переносе и однородном сжатии (растяжении).

Из np q можно собрать однородные полиномы, инвариантные по отношению к другим преобразованиям прообразов,

d1,2 =Ji (((np,q )2 - (np,q \)i Я

между точками p и P2 судят о близости форм фигур s1 и s2.

Применение этой техники к однородному тексту отображает его на множество точек {P}. Если текст достаточно качественный, точки, образы некоторой буквы группируются и отчётливо отдалены от кластеров, соответствующих другим буквам. Это условие, если выполнено для алфавита,

Интеллектуальные технологии на транспорте. 2015. № 4

55

Intellectual Technologies on Transport. 2015. No 4

обеспечивает как обучаемость схемы, так и качественное чтение текстов. Его выполнение достигается настройкой вычислительных параметров схемы при отладке на репрезентативной выборке текстов в конкретном алфавите. Для эффективности подхода число знаков алфавита должно быть небольшим [9-12].

Вопрос о погрешности дигитализации букв существен, поскольку они состоят из нешироких линий, а знаки должны быть достаточно массивными, чтобы при их сеточном представлении доля внутренних полных ячеек была существенно больше доли частичных (на контуре), аппроксимируемых приближённо. В роли меры массивности фигуры можно взять отношение площади S фигуры к её периметру L, отнесённое к значению этой величины для круга, имеющего такую же площадь

2/nS

L

(4)

Инвариант Z

Для круга Z = 1, а для других фигур величина Z е (0,1). Взяв фигуру с конкретным Z, можно всегда подобрать эллипс с такой же величиной Z. Из этого вытекает, что конкретному Z может соответствовать не одна фигура. Единственный случай уникального соответствия - это пара Z = 1 и круг.

Для правильного «-угольника

Z = Ictg-,« е {3,4,...}.

V n V n

Для прямоугольника a х b

мера сводятся к рекомендации: если относительная погрешность пикселизации буквы Z « 0,5 не должна превосходить 0,1, то следует применить сетку, в которой поперёк штриха буквы укладывается не меньше 4 ячеек.

Асимптотические свойства n pq

1У’Ч

В расчётах np q обнаружено, что помимо факторов разброса точек Р кластера S, связанных, во-первых, с созданием и последующей графической переработкой прообраза S, во-вторых, с погрешностями производимых с ним вычислительных процедур, есть ещё третий источник дисперсии точек Р, имеющий внутреннюю для {n } природу. Поскольку рассеяние точек в кластере Р ухудшает условия распознания прообраза, потребовался анализ этого вопроса.

Справедливо утверждение: в модели (3) существуют S, p, q, для которых n p,q больше любого заданного значения.

Доказательство этой теоремы может быть произведено конструктивно.

Действительно, пусть pn = —,n = 1,2,..., pn ^ 0,n

n

и в координатах (г,ф) задана последовательность фигур Sn:

S

n

(с ф)

((1 -Pn) < г <Ц А

VI 9- VI О ф0) u ''

v (п<ф< (п + ф0)) ^

(0 <ф0 <п),

(6)

Z=

(5)

Экстремум (5) достигается при a = b (для квадрата) и равен----.

2

Из определения можно видеть, что для любой фигуры инвариант Z не изменяется при переносе, повороте, отражении и однородном растяжении, т. е. одинаков для всех фигур из какого-либо класса подобия.

Среди причин рассеяния точек Р, образов буквы в пространстве инвариантов существенное место занимают погрешности пикселизации и сеточного представления букв, возникающие в частичных ячейках у границы буквы. Вклад границы уменьшается с увеличением массивности фигуры. С другой стороны, доля частичных ячеек зависит от подробности сеточного разбиения. Настраивают параметры вычислительной схемы в экспериментах, но оценки могут быть сделаны аналитически.

Макетом буквы для изучения вопроса может служить удлинённый прямоугольник а х b , a << b , например a = 0,1b. Если допускать погрешность дихотомического определения частичной ячейки локальную 0,25 и общую (по всему контуру) 0,1, то можно взять a = 4, b = 40. Величина Z такой буквы близка к 0,5.

Подобным образом на этом же макете, изменив порядок действий, можно получить оценки параметров применяемой сетки, исходя из величины Z. Эти оценки в условиях при-

с тем, что

f (r, ф) = 1, если (r, ф) е Sn ,

в противном случае

f (г, ф) = 0. (7)

Для каждой из букв в Sn

Ц xds = 0, Ц yds = 0

Sn S„

и

Далее

x = x, y = y.

mp,q,n = Я f (г cos Ф, г sin ф)гр^+1 х

Sn (8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x(cos ф)p (sin ф)51 d фdг.

При (p + q) нечётном mp qn тривиально равен нулю.

Рассмотрим случай (p + q) - чётное. Из-за (6) и (7) переменные в (8) разделяются. Если этим воспользоваться, то результату интегрирования можно придать форму

mp,q,n = Фp,q,n Х

X----Ц- (1 - (1 -Pn ) p+q+2),

p + q + 2

Интеллектуальные технологии на транспорте. 2015. № 4

56

Intellectual Technologies on Transport. 2015. No 4

в которой явно выделена часть, зависящая от г. При этом

мых с помощью интегральных инвариантов, есть близкие к каким-либо из Sn.

1 2

m0,0,n = Ф0,0,п 2(1 -(1 -рп) ).

Можно указать формулы для членов последовательности интегральных инвариантов

П

p,q,n

Ф

p,q,n

p,q,n p+q+2 p+q+2

(m0,0,n) 2 (Ф0,0,п ) 2

1 (1 - (1 -Pn )p+q+2)

(p + q + 2)

p+q+2

2 >

Асимптотический характер каждого инварианта np q при pn > 0, n > x над Sn находится из формулы

Ф

Ф

p,q

p,q

(p + q + 2) x (ф0,0) 1

(p+q+2)

n

p,q,n

*Ф-

P

p+q 2

кроме n0,0 все инварианты

П > x

I p,q,n •

Утверждение доказано.

Существенно, что для фигур Sn Z —x > 0 .

Заключение

Из доказанного утверждения вытекает важное следствие, которое может стать критическим в приложениях, что вычисления значений инвариантов могут оказаться неравномерно точными по алфавиту, если среди фигур, анализируе-

Литература

1. Гуревич Г. Б. Основы теории алгебраических инвариантов / Г. Б. Гуревич. - М. : Л. : ОГИЗ ГИТТЛ, 1948. - 408 с.

2. Hu M. Visual Pattern Recognition by Moment Invariants / M. Hu // IRE Trans. Inf. Theory. - 1962. - Vol. 8. - P. 179-187.

3. Flusser. J. Pattern Recognition by Affine Moment Invariants / J. Flusser, T. Suk // Pattern Recognition. - 1993. - Vol. 26, N 1. - P. 167-174.

4. Flusser J. Moments and Moment Invariants in Pattern Recognition / J. Flusser, T. Suk, B. Zitova. - John Wiley & Sons, Ltd., 2009.

5. Жигалко Е.Ф. Исследование свойств метода момент-ных инвариантов применительно к линейной классификации и идентификации изображений / Е.Ф. Жигалко, М.Ю. Пах-нушева // Обозрение прикладной и промышленной математики. - 2009. - Т. 16, вып. 2. - С. 327-329.

6. Gouda I. S. Moment Invariants And Quantization Effects / I.S. Gouda, A.L. Abbott // Proc. IEEE Computer Soc. Conf. on Computer Vision and Pattern Recognition. - 1998. - P. 157-163.

7. ЕСКД. Шрифты чертёжные. ГОСТ 2.304-81. - M., 1982.

8. Жигалко Е. Ф. О регуляризации пространства инвариантов / Е. Ф. Жигалко, М. Ю. Пахнушева // Обозрение прикладной и промышленной математики. - 2009 - Т. 16, вып. 6. - С. 1062-1064.

9. Rahtu E. Generalized Affine Moment Invariants for Object Recognition / E. Rahtu, M. Salo, J. Heikkil, J. Flusser // 18th ICPR. - 2006. - Vol. 2. - P. 634-637.

10. Li Y. Application of Moment Invariants to Neurocomputing for Pattern Recognition / Y. Li // Electronics Let. - 1991. -Vol. 27, Is. 7. - P. 587-588.

11. Hosny Kh. M. On the Computational Aspects of Affine Affine Moment Invariants for Grey-scale Images / K.M. Hosny // Appl. Math. Comp. - 2008. - Vol. 195, Is. 2. - P. 762-771.

12. Proakis J. G. Digital signal processing / J. G. Proakis, D. G. Mandakis. - W. : Prentice Hall, 2003.

Интеллектуальные технологии на транспорте. 2015. № 4

57

Intellectual Technologies on Transport. 2015. No 4

A Singularity of Integral Moment Invariants

Zhigalko E.Th.

Petersburg State Transport University S. Petersburg, Russia kprikmat@pgups.edu

p,q

Abstract. For the geometric invariants npq =------, mpq being

m0,0

a centered integral momentum of a plane figure S, a sequence of characters Sn, ||Sn|| = An, An ^ 0 has been suggested, providing

n

p,q,n

since n p,q

(An)

p+q

, while n . Image pro-

cessing algorithms utilizing integral invariants may become nonuniform in presence of characters, close to Sn, within the object set.

Keywords: algorythm, alphabet, asymptotics, recognizing, integral momenta, invariants, non-uniformity, identificarion.

References

1. Gurevich G.B. Osnovy teorii algbraicheskih invariantov [Fundamentals of Algebraic Invariants Theory]. Moscow, Leningrad, OGIZ GITTL, 1948. 408 p.

2. Hu M. Visual Pattern Recognition by Moment Invariants. IRE Trans. Inf. Theory, 1962, vol. 8, pp. 179-187.

3. Flusser J., Suk T. Pattern Recognition by Affine Moment Invariants. Pattern Recognition, 1993, vol. 26, no 1, pp. 167174.

4. Flusser J., Suk T., Zitova B. Moments and Moment Invariants in Pattern Recognition. John Wiley & Sons, Ltd., 2009.

5. Zhigalko E.Th., Pahnusheva M.Yu. Investigation of Properties of the Moment Invariants Method Application to Images Linear Classification and Recognizing [Isledovanije svojstv me-toda momentnyh invariantov primenitielno k liniejnoj klassy-fikacji I identifikacji izobrazhenij] Obozrenije Prikladnoj i Promyshlennoj Matiematiki [Review of Applied and Industrial Mathematics], 2009, vol. 16, is. 2, pp. 327-329.

6. Gouda I.S., Abbott A.L. Moment Invariants And Quantization Effects. Proc IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 1998, pp. 157-163.

7. ESKD. Drawing Letters. GOST 2.304-81. Moscow, 1982.

8. Zhigalko E.Th., Pahnusheva M.Yu. Uniformization of the Space of Invariants. Rev. Appl. Ind. Math., 2009, Vol. 16, is. 6, pp. 1062-1064.

9. Rahtu E., Salo M., Heikkil J., Flusser J. Generalized Affine Moment Invariants for Object Recognition. 18th ICPR, 2006, vol. 2, pp. 634-637.

10. Li Y. Application of Moment Invariants to Neurocomputing for Pattern Recognition. Electronics Let., 1991, vol. 27, is. 7, pp. 587-588.

11. Hosny Kh. M. On the Computational Aspects of Affine Affine Moment Invariants for Grey-scale Images. Appl. Math. Computation, 2008, vol. 195, is. 2, pp. 762-771.

12. Proakis J. G., Mandakis D. G. Digital signal processing. W., Prentice Hall, 2003.

Интеллектуальные технологии на транспорте. 2015. № 4

58

i Надоели баннеры? Вы всегда можете отключить рекламу.