Научная статья на тему 'Интервальный подход к решению задачи распознавания числовых матриц'

Интервальный подход к решению задачи распознавания числовых матриц Текст научной статьи по специальности «Математика»

CC BY
359
79
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / ИНТЕРВАЛЬНЫЙ АНАЛИЗ / PATTERN RECOGNITION / INTERVAL ANALYSIS

Аннотация научной статьи по математике, автор научной работы — Пролубников Александр Вячеславович

Предлагается подход к решению задачи распознавания числовых матриц, использующий интервальные методы. Анализируются результаты вычислительного эксперимента. В качестве приложения разработанного алгоритма рассматривается задача распознавания растровых изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An interval approach to the matrix recognition problem

We introduce an approach for matrix recognition, which uses methods of interval analysis. An application of the presented approach for the recognition of raster image is considered. Test results for raster digital images are presented.

Текст научной работы на тему «Интервальный подход к решению задачи распознавания числовых матриц»

Вычислительные технологии

Том 17, № 4, 2012

Интервальный подход к решению задачи распознавания числовых матриц

А. В. Пролувников Омский государственный университет, Россия e-mail: a.v.prolubnikov@mail.ru

Предлагается подход к решению задачи распознавания числовых матриц, использующий интервальные методы. Анализируются результаты вычислительного эксперимента. В качестве приложения разработанного алгоритма рассматривается задача распознавания растровых изображений.

Ключевые слова: распознавание образов, интервальный анализ.

Введение

Проблема автоматического анализа формы и состояния объектов, информация о которых представлена в матричном виде, является актуальной во многих отраслях деятельности человека. Очевидный пример приложения методов такого анализа — распознавание растровых изображений, представленных матрицами с числовыми значениями элементов, соответствующими яркости, цвету или каким-либо другим характеристикам пикселов, совокупность которых представляет изображение. Автоматизация процесса анализа и интерпретации изображений достаточно трудна как в связи с обработкой большого объёма информации в изображениях, требующей значительных вычислительных мощностей, так и по той причине, что сами процессы регистрации человеком изображений или каких-либо других объектов, представляемых числовыми матрицами, могут быть достаточно сложны, плохо формализуемы или вообще неизвестны. Кроме того, при регистрации изображений техническими средствами часто неизбежны погрешности измерения, возможно наличие шума при регистрации изображений, например, зашумление отдельных фрагментов или всего изображения в целом.

При применении для распознавания растровых изображений алгоритмов распознавания с помощью нейронных сетей [1], параметрических алгоритмов [2], алгоритмов на основе теории морфологического анализа [3] используется предварительная стадия обучения, в ходе которой алгоритм необходимо "обучать изображениям объекта", полученным при различных условиях его регистрации. Цель процесса обучения — фиксирование ряда характеристик изображения, по которым может быть произведено распознавание.

Предлагаемый в настоящей работе подход к распознаванию числовых матриц, применимый, в частности, к растровым изображениям, использует минимизацию лебеговой меры объединённого множества решений интервальной системы линейных алгебраических уравнений (ИСЛАУ), которая ставится в соответствие каждой эталонной матрице с учётом распознаваемой зашумлённой матрицы. Характерным отличием представляемого подхода от традиционных является отсутствие стадии обучения алгоритма распознавания.

1. Постановка задачи

Матричная постановка задачи следующая. Имеется набор из N эталонных квадратных п х п-матриц |Л(к)}^=1 с элементами а, € К. В ходе зашумления одной из матриц — матрицы А(р) — получена некоторая матрица А. Известно, что значение элементов матриц могло быть изменено в пределах интервалов [о, — А, о(к) + А], А > 0. Необходимо определить р.

Матрицы А(1),..., А(м) , А без ограничения общности можно считать квадратными. В противном случае, если матрицы из набора эталонных и распознаваемая матрица — т х п-матрицы и т < п, то к каждой из них добавляются п — т нулевых строк, если п < т — добавляется т — п нулевых столбцов.

2. Использование внешнего оценивания множества решений ИСЛАУ для распознавания числовых матриц

2.1. Минимизация лебеговой меры внешней оценки объединённого множества решений ИСЛАУ как эвристика, на основе которой производится распознавание

Определение 1. Для ИСЛАУ Ах = Ь, где А — интервальная п х п-матрица, Ь — некоторый интервальный п-мерныи вектор, объединенное множество решении — это множество £(А, Ь):

~(А, Ь) = {х € | ЗА € А, 36 € Ь: Ах = Ъ). (1)

Эталонным матрицам |А(к)}^=1 с элементами о(к) € К поставим в соответствие интервальные матрицы |А(к)}^=1 с интервальными элементами а(к), формируемыми следующим образом:

а(к) = [тт{а(к), о»,-}, тах{а(к), }], (2)

где о», — элементы распознаваемой числовой матрицы А. Элементы матрицы А(к) — интервалы, характеризующие изменения элементов эталонной матрицы

А(к) , необходимые для получения из неё распознаваемой матрицы А.

Предлагаемый подход основан на предположении: чем меньше разброс в решениях точечных СЛАУ, составляющих ИСЛАУ А(к)х = Ъ с некоторой точечной правой частью Ъ € тем вероятнее, что именно зашумлением эталонной матрицы А(к) получена матрица А.

Разброс в решениях точечных СЛАУ, составляющих (2), можно оценить через лебегову меру ^ множества решений 2(А(к),Ъ). Поскольку мера ^(2(А(к), Ъ)) зависит от взаимного расположения элементов А(к) и непрерывно зависит от их изменений, то при изменении достаточно ограниченного числа элементов эталонной матрицы в не слишком большом диапазоне значений предложенная эвристика может быть использована для решения поставленной задачи распознавания.

2.2. Выбор вектора правой части

ИСЛАУ А(к) х = Ь

Наряду с матрицей А(к) вектор правой части Ъ определяет множество £( А(к), Ъ), поэтому его выбор важен для эффективности распознавания. Вектор правой части в рассматриваемых ИСЛАУ выбирается точечным для того, чтобы было возможно более точное

внешнее оценивание объединённого множества решений. В случае точечной правой части интервальная оболочка объединённого множества решений имеет покомпонентно меньший радиус, чем в случае интервальной правой части, что приводит к уменьшению расстояния между объединённым множеством решений и его интервальной оболочкой [4], что в свою очередь позволяет производить внешнее оценивание с большей точностью.

При точечной правой части Ь множество решений 2(А(к) , Ь) принимает следующий вид:

~(А(к),Ь) = {х е Еп | ЗА е А(к): Ах = Ь}.

В результате описанных далее преобразований матрицы А(к) (к = ) становятся неособенными, т.е. любая точечная матрица А е А(к) обратима. В этом случае

~(А(к),Ь) = {А-1Ь 1 А е А(к)}.

Будем рассматривать множество £(А, Ь) как образ множества матриц А при отображении Ьь:

Ьь : А ^ Еп,

где для А е А

Ьь(А) = А-1Ь.

Пусть а^ — элементы матрицы А-1, обратной к матрице А е А. Для г-й компоненты вектора х е £(А, Ь) будем иметь

П 1 п

х = ^ Ь3 = ¿еТА ^ , ¿=1 ¿=1

где А е А такая, что х = А-1Ь. Иными словами, компоненты вектора Ь — это веса столбцов, с которыми при получении компонент вектора х е £(А, Ь), х = Ьь(А) производится суммирование элементов строк матрицы А-1, А^ — алгебраические дополнения элементов г-го столбца матрицы А.

Если в качестве правой части использовать вектор е = (1,..., 1)т, то компоненты вектора х = А-1е для А е А будут в равной мере зависеть от алгебраических дополнений элементов любого столбца, а значит, в среднем примерно одинаково — от всех элементов матрицы, что не имеет места в случае вектора с не равными компонентами. Так, если использовать какой-либо из ортов е^ стандартного базиса в Кп, то для

х е £(А, е^), х = Ье. (А) получим

х = ¿(^'...'^

т.е. компоненты векторов, составляющих 2(А(к),е^) и являющихся образами матриц А е А при отображении Ье1, будут в меньшей степени зависеть от элементов г-х столбцов матриц А е А(к), чем от элементов других столбцов. Элементы из позиций в г-м столбце матрицы А не будут влиять на значения А^,... , Ап алгебраических дополнений, а значит, в той же мере, что и другие элементы матрицы, — на компоненты векторов, составляющих 2(А(к),е^). Мы исходим из того, что все элементы эталонных матриц и распознаваемой матрицы должны в равной мере учитываться при распознавании.

Таким образом, рассматриваемые далее ИСЛАУ имеют вид

А(к)х = е. (3)

2.3. Вычислительная сложность распознавания

Множество 2(к) = 2(А(к),е) представляет собой объединение не более чем 2П полиэдров [5], являющихся пересечениями 2(к) с ортантами Задача нахождения лебеговой меры 2(к) имеет большую вычислительную сложность, поскольку описание самого этого множества с помощью гиперплоскостей, ограничивающих его, является задачей с экспоненциально растущей относительно размерности вычислительной сложностью. Поэтому ограничимся оцениванием сверху лебеговой меры множества 2(к) лебеговой мерой некоторого приближения интервальной оболочки □ 2(к) данного множества. Интервальная оболочка □ 2(к) — это минимальный по включению интервальный вектор, содержащий 2(к), т.е. такой брус со сторонами, параллельными координатным осям, что 2(к) С □ 2(к), и для любого бруса с такого, что 2(к) С с, имеем □ 2(к) С с.

Обозначим как X(к) получаемое с помощью какого-либо численного метода интервального анализа приближение интервальной оболочки □ 2(к). X(к) — некоторый брус

х(к) = ([хк ,хк ],..., [хП,хП])т,

хк < хк, такой, что □ 2(к) С X(к). Лебегова мера ^ бруса X(к) рассчитывается как

^(Х(к)) = (хк — хк) ■ ... ■ (хП — хП). (4)

Вычисление внешних оценок X(к) может быть произведено с помощью методов интервального анализа, разработанных для внешнего оценивания объединённых множеств решений ИСЛАУ. При вычислительной сложности выбранного алгоритма внешнего оценивания Епс1, равной СеПс1 (п), общая трудоёмкость алгоритма, производящего распознавание, исходя из сравнения N значений ^(X(к)) составит

СN п, Епс1) = О^ ■ Сепс1 (п)). (5)

В случае СеПс1 (п) = О(п2) получим алгоритм с минимальным возможным порядком вычислительной сложности для алгоритмов решения поставленной задачи, поскольку вычислительная сложность любой процедуры обработки элементов п х п-матрицы составляет не менее О(п2).

3. Алгоритм распознавания

3.1. Модификация матриц, подаваемых на вход алгоритма

Для улучшения качества распознавания по предложенному алгоритму производится следующая модификация матриц, подаваемых на его вход. Каждый элемент как эталонных матриц, так и зашумлённой матрицы увеличивается на одно и то же значение и (и > 0):

aij := aij + и, (6)

a j := a(f + и. (7)

Преобразования (6) и (7) сохраняют расстояние, понимаемое как модуль разности, и между элементами в разных позициях одной матрицы, и между элементами в одинаковых позициях для любой пары матриц из набора входных. Поэтому входная информация, по которой можно различать элементы матриц и производить распознавание, после проведённых преобразований сохраняется.

В результате проведения преобразований (6) и (7) уменьшается отношение радиуса интервала изменения элемента эталонной матрицы к модулю этого элемента. Так, если до преобразований (6) и (7) для элементов эталонных матриц а(к) отношение радиуса интервала, в котором происходит изменение элемента, к величине модуля элемента матрицы составляет Д/|а(к)|, то после их проведения это отношение уменьшается с

ростом и и составляет Д/|а(к) + и|.

Данное уменьшение отношения радиуса Д к величине модуля элемента матрицы необходимо по следующей причине. Если значение Д близко к модулям значений элементов эталонных матриц, то интервальные матрицы А(к), построенные в соответствии с (2), будут содержать такие точечные матрицы, что векторы х = Ье(А) = А-1е для А £ А(к) могут столь сильно отличаться друг от друга, что производить распознавание исходя из близости или удалённости этих векторов для всех матриц из А(к), минимизируя по к меру множества 2(к), нельзя. Если же радиус Д мал относительно модулей элементов зашумляемой эталонной матрицы, что будет после проведения преобразований (6) и (7), то распознавание во многих случаях возможно.

Так, при распознавании монохромных изображений, если пикселам белого цвета соответствуют элементы матриц, равные 1, пикселам чёрного цвета — 0, а изменению цвета пикселов при зашумлении соответствует изменение значения элемента матрицы с 0 на 1 или наоборот, то величина Д возможного изменения элемента матрицы будет либо больше модуля элемента, либо равна ему. Для таких матриц распознавание по предложенному подходу с использованием какого-либо метода внешнего оценивания объединённого множества решений ИСЛАУ невозможно, тогда как оно эффективно производится после модификации (6) и (7) входных матриц с и = 10, когда Д/|а(к;) + и| < 0.1.

Проведение преобразований (6) и (7) входных точечных матриц эквивалентно преобразованию интервальных матриц вида (2):

А(к) := А(к) + иЕ, (8)

где Е — матрица с элементами (Е) у = [1,1], г, ] = 1, п. После проведения преобразования (8) матриц А(к) модифицируем их диагональные элементы

А(к) := А(к) + в (9)

где О — диагональная интервальная матрица с элементами = [О, О]. О задаётся

следующим образом:

О = тах О(к), (10)

1<к<Ы

где

О(к) = 2 тах V |(А(к) Ь |.

Матрицы А(к) после выполнения преобразований (9) — это Н-матрицы, что позволяет в ходе распознавания выполнять с ними необходимые вычисления по нахождению внешних оценок X(к).

Определение 2. Компарантом матрицы А = (ау) £ Егахга называется матрица того же размера, обозначаемая как (А), такая, что

/л\ Г |ау|, если г = г?-й элемент (А) = < ■, ■

I -|ау |, если г = у.

Определение 3. Матрица A = (a^) е Rnxra называется M-матрицей, если она представима в виде A = sI—P, где P — неотрицательная матрица и s > p(P), p(P) — спектральный радиус P. Матрица A е IRnxn называется интервальной M-матрицей, если каждая вещественная матрица A е A является M-матрицей.

Определение 4. Матрица A е Rnxn называется H-матрицей, если её компарант является M-матрицей. Матрица A е IRnxn называется интервальной H-матрицей, если каждая вещественная матрица A е A является H-матрицей.

Для матриц, построенных в соответствии с (2), (8), (9), компарант (A(k)) — M-матрица. Иными словами, каждая построенная матрица A( — H-матрица, что гарантирует улучшение любого достаточно широкого начального интервального вектора-приближения интервальным методом Гаусса — Зейделя [6] и позволяет получать для множеств S(fc) их внешние оценки Xисходя из лебеговой меры которых производится распознавание. Как начальное приближение может быть выбран брус ([—B,B],..., [—B,B])т е IRn, заведомо содержащий объединённые множества решений S(fc) для некоторого B > 0.

3.2. Выбор начального приближения для множества E(fc) и ограничение на величину и

Без ограничения общности можно считать, что все элементы aj матриц A е A(k) положительны. В противном случае можно провести предварительные преобразования (6) и (7) входных матриц с некоторым таким и0 > 0, что значение и0 будет больше модулей всех отрицательных элементов эталонных и распознаваемой матриц.

После преобразований (8) и (9) матриц A(k), построенных в соответствии с (2), любая A е A(k) — матрица с диагональным преобладанием. Пусть для матриц A е A(k)

Ri(A) =f aü — aj, R =f min Ri(A).

1<i<ra

Для матрицы A справедлива [7] оценка

l|A-1|U < 1

i те

(

R*(A)

Из (10) следует, что R*(A) > u(n — 1), поэтому

1

P-1|U < г. (11)

u(n — 1)

Если х е S(fc), то для A е A(k) такой, что х = A 1e, будем иметь

A-1

-1

||х||те <||A-1|UNU

т.е. ||х||те < ( 1 1). (12)

и(п — 1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Значение правой части (12) позволяет задать начальное приближение для интервального метода Гаусса — Зейделя — брус ([—В, В],... , [—В, В])т, где

В = -т-Цт. (13)

и(п — 1)

Из (12) также следует, что рост и может привести к такому уменьшению нормы векторов, составляющих множества S(fc), что лебеговы меры приближений интервальных оболочек этих множеств, получаемых с помощью какого-либо алгоритма внешнего оценивания, не будут отражать специфику эталонных матриц. Это будет происходить как вследствие того, что с ростом модулей элементов в матрицах и диагонального преобладания будут нивелированы различия между самими оцениваемыми множествами S(fc), так и в силу наличия погрешностей используемых численных методов. Для эффективного распознавания необходимо достаточное отклонение одного из значений ^(X(p)) от прочих значений ^(X(k)), k = p. При проведении численных экспериментов полагалось и = 10 а, где а — максимальное значение модуля элемента в эталонных матрицах.

3.3. Алгоритм распознавания и его вычислительная сложность

Предлагается следующий алгоритм распознавания числовых матриц. Вход: эталонные матрицы {А(к)}^= и зашумлённая матрица A. Выход: индекс p матрицы A(p) G {А(к)}^= — результат распознавания.

1. По матрицам {А(к)}£= и матрице A в соответствии с (2), (8), (9) сформировать матрицы {A(fc)}N=1.

2. С помощью метода End рассчитать значения X(k), k = 1, N.

3. Найти p такое, что ^(X(p)) = min ^(X(k)), и выдать p в качестве результата распознавания.

Вычислительная сложность алгоритма распознавания, использующего в качестве End интервальный метод Гаусса — Зейделя: End =GS, составит

C(N,n, GS) = O(N ■ Ngs ■ n2), (14)

где n — размерность квадратных матриц изображений, N — число эталонных матриц, Ngs — количество производимых итераций интервального метода Гаусса — Зейделя, которое в ходе проведённых экспериментов полагалось равным 20.

4. Вычислительный эксперимент

Для исследования эффективности описанного алгоритма в качестве данных для тестирования использовались изображения цифр: черно-белые (бинарные) изображения и изображения в градациях серого цвета с разрешением 20 х 20, 35 х 35, 50 х 50 и 100 х 100 пикселов (рис. 1). Кроме того, были проведены эксперименты с цифрами шрифтов Times New Roman, Arial, Courier New. Наиболее сложным для распознавания является шрифт, представленный на рис. 1. Элементы матриц тестовых изображений принимают два значения:

(к) / с1, если пиксел в позиции г^' белого цвета, с2, если пиксел в позиции г^' чёрного цвета.

Рис. 1. Эталонные изображения цифр

При черно-белых изображениях С1 = 1 и с2 = 0, в случае изображений в градациях серого цвета с1 и с2 могут принимать целые значения в диапазоне от 0 до 255.

Назовём уровнем шума целое число Q (%), лежащее в интервале [0,100]. Изображения зашумлялись следующим образом. Генератор случайных чисел давал целые числа в интервале [0,100]. Просматривался каждый пиксел изображения, и анализировалось число, сгенерированное генератором случайных чисел на очередном шаге. Если это число попадало в интервал [0^], то пиксел зашумлялся. В ходе зашумления бинарного изображения, когда оно происходит инвертированием пикселов, т. е. заменой пиксела белого цвета на пиксел чёрного цвета или наоборот, при 0%-м уровне шума ^ = 0) получается чистое изображение, при 50%-м ^ = 50) — инвертируется в среднем 50 % пикселов, при 100%-м ^ = 100) — изображение инвертируется полностью.

Для каждой упорядоченной пары изображений (А, В) было выполнено по 100 испытаний: производилось зашумление изображения А, после чего запускался алгоритм распознавания. Процент правильных решений (распознавания) Р подсчитывался следующим образом:

р количество правильных ответов ^^ количество испытаний

В ходе проведённого эксперимента по распознаванию монохромных изображений значение и = 10 для преобразований (6) и (7) было выбрано так, чтобы инвертирование пиксела — изменение его значения с 0 на 1 или наоборот — давало изменение элементов а(к) модифицированных матриц эталонных изображений в интервале [а(к) — А, а(к) + А]

с радиусом А < а(к)/10 < 0.1.

Результаты эксперимента отражены в табл. 1, 2 и на рис. 2. В табл. 1 показаны результаты распознавания при уровне шума от 31 до 50 % для матриц, представляющих тестовые изображения с разрешением 20 х 20, 35 х 35, 50 х 50 и 100 х 100 пикселов, в табл. 2 — результаты расчётов для Q = 45 %, п = 50. При уровне шума до 30 % процент распознавания составляет не менее 99.9%. Графики на рис. 2 иллюстрируют рост процента распознавания при увеличении размерности распознаваемых матриц.

Как показал вычислительный эксперимент, предложенная эвристика и алгоритм, основанный на её расчёте, по качеству распознавания не уступают известным алгоритмам, применяемым для распознавания растровых изображений. Так, для параметрических

Таблица 1. Процент распознавания тестовых изображений при шуме от Q = 31 % до 50%

Уровень шума, % 31 32 33 34 35 36 37 38 39 40

п = 20 99.57 99.6 99.37 99.19 99 98.56 98 97.27 95.97 94.96

п = 35 99.9 99.97 99.97 99.84 99.83 99.71 99.47 99.36 99.02 98.31

п = 50 100 100 99.99 99.98 99.97 99.99 99.93 99.89 99.82 99.74

п = 100 100 100 100 100 100 100 100 100 100 100

Уровень шума, % 41 42 43 44 45 46 47 48 49 50

п = 20 93.32 90.67 88.07 84.1 79.87 75.28 69.16 63.06 57.02 49.72

п = 35 97.52 96.55 94.46 91 87.22 82.18 76.16 67.86 60.13 49.41

п = 50 99.51 99.27 98.36 97.29 95.23 90.6 83.99 74.61 62.69 49.86

п = 100 100 99.98 99.97 99.86 99.68 99.08 97.23 99.08 75.09 50.68

Таблица 2. Результаты распознавания тестовых изображений при уровне шума Q = 45 %, п = 50

Q = 45 % 0 1 2 3 4 5 6 7 8 9

0 — 97 92 100 91 86 96 94 85 97

1 98 — 98 98 98 98 94 92 98 99

2 94 94 — 94 99 97 100 96 98 89

3 99 96 96 — 97 96 97 91 100 95

4 100 93 99 96 — 92 99 99 93 95

5 94 97 95 97 93 — 94 99 90 96

6 96 93 100 95 97 94 — 95 99 98

7 99 99 99 91 98 96 96 — 99 99

8 76 92 93 96 89 84 92 97 — 94

9 96 97 93 89 94 95 98 97 96 —

Рис. 2. Повышение процента распознавания тестовых изображений при росте разрешения

алгоритмов "Кора", "R-метод", "TEMP" и "CORAL" доля распознавания изображений при тех же условиях, при которых проводился вычислительный эксперимент, составила 80% при Q = 43%, для алгоритма, основанного на монохромной морфологии, — 80% при Q = 45 % [8]. Для алгоритмов распознавания с помощью нейронных сетей доля распознавания при Q от 46 % и выше не превышает 90 % [1]. Как видно из приведённых результатов, при этих же значениях уровня шума предложенный подход даёт тот же или больший процент распознавания при должном разрешении изображений.

Далее было проведено сравнение эффективностей распознавания с помощью предложенной эвристики и другой также используемой эвристики, представляющей собой минимизацию евклидова расстояния p(A, A(k)) между матрицей A, сопоставляемой распознаваемому изображению, и матрицами A(k), сопоставляемыми эталонным изображениям:

p(A, A(k)) =

\

% - j . (!5)

Результатом распознавания является номер эталонного изображения р, дающий минимум (15). Минимизация расстояния р между эталонной матрицей и распознаваемой А часто позволяет производить успешное распознавание при решении задачи

2

Таблица 3. Процент задач 5 при уровне шума Q = 44 % для с1 = 110, с2 = 120 и с1 = 119, С2 = 120

Параметр С1 = 110, С2 = 120 С1 = 119, С2 = 120

5, % 0 5.4 7.4 16.2 23.5 22.8 37.5 47.3 46.4 46.4

Р, % 100 99.93 99.79 99.72 99.81 99.71 99.6 99.8 99.72 99.82

А 10 25 50 75 100 10 25 50 75 100

в рассматриваемой здесь постановке. Вместе с тем возможны ситуации, когда для пары матриц А(1) и А(2) и распознаваемой матрицы А будем иметь

р(А, А(1)) <р(А, А(2)),

тогда как для большего количества позиций у в этих матрицах

и А в действительности получена в результате зашумления матрицы А(2).

Был проведён эксперимент, показавший, что с увеличением радиуса А интервалов, в которых происходят изменения элементов эталонных матриц, при |с1 — с2| < А растёт доля задач с процентом распознавания с помощью предложенной эвристики большим, чем в случае распознавания с помощью евклидова расстояния.

Пусть Б — процент задач от общего числа решаемых задач распознавания, где предложенная эвристика даёт верное распознавание, тогда как минимизация евклидова расстояния правильного распознавания произвести не позволяет. Для того же рассматриваемого набора эталонных изображений, но представленных в градациях серого цвета со значениями с1 = 110, с2 = 120 и с1 = 119, с2 = 120, в ходе эксперимента с тем же описанным выше выбором зашумляемых элементов, изменяемых в интервалах радиуса А, получены значения Б, приведенные в табл. 3. Видно, что доля задач, где ситуация была обратной при уровне шума Q от 31 до 50 %, не превысила 0.01 % от числа всех решённых задач распознавания для данного значения Q. Подобная тенденция к повышению доли задач Б с ростом А сохраняется и при других значениях с1 и с2, если значение |с1 — с2| достаточно мало относительно величины А.

Выводы

Предложен алгоритм распознавания числовых матриц. Используемая алгоритмом эвристика состоит в минимизации лебеговой меры внешней оценки объединённого множества решений интервальной системы линейных алгебраических уравнений, сопоставляемой эталонной и распознаваемой матрицам. Алгоритм не требует обучения и имеет квадратичную относительно размерности входных матриц вычислительную сложность.

Проведённые вычислительные эксперименты свидетельствуют о высокой эффективности подхода в приложении к задаче распознавания растровых изображений и о росте процента распознавания с повышением разрешения распознаваемых изображений.

Автор благодарен С.П. Шарому за внимание к работе и высказанные замечания.

Список литературы

[1] Demuth H., Beale M. Neural Network Toolbox for Use with MATLAB. User's Guide. Version 4. [Электронный ресурс] URL: http://cs.mipt.ru/docs/comp/eng/develop/software/ matlab/nnet/main.pdf (дата обращения 23.09.2011).

[2] Кирнос Э.А., ПытьЕв Ю.П. О параметрических алгоритмах распознавания // Вестник Московского гос. ун-та. Физика. Астрономия. 2003. № 1. C. 16-18.

[3] Kirnos E.A., Pyt'ev Yu.P., Djukova E.V. Training the kora type algorithms // Pattern Recognition and Image Analysis. 2002. Vol. 12, No. 1. P. 19-24.

[4] Шарый С.П. Конечномерный интервальный анализ. [Электронный ресурс] URL: http://www.nsc.ru/interval/Library/InteBooks/SharyBook.pdf (дата обращения 23.09.2011).

[5] Oettli W. On the solution set of a linear system with inacurate coeffients // SIAM J. on Numerical Analysis. 1965. Vol. 2, No. 1. P. 115-118.

[6] Neumaier A. Interval Methods for Systems of Equations. Cambridge Univ. Press, 1990.

[7] Ahlberg J.H., Nilson E.N. Convergence properties of the spline fit //J. SIAM. 1963. Vol. 11, No. 1. P. 95-104.

[8] Кирнос Э.А. Сравнительный анализ морфологических методов интерпретации изображений: Автореф. дис. ... канд. физ.-мат. наук. М.: МГУ, 2004.

Поступила в 'редакцию 28 октября 2011 г., с доработки — 27 июня 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.