Научная статья на тему 'Подход к распознаванию зрительных образов на основе эталонных образов и обучения'

Подход к распознаванию зрительных образов на основе эталонных образов и обучения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
380
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАЗ / ОБЪЕКТ РАСПОЗНАВАНИЯ / СЧИТЫВАЮЩЕЕ УСТРОЙСТВО / ЦИФРОВОЙ ОБРАЗ / ЭТАЛОННЫЙ ОБРАЗ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Батырканов Жениш Исакунович, Кудакеева Гулида Маданбековна, Субанкулова Жылдызгул Жаныбековна

Рассматривается и решается задача распознавания зрительных образов. При этом под образом понимается конкретное проявление распознаваемого объекта. Предлагается подход к распознаванию зрительных образов на основе использования базы эталонных образов и процедуры обучения. Предлагаемый подход можно применять для распознавания рукописного текста, идентификации личности по биометрическим данным и решения других подобных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Батырканов Жениш Исакунович, Кудакеева Гулида Маданбековна, Субанкулова Жылдызгул Жаныбековна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of recognition of visual images is considered and solved. The image is thought of as the concrete manifestation of the recognized object. The authors suggest an approach to recognizing visual images based on the use of reference image base and training procedure. This approach can be used to recognize handwritten text, to identify a person by biometric data, etc.

Текст научной работы на тему «Подход к распознаванию зрительных образов на основе эталонных образов и обучения»

БАТЫРКАНОВ Ж. И., КУДАКЕЕВА Г. М., СУБАНКУЛОВА Ж. Ж.

ПОДХОД К РАСПОЗНАВАНИЮ ЗРИТЕЛЬНЫХ ОБРАЗОВ НА ОСНОВЕ ЭТАЛОННЫХ ОБРАЗОВ И ОБУЧЕНИЯ

Аннотация. Рассматривается и решается задача распознавания зрительных образов. При этом под образом понимается конкретное проявление распознаваемого объекта. Предлагается подход к распознаванию зрительных образов на основе использования базы эталонных образов и процедуры обучения. Предлагаемый подход можно применять для распознавания рукописного текста, идентификации личности по биометрическим данным и решения других подобных задач.

Ключевые слова: образ, объект распознавания, цифровой образ, эталонный образ, считывающее устройство.

BATYRKANOV ZH. I., KUDAKEEVA G. M., SUBANKULOVA ZH. ZH.

RECOGNITION OF VISUAL IMAGES: AN APPROACH BASED ON REFERENCE IMAGES AND TRAINING

Abstract. The problem of recognition of visual images is considered and solved. The image is thought of as the concrete manifestation of the recognized object. The authors suggest an approach to recognizing visual images based on the use of reference image base and training procedure. This approach can be used to recognize handwritten text, to identify a person by biometric data, etc.

Keywords: image, object of recognition, digital image, reference image, reader.

Введение. В практике сегодняшнего дня достаточно часто возникает потребность в разработке методов, алгоритмов и программ для распознавания зрительных образов. Они применяются для распознавания рукописного текста, природных и техногенных катастрофических явлений по аэрофотоснимкам, при разведке полезных ископаемых, для идентификации личностей по биометрическим данным и пр.

Существуют различные подходы и методы распознавания зрительных образов: распознавание на основе оценок определяющих признаков, распознавание на основе аналогий, распознавание на основе обучения и использования эталонных образов. Среди этих подходов наиболее универсальным и эффективным, на наш взгляд, является подход на основе использования эталонных образов и обучения. Ниже предлагается подход к решению задач распознавания рукописного текста и идентификации личности по биометрическим данным.

Подход на основе базы эталонных образов и обучения. Подход состоит в последовательном выполнении двух этапов:

1) зрительный образ предъявляется считывающему устройству;

2) считывающее устройство переводит зрительный образ в двоичный компьютерный образ.

В качестве считывающего устройства может служить сканирующее устройство, цифровой фотоаппарат, смартфон, рецепторная матрица и другие специальные устройства. Алгоритм распознавания заключается в последовательном сравнении поступившего двоичного образа со всеми двоичными образами из базы эталонных образов. При сравнении вычисляются количественные оценки близости, например, по эвклидовой разности сравниваемых двоичных образов. Тот эталонный двоичный образ, для которого вычисляемая величина эвклидовой разности минимальна, определит класс объекта, к которому принадлежит предъявленный для распознавания образ.

При распознавании рукописного текста алгоритм распознавания состоит в распознавании букв предъявленного слова, а затем в сборке распознанных букв в слово, которое затем ищется в словаре (существующей базе данных). Алгоритм распознавания личности по биометрическим данным осуществляется по аналогичной схеме.

Процедура обучения при применении данного подхода к распознаванию состоит в корректировке алгоритма распознавания на этапе разработки и обучения системы. Рассмотрим как это делается на примере распознавания зрительных образов.

Процедура подготовки и обучения системы. В самом начале последовательно на рецепторную матрицу считывающего устройства подается определенное количество образов первого объекта А. При предъявлении конкретного образа А1 активируются определенные ячейки рецепторной матрицы. Активацию ячеек матрицы можно представить в виде конкретной числовой матрицы, при этом размер числовой матрицы определяется размером рецепторной матрицы. Имеем числовую матрицу типа

О „1 „1 Л

А =

а21 а22 ,'' а2N ам 1 ам 2 , ■ ■ ам J

(1)

1 ]0' где ач

Далее предъявляется образ А2 объекта А и так до последнего возможного образа Аь объекта А. Совокупность образов А1, А2,..., Аь объекта А записывается в память компьютера как база данных эталонных образов объекта А. Эта процедура повторяется для всех объектов

(В... С). В итоге в компьютере создается база данных эталонных образов объектов А, В,., С:

А={А1, А2,., А1}

В={В1, В2,., ВР}, (2)

С={С1, С2,., СМ}.

После этапа обучения система готова к распознаванию предъявленных образов. Алгоритмы распознавания.

Предлагается два варианта алгоритма распознавания. 1-й вариант алгоритма распознавания.

Процедура классификации, т.е. отнесения предъявленного образа к тому или иному объекту происходит по следующей схеме. При предъявлении рецепторной матрице образа Х в компьютере образуется числовой образ в виде матрицы:

( х„ Х12,.

X — Х21 Х22 ,. Х2 N (3)

V Х М1 Х М 2 , . Х MN у

Чтобы отнести образ Х к тому или иному классу объектов А, В. С, осуществляется процедура последовательного вычисления нормы от разностей матрицы Х со всеми матрицами А1,А2,..., АЬ,Б1,..., С1,..., См, которые хранятся в базе эталонных образов объектов А, В, ... С. Норму вычислять удобно в виде эвклидовой нормы разностей матрицы (1), (2), (3) в виде

Х-А*

ла

(4)

Среди этого множества (4) существует одна минимальная норма. Пусть, например, минимальная норма разностей будет для образа Б8

V:

(5)

х-в1

У

' J

Тогда компьютер активирует выход В выходного слоя. Это говорит о том, что предъявленный образ Х относится к объекту В.

Описанный алгоритм классификации (распознавания) работает не только в случаях, когда матрица Х полностью совпадает с матрицами А1,..., См, но и в тех случаях, когда Х не совпадает ни с одной из них. При этом используется «принцип близости», который в теории распознавания заключается в том, что образы для одного и того же объекта в пространстве признаков должны располагаться близко друг к другу.

2-й вариант алгоритма распознавания,

При использовании э переводятся в векторную форму:

При использовании этого алгоритма все матрицы A1,A2,...ALB1...C1...CM,X

Далее осуществляется вычисление скалярных произведений вектора X со всеми векторами

A1,..., CM.

Скалярное произведение вектора изображения X на векторы эталонов A1,..., CM характеризует их сходство, при этом изображение Х относят к тому классу эталонов, для которого одно скалярное произведение среди (х, A1 ]... (х, CM) дало максимальное значение.

Таким образом, нами предложен подход распознавания зрительных образов с процедурой обучения и использования базы эталонных образов. Для более точной и достоверной работы распознающего устройства необходимо увеличивать количество ячеек рецепторной матрицы, а также базу эталонных образов распознаваемых объектов.

ЛИТЕРАТУРА

1. Хант Э. Искусственный интеллект. - М.: Мир, 1978. - 558 с.

2. Хайкин С. Нейронные сети: полный курс Neural Networks: A Comprehensive Foundation. - 2-е изд. - М.: Вильямс, 2006. - 1104 с.

3. Журавлев Ю. И. Избранные научные труды. - М.: Магистр, 2002. - 420 с.

4. Батырканов Ж. И. Системы искусственного интеллекта. - Бишкек: ИЦ «Текник», 2013. - 138 с.

5. Батырканов Ж. И., Кудакеева Г. М. Подход к распознаванию зрительных образов на основе эталонов и обучения // Известия Кыргызск. гос. техн. ун-та им. И. Раззакова. -2015. - №1 (34). - С. 11-13.

i Надоели баннеры? Вы всегда можете отключить рекламу.