Научная статья на тему 'Математическая модель представления изображения в системах распознавания образов'

Математическая модель представления изображения в системах распознавания образов Текст научной статьи по специальности «Математика»

CC BY
274
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ГРАФ / ГРАФОВАЯ МОДЕЛЬ / ИЗОБРАЖЕНИЕ / ФИЛЬТРАЦИЯ / СЕГМЕНТАЦИЯ / ОГРАНИЧЕНИЕ ГРАФОВОЙ МОДЕЛИ / НАРАЩИВАНИЕ ГРАФОВОЙ МОДЕЛИ / MATHEMATICAL MODEL / GRAPH / RAPH MODEL / IMAGE FILTERING / SEGMENTATION / LIMITING GRAPH MODEL / INCREASING GRAPH MODEL

Аннотация научной статьи по математике, автор научной работы — Штанчаев Хайрутин Баширович

С увеличением мощностей персональных электронно-вычислительных машин, остро стоит вопрос о математических моделях представления различных объектов. Связано это с тем, что существующие модели являются устаревшими и медленными. Статья посвящена математической модели представления изображения позволяющей качественно заменить классическую модель. В статье описывается математический аппарат модели, действия над ними и различные виды модели. Предложенная модель хорошо подходит для представления, фильтрации и сегментации изображения в современных системах распознавания образов. Одно изображение можно представить в разных графовых моделях в зависимости от поставленной задачи. Математический аппарат модели является гибким и встраиваемым в любую систему по необходимости. Графовая модель позволяет сократить вычисления связанные с манипуляциями с каждым пикселем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical model of image representation in recognition systems

The article is devoted to the mathematical model allows high quality image representation to replace the classical model. The article describes a mathematical model, action on them and a variety of models. The proposed model is well suited for presentation, filtering and image segmentation in modern systems of pattern recognition. One image can be represented in different graph models, depending on the task. Mathematical model is flexible and can be integrated into any system as needed. Graph model reduces the calculation related to the manipulation of each pixel.

Текст научной работы на тему «Математическая модель представления изображения в системах распознавания образов»

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

научный интернет-журнал

Интернет-журнал «Мир науки» ISSN 2309-4265 http://mir-nauki.com/ Выпуск 2 - 2015 апрель — июнь http://mir-nauki.com/issue-2-2015.html URL статьи: http://mir-nauki.com/PDF/29TMN215.pdf

УДК 004.93

Штанчаев Хайрутин Баширович

ОАО “Каспийский завод листового стекла”

Россия, Махачкала Инженер АСУ ТП

ФГБОУ ВПО “Дагестанский государственный технический университет”

Россия, Махачкала Аспирант

E-mail: Shtanchaev.h@gmail.com

Математическая модель представления изображения в системах распознавания образов

Аннотация. С увеличением мощностей персональных электронно-вычислительных машин, остро стоит вопрос о математических моделях представления различных объектов. Связано это с тем, что существующие модели являются устаревшими и медленными. Статья посвящена математической модели представления изображения позволяющей качественно заменить классическую модель. В статье описывается математический аппарат модели, действия над ними и различные виды модели. Предложенная модель хорошо подходит для представления, фильтрации и сегментации изображения в современных системах распознавания образов. Одно изображение можно представить в разных графовых моделях в зависимости от поставленной задачи. Математический аппарат модели является гибким и встраиваемым в любую систему по необходимости. Графовая модель позволяет сократить вычисления связанные с манипуляциями с каждым пикселем.

Ключевые слова: математическая модель; граф; графовая модель; изображение; фильтрация; сегментация; ограничение графовой модели; наращивание графовой модели.

Ссылка для цитирования этой статьи:

Штанчаев Х.Б. Математическая модель представления изображения в системах распознавания образов // Интернет-журнал «Мир науки» 2015 №2 http://mir-nauki.com/PDF/29TMN215.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.

1

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

Введение

С математической точки зрения, изображение можно представить как вещественную функцию img двух переменных х и y, I(x,y).

Функция img = 1(х,у), в общем случае определяется в прямоугольной форме [4,5], но для удобства исследований в работе все изображения определяются квадратными областями, т.е. х е [0; W], а у £ [0; Н] , где W- ширина изображения, H-высота изображения и W=H. Тогда говорят, что изображение имеет размер WxH. Значение, стоящее на пересечении x и y, называется пикселем. Не трудно заметить, что изображение схоже с прямоугольной системой координат. Можно отметить, что началом координат (0,0) применительно к изображению, нужно считать (x,y)=(1,1). Важно знать, что пара (x,y)=(1,2) относится ко второму пикселю.

Для легкости преобразований фильтрации и обработки, можно представить изображение в матричном виде:

img = 1(х,у)

1(0,0)

1(1,0)

1(0,1)

1(1,1)

1(0, W - 1) 1(1,W - 1)

(1)

И(Н - 1,0) 1(Н - 1,1)

I(H -1,W -1)\

где H- высота изображения, W- ширина изображения.

Особенностью такого представления цифрового изображения является то, что первый элемент в выражении (1) имеет координаты (x,y)=(0,0), а не (x,y)=(1,1) как указывалось выше[2].

Обобщенная графовая модель

Описанная выше модель не всегда удобна. Это обуславливается трудностью осуществлять поиск пикселей по цвету, проводить фильтрацию или сегментацию изображения. В этой связи представим изображение в качестве неориентированного графа:

G = (V, Е), V = {рп}, E = [ei2], HeW *H,i2£1... fc[1,3] где: V - множество вершин графа;

E - множество ребер графа;

W - ширина изображения;

H - высота изображения.

В качестве вершин графовой модели выступают пиксели исходного изображения. А ребра графа это связь пикселей между собой. Такую графовую модель будем называть обобщенной графовой моделью. Формула для получения графовой модели выглядит следующим образом:

УРк(хоУ]) £ img,к = 1...(W *H),G = [V Upk(xi,yj),E U (pk,pk+r)} (2) где: x,y -координаты пикселя pk; i = 1 ...W, j = 1 ...H

Графически обобщенная модель для изображения img представлена на рисунке 1.

2

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

Рис. 1. Обобщенная графовая модель изображения

A,B,C,D - стороны решетки графовой модели.

Представленная на рисунке 1 обобщенная модель практически можно применить только для представления изображения в качестве графа, т.к. кроме положения пикселей и связи между ними другой информации не несет. Однако такую модель можно преобразовать в другие графовые модели. Стоит отметить, что координаты (Xj, уу) закрепляются за вершиной рк. И в случае удаления этой вершины место в решетке с координатами (Xj,yy) остается пустым. Операции удаления и добавления вершины, ребер графовой модели идентичны операциям для графов. Однако имеются некоторые особенности:

1. Ново добавленная вершина заменяет старую если их координаты совпадают.

2. Ребра могут добавляться в любом количестве.

Введем основные определения графовой модели.

Определение 1. Восстановление изображения по графовой модели - получение изображения из графа представляя вершину графа как пиксель. Т.е. для некоторого графа G имеем: VVj2(x,y) е G,img = img U Vj2(x,y).

Определение 2. Ограничение графовой модели - уменьшение графовой модели в определенных пределах. Ограничение может проводиться в определенных пределах и в любые стороны решетки графовой модели.

Ограничение обозначается как R(x1,x2,x3,x4);

x1 - глубина ограничения со стороны A,

x2 -глубина ограничения со стороны B,

x3 -глубина ограничения со стороны C,

x4 - глубина ограничения со стороны D.

Ограничение означает удаление х1строк для стороны A, x2 столбцов для стороны B, x3 строк для стороны C, x4 столбцов для стороны D:

3

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

( Vvn(x,y) EV(G) хе[0...х1] у е [0...W],Greduct = V(G)\vn(x,y)

I Vvn(x,y) eV(G) хе[0...Н] у е [W ...x2],Greduct = V(G)\vn(x,y)

| Vva(x,y) е V(G) хе[н-х3 ...H] у е [0 ...W],Greduct = V(G)\vn(x,y) { Vvn(x,y) eV(G) хе[0...н] у е [0 ...x4],Greduct = V(G)\va(x,y)

Ограничение возможно и в определенном интервале, тогда из графовой модели удаляется область с определенной стороны. Ограничение на интервале [о, q]:

Rs(N,m, [о, q]).

где: N - наименование стороны;

[o, q] - интервал вершин; m - глубина ограничения.

Определение 3. Наращивание графовой модели - увеличение графовой модели в одну или несколько сторон. Наращивания не происходит в интервал. Т.е. Наращивание означает добавление вершин в графовую модель по всей длине строки и или по всей высоте столбца.

Наращивание графовой модели обозначается N(x1,x2,x3,x4) Редукция означает добавление x1 строк для стороны A, x2 столбцов для стороны B, x3 строк для стороны C, x4 столбцов для стороны D:

rVva(x,y) хе Ю-Х1...0] уе [0...W],Gnar = V(G)Uvn(x,y)

I Vvi2(x,y) хе[0...н] у е [W ...W + x2],Gnar = V(G) Uva(x,y)

I Vvi2(x,y) хе [H ...H + x3] у е [0...W],Gnar = V(G) Uva(x,y)

{ Vva(x,y) хе [0...H] уе [0 — x4...0],Gnar = V(G)Uvn(x,y)

Следует отметить, что G c Gnar. Из этого следует, что записи х е [0 — х1... 0] и у е [0 — х4 ...0] означают, что вершины из старой модели переносятся в новый со смещением на глубину наращивания :

Vvi3(x,y) е V(G),Gnar = V(G) U Рц(х + к1,у + к2) где: k1, k2 - глубина наращивания.

Определение 4. Зона графовой модели - область вершин графовой модели выбранная для решения поставленной задачи. Зона представляет собой сплошную область вершин ограниченную четырьмя ключевыми вершинами либо цепь из определенных вершин. Зона ограниченная четырьмя вершинами представляет собой следующую последовательность:

Zone(vpi, Vp2, Vp^, Vp^

Zone - название зоны vp1 - верхняя левая вершина vp2- верхняя правая вершина. vp3- нижняя левая вершина. vp4- нижняя правая вершина.

Зону с ограничением можно видеть на рисунке 2. Если G графовая модель, то ограниченная зона получается удалением вершин не входящих в указанный интервал. Так же

4

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

можно получить зону ограничением. Но при ограничении получается “обрезанный” основной граф, а зона может иметь вид многоугольника. В этом случае зона имеет вид:

Zo'n,e(V'pi> Vp2t ■■■, Vpi)

где: Vpi - последняя вершина многоугольной зоны. Также и представляется зона которая состоит из цепи вершин выражается как:

Zone[v1 .... vk3], получить ее можно из любой графовой модели ^zona = G(V)/vk 4 если Vvk4 EG vk4 Ф vk3

Рис. 2. Зона в графовой модели. Слева зона с ограничением. Справа зона образованная цепью вершин

Цветная графовая модель

Определение 5. Цвет вершины графа (z) - цвет в который окрашена вершина исходя из цвета пикселя составившей эту вершину. Цвет z исходя из поставленный задачи можно выразить численно как в цветовой системе RGB (например черный - 000000) или лингвистически (черный цвет или black). Если окрасить все вершины графа G в соответствующий цвет Z получим цветную графовую модель. Тогда вместо графа G имеем тройку:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Gcoior = (V,E,Z),V = {vi3},E = {e^.Z = {zi5},i3 = i5 E W * H,i4 E 1 ...k где: V - множество вершин графа;

E - множество ребер графа;

W - ширина изображения;

H - высота изображения;

Z - множество цветов вершин графа.

Например на рисунке 3 показан цветной граф у которого первые и последние вершины черного цвета.

5

29TMN215

Мир Науки Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Рис. 3. Цветная графовая модель изображения Для составления такого графа перепишем 2:

Vpk(x, у) е img, к = 1... (W * Н)

Gcoior = [У U рк(х,у),Е U (pk,pk+r),Z U z(pk(x,y)}(2.3)

где: x,y -координаты пикселя рк;

Такой граф очень удобно использовать для сегментации.

Определение 6. Сегментация графа - разделение графа на I подграфов по цветовому признаку. Цветовой признак зависит от поставленной задачи. Восстановив изображение по сегментированному графу можно получить сегментированное изображение.

Обозначим цветовой признак как P. Опишем сегментацию графа Gcolor как удаление вершины Vi6 с цветом z(Vi6) который не равен P, т.е.:

Vvi6, если z(vi6) * Р,

V(Gsegm) = V(Gcolor)\[Ei6'} ,G(Gsegm) = Е(Gcoior)\[(Vi6,Vi6+i)\Vi6 е V(Gcoior)}

Например если сегментировать граф показанный на рисунке 3 по черному цвету, мы получим граф представленный на рисунке 4

6

29TMN215

Мир Науки Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Рис. 4. Цветной граф после сегментации Для восстановления цветного графа имеем:

Vvj3(x,y) E G, img = [img U vj3, color(vj3) = Zj3} Где запись color означает установку цвета пикселя в указанный.

Раздельная графовая модель

Раздельную графовую модель можно получить разделив обобщенную графовую модель на i графов которые представляют собой столбцы изображения или на j графов которые представляют собой строки изображения.

Gsuper = т е. Gk с Gsuper

Разделение суперграфа Gsuper на подграфы по столбцам:

Gk = V(Gsuper)\v(k,i9), E(Gk) = E(Gsuper)\{(v,u)\u E V(Gk)},i9 = 1 ...H.

Разделение суперграфа Gsuper на подграфы по строкам:

Gk = V(Gsuper)\v(iw,k), E(Gk) = E(Gsuper)\{(v,u)\u E V(Gk)},iw = 1 ...W.

Такая модель оказывается полезной при поиске того или иного пикселя. Например поиск первого черного пикселя в 4 строке, или пиксель другого цвета в первой половине изображения и т.д. Следует отметить что раздельный граф должен отвечать условию:

deg(v±) = 1, deg(vm) = 1,deg(vm ....vm-±) = 2.

Также стоит обратить внимание на то, то раздельная графовая модель может быть выстроена как для обобщенного графа так и для цветного и сегментированного графов.

Раздельная модель для столбцов суперграфа 2 графически показана на следующем рисунке.

7

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

Рис. 5. Раздельная графовая модель для обобщенного суперграфа по столбцам А раздельная модель для графа 5 по строкам выглядит так:

Рис. 6. Раздельная графовая модель для цветного суперграфа по строкам

Стоит отметить, что при восстановлении изображения по раздельному графу мы получим j изображений.

Заключение

Описанная в статье математическая модель, основанная на графах, является достаточной и качественной заменой классической модели представления изображения. Такая модель хорошо подходит для представления, фильтрации и сегментации изображения в современных системах распознавания образов[6]. Одно изображение можно представить в разных графовых моделях в зависимости от поставленной задачи. Математический аппарат модели является гибким и встраиваемым в любую систему по необходимости. Графовая модель позволяет сократить вычисления связанные с манипуляциями с каждым пикселем.

8

29TMN215

Выпуск 2 - 2015 (499) 755 50 99

http://mir-nauki.com

ЛИТЕРАТУРА

1. Асанов М.О. Дискретная математика: графы, матроиды, алгоритмы: учебное пособие / М.О. Асанов, В.А. Баранский, В.В. Расин. - СПб.: Лань, 2010.

2. Брусенцов В., Поляков А. Методы и алгоритмы компьютерной графики в примерах на Visual C++ - БХВ-Петербург,2012.-544c.

3. Мельников О.И. Теория графов в занимательных задачах. Изд.3, испр. и доп.2009. 232с.

4. Методы компьютерной обработки изображений / под. ред. В.А.Сойфера-М.: ФИЗМАТЛИТ, 2003. -784с.

5. Тропченко А.Ю., Тропченко А.А. Методы сжатия изображений, аудио сигналов и видео: Учебное пособие - СПб: СПбГУ ИТМО, 2009. - 108 с.

6. Штанчаев Х.Б. Применение графовой модели и априорного классификатора для

сегментации изображения в задачах распознавания лица человека // Интернетжурнал «НАУКОВЕДЕНИЕ» Том 7, №2 (2015)

http://naukovedenie.ru/PDF/130TVN215.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10.15862/130TVN215

9

29TMN215

Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

Мир Науки

Shtanchaev Khairutin Bashirovich

Caspian Flat Glass Dagestan State Technical University Russia, Dagestan republic, Makhachkala E-mail: Shtanchaev.h@gmail.com

Mathematical model of image representation in recognition systems

Abstract. The article is devoted to the mathematical model allows high quality image representation to replace the classical model. The article describes a mathematical model, action on them and a variety of models. The proposed model is well suited for presentation, filtering and image segmentation in modern systems of pattern recognition. One image can be represented in different graph models, depending on the task. Mathematical model is flexible and can be integrated into any system as needed. Graph model reduces the calculation related to the manipulation of each pixel.

Keywords: mathematical model; graph, graph model; image filtering; segmentation; limiting graph model; increasing graph model.

10

29TMN215

Мир Науки Выпуск 2 - 2015

(499) 755 50 99 http://mir-nauki.com

REFERENCES

1. Asanov M.O. Diskretnaya matematika: grafy, matroidy, algoritmy: uchebnoe posobie / M.O. Asanov, V.A. Baranskiy, V.V. Rasin. - SPb.: Lan', 2010.

2. Brusentsov V., Polyakov A. Metody i algoritmy komp'yuternoy grafiki v primerakh na Visual C++ - BKhV-Peterburg,2012.-544c.

3. Mel'nikov O.I. Teoriya grafov v zanimatel'nykh zadachakh. Izd.3, ispr. i dop.2009. 232s.

4. Metody komp'yuternoy obrabotki izobrazheniy / pod. red. V.A.Soyfera-M.: FIZMATLIT, 2003. -784s.

5. Tropchenko A.Yu., Tropchenko A.A. Metody szhatiya izobrazheniy, audio signalov i video: Uchebnoe posobie - SPb: SPbGU ITMO, 2009. - 108 s.

6. Shtanchaev Kh.B. Primenenie grafovoy modeli i apriornogo klassifikatora dlya

segmentatsii izobrazheniya v zadachakh raspoznavaniya litsa cheloveka // Internet-zhurnal «NAUKOVEDENIE» Tom 7, №2 (2015)

http://naukovedenie.ru/PDF/130TVN215.pdf (dostup svobodnyy). Zagl. s ekrana. Yaz. rus., angl. DOI: 10.15862/130TVN215

11

29TMN215

i Надоели баннеры? Вы всегда можете отключить рекламу.