Научная статья на тему 'Распознавание скелетных образов'

Распознавание скелетных образов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
166
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Метляев С. В.

Рассматривается скелетное представление, используемое для распознавания символов. Описаны построения набора вектора скелетных признаков и формирования оценок распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RECOGNITION OF THE SKELETAL IMAGES

We consider skeletal presentation that is used for character recognition. We describe the construction of a set of vector skeletal traits and estimates mark of recognition.

Текст научной работы на тему «Распознавание скелетных образов»

фонового пикселя еп-1(х, у) и текущего пикселя еп(х, у) должны быть равны и близки к нулю. Если же пиксель является граничным для области задымления, то будут наблюдаться характерные всплески в разнице значений энергии фонового и текущего пикселей. Это происходит из-за частого перехода такого рода пикселя из области задымления в область фона, и наоборот. Точки изображения, прошедшие контроль частотных характеристик, составляют собой массив точек полигональной аппроксимации формы области с вероятным наличием дыма.

На последнем шаге происходит контроль формы найденной области на выпуклость. В некоторой степени упрощения область задымления представляет собой выпуклый многоугольник, что следует из особенностей газообразной природы пара и дыма. Для проверки выпуклости граница найденной области пересекается несколькими горизонтальными и вертикальными прямыми линиями, после чего анализируется количество точек пересечения. Для выпуклой области оно всегда меньше или равно двум. Область, прошедшая контроль по всем четырем шагам, с высокой вероятностью соответствует области задымления и сопровождается на изображении цветовыми маркерами.

Метод визуального детектирования дыма на основе вейвлет-преобразований обладает высокой степенью эффективности, поскольку использует для анализа главную отличительную особенность видеопотока - наличие динамических характеристик искомой области. В настоящее время разрабатывается программная реализация данного метода визуального детектирования дыма.

Библиографический список

1. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. М. : Техносфера, 2005.

2. Грибунин, Б. Теория и практика вейвлет-преобразований / Б. Грибунин, А. Воробьев. М. : Военный университет связи, 1999.

3. Левтин, К. Э. Блочно-текстурный метод детектирование дыма в видеопоследовательностях / К. Э. Левтин // ТиПВСИТ. Улан-Удэ, 2009. С.248-250.

4. Vezzani, R. Smoke Detection in Video Surveillance: the Use of ViSOR (Video Surveillance Online Repository) / R. Vezzani, S. Calderara // EUSIPC0-2005, Poland, 2007. P. 540-543.

K. E. Levtin

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

VIDEO STREAM SMOKE DETECTION BASED ON WAVELET TRANSFORMS

An approach that describes the algorithm for smoke detection in video stream based on applying a wavelet transform to candidate images and on some especial physical processes of smoke as gaseous substance is discussed.

© Левтин К. Э., 2009

УДК 004.932.75'1

С. В. Метляев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

РАСПОЗНАВАНИЕ СКЕЛЕТНЫХ ОБРАЗОВ

Рассматривается скелетное представление, используемое для распознавания символов. Описаны построение набора вектора скелетных признаков и формирования оценок распознавания.

Процедура скелетизации исходных изображений символов, ее использование в системах распознавания текста давно изучается разными авторами, ей посвящена многочисленная литература [1; 2].

Рассматривается задача, когда на изображения со сложной цветовой структурой нанесены печат-

ные символы, которые необходимо распознать. На начальном этапе исходное изображение подвергается предварительной обработке, заключающееся в улучшении изображения, очистки от шумов и т. д. На следующем этапе происходит поиск областей, в которых большая вероятность содержания текстовых символов. К найденным

Решетневские чтения

областям применяется процедура скелетизации (утоньшения), в результате которого формируется скелетное представление.

Для ускорения получения скелетного представления применяется ряд технических приемов, таких как получение сведений о возможности удаления точки и о последующей точке перехода по границе с использованием предварительно подготовленных таблиц, а не с помощью вычисления нужных величин.

Главная задача скелетного представления символа - предоставить возможность для получения ряда характеристик исходного изображения, в связи с этим можно использовать скелетное представление символа для выделения характеристик символа. Утоньшенное изображение анализируется, и в особой таблице фиксируются его следующие параметры: особые точки, структура контура, цепной код.

В полученном описании скелетного представления производится огрубляющая предобработка, состоящая в удалении коротких линий, объединении близких триодов, уничтожении малых внутренних контуров. Для внешнего контура находят его тип или топологический код. Для этого контур записывают в виде последовательного набора номеров особых точек, соответствующих обходу по часовой стрелке. Затем с помощью перенумерации особых точек и изменения начала контура делают попытку отождествления контура с одним из основных типов.

Топологические признаки, которые могут использоваться при анализе скелетизованного представления символов следующие:

- нормированные координаты особой точки (вершины графа);

- длина ребра до следующей вершины в процентах от длины всего графа;

- нормированное направление из данной точки на следующую особую точку;

- нормированное направление входа в точку, выхода из точки (для триодов эти значения различаются, для точек индекса 1 совпадают с точностью до знака);

- кривизна дуги, точнее «левая» и «правая» кривизна дуги, соединяющей особую точку со следующей вершиной (кривизна слева и справа). Кривизна вычисляется как отношение максимального расстояния от точек дуги (находящихся соответственно слева/справа от прямой) до прямой, соединяющей вершины, к длине отрезка, соединяющего те же вершины.

Обучение метода состоит в построении деревьев распознавания для каждого из определенных заранее (вручную или автоматически) топологических кодов. Кратко опишем процедуру построения дерева распознавания.

Для каждого топологического кода в обучающем множестве проводится отбор всех имен символов, имеющих достаточно большое представительство. Для каждого имени проводится анализ имеющихся значений признаков p[i], i = 1,..., N, где N - число признаков для текущего топологического кода. Обозначим Ai - множество имеющихся значений для признака i для символов с именем А. Тогда для каждого i, 0 < i <= N, Ai представляется в виде

4 = 4i u • u Aim¡, A.. = {x e R | 5.. < x < е.. },

V l 1 V V }'

где m различно для каждого и для каждого A . Далее производится поиск конфликтов. Если для некоторых символов A, B значения признаков пересекаются, т. е. at n bt ф 0 для "i,i = 1,...,N, тогда проводится попытка разрешить конфликт. Делается попытка найти некоторый наилучший для разбиения (наиболее дисперсионный) признак y, выбрать точку деления этого признака к, и разбить множество A на два непересекающихся подмножества A', A" таким образом, чтобы выполнялось условие A = A u А,

A. = A j u Aj,

A= Aji u Aj2 u...u Ajk,

AJ = AJk+1 U AJk+2 U ... U Ajmj ,0 < к < mj .

Затем процедура повторяется, т. е. для каждого A', A" проводится построение областей значений признаков и поиск конфликтов с разноименными символами с возможной дальнейшей разбивкой множеств A', A" и т. д. Конечно, все конфликты разрешить удается не всегда, поэтому при распознавании в ряде случаев будет выдаваться не одна альтернатива, а несколько. Оценки результирующих альтернатив будут зависеть как от значений признаков (топологических и не топологических), так и от представительности конфликтующих символов в обучающем множестве.

Таким образом, распознавание является древовидным, текущее дерево распознавания выбирается с помощью топологического кода.

Метод распознавания символов на основе их скелетного представления имеет ряд преимуществ в сравнении с другими методами: простота реализации метода, точность полученных результатов, высокое скорость (быстродействие) в зависимости от выбора метода скелетизации.

Библиографический список

1. Lam, L. Thinning Methodologies: A Comprehensive Survey / L. Lam, S. W. Lee, C. Y. Suen // IEEE Trans. Pattern Analysis and Machine Intelligence. Vol. 14. 1992. P. 869-885.

2. Plamondon, R. Methodologies for Evaluating Int'l. J. Pattern Recognition and Artificial Intelli-Thinning Algorithms for Character Recognition / gence, special issue thinning algorithms. 1993. R. Plamondon, C. Y. Suen, M. Bourdeau, C. Barriere. Vol. 7, № 5. Р. 1 247-1 270.

S. V. Metlyaev

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

RECOGNITION OF THE SKELETAL IMAGES

We consider a skeletal presentation used for a character recognition. We describe the construction of a set of vector skeletal traits and estimates mark of recognition.

© Mem«« C. B., 2009

УДК 681.3

В. В. Митюков

Ульяновское высшее авиационное училище гражданской авиации (институт), Россия, Ульяновск

ПРОГРАММНОЕ ДОПОЛНЕНИЕ К СРЕДСТВАМ РИСОВАНИЯ MS OFFICE ДЛЯ ИНТЕРАКТИВНОЙ АППРОКСИМАЦИИ ГРАФИЧЕСКИХ ЗАВИСИМОСТЕЙ

Рассматривается задача аналитического представления некоторых зависимостей, заданных дискретно или графически. Предложен подход к аппроксимации такого вида зависимостей путем визуальной интерактивной обводки их кривыми линиями (сплайнами), включенными в панель рисования пакета MS Office.

Задачи компьютерного моделирования непосредственно связаны с необходимостью интерполяции и аппроксимации различных данных и зависимостей, представленных в графическом виде. Например, если требуемая зависимость получена в результате сложных экспериментов или громоздких расчетов. В работе рассматривается задача аппроксимации таких зависимостей, решаемая путем визуальной подгонки рисованных кривых линий (сплайнов).

Математически сплайны состоят из алгебраических полиномов n-ой степени [1], состыкованных между собой с заданной степенью гладкости. В приложениях MS Office используется стандартная, встроенная в ОС Windows функция Безье, рисующая кубический параметрический сплайн, составленный из плоских фрагментов:

r(u) = p0-(1 - u) 3 + p1-3-M (1 - u) 2 +

+ p2-3-M2(1-M) + p3-M3, (1)

где параметр (u) задан в интервале [0, 1].

Перетаскивание меток-манипуляторов в большинстве графических программ позволяет интерактивно изменять векторные коэффициенты (точки) p0, p1, p2, p3, задающие форму фрагмента сплайна, добиваясь его наилучшего совпадения с плоским фрагментом отсканированного изображения зависимости. Сначала размещаются конце-

вые точки p0 и p3, и, затем, перемещением точек p1 и p2, задающих направления желаемых касательных на концах кривой, подбирается нужная форма сплайна [1]. Для выполнения этих действий вполне достаточно средств стандартной панели инструментов «Рисование» пакета MS Office (автофигуры «Линия» или «Кривая»). После масштабирования полученных точек p0, p1, p2, p3 по осям координат и подстановки полученных значений в уравнение (1), нетрудно вычислить значения реальных координат любой промежуточной точки фрагмента сплайна.

В задачах моделирования может потребоваться представить кубическим фрагмент сплайна Л(Ц) в виде разложения по другим базисным функциям (например, в степенной ряд):

r(u) = со'ф о(х) + сгф1(х) +

+с2 -ф2(х) + с3 -ф3(х). (2)

Путем сопоставления уравнений кривой r(u) в (2) с уравнением в Безье (1), можно установить соотношения между наборами векторов p0, pi, p2, p3 и со, сь с2,Х3.

В задачах аппроксимации в качестве независимой переменной чаще всего служит одна из координат (x), наряду с остальными координатами в (1) зависящая от параметра u -> x(u). Для вычисления зависимой от x переменной y = y(u(x)) в

i Надоели баннеры? Вы всегда можете отключить рекламу.