Научная статья на тему 'Критерий обнаружения объектных фрагментов штрихового изображения в полутоновом'

Критерий обнаружения объектных фрагментов штрихового изображения в полутоновом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
88
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Григорьев А. В., Држевецкий А. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Критерий обнаружения объектных фрагментов штрихового изображения в полутоновом»

Критерий обнаружения объектных фрагментов штрихового изображения в полутоновом Г ригорьев А.В., Држевецкий А.Л.

Пензенский государственный университет

Восстановление штрихового изображения из полутонового осуществляется, например, тогда, когда сканируется текст с установленным флажком «чёрно-белый рисунок или текст». При этом реально сканируется, конечно, полутоновое изображение с уровнями серого. Это изображение непосредственно в процессе сканирования преобразуется в штриховое. При этом цифровой код яркости растрового элемента сравнивается с кодом некоторого порогового уровня є. Если яркость пикселя не менее є, то принимается решение о том, что это уровень белого, если менее — то чёрного.

Можно сканировать или фотографировать цифровым фотоаппаратом текст со штриховыми рисунками в полутоновом и даже цветном режиме. Но если потом мы хотим его распознать с помощью какой-нибудь известной программы (например, Fine Reader ’а), всё равно эта программа осуществит преобразование полутонового изображения в штриховое путём простого сравнения кодов яркости и цветности исходного изображения с постоянным пороговым уровнем, сформирует по результатам этого сравнения файл (в Fine Reader’е этот файл имеет расширение «.tif»), и уже из этого файла будет распознавать текст.

При распознавании решается задача формирования и классификации объектов из областей связанных элементов определённого класса. В данном случае таким классом является уровень чёрного. Условимся, что яркость элементов обращенная: чем чернее, тем выше. Участки растрового изображения, из которых будут при распознавании формироваться объекты, будем называть объектными фрагментами. Например, при рассмотренном способе предварительной обработки объектными фрагментами являются области связанных элементов, отнесённых к уровню чёрного. Распределение обращённой яркости пикселей Z вдоль линии х, будем называть профилем. Рассмот-

1

рим преобразование некоторого полутонового профиля в двухградационный методом сравнения яркости пикселя с пороговым уровнем (рис.1.).

х-^

Рис. 1. Обнаружение объектных фрагментов методом сравнения с постоянным уровнем яркости

На рис.1. Z — обращённая яркость пикселей; b — логическая функция, принимающая значение «1» (верхний уровень), если Z >е и «0» (нижний уровень), если Z < e. Нижний (белый) горизонтальный участок определится как фоновый фрагмент, а верхний (чёрный) — как объектный. В реальных изображениях фон, как правило, неравномерный. Границы символов, как правило, нечёткие. Это приводит к ошибкам распознавания. Если текст не сканировался сканером, а фотографировался фотоаппаратом, то ошибок при распознавании будет ещё больше.

Известны также системы, вычисляющие градиент яркости в окрестности пикселя и сравнивающие его с пороговым уровнем (рис. 2.). Такой алгоритм реализуется, например, в опции «Градиентный анализ» программы Corel Photo Paint.

2

X

Рис. 2. Обнаружение объектных фрагментов методом сравнения градиента яркости пикселя с его с постоянным уровнем яркости

Преимуществом такой системы является то, что границы объектов выделяются чётче, чем при простом сравнении яркости пикселя с пороговым

3

уровнем. Неравномерность фона влияет на результат гораздо меньше, чем при сравнении с пороговым уровнем самой яркости, а не её производной.

К недостаткам такого подхода следует отнести то, что при этом отображаются только границы объектного фрагмента, а не сам этот фрагмент. Кроме того, наиболее информативная «вершинная» часть сцены будет перегружена неинформативными пятнами чёрного (рис. 2.).

Такое изображение не может быть исходным для распознавания стандартными пакетами, да и вообще задача распознавания таких объектов будет гораздо сложней.

В [1] предложен способ селекции объектов, расположенных на неравномерном фоне, при котором вычисляются разности яркостей текущего по ходу развёртки пикселя и соседних с ним по восьми направлениям. Этот способ применительно к рефлексам электронно-дифракционной картины, развит в [2].

Сущность этого способа заключается в том, что при пошаговом считывании кодов яркости пикселей вычисляются разности яркостей этих пикселей и соседних с ними по восьми направлениям (рис. 3.).

Рис. 3. Схема восьми направлений для вычисления разностей

4

На рис. 3.: i — порядковый номер растрового элемента в растровой строке; j — порядковый номер растровой строки. Цифра возле линии, обозначающей направление, — порядковый номер направления.

При этом разности по нечётным направлениям следует делить на V2, поскольку межцентровые расстояния элементов, соседствующих по этим направлениям, в V2 раз больше межцентровых расстояний элементов, соседствующих по чётным (недиагональным) направлениям.

Введём обозначения. Пусть Zi j это обращённая яркость растрового

элемента с порядковым номером i в j-й строке растра. щ j к — к-я разность i-

го элемента в j-й строке. Например, = Zi j - Zi+1j_i. Разности Щ jk

сравниваем с пороговыми уровнями є и минус є. Каждой разности ставится в соответствие параметр pi, j,к. Значение этого параметра определяет класс

разности (табл. 1.).

Таблица 1

Неравенство Параметр разности Класс разности

ai, j, к <-e о II •"3 б; отрицательная

00 VI •"3 о* VI 00 1 pi, j, к = 1 незначимая

ai , j,к > e Pi,j,k = 2 положительная

Если некоторый пиксель связан с другими пикселями только значимыми (то есть либо положительными, либо отрицательными) разностями, то это будет одноэлементная область связанных незначимых разностей. Вернёмся к профилю рис.1. Как видим, у этого профиля нижние горизонтальные участки фоновые, верхние — объектные. То есть область связанных незначимых разностей может быть объектной, а может быть и фоновой. Как отличить фоновую область от объектной? Как видим, среди элементов, расположенных на границе любой фоновой области связанных незначимых разностей, обяза-

5

тельно найдётся хотя бы один растровый элемент, который имеет за пределами этой областей отрицательные разности. Если же область связанных незначимых разностей является объектной, то ни один из её элементов никогда не будет иметь ни одной отрицательной разности.

Среди растровых элементов такой области связанных незначимых разностей также обязательно найдётся хотя бы один растровый элемент, имеющий хотя бы одну отрицательную разность.

Такая одноэлементная объектная область представляет собой одноэлементную область связанных незначимых разностей, ни один из элементов которой не имеет за её пределами ни одной отрицательной разности.

Обобщая сказанное, можем сформулировать определение объектного фрагмента: объектным фрагментом называется область связанных незначимых разностей, ни один из растровых элементов которой не имеет ни одной отрицательной разности.

Данный критерий нельзя применять непосредственно. Областей связанных незначимых разностей в реальной полутоновой сцене великое множество. Собственно, каждый пиксель такой сцены принадлежит какой-нибудь области связанных незначимых разностей. На склоне рефлекса каждый пояс равной высоты (яркости) шириной в один пиксель есть область связанных незначимых разностей. Алгоритм необходимо трансформировать таким образом, чтобы решающее устройство оперировало не с разностями, а с пикселями. А вот классифицировать пиксели необходимо по разностям этих пикселей, определённым по направлениям (рис. 3.).

Рассмотрим сначала классификацию пикселей по профилю. Каждый пиксель профиля имеет две разности: «вперёд» и «назад». Другими словами: щ і = Zi - Zi+1 а л = Zi - Zi_i, где щ I и aj ii — профильные разности, со-

ответственно, «вперёд» и «назад». Профильные разности могут быть положительными, отрицательными и незначимыми. По сочетанию этих разностей будем определять класс профильного пикселя. Возможны следующие соче-

6

тания: «00», «01», «02», «11», «12», «22». Всего шесть сочетаний, шесть классов [3].

В [3] рассмотрен алгоритм распознавания вершин профилей электронно-дифракционных картин. В настоящей работе предпринимается попытка распространить опыт, накопленный при анализе электронно-дифракционных картин, на любые полутоновые изображения. Для удобства ссылок будем далее именовать область, отличную от фона, «рефлексом», объектный фрагмент — «вершиной» и прочие термины унифицируем к электроннодифракционным определениям.

Математически количество классов профильных пикселей это есть количество сочетаний с повторениями из двух направлений по три разностных класса [2]:

т = (n + m -1)/ ^ 2 = (3 + 2 -1)/ = = 1-2 • 3 • 4 = 6

Jn т/ (n -1)/ J3 2/ (3 -1)/ 2/-2/ 1- 2 -1- 2 .

Таким образом подтверждается определённое на вербальном уровне количество классов профильных пикселей.

Каждый такой класс представляет собой сочетание двух разностей. Наглядно эти сочетания могут быть представлены в оконном шаблоне [4] (рис.

4.).

I II

P =0

р =1

P =2

Рис. 4. Оконный шаблон для профильных разностей

Если, например, у элемента профиля обе разности незначимые, то такой профильный пиксель получил название негативного. Графически он может быть представлен следующим образом (рис. 5.).

7

I II

P=0

P=1

_ 1 - - ■ p=2

Рис. 5. Графическая интерпретация негативного пикселя

Если одна из разностей незначимая, а другая отрицательная, то это негативно-контурный профильный пиксель (рис. 6.).

Если одна из разностей незначимая, а другая положительная, то это позитивно-контурный профильный пиксель (рис. 7.).

I II

.........P=0

p=i

P=2

Рис. 7. Графическая интерпретация позитивно-контурного пикселя

Если одна из разностей положительная, а другая отрицательная, то это позитивный профильный пиксель (рис. 8.).

I II

Рис. 8. Графическая интерпретация позитивного пикселя

Если обе разности положительные, то это вершинный профильный пиксель (рис. 9.).

8

I

II

P=0

Рис. 9. Графическая интерпретация вершинного пикселя

Если обе разности отрицательные, то это низинный профильный пиксель (рис. 10.).

I II

Вот такие шесть классов профильных пикселей. В [3] сформулированы характеристические признаки и логический функционал для выделения фрагмента как вершины рефлекса (то есть для обнаружения информативного объектного сегмента изображения). При этом добавляются ещё два класса пикселей. Это пиксели краевые, которые примыкают к краю обрабатываемой сцены и пиксели горизонтально-положительные, то есть объединение негативных и позитивно-контурных пикселей.

Логический функционал такой: H = (k/ и/2/, где /1.-/4 — характеристические признаки:

k1 : фрагмент является областью связанных горизонтально-

положительных элементов;

/2: фрагмент является областью связанных вершинных элементов;

k3 : к фрагменту не примыкает ни один негативно-контурный элемент;

k4 : к фрагменту не примыкает ни один краевой элемент.

По смыслу данный функционал и сформулированный в настоящей статье критерий идентичны. Действительно, если фрагмент является областью связанных горизонтально-положительных элементов, то данный фрагмент является областью связанных незначимых разностей. А если к такому фрагменту не примыкает ни один негативно-контурный элемент, то ни один из

9

пикселей этого фрагмента не имеет за его пределами отрицательных разностей. Если фрагмент является областью связанных вершинных элементов (в профиле такая область может состоять только из одного вершинного элемента), то такая область является вершиной рефлекса, потому что элемент связан сам с собой незначимой разностью, а отрицательных разностей у вершинного элемента в принципе быть не может. Разумеется, всё это при условии, что фрагмент не примыкает к краю поверхности. Если примыкает, то неизвестно, что там дальше, и принимается решение о том, что фрагмент не объектный.

Осталось обобщить данный подход на двумерное распределение яркости, каковым является анализируемая сцена. Каждый пиксель двумерного распределения имеет восемь направлений, по которым определяются разности. Каждое такое направление вместе с противоположным ему — пара направлений — это элементарный трёхэлементный профиль. Таким образом, каждой паре направлений можно поставить в соответствие один из шести рассмотренных классов. В результате каждый пиксель сцены имеет четыре класса. Задача сводится к определению уровней предпочтений, другими словами, приоритета для этих классов. Обоснование и формулировка приоритетов классов пикселей полутонового изображения приведены в статьях [5]... [8] применительно к анализу электронно-дифракционных картин.

Список литературы

1. Патент 1837335 РФ G06K 9/00. Устройство для селекции изображений. / А. Л. Држевецкий, В.Н. Контишев, А.В. Григорьев, А.Г. Царёв // Выдан 19.08.1993 г.

2. Григорьев А.В. Структурный принцип классификации растровых элементов электронно-дифракционного профиля. «Цифровые модели в про-

10

ектировании и производстве РЭС». Межвуз. сб. науч. тр. — Изд-во Пенз. гос. ун-та, 2003 г.

3. Григорьев А.В. Структурный принцип распознавания вершин электронно-дифракционных профилей. Труды международного симпозиума «Надёжность и качество’2003» — Изд-во Пенз. гос. ун-та, 2003 г.

4. Григорьев А.В. Способ обработки электронно-дифракционных профилей. Труды международного симпозиума «Надёжность и качество’2004» — Изд-во Пенз. гос. ун-та, 2004 г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Григорьев А.В., Граб И.Д. Приоритет склона электроннодифракционного рефлекса. Труды международного симпозиума «Надёжность и качество’2007» — Изд-во Пенз. гос. ун-та, 2007 г.

6. Григорьев А.В. Оконтуривание склона электронно-дифракционного рефлекса. Труды международного симпозиума «Надёжность и качест-во’2008» — Изд-во Пенз. гос. ун-та, 2008 г.

7. Григорьев А.В., Држевецкий А. Л. Нижний контур склона электронно-дифракционного рефлекса. Труды международного симпозиума «Надёжность и качество’200» — Изд-во Пенз. гос. ун-та, 2009 г.

8. Григорьев А.В., Држевецкий А.Л., Граб И.Д. Уровни предпочтений в системе распознавания электронно-дифракционных картин. Труды международного симпозиума «Надёжность и качество’2010» — Изд-во Пенз. гос. унта, 2010 г.

11

i Надоели баннеры? Вы всегда можете отключить рекламу.