Адаптивный пороговый метод бинаризации растровых изображений технических чертежей

Молчанова В. С.

УДК 004.93

Молчанова В. С.

Ст. преподаватель кафедры информатики ГВУЗ «Приазовский государственный технический университет»,

Мариуполь, Украина

АДАПТИВНЫЙ ПОРОГОВЫЙ МЕТОД БИНАРИЗАЦИИ РАСТРОВЫХ ИЗОБРАЖЕНИЙ ТЕХНИЧЕСКИХ ЧЕРТЕЖЕЙ

В статье предлагается метод адаптивной пороговой бинаризации растровых изображений технических чертежей. Проанализированы специфические особенности изображений технических чертежей и их влияние на результат бинаризации известными универсальными методами. Выявлены артефакты, возникающие на результирующих бинарных изображениях и предложены способы их устранения.

В основу предложенного метода положено соображение о том, что очень маленькие фрагменты изображения чертежа напоминают букву «С», которая в особых случаях вырождается в прямую линию. Дальнейшие рассуждения сводятся к выбору способа определения соответствия объекта на изображении форме «С». Отдельное влияние уделено вопросам настройки порога бинаризации в зависимости от яркости изображения.

В работе представлена математическая модель предложенного метода, его алгоритмическое описание. Проведены эксперименты по исследованию качественных и количественных показателей эффективности. Качественная оценка выполнялась путем сравнения результата бинаризации с эталонным черно-белым изображением. В качестве критериев количественного оценивания рассмотрены такие критерии, как время выполнения алгоритма, полнота и /-мера. Представлены результаты проведенных экспериментов, показывающие превосходство предложенной в работе методики бинаризации растровых изображений технических чертежей, как количественно, так и качественно.

Ключевые слова: растровое изображение, бинаризация, технический чертеж, порог бинаризации, яркость, оттенок серого, полезный сигнал, фон, шум, ошибка

НОМЕНКЛАТУРА

В - матрица, задающая полученное бинарное изображение;

Ь - элемент матрицы В, определяющий цвет в точке (х, у) получаемого в ходе бинаризации черно-белого изображения

ВО - число точек, принадлежащих фону на «идеальном» бинарном изображении;

ВТ - число точек, принадлежащих фону на бинарном изображении;

Р - Р-мера результатов бинаризации; РО - число точек, принадлежащих объекту на «идеальном» бинарном изображении;

РК - число точек, одновременно принадлежащих объекту на «идеальном» бинарном изображении и изображении, полученном в ходе преобразования;

РТ - число точек, принадлежащих объекту на бинарном изображении;

Н - длина исходного изображения; г - индекс точки, принадлежащей стороне «окна» вокруг точки (х, у);

Ь(Р) - булевая функция, определяющая превышает ли разность среднего значения серого в окрестности и значения серого в некоторой точке, порог Т; т - смещение по оси х; МЕ - ошибка классификации; п - смещение по оси у;

Р - матрица, задающая исходное изображение в градациях серого;

р - среднее значение серого в окрестности точки; ру - элемент матрицы Р, определяющий тон серого в точке (х, у) исходного изображения;

Р. - точка, принадлежащая окрестности точки (х, у);

Б01 10.15588/1607-3274-2015-2-8

P' - точка, принадлежащая окрестности точки (x, у), расположенная напротив точки P.;

P - максимальное значение серого в окрестности

max г г

точки;

P . - минимальное значение серого в окрестности

min г г

точки;

Q - правило преобразования исходного изображения в градациях серого в черно-белый формат;

SW - длина стороны локального окна;

T - локальный порог бинаризации;

T1 - глобальный порог бинаризации;

W - ширина исходного изображения;

x - координата точки по оси х;

y - координата точки по оси у;

а - коэффициент поправки;

ДТ - корректировка глобального порога бинаризации. ВВЕДЕНИЕ

Изображения технических чертежей следует сканировать в цветной палитре или в палитре оттенков серого, так как в этом случае получается изображение более высокого качества, чем при использовании черно-белого варианта. Данное утверждение относится, прежде всего, к документам, выполненным вручную чертежными шрифтами, и к многократным копиям документов. В тоже время распознавание, а также предварительную фильтрацию и скелетизацию проще выполнять для монохромного изображения. Кроме того, обработка монохромных изображений требует меньших затрат времени и ресурсов вычислительной системы. Таким образом, становится актуальной проблема преобразования цветного или полутонового изображения в его монохромный эквивалент. Такая задача называется бинаризацией и по своей сути представляет отделение полезного сигнала от фона.

Объект исследования представляет собой процесс бинаризации цветных или полутоновых изображений технических чертежей. Предметом исследования в работе являются специфические особенности изображений технических чертежей, влияющие на качество результирующего изображения, а также способы устранения недостатков, полученных в ходе обработки изображений стандартными алгоритмами бинаризации.

Цель работы состоит в разработке и реализации эффективного алгоритма бинаризации изображений, адаптированного под специфические особенности технических чертежей. Для достижения поставленной цели необходимо решить следующие задачи:

- определить специфические особенности изображений технических чертежей, влияющие на результат бинаризации;

- предложить способ устранения недостатков обработки изображений универсальными алгоритмами;

- реализовать алгоритм бинаризации растровых изображений технических чертежей;

- проанализировать полученные результаты. 1 ПОСТАНОВКА ЗАДАЧИ

Пусть некоторое исходное изображение задано в виде прямоугольной матрицы Р размерностью ЖХИ (1):

(

Р =

Р00 Р10

Р01 Р11

рИ-1,0 рИ-1,1

р0,ю-1 р1,ю-1

рИ-1,Ю-1

л

(1)

Каждый элемент ру матрицы Р определяет тон серого в соответствующей точке изображения и может принимать любые целые значения от 0, что соответствует черному цвету в точке (х,у) исходного изображения, до 255 - белому [1-3]. Необходимо определить правило Q, такое, что матрица В (2), полученная как Р ——^ В, определяет бинарное представление исходного изображения, при этом значение 0 будет соответствовать белому цвету, а значение 1 - черному:

( Ь

В =

00

Л0

Ь

01

И-1,0

Ь

И-1,1

Ь

Ь0,№-1 Ь1,№-1

И-Ш-1

(2)

/

Таким образом, правило Q представляет собой способ классификации точек исходного изображения на полезный сигнал и фон на основании некоторого критерия, называемого порогом Т [4], метод вычисления которого определяет Q (3):

Ьху =

1, если рху < Т : Q ;

0,

иначе.

(3)

В качестве целевого критерия Q при построении продукционных правил может выступать:

- ошибка классификации [5], которая рассчитывает-

\ВО п ВТ| + |рО п РТ\

ся по формуле: МЕ = 1 ---,-—-,-1;

* Р 3 \ВО\ + |рО|

- Р-мера, представляющая собой гармоническое среднее полноты и точности [5], рассчитывается по фор-

2 х полнота х точность

муле: Р =-, где полнота и точ-

полнота + точность

ность вычисляется соответственно по формулам:

Полнота = , Точность = ^^.

РО РТ

2 ОБЗОР ЛИТЕРАТУРЫ

На сегодняшний день существует большое число готовых реализаций бинаризации изображений, которые описаны, например в работах [5-11]. Все они сводятся к сравнению яркости каждой точки Р с некоторым пороговым значением Т и в зависимости от результата сравнения отнесения ее к «белым» или «черным». Принципиально эти методы отличаются лишь способом вычисления порога яркости и принципом построения пороговой поверхности (методы локальной и глобаль -ной бинаризации) [6, 12-13].

Оба подхода имеют некоторые недостатки. Они обусловлены тем, что методы глобальной бинаризации не учитывают характеристики точек в их окрестности, в то время как локальные не учитывают характеристики всего изображения в целом, что, в конечном счете, влияет на качество бинаризации. Устранение этих недостатков предложено в работе [14], где описывается гибридный метод бинаризации, предполагающий использование нескольких пороговых величин. Этот метод показал хорошие результаты при обработке текстовых документов.

В [14] представлен метод бинаризации изображений с адаптивным порогом на основе анализа гистограмм в локальных регионах и автоматическом определении окрестности с центром в заданной точке (рис. 1). Порог бинаризации для каждого локального фрагмента вычисляется индивидуально.

В процессе бинаризации все точки обрабатываются последовательно, а результат определяется формулой [4]:

Ьху =

= {1, если V3=0 [ь(Р) л ') л Ь(РМ) л ь(Рм')] = истина;

0, в противном случае.

Р = P(г+4)mod8, при ' = 3

Ь(Р) = Р - рху > Т

Р =-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ ^ рх+т, у+п. (4)

/ \2 " " х-г

(2 • +1) -хю<т<8№ <п<Х'Ю

Р1 рг рз

ф----

Р^рр]

I <»1I

й—о—ш

Р7(РИ[ Р5 <Р 1 н

Рисунок 1 - Соседние локальные регионы вокруг точки

1

Этот способ позволяет получить достаточно хороший результат, но преимущественно он ориентирован на изображения текстовых документов, поэтому при попытке обработки таким методом изображений технических чертежей зачастую возникает проблема нарушения исходной топологии объектов, что в дальнейшем оказывает существенное влияние на результат последующих операций над изображением и, следовательно, быть использован не может.

В работе [15] обнаружено, что изображения технических чертежей обычно состоят из прямых линий и дуг окружности. Благодаря чему сделан вывод: очень маленькие фрагменты изображения имеют форму, близкую к форме буквы «С». Таким образом, несмотря на то, что изолированные точки имеют более низкую шкалу оттенков серого, они не образуют форму фигуры «С» в совокупности со своими соседями и, следовательно, не могут быть бинаризованы как точки объектов.

В качестве примера рассмотрим рисунок 2. Типичная С-форма создается точками Р0, Р1, Р2 или Р2, Р3, Р4 или Р4, Р5, Р6 или Р6, Р7, Р0. Точка ру бинаризуется как точка объекта, если в локальной области с заданными геометрическими размерами образуется по крайней мере одна область в форме буквы «С». Исключительной ситуацией С-формы является ситуация, когда пиксели с низким оттенком серого образуют прямую линию. В этом случае пиксели также принимаются как пиксели объекта.

Для локальных областей, уровень яркости которых отличается от яркости изображения в целом, глобальный порог бинаризации не будет соответствовать значению полученному для всего изображения и приведет к неверному результату [12]. Для корректировки порога бинаризации в таких ситуациях вводится коэффициент поправки а, значение которого определяется исходя из следующего выражения.

жет быть использован для корректировки порога бинаризации на величину в интервале [-6; 6].

3 МАТЕРИАЛЫ И МЕТОДЫ

Примеры инженерных чертежей представлены на рисунке 3. а) синька; б) чертеж, выполненный от руки; в) печатный чертеж.

Изображения инженерных чертежей имеют ряд специфических особенностей.

1) изображение состоит преимущественно из прямых линий, текстовых блоков и дуг окружности;

2) линии на чертеже имеют различные геометрические размеры;

3) наличие фонового шума;

4) большой диапазон яркости для изображений технических чертежей различных типов.

Из рисунка 3 видно, что различные виды инженерных чертежей имеют различные показатели качества, яркости и контрастности. Наиболее подходящим для обработки такого типа изображений является метод, описанный в [4]. В случае выбора локальной области надлежащего размера (£^=3), а также порога бинаризации в пределах от 20 до 120 данный метод дает весьма неплохие результаты. Исключение составляют линии единичной толщины, а также точки пересечения линий и дуг (рисунок 4). По сути это ситуация, когда рассматривается вырожденная форма «С» в виде прямой линии. Выделенная точка на рисунке 4 принадлежит объекту, однако с точки зрения метода с-форм она будет бинаризована как точка фона, что приведет к нарушению целостности объекта. Уменьшение размера окна до (£^=1) не позволяет существенно улучшить результат, что свидетельствует о целесообразности доработки данного метода.

Р1 Р2 Р3

]—-а—и

Ф-

1, если Рху < 90;

а = ■ 0,33, если 90 < рху < 170; Р0Й

0,1, если Рху > 170,

[Ц Р4

Т1 ^ Т + АТ ,

где АТ - небольшое целое число в пределах [-20; 20]. Т. к. 0 < а < 1 и чаще всего а = 0,33, то параметр а мо-

й—£3—а

Р7 Р6 Р5

Рисунок 2 - Соседние локальные регионы для окна со сторонами Ш\ и Ж2

а б в

Рисунок 3 - Изображения инженерных чертежей: а - на синьке, б - ручной чертеж на ватмане в - распечатанный чертеж

Для решения проблемы «потери» тонких линий предлагается:

1) производить поиск С-форм для локальных областей различных размеров (£^=3) и (£^=1);

2) включить в поиск возможность исключительный ситуации, когда с-форма вырождается в прямую линию;

3) рассмотреть ситуацию, когда происходит обработка конечной точки линии или дуги.

Данное утверждение может быть реализовано с помощью шаблонов путем поточечного сравнения исходного изображения с каждым эталонным вариантом, а также с помощью математических уравнений. Наибо-

лее удобным вариантом для дальнейшей реализации является вариант решения задачи математическим путем.

Так, например, для проверки соответствия вырождается ли форма с в прямую линию необходимо формулу (1) переписать в следующем виде:

Ьху =-

©

Рисунок 4 - Примеры линий объекта не образующих форму «С»

) 1, если V4=0 [[)л Ь(р')] = истина; [О, в противном случае.

А далее воспользоваться ранее полученной методикой.

Модифицированный таким образом метод, позволит выполнить корректную бинаризацию точек объекта в особых ситуациях, аналогичных приведенным на рис. 4.

Методика, описанная в [4] предполагает расчет пороговых значений на неидеально белой бумаге. В тоже время большинство чертежей выполняются на белом ватмане. Следовательно, фон таких изображений будет иметь высокую яркость (большую 170). Таким образом, для большей части изображения коэффициент а будет составлять 0,1. Поэтому с целью достижения корректного различения фона и объектов диапазон корректировки необходимо увеличить до 20-120.

Предложенный алгоритм бинаризации реализуется следующей последовательностью шагов (рис. 5).

Рисунок 5 - Схема предложенного алгоритма

1. Рассчитываем минимальное, максимальное, среднее значения яркости цвета для всех точек изображения. Полученные результаты позволяют определить класс исходного изображения (ватман, синька).

2. Исходя из полученных результатов, определяем поправочный коэффициент и глобальный порог бинаризации T1.

3. Просматриваем все изображение и бинаризуем каждую точку, исходя из того, что объект=1, фон=0.

Если яркость обрабатываемой точки больше глобального порога Т1, то после бинаризации данная точка однозначно определяется как точка фона b=0.

В противном случае обрабатываемая точка берется как центр квадрата размером (2SW+1)x(2iSW+1), рассчитывается среднее значение яркости в данной области и динамический локальный порог T = ах AT, AT - диапазон поправочный коэффициент порога бинаризации.

Определяем яркость 8 соседних точек. Если для каких-либо 3-х последовательных, либо лежащих на одной прямой точек, выполняется условие \р -p\>T обрабатываемая точка бинаризуется как b=1, т.е точка, принадлежащая объекту.

В противном случае обрабатываемая точка бинаризуется как b=0.

4. Если имеются необработанные точки возвращаемся к шагу 2.

5. Выводим результирующее двухградационное изображение.

4 ЭКСПЕРИМЕНТЫ

Предложенный алгоритм реализован в среде C++ Builder XE5. Разработанный программный продукт позволяет выполнить бинаризацию изображения каждым из рассмотренных в работе методом и наглядно оценить результат (рис. 6).

Для выполнения количественной оценки результата предусматривается возможность сравнения результата бинаризации с идеальным черно-белым образцом и расчета основных оценочных критериев, на основании значений которых можно сделать вывод об эффективности каждого метода. Программа снабжена гибкой системой настроек каждого метода.

5 РЕЗУЛЬТАТЫ

В тестовой выборке участвовало 20 образцов полутоновых изображений, площадью от 500 до 50000 точек. Сравнение результатов бинаризации каждым методом осуществлялось по критериям качество и время. Наиболее сложно обстоит вопрос с определением качества бинаризации, т. к. задача определения точки как точки фона или точки объекта не является тривиальной и в некоторых случаях ее затруднительно решить даже при ручном разборе изображения.

На международном конкурсе DIBCO [16-18] алгоритмов бинаризации для оценки качества получаемых результатов предлагаются следующие метрики: ошибка классификации (misclassification error, ME), полнота (recall), точность (precision) и F-мера (F-measure). Чем выше значение F-меры, тем лучше производительность алгоритма

Значения этих метрик для ряда тестовых образцов, после их обработки логическим пороговым методом, методом с-форм и нашим методом представлены в таблице 1.

Наглядно результаты тестирования методов бинаризации показаны на графиках (рис. 7-9).

6 ОБСУЖДЕНИЕ

Результаты анализа данных, представленных в табл. 1, показывают, что наилучшее качество результирующего бинарного изображения обеспечивает метод, предложенный в работе. Так, например, этот метод дает самое

Рисунок 6 - Экранная форма программы, используемой при проведении экспериментов

высокое значение Б-меры для всех без исключения тестовых образцов.

Качественный анализ изображений, полученных в ходе обработки рассмотренными в работе методами бинаризации, показал, что в результате обработки изображений логическим пороговым методом образуется шум, особенно вблизи границ объектов, который значительно ухудшает качество изображения, кроме того, име-

Таблица 1 - Результаты тест

ет место потеря некоторых тонких линий. Метод с-форм дает хорошие результаты на изображениях, толщина линий которых приблизительно одинакова, а линии единичной толщины отсутствуют, однако корректно обработать тонкие линии данный метод не способен. Все эти недостатки отсутствуют в изображениях, полученных в результате бинаризации рассмотренным в работе методом.

вания методов бинаризации

Номер изображения Размер Логический пороговый метод Метод с-форм Глобальная бинаризация Новый метод

Время Полнота Б-мера Время Полнота Б-мера Время Полнота Б-мера Время Полнота Б-мера

1 130x135 34 18 1,89 114 16 1,88 1 22 1,91 126 9 1,8

2 176x166 36 14 1,86 72 12 1,84 1 17 1,89 90 7 1,75

3 147x192 58 14 1,87 166 13 1,86 1 18 1,89 141 8 1,77

4 244x321 137 7 1,75 254 7 1,75 1 9 1,8 303 6 1,71

5 247x321 419 8 1,77 620 7 1,75 1 12 1,84 401 6 1,74

6 170x190 290 12 1,85 148 10 1,82 1 13 1,86 304 8 1,78

7 133x123 30 8 1,78 46 8 1,78 1 12 1,85 70 6 1,71

8 131x190 26 86 1,98 101 73 1,97 1 415 1,99 89 22 1,91

9 267x195 215 37 1,95 456 27 1,93 1 229 1,99 564 20 1,9

10 144x321 64 45 1,96 162 42 1,95 1 83 1,98 187 18 1,89

11 267x226 104 37 1,95 334 33 1,94 1 48 1,96 356 16 1,88

12 267x205 96 11 1,83 143 11 1,83 1 16 1,88 190 9 1,8

13 161x200 75 8 1,78 151 8 1,78 1 18 1,89 187 6 1,71

14 104x113 38 28 1,93 149 23 1,92 1 45 1,96 66 7 1,75

15 267x321 291 38 1,95 705 17 1,88 1 31 1,94 905 7 1,75

16 207x214 46 1655 1,99 123 459 1,99 1 599 1,99 146 19 1,9

17 213x321 92 539 1,99 247 439 1,99 1 1514 1,99 246 3 3

18 267x147 44 8 1,78 100 8 1,78 1 10 1,82 127 5 1,65

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

19 236x162 43 28 1,93 103 21 1,91 1 71 1,97 30 15 1,89

20 117x96 19 26 1,93 31 22 1,91 1 30 1,94 37 7 1,75

Время, затраченное на бинаризацию изображений

1 г 3 4 5 5 7 8 9 10 ±1 II 53 15 Ш 1Т 16 19 20

■ Логический пороговый метод Время ^ Метод с-форм Время [| Глобальная бинаризация Время Н Новый метод Время

Рисунок 7 - Гистограмма времени, затраченногого на бинаризацию

Рисунок 8 - Полнота бинаризации

Вторым критерием оценки качества работы алгоритма является время его выполнения соизмеримо с размерами обрабатываемой области. Характеристики скорости выполнения сравниваемых алгоритмов также представлены в таблице 1.

Анализ времени обработки каждого тестового образца показывает, что наиболее быстрым является метод,

Рисунок 9 - Б-мера результатов бинаризации

использующий глобальный порог, что объясняется наиболее простым алгоритмом обработки каждой точки изображения, однако результаты, получаемые таким методом, непригодны для дальнейшей обработки. Среди методов, дающих удовлетворительный результат, наиболее быстрым является метод с-форм. Необходимость больших временных затрат для выполнения предложен-

ного метода объясняется выполнением дополнительных проверок на наличие «особых ситуаций», результат которых оказывает значительное влияние на формируемое в процессе бинаризации изображение. Таким образом, для образцов, не содержащих «особых ситуаций», время выполнения обоих методов одинаково либо отличается незначительно.

ВЫВОДЫ

В работе решена актуальная задача преобразования изображений технических чертежей, представленных в градациях серого, в черно-белый формат, удобный для дальнейшей обработки таких изображений.

Научная новизна работы состоит в том, что получила дальнейшее развитие идея применения метода с-форм для бинаризации изображений технических чертежей. Данный метод позволяет получить хорошие результаты при обработке таких сложных ситуаций как тонкие линии и точки пересечения линий, в тоже время метод «отсеивает» случайные шумы в изображении. Второй отличительной особенностью предложенного метода, является автоматическая корректировка порога яркости, что позволяет обрабатывать, как изображения, представленные на белом ватмане, так и на «синьке».

Предложен ряд критериев оценки бинаризации изображений технический чертежей: время выполнения, полнота и Б-мера. В качестве альтернативных методов рассматривается логический пороговый метод, метод с-форм, метод глобальной бинаризации. Показано, что наилучшие результате дает предложенный в работе метод. Исключением является время выполнения метода, которое в некоторых ситуациях большее, чем время выполнения других, рассматриваемых в качестве альтернативы вариантов. Это объясняется необходимостью выполнения дополнительных проверок на наличие специфических элементов на изображении и их корректной обработки.

Практическая ценность полученных результатов состоит в том, что разработано программное обеспечение, которое позволяет выполнить бинаризацию растровых изображений технических чертежей, представленных в градациях серого.

Перспективы дальнейших исследований состоят в разработке способа векторизации изображений технических чертежей и реализации на его основе полномасштабной системы обработки и распознавания растровых изображений технических чертежей и их дальнейшего преобразования в формат современных САЭ-систем.

БЛАГОДАРНОСТИ

Автор выражает благодарность научному руководителю И. С. Грунскому за внимание к работе и полезные замечания.

СПИСОК ЛИТЕРАТУРЫ

1. Гонсалез Р. Цифровая обработка изображений в среде Matlab / Р. Гонсалез, Р. Вудс, С. Эддинс. - М. : Техносфера, 2006. -616 с.

2. Абламейко С. В. Обработка изображений: технология, методы, применение / С. В. Абламейко, Д. М. Лагуновский. -Минск: Амалфея, 2000. - 304 с.

3. Красильников Н. Н. Цифровая обработка 2D- и 3Э-изображе-ний : учебное пособие / Н. Н. Красильников. - СПб. : БХВ-Петербург, 2011. - 608 с.

4. Методы компьютерной обработки изображений / под ред. В. А. Сойфера. - М. : Физматлит, 2003. - 784 с.

5. Грузман И. С. Цифровая обработка изображений в информационных системах : учебное пособие / И. С. Грузман, В. С. Киричук, В. П. Косых и др. - Новосибирск : Издательство НГТУ 2002. - 352 c.

6. Gonzalez R. Digital image processing / R. C. Gonzalez, R. E.Woods. -Prentice Hall, 2007. - 976 p.

7. Rogers D. Matematical elements for computer graphics / David F. Rogers, J. Alan Adams. - New York : McGraw-Hill, 2002. - 630 p.

8. Otsu N. A threshold selection method from grey level histogram / N. Otsu // IEEE Transactions on Systems, Man and Cybernetics. -1979. - Vol. 9, № 1. - P. 62-66.

9. Niblack W. An introduction to digital image processing / Niblack W. - Prentice Hall, Englewood Cliffs, 1986. - 231 p.

10.Sauvola J. Adaptive Document Binarization / J. Sauvola, M. Pietikainen // Pattern Recognition. - 2000. - № 33. -P. 225-236.

11.Анисимов Б. В. Распознавание и цифровая обработка / Б. В. Анисимов, В. Д. Курганов, В. К. Злобин. - М. : Высшая школа, 1983. - 95 с.

12. Navon E. Color image segmentation based on adaptive local thresholds / E. Navon, O. Miller, A. Averbuch // Image and Vision Computing. - 2012. - № 23. - P. 69-85.

13. O'Gorman L. Binarization and multithresholding of document images using connectivity // CVGIP: Graphical Models and Image Processing. - 2004. - Vol. 5, № 6. - P. 494-506.

14. Yang Y. An adaptive logical method for binarization of degraded document images / Y. Yang, H. Yan // Pattern Recognition. -2010. - Vol. 33. - P. 787-807.

15. Zhao M. An adaptive thresholding method for binarization of blueprint images / M. Zhao, Y. Yang, and H. Yan // Pattern Recognition Letters. - 2010. - Vol. 21. - P. 927-943.

16.Gatos B. Document image binarization contest / B. Gatos, K. Ntirogiannis, I. Pratikakis // DIBCO 2009: 10th International Conference on Document Analysis and Recognition, Spain, Barcelona, 26-29 July, 2009. - Barcelona : Universitat Autrnoma, 2009. - P. 1375-1382.

17. Pratikakis I. Document Image Binarization Contest (DIBCO 2011) / I. Pratikakis, B. Gatos, K. Ntirogiannis // ICDAR 2011: 11th International Conference on Document Analysis and Recognition, China, Beijing, 18-21 September, 2011. - Beijing, 2011. -P. 1506-1510.

18. Pratikakis I. Document Image Binarization Contest (ICDAR 2013) / I. Pratikakis, B. Gatos, K. Ntirogiannis // ICDAR 2013: 12th International Conference on Document Analysis and Recognition, USA, Washington, 25-28 August, 2013. - Washington, 2013. -P. 1471-1476.

Статья поступила в редакцию 04.11.2014.

После доработки 05.11.2014.

Молчанова В. С.

Ст. викладач кафедри шформатики ДВНЗ «Приазовський державний техшчний ушверситет», Марiуполь, Украша АДАПТИВНИЙ ПОРОГОВЫЙ МЕТОД БШАРИЗАЦИ РАСТРОВИХ ЗОБРАЖЕНЬ ТЕХН1ЧНИХ КРЕСЛЕНЬ

У стати пропонуеться метод адаптивно!' порогово!' бшаризаци растрових зображень техшчних креслень. Проаналiзовано спе-цифiчнi особливост зображень техшчних креслень та 1х вплив на результат бшаризаци вщомими ушверсальними методами. Виявлено артефакти, що виникають на результуючих бшарних зображеннях та запропоновано способи 1х усунення.

В основу запропонованого методу покладено iдею про те, що дуже маленькi фрагменти зображення креслення нагадують букву «С», яка в особливих випадках вироджуеться у пряму лшто. Подальшi роздуми зводяться до вибору способу визначення вщповщносп об'екта на зображеннi формi «С». Окремий вплив придшено питанням Налаштування порога бiнарiзащl залежно вiд яскравосп зобра-ження.

В роботi подана математична модель запропонованого методу, його алгорштшчний опис. Проведет експерименти з дослщження якiсних i кiлькiсних показникiв ефективностг Якiсна оцiнка виконувалася шляхом порiвняння результату бiнарiзащl з еталонним чорно-бiлим зображенням. В якостi критерпв кiлькiсного оцiнювання розглянутi такi критерп, як час виконання алгоритму, повнота i /^ра. Представленi результати проведених експеримешгв, що показують перевагу запропоновано! в роботi методики бiнарiзацil растрових зображень техшчних креслень, як юльюсно, так i якiсно.

Ключовi слова: растрове зображення, бшаризащя, технiчне креслення, порш бiнаризацiя, яркость, вiдтiнок шрого, корисний сигнал, фон, шум, помилка.

Molchanova V. S.

Senior Lecturer of Department of Informatics of Azov State Technical University, Mariupol, Ukraine

THE ADAPTIVE THRESHOLD BINARIZATION METHOD OF RASTER IMAGES OF TECHNICAL DRAWINGS

The paper proposes a method of adaptive threshold binarization of technical drawings raster images. The specific image features of technical drawings and their influence on the result of binarization of known universal methods are analysed. The artifacts that arise on the resulting binary images are identified and ways to address them are suggested.

The proposed method is based on the idea that very small parts of the image of the drawing resembles the letter «C», which in special cases degenerates into a straight line. Further arguments boil down to the choice of method for determining the conformity of the object in the image form «C». Separate effect given to the issues of binarization threshold settings depending on the brightness of the image.

The paper presents a mathematical model of the proposed method, its algorithmic description and experimental qualitative and quantitative evidence of efficacy. The quantitative evaluation was performed by comparing the results with the reference binarization black and white image. As evaluation criteria considered criteria such as time of the algorithm, completeness and f-measure. The results of the conducted experiments demonstrating the superiority of the proposed methodology in the raster image binarization technical drawings, both quantitatively and qualitatively.

Keywords: bitmap, binarization, technical drawings, threshold binarization, brightness, shade of gray, useful signal, background, noise, error.

REFERENCES

1. Gonsalez R., Vuds R., Jeddins S. Cifrovaja obrabotka izobrazhenij v srede Matlab. Moscow, Tehnosfera, 2006, 616 p.

2. Ablamejko S. V. Lagunovskij D. M. Obrabotka izobrazhenij: tehnologija, metody, primenenie. Minsk, Amalfeja, 2000, 304 p.

3. Krasil'nikov N. N. Cifrovaja obrabotka 2D- i 3D-izobrazhenij: uchebnoe posobie. SPb, BHV-Peterburg, 2011, 608 p.

4. Metody komp'juternoj obrabotki izobrazhenij / pod red. V. A. Sojfera. Moscow, Fizmatlit, 2003, 784 p.

5. Gruzman I. S. Kirichuk V. S., Kosyh V. P. i dr. Cifrovaja obrabotka izobrazhenij v informacionnyh sistemah: uchebnoe posobie. Novosibirsk, Izdatel'stvo NGTU, 2002, 352 p.

6. Gonzalez R., Woods R. E. Digital image processing. Prentice Hall, 2007, 976 p.

7. Rogers D., Adams J. A. Matematical elements for computer graphics. New York, McGraw-Hill, 2002, 630 p.

8. Otsu N. A threshold selection method from grey level histogram, IEEE Transactions on Systems, Man and Cybernetics, 1979, Vol. 9, No. 1, pp. 62-66.

9. Niblack W. An introduction to digital image processing. Prentice Hall, Englewood Cliffs, 1986, 231 p.

10. Sauvola J., Pietikainen M. Adaptive Document Binarization, Pattern Recognition, 2000. No. 33, pp. 225-236.

11. Anisimov B. V., Kurganov V. D., Zlobin V. K. Raspoznavanie i cifrovaja obrabotka izobrazhenij. Moscow, Vysshaja shkola, 1983, 295 p.

12. Navon E., Miller O., Averbuch A. Color image segmentation based on adaptive local thresholds, Image and Vision Computing, 2012, No. 23, pp. 69-85.

13. O'Gorman L. Binarization and multithresholding of document images using connectivity, CVGIP: Graphical Models and Image Processing, 2004, Vol. 5, No. 6, pp. 494-506.

14. Yang Y., Yan H. An adaptive logical method for binarization of degraded document images, Pattern Recognition, 2010, Vol. 33, pp. 787-807.

15. Zhao M., Yang Y., and Yan H. An adaptive thresholding method for binarization of blueprint images, Pattern Recognition Letters, 2010, Vol. 21, pp. 927-943

16. Gatos B., Ntirogiannis K., Pratikakis I. Document image binarization contest, DIBCO 2009:10th International Conference on Document Analysis and Recognition, Spain, Barcelona, 2629 July, 2009. Barcelona, Universitat AutTnoma, 2009, pp. 13751382.

17. Pratikakis I., Gatos B., Ntirogiannis K. Document Image Binarization Contest (DIBCO 2011), ICDAR 2011: 11th International Conference on Document Analysis and Recognition, China, Beijing, 18-21 September, 2011. Beijing, 2011, pp. 15061510.

18. Pratikakis I., Gatos B., Ntirogiannis K. Document Image Binarization Contest (ICDAR 2013), ICDAR 2013: 12th International Conference on Document Analysis and Recognition, USA, Washington, 25-28 August, 2013. Washington, 2013, pp. 1471-1476.

Адаптивный пороговый метод бинаризации растровых изображений технических чертежей Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Молчанова В. С.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Молчанова В. С.

THE ADAPTIVE THRESHOLD BINARIZATION METHOD OF RASTER IMAGES OF TECHNICAL DRAWINGS

Текст научной работы на тему «Адаптивный пороговый метод бинаризации растровых изображений технических чертежей»