Компьютерные инструменты в образовании, 2015 № 4: 26-36 УДК: 004.932 http://ipo.spb.ru/journal
О СВОЙСТВАХ БЛОЧНОГО АЛГОРИТМА БИНАРИЗАЦИИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ *
Яковлева Елена Сергеевна, Макаров Антон Александрович
Аннотация
В статье рассматриваются современные методы бинаризации, которые широко используются в полиграфии при печати для процесса растрирования, и связанные с этим процессом теоретические вопросы растрирования. Особое внимание уделено блочному алгоритму бинаризации, относящемуся к методам, основанным на условии равенства яркостей, когда бинарное изображение имеет яркость равную яркости исходного изображения. Приводится его описание, а также краткое описание алгоритмов, выбранных для сравнения. Изображение, полученное бинаризацией полутонового изображения блочным алгоритмом бинаризации, на основе вычисления выбранных мер искажений показывает лучшие характеристики по сравнению с другими алгоритмами бинаризации.
Также целью данной работы являлся эксперимент по печати тоновой шкалы и измерение коэффициентов отражения полутонов при помощи спектрофотометра. В ходе эксперимента были построены градационные кривые для заданного принтера и проанализированы полученные характеристики. Найдено, что для блочного алгоритма наблюдается увеличение контраста, что подтверждается реальным печатным экспериментом. При анализе свойств блочного алгоритма бинаризации выявлено, что он может быть рекомендован в виде коммерческого алгоритма бинаризации.
Ключевые слова: цифровое изображение, полутоновое изображение, блочный алгоритм бинаризации, растрирование, бинаризация, меры искажения, градационная кривая, модель принтера.
1. ВВЕДЕНИЕ
Процесс бинаризации изображения (то есть его преобразование в изображение, элементы которого могут принимать только два значения) представляет значительный интерес для различных прикладных задач анализа изображений, поскольку позволяет выявить объекты, которые содержат интересующую информацию, осуществить компактное описание (сократить битовую глубину при бинаризации). Бинаризация используется в задачах исследования и диагностики сложных технических и биологических систем, в число которых входит распознавание образов [1], видеонаблюдение и видеокодирование [2], контроль и анализ материалов [3].
Методы бинаризации широко используются в полиграфии при печати для процесса растрирования. Цифровое растрирование является процессом уменьшения битовой
* Работа выполнена при частичной финансовой поддержке грантом Президента РФ № МД-6766.2015.9.
глубины изображения для воспроизведения на устройствах, способных к репродуцированию меньшего числа уровней серого, чем тех, которые представлены в оригинальном изображении с высокой битовой глубиной (так называемое изображение с непрерывным тоном). Напечатанные изображения, которые казалось бы имеют непрерывные тона, созданы оригинальным распределением точек при использовании растрового алгоритма. Хороший растровый алгоритм должен так преобразовывать информацию, чтобы обеспечить вывод с высоким визуальным качеством. Помимо этого он должен быть помехоустойчивым и быть простым с вычислительной точки зрения.
Известно, что существуют различные подходы к бинаризации изображений, которые условно можно разделить на две группы: пороговые методы и методы, основанные на условии равенства яркостей. В пороговых методах ищется некоторая характеристика (порог), позволяющая разделить элементы изображения на черные и белые. Порог может быть постоянным или адаптивным, основой его выбора может служить гистограмма значений яркостей или энтропия. Одним из самых эффективных по качеству и быстродействию здесь считается метод Отса [4].
Рассматриваемый в данной работе алгоритм относится к методам на основе условия равенства яркостей, когда бинарное изображение имеет яркость равную яркости исходного изображения. С точки зрения зрительного восприятия это условие выглядит естественным, однако методы расстановки белых и черных пикселов в бинарном изображении могут быть различными. Чтобы каждый раз не решать задачу расставления нулей и единиц можно использовать готовые бинарные шаблоны с разной яркостью. Такой процесс известен как псевдотонировние (подробнее см. [5]). В этом методе каждому блоку полутонового изображения ставится в соответствие шаблон с равной яркостью, при этом разные полутоновые блоки могут кодироваться одинаковыми шаблонами. Эта особенность приводит к появлению характерной пространственной структуры в бинарном изображении, которая устраняется последующей обработкой, например, с помощью алгоритма диффузии ошибок [6]. В отличие от метода псевдотонирования предлагаемый алгоритм может учитывать распределение яркости внутри полутонового блока, что делает его свободным от указанной ошибки и позволяет более тщательно воспроизводить детали.
Предлагаемая работа продолжает исследование методов бинаризации, начатое в работе [7], которые отличаются от известных тем, что позволяют усилить контраст, выделить слабоконтрастные детали в полутоновых изображениях, и за счет дополнительно разработанного метода рандомизации улучшить визуальное качество бинарного изображения. Цель данной работы — исследовать свойства предлагаемого блочного алгоритма бинаризации путем сравнения его с современными алгоритмами бинаризации при помощи мер искажения, при помощи построения градационной кривой для заданного принтера, а также проанализировать полученные характеристики (приближенность градационных кривых к линейной зависимости идеального воспроизведения).
2. ОБ АЛГОРИТМЕ БИНАРИЗАЦИИ
Пусть / = /(х, у), х = 1..т, у = 1..п — исходное полутоновое изображение размера т х п, g = g(х, у) — обработанное изображение. Процесс бинаризации описывается уравнением g(х,у) = В[/(х,у)], где В — оператор бинаризации, сопоставляющий яркости элемента f (х, у), принимающей 2к значений (здесь к — натуральное число), элемент g(х, у) е {0,1}.
Под яркостью цифрового изображения будем понимать сумму значений всех его пикселов. Алгоритм бинаризации основан на условии равенства яркости полутонового и бинарного изображений, опишем его работу.
1. Исходное полутоновое изображение f (х, у) разделяется на L неперекрывающихся блоков fi, l = 1..L, начиная с верхнего левого угла слева направо сверху вниз, с помощью так называемой «телевизионной» развертки. Размер каждого блока равен hx х hy, где параметры hx, hy выбираются произвольно, например, из условий пространственного разрешения системы человеческого зрения. Элементам блока, имеющим пустое пересечение с исходным изображением присваивается нулевое значение. Соответствующий бинарный блок gi имеет тот же размер, что и полутоновый блок fi, на данном этапе он заполняется нулями. После разбиения каждый блок обрабатывается независимо.
2. В каждом блоке fi вычисляется суммарная приведенная яркость, которая определяет количество единиц щ в соответствующем бинарном блоке gi:
2-к X f (х, У) = Щ,
x,yefi
где скобки L J — обозначают взятие целой части числа. Количество единиц в бинарном блоке будет щ е [0, hx х hy].
3. В бинарном блоке gi единицы ставятся на позиции, в которых находятся щ наибольших значений яркостей f (х, у) блока fi, начиная с максимального значения. При этом если найдено несколько одинаковых наибольших значений, то среди всех вариантов один выбирается случайно в соответствии с некоторой вероятностью. Таким образом реализуется механизм рандомизации расстановки единиц, основанный на случайном правиле.
4. Из бинарных блоков gi (опуская элементы, имеющие пустое пересечение с исходным изображением), собирается полное бинарное изображение g(х, у).
Особенность расстановки нулей и единиц приводит к тому, что в бинарном изображении частично воспроизводится пространственное распределение яркости полутонового изображения. Для визуального восприятия это означает следующее:
1) более точно воспроизводятся детали и границы объектов полутонового изображения;
2) выделение слабоконтрастных структур, которые могут быть неразличимы глазом или плохо передаваться техническими средствами, формирующими изображение.
При растрировании цифровыми методами растр представляет собой совокупность квадратных ячеек, на которые разбито изображение. Каждая ячейка отводится для одной растровой точки. Растровая точка, в свою очередь, состоит из группы «реальных» точек одинакового размера, создаваемых устройством вывода. Чем большая часть такой ячейки заполнена точками принтера, тем больший размер имеет формируемая ими растровая точка и более темный оттенок серого она передает.
Отношение разрешающей способности устройства вывода к линиатуре растра дает размер стороны ячейки растра, измеренный в точках принтера. Максимальное количество точек принтера, образующих растровую точку, равно квадрату стороны ячейки. Так, например, если линиатура растра установлена в 100 lpi, а разрешение принтера — 600 dpi, сторона ячейки растра будет равна 600/100 = 6 точек. При этих условиях растровая точка формируется из 6 х 6 = 36 точек принтера. Эта цифра имеет очень большое
значение для адекватной передачи фотографического изображения, так как определяет количество оттенков серого, которое способен передать растр с заданными параметрами.
Полутоновое изображение представляет собой матрицу, элементы которой являются целыми числами. Для изображений 8 бит/пиксел целые числа принимают значения от 0 до 255, для 16-битных изображений диапазон составляет от 0 до 65535. Пока что современная полиграфия не позволяет воспроизводить 16-битные изображения, да и способности человеческого глаза уловить разницу между такими малыми оттенками ограничены. Чаще всего параметры растрирования рассчитываются, исходя из необходимости передачи всех оттенков, которые дает компьютерный оригинал, а именно — 256 оттенков при 8-битных полутоновых каналах [8].
Из алгоритмов, относящихся к классу частотно-модулированного растрирования, были выбраны следующие: BAYER, использующий пороговый массив, стандартный алгоритм Флойда-Стейнберга ERRDIF, основанный на дитеринге (dithering — добавление шума перед квантованием) с использованием голубого шума, модификация алгоритма Флойда-Стейнберга DOTDIF, модификация ULICHNEY с возмущенными весами, модификация LAU с адаптивным гистерезисом. Также для сравнения был выбран алгоритм CDOD, выполняющий дитеринг с формированием печатных точек в виде кластеров, принадлежащий классу алгоритмов амплитудно-модулированного растрирования. При этом размер, частота растра, форма точки и угол растра могут отличаться. Перечисленные алгоритмы бинаризации подробно рассмотрены в монографии [9].
Бинаризация полутоновых изображений является примером квантования изображения на два уровня, при котором могут возникать потери информации, ведущие к снижению качества изображения. Известно, что универсального критерия оценки качества не существует, и объективные оценки весьма ненадежны (подробнее см., например, [10]). Тем не менее, желательно, чтобы объективный критерий имел простую аналитическую форму и просто вычислялся.
Расстояние между двумя изображениями f = f(x, y) и g = g(x, y), где x = 1..m, y = 1..n определяется через норму Гёльдера, усредненную на количество элементов изображе-
II f -g lip=
i m n \1lp
i E Elf (x, y) - g (x, y )|p
mn x=1 y= 1
p & 1.
При р = 1 возникает средняя разность, а при р = 2 — корень из среднеквадратическо-го отклонения (RMSE).
На основе введенного расстояния строится пиковое отношение сигнал/шум рЖК) между двумя изображениями, которое определяется следующим образом
PSNR = 20 ln-
2k -1 f - g II
Напомним, что гистограмма яркости изображения / определяется формулой ру (г) = ni/тп, где ni — количество элементов изображения / значение которых равно г = 0,...,2к - 1. Наряду с гёльдеровой метрикой в качестве меры искажения между двумя изображениями используется относительная энтропия, которая устанавливает соответствие между гистограммами яркости изображений / и g
2к-1 рг (/) н(/ И g) = Е РГ(г)1оВ2 р^•
г=о pg(г)
2
Рис. 1. Бинаризация сложного слабоконтрастного изображения с большим количеством деталей. а) исходное полутоновое изображение; б) работа блочного алгоритма бинаризации; в) DOTDIF; г) ERRDIF; д) ULICHNEY; е) LAU; ж) CDOD 0°; з) CDOD 75°; и) BAYER
Результаты обработки одного из изображений коллекции Caprichos приведены на рис. 1. Из результатов вычислений выбранных мер искажений (см. таблицу 1) следует, что для выбранного изображения объективные меры искажения у предложенного блочного алгоритма бинаризации с размером блока 4 х 4 лучше.
Таблица 1. Меры искажений: AD — средняя разность, RMSE — среднеквадратическое отклонение, PSNR — пиковое отношение сигнал/шум, H — относительная энтропия
AD (p = 1 ) RMSE (p = 2 ) PSNR H
Блочный алгоритм 0.3414 0.3840 8.3128 7.5932
DOTDIF 0.4082 0.4633 6.6820 7.9621
ERRDIF 0.3801 0.4319 7.2919 7.6927
ULICHNEY 0.3750 0.4260 7.4111 7.6932
LAU 0.3786 0.4302 7.3256 7.6929
CDOD 0° 0.4137 0.4693 6.5712 7.6881
CDOD 75° 0.4132 0.4687 6.5818 7.6880
BAYER 0.3875 0.4404 7.1230 7.6908
3. ДЕФЕКТЫ ПЕЧАТИ. РАЗМЫТИЕ И ПОТЕРЯ РАСТРОВЫХ ТОЧЕК
Следующий пример показывает реальный печатный процесс с видимыми дефектами: увеличение точки и потеря точки. Исходное полутоновое изображение (рис. 2) было напечатано в типографии «Наука» г. Санкт-Петербург и затем отсканировано с разрешением 300 dpi (рис. 3,4). Увеличенный фрагмент отсканированной копии (рис. 5) позволяет визуально оценить качество печати и обнаружить области в которых присутствуют дефекты потери и увеличения точек.
Наиболее сложным для воспроизведения любым печатным устройством является одиночный пиксел либо группа пикселов, расположенных недалеко от границ изображения. В этом случае чрезмерное давление при печати приводит к возникновению артефактов при воспроизведении и увеличивает количество черной краски. Иначе, в случае недостаточного давления появляются не заполненные краской места и потеря точек.
Рис. 2. Исходное полутоновое изображение
Рис. 3. Отсканированная копия оттиска с разрешением 300 dpi
Рис. 4. Увеличенный фрагмент исходного полутонового изображения
Рис. 5. Увеличенный фрагмент отсканированной копии с разрешением 300 dpi
Все методы, разработанные для оценки реального печатного искажения, основаны на оценке отношения периметра к площади (perimeter to area ratio), создании кривой отражения зависимости выхода от входа для конкретной модели принтера и затем выполнение тоновой коррекции при допечатной подготовке [11-15]. После анализа по-
лученных значений для тестируемых алгоритмов бинаризации возможно найти более чувствительный и более устойчивый алгоритмы. Например, для выбранного лазерного принтера HP LaserJet 4100 Series PS была сгенерирована тестовая шкала в градациях серого размером 4623 х 4623 пикселов, с равномерным изменением уровней серого от черного к белому с передачей 256 градаций серого. Шкала имеет заданный размер блока пикселов, в котором формируется растровая ячейка, равный 12 х 12 (рис. 6а). Затем шкала растрируется при помощи блочного алгоритма бинаризации с аналогичным размером блока (рис. 6б), алгоритмов ERRDIF (рис. 6в), CDOD (рис. 6г) с размером ячейки 12 х 12 и углом поворота растра 15°. После тестовой печати Postscript-файла бинаризи-рованного изображения на лазерном принтере с разрешением вывода 600 dpi, были выполнены измерения коэффициентов отражения каждого блока оттиска при помощи спектрофотометра.
(а)
(б)
тщ
(в)
(г)
Рис. 6. Бинаризация полутоновой шкалы: а) исходное полутоновое изображение, б) работа блочного алгоритма бинаризации, в) работа ERRDIF, г) работа CDOD 15°
010200020500000102000102080001000001020208020000010000020501010200000100080102004802000001000001020048020900080900010409110409000805
Из найденных значений был построен график зависимости выходных значений коэффициентов отражения по отношению к входным значениям градаций серого (см. рис. 7). Другой подход для компенсации потери точек и размытия точек состоит в использовании различных моделей принтера [16], разделенных на статистические и физические модели с принятием решения о печатании или не печатании точки вместо тоновой коррекции градационной кривой.
Отношение уровней серого оттиска к уровням серого цифрового оригинала для лазерного принтера HP LaserJet 4100 Series PS
0.2
o.i -............................................................................................................................;.......................................................-
Q Ll^_\_i_i_I_i_i_I_i_I_
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Уровень серого цифрового оригинала
Рис. 7. Кривая отражения выхода к входу для лазерного принтера HP LaserJet 4100 Series PS
По характеру кривой для блочного алгоритма можно отметить, что наблюдается увеличение контраста, что подтверждается реальным печатным экспериментом. Небольшая потеря контраста происходит только начиная со значения 0.7. Алгоритм ERRDIF уступает блочному алгоритму в том, что теряет в контрасте, начиная со значения 0.3, что приводит к зачернению оттиска и потере деталей.
4. ВЫВОДЫ
В процессе работы блочного алгоритма бинаризации цифровых изображений найдено, что он показывает сопоставимые результаты по сравнению с современными алгоритмами бинаризации, а для изображений коллекции Caprichos даже превосходит другие алгоритмы. Печатный эксперимент с построением градационной кривой показал превосходство блочного алгоритма в усилении контраста, что позволяет выявлять слабоконтрастные структуры. Ввиду того, что каждый блок предложенного блочного алгоритма обрабатывается независимо, блочный алгоритм может быть эффективно распараллелен. Этому вопросу будут посвящены дальнейшие исследования.
Список литературы
1. Фурмант, Я.А., Юрьев А.Н., Яншин В.В. Цифровые методы обработки и распознавания бинарных изображений. Красноярск: Изд-во Краснояр. ун-та, 1992.
2. Ричардсон, Я. Видеокодирование. Н.264 и MPEG-4 — стандарты нового поколения. М.: Техносфера, 2005.
3. Самусев, К.Б., Юшин Г.Н., Рыбин М.В., Лимонов М.Ф. Структурные параметры синтетических опалов: статистический анализ данных электронной микроскопии // Физика твердого тела, 2008, Т. 50, вып. 7. С. 1230-1236.
4. Otsu N. A threshold selection method from gray-level histograms. IEEE Trans. on System, Man and Cybernetics, 1979, Vol. SMC-9, № 1.
5. J. Foley, A. vanDam, et al. Computer Graphics: principle and Practice Second Edition, 1990. P. 568-573.
6. Floyd R.W., Steinberg L. An adaptive algorithm for spatial gray-scale // Proceedings Society Information Display, 1976. Vol. 17, № 2. P. 75-78.
7. Горбачев, В.Н., Дроздов В.Н., Яковлева Е.С. Один алгоритм бинаризации полутоновых изображений // Дизайн. Материалы. Технологии. СПб.: СПГУТД, 2009. № 2(9). С. 104-107.
8. Комолова, Н.В., Яковлева Е.С. Adobe Photoshop CS4 для всех. СПб.: БХВ-Петербург, 2009.
9. Lau D.L., Arche G.R. Modern digital halftoning. Second edition. USA: CRC Press, 2008.
10. WangZ., BovikA.C. Modern Image Quality Assessment. New York: Morgan and Claypool Publishing Company, 2006.
11. Daniel L. Lau, Robert Ulichney, Gonzalo R. Arce Cam. Fundamental Characteristics of Halftone Textures: Blue-Noise and Green-Noise // Image Systems Laboratory, march 31, 2003.
12. Velho and Gomes J.M. Digital halftoning with space filling curves // Computer Graphics, 1991. Vol. 25, № 4. P. 81—90.
13. Ulichney R.A. Digital Halftoning. MIT Press, Cambridge, MA, 1987.
14. Rosenberg C.J. Measurement-based evaluation of a printer dot model for halftone algorithm tone correction // Journal of Electronic Imaging, 1993. Vol. 2, № 3, P. 205—212.
15. Yao M., Parker K.J. Dot gain compensation in the blue noise mask. In B. E. Rogowitz and J. P. Allebach, editors, Proceedings of SPIE, Human Vision, Visual Processing, and Digital Display VI, 1995. Vol. 2411, P. 221-227.
16. T. N. Pappas and D. L. Neuhoff. Printer models and error diffusion // IEEE Transactions on Image Processing, 1995. № 4(1). P. 66-79.
ON PROPERTIES OF THE BLOCK-BASED BINARIZATION ALGORITHM
OF DIGITAL IMAGES
Yakovleva E. S., Makarov A. A. Abstract
Modern methods of the binarization which are widely used in printing industry by printing for the halftoning process are considered in the article. Some of the theoretical questions of halftoning also shown. Special attention attended to the block-based binarization algorithm which relative to the methods based on condition of equality brightness, when image has a brightness is equal to the brightness of initial image. Its description and as well short description of chosen algorithms for comparison is stated. From the results of binarization grayscale image from the calculations the chosen distortion measures it has been found that binarized image created using block-based halftoning algorithm has the best results, than those results which were obtained by other halftoning algorithms.
Also the goal of this work was experiment on printing tone scale and measurement of the reflectance coefficients of the halftones using spectrophotometer. Gradation curves for given printer model were obtained. It is founded, that for the block-based binarization algorithm increasing a contrast is observed, that confirmed by real printing experiment. From the analysis of the properties block-based binarization algorithm was discovered that it can be recommended as a commercial halftoning algorithm.
Keywords: digital image, grayscale image, block-based binarization algorithm, halftoning, distortion measures, gradation curve, printer model.
Яковлева Елена Сергеевна, кандидат технических наук, инженер-исследователь кафедры параллельных алгоритмов СПбГУ, [email protected]
Макаров Антон Александрович, доктор физико-математических наук, профессор кафедры параллельных алгоритмов СПбГУ, [email protected]
© Наши авторы, 2015. Our authors, 2015.