Модифицированный алгоритм адаптивной пороговой сегментации в задачах выделения протяженных объектов на слабоконтрастных изображениях

Д. А. Бушенко; Р. Х. Садыхов

Доклады БГУИР

2008 № 4 (34)

УДК004.932.724 ; 004.9344

МОДИФИЦИРОВАННЫЙ АЛГОРИТМ АДАПТИВНОЙ ПОРОГОВОЙ СЕГМЕНТАЦИИ В ЗАДАЧАХ ВЫДЕЛЕНИЯ ПРОТЯЖЕННЫХ ОБЪЕКТОВ НА СЛАБОКОНТРАСТНЫХ ИЗОБРАЖЕНИЯХ

ДА. БУШЕНКО, Р.Х. САДЫХОВ

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь

Поступила в редакцию 22 сентября 2008

Протяженные объекты на слабоконтрастных изображениях обладают рядом свойств, из-за которых их сегментация представляет определенные сложности. Зашумленный неоднородный фон представляет собой главную особенность, которая не позволяет применить здесь классические методы сегментации в чистом виде. Данная статья предлагает модифицированный алгоритм адаптивной пороговой сегментации, позволяющий добиться высоких результатов даже в таких условиях.

Ключевые слова: цифровая обработка изображений, сегментация, протяженные объекты.

Введение

Цифровая обработка изображений применяется в различных областях народного хозяйства. Разнообразные технологические процессы, связанные с ручным трудом, теперь автоматизируются при помощи искусственного интеллекта, а интеллектуальная автоматическая обработка изображений находится на переднем крае информационных технологий.

Одно из быстро развивающихся направлений цифровой обработки связано с протяженными объектами.

Протяженный объект удовлетворяет следующим двум условиям:

1) обладает приблизительно одинаковой шириной по всей своей длине.

2) длина его значительно превышает ширину.

Понятие протяженного объекта является центральным в следующих разделах науки:

- распознавание печатных и рукописных символов;

- интерпретация медицинских изображений;

- построение карт по спутниковым снимкам;

- идентификация волокон в криминалистике.

Что касается распознавания символов, протяженный объект здесь - сам символ. Символ — это не одиночная линия, скорее, она обладает свойствами разветвленных объектов, но несмотря на это, цифровое изображение символа обладает также и всеми свойствами протяженного объекта.

Технология построения карт по спутниковым снимкам предполагает выделение и нанесение на карту дорог и рек. Эти объекты могут иметь различную ширину на разных участках. Тем не менее участки с приблизительно постоянной длиной являются достаточно длинными, чтобы говорить об этих объектах как о протяженных.

Легко заметить, что компьютерное зрение и цифровая обработка изображений имеет дело с большим числом объектов, классифицируемых как протяженные. Поэтому существует интерес к методам и алгоритмам их обработки.

Алгоритмы выделения объектов

Главный этап идентификации протяженных объектов — это их сегментация и выделение. Исходные изображения зачастую содержат слишком много искажений и шумов. Поэтому необходим надежный алгоритм для выделения протяженных объектов на неоднородном фоне слабоконтрастного изображения.

Алгоритмы, основанные на различных типах пороговой обработки, получили наибольшую популярность [1, 2]. Они обычно легко реализуемы и не требуют больших вычислительных затрат, что особенно важно при построении систем компьютерного зрения реального времени.

Сегментация на основе анализа точек с применением пороговой обработки концептуально является простейшим подходом, который возможно применить для обработки. При этом в цветных изображениях важен признак, по которому происходит сегментация. Как отмечено в [3], возможны несколько способов выбора признака сегментации в цветном изображении.

в) г)

Рис. 1. Признаки, использованные при сегментации цветного изображения: а) исходное изображение; б) изображение, сегментированное по яркости; в) изображение, сегментированное сразу по трем цветовым каналам RGB; г) изображение, сегментированное по значению тона объекта

1. Яркость изображения — наиболее очевидный и удобный признак, по которому достаточно легко сегментировать изображение. Главное достоинство этого признака — вполне приемлемое качество сегментации при легкости реализации и скорости выполнения операции. Недостаток — потеря информации, содержащейся в цветовых характеристиках изображения.

2. Все три канала RGB — здесь сегментация производится сразу по всем трем значениям каналов изображения. При этом объект считается выделенным, если он выделен сразу на всех трех каналах. К сожалению, этот метод, хотя и сохраняет информацию о цвете и учитывает яркостные характеристики, но дает совершенно неприемлемое качество сегментации.

3. Значение тона объекта — также является одним из возможных признаков для сегментации. Но эта характеристика, учитывая только цветовые характеристики, совершенно не учитывает яркостные. В результате качество сегментации — низкое.

Как видно на рис. 1, наиболее подходящий для сегментации признак — это яркость объекта. При сегментировании по остальным признакам, некоторые объекты ошибочно отсеиваются как принадлежащие фону.

Гистограмма распределения вероятностей значений яркости всего изображения показывает распределение с двумя отчетливыми максимумами (рис. 2).

Даже если имеет место четкий переход уровней яркости на контуре объектов, всегда будут существовать некоторые промежуточные значения, которые нельзя однозначно отнести ни к фону, ни к искомому объекту. И чем меньше изучаемые объекты, тем большую область на изображении занимают промежуточные значения, заполняющие гистограмму между значениями для объекта и фона.

Как определить оптимальную пороговую величину для сегментации изображения? Тщательное рассмотрение изображения показывает, что размер сегментированных объектов значительно изменяется в зависимости от уровня пороговой величины. Из рис. 8,б видно, что в областях изображения, где колебания неоднородности яркости фона слишком велики, алгоритм пороговой обработки с глобальным пороговым значением ошибочно выделяет слишком большое количество пикселей.

Таким образом, выбор конкретной пороговой величины является решающим для безошибочного определения геометрических признаков объекта. Однако тот факт, что фон изображения является неоднородным, делает невозможным выбор глобального порога сегментации

[4].

Адаптивная пороговая обработка

Поскольку текстильное волокно, показанное на рис. 8,а, является протяженным объектом, то оно находится на участках изображения с фоном различной яркости и зашумленности. Поэтому для более качественного выделения таких протяженных объектов необходимо иметь различные пороговые значения для различных участков изображения.

В подобных ситуациях применим подход, при котором исходное изображение разбивается на подобласти, в каждой из которых для сегментации используется свое значение порога. Основные проблемы при таком подходе — как разбить исходное изображение и как оценить порог для каждой полученной области. Поскольку порог, применимый для каждого пикселя, оказывается зависящим от характеристик подобласти изображения, содержащей данный пиксель, такое пороговое преобразование является адаптивным. В качестве иллюстрации приведем обработку изображения текстильных волокон методом адаптивного порога (рис. 8,в).

Здесь изображение было разбито на 16 фрагментов, для каждого из которых порог Т выбирался как полусумма минимального и максимального уровня яркости фрагмента:

Т = 0,5 (6тш+6тах).

Недостатком метода адаптивной пороговой обработки является то, что он рассматривает изображение как матрицу пикселей. Различные участки волокон, таким образом, могут обрабатываться при различных пороговых значениях, полученных в зависимости от фрагмента изображения, но не от характеристик самого волокна. Желательно было бы рассматривать текстильное волокно единым целым объектом, а пороговые значения вычислять из свойств волокна, а не всего фрагмента в целом.

Рис. 2. Гистограмма распределения вероятностей значений яркости изображения

Модифицированный алгоритм адаптивной пороговой обработки

Очевидно, что шансов на выбор "хорошего" порога значительно больше, если пики на гистограмме являются высокими, узкими и симметричными, а также разделены глубокими впадинами. Как отмечено в [5], один из возможных подходов к "улучшению" формы гистограммы состоит в том, чтобы рассматривать в изображении только те пиксели, которые лежат вблизи перепадов между объектами и фоном, либо на самих перепадах. Непосредственное и очевидное улучшение заключается в том, что гистограммы станут меньше зависеть от относительных размеров объектов и областей фона. Например, на гистограмме изображения, состоящего из маленького объекта на фоне с большой площадью (или наоборот), будет доминировать один большой пик, потому что имеется большое число пикселей одного из видов.

Если учитывать только пиксели, лежащие на перепаде между объектом и фоном или вблизи перепада, то в получаемой гистограмме будут присутствовать пики примерно равной высоты. К тому же вероятность того, что любой из таких пикселей принадлежит объекту, будет приблизительно равна вероятности его принадлежности фону, что улучшает симметричность пиков гистограммы.

Главная трудность при реализации описанного подхода состоит в неявном предположении, что известны места перепадов между объектами и фоном. Ясно, что во время сегментации этих данных нет, поскольку нахождение границ между объектами и фоном как раз и является целью сегментации. Однако, как показано в [5], находится ли некоторый пиксель на перепаде, можно получить, вычисляя градиент в этой точке. Кроме того, с помощью лапласиана можно получить информацию о том, лежит ли некоторый пиксел на темной или светлой стороне перепада.

К сожалению, классический метод адаптивной пороговой обработки с оптимальным порогом совершенно неприемлем для сегментации слабоконтрастных изображений. Ключевой момент классического метода — правильное выделение границ объекта. На слабоконтрастных изображениях это условие выполнить практически невозможно. Главным атрибутом слабоконтрастного изображения являются размытые границы объектов, причем размытые настолько, что они зачастую ничем не отличаются от фона. Поэтому даже самые эффективные методы выделения границ не способны дать замкнутые границы объектов.

На основе классического метода был разработан более результативный и производительный метод определения пороговой величины для выделения протяженных объектов на слабоконтрастных изображениях.

Первым шагом модифицированного алгоритма является выделение границ объектов. Как показано выше, наиболее точные пороговые значения можно получить при рассмотрении значений яркости пикселей, лежащих на выделенных границах. Здесь таким пороговым значением предлагается использовать статистическое среднее значение яркости пикселей выделенных границ. В большом количестве экспериментов участвуют протяженные объекты, каждый из которых обладает одним постоянным цветом и яркостью. Это значит, что, выделив пороговую величину для каждого конкретного объекта, мы получаем независимость от флуктуаций фона.

Существует огромное количество различных алгоритмов выделения границы объектов. Среди них можно назвать следующие методы: Кэнни, Лапласиан, оператор Превитта, Собела и др. [5-10]. Наибольшей точностью обладает алгоритм SUSAN [11] (рис. 3).

Эксперименты показали, что алгоритм SUSAN выделяет границы объектов даже на слабоконтрастных изображениях. Правда такие границы часто разомкнуты и плохо описывают выделяемый объект. Но они все же дают достаточно информации для сегментации методом адаптивной пороговой обработки (рис. 3).

Вторым шагом предложенного алгоритма является сегментация объектов при использовании полученных пороговых значений. Важно выделить не просто все пиксели, значение яркости которых превышает пороговое, а пиксели, принадлежащие одному исследуемому объекту. Характеристикой выделенных точек должна стать их геометрическая связанность.

Поэтому для сегментации используется модифицированный метод машинной графики "заполнение замкнутых областей". При помощи этого метода помечаются все пиксели, значе-

ние яркости которых равно или превышает пороговое. Заполнение начинается от границы объекта и, таким образом, выделяет геометрически связанные области.

Третьим шагом предложенного алгоритма является определение протяженных объектов среди всех выделенных. В частности, следует отсеять "мусор", объекты, не являющиеся протяженными, и объекты с эффектом "разлитого волокна".

Рис. 3. Исходное слабоконтрастное изображение текстильного волокна (а) и выделение границ при помощи: метода Кенни (б); оператора Превитта (е); оператора Робертса (г); оператора Собела (д); метода SUSAN (е)

Эффект разлитого волокна и его устранение

При обработке протяженных объектов, таких, как текстильные волокна, может возникать сложный эффект, называемый здесь эффектом разлитого волокна. Этот эффект появляется из-за слабой контрастности изображения там, где вычисленное пороговое значение равно или меньше значения фона. На рис. 4 показано, как возникает такая ситуация.

На рис. 6 изображено волокно настолько слабоконтрастное, что едва отличается от фона. На изображении присутствуют всего три цифровых значения яркости, интервал дискретизации между которыми равен 1. Жирной линией помечены границы волокна так, как их выделит детектор границ. Волокно, изображенное на рис. 6, состоит из 12 пикселей цвета 2 и 10 пикселей цвета 3. Это значит, что в силу неделимости яркостей цифрового изображения на подуровни среднее значение порога для выделения волокна будет равно 2.

1 1 1 1 1 1 2 2 2 2

2 2 1 1 1 1 2 2 2 2

2 2 2 2 2 3 3 3 3 2

1 2 2 2 2 2 3 3 3 3

1 1 1 1 1 1 1 2 3 3

1 1 1 1 2 2 2 2 2 2

а б

Рис. 4. Эффект разлитого волокна: а) исходное изображение; б) изображение после пороговой обработки

Поскольку фон изображения неоднородный, то на нем могут быть различные флуктуации цвета. На рис. 6 показано, что фон состоит из значений яркости 1 и 2.

Во время выделения объекта методом модифицированной адаптивной пороговой обработки все пиксели, яркость которых равна или больше 2, будут отнесены к объекту. Таким образом, волокно "разольется" по фону.

На рис. 5 показан пример такого эффекта на реальном изображении с текстильными волокнами.

б

Рис. 5. Исходное изображение с выделенными границами волокон (а) и изображение после обработки при помощи модифицированного адаптивного порогового алгоритма (б)

а

Первая деструктивная особенность этого эффекта заключается в том, что во время заполнения областей, похожих на искомый объект, кроме фона вокруг слабоконтрастного изображения будут залиты также и удачно выделенные волокна. Второй недостаток методики в том, что выделение таких объектов занимает очень много машинного времени и в 10-20 раз замедляет работу всего алгоритма. Для преодоления указанных недостатков предлагается использовать следующие методы.

1. Каждое волокно обрабатывать в отдельности от всех остальных. Это позволит не "залить" испорченным волокном все остальные, выделенные удачно.

2. Сделать ограничение на площадь заливаемой области. Здесь использовалось эмпирически полученное значение: количество пикселей в границах волокна, помноженное на 50. Это позволит избежать выделения слишком большого количества машинного времени на выделения "разлитого" волокна.

3. Распознать "разлившиеся" волокна и вынести их из рассмотрения.

Для распознавания "разлившихся" волокон здесь предлагается использовать одну из особенностей волокон как протяженных объектов: их средняя линия является обычной кривой. Бывают ситуации, когда волокно закручивается и пересекает само себя несколько раз или пересекает другие волокна. Тогда средняя линия волокна будет напоминать древовидную структуру. Но даже в этом случае средняя линия волокна ветвится значительно меньше, чем средние линии любых других объектов. На основании этого признака удается очень точно определить "разлившиеся волокна" (рис. 6).

Рис. 6. Средняя линия разлившегося волокна в сравнении со средними линиями обычных волокон

Эффективность алгоритма

Блок-схема использованного алгоритма представлена на рис. 7.

Рис. 7. Модифицированный алгоритм адаптивной пороговой сегментации

Используя такую модификацию метода адаптивной пороговой обработки удается выделить пиксели, относящиеся к одному объекту, имея для него его собственное индивидуальное значение пороговой величины.

Результат сегментации предложенным модифицированным методом значительно превосходит по точности классический алгоритм пороговой обработки.

• \ •

Рис. 8. Сравнение различных методов пороговой обработки при выделении протяженных объектов на слабоконтрастных изображениях: а — исходное изображение; б — результат пороговой обработки с глобальным пороговым значением; в — адаптивная пороговая обработка; г — модифицированная адаптивная пороговая обработка

В таблице сведены результаты сравнения эффективности алгоритмов пороговой обработки.

Точность выделения волокон различными методами

Метод выделения Процент приемлемо выделенных волокон

Глобальная пороговая обработка 41,48%

Адаптивная пороговая обработка 62,86%

Модифицированная адаптивная пороговая обработка 81,35%

Опыты проводились на выборке изображений, содержащих в общей сумме 622 текстильных волокна. Изображения были получены при помощи сканнера Epson Perfection 4870 с разрешением 2400 dpi. Разрешение было выбрано именно 2400 dpi, потому что оно поддерживается большинством современных сканеров бизнес-класса.

Как видно из результатов испытаний, предложенный модифицированный метод адаптивной пороговой обработки значительно превосходит существующие методы по точности. Он способен выделять волокна на слабоконтрастных и зашумленных изображениях. В состав алгоритма входит новая модификация адаптивной пороговой обработки, автоматически вычисляющая пороговое значение для каждого волокна как объекта в целом и заполняющая геометрически связанные области в местах обнаружения границ объектов. Алгоритм успешно находит области "разлитых" волокон, не подходящих для выделения, и выносит их из рассмотрения.

Выводы

В статье показано, что существующие методы сегментации объектов неприменимы для сегментации протяженных микрообъектов на слабоконтрастных изображениях, таких как текстильные волокна. Была предложена также модификация существующих наиболее эффективных аналогов для решения указанной задачи. Алгоритм был протестирован на большой выборке волокон и показал хорошие результаты, позволяющие применять его в экспертных системах для анализа и идентификации текстильных волокон.

MODIFIED ALGORITHM OF ADAPTIVE THRESHOLD SEGMENTATION IN THE TASKS OF STRETCHED OBJECTS EXTRACTION FROM THE LOW CONTRAST IMAGES

DA. BUSHENKO, R.Kh. SADYKHOV

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Abstract

Stretched objects on the low contrast images possess a number of properties, which make the objects difficult to extract from the images. Distorted non-uniform background of the images is the main feature, which makes it impossible to apply the classic segmentation algorithms. In this article a new modified adaptive threshold algorithm is presented which allows achieving high quality results in these conditions.

Литература

1. Pitas I. Digital Image Processing Algorithms. Prentice Hall, New York, 1993.

2. Umbaugh S.E. Computer Vision and Image Processing: A Practical Approach Using CVIPTools. Prentice Hall PTR, Upper Saddle River, NJ, 1998.

3. Crane R. A simplified approach to image processing. Classical and modern techniques in C. Prentice-Hall, New Jersey, 1997.

4. Яне Б. Цифровая обработка изображений. М., 2007.

5. Гонсалес Р., Вудвс Р. Цифровая обработка изображений. М., 2006.

6. Pratt W.K. Digital image processing, PIKS Inside. Willey, New York, 3rd edn., 2001.

7. Deriche R. Fast algorithms for low-level vision, IEEE Trans. PAMI, 1990.

8. Marr D., Hildreth E. Theory of edge detection. Proc. Royal Society, London, 1980.

9. Canny J.F. A computational approach to edge detection. PAMI, 1986.

10. Wilson J.N., Ritter G.X. Handbook of Computer Vision Algorithms in Image Algebra. Boca Raton, 2000.

11. Smith S.M., Brady J.M. SUSAN — A New Approach to Low Level Image Processing, 1995.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д А. Бушенко, Р Х. Садыхов

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Д А. Бушенко, Р Х. Садыхов

MODIFIED ALGORITHM OF ADAPTIVE THRESHOLD SEGMENTATION IN THE TASKS OF STRETCHED OBJECTS EXTRACTION FROM THE LOW CONTRAST IMAGES