Сравнительный анализ методов формирования контурных представлений для поиска линий на основе метода Хафа

Зотин А. Г.; Борисов Ю. В.; Лисица А. С.

УДК 004.932

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ФОРМИРОВАНИЯ КОНТУРНЫХ ПРЕДСТАВЛЕНИЙ ДЛЯ ПОИСКА ЛИНИЙ НА ОСНОВЕ МЕТОДА ХАФА

А. Г. Зотин, Ю. В. Борисов, А. С. Лисица

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31.

Е-шаИ: zotin@sibsau.ru, borisoff@sibsau.ru, lisizaandrey@sibsau.ru

Рассматривается метод Хафа для поиска линий, а также способы формирования контурных представлений. Приведено описание алгоритмов, их формирования и метода бинаризации Отсу. Выполнена сравнительная оценка методов формирования контуров для поиска линий с учетом различных способов бинаризации. Представлены результаты экспериментов для различных изображений.

Ключевые слова: анализ изображений, контурные представления, метод Робертса, метод Лапласа, метод Собела, бинаризация, метод Отсу, метод Хафа.

COMPARATIVE ANALYSIS OF EDGE DETECTION METHODS FOR LINES SEARCH ON THE BASIS OF HOUGH TRANSFORM METHOD

A. G. Zotin, Yu. V. Borisov, A. S. Lisitsa

Siberian State Aerospace University named after academician M. F. Reshetnev 31 “Krasnoyarskiy Rabochiy” prospect, Krasnoyarsk, 660014, Russia.

E-mail: zotin@sibsau.ru, borisoff@sibsau.ru, lisizaandrey@sibsau.ru

The method of Hough transformation for line detection is considered in the article. Methods of edge representation generation and their algorithms are described. Binarization algorithms of an image are presented. The comparative evaluation of methods of formation of edge representation for lines detection, with the account of various ways of binarization, is given. Results of the experiments, carried out under different conditions, are presented.

Keywords: images analysis, edge representations, method of Roberts, method of Sobel, binarization, method of Otsu, method of Hough.

Системы компьютерного зрения и распознавания образов широко входят в обыденную жизнь современного человека. Компьютерное зрение позволяет эффективно решать различные задачи, связанные с анализом изображений или видеопоследовательностей. При автоматизированном анализе цифровых изображений очень часто возникает задача определения простых фигур, таких как прямые, круги или эллипсы. Преобразование Хафа может применяться в этих областях для распознавания контуров зданий на изображениях [1], нормализации ориентации текста на странице сканированного документа, определения линии горизонта [2], нахождения линий дорожной разметки и в прочих сферах [3].

Преобразование Хафа - метод, используемый в обработке изображений и компьютерном зрении, который предназначен для поиска параметрических и непараметрических объектов с использованием процедуры голосования. Данный метод основывается на представлении объекта интереса в виде параметрического уравнения [4; 5]. Параметры этого уравнения представляют собой фазовое пространство (аккумуляторный массив/пространство, пространство Хафа). Идея преобразования Хафа состоит в том, что для каждой точки пространства параметров подсчитывается число точек пространства, порождающих в про-

странстве параметров отклики. При этом на основе данных фазового пространства возможно восстановить параметры исследуемого объекта.

Классический алгоритм преобразования Хафа является наиболее простым в реализации и быстрым в работе. Он предназначен для нахождения прямых на изображении. В этом случае фазовое пространство получается двумерным, так как любую линию можно задать двумя параметрами её уравнения [6; 7]. При формировании фазового пространства целесообразно использование нормального уравнения прямой:

R = x • cos 9 + y • sin 9, (1)

где R - длина перпендикуляра, опущенного из начала координат на прямую; 0 - угол между положительным направлением оси OX и направлением этого перпендикуляра R.

Использование в качестве параметров фазового пространства угла 0 и длины перпендикуляра (радиуса) R обусловлено тем, что в случае применения параметров уравнения прямой с угловым коэффициентом y = к • x + b будет невозможно представить в фазовом пространстве прямую, параллельную оси O7.

Для реализации преобразований Хафа используется аккумуляторный массив, сформированный на основе параметров 0 и R, которые выступают в качестве

индексов элементов в массиве. Значение каждого элемента равно количеству точек, принадлежащих прямой (в пространстве исходного изображения), которая описывается соответствующими индексными значениями. Размерность фазового пространства с индексом R представляет количество пикселов, расположенных на диагонали изображения.

Алгоритм выполнения преобразования Хафа (рис. 1) можно представить в виде последовательности шагов.

Шаг 1. Задание параметров для фазового пространства. На этом шаге выполняется задание диапазона углов 0 и расчет максимальной длины перпендикуляра (радиуса) Rmax, рассчитываемой по формуле

Rmax _ ^width + ^height , (2)

где /width - ширина изображения; Iheight - высота изображения.

Шаг 2. Задание размерности фазового пространства Хафа для угла (0) и для радиуса (R).

Шаг 3. Создание матрицы, в которую заносятся данные о количестве точек, лежащих на прямой с заданными параметрами, PhaseSpace (R, 0).

Шаг 4. Анализ каждой точки изображения. Если точка принадлежит контуру (в бинарном виде контурного представления она представлена белым цветом), то переход к шагу 5. В противном случае анализируется следующая точка изображения. Когда рассмотрены все точки изображения, переход к шагу 6.

Шаг 5. Проверка каждой прямой на возможность прохождения через точку (x, у). Для выполнения проверки перебираются все возможные углы наклона и все возможные расстояния от начала координат. Для каждого значения угла 0 и расстояния R проверка выполняется согласно выражению

|х• cos9 + у• sin9-R| <TS , (3)

где x, у - координаты точки в пространстве изображения; 0, R - значения параметров фазового пространства; TS - порог задания точности аппроксимации.

В случае истинности выражения увеличивается значение аккумуляторного массива с соответствующими параметрами. Когда рассмотрены все точки

фазового пространства для анализируемой точки изображения, переход к шагу 4.

Шаг 6. Визуализация фазового пространства (рис. 1, б) и формирование массива параметров фазового пространства PhasePar, который содержит в себе следующие элементы: угол 0, длину перпендикуляра R, значение аккумулятора для этих параметров Counter. В массив включаются элементы, содержащие ненулевое значение элемента Counter.

Шаг 7. Сортировка массива PhasePar по убыванию. Сортировка выполняется при помощи любого метода. Так, для увеличения быстродействия можно использовать метод Шелла.

Шаг 8. Отрисовка на основании массива PhasePar найденных линий (рис. 1, в) по точкам для 0, R, которые получены в результате преобразования.

При обработке цветных цифровых изображений точность определения линий во многом зависит от контурного представления изображения и параметров аппроксимации в фазовом пространстве. Методы формирования контурных представлений широко применяются в различных задачах, например для поиска наложенного текста [3], в задачах улучшения качества изображений [8], а также при сегментации [9] и анализе параметров объектов в различных сферах [10; 11]. Наиболее известными являются методы Робертса, Превита, Собела и Лапласа [9; 10].

Первые три метода представляют собой дискретный дифференциальный оператор, вычисляющий приближенное значение градиента яркости изображения. В результате показывается, насколько резко или плавно меняется яркость изображения в каждой точке, а значит, вероятность нахождения точки на грани, а также ориентация границы. Дискретный лапласиан в свою очередь определяется как сумма вторых производных и вычисляется, как сумма перепадов на соседях центрального пиксела.

Метод Робертса, как показывает практика, является самым простым и самым быстродействующим. В данном методе используется маска 2*2 вида

G D D D ’

где G - пиксел, с которым ведется работа; D -соседние пикселы.

а б в

Рис. 1. Примеры изображений формируемых при выполнении преобразования Хафа: а - исходное изображение; б - фазовое пространство; в - найденные линии

Операторы Робертса

1 0 0 1

Gx = 0 -1 Gy = -1 0

используются для расчета значения нового пиксела по формулам

О = 7Ох2 + Оу2 О = \Ох\ + |Оу| , (4)

Методы Превита и Собела аналогичны методу Робертса - они также основаны на вычислении градиента и работают с масками 3*3 следующего вида:

В В В БОБ ,

В В В

где О - пиксел, с которым ведется работа; В - соседние пикселы;

Для расчета нового значения методы Превита и Собела также используют выражение (4). Основное их отличие заключается в самих операторах:

- операторы Превита:

1 0 -1 1 1 1

Gx1 = 1 0 -1 , Gy1 = 0 0 0

1 0 -1 -1 -1 -1

1 1 0 0 1 1

Gx2 = 1 0 -1 , Gy 2 = -1 0 1

0 -1 -1 -1 -1 0

- операторы Собела:

1 0 -1 1 2 1

Gx1 = 2 0 -2 , Gy1 = 0 0 0

1 0 -1 -1 -2 -1

2 1 0 0 1 2

Gx2 = 1 0 -1 , Gy 2 = -1 0 1

0 -1 -2 -2 -1 0

Метод Лапласа относится к группе цифровых фильтров с конечной импульсной характеристикой, основанной на теории линейных систем и применении двумерных сверток. Обработка изображения с применением таких фильтров описывается формулой

m П

hew (x y) = ХХа к,1 • hid(x - m/2 + k, У - П/2 +1 ), (5)

k=0 I=0

где Inew, /oid - новые и старые значения пикселов изображения; akj - коэффициент, определяющий эффект фильтра; m, п - константы, задающие размер фильтра. При наложении фильтра Лапласа коэффициент а может иметь различный вид (рис. 2):

- коэффициент Лапласа с положительным ядром:

0 -1 0 -1 -1 -1

а = -1 4 -1 , а = -1 8 -1

0 -1 0 -1 -1 -1

- коэффициент Лапласа с отрицательным ядром:

0 1 0 1 1 1

а = 1 -4 1 , а = 1 -8 1

0 1 0 1 1 1

На рис. 2 отображены примеры контурных представлений некоторых методов.

Как можно заметить из рис. 2, метод Собела дает более плотное описание линий контуров, метод Робертса учитывает меньше градиентных переходов, метод Лапласа с отрицательным ядром подчеркивает внешние границы, а с положительным ядром - внутренние.

Прежде чем выполнять обработку контурного представления методом Хафа, необходимо выполнить бинаризацию. Бинаризацию можно выполнить с использованием фиксированного порога, адаптивного порога на основе значений максимума и минимума или порога, вычисленного методом Отсу [12].

Метод Отсу заключается в том, что порог разделения пикселей подбирается так, чтобы классы светлых и темных пикселов были наиболее далеки друг от друга. Для этого значения гистограммы яркости представляются в виде случайного распределения. Затем ищется порог, при котором внутриклассовая дисперсия (сумма отклонения от математического ожидания) будет минимальной. Это соответствует максимизации межклассовой дисперсии

(Скл)2 = Wi'ff>2'(ai - a2)2, (6)

где ю1 и ю2 - значения вероятности первого и второго классов; a1 и а2 - средние арифметические значения для каждого из классов.

Для расчета значений вероятностей классов с учетом порога используются выражения:

t max

Ю 1(t) = Х Pi , Ю 2(t) =Х Pi =1 -ю ^ (7)

i=0 i=t+1

где Pi - вероятность распределения i-го элемента гистограммы; t - значение порога.

Обобщенная форма алгоритма вычисления порога методом Отсу:

Шаг 1. Формирование гистограммы и вероятностей Pi распределения интенсивностей.

Шаг 2. Анализ гистограммы. Начиная с порога t =

1 происходит проход через всю гистограмму, на каждом шаге выполняются следующие действия:

Шаг 2.1. Пересчитывается дисперсия окл(0.

Шаг 2.2. Если на каком-то шаге дисперсия оказалась больше максимума, то дисперсия обновляется и T = t.

Еще один метод бинаризации - максиминный. В нем выполняется расчет глобального порога бинаризации Т на основе минимума (min) и максимума (max) интенсивности для всего изображения согласно формуле

в г

Рис. 2. Примеры работы методов по выделению контурных линий: а - метод Собела с вычислением градиента по всем направлениям; б - метод Робертса; в - метод Лапласа с отрицательным ядром; г - метод Лапласа с положительным ядром

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Проанализировав представленные методы бинаризации на тестовых изображениях, авторы сделали вывод о том, что наиболее эффективным из перечисленных методов глобальной бинаризации по качеству обработки (величина ошибок до 30 % и меньше) является метод Отсу. К его недостаткам относится размытие линий, потеря тонких линий [12; 13]. Примеры бинаризации контурных представлений показаны на рис. 3.

Для проведения экспериментальных исследований было разработано программное обеспечение, позволяющее выполнять формирование контурных представлений на основе яркости изображения. Схема организации модулей экспериментального программного обеспечения представлена на рис. 4.

Для анализа описанных методов формирования контурных представлений был проведен ряд экспериментов, который заключался в следующем: на тестовых фотографиях отмечались важные линии (каркасные линии, имеющие значение при построении модели помещения), после этого с помощью реализованных методов программа находила линии и сохранялись параметры и результаты их работы. Для проведения экспериментов были отобраны 100 различных фотографий, сделанных в разных условиях: 40 фотографий были сделаны внутри помещений, имеющих длинный центральный коридор; 30 фотографий были сделаны внутри помещений, имеющих четкие разгра-

ничительные линии (между стенами и потолком, стенами и полом); остальные фотографии были выполнены в условиях плохой различимости линий (сливающиеся, тонкие, искаженные). Выполнение оценки методов формирования контурных представлений осуществлялось для бинаризации методом Отсу и с использованием адаптивного порога на основе максимальных и минимальных значений гистограммы. Бинаризация со статическим порогом была исключена, поскольку она очень сильно зависит от величины отклика, полученного при формировании контурного представления, и условий освещения во время съемки. В качестве оценки использовались следующие критерии: процент точного определения искомых линий, процент дублирующих линий, процент ложно обнаруженных линий. В таблице представлены сводные данные для оценки методов.

На основе проведенных экспериментов можно сделать следующие выводы. Одним из самых эффективных методов формирования контурного представления для поиска линий является метод Собела. По точности определения искомых линий он превышает остальные методы на 8... 30 %. Его существенным недостатком является то, что на месте одной линии он находит несколько (с равным углом и сходным расстоянием). Количество этих линий лишь немногим меньше, чем в методе Превита. Характерной особен-

ностью этих линий является достаточно большой раз- количество посторонних (не основных) линий, при-

брос (2.6 пикселов), в отличие от метода Лапласа чем по их количеству он уступает лишь методу

(0.3 пиксела). Метод Собела также находит большое Робертса на 7.8 %.

г

Рис. 3. Пример бинаризации контурных представлений методом Отсу (слева) и на основе Максиминого порога (справа): а - метод Собела с градиентом по всем направлениям; б - метод Робертса; в - метода Лапласа с отрицательным ядром; г - метод Лапласа с положительным ядром

* ' Преобразование цветов моделей г у Формирование контуров к. Бинаризация изображения

Метод Робертса

Метод Собела

Метод Лапласа

Метод Превита

Рис. 4. Схема организации модулей экспериментального программного обеспечения Оценка методов формирования контурных представлений

Методы формирования контурных представлений Точность определения искомых линий, % Ложное определение, % Ду блирующиеся линии, %

Отсу максимин Отсу максимин Отсу максимин

Метод Собела (все направления) 80,2 52,1 17,3 2,7 28,1 1б,8

Метод Собела (декартовые направления) 77,1 50,7 15,3 2,7 27,05 18,1

Метод Собела (диагональные направления) 73,4 50,3 14,б 5,б 28,35 1б,7

Метод Превита (все направления) 79,2 48,3 1б,1 2,8 31,05 1б,8

Метод Превита (декартовые направления) 73,2 47,1 14,3 2,7 29,05 18,1

Метод Превита (диагональные направления) 72,8 47,4 1б,2 4,9 28,35 1б,7

Метод Робертса 71,б 12,3 18,3 2,9 25,15 8,б

Метод Лапласа (положительное ядро 4) 43,5 9,2 10,2 3,5 21,75 5,1

Метод Лапласа (положительное ядро B) 49,2 43,1 12,8 2,7 23,1 20,5

Метод Лапласа (отрицательное ядро 4) 50,3 8,7 5,2 1,7 20,5 б,15

Метод Лапласа (отрицательное ядро B) 48,4 48,1 5,4 2,5 19,2 23,05

Подводя итоги, можно сказать, что выбор метода формирования контурного представления в большей степени зависит от решаемых задач: если требуется найти как можно больше верных линий, то метод Со-бела будет наилучшим выбором; если же требуется, чтобы среди найденных линий присутствовало как можно меньше ложно определенных линий и допускается небольшая потеря основных линий, то целесообразно использование метода Лапласа. Для компенсации дублирующихся линий предлагается ввести следующую модификацию: при нахождении линий с одинаковым углом и сходной длиной перпендикуляра (различия на 2.4 пиксела) следует объединять их в одну линию, при этом итоговая длина перпендикуляра будет вычисляться как среднее арифметическое значение. Данная модификация позволит улучшить показатели методов Лапласа и Робертса за счет малого разброса их дублирующихся линий. По предвари-

тельным оценкам в методах Собела и Превита количество дублирующихся линий с применением модификации сократится в среднем на 60.70 %.

Библиографические ссылки

1. Arefi H., Engels J., Hahn M. and Mayer H. Levels of detail in 3D building reconstruction from lidar data // In proceedings of the International Achieves of the Photogrammetry, Remote Sensing, and Spatial Information Sciences. Beijing 2008. Vol. XXXVII. P. B3b. P. 485-490.

2. Коррекция наклона [Электронный ресурс].

URL: http://bik-top.livejournal.com/37060.html (дата

обращения: 28.11.2012).

3. Зотин А. Г. Адаптивный метод обнаружения текстовых зон в видеопотоке на основе яркостных карт // Вестник СибГАУ. 2007Вып. 1 (14). С. 34-38.

4. Image Transforms - Hough Transform [Electronic resourse]. URL: http://homepages.inf.ed.ac.uk/rbf/HIPR2/ hough.htm (date of visit: 28.11.2012).

5. Tretiak E., Barinova O., Kohli P., Lempitsky V. Geometric image parsing in man-made environments // Intern. J. of Computer Vision. 2012. Vol. 97. № 3. Р. 305-321.

6. Barinova O., Lempitsky V., Kohli. P. On the Detection of Multiple Object Instances Using Hough Transforms // IEEE Computer Vision and Pattern Recognition, San Francisco. 2010. Р. 1-8.

7. Nixon M., Aguado A. S. Feature Extraction and Image Processing for Computer Vision. 3rd ed. // Academic Press, 2012.

8. Фаворская М. Н., Зотин А. Г., Пахирка А. И. Метод улучшения цветных изображений на основе выравнивания спектральных диапазонов и коррекции контрастности // Механика, управление и информатика. 2012. № 8. С. 99-103.

9. Muthukrishnan R., Radha M. Edge Detection Techniques for Image Segmentation // Intern. J. of Computer Science & Information Technology. 2011. Vol. 3. № 6. Р. 259-267.

10. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера, 2006.

11. Лукьяница А. А., Шишкин А. Г. Цифровая обработка видеоизображений. М. : Ай-Эс-Эс Пресс, 2009.

12. Sezgin M., Sankur B. Survey over Image Thresholding Techniques and Quantitative Performance Evaluation // J. of Electronic Imaging. 2004. Vol. 13(1). Р. 146-165.

13. Otsu N. A Threshold Selection Method from Gray-Level Histograms // IEEE Transactions on Systems, Man, and Cybernetics. 1979. Vol. 9. № 1. Р. 62-66.

УДК 519.8

САМОКОНФИГУРИРУЕМЫЙ ГЕНЕТИЧЕСКИЙ АЛГОРИТМ РЕШЕНИЯ ЗАДАЧ ПОДДЕРЖКИ МНОГОКРИТЕРИАЛЬНОГО ВЫБОРА*

И. А. Иванов, Е. А. Сопов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: ilyaiv92@gmail.com, evgenysopov@gmail.com

Предложен новый самоконфигурируемый многокритериальный алгоритм оптимизации на базе коэволюци-онного генетического алгоритма. Представлены результаты исследования эффективности подхода в сравнении с известными алгоритмами.

Ключевые слова: многокритериальная оптимизация, множество Парето, эволюционные алгоритмы.

SELF-CONFIGURING GENETIC ALGORITHM FOR MULTI-OBJECTIVE CHOICE PROBLEM DECISION

I. A. Ivanov, E. A. Sopov

Siberian State Aerospace University named after academician M. F. Reshetnev 31“Krasnoyarskiy Rabochiy” prospect, Krasnoyarsk, 660014, Russia E-mail: ilyaiv92@gmail.com, evgenysopov@gmail.com

A novel self-configuring multi-objective algorithm of optimization, based on coevolutional genetic algorithm, is proposed. Results of algorithm efficiency investigation are presented.

Keywords: multi-objective optimization, Pareto set, evolutional algorithms.

Большое число практических задач поддержки аналитических моделей (выбор структуры и парамет-

принятия решений в различных областях науки и тех- ров модели), генерировании множества допустимых

ники сводятся к решению задачи выбора на множест- альтернатив, непосредственно при выборе наилучшей

ве альтернатив. Такие задачи возникают на всех эта- альтернативы в соответствии с некоторыми крите-

пах поддержки принятия решений: при построении риями. В реальных задачах число критериев, по кото-

* Работа выполнена при финансовой поддержке ФЦП «Научные и научно-педагогические кадры России» (2011-1.2.2215-021, 2011-1.2.1-113-025), ФЦП «Исследования и разработки по приоритетным направлениям развития научнотехнологического комплекса России на 2007-2013 годы» (2011-1.9-519-005-042).

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зотин А. Г., Борисов Ю. В., Лисица А. С.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зотин А. Г., Борисов Ю. В., Лисица А. С.

Comparative analysis of edge detection methods for lines search on the basis of Hough transform method

Текст научной работы на тему «Сравнительный анализ методов формирования контурных представлений для поиска линий на основе метода Хафа»