Научная статья на тему 'Предварительная обработка изображений плоских объектов в системах технического зрения'

Предварительная обработка изображений плоских объектов в системах технического зрения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
778
174
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА / ПЛОСКИЙ ОБЪЕКТ / FLAT OBJECT / СГЛАЖИВАНИЕ ШУМА / NOISE SMOOTHING / ВЫДЕЛЕНИЕ КОНТУРА / THE CIRCUIT SELECTION / ДЛИНА ОБЪЕКТА / OBJECT LENGTH / МАРКИРОВКА / MARKING / БИНАРИЗАЦИЯ / BINARIZATION / ПОВОРОТ ОБЪЕКТА / OBJECT ROTATION / PRE-PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Садыков Султан Сидыкович, Савичева Светлана Владимировна

Предложена и реализована методика предварительной обработки изображений реальных плоских объектов, использование которой позволяет осуществлять идентификацию промышленных деталей в реальном масштабе времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

pre-processing of flat object image in technical vision system

A method of preliminary image processing in technical vision system is proposed. Realization of the method is shown to allow for real time identification of industrial elements.

Текст научной работы на тему «Предварительная обработка изображений плоских объектов в системах технического зрения»

УДК 004.932.2:681.327

С С Садыков, С. В. Савичева

ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ ПЛОСКИХ ОБЪЕКТОВ

В СИСТЕМАХ ТЕХНИЧЕСКОГО ЗРЕНИЯ

Предложена и реализована методика предварительной обработки изображений реальных плоских объектов, использование которой позволяет осуществлять идентификацию промышленных деталей в реальном масштабе времени.

Ключевые слова: предварительная обработка, плоский объект, сглаживание шума, выделение контура, длина объекта, маркировка, бинаризация, поворот объекта.

На современном этапе развития компьютерных технологий все более широкое распространение получают системы технического зрения (СТЗ). Их основное назначение — помочь человеку в областях деятельности, связанных со сбором и анализом зрительной информации, или даже заменить его. Уровень использования СТЗ в прикладных областях является одним из наиболее ярких и наглядных показателей развития высоких технологий в самых различных сферах человеческой деятельности. Традиционно развитие СТЗ ориентировано на промышленное производство, связанное с робототехникой [1].

На изображениях практически каждого реального объекта присутствуют шумовые составляющие. Они могут возникать из-за несовершенства видеодатчиков, наличия пыли или грязи на обрабатываемой поверхности, износа источников освещения и пр. Все эти помехи затрудняют распознавание объектов с помощью СТЗ, и если их не сократить (в идеале — удалить), помехи могут привести к значительным ошибкам.

Снизить уровень ошибок при распознавании позволяет использование быстрых алгоритмов предварительной обработки изображений плоских объектов сразу после их получения с видеодатчика. Рассмотрим этапы предлагаемой методики предварительной обработки изображений плоских объектов.

Этап 1. Снижение уровня шума на изображениях объектов до требуемого. К настоящему времени разработано много методов и алгоритмов сглаживания шума. Среди них можно выделить методы адаптивного сглаживания [2, 3], анизотропной диффузии [4, 5] и медианной фильтрации [2—7]. Последний обладает высоким быстродействием и позволяет снизить уровень помех на изображениях, при его работе не происходит усреднения по яркости, контуры объектов на изображении не размываются.

Обозначим последовательность обрабатываемых точек в виде одномерного массива 7={у1, у2, ..., уп}. Обычно используется квадратная апертура размером (2к +1)х (2к +1), £=1,2,..., и в каждой точке растра (г, у) яркость пересчитывается по следующему правилу: апертура помещается в левый верхний угол так, чтобы ее центр совпал с точкой (г, у). Яркости (2£+1) элементов изображения, попавших в окно, нумеруются по возрастанию: Ъ1<Ъ2<.<Ъг. При этом медианой набора Ь1—Ъг является его средний элемент.

Описанную процедуру можно представить следующим образом:

*

х = теё(уьУп). (1)

Этап 2. Бинаризация изображений. Бинаризация является одним из основных методов обработки изображений в робототехнике, позволяющих выделять объекты в поле зрения СТЗ. Наиболее известны следующие алгоритмы бинаризации:

— адаптивная бинаризация [2, 3];

— метод Отсу [9];

— методы кластеризации (к-средних, ЕМ-алгоритм) [10, 11];

— обработка с постоянным порогом [2, 3].

Исследования показали, что лучшие результаты как по скорости, так и по качеству уменьшения шума дает метод Отсу. Данный алгоритм состоит из двух основных шагов.

Шаг 1. Автоматическое определение порога бинаризации по нормированной гистограмме яркостей изображения по формуле:

Рг = Щ / N, (2)

где N — общее число пикселов на изображении; пг — число пикселов с уровнем яркости г. Шаг 2. Процедура простого порогового разбиения изображения.

Диапазон яркостей делится на два класса с помощью порогового значения уровня яркости г (целое значение от нуля до Ь). При этом каждому классу соответствуют:

г

®0(0= Е Рг , (3)

г=1

ю1(г)=1-юо(г),

г

Ы0= Е гРг/ ю0(г К

г=1 Ь

Ш(г)= Е гРг1 ю1(г^

г =г+1

где ю0(/) и ю1(/) — относительная частота двух классов 0 и 1, разделенных порогом г; ц0(0) и ц1(0) — средний уровень для каждого из двух классов 0 и 1 изображения, разделенных порогом г.

Этап 3. Маркировка. Наиболее известны алгоритмы маркировки связных областей путем последовательного сканирования и рекурсивной маркировки [6, 12—15].

Сравнение показало, что лучшим по быстродействию является алгоритм последовательного сканирования. Он заключается в следующем:

— изображение последовательно сканируется слева-направо и сверху-вниз;

— для каждой точки изображения анализируется ее окрестность 3x3 (рис. 1);

— проверяются условия:

х(г -1, у +1) л х(г, j +1) л х(г +1, у +1) л х(г -1, у) = 0, х(г, У) = N, если х(г, у) = 1, х(г +1, У) = N, если х(г, у) л х(г +1, у) = 1, х(г -1, У -1) = N, если х(г, у) л х(г -1, у -1) = 1, х(г, у +1) = N, если х(г, у) л х(г, у +1) = 1, х(г +1, у -1) = N, если х(г, у) л х(г +1, у -1) = 1,

где N — номер связной компоненты (объекта).

(4)

х(г-1, у+1) х(г, у+1) х(г+1, у+1)

х(г-1, у) х(1, .0 х(г+1, у)

х(г-1, у-1) х(г, у-1) х(г+1, у-1)

Рис. 1

В результате работы описанного алгоритма получаем изображение, в котором каждому объекту присвоен отдельный номер.

Этап 4. Деление нецелых объектов, т.е. не полностью вошедших в кадр поля зрения.

К настоящему моменту разработаны рекурсивный алгоритм удаления объектов, расположенных по краю поля зрения, и алгоритм удаления объектов по площади [6, 13]. Проведенные исследования показали, что наиболее быстродействующим является первый алгоритм.

Этап 5. Выделение контура. Существует множество алгоритмов выделения контуров бинарных изображений: алгоритм жука [15, 16], алгоритм направленного перебора [5, 16], сканирующий алгоритм [16], рекурсивный метод [4, 16], метод связности [17].

Исследования показали, что наиболее быстродействующим является алгоритм направленного перебора. Контурное изображение формируется следующим образом: для каждой точки изображения анализируется ее окрестность 3х3 (рис. 1).

Точка х(г, у) считается контурной, если выполняются следующие условия:

х(г, у) = 1 и х(г +1, у) л х(г, у +1) = 0, х(г, у +1) = 1 и х(г, у) = 0, х(г +1, у) = 1 и х(г, у) = 0.

(5)

В результате получаем одноточечный безразрывный контур, состоящий из четырех связных точек.

Этап 6. Вычисление центра тяжести объекта, заданного координатами (хц, уц), определяемыми как среднее значение координат (х, у), принадлежащих объекту, в соответствии с уравнениями:

1 т 1 т

=— Е х, уц =—Е у,

т

г=1

т г=1

(6)

где хг, уг — текущие координаты точек контура по оси X и У соответственно; т — число точек контура объекта.

Этап 7. Определение длины объектов. Существует несколько алгоритмов вычисления длины объекта: путем определения длины максимальной хорды; путем вычисления максимального расстояния между двумя параллельными касательными и путем построения выпуклой оболочки объекта и определения максимальной стороны [3, 13, 14, 18]. Наиболее быстродействующим является первый алгоритм, он состоит в следующем. Для каждой точки контура вычисляется расстояние между ней и соседними точками по формулам:

а = Рг[С(X, у X Д ху, уу )], а = ^(ху - X )2 + (уу - у )2 .

Длина объекта есть максимальное значение:

А = тах{аг},

(7)

(8)

где г=1, 2, ..., п — число точек контура.

Этап 8. Поворот объектов. Среди алгоритмов поворота можно выделить основанный на расчете тангенса угла наклона линии длины объекта к оси Х [19]. Однако наиболее быстрым является алгоритм, в котором для поворота объекта на угол а координаты каждой точки объекта пересчитываются в соответствии с формулами:

хн = (х - хц )соб а-(у - уц )б1п а + хц; ун = (у - уц )°08 а-(х - Хц ^п а + уц,

где хн, ун — новые координаты точки, х, у — исходные координаты точки.

х

ц

Предложенная методика, включающая рассмотренные алгоритмы, исследовалась на 100 изображениях реальных плоских объектов. Некоторые объекты и результаты их предварительной обработки приведены на рис. 2.

Исходное изображение

Снижение шума

Бинаризация

Маркировка и удаление нецелых объектов

Выделение контуров, определение центра тяжести, поиск длины

Поворот объектов

Рис. 2

Предложенная методика исследована на изображениях реальных плоских объектов и ее достоинством является простота реализации, быстродействие, которое дает возможность

идентифицировать объекты в СТЗ, работающих в режиме реального времени. Общее время

работы рассмотренных алгоритмов при 5—6 объектах на изображении составляет 120 мс.

СПИСОК ЛИТЕРАТУРЫ

1. Шапиро Л., Стокман Дж. Компьютерное зрение М.: БИНОМ. Лаборатория знаний, 2006. 752 с.

2. Писаревский А. Н. и др. Системы технического зрения (принципиальные основы, аппаратное и математическое обеспечение). Л.: Машиностроение, 1988. 424 с.

3. Мошкин В. И., Петров А. А., Титов В. С., Якушенков Ю. Г. Техническое зрение роботов. М.: Машиностроение, 1990. 272 с.

4. Анисимов Б. В., Курганов В. Д., Злобин В. К. Распознавание и цифровая обработка изображений: Учеб. пособие. М.: Высш. школа, 1983. 295 с.

5. Фурман Я. А. Цифровые методы обработки и распознавания бинарных иображений. Красноярск: Изд-во Красноярского ун-та, 1992. 248 с.

6. Фисенко В. Т., Фисенко Т. Ю. Компьютерные обработки и распознавание изображений: Учеб. пособие. СПб: СПбГУ ИТМО, 2008. 192 с.

7. Сойфер В. А.. Методы компьютерной обработки изображений. М.: Физматлит, 2003. 784 с.

8. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. Кн. 2. 480 с.

9. Otsu N. A threshold selection method from gray-level histograms // IEEE Trans. Syst., Man. and Cybern. 1979. Vol. SMC-9. P. 62—66.

10. Shi J. and Malik J. Normalized Cuts and Image Segmentation // Proc. IEEE Conf. Computer Vision and Pattern Recognotion, 1997. P. 731—737.

11. Kanungo T., Mount D. M., Netanyahu N., Piatko C., Silverman R. and Wu A Y. An efficient k-means clustering: Analysis and implementation // Proc. IEEE Conf. Computer Vision and Pattern Recognotion, 2002. P. 881—892.

12. Хорн Б. К. П. Зрение роботов. М.: Мир, 1989. 487 с.

13. Генкин В. Л., Ерош И. Л., Москалев Э. С. Системы распознавания автоматизированных производств. Л.: Машиностроение, 1988. 246 с.

14. Садыков С. С., Стулов Н. Н. Методы и алгоритмы выделения признаков объектов в системах технического зрения. М.: Горячая линия—Телеком, 2005. 204 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 507 с.

16. Абламейко С. В., Лагуновский Д. М. Обработка изображений: технология, методы, применение: Учеб. пособие. М.: Амалфей, 2000. 304 с.

17. Кормановский С. И., Скорюкова Я. Г., Мельник О. П. Структурно-связностная модель изображения: выделение контура и формирование признаков // Информационные технологии и компьютерная техника. 2010. № 1.

18. Путятин Е. П., Аверин C. B. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320 с.

19. Погорелов А. В. Дифференциальная геометрия. М.: Наука, 1974. 176 с.

Сведения об авторах

Султан Сидыкович Садыков — д-р техн. наук, профессор; Муромский институт Владимирского го-

сударственного университета им. А. Г. и Н. Г. Столетовых, кафедра информационных систем; E-mail: [email protected]

Светлана Владимировна Савичева — аспирантка; Муромский институт Владимирского государственного

университета им. А. Г. и Н. Г. Столетовых, кафедра информационных систем; E-mail: [email protected]

Рекомендована Юго-Западным Поступила в редакцию

государственным университетом 24.10.11 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.