Научная статья на тему 'Краткая характеристика современных методов морфологической обработки полутоновых изображений в среде Matlab'

Краткая характеристика современных методов морфологической обработки полутоновых изображений в среде Matlab Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1024
231
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЗС МАТРИЦА / СИСТЕМЫ КОМПЬЮТЕРНОГО ЗРЕНИЯ / ПРЕОБРАЗОВАНИЕ ЯРКОСТИ / ДИЛАТАЦИЯ / ЭРОЗИЯ / ПРЕОБРАЗОВАНИЕ «ВЕРХ ШЛЯПЫ» / ОПЕРАЦИИ СМЫКАНИЯ И РАЗМЫКАНИЯ / МОРФОЛОГИЧЕСКИЙ ГРАДИЕНТ / ПОЛУТОНОВОЕ ИЗОБРАЖЕНИЕ / IMAGE / FILTERING / REMOTE SENSING / UNDERLYING SURFACE / FUNCTIONAL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шестов Руслан Владимирович, Тамьяров Андрей Валерьевич

В статье представлено описание наиболее распространенных методов морфологической обработки полутоновых изображений, а также представлены примеры использования рассмотренных методов в математическом пакете MATLAB

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шестов Руслан Владимирович, Тамьяров Андрей Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT MORPHOLOGY ANALYSIS IMAGE IN MATLAB

The article presents the morphology analysis of the most famous methods of image in Matlab and its result.

Текст научной работы на тему «Краткая характеристика современных методов морфологической обработки полутоновых изображений в среде Matlab»

УДК 004.9 ББК 30в6

Шестов Р.В., Тамьяров А.В.

КРАТКАЯ ХАРАКТЕРИСТИКА СОВРЕМЕННЫХ МЕТОДОВ

МОРФОЛОГИЧЕСКОЙ ОБРАБОТКИ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ

В СРЕДЕ MATLAB

Shestov R. V., Tamyarov A. V.

ABOUT MORPHOLOGY ANALYSIS IMAGE IN MATLAB

Ключевые слова: ПЗС - матрица, системы компьютерного зрения, преобразование яркости, дилатация, эрозия, преобразование «Верх шляпы», операции смыкания и размыкания, морфологический градиент, полутоновое изображение.

Keywords: image, filtering, remote sensing, underlying surface, filtering, functional

Аннотация: в статье представлено описание наиболее распространенных методов морфологической обработки полутоновых изображений, а также представлены примеры использования рассмотренных методов в математическом пакете MATLAB

Abstract: the article presents the morphology analysis of the most famous methods of image in Matlab and its result.

В настоящее время благодаря бурному развитию компьютерных технологий, программного обеспечения и средств автоматизации все большее значение приобретают системы компьютерного зрения. Системы компьютерного зрения - это системы, которые могут производить дистанционный мониторинг как всей яркостной сцены, так и отдельных ее фрагментов. Данные устройства могут применяться в различных сферах народного хозяйства как в сугубо гражданских целях, так и в военно-промышленном комплексе и аэро-космической области. Системы компьютерного зрения могут не только производить мониторинг яркостной сцены, но и помимо этого использоваться для выделения определенных объектов из яркостной сцены, слежения за этими объектами, распознавания данных объектов, а также для анализа их геометрических размеров. Довольно ярким примером использования систем компьютерного зрения является их применение для решения задач контроля геометрических размеров промышленных деталей и задач, где необходимо определить пройденное объектом расстояние и его среднюю скорость в пути. Для решения задачи определения пройденного объектом пути довольно часто используют систему, состоящую из двух ПЗС-матриц,

установленных друг за другом и жестко закрепленных на фиксированном расстоянии, при этом каждая из камер обладает определенной частотой съемки, но частоты съемки этих устройств должны совпадать, то есть каждая из камер будет производить одинаковое количество кадров в единицу времени. Таким образом, в результате анализа полученных с камер изображений будут получены кадры одного и того же пути, пройденного объектом, однако между ними будет существовать смещение, обусловленное расстоянием между ПЗС-матрицами. Таким образом, производя сведение изображений, полученных от каждой из камер, становится возможным определить пройденный объектом путь, а также впоследствии и его среднюю скорость.

Из анализа вышеописанного следует, что системы компьютерного зрения являются одними из основных подсистем, входящих в состав современных автоматизированных и автоматических систем.

Несмотря на все достоинства систем компьютерного зрения, у них есть ряд существенных недостатков, основными из которых являются высокая чувствительность к освещению при решении ряда задач, например определении геометрических размеров детали, а также довольно сложное устрой-

ство. Помимо этого существенным недостатком систем компьютерного зрения является необходимость осуществления довольно большого количества подготовительных операций, необходимых для качественной обработки изображений на пиксельном уровне. Данное явление обусловлено рядом причин, основными из которых являются:

- невозможность соблюдения одинакового уровня освещенности объекта или подстилающей поверхности, зондирование которой осуществляется в данный момент времени;

- другая причина обусловлена тем, что при формировании одного и того же изображения яркостного объекта идентичными системами съемки невозможно получить абсолютно одинаковую пару снимков.

Причина описанного выше явления объясняется тем, что при производстве основных элементов систем получения ярко-стной сцены - ПЗС-матриц, невозможно получить устройства, демонстрирующие одинаковые результаты.

ПЗС - матрицы - это датчики, основной задачей которых является преобразование спроецированного на них оптической системой изображения и преобразование его в цифровую форму удобную для дальнейшей обработки. Современные ПЗС-матрицы являются приборами с зарядовой связью. Помимо ПЗС-матриц существуют также КМОП-матрицы, изготавливаемые на основе комплементарных металооксидных полупроводников (КМОП).

КМОП-матрицы, в настоящее время, не достигают уровня ПЗС-формирователей изображения, особенно при низкой освещенности, ввиду этого более широкое распространение получили ПЗС-матрицы.

Данная матрица состоит из большого числа фоточувствительных элементов. Основной задачей ПЗС-матрицы является накопление электрических зарядов, сгенерированных поглощенными фотонами. В результате заряд, накопленный ПЗС-матрицей, пропорционален освещенности. На этапе считывания данные заряды передаются на дальнейшую обработку ив результате преобразуются в электрическое напряжение. Таким образом разница казалось бы одинаковых для глаза пар изобра-

жений обусловлена тем, что во время формирования изображения в момент накопления заряда и передачи его на обработку на этот заряд действует большое количество шумов (например дробовый шум), уровни которых в различных ПЗС-матрицах различны. Таким образом, можно сделать вывод о том, что в результате использования двух идентичных ПЗС-матриц в принципе невозможно получить одинаковые, с точки зрения технической системы, изображения. Помимо этих двух факторов на оптическую систему и устройство формирования изображения действует еще довольно большое количество возмущений, природа возникновения которых довольно широка. Данные возмущения также вносят негативный вклад в процесс формирования изображения на всех его стадиях, начиная от проецирования его оптической системой на ПЗС-матрицу и заканчивая его конечной обработкой информационной системой.

Таким образом, как уже было отмечено выше, прежде чем приступать к решению конкретной задачи, поставленной перед системой компьютерного зрения, необходимо произвести ряд операций над полученными изображениями, то есть необходима предварительная обработка исследуемого изображения.

В настоящее время наиболее распространенным методом обработки изображений является обработка в пространственной и частотной областях. Обработка в пространственной области включает в себя различные методы преобразования яркости и контрастности, а также пространственную фильтрацию. Обработка в частотной области включает в себя различные виды фильтрации в соответствующей области. Однако все эти меры относятся к низкоуровневой обработке изображений. Для решения ряда задач, формируемых перед системами компьютерного зрения, необходимо обрабатывать изображение не только на низком уровне, но и на более высоком. К таким методам обработки относятся морфологическая обработка изображения и сегментация.

Особенностями методов морфологической обработки изображения и сегментации является то, что выходом процессов обработки является не само обрабатываемое

изображение, а его описательные атрибуты, в отличие от низкоуровневой обработки, где выходом операции являлось то же изображение что и на входе, с рядом откорректированных характеристик в зависимости от используемого метода.

Суть морфологической обработки изображения заключается в извлечении определенных компонентов изображения необходимых для представления и описания их геометрических форм. К таким признакам чаще всего относятся границы, остовы или различные выпуклые оболочки.

Основными операциями морфологической обработки изображения являются операции дилатации и эрозии (рисунок 1). Большинство алгоритмов средне- и высокоуровневой обработки изображения базируются на операциях дилатации и эрозии.

Суть операции дилатации заключается в «наращивании» или «утолщении» объектов на изображении. Для решения данной задачи используется определенная форма, называемая структурообразующим элементом. Сам по себе структурообразующий элемент представляет собой матрицу из нулей и единиц, которая в результате выполнения процедуры дилатации перекрывает определенную область изображения и заполняет ее.

В пакете IPT процедура дилатации выполняется при помощи команды imdilate, имеющей следующий синтаксис: A2 = imdilate(A, B), где A - изображение, подвергаемое преобразованию, а B - структурообразующий элемент

Таким образом, при использовании процедуры дилатации особое внимание необходимо уделять форме структурообразующего элемента ввиду того, что именно от формы структурообразующего элемента в конечном итоге будет зависеть результат процедуры. Однако пакет IPT помимо команды imdilate поддерживает команду strel, которая автоматически строит структурообразующий элемент. Синтаксис команды выглядит следующим образом:

Se = strel(shape, parameters),

где Shape - строка обозначающая форму структурообразующего элемента, а Parametrs - строка, где задается список параметров, уточняющих информацию о его форме.

Ниже представлен программный код, реализованный в приложении IPT математического пакета MATLAB, демонстрирующий применение процедуры дилатации.

Рисунок 1 - Программный код, демонстрирующий использование процедуры дилатации

в г

Рисунок 2 - Изображения, полученные в результате использования процедуры дилатации а) исходное изображение, б) изображение, полученное при использовании структурообразующего элемента типа квадрат со стороной 2 пикселя, в) изображение, полученное при использовании структурообразующего элемента типа квадрат со стороной 1 пикселя, г) изображение, полученное при использовании структурообразующего элемента типа

квадрат со стороной 3 пикселя

Из анализа полученных изображений (рисунок 2) становится очевидным, что в результате использования процедуры дила-тации происходит увеличение контрастности изображения и выделение светлых областей, причем степень размытости изображения зависит от геометрической величины стрктурообразующего элемента, то есть, проще говоря, использование процедуры дилатации имеет смысл только в том случае, если необходимо выделить светлые символы на черном фоне, при этом в случае использования структурообразующего элемента с большими геометрическими размерами велик риск получить сильно размытое изображение, не пригодное к дальнейшей обработке.

Помимо процедуры дилатации при морфологической обработке изображений широко используется процедура эрозии. Процедура эрозии «ужимает» или «утонча-

ет» объекты изображения. Рассматриваемая процедура является антиподом процедуры дилатации, то есть если при использовании процедуры дилатации происходит выделение светлых областей изображения, то при процедуре эрозии, наоборот, приоритет получают темные области. Для использования процедуры эрозии в приложении IPT математического пакета MATLAB используется команда imerode, имеющая следующий синтаксис:

A2 = imerode(A, Б),

где А - изображение, подвергаемое преобразованию, а Б - как правило, переменная функции $1:ге1.

Программный код, демонстрирующий использование процедуры эрозии, представлен на рисунке 3, а результаты, полученные в ходе исследования, представлены на рисунке 4.

Рисунок 3 - Программный код, демонстрирующий использование процедуры эрозии

б в

Рисунок 4 - Изображения, полученные в результате использования процедуры эрозии а) исходное изображение, б) изображение, полученное при использовании структурообразующего элемента типа квадрат со стороной 1 пикселя, в) изображение, полученное при использовании структурообразующего элемента типа квадрат со стороной 2 пикселя, г) изображение, полученное при использовании структурообразующего элемента типа

квадрат со стороной 3 пикселя

Помимо этого процедуры дилатации и эрозии возможно сочетать. Наиболее ярким примером является нахождение морфологического градиента (рисунки 5,6). Нахождение морфологического градиента позволяет выделить контуры объектов, присутствую-

щих на изображении. Сам по себе морфологический градиент определяется как разность между изображениями, полученными в результате дилатации и эрозии соответственно.

Рисунок 5 - Программный код, реализующий задачу нахождения морфологического

градиента

Л л. »Л*-»

яШ&Ш***. ■ ¿но1 Г1 Ш - <

«ТМЛг'Ч. •

г/' ' '' !■. '

бят* : л ■*>

. У .. ; . • Л/

..Су' «

V,:; л; . '

б

Рисунок 6 - Изображения, полученные в ходе определения морфологического градиента а) исходное изображение, б) морфологический градиент

а

Из анализа полученных изображений становится очевидным, что в результате определения разности между изображениями, подвергнутыми процедурам дилатации и эрозии, было получено изображение с выделенными контурами, называемое морфологическим градиентом.

Помимо операций дилатации и эрозии при морфологической обработке изображений важное значение имеют процедуры размыкания и замыкания. Данные процедуры используются для решения широкого

спектра задач, одними из которых являются задачи очистки от пограничных объектов и реконструкции. Процедуры размыкания и замыкания служат для работы с фоном изображения и позволяют выделять необходимые элементы от фона изображения. Почти всегда при работе с изображениями возникает проблема «разности» двух одинаковых на первый взгляд изображений. Для решения данной задачи возможно использовать преобразование называемое «верх шляпы».

Рисунок 7 - Исходное изображение, подвергаемое процедуре размыкания

Суть данного преобразования заключается в нахождении разности между изображением, полученным за счет проведения размыкания и исходным изображением. На рисунке 7 представлено изображение зерен риса. Из анализа изображения является очевидным, что фон нижней части изображения более темный чем верхней части. Данная особенность может послужить серьезным сдерживающим фактором при решении ряда задач. Для решения данной проблемы предлагается произвести размыкания элементов изображения на переднем плане от фона путем использования преобразования

«верх шляпы».

Для использования преобразования «верх шляпы» применяется команда ¡т!орИа!, имеющая следующий синтаксис: а = ¡т1;орка1;( Бе );

где { - изображение, над которым проводится операция,

Бе - переменная функции 81хе1, описывающей структурообразующий элемент.

Программный код, реализующий задачу преобразования «верх шляпы», а также полученные результаты представлены на рисунке 8.

Рисунок 8 - Программный код, реализующий преобразование «Верх шляпы»

ПЩГс

-?Л V' 1

Рисунок 9 - Результат выполнения программного кода, представленного на рисунке 8

Из анализа, представленного на рисунке 9 изображения, становится очевидным, что в результате выполнения преобразования «верх шляпы» произошло выравнивание цветовой гаммы изображения и фона изображения. Для более четкого выделения зерен, представленных на переднем фоне, необходимо произвести операцию пороговой обработки.

Заключение

Основной задачей сегментации является задача выделения интересующих объектов из изображения, то есть сегментацию

следует выполнять до тех пор, пока не будут выделены интересующие объекты. Наиболее ярким примером, где может использоваться процедура сегментации, является область микроэлектроники, где в ряде случаев невозможно производить визуальный контроль качества сборки тех или иных элементов без использования специальных средств. На сегодняшний день все алгоритмы сегментации монохромных изображений основаны на двух свойствах яркости изображения: разрывности и однородности.

При использовании алгоритма, в основе которого лежит свойство разрывности,

подход состоит в разбиении изображения на части исходя из перепадов значений яркости. В случае использования алгоритма, в основе которого лежит однородность изображения, разделение изображений на области осуществляется за счет заранее заданных критериев.

Из результатов проведенного анализа методов морфологической обработки полутоновых изображений становится очевидным, что для успешного решения ряда за-

дач, формируемых перед системами компьютерного зрения, необходимо использование широкого комплекса методов, реализуемых в настоящее время с использованием всех возможных настроек, предоставляемых этими методами. Таким образом, для достижения приемлемого результата в каждом конкретном случае необходимо большое количество эмпирических исследований.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК:

1. Гонсалес, Р., Вудс, Р., Эддинс, С. Цифровая обработка изображений в среде MATLAB. - М.: Техносфера, 2006. - 616 с.

2. Шредер, Г., Трайбер, Х. Техническая оптика. - М.: 2006. - 424 с. ISBN 5-94836-075-x.

3. Яне, Б. Цифровая обработка изображений. - М.: Техносфера, 2007. - 584 с.

4. Визильтер, Ю.В., Желтов, С.Ю., Князь, В.А., Ходарев, А.Н., Моржин, А.В. Обработка и анализ цифровых изображений с примерами на LabVIEW IMAQ Vision. - М.: ДМК Пресс, 2007. - 464 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.