Научная статья на тему 'Сегментация изображений и выявление контуров объектов на основе генетических алгоритмов'

Сегментация изображений и выявление контуров объектов на основе генетических алгоритмов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1423
192
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Барлит А. В., Нужнов Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сегментация изображений и выявление контуров объектов на основе генетических алгоритмов»

2. Goldberg David E. Genetic Algorithms in Search, Optimization and Machine Learning. USA: Addison-Wesley Publishing Company, Inc., 1989.

3. Koza J.R. Genetic Programming. Cambridge/MA:MIT Press, 1998.

4. Курейчик В.М., Лебедев П.К., Лях А.В. Проблемы эволюционной адаптации в САПР, Новинтех. №3. 1991.

УДК 321.3

А.В. Барлит, Е.В. Нужное

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ И ВЫЯВЛЕНИЕ КОНТУРОВ ОБЪЕКТОВ НА ОСНОВЕ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ*

Введение. Обработка, анализ и отображение (синтез) изображений являются важнейшими задачами систем переработки визуальной информации, образующих отдельное направление искусственного интеллекта. В отличие от собственно обра-

,

форме, а также синтеза, когда по входному описанию строится изображение, анализ представляет собой интерпретацию, распознавание или «понимание» изобра-, , в виде некоторого его описания [1].

Задача компьютерного анализа изображений становится все более актуальной, т.к. находит применение в столь востребованных областях как медицина, гео-

, , , по разным причинам не ставилась. В число задач низкоуровневого анализа изображений входят сегментация изображений и выявление контуров объектов. Известные подходы к их решению обладают значительной временной сложностью и требуют подбора параметров для каждого подкласса изображений рассматривае-. -ционным методам на основе механизмов генетического поиска решений значительно выросли [2-6]. Некоторые полученные результаты [2] превосходят результаты применения традиционных методов анализа изображений, например, на основе нейронных сетей.

В настоящей работе рассматриваются вопросы построения генетических алгоритмов (ГА) для решения задач сегментации и выявления границ контуров на

изображениях: представления целевой функции, кодирования и декодирования

.

, -

.

1. Задача сегментации изображения. Данная задача решается на начальной стадии процесса анализа изображений и она заключается в разделения исходного ( ), : , , -стуры и т.д. (чаще всего используются черно-белые изображения с 8-битной града). -

ки монохромных фотографий - протяженность и схожесть. В первом случае алго-

* Работа выполнена при поддержке Мин. образования, грант № Е02.2.0-44 и РФФИ, грант № 03-01-00336

ритм реагирует на резкие изменения уровня серого цвета. Основные алгоритмы второго класса базируются на пороговой классификации, возрастании размеров регионов и разбиении/объединении областей. Большинство известных подходов требует наличия набора приблизительных параметров для решения неясно сфор-.

конкретного класса изображений и трудно решаема. Применение ГА позволяет избежать стадии априорного параметрического построения. Одним из приложений , , -ленное число областей к, а на выходе мы должны получить набор регионов мощностью п:

а1 е /да§", г = 1,К; а1 и а2 и... и ак = а1 п ат = 0 VI Ф т; (1)

Ь] е /mg, у = 1,N; Ь1 и Ь2 и... и Ьы = 1т§; Ь1 п Ьт = 0 VI Ф т,

где - элемент начального разбиения на подмножества, Ь, - элемент конечной сегментации, Img - исходное изображение, характеризующее область поиска.

Большинство алгоритмов сегментации может быть отнесено к одной из трех групп [3]: основанных на контурах; на кластерах; на регионах.

Последняя группа включает в себя алгоритмы, основанные на возрастании , , -/ . / -

(1)

дальнейшими попытками объединения и/или разбиения. Задачей ГА является получение «хорошего» или «удовлетворительного» решения на основе вышеописан-. -рования отжига [3].

С задачей низкоуровневой сегментации связаны две фундаментальные проблемы, требующие обязательного решения [3]:

• Большинство результатов сегментации является не всегда четким и кор-

- , также пространственной неформализованное™.

, . , , сегментации новых изображений. Задача построения такого набора является отдельной сложно решаемой проблемой.

Известен ряд подходов, которые используют ГА для подбора соответствующих параметров или для выявления ассоциативности регионов [3, 6]. Но, несмотря

, , существует несколько ключевых проблем повышения производительности, в том числе: исключение сложной предварительной обработки; простое кодирование и ; ; .

С учетом приведенных замечаний для решения задачи сегментации изображений предлагается использовать следующий комбинированный подход: разделение изображения на области с помощью алгоритма анализа перепадов яркости с последующим их объединением с помощью ГА. С целью увеличения скорости вычислений целесообразно уменьшить длину хромосом в ГА. Для этого предлагается применить вышеупомянутый метод моделирования отжига. При формировании целевой функции были учтены следующие требования и возможности:

• ;

• ;

• , ;

• ;

.

ГА представляет собой адаптивную процедуру поиска решения в порядке возрастания значений некоторой целевой функции, используя коллекцию точек в пространстве решений, известную как популяция [7]. Применительно к рассматриваемой задаче существует два вида целевых функций - пространственная и непространственная [3]. Непространственная функция качества решения широко применяется для рассмотрения колебаний характеристик и гистограмм за исключением геометрической информации в изображениях. Пространственная целевая функция применительно к обработке изображений рассматривает расположение пикселей и их геометрические свойства. Она оценивает плотность пикселей, обладающих определенными свойствами по отношению к их соседям, и показывает гомогенность .

- (1), аг -

(1=1,2,..., К). Регион характеризуют следующие свойства: т{ - средний уровень серого цвета в регионе а; а2 - разница в уровне серого цвета в пикселях региона а; Р - число пикселей в регионе а; щ - число регионов, смежных с регионом а{ . Известны три основных функции оценки качества решения, учитывающие :

1) Средний уровень серого в регионе (^). Это наиболее значимая характеристика для вычисления различия между смежными регионами 1 и Чем больше эта , :

2) Разница в уровне серого цвета (^). Данная величина применяется для вычисления схожести областей. Чем она меньше, тем более различны регионы. ¥2 вычисляется по следующей формуле:

к

г, 1 =1; г Ф1

3) Размер региона (Ж3). В технологии слияния/раделения основной является тенденция объединения регионов. Следующая функция должна стремиться к мак:

В первую очередь, целесообразно вычислять функцию различия Е1 (2). Сегмент аг наиболее похож на сегмент а, если значение ^1(/,_/') является наименьшим из вектора Е1(г,к) (к = 1,2,., п; щ - половина квадрата числа сегментов на итерации /). Так как цель сегментации - разбиение изображения на различные регионы, чьи характеристики схожи, то наилучший в вышеупомянутом контексте регион аг

а1.

С учетом вышеописанных рассуждений в ГА предлагается реализовать сле-.

^(у) = |т,- - т/.

(2)

(3)

(4)

Кодирование хромосом. Предлагаются структура и принципы кодирования , -, . -ние, смысл и обоснование которого подробно описаны в [6]. Предположим, что число регионов после разбиения равно N. Пример структуры хромосомы представлен на рис.1.

1 2 З 4 б б 7

о о 1 1 о 1 о

Рис.1. Пример структуры хромосомы

Изображение, разбитое на сегменты с указанием направлений слияния, показано на рис.2, а. Результат объединений, соответствующий хромосоме ^ІЮЮ», показан на рис.2, б.

Рис.2. Пример сегментации изображения до и после соответствующего слияния

«1» , «0» - . -

жести основана на формуле (2). Данный метод кодирования гарантирует, что объединение регионов приводит только к легальному решению.

. / пиксели смежных регионов, а так же различие данных сегментов. Целевая функция имеет следующий вид:

1 N

= Т7 Ко *Ръ(г, у)) . (5)

Л ',]'; гФ]

Модификации основных генетических операторов (селекции, кроссинговера, мутации и других) необходимо подбирать в зависимости от конкретной области .

2. Задача определения контуров объектов. Эта задача является более трудоемкой и обладает большим числом параметров, чем предыдущая. В качестве примера рассмотрим задачу, постановка которой представлена в [2]. В этой работе авторы предлагают распознавать контуры структур внутри тонких срезов минералов для дальнейшей их идентификации. Для получения данных фотографий использовался петрографический микроскоп с вращающимся поляризатором.

Каждому пикселю после применения описанных в [2] фильтров соответствует следующий набор параметров, выделенных авторами (обозначения сохранены):

• Градиент (p1). Данный параметр важен, в первую очередь, для обнаружения границ зерновых структур. Оператор градиента, сравнивающий интенсивность пикселя по отношению к соседям в горизонтальном и вертикальном направлениях, применим для всех изображений. Для каждого пикселя максимальное значение градиента добавляется в массив возрастания градиента, собирающий информацию со всех фотографий, полученных в ходе полного, 180-градусного вращения поляризатора. Градиент в визуально наблюдаемых границах между зернистыми структурами выше, чем аналогичный показатель внутри таковых структур. После этого общий массив градиента масштабируется по шкале 8 бит, со значениями от 0 до 255. Это выглядит как изображение с палитрой градаций серого цвета, где высокие/яркие значения передают границы зерен, в то время, как низкие/темные области соответствуют внутренним зонам.

• Положение максимума (p2). Данный параметр фиксирует ориентацию поляризационного фильтра в момент, когда интенсивность пикселя достигает максимального и минимального значения. Для вращения поляризатора на 180 градусов, значение параметра находятся в диапазоне 1-200, так как пиксель может достигнуть своего максимального или минимального значения на любом из 200 шагов вращения фильтра. Значение данного параметра также представлено в виде изображения с 8-битной палитрой градаций серого цвета.

• Максимальная интенсивность (p3, p4, p5). Значение максимальной интенсивности передается цветом максимальной интерференции в пределах зернистой структуры по ходу вращения поляризатора на 180 градусов. Интенсивность пикселя вычислена с использованием значение интенсивности в цветовой системе HIS (Тон, Насыщенность, Интенсивность). Для цветных изображений значение интенсивности вычисляется как среднее арифметическое трех цветовых составляющих - красной, зеленой и синей.

В таблице 1 представлен список параметров, участвующих в вычислениях.

1

Операторы и функции, участвующие в вычислениях avg, amin, amax, sdev, min, max, -, +, *, /

Выходные величины

Все данные имеют два типа представления - целочисленный (int) и с плавающей запятой (float). Стандартная функция sdev вычисляет стандартное отклонение матрицы точек, окружающих текущий пиксель:

$йеу = {у‘ а) , (6)

V П

где V - значение входного параметра матрицы, а - среднее значение по области матрицы и п - число пикселей в матрице.

Стандартные функции атт и атах вычисляют максимальное и минимальное значение в заданной области, в то время, как стандартная функция avg вы чис-

ляет среднее значение в этой же области. С отмеченными операциями также связан целочисленный параметр - размер матрицы подсчета, например 5x5 или 9x9 (размер должен быть нечетным, т.к. в центре матрицы находится рассматриваемый пиксель).

Общая идея алгоритма заключается в следующем. Имеется некий набор изображений для обучения. Эксперт сам устанавливает для каждого пикселя в данном наборе - является ли данный пиксель границей или нет. Затем необходимо произвести подбор вышеперечисленных параметров так, чтобы в результате мы получили дерево решений, корнями которого являлись бы бинарные значения «вляется ли пиксель границей или нет». При отборе изображений для обучения использована стратегия квазислучайной выборки. Критерий при выборке состоит в том, чтобы из каждого изображения была возможность выбора набора пикселей для обучения, содержащего примерно одинаковое число пикселей из следующих четырех классификационных групп:

• группа 1 - пиксели, находящиеся в граничной области недалеко от пика границы (все такие пиксели в выходном изображении классифицируются как граница);

• группа 2 - пиксели, принадлежащие границе, но некоторые из окружающих их пикселей не могут быть классифицированы как принадлежащие границе;

• группа 3 - пиксели, смежные границе;

• группа 4 - пиксели, не принадлежащие границе и не смежные ей.

Данная классификация имеет следующее логическое объяснение. Критические случаи обучения происходят либо внутри области границы, либо возле нее, и введенные классификационные группы использованы для идентификации таких трудностей. Кроме того, так как большинство пикселей на изображении принадлежат внутренней области зерновых структур, данная классификация позволяет операции выборки избежать излишнего выбора из таких регионов. Данная ситуация является стандартной для оценки правильности идентификации. В данном случае обычно перемножаются относительные величины правильно идентифицированных пикселей двух подклассов. Исходя из этого, целесообразно использовать следующую целевую функцию:

Fitness = 1 -

г се спл — * —

^ tе Ш )

(7)

где се - число правильно идентифицированных пикселей, принадлежащих контурам; 1е - общее число пикселей, принадлежащих этому классу; еп - число правильно идентифицированных пикселей во внутренней области регионов зерновых структур; М - общее число таковых пикселей.

Задача ГА состоит в том, чтобы подобрать параметры для функций, формирующих классификацию пикселя. Как было показано выше, данная задача обладает большим числом параметров, как целочисленных, так и с плавающей запятой. В данной ситуации ГА являются наиболее релевантным инструментом для получения корректного удовлетворительного решения за ограниченный промежуток времени.

.

решению некоторых задач анализа изображений. Универсальность механизмов ГА позволяет получать решения удовлетворительного качества с высоким постоянст-

вом, что не обеспечивают другие подходы [2]. Некоторые из важных проблем в низкоуровневой обработки изображений - это задача сегментации, рассмотренная в первой части статьи, и задача выявления контуров объектов, описанная во второй части. Несмотря на несхожесть этих задач, удалось сформулировать критерии, определить целевые функции и предложить рациональный метод кодирования хромосом для каждой из них. В дальнейшем планируется получить экспериментальные данные для тестовых изображений, участвовавших в обучении и для набора .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Искусственный интеллект: В 3 кн. Кн.1. Системы общения и экспертные системы: Справочник / Под ред. Э.В. Попова. М.: Радио и связь. 1990. 464с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Brian J. Ross, Frank Fueten Dmytro, Y. Yashkir. «Edge Detection of Petrographic Images Using Genetic Programming». GECCO 2000, pp. 658-665.

3. Shinn-Ying Ho, Kual-Zheng Lee. «A Simple and Fast GA-SA Hybrid Image Segmentation Algorithm». GECCO 2000, pp. 718-724.

4. Simon C. Roberts, Daniel Howard. «Genetic Programming for Image Analysis: Orientation Detection». GECCO 2000, pp. 651-657.

5. Patrick Chiu etc. «A Genetic Segmentation Algorithm for Image Data Stream and Video». GECCO 2000, pp. 666-675.

6. Harris C., B. Buxton. «Evolving Edge Detectors with Genetic Programming». Genetic Programming» 1996. MIT Press, pp. 309-314.

7. Методы генетического поиска/ Под ред. В.М. Курейчика. Таганрог: Изд-во ТРТУ. 2002. "

УДК 004.3

Л.Г. Комарцова

ИССЛЕДОВАНИЕ КОНСТРУКТОРА ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ

. , -

тических алгоритмов [Курейчик, 1999; I.Chambers, 1999]. Для решения задач оптимизации разработано большое количество возможных вариантов их реализации. При решении реальных задач необходимо конструировать такой генетический ал-( ), -пени учитывал бы специфику каждой конкретной области использования ГА. Поэтому актуальной проблемой является создание Конструктора ГА, помогающего пользователю выбирать параметры алгоритма и настраивать его на решение опре.

1. . -

руктора является возможность применения средств ГА для выбора параметров ГА, используемого при решении определенной оптимизационной задачи. В [Комарцова, 2001; Комарцова, 2000] автором были предложены алгоритмы обучения нейронной сети (НС) и поиска конфигурации компьютерной сети на основе ГА, а также разработаны некоторые новые генетические операторы для этих алгоритмов. В процессе функционирования ГА осуществляется "естественный отбор" и реализуется направленный поиск хромосом, которые являются ценными в смысле задан-

i Надоели баннеры? Вы всегда можете отключить рекламу.