V V Bukhtoyarov, E. S. Semenkin
INTEGRATED EVOLUTIONARY APPROACH FOR NEURAL NETWORK ENSEMBLES AUTOMATIC DESIGN
New comprehensive approach for neural network ensemble design is proposed. It consists of method for neural networks automatic design and method for ensemble decision automatic construction. It is demonstrated that proposed approach is not less effective than other approaches for neural network ensemble design.
Keywords: neural networks, ensemble, automatic design, genetic programming, probability-based evolutionary algorithm.
©БухтояровВ. В., Семенкин Е. С., 2010
УДК 004.932
И. Н. Паламарь, П. В. Сизов
МЕТОД СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ С ПРИМЕНЕНИЕМ ВЫРАЩИВАНИЯ ОБЛАСТЕЙ И МНОГОМАСШТАБНОГО АНАЛИЗА
Анализируются достоинства и недостатки существующих методов сегментации изображений. Ведется разработка оригинального алгоритма сегментации, использующего идеи метода выращивания областей и многомасштабного анализа. Проводится исследование возможностей предложенного подхода при сегментации разнотипных изображений.
Ключевые слова: сегментация, изображение, выращивание, вейвлет.
Сегментация, т. е. выделение однородных областей на исходном цифровом изображении, является одной из наиболее важных задач в системах машинного зрения, которые применяются во многих научно-технических и производственных отраслях: медицине, металлографии, аэрофотосъемке, робототехнике, дефектоскопии, системах безопасности и охраны правопорядка и др. Именно на данном этапе обработки происходит преобразование изображения из вида, характеризуемого совокупностью пикселов, в форму множества сегментов, пригодную для дальнейшего распознавания объектов сцены.
На данный момент существует масса формализованных методов сегментации [1], которые по основному принципу работы можно условно разделить на две группы:
- методы, первоначально выделяющие границы областей (контуры) как перепады какого-либо признака изображения;
- методы, выделяющие области (сегменты) по однородности на них определенного признака.
К первой группе следует отнести методы, вычисляющие первую и вторую производные функции изображения с помощью различных масок (операторы Робертса, Превитта, Собела, Лапласа, Марра-Хилдрет и др.), дополняемые методами связывания контуров (локальное связывание, преобразование Хафа (Hough), анализ с помощью теории графов). Проблемой данных методов определения контуров является несвязность получаемых границ объекта, что неудивительно, так как алгоритмы, находящиеся в основе сегментации не настроены на получение связных, замкнутых контуров, а методы связы-
вания, являясь надстройкой для данных алгоритмов, позволяют решить проблему ценой больших вычислительных затрат.
К методам сегментации, объединенным в рамках второй группы, прежде всего можно отнести пороговое преобразование. Данный метод, получивший широкое распространение благодаря своей простоте и понятным свойствам, несмотря на различные усовершенствования, имеет недостаток, присущий и указанным методам определения контуров - неиспользование информации о связности сегментов. Этого недостатка лишены методы выделения областей, изначально построенные так, чтобы получать связные области, удовлетворяющие некоторому критерию однородности: выращивание областей, разделение и слияние областей, сегментация по морфологическим водоразделам.
Метод выращивания областей в простейшей его реализации можно описать так:
1) на исходном изображении выбираются точки (центры кристаллизации), предположительно принадлежащие выделяемым областям, например, это могут быть точки с максимальным уровнем яркости;
3) далее из этих точек начинается рост областей, т. е. присоединение к уже имеющимся точкам области соседних, при этом используется определенный критерий их близости, например, разница в яркости;
4) остановка роста областей по какому-либо условию, например, максимальному отклонению яркости новых точек области от уровня яркости центра кристаллизации.
Как видно из описания, данный алгоритм учитывает связность областей и на практике позволяет гораздо ус-
пешнее решать многие задачи, где до этого применялось пороговое преобразование. Недостатком здесь является возросшая вычислительная сложность, а основную труд -ность составляет поиск центров кристаллизации и определение момента окончания роста областей.
Из данного представления методов сегментации следует вывод о необходимости использования информации о связности сегментов (или контуров) при выделении областей. Перспективной идеей здесь видится модификация метода выращивания областей с целью получения полной сегментации, а не просто отделения выбранных объектов от фона.
Определим требования к проектируемому методу сегментации. Новый метод должен:
- обладать высокой точностью и достоверностью при выделении областей, работать на достаточно сложных для сегментации изображениях;
- выполнять полную сегментацию изображения;
- выделять связные однородные области;
- использовать помимо яркостной также текстурную информацию;
- иметь высокий уровень автоматизации, сводящий к минимуму вмешательство оператора в процесс сегментации.
Для описания операций метода сегментации сначала необходимо определиться со способом представления исходных данных. Оригинальное изображение зададим вектор-функцией f (x, y), определенной на двумерном пространстве целых чисел как f (x, y) = px, y, где вектор p = \pR, pG, pB] определяет значение цвета пиксела в трехмерном цветовом пространстве RGB.
Прежде всего необходимо универсально решить проблему поиска центров кристаллизации. Свойство центров роста находиться внутри однородных областей подсказывает выбор способа их нахождения - дифференциальное преобразование. Тогда на преобразованном изображении точки локальных минимумов будут соответствовать точкам с наименьшим изменением уровня яркости в окрестности, т. е. центрам кристаллизации. Для большинства применяемых в таком случае преобразований (по Превитту, Собелу и др.) окрестность дифференцирования распространяется не далее одного пиксела. Однако для выделения большей информации о вариациях значений пикселов вблизи сканируемой точки можно использовать многомасштабное представление ближайшей окрестности, применив идеи вейвлет-преобразования.
Как известно, вейвлет-анализ изображения состоит в представлении оригинала в виде двух пирамид: приближений и деталей, отображающих локальные изменения изображения на разных масштабах. Отсюда следует, что, используя вейвлет-детали, можно выделить информацию о поведении функции изображения в окрестности исследуемой точки на разных масштабах (частотах), а не на единственном верхнем уровне, как в дифференциальных операторах. При этом должен быть применен способ фильтрации с плавающей маской, где для каждой точки изображения полностью рассчитываются вейвлет-дета-ли ее окрестности.
Итак, с каждым пикселом можно связать некоторую окрестность на исходном изображении (рис. 1), по кото-
рой будут рассчитаны коэффициенты многомасштабного анализа.
Рис. 1
Тогда для выбранной точки изображения можно рассчитать несколько значений детализации (на рис. 1 - три), число которых определяется уровнем преобразования. Для более глубокого уровня анализа используется буль-шая окрестность. Но, как видно из примера, эта окрестность покрывает лишь один квадрант в области пиксела. Остальные квадранты перекроем путем отражений шаблона преобразования и получим количественную меру изменчивости функции изображения на определенном масштабе (назовем ее вейвлет-статистикой) как сумму К = КУ + ^ + + ^, где / - уровень анализа; VХ'у , ;'ху , ;'хУ'', V у'' - составляющие вейвлет-статис-тики, рассчитанные в четырех квадрантах окрестности базовой точки. Эти слагаемые отличаются направлением своего расчета на плоскости изображения. Для их определения введем вспомогательный вектор среднего значения 1-го уровня на квадрате пикселов со стороной 2 /, рассчитываемый по рекуррентным формулам
-IV,/ _ ,—у ft-IV,/-1
mwx y = M \ {mwx.
= M
У + 2/ -
x, y-2-
'.M }
+ 2/-1, y +2/ -1 )
[,/-1 | b 2/-1, y-2/-1 )
-II / — f (-II-/-1 -II-/-1 -II-/-1 -II-/-1 |
mwxy = M l{mwx,y , mwx-2-1,y, mwxy-2,-1, mwx-2,-1,y-2,-1}
-1,/ i~,f\-1,/-1 -1,/-1 -1,/-1 -1,/-1 )
mwx.y = M\ {mwx,y , mwr 2i-1 y, mwxy+2/-1, mwx-2/-1,y+2/-1}
-2'-1, y
_ шмвх;0 = рх, у, 2={I, II, ш, IV},
где М - оператор расчета средней точки в трехмерном КОБ-пространстве на множестве Р = { р1, р2, ..., ры }.
Теперь, используя данные формулы, можно описать расчет составляющих вейвлет-статистики для 1-го масштаба как
™ 1 ^ I-IV.' -IV,'-1 \ I-IV,/ -IV,/-1 \
; ' = Щшм>х,у , шм /-1 + Б (ШМху , шм /| +
х,У \ ' х+2 ,у I \ ' х,у+21-1/
+ D
i-IV,/
I mwxy ,
mw
-IV,/-1
x + 2/-y + 2/-
■ )■
ттт , I-Ш,/ -Ш,/-
V:ry; = D (mwx,y, mw /
x,y \ x+2'
1 y ) + D (
Ш,/ -Ш,/-
mwx y, mw , , I +
x, y -2/
_2l-l ) "
I-IV,/ -IV,/-, \
+ D (mwx,y , mwx+ 2/-1,y-2/-1 ) ,
-ii,/ -n,/-:
Vn,/ = D (mwx y, mw X y \ x
/-1 \ i-ii,/ -П,/-1 \
2,-1,y ) + D (mwx,y , mwx,y-2/-l ) +
+D
/-ii,/
I mwx,y
-n,/-1
y, llirv /-, /
r x - 2' 1, y-2'
-1),
. I—I,/ Vjy = D(mwx,y, mw
x, y \
i,/-1 \ /-1,/ —1,/-1 \
, 1 + Dimwx,y, mw . 1 -
x-2/-1, y/ \ x, y + 2/-1 J
+D
i-1J
I mwx,y
-i,/-1
-1) •
где D - оператор вычисления евклидова расстояния в RGB -пространстве.
В итоге после расчетов получим массив чисел, где каждой точке px,y изображения будет соответствовать последовательность значений W'xy, отражающих степень вариации функции оригинала для разных уровней масштаба l в ближайшей окрестности, размер которой непостоянен и зависит от уровня анализа. Из каждой такой последовательности может быть получено единственное значение посредством сложения входящих в нее чисел, и далее может быть определена двумерная функция суммарной вейвлет-статистики
Z
UWZ(x,y) = X WX,y , Z <|log 2(min{X, Y})|,
l=i 2
где Z - глубина расчета вейвлет-статистики; X, Y- общее количество строк и столбцов на исходном изображении. Получив данную функцию, следует перейти к непосредственному определению центров кристаллизации путем поиска на ней локальных минимумов.
Так как исследуемая функция UWZ(x, y) определена на двумерном дискретном пространстве, то использование классических методов оптимизации функций многих переменных здесь будет неэффективно. Здесь возможно применение метода подавления немаксимумов [2] применительно к задаче минимизации. Его использование предполагает сканирование изображения с помощью маски 3 х 3 с целью определения точек, окруженных пикселами с наибольшими значениями. Но в такой постановке окажутся потерянными точки нестрогого локального минимума, а, исходя из требований, предъявляемых к задаче обнаружения центров кристаллизации, в области равно малых значений функции должна быть определена как минимальная одна точка, желательно лежащая в центре области равных значений. Для этого необходимо после нахождения точки нестрогого локального минимума выполнить морфологическую заливку связной с ней области того же уровня с целью определения и сохранения средней точки выделенной компоненты как центра кристаллизации. Математическое описание морфологических операций обычно дается с помощью теории множеств [1]. Для выделения компоненты связности в морфологии используется операция дилатации ©, т. е. расширение множества на его границах. Итак, если известная точка c находится внутри искомой области, то операция выделения компоненты связности Ck на множе-
стве значений функции UWZ(x, y) выглядит как Ck = (Ck-1 © B)n A; k = 0, 1, ...; A = {UWZ(x, y) | (UW Z(x, y) = c)}; C0 = c, где B - примитив дилатации, здесь это квадрат 3 х 3.
Выполнение заливки завершается, когда Ck = Ck . Элементы множества Ck представляют изображение связной области равных значений, для которого необходимо определить центр тяжести. Центр тяжести для области, где все значения равны можно определить путем нахождения точки внутри ограничивающего область прямоугольника, в которой пересекаются горизонтальная и вертикальная линии так, что по обе стороны от каждой из них лежат равномощные подмножества исследуемой области C. Далее необходимо найти ближайшую в смысле евклидова расстояния от центра тяжести точку, принадлежащую Ck (так как область может иметь, например, форму кольца), и признать ее новым центром роста.
Определив центры кристаллизации, следует непосредственно перейти к выращиванию областей. Преследуя цель полной корректной сегментации изображения, здесь необходимо разработать интегрированный подход к данному процессу, а не просто использовать многократное приложение описанного выше метода с разными параметрами для каждого сегмента. Из этого следует, что алгоритм при каждом своем шаге должен учитывать ситуацию на всех растущих сегментах изображения, т. е. быть связным. Тогда, вероятно, стоит выбрать критерием остановки сегментации полное заполнение сегментами всего изображения, но прибавлять на каждом шаге не по пикселу к каждой области, а лишь единственный пиксел, наиболее близкий в данный момент к одной из областей. Так можно достигнуть неравномерного роста сегментов, соответствующего реальной ситуации и универсально решить проблему выбора критерия остановки процесса выращивания.
Естественно, все пикселы-кандидаты, претендующие на включение в какой-либо сегмент, должны быть смежными со своими областями, т. е. находиться на внешней их границе, которую удобно выделять с помощью методов морфологии. Внешняя граница Gr области Reg (Gr и Reg - множества пикселов) может быть определена как Gr = (Reg © B) \ Reg.
Далее следует искать среди выделенных граничных пикселов единственный максимально близкий к смежной области по какому-либо признаку. Близость граничного пиксела и исследуемой области будем определять двумя способами:
- расстоянием a между значением цвета пиксела и средним значением области, ax,y = D(gx ,M(Reg)), где
gx,y Px,y , gx,y ^ Gr;
- расстоянием ß в Z-мерном пространстве вейвлет-
статистики W„ y
x,y
/ = 1, 2,
, Z между вектором w(
,-t.Z
Gr,x,y •
принадлежащим граничному пикселу и средним значением для соответствующей области; здесь расширим операции нахождения среднего и евклидова расстояния на случай _ 2-мерного пространства,
-Ог,х,уМ,х,у | Рх,у 6 Яе?})) ,
ßx,y = D(wG
= ГW ,.. ,
L x,y > x,y >
WZ
wz x y
Таким образом, в результате анализа параметров областей и прилегающих к ним пикселов будет найдена та-
кая точка gXгу, что расстояние а или р для нее будет минимально среди всех пикселов, входящих в множество От. Эта точка должна быть объединена с соответствующим сегментом. Процесс выращивания областей завершается, когда в множество пикселов всех областей будут включены все пикселы изображения.
Вероятно, что в общем случае описанный метод не позволит провести корректную сегментацию, так как центров кристаллизации (локальных минимумов) на градиентном изображении вейвлет-статистики, а значит и сегментов на оригинале, скорее всего будет выделено больше, чем областей, воспринимаемых человеком, что приведет к избыточной сегментации. Эту проблему можно решить с помощью объединения областей на уже сегментированном изображении. Используем здесь тот же принцип действия, что и при выращивании, и будем искать на каждом шаге пару соседних областей наиболее близких друг к другу. Кандидатами на объединение могут быть любые две соседние области, при этом расстояние (а или Р) может определяться с помощью тех же выражений, что и при выращивании, с той лишь разницей, что вместо значения параметра для одного пиксела в обоих случаях используются средние значения для областей. Те две области, которые будут иметь минимальное расстояние ёк друг от друга на к-м шаге слияний должны быть объединены, и так до тех пор, пока не останется
единственная область, равная всему изображению. Но тогда встает вопрос о критерии окончания процесса, о шаге, на котором сегментированное изображение будет наилучшим образом соответствовать человеческому восприятию оригинала либо давать информацию, максимально облегчающую задачу дальнейшего распознавания образов. Выявление этого момента, вероятно, может быть осуществлено при анализе последовательности допущенных отклонений характеристик областей во время их объединения. Можно предположить, что эта функция будет монотонно возрастать, так как по мере объединения областей придется допускать все большие отклонения их параметров. В таком случае с помощью дифференцирования данной последовательности можно определить момент, после которого при слиянии очередной пары пришлось сделать допущение, сильно отличающееся от соседних, т. е. необходимо найти глобальный максимум первой производной последовательности отклонений ёк. Тогда шаг остановки слияний t найдем как
Г = а^(шах{Дёк, к = 1,2,...})
к ' Дё к = ё к+1 - ёк.
В окончание необходимо сделать возврат в слияниях сегментов к результатам шага t и завершить работу метода.
Описанный метод сегментации представим в общем виде схемой алгоритма (рис. 2).
Рассмотрим результаты работы предложенного подхода на различных изображениях. Сначала используем простое двухцветное изображение (рис. 3, слева) для испытания работы метода определения центров кристаллизации. Здесь же представлено изображение рассчитанной вейвлет-статистики (рис. 3, центр) и изображение центров кристаллизации (рис. 3, справа).
Видно, что центры кристаллизации (контрастные пометки-крестики) были выделены по одному в каждой однородной области цвета. При этом каждая отмеченная точка расположена в центре тяжести своей области, хотя значения вейвлет-статистики (градиента) внутри области равны нулю. Такого результата удалось достичь благодаря использованию морфологического алгоритма заливки при минимизации функции вейвлет-статистики иш2(х, у).
Теперь применим алгоритм к достаточно простому с точки зрения выделения областей изображению клеток крови (рис. 4, слева).
Слева на рис. 4 - исходное изображение, в центре -сегментированное изображение после выращивания областей, справа - сегментированное изображение после слияния областей. Представленные на рис. 4 сегментированные изображения получены в полностью автоматическом режиме работы алгоритма; каждый показанный на рис. 4, справа сегмент имеет набор индивидуальных значений декрипторов. Разумеется, здесь были введены основные настройки метода (вейвлет-статистика первого уровня, выращивание и слияние по цвету), но значения данных параметров влияют на результат работы метода в гораздо меньшей степени, чем, например, значение выделяемого цвета в пороговом преобразовании или в простом выращивании областей. Достаточно сказать, что ва-
риации цвета объектов на рис. 4, слева и небольшие искажения не повлияют на результат сегментации. Следовательно, предложенный метод сегментации обладает высокой степенью устойчивости и автоматизации.
Проверим способность метода к сегментации текстурных изображений (рис. 5, слева). Для данного изображения может быть удачно применен многомасштабный анализ большей глубины (например, до четвертого уровня) и использование полученной вейвлет-статистики в самом процессе сегментации, так как в таком случае будет задействована частотная информация об изображении.
В данном случае (рис. 5, центр) автоматическая остановка слияний не сработала должным образом, но изображение, полученное на более ранней стадии объединения областей (рис. 5, справа) показывает способность метода к текстурной сегментации.
Подводя итог, выделим прогрессивные черты предложенного метода сегментации и его достоинства перед существующими:
- метод использует информацию о связности областей;
- интегрированная структура метода; динамичность, адаптивность процесса выращивания и слияния областей с возможностью привлечения различных данных об исследуемой сцене;
- использование частотной информации, предоставляющее возможность сегментации текстурных изображений;
- высокий уровень автоматизации.
Недостатки метода:
- сложность алгоритмов;
- высокие требования к ресурсам ЭВМ.
Помимо самого алгоритма сегментации в данной работе были представлены другие новые идеи:
Рис. 3
- схема многомасштабного анализа изображения с выделением частотной информации;
- алгоритм минимизации двумерной функции, использующий морфологическую заливку;
- совмещение выращивания и слияния областей;
- критерий определения оптимального момента остановки слияний.
Библиографические ссылки
1. Гонсалес Р. C., Вудс Р. Э. Цифровая обработка изображений. М. : Техносфера, 2005.
2. Steinbrecher R. Bildverarbeitung in der Praxis [Электронный ресурс]. URL: http://www.rst-software.de/dbv/ download.html.
Рис. 5
I. N. Palamar, P. V Sizov
METHODS OF IMAGE SEGMENTATION WITH THE HELP OF AREAS GROWING AND MULTISCALE ANALISYS
In this article we analyze advantages and disadvantages of existing methods of image segmentation. We develop an original algorithm of segmentation with usage of the method of areas growing and multiscale analysis. Researches of capabilities of this method according to different images are performed now.
Keywords: segmentation, image, growing, wavelet.
© Паламарь И. Н., Сизов П. В., 2010
УДК621.396.43
В. И. Носов, В. Н. Бактеев, Л. А. Штанюк
ВЫБОР ОПТИМАЛЬНОЙ ТОЧКИ РАЗМЕЩЕНИЯ РАДИОТЕЛЕВИЗИОННОЙ ПЕРЕДАЮЩЕЙ СТАНЦИИ
При строительстве новых или реконструкции действующих передающих станций возникает задача определения их оптимальных местоположения и технических параметров. Для определения оптимального местоположения станций необходимо производить расчет напряженностей полей сигналов и помех с учетом профилей интервалов, построенных в направлении от местоположения станции до границы зоны вещания. Рассматривается решение задачи оптимизации местоположения радиотелевизионной передающей станции посредством расчета зон обслуживания и зон теней вещательных передатчиков с использованием автоматизированной системы расчетов и географической информационной системы.
Ключевые слова: телевизионное вещание, зона обслуживания, геоинформационная система.
Основной проблемой при проектировании сети наземного телевизионного (ТВ) и звукового (ЗВ) вещания является определение действительной зоны обслуживания радиотелевизионной передающей станции (РТПС)
[1-6]. Только определив зоны обслуживания и зоны тени, можно оптимально разместить передающие станции, что сократит расходы не только на строительство новых станций, но и на их обслуживание.