Научная статья на тему 'Модель и метод решения задачи сегментации типовых изображений нерегулярной формы'

Модель и метод решения задачи сегментации типовых изображений нерегулярной формы Текст научной статьи по специальности «Математика»

CC BY
432
39
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Путятин Евгений Петрович, Смеляков Кирилл Сергеевич

Рассматриваются модель и метод решения задачи сегментации типовых изображений нерегулярной фор мы, возникающей при обработке цифровых снимков земной поверхности и иных объектов (радужки глаза, семян, микробиологических объектов), которые предназначены для повышения эффективности систем обработки данных по оперативности, точности и экономичности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Путятин Евгений Петрович, Смеляков Кирилл Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model and Method for Solving of the Irregular-Form Typical Images Segmentation Problem

The model and method are presented that are provided for solving the irregular-form typical images segmentation problem which arises on processing of the digital photos of the Earth’s surface, iris, seeds, microbiological and other objects. The proposed approach is provided for increasing the efficiency of the data processing systems relative to time complexity, accuracy and cost.

Текст научной работы на тему «Модель и метод решения задачи сегментации типовых изображений нерегулярной формы»

ИНФОРМАЦИОННЫЕ

УДК 519.673

МОДЕЛЬ И МЕТОД РЕШЕНИЯ ЗАДАЧИ СЕГМЕНТАЦИИ ТИПОВЫХ ИЗОБРАЖЕНИЙ НЕРЕГУЛЯРНОЙ ФОРМЫ

ПУТЯТИНЕ.П., СМЕЛЯКОВ К.С.______________

Рассматриваются модель и метод решения задачи сегментации типовых изображений нерегулярной фор -мы, возникающей при обработке цифровых снимков земной поверхности и иных объектов (радужки глаза, семян, микробиологических объектов), которые предназначены для повышения эффективности систем обработки данных по оперативности, точности и экономичности.

1. Постановка проблемы

Под изображением объекта понимают структурированную информацию о его геометрической форме и распределении яркости, которая может быть получена в результате обработки цифрового снимка с помощью цифровой камеры или оцифровки аналоговой фотографии. Регистрация объекта производится на некотором фоне; для этого используются излучения различной природы (электромагнитные, рентгеновские и др.), но чаще всего рассматривается диапазон длин волн видимого спектра. При этом под сегментацией понимают [1] выделение изображения объекта из цифрового снимка, а под распознаванием — сегментацию и классификацию изображений по некоторым признакам.

Возможности современной техники получения качественных цифровых снимков при сравнительно малых затратах способствуют развитию средств их программной обработки в целях автоматизации исследования объектов по их цифровым изображениям, которые все шире применяются в различных прикладных областях.

Однако до настоящего времени основное внимание уделялось распознаванию изображений с использованием эталонов или объектов, геометрическая форма которых известна. В то же время при проведении аварийно-спасательных [2] и нефтегазопоисковых [www.scanex.ru/rus] работ, при анализе экологического состояния регионов [3], мониторинге и прогнозировании последствий чрезвычайных ситуаций (пожаров, наводнений и др.) по данным дистанционного зондирования Земли с Украинских спутников “Січ-1” и “Океан-О” [4], а также во многих иных задачах, связанных с

обработкой цифровых снимков земной поверхности, Солнца и дальнего космоса [3-6], возникает необходимость распознавания изображений нерегулярной формы (т.е. невыпуклых объектов, эталоны для которых отсутствуют) по их яркости; например, новых лесов, солнечных пятен, областей радиоизлучения. Та же проблема возникает в биологии, медицине и других областях при компьютерном анализе радужки глаза [7], семян [8], микробиологических объектов [9]; например, при сегментации эмбриона и его компонент — бластомеров.

Поэтому отсутствие адекватных математических моделей, методов и компьютерных технологий решения задач сегментации для объектов нерегулярной формы существенно сдерживает развитие систем автоматизации решения актуальных задач распознавания изображений в различных областях либо снижает их эффективность в отношении оперативности, точности и экономичности вследствие необходимости привлечения специалистов на этапе ручной обработки подобных данных.

Эта ситуация порождается, прежде всего, сложностью идентификации формы исследуемых объектов и их изображений, которая, с геометрической точки зрения, не описывается “стандартными” фигурами, а топологически может представлять неодносвязную область.

Поэтому, в силу неполной формализации образуемых типовыми объектами связных структур, которые могут представлять невыпуклые области с “выколотыми” подобластями, большинство существующих подходов к сегментации нерегулярных изображений [9-11] как необходимую фазу анализа включают трудоемкие и дорогостоящие этапы ручной обработки данных, к которым привлекаются эксперты в целях учета особенностей частных задач распознавания изображений и проверки адекватности результата. В итоге “предложено великое множество методов классификации и распознавания, причем число различных подходов к решению проблемы равняется, фигурально, сумме количества конкретных задач и числа исследователей, решающих эти задачи” [11].

В этом отношении проблема распознавания изображений сводится к двум взаимосвязанным аспектам сегментации: выделению базовых односвязных нерегулярных областей и образуемых ими структур (типовых изображений), поскольку решение задачи классификации (по форме и метрическим характеристикам) может быть получено лишь при наличии унифицированной системы подобных моделей для задачи сегментации; например, на основе использования известных методов поддержки принятия решений [12].

Эти два аспекта сегментации являются общими для всех прикладных задач рассматриваемого класса (отличие состоит в том, что привязка объектов производится к карте региона, зонам радужки или эмбриона и т.д.). Типовая, в смысле общности форм рассматриваемых объектов [3-8], но более наглядная для описания задача возникает в иридодиагно-

124

РИ, 2003, № 2

стике [7], где по снимку радужки, полученному с высоким разрешением, выделяются иридознаки и иные элементы произвольной геометрической формы, эталоны для которых отсутствуют. Сегментация и распознавание этих знаков в настоящее время производятся вручную: специалист накладывает на полученный снимок схему проекционных зон тела человека (рис.1), выполненную на прозрачной пленке, и определяет конфигурацию основных зон радужки и имеющиеся на ней ири-дознаки (по типу, локализации и количеству). Соотнесение выделенных на снимке зон и знаков со схемой проекций зон (рис.2) позволяет диагностировать состояние здоровья.

Рис. 1.Распре деление проекционных зон по радужке

2 1 ? ’ 2 э , _і_*-L_7 З

Рис. 2. Схема проекционных зон тела человека на левой радужке (по F. Roberts)

Таким образом, для актуальной задачи сегментации типовых изображений нерегулярной формы необходимо разработать эффективную (по точности, трудоемкости и затратам памяти) систему моделей и методов ее решения с учетом критериев и ограничений, характерных для прикладных задач.

2. Модель области изображения

Построим модель входного изображения, под которым понимают цифровое изображение поля зрения, полученное при стандартных условиях фотосъемки и при ограничениях, характерных для сегментации типовых изображений объектов.

Пусть D — область входного изображения, заданная совокупностью узлов D = {dij = (i, j)}, i = 0,...,M,

РИ, 2003, № 2

j = 0,..., N, прямоугольной равномерной решетки r на плоскости R , образующие которой параллельны осям координат. В случае введения системы окрестностей на D узлы решетки определяют точки топологического пространства, а при их отображении на плоскость — точки в R2 , которые могут использоваться для аппроксимации и оценивания метрических характеристик областей.

Полутоновым входным изображением Ed называется совокупность

Ed = [Fd,D] , (1)

где Fd — функция яркости входного изображения, заданная распределением Fd = {(i,j,fy)} значений яркости fjj, 0 < fjj < A, в узлах dy области D .

Цветным входным изображением Ed называется совокупность трех полутоновых изображений вида (1), соответственно в красном, зеленом и синем спектре:

Ed = {eD} , k = 1,2,3 , (2)

которое определяет стандартное представление цветного входного изображения после оцифровки.

Тогда считаем, что во входном изображении (2) сегментировано Q изображений Eq, если они удовлетворяют системе

' Eq = {Eq = [Fqk,Dq]};

Dq c D;D Dy = ф при E, Ф ц;

Fq = fD на Dq, F,k = 0 на D\Dq; (3)

k = 1,...,3; q = 1,2,...,Q;

где Dq — область изображения объекта Eq, а {Fq }

— совокупность его функций яркости.

Соответственно, к фону относят множество узлов, не входящих в области изображений объектов:

D0 = D \ и Dq . (4)

q=1,Q 4

После оцифровки полутонового аналогового снимка (рис. 3) анализ яркости не позволяет однозначно отнести точки, лежащие вблизи границ изображений, к фону или изображениям объектов.

q ц+-1 ц+-2 ц + З ц + d q Т) + 1 Т) + 2 ц + 3 тщ + 4

5 I * Г* Г* Г* г.

?+1..........

f+s ' | * | ■ * *

W * |~* •

а б в

Рис. 3. Оцифровка полутонового изображения:

а — аналоговое изображение поля зрения; б — дискретизация области аналогового изображения; в

— квантование аналогового изображения по яркости (получение цифрового полутонового изображения)

Поэтому выбор критерия сегментации и настройка его параметров представляют отдельную задачу [13], которая рассматривается ниже. В случае цвет-

125

ных изображений дополнительно должен быть введен критерий согласования границы изображения по результатам его сегментации в различных спектрах. Поэтому, если не оговорено иное, далее рассматриваются полутоновые изображения.

Введем дискретные аналоги понятий, необходимые для описания связности изображений.

В топологии область q , лежащая на плоскости, называется односвязной [14], если непрерывной деформацией любая петля в ней стягивается в точку; подобная область имеет тип диска (рис. 4,а). При этом линейно связное множество с n +1 компонентой границы имеет топологический тип диска с n дырами (рис. 4,б, в), а ее фундаментальная группа является свободной группой C(n).

В практически значимых случаях эти границы определяют выколотые области-диски (рис. 4,б) с границами, гомеоморфными окружности, а топологические типы области и ее замыкания совпадают.

Поэтому далее не рассматриваются границы, имеющие сингулярные компоненты типа “точка” или “линия” (рис. 4,в), или точки ветвления (рис. 4,г). Тогда с топологической точки зрения любая область изображения q на плоскости рассматривается с присоединенной границей и имеет тип диска сn дырами {го;};—i,n , n > 0 (на рис. 4,б n = 3 ):

Q = ClШо \ u Ю;;

i—1,n

Cl ®i C®0, Cl ®i n Cl ю j = 0,

(5)

і Ф j, i,j = 1,...,n;

где юі,і = 0,...,n, — диски; Cl — операция замыкания. Диск юо называется носителем, а его граница Frюо — внешней границей Fr0 Q области Q; границы Frcoj, і = 1,...,п, назовем внутренними.

Рис. 4. Топология областей на плоскости

Изучение диска с n дырами исчерпывающим образом определяет топологическую модель рассматриваемых областей и, посредством (5), задает их структуру (по вложению) и топологическую классификацию. Рассмотрим, каким образом эту топологию можно перенести на d .

Точки dij,є D называются 4-, соответственно, 8-связными (рис. 5) при выполнении условий [1]

[ф Ч| = 1) А ф-ц\ = 0)] V [(|i-%\ = 0) Л ф-ц\ = 1)]; max{|i -S\ ,|j -ц\ } = 1.

Если не оговорено иное, считаем точки смежными, если они 4-связны. Множество G с D назовем

связным, если для всякой пары точек dipd^ є G в G существует последовательность смежных точек с началом и концом в dij, d. Далее считаем, что рассматриваемые области связны.

Элементарная окрестность точки dij є D включает ее саму и множество смежных ей точек (рис.5,а); для этих пяти точек точка dij является внутренней. Соответственно, точка dij є G является внутренней для множества G с D , если ее элементарная окрестность лежит в G. Исходя из этих базовых определений, приходим к соответствующим понятиям окрестности, внутренности Int G , граничной точки и границы FrG множества G с D (рис.6), а также изолированной точки.

Рис. 5. 4- и 8-связность точек в D

Рис. 6. Область G типа диск с одной дырой; ее границы выделены черным

Если компоненты границ множества G с D попарно не имеют 8-связных точек, то они отделимы в G, например, петлями, т.е. замкнутыми последовательностями p смежных точек. Поэтому область G рассматривается с присоединенной границей и имеет представление (5).

При указанных допущениях введенные понятия связности (включая односвязность и неодносвязность) и окрестности для дискретного пространства множеств в D порождают ту же топологию связности, описываемую группой C(n), что и диск с n дырами, если в качестве операций деформации в IntG рассмотреть замену пути ... (i,j),(i +1,j),(i, j)... на вырожденную петлю ... (i,j)..., а пути ... (i,j),(i + 1,j),(i + 1,j +1)... - на путь ... (i,j),(i,j +1), (i +1, j +1)..., или наоборот.

Поэтому понятие диска с дырами определено и для пространства D с введенной топологией окрестно-

РИ, 2003, № 2

126

стей. В частности, для диска с n дырами G с D , как для случая на плоскости, определены внешняя и внутренние границы. Заметим, что компоненты границы множества G с D в общем случае 8-связны, а “дырки” представляются областью или, в предельном случае, изолированной точкой.

d -Отрезком d(ij,, соединяющим точки dy , d^ є D, назовем множество точек из D , которые лежат на отрезке dij dє R2 ; d -отрезокd(ij,£ц) принадлежит множеству G, если каждая его точка принадлежит G. Тогда область G называется выпуклой, если для любой пары точек dij, dє D d -отрезок d(ij, |ц) принадлежит G .

Введем понятие выпуклой оболочки Conv G множества G с D с границей g = Fr0 G, заданной последовательностью 8-связных точек. Отобразим G с D на плоскость; тогда вершины g' ломаной, геометрически определяющей границу выпуклой оболочки множества g, с линейной трудоемкостью могут быть получены как подпоследовательность g с использованием алгоритма Ли [15]. Далее, в d -отрезках, определяемых последовательностью вершин из g', удалим внутренние точки. Полученная последовательность g* задает вершины ломаной, определяющей выпуклую оболочку для G в R2 ; эту же последовательность принимаем за Conv G (отмечено черным на рис. 7).

Рис. 7. Область G типа диск с одной дырой. Вершины выпуклой оболочки отмечены черным

Изображение объекта, заданное на односвязной (связной) области, назовем элементарным (типовым); изображение, определенное совокупностью типовых изображений с непересекающимися носителями, назовем композиционным.

Тогда трехуровневая иерархическая классификация изображений, актуальных для прикладных задач, по топологическому типу определяющих их областей характеризуется тем, что композиционное изображение представляется объединением типовых изображений, а последние, в свою очередь, — вложением (5) элементарных дисков в носитель.

3. Модель функции яркости изображения

С учетом точности исходных данных и требований вычислительной эффективности моделей и методов сегментации изображений двумерная интерполяция или аппроксимация порядка, выше второго, не используется. Вместо этого значения функции яркости fij, заданные в точках области Dq с D , аппроксимируются вдоль образующих решетки R . Для этого используется система регрессионных уравнений Фq = (Фі (x), фj(y)}, где x, у принимают значения координат узлов решетки R . В общем случае функция z = Фі (x) для среза по строке і имеет неявное представление:

a5 • x2 + a4 • z2 + a3 • x • z + a2 • x + aj • z + a0 = 0 . (6)

В зависимости от особенностей функции Fq , определяемых спецификой прикладных задач, рассматривают равномерную, линейную, параболическую, коническую или сферическую аппроксимацию. При выборе класса уравнений регрессии, образующих систему Ф q , учитывается уровень искажения исходного распределения яркости низкочастотным шумом. С этой целью при выборе функционального класса модели регрессии (6) может использоваться критерий Фишера, а в качестве оценки точности аппроксимации (6) — среднее отклонение Д от регрессии и его дисперсия.

Тогда иерархическая классификация изображений по классу уравнений регрессии, аппроксимирующих функции яркости, в целом определяется пятью уровнями — сферической, конической, квадратичной, линейной и равномерной моделями, хотя в случае минимизации погрешности аппроксимации А по срезам может возникнуть ситуация, когда в пределах элементарного объекта используются уравнения регрессии различных функциональных классов. Такая же ситуация может иметь место и для типовых объектов. В случае, когда квадратичная аппроксимация по срезам является избыточной, для элементарных ячеек может применяться двумерная линейная аппроксимация вида z = a • x+b • у + c .

4. Задачи сегментации и методы их решения

Таким образом, общая модель изображения объекта включает два элемента — модель области и модель функции яркости. Рассмотрим основные критерии, которые могут быть применены при сегментации с учетом особенностей изображений.

Поскольку при пересечении геометрической границы объекта функция яркости (для внутренних точек объекта и фона) претерпевает скачок, аналогичный скачок имеет место и для значений (fij} при движении по срезам. К идентификации этих граничных точек объектов, в конечном счете, и сводится сегментация изображений объектов. Однако основная проблема состоит в том, что вследствие неравномерности освещения и бликов, дискретизации аналогового снимка и действия иных факто-

РИ, 2003, № 2

127

ров, совокупность которых для краткости назовем шумом, границы объектов могут быть искажены по линейным размерам и размыты по яркости при слабом различии между фоном и объектом. Поэтому введем некоторые допущения о распределении функции яркости по срезам.

Не теряя общности, будем считать, что яркость фона, в среднем, ниже, чем яркость объектов (иначе достаточно инвертировать входное изображение). Для краткости индексации положим, что рассматривается срез i, а номер столбца j для точек (i,j) со значением яркости fj = fj изменяется от 1 до m .

В идеальном случае, т.е. при отсутствии шумов или наличии для них точных аналитических моделей, выделение фона не представляет труда и сводится к построению областей равного уровня яркости. На практике этот подход неприемлем, но с достаточной степенью точности влияние шума и трендов для фона можно учесть, рандомизируя модель изображения посредством представления яркости фона входного изображения функцией вида

fB(j) = fB + e , (7)

где fB — константа, а e — нормально распределенная случайная величина, N(0, ст ), с нулевым математическим ожиданием и дисперсией ст2. При этом не исключается, что в пределах области D значение fB может иметь слабо выраженную линейную зависимость от j, статистически не значимую в пределах областей, по размеру сопоставимых с элементарными объектами. Соответственно, функция яркости элементарного объекта O описывается функцией вида

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

fo(j) = Ф0) + E, (8)

здесь фО) — выпуклая функция (уравнение регрессии из (6)), определяющая яркость объекта в точках j среза i, а E — величина типа N(0,ст2).

Пусть входное изображение содержит единственное элементарное изображение О. Тогда базовая задача сегментации изображений нерегулярной формы состоит в следующем.

Задача 1. С заданной доверительной вероятностью р идентифицировать все точки jj, ... , jk области О элементарного изображения в срезе i при условии, что функции яркости объекта и фона описываются моделями (7), (8).

Доверительный интервал для значений функции яркости в точках j можно оценить следующим образом:

lB(j) = fB ±eB; sB = s • ta/2;n-l/Vn^I; (9)

Io(j) = 9(j) ±eo; eo = so •ta/2;n-1 Л/п^1 , (10)

где s (so) — оценка для ст (ст0); ta/2;п_1 — квантиль распределения Стьюдента; а = 1 - р , а n — число точек j, по которым производится оценка.

Обозначим j ^ O , j ^ B операции отнесения точки j к объекту и фону, соответственно, и рассмотрим критерий

_ I j ^ O, если fj > fB +є B;

R0 =1 • B j B B (11)

[ j ^ B в противном случае.

Если во внутренней области объекта О интервалы (9), (10) не пересекаются, назовем объект контрастным; для них критерий (11) дает решение задачи 1. Ситуация, когда интервал Ib (j) содержит функцию 9(j) для всех точек объекта О, соответствует отсутствию решения задачи 1 в смысле не значимого отличия объекта от фона. Этот случай определяет “неявное” изображение ввиду значительных шумов или близости объекта и фона по яркости.

При наличии точек объекта, не попадающих в интервал Ib (j), назовем его изображение (и границу) размытым. В этом случае байесовское отношение правдоподобия принадлежности точки j объекту и фону примет вид

P(O,B) = — exp

CTo

(fj-qj)2 + fi- fB)2

2ct2 2ct 2 ,

(12)

и задаст следующий критерий дискриминации для точки j :

Ri =

j ^ O, если P(O,B) > 1; j ^ B в противном случае.

(13)

Для размытого изображения предлагается следующий метод решения задачи 1. По критерию Ro находим связную последовательность точек j1, j2 , ... , jn , принадлежащих объекту ввиду введенных допущений n > 1. По этим точкам получаем уравнение регрессии ф(х) по (6). В окрестности точки j 6(jbjn} применяем, соответственно ситуации, критерий Ro или R1, либо, в случае их неадекватности, находим решение j * уравнения ф(х) = fB, которое задает граничную точку объекта (предшествующую j1 либо следующую после jn , соответственно ситуации). Доопределив точки между граничными и внутренними, в результате получаем связную последовательность точек j) , j'2 , ... , jn среза i, определяющих решение задачи 1 для размытого изображения объекта.

Для решения задачи 1 необходим этап обучения в целях определения параметров яркости объекта и фона. Фон может иметь не только случайную составляющую, но слабо выраженную регрессионную зависимость от j, а вблизи границы контрастных и практически важных размытых изображений объектов, как правило, имеет место скачок яркости.

Поэтому для оценивания параметров функции (7) (и предварительной идентификации границ объек-

128

РИ, 2003, № 2

тов) предлагается использовать метод экспоненциальных средних, начиная просмотр значений яркости f j с точки j = 1 ( и, в сторону убывания, начиная

с j = jk ) До первого значимого нарушения тренда, определяющего скачок яркости на границе объекта. В результате, если срез i проходит через объект, получаем выборку для оценки параметров (7), (8) фона и объекта, иначе — только фона.

Таким образом, предложенная процедура обучения и критерии дискриминации позволяют сегментировать элементарное изображение в условиях параметрической настройки, автоматической или принудительной, посредством задания порогов и предельных погрешностей для доверительных областей, включая уровень значимости а . Рассмотрим теперь задачу сегментации типовых изображений нерегулярной формы при следующих предположениях, допускающих естественное распространение на инверсные ситуации по яркости.

Задача 2. С заданной доверительной вероятностью Р идентифицировать все точки ji, ... , jk области О типового изображения в срезе i при условии, что функции яркости элементов объекта (дыр и носителя) и фона удовлетворяют условиям (7), (8), причем уровни яркости дыр доминируют над носителем, а яркость носителя выше яркости фона.

Метод решения этой задачи основан на ее сведении к системе однотипных базовых задач сегментации элементарных нерегулярных изображений.

Этап обучения. Сканируем срез и по описанному выше методу оцениваем параметры фона; в результате все его точки разбиваются на два подмножества, относящиеся к фону и носителю. Далее, сканируя точки в пределах носителя, с помощью метода экспоненциальных средних выявляем границы дыр (если имеются); эта процедура корректна, поскольку контрастность фона (понимаемая как производная от яркости) в пределах дыры или носителя ниже контрастности (как разности значений) в окрестности границы. Заметим, что при этом не возникает сложностей с отнесением границ к дырам или носителю, так как для каждого из этих объектов они появляются парами, как скобки при записи операций.

Этап сегментации. Из области носителя исключаем точки, относящиеся к дырам, и по ним строим уравнение регрессии, после чего производим сегментацию носителя (относительно фона — т.е. решаем задачу 1). Для сегментации дыр применяем

критерий Ri к внутренним точкам дыр и носителя в целях уточнения их границ.

Рассмотрим теперь задачу сегментации типового изображения нерегулярной формы, считая, что изображение сегментировано, если определены все его точки на d (или компоненты связности границы); получение границ изображения по внутренним точкам, и наоборот, в соответствии с (5) представляет рутинную задачу.

Задача 3. При введенных выше допущениях на функции яркости и структуру изображений объектов, сегментировать изображение O нерегулярной формы.

Рассмотрим вначале метод решение этой задачи для элементарного объекта. Пусть для всех горизонтальных и вертикальных срезов по образующим решетки R идентифицированы точки {ji, ... , jk^ области O элементарного изображения. По построению каждая из этих £ последовательностей определяет d -отрезок d^ , представляющий связную последовательностью точек на одной из образующих. Обозначим O* объединение точек, входящих в эти отрезки. Тогда, если шаг решетки R достаточно мал по сравнению с диаметром объекта О, ввиду выпуклости функции яркости внутренность множества O* -связна, а граница 8-связна. Исключение могут составить выколотые точки, смежные граничным (вследствие шума) или лежащие в узких “горловинах” (если таковые имеются). Пополняя множество O* подобными выколотыми точками (смежными внутренним и граничным) до достижения связности его внутренней части, предполагаемой по условию, получим, что множество O * определяет сегментацию искомого элементарного изображения.

В случае типового объекта поступаем так же, как при сведении задачи 2 к задаче 1: вначале, с помощью описанного выше метода, сегментируем дыры в носителе типового объекта, а затем сегментируем его как элементарный объект, рассматривая его вместе с дырами относительно фона у границы носителя.

Если входное изображение содержит несколько типовых объектов, их носители, по условию, отделимы, значит, описанная выше процедура сегментации типового изображения может быть применена к каждому из них независимо.

В результате применения предложенных выше методов решения задач 1 — 3 получаем совокупность сегментированных полутоновых типовых изображений объектов, каждый из которых представлен разностью между носителем и лежащими в нем дырами. Более того, сегментированные изображения могут быть заданы как множеством точек в D , так и структурой (5) вложенных областей и/ или их границами (8-связными последовательностями точек из D). Если требуется, для дыр и носителей по предложенным методам могут быть получены вершины, определяющие их выпуклые оболочки.

В случае цветных изображений задача сводится к сегментации трех полутоновых изображений, для чего применимы предложенные в работе модели и методы, и синтезу их “общей” границы на основе различных подходов, отражающих спектральные особенности объектов, рассматриваемых в прикладных задачах.

РИ, 2003, № 2

129

5. Заключение

Использование топологических и статистических концепций позволило построить модель задачи сегментации типовых изображений нерегулярной формы при достаточно общих предположениях об их геометрической форме и распределении функции яркости, а также предложить метод решения этой задачи, основанный на этапах обучения (настройки параметров модели на фотометрические особенности прикладных объектов) и сегментации изображений, которая базируется на сведении общей задачи к сегментации элементарных изображений, определяющей структуру сегментируемых неодносвязных изображений.

Представленные в работе модели и методы сегментации объектов по их изображениям представляют самостоятельный интерес, а также актуальны для решения последующих задач распознавания, например — определения метрических характеристик сегментированного изображения (линейных размеров, площади, блеска объектов и др.) с помощью известных методов, основанных на использовании полученных описаний объектов и метрических эталонов, содержащихся во входном изображении. Кроме того, по результатам решения задачи 3 получаем иерархию вложенности сегментированных изображений, использование которой, наряду с их метрическими характеристиками, позволяет распределять сегментированные изображения по классам соответственно системе правил и признаков, заданных для рассматриваемого класса прикладных объектов.

Предложенные в работе модели и методы решения задач сегментации нашли применение при разработке программных систем распознавания изображений, ориентированных на анализ солнечных пятен, семян сельскохозяйственных культур и эмбрионов животных, и подтвердили свою эффективность в отношении оперативности, точности и затрат на создание программно-аппаратных комплексов при адекватном качестве (по экспертным оценкам) получаемых решений.

Развитие предложенного подхода к моделированию и решению задач сегментации состоит в разработке параметрических и диалоговых методов обучения, а также моделей и методов сегментации цветных и размытых изображений, сингулярных объектов и изображений с неявными фрагментами границ.

Литература: 1. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320с. 2. Стрелец В.М. Имитационный анализ системы “человек-машина” как метод эргономической оценки функционирования аварийных служб// Радиоэлектроника и информатика. 2001. №3. С. 125128. 3. Rudel T.K., Bates D., Machinguiashi R. A Tropical Forest Transition// Annals of the Association of American geographers. 2002. Vol. 92, N. 1. P. 87-102. 4. Сергієнко .В. 50 років Української інформатики // Доповідь академіка НАН України І. В. Сергієнка // Вісн. НАН України. 2002. №3 . С. 10-17. 5. Woo R, Habbal S.R.The Origin of the Solar Wind // American Scientist. 2002. Vol. 90. N.

6. P. 532-539. 6. Hogan C.J. Observing the Beginning of Time// American Scientist. 2002. Vol. 90. N 5. P. 420-427.

7. Вельховер Е.С., Ананин В.Ф. Иридология: теория и методы. М.: Изд-во РУДН и Биомединформ, 1992. 296с.

8. Мунтян В. О., Смеляков К. С. Багатофракційна електронно-світлова сепарація насіння за його забарвленням // Праці Таврійської державної агротехнічної академії. Мелітополь: ТДАТА, 2002. С. 51-55. 9. Верескун О.В., Мегель Ю.Е., Путятин В.П. Моделирование эталонов эмбрионов // Проблемы бионики. 2002. Вып. 53. С. 79-86. 10. Коваленко А.И., Мунтян В.А., Путятин В.П. Математические модели семян по классификации Ульриха // Проблемы бионики. 2002. Вып. 53. С. 70-78. 11. Фор А. Восприятие и распознавание образов. М.: Машиностроение, 1989. 31 с. 12. Батий Л.В., Левагина С.И. Анализ математических методов поддержки принятия решений / / АСУ и приборы автоматики. 2002. Вып 120. С. 72-76. 13. Смеляков К. С. Модель эталонного изображения объекта и критерий дискриминации для задачи сегментации изображений // Системи обробки інформації. 2000. Вип. 3(9). С. 97-99. 14. Кроуэлл Р, Фокс Р. Введение в теорию узлов. М.: Мир, 1967. 348с. 15. Препарата Ф, ШеймосМ. Вычислительная геометрия. М.: Мир, 1989. 478с.

Поступила в редколлегию 15.04.2003

Рецензент: д-р техн. наук, проф. Стасев Ю.В.

Путятин Евгений Петрович, д-р техн. наук, профессор, зав. кафедрой информатики ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 702-14-19.

Смеляков Кирилл Сергеевич, аспирант кафедры информатики ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 702-14-19.

130

РИ, 2003, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.