ИНФОРМАЦИОННЫЕ
УДК 519.673
МОДЕЛЬ И МЕТОД РЕШЕНИЯ ЗАДАЧИ СЕГМЕНТАЦИИ ТИПОВЫХ ИЗОБРАЖЕНИЙ НЕРЕГУЛЯРНОЙ ФОРМЫ
ПУТЯТИНЕ.П., СМЕЛЯКОВ К.С.______________
Рассматриваются модель и метод решения задачи сегментации типовых изображений нерегулярной фор -мы, возникающей при обработке цифровых снимков земной поверхности и иных объектов (радужки глаза, семян, микробиологических объектов), которые предназначены для повышения эффективности систем обработки данных по оперативности, точности и экономичности.
1. Постановка проблемы
Под изображением объекта понимают структурированную информацию о его геометрической форме и распределении яркости, которая может быть получена в результате обработки цифрового снимка с помощью цифровой камеры или оцифровки аналоговой фотографии. Регистрация объекта производится на некотором фоне; для этого используются излучения различной природы (электромагнитные, рентгеновские и др.), но чаще всего рассматривается диапазон длин волн видимого спектра. При этом под сегментацией понимают [1] выделение изображения объекта из цифрового снимка, а под распознаванием — сегментацию и классификацию изображений по некоторым признакам.
Возможности современной техники получения качественных цифровых снимков при сравнительно малых затратах способствуют развитию средств их программной обработки в целях автоматизации исследования объектов по их цифровым изображениям, которые все шире применяются в различных прикладных областях.
Однако до настоящего времени основное внимание уделялось распознаванию изображений с использованием эталонов или объектов, геометрическая форма которых известна. В то же время при проведении аварийно-спасательных [2] и нефтегазопоисковых [www.scanex.ru/rus] работ, при анализе экологического состояния регионов [3], мониторинге и прогнозировании последствий чрезвычайных ситуаций (пожаров, наводнений и др.) по данным дистанционного зондирования Земли с Украинских спутников “Січ-1” и “Океан-О” [4], а также во многих иных задачах, связанных с
обработкой цифровых снимков земной поверхности, Солнца и дальнего космоса [3-6], возникает необходимость распознавания изображений нерегулярной формы (т.е. невыпуклых объектов, эталоны для которых отсутствуют) по их яркости; например, новых лесов, солнечных пятен, областей радиоизлучения. Та же проблема возникает в биологии, медицине и других областях при компьютерном анализе радужки глаза [7], семян [8], микробиологических объектов [9]; например, при сегментации эмбриона и его компонент — бластомеров.
Поэтому отсутствие адекватных математических моделей, методов и компьютерных технологий решения задач сегментации для объектов нерегулярной формы существенно сдерживает развитие систем автоматизации решения актуальных задач распознавания изображений в различных областях либо снижает их эффективность в отношении оперативности, точности и экономичности вследствие необходимости привлечения специалистов на этапе ручной обработки подобных данных.
Эта ситуация порождается, прежде всего, сложностью идентификации формы исследуемых объектов и их изображений, которая, с геометрической точки зрения, не описывается “стандартными” фигурами, а топологически может представлять неодносвязную область.
Поэтому, в силу неполной формализации образуемых типовыми объектами связных структур, которые могут представлять невыпуклые области с “выколотыми” подобластями, большинство существующих подходов к сегментации нерегулярных изображений [9-11] как необходимую фазу анализа включают трудоемкие и дорогостоящие этапы ручной обработки данных, к которым привлекаются эксперты в целях учета особенностей частных задач распознавания изображений и проверки адекватности результата. В итоге “предложено великое множество методов классификации и распознавания, причем число различных подходов к решению проблемы равняется, фигурально, сумме количества конкретных задач и числа исследователей, решающих эти задачи” [11].
В этом отношении проблема распознавания изображений сводится к двум взаимосвязанным аспектам сегментации: выделению базовых односвязных нерегулярных областей и образуемых ими структур (типовых изображений), поскольку решение задачи классификации (по форме и метрическим характеристикам) может быть получено лишь при наличии унифицированной системы подобных моделей для задачи сегментации; например, на основе использования известных методов поддержки принятия решений [12].
Эти два аспекта сегментации являются общими для всех прикладных задач рассматриваемого класса (отличие состоит в том, что привязка объектов производится к карте региона, зонам радужки или эмбриона и т.д.). Типовая, в смысле общности форм рассматриваемых объектов [3-8], но более наглядная для описания задача возникает в иридодиагно-
124
РИ, 2003, № 2
стике [7], где по снимку радужки, полученному с высоким разрешением, выделяются иридознаки и иные элементы произвольной геометрической формы, эталоны для которых отсутствуют. Сегментация и распознавание этих знаков в настоящее время производятся вручную: специалист накладывает на полученный снимок схему проекционных зон тела человека (рис.1), выполненную на прозрачной пленке, и определяет конфигурацию основных зон радужки и имеющиеся на ней ири-дознаки (по типу, локализации и количеству). Соотнесение выделенных на снимке зон и знаков со схемой проекций зон (рис.2) позволяет диагностировать состояние здоровья.
Рис. 1.Распре деление проекционных зон по радужке
2 1 ? ’ 2 э , _і_*-L_7 З
Рис. 2. Схема проекционных зон тела человека на левой радужке (по F. Roberts)
Таким образом, для актуальной задачи сегментации типовых изображений нерегулярной формы необходимо разработать эффективную (по точности, трудоемкости и затратам памяти) систему моделей и методов ее решения с учетом критериев и ограничений, характерных для прикладных задач.
2. Модель области изображения
Построим модель входного изображения, под которым понимают цифровое изображение поля зрения, полученное при стандартных условиях фотосъемки и при ограничениях, характерных для сегментации типовых изображений объектов.
Пусть D — область входного изображения, заданная совокупностью узлов D = {dij = (i, j)}, i = 0,...,M,
РИ, 2003, № 2
j = 0,..., N, прямоугольной равномерной решетки r на плоскости R , образующие которой параллельны осям координат. В случае введения системы окрестностей на D узлы решетки определяют точки топологического пространства, а при их отображении на плоскость — точки в R2 , которые могут использоваться для аппроксимации и оценивания метрических характеристик областей.
Полутоновым входным изображением Ed называется совокупность
Ed = [Fd,D] , (1)
где Fd — функция яркости входного изображения, заданная распределением Fd = {(i,j,fy)} значений яркости fjj, 0 < fjj < A, в узлах dy области D .
Цветным входным изображением Ed называется совокупность трех полутоновых изображений вида (1), соответственно в красном, зеленом и синем спектре:
Ed = {eD} , k = 1,2,3 , (2)
которое определяет стандартное представление цветного входного изображения после оцифровки.
Тогда считаем, что во входном изображении (2) сегментировано Q изображений Eq, если они удовлетворяют системе
' Eq = {Eq = [Fqk,Dq]};
Dq c D;D Dy = ф при E, Ф ц;
Fq = fD на Dq, F,k = 0 на D\Dq; (3)
k = 1,...,3; q = 1,2,...,Q;
где Dq — область изображения объекта Eq, а {Fq }
— совокупность его функций яркости.
Соответственно, к фону относят множество узлов, не входящих в области изображений объектов:
D0 = D \ и Dq . (4)
q=1,Q 4
После оцифровки полутонового аналогового снимка (рис. 3) анализ яркости не позволяет однозначно отнести точки, лежащие вблизи границ изображений, к фону или изображениям объектов.
q ц+-1 ц+-2 ц + З ц + d q Т) + 1 Т) + 2 ц + 3 тщ + 4
5 I * Г* Г* Г* г.
?+1..........
f+s ' | * | ■ * *
W * |~* •
а б в
Рис. 3. Оцифровка полутонового изображения:
а — аналоговое изображение поля зрения; б — дискретизация области аналогового изображения; в
— квантование аналогового изображения по яркости (получение цифрового полутонового изображения)
Поэтому выбор критерия сегментации и настройка его параметров представляют отдельную задачу [13], которая рассматривается ниже. В случае цвет-
125
ных изображений дополнительно должен быть введен критерий согласования границы изображения по результатам его сегментации в различных спектрах. Поэтому, если не оговорено иное, далее рассматриваются полутоновые изображения.
Введем дискретные аналоги понятий, необходимые для описания связности изображений.
В топологии область q , лежащая на плоскости, называется односвязной [14], если непрерывной деформацией любая петля в ней стягивается в точку; подобная область имеет тип диска (рис. 4,а). При этом линейно связное множество с n +1 компонентой границы имеет топологический тип диска с n дырами (рис. 4,б, в), а ее фундаментальная группа является свободной группой C(n).
В практически значимых случаях эти границы определяют выколотые области-диски (рис. 4,б) с границами, гомеоморфными окружности, а топологические типы области и ее замыкания совпадают.
Поэтому далее не рассматриваются границы, имеющие сингулярные компоненты типа “точка” или “линия” (рис. 4,в), или точки ветвления (рис. 4,г). Тогда с топологической точки зрения любая область изображения q на плоскости рассматривается с присоединенной границей и имеет тип диска сn дырами {го;};—i,n , n > 0 (на рис. 4,б n = 3 ):
Q = ClШо \ u Ю;;
i—1,n
Cl ®i C®0, Cl ®i n Cl ю j = 0,
(5)
і Ф j, i,j = 1,...,n;
где юі,і = 0,...,n, — диски; Cl — операция замыкания. Диск юо называется носителем, а его граница Frюо — внешней границей Fr0 Q области Q; границы Frcoj, і = 1,...,п, назовем внутренними.
Рис. 4. Топология областей на плоскости
Изучение диска с n дырами исчерпывающим образом определяет топологическую модель рассматриваемых областей и, посредством (5), задает их структуру (по вложению) и топологическую классификацию. Рассмотрим, каким образом эту топологию можно перенести на d .
Точки dij,є D называются 4-, соответственно, 8-связными (рис. 5) при выполнении условий [1]
[ф Ч| = 1) А ф-ц\ = 0)] V [(|i-%\ = 0) Л ф-ц\ = 1)]; max{|i -S\ ,|j -ц\ } = 1.
Если не оговорено иное, считаем точки смежными, если они 4-связны. Множество G с D назовем
связным, если для всякой пары точек dipd^ є G в G существует последовательность смежных точек с началом и концом в dij, d. Далее считаем, что рассматриваемые области связны.
Элементарная окрестность точки dij є D включает ее саму и множество смежных ей точек (рис.5,а); для этих пяти точек точка dij является внутренней. Соответственно, точка dij є G является внутренней для множества G с D , если ее элементарная окрестность лежит в G. Исходя из этих базовых определений, приходим к соответствующим понятиям окрестности, внутренности Int G , граничной точки и границы FrG множества G с D (рис.6), а также изолированной точки.
Рис. 5. 4- и 8-связность точек в D
Рис. 6. Область G типа диск с одной дырой; ее границы выделены черным
Если компоненты границ множества G с D попарно не имеют 8-связных точек, то они отделимы в G, например, петлями, т.е. замкнутыми последовательностями p смежных точек. Поэтому область G рассматривается с присоединенной границей и имеет представление (5).
При указанных допущениях введенные понятия связности (включая односвязность и неодносвязность) и окрестности для дискретного пространства множеств в D порождают ту же топологию связности, описываемую группой C(n), что и диск с n дырами, если в качестве операций деформации в IntG рассмотреть замену пути ... (i,j),(i +1,j),(i, j)... на вырожденную петлю ... (i,j)..., а пути ... (i,j),(i + 1,j),(i + 1,j +1)... - на путь ... (i,j),(i,j +1), (i +1, j +1)..., или наоборот.
Поэтому понятие диска с дырами определено и для пространства D с введенной топологией окрестно-
РИ, 2003, № 2
126
стей. В частности, для диска с n дырами G с D , как для случая на плоскости, определены внешняя и внутренние границы. Заметим, что компоненты границы множества G с D в общем случае 8-связны, а “дырки” представляются областью или, в предельном случае, изолированной точкой.
d -Отрезком d(ij,, соединяющим точки dy , d^ є D, назовем множество точек из D , которые лежат на отрезке dij dє R2 ; d -отрезокd(ij,£ц) принадлежит множеству G, если каждая его точка принадлежит G. Тогда область G называется выпуклой, если для любой пары точек dij, dє D d -отрезок d(ij, |ц) принадлежит G .
Введем понятие выпуклой оболочки Conv G множества G с D с границей g = Fr0 G, заданной последовательностью 8-связных точек. Отобразим G с D на плоскость; тогда вершины g' ломаной, геометрически определяющей границу выпуклой оболочки множества g, с линейной трудоемкостью могут быть получены как подпоследовательность g с использованием алгоритма Ли [15]. Далее, в d -отрезках, определяемых последовательностью вершин из g', удалим внутренние точки. Полученная последовательность g* задает вершины ломаной, определяющей выпуклую оболочку для G в R2 ; эту же последовательность принимаем за Conv G (отмечено черным на рис. 7).
Рис. 7. Область G типа диск с одной дырой. Вершины выпуклой оболочки отмечены черным
Изображение объекта, заданное на односвязной (связной) области, назовем элементарным (типовым); изображение, определенное совокупностью типовых изображений с непересекающимися носителями, назовем композиционным.
Тогда трехуровневая иерархическая классификация изображений, актуальных для прикладных задач, по топологическому типу определяющих их областей характеризуется тем, что композиционное изображение представляется объединением типовых изображений, а последние, в свою очередь, — вложением (5) элементарных дисков в носитель.
3. Модель функции яркости изображения
С учетом точности исходных данных и требований вычислительной эффективности моделей и методов сегментации изображений двумерная интерполяция или аппроксимация порядка, выше второго, не используется. Вместо этого значения функции яркости fij, заданные в точках области Dq с D , аппроксимируются вдоль образующих решетки R . Для этого используется система регрессионных уравнений Фq = (Фі (x), фj(y)}, где x, у принимают значения координат узлов решетки R . В общем случае функция z = Фі (x) для среза по строке і имеет неявное представление:
a5 • x2 + a4 • z2 + a3 • x • z + a2 • x + aj • z + a0 = 0 . (6)
В зависимости от особенностей функции Fq , определяемых спецификой прикладных задач, рассматривают равномерную, линейную, параболическую, коническую или сферическую аппроксимацию. При выборе класса уравнений регрессии, образующих систему Ф q , учитывается уровень искажения исходного распределения яркости низкочастотным шумом. С этой целью при выборе функционального класса модели регрессии (6) может использоваться критерий Фишера, а в качестве оценки точности аппроксимации (6) — среднее отклонение Д от регрессии и его дисперсия.
Тогда иерархическая классификация изображений по классу уравнений регрессии, аппроксимирующих функции яркости, в целом определяется пятью уровнями — сферической, конической, квадратичной, линейной и равномерной моделями, хотя в случае минимизации погрешности аппроксимации А по срезам может возникнуть ситуация, когда в пределах элементарного объекта используются уравнения регрессии различных функциональных классов. Такая же ситуация может иметь место и для типовых объектов. В случае, когда квадратичная аппроксимация по срезам является избыточной, для элементарных ячеек может применяться двумерная линейная аппроксимация вида z = a • x+b • у + c .
4. Задачи сегментации и методы их решения
Таким образом, общая модель изображения объекта включает два элемента — модель области и модель функции яркости. Рассмотрим основные критерии, которые могут быть применены при сегментации с учетом особенностей изображений.
Поскольку при пересечении геометрической границы объекта функция яркости (для внутренних точек объекта и фона) претерпевает скачок, аналогичный скачок имеет место и для значений (fij} при движении по срезам. К идентификации этих граничных точек объектов, в конечном счете, и сводится сегментация изображений объектов. Однако основная проблема состоит в том, что вследствие неравномерности освещения и бликов, дискретизации аналогового снимка и действия иных факто-
РИ, 2003, № 2
127
ров, совокупность которых для краткости назовем шумом, границы объектов могут быть искажены по линейным размерам и размыты по яркости при слабом различии между фоном и объектом. Поэтому введем некоторые допущения о распределении функции яркости по срезам.
Не теряя общности, будем считать, что яркость фона, в среднем, ниже, чем яркость объектов (иначе достаточно инвертировать входное изображение). Для краткости индексации положим, что рассматривается срез i, а номер столбца j для точек (i,j) со значением яркости fj = fj изменяется от 1 до m .
В идеальном случае, т.е. при отсутствии шумов или наличии для них точных аналитических моделей, выделение фона не представляет труда и сводится к построению областей равного уровня яркости. На практике этот подход неприемлем, но с достаточной степенью точности влияние шума и трендов для фона можно учесть, рандомизируя модель изображения посредством представления яркости фона входного изображения функцией вида
fB(j) = fB + e , (7)
где fB — константа, а e — нормально распределенная случайная величина, N(0, ст ), с нулевым математическим ожиданием и дисперсией ст2. При этом не исключается, что в пределах области D значение fB может иметь слабо выраженную линейную зависимость от j, статистически не значимую в пределах областей, по размеру сопоставимых с элементарными объектами. Соответственно, функция яркости элементарного объекта O описывается функцией вида
fo(j) = Ф0) + E, (8)
здесь фО) — выпуклая функция (уравнение регрессии из (6)), определяющая яркость объекта в точках j среза i, а E — величина типа N(0,ст2).
Пусть входное изображение содержит единственное элементарное изображение О. Тогда базовая задача сегментации изображений нерегулярной формы состоит в следующем.
Задача 1. С заданной доверительной вероятностью р идентифицировать все точки jj, ... , jk области О элементарного изображения в срезе i при условии, что функции яркости объекта и фона описываются моделями (7), (8).
Доверительный интервал для значений функции яркости в точках j можно оценить следующим образом:
lB(j) = fB ±eB; sB = s • ta/2;n-l/Vn^I; (9)
Io(j) = 9(j) ±eo; eo = so •ta/2;n-1 Л/п^1 , (10)
где s (so) — оценка для ст (ст0); ta/2;п_1 — квантиль распределения Стьюдента; а = 1 - р , а n — число точек j, по которым производится оценка.
Обозначим j ^ O , j ^ B операции отнесения точки j к объекту и фону, соответственно, и рассмотрим критерий
_ I j ^ O, если fj > fB +є B;
R0 =1 • B j B B (11)
[ j ^ B в противном случае.
Если во внутренней области объекта О интервалы (9), (10) не пересекаются, назовем объект контрастным; для них критерий (11) дает решение задачи 1. Ситуация, когда интервал Ib (j) содержит функцию 9(j) для всех точек объекта О, соответствует отсутствию решения задачи 1 в смысле не значимого отличия объекта от фона. Этот случай определяет “неявное” изображение ввиду значительных шумов или близости объекта и фона по яркости.
При наличии точек объекта, не попадающих в интервал Ib (j), назовем его изображение (и границу) размытым. В этом случае байесовское отношение правдоподобия принадлежности точки j объекту и фону примет вид
P(O,B) = — exp
CTo
(fj-qj)2 + fi- fB)2
2ct2 2ct 2 ,
(12)
и задаст следующий критерий дискриминации для точки j :
Ri =
j ^ O, если P(O,B) > 1; j ^ B в противном случае.
(13)
Для размытого изображения предлагается следующий метод решения задачи 1. По критерию Ro находим связную последовательность точек j1, j2 , ... , jn , принадлежащих объекту ввиду введенных допущений n > 1. По этим точкам получаем уравнение регрессии ф(х) по (6). В окрестности точки j 6(jbjn} применяем, соответственно ситуации, критерий Ro или R1, либо, в случае их неадекватности, находим решение j * уравнения ф(х) = fB, которое задает граничную точку объекта (предшествующую j1 либо следующую после jn , соответственно ситуации). Доопределив точки между граничными и внутренними, в результате получаем связную последовательность точек j) , j'2 , ... , jn среза i, определяющих решение задачи 1 для размытого изображения объекта.
Для решения задачи 1 необходим этап обучения в целях определения параметров яркости объекта и фона. Фон может иметь не только случайную составляющую, но слабо выраженную регрессионную зависимость от j, а вблизи границы контрастных и практически важных размытых изображений объектов, как правило, имеет место скачок яркости.
Поэтому для оценивания параметров функции (7) (и предварительной идентификации границ объек-
128
РИ, 2003, № 2
тов) предлагается использовать метод экспоненциальных средних, начиная просмотр значений яркости f j с точки j = 1 ( и, в сторону убывания, начиная
с j = jk ) До первого значимого нарушения тренда, определяющего скачок яркости на границе объекта. В результате, если срез i проходит через объект, получаем выборку для оценки параметров (7), (8) фона и объекта, иначе — только фона.
Таким образом, предложенная процедура обучения и критерии дискриминации позволяют сегментировать элементарное изображение в условиях параметрической настройки, автоматической или принудительной, посредством задания порогов и предельных погрешностей для доверительных областей, включая уровень значимости а . Рассмотрим теперь задачу сегментации типовых изображений нерегулярной формы при следующих предположениях, допускающих естественное распространение на инверсные ситуации по яркости.
Задача 2. С заданной доверительной вероятностью Р идентифицировать все точки ji, ... , jk области О типового изображения в срезе i при условии, что функции яркости элементов объекта (дыр и носителя) и фона удовлетворяют условиям (7), (8), причем уровни яркости дыр доминируют над носителем, а яркость носителя выше яркости фона.
Метод решения этой задачи основан на ее сведении к системе однотипных базовых задач сегментации элементарных нерегулярных изображений.
Этап обучения. Сканируем срез и по описанному выше методу оцениваем параметры фона; в результате все его точки разбиваются на два подмножества, относящиеся к фону и носителю. Далее, сканируя точки в пределах носителя, с помощью метода экспоненциальных средних выявляем границы дыр (если имеются); эта процедура корректна, поскольку контрастность фона (понимаемая как производная от яркости) в пределах дыры или носителя ниже контрастности (как разности значений) в окрестности границы. Заметим, что при этом не возникает сложностей с отнесением границ к дырам или носителю, так как для каждого из этих объектов они появляются парами, как скобки при записи операций.
Этап сегментации. Из области носителя исключаем точки, относящиеся к дырам, и по ним строим уравнение регрессии, после чего производим сегментацию носителя (относительно фона — т.е. решаем задачу 1). Для сегментации дыр применяем
критерий Ri к внутренним точкам дыр и носителя в целях уточнения их границ.
Рассмотрим теперь задачу сегментации типового изображения нерегулярной формы, считая, что изображение сегментировано, если определены все его точки на d (или компоненты связности границы); получение границ изображения по внутренним точкам, и наоборот, в соответствии с (5) представляет рутинную задачу.
Задача 3. При введенных выше допущениях на функции яркости и структуру изображений объектов, сегментировать изображение O нерегулярной формы.
Рассмотрим вначале метод решение этой задачи для элементарного объекта. Пусть для всех горизонтальных и вертикальных срезов по образующим решетки R идентифицированы точки {ji, ... , jk^ области O элементарного изображения. По построению каждая из этих £ последовательностей определяет d -отрезок d^ , представляющий связную последовательностью точек на одной из образующих. Обозначим O* объединение точек, входящих в эти отрезки. Тогда, если шаг решетки R достаточно мал по сравнению с диаметром объекта О, ввиду выпуклости функции яркости внутренность множества O* -связна, а граница 8-связна. Исключение могут составить выколотые точки, смежные граничным (вследствие шума) или лежащие в узких “горловинах” (если таковые имеются). Пополняя множество O* подобными выколотыми точками (смежными внутренним и граничным) до достижения связности его внутренней части, предполагаемой по условию, получим, что множество O * определяет сегментацию искомого элементарного изображения.
В случае типового объекта поступаем так же, как при сведении задачи 2 к задаче 1: вначале, с помощью описанного выше метода, сегментируем дыры в носителе типового объекта, а затем сегментируем его как элементарный объект, рассматривая его вместе с дырами относительно фона у границы носителя.
Если входное изображение содержит несколько типовых объектов, их носители, по условию, отделимы, значит, описанная выше процедура сегментации типового изображения может быть применена к каждому из них независимо.
В результате применения предложенных выше методов решения задач 1 — 3 получаем совокупность сегментированных полутоновых типовых изображений объектов, каждый из которых представлен разностью между носителем и лежащими в нем дырами. Более того, сегментированные изображения могут быть заданы как множеством точек в D , так и структурой (5) вложенных областей и/ или их границами (8-связными последовательностями точек из D). Если требуется, для дыр и носителей по предложенным методам могут быть получены вершины, определяющие их выпуклые оболочки.
В случае цветных изображений задача сводится к сегментации трех полутоновых изображений, для чего применимы предложенные в работе модели и методы, и синтезу их “общей” границы на основе различных подходов, отражающих спектральные особенности объектов, рассматриваемых в прикладных задачах.
РИ, 2003, № 2
129
5. Заключение
Использование топологических и статистических концепций позволило построить модель задачи сегментации типовых изображений нерегулярной формы при достаточно общих предположениях об их геометрической форме и распределении функции яркости, а также предложить метод решения этой задачи, основанный на этапах обучения (настройки параметров модели на фотометрические особенности прикладных объектов) и сегментации изображений, которая базируется на сведении общей задачи к сегментации элементарных изображений, определяющей структуру сегментируемых неодносвязных изображений.
Представленные в работе модели и методы сегментации объектов по их изображениям представляют самостоятельный интерес, а также актуальны для решения последующих задач распознавания, например — определения метрических характеристик сегментированного изображения (линейных размеров, площади, блеска объектов и др.) с помощью известных методов, основанных на использовании полученных описаний объектов и метрических эталонов, содержащихся во входном изображении. Кроме того, по результатам решения задачи 3 получаем иерархию вложенности сегментированных изображений, использование которой, наряду с их метрическими характеристиками, позволяет распределять сегментированные изображения по классам соответственно системе правил и признаков, заданных для рассматриваемого класса прикладных объектов.
Предложенные в работе модели и методы решения задач сегментации нашли применение при разработке программных систем распознавания изображений, ориентированных на анализ солнечных пятен, семян сельскохозяйственных культур и эмбрионов животных, и подтвердили свою эффективность в отношении оперативности, точности и затрат на создание программно-аппаратных комплексов при адекватном качестве (по экспертным оценкам) получаемых решений.
Развитие предложенного подхода к моделированию и решению задач сегментации состоит в разработке параметрических и диалоговых методов обучения, а также моделей и методов сегментации цветных и размытых изображений, сингулярных объектов и изображений с неявными фрагментами границ.
Литература: 1. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320с. 2. Стрелец В.М. Имитационный анализ системы “человек-машина” как метод эргономической оценки функционирования аварийных служб// Радиоэлектроника и информатика. 2001. №3. С. 125128. 3. Rudel T.K., Bates D., Machinguiashi R. A Tropical Forest Transition// Annals of the Association of American geographers. 2002. Vol. 92, N. 1. P. 87-102. 4. Сергієнко .В. 50 років Української інформатики // Доповідь академіка НАН України І. В. Сергієнка // Вісн. НАН України. 2002. №3 . С. 10-17. 5. Woo R, Habbal S.R.The Origin of the Solar Wind // American Scientist. 2002. Vol. 90. N.
6. P. 532-539. 6. Hogan C.J. Observing the Beginning of Time// American Scientist. 2002. Vol. 90. N 5. P. 420-427.
7. Вельховер Е.С., Ананин В.Ф. Иридология: теория и методы. М.: Изд-во РУДН и Биомединформ, 1992. 296с.
8. Мунтян В. О., Смеляков К. С. Багатофракційна електронно-світлова сепарація насіння за його забарвленням // Праці Таврійської державної агротехнічної академії. Мелітополь: ТДАТА, 2002. С. 51-55. 9. Верескун О.В., Мегель Ю.Е., Путятин В.П. Моделирование эталонов эмбрионов // Проблемы бионики. 2002. Вып. 53. С. 79-86. 10. Коваленко А.И., Мунтян В.А., Путятин В.П. Математические модели семян по классификации Ульриха // Проблемы бионики. 2002. Вып. 53. С. 70-78. 11. Фор А. Восприятие и распознавание образов. М.: Машиностроение, 1989. 31 с. 12. Батий Л.В., Левагина С.И. Анализ математических методов поддержки принятия решений / / АСУ и приборы автоматики. 2002. Вып 120. С. 72-76. 13. Смеляков К. С. Модель эталонного изображения объекта и критерий дискриминации для задачи сегментации изображений // Системи обробки інформації. 2000. Вип. 3(9). С. 97-99. 14. Кроуэлл Р, Фокс Р. Введение в теорию узлов. М.: Мир, 1967. 348с. 15. Препарата Ф, ШеймосМ. Вычислительная геометрия. М.: Мир, 1989. 478с.
Поступила в редколлегию 15.04.2003
Рецензент: д-р техн. наук, проф. Стасев Ю.В.
Путятин Евгений Петрович, д-р техн. наук, профессор, зав. кафедрой информатики ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 702-14-19.
Смеляков Кирилл Сергеевич, аспирант кафедры информатики ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 702-14-19.
130
РИ, 2003, № 2