Научная статья на тему 'МЕТОДОЛОГИЧЕСКИЕ ПОДХОДЫ К КОНТУРНОЙ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ В АВТОМАТИЗИРОВАННЫХ ПРОИЗВОДСТВЕННЫХ СИСТЕМАХ'

МЕТОДОЛОГИЧЕСКИЕ ПОДХОДЫ К КОНТУРНОЙ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ В АВТОМАТИЗИРОВАННЫХ ПРОИЗВОДСТВЕННЫХ СИСТЕМАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
27
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ / КЛАССИФИКАЦИЯ / МЕТОДЫ / КОДИРОВАНИЕ / СТРУКТУРЫ ДАННЫХ / ГРАФОВЫЕ МОДЕЛИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гагарина Лариса Геннадьевна, Колдаев Виктор Дмитриевич

Выявлены основные направления и тенденции контурной сегментации изображений, определена система кодирования контуров, этапы становления новаций и методологические ориентиры. Проведен анализ графовой модели сегментации изображений, и предложены критерии оценки качества алгоритмов сегментации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гагарина Лариса Геннадьевна, Колдаев Виктор Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODOLOGICAL APPROACHES TO IMAGE CONTOUR SEGMENTATION IN AUTOMATED INDUSTRIAL SYSTEMS

The basic directions and tendencies of the images contour segmentation have been revealed; the contours coding system, the stages of the development of innovations and the methodological guiding points have been determined. The images segmentation graph model has been analyzed, and the criteria for assessing the quality of the segmentation algorithms have been proposed.

Текст научной работы на тему «МЕТОДОЛОГИЧЕСКИЕ ПОДХОДЫ К КОНТУРНОЙ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ В АВТОМАТИЗИРОВАННЫХ ПРОИЗВОДСТВЕННЫХ СИСТЕМАХ»

Важным этапом обработки изображения является сегментация, позволяющая выделить множество сегментов, которые покрывают изображение, или множество контуров, выделенных из него. Результаты сегментации используются для обнаружения характеристик определенного типа, измерения параметров объектов на изображении и их распознавания. Для использования в СТЗ выбор алгоритма сегментации определяется не только его точностью, быстродействием, но и программной реализацией (рис.1). Изображения электронных изделий обладают большой сложностью и многофакторностью, что обусловливает высокие требования к надежности, точности и достоверности результатов исследований.

Рис.1. Основные модули СТЗ

Непрерывное изображение может быть представлено функцией пяти аргументов: трех пространственных координат, времени и длины волны электромагнитного излучения. Упрощения модели пространственно-временных сигналов в некотором диапазоне волн f (x, y, z, t, X) приводят к моделям пространственно-временного сигнала f (x, y, z, t), пространственного сигнала fx, y, z) или временного сигнала ft). Здесь x,y,z - пространственные координаты; t - время; X - длина волны электромагнитного излучения.

При обработке изображений широко используется анализ спектра изображения, который получают прямым двумерным преобразованием функции Фурье, описывающей изображение [1]:

x > ) = { {fix y)exP(—i + ЮуУ)) dxdy,

—то —то

где Юх, юу - пространственные частоты; функция ехр [-■ (юх х + юу у)] при фиксированных значениях пространственных частот описывает плоскую волну в плоскости изображения (х, у); / = - мнимая единица. Формула связывает вещественную функцию, описывающую яркость изображения $х,у), с комплексной функцией частоты -спектром изображения Е(юх , Юу):

да да

р(юх, Юу) = | |/(х у)соКЮХх + ЮуУ)Му +

—да —да

да да

+ 1 I I(—/(X, У)sin(ЮXх + ЮуУ)) дхйУ = х , Юу ) + 1МЮх , Юу ) ,

—да —да

где К-е(юх, ю у) - реальная часть спектра; 1ш(ю х, ю у ) - мнимая часть спектра.

Обратное преобразование Фурье позволяет восстановить изображение по его спек-

да да

тру: /(х,у) = (1/4л2) I Iр(юх, Юу)ехр[/(юхх + Шуу)].

—да —да

В двустороннем (билатеральном) фильтре значения интенсивности каждого пикселя изображения заменяются средневзвешенными значениями интенсивности соседних пикселей. В отличие от гауссовой фильтрации, в которой вклад каждого пикселя в итоговую яркость в центральной точке пропорционален его расстоянию от нее, ядро двустороннего фильтра зависит не только от расстояния, но и от разности яркостей между центральной точкой и пикселями, принадлежащими окрестности. Яркость в точке (хо, уо) вычисляется по формуле

1/(х0,уо) = -1 (г(ху))(|1 (х0,уо) — 1 (ху^) 1 (ху),

™ (х, у )еБ

где

( - л2 , у,. \2 Л

^ 1

= п-ехР

^ 1

= т-ехР

I1 (Xо, уо)—1 (x, у)|

2о 2

(х — хо) + (у— уо)2 ^ _

2о 5 у 1 -\/2па 1

г( х, у) = ^1 (х — хо)2 + (у — уо)2 ; Ж - коэффициент нормализации; Б - сумма, определяемая по круглому окну заданного радиуса; о/ , оБ - параметры, задающие степень сглаживания в области значений и в пространственной области [4, 5].

В ходе исследования было выявлено, что при сегментации происходит разделение множества пикселей исходного изображения Е на п топологических связных подмножеств (кластеров, областей) £ = (5ь 52, ..., Sn}, таких что

п

и Б = р, Б, и Бу = 0 , 1 * у, V (Б, е 5) Р (Б,),

г=1

V(Si, Б у е Б; ЩБ,, SJ)) Р&иБу) , Р(Б,) = [Рк \к е К} ,

где Р(£) - предикат гомогенности для сегмента £■; К - множество факторов гомогенности изображения неоднородной сегментной структуры; Л(5;, - предикат топологической смежности сегментов и Sj. Классификацию С можно задать группой С = (М, СО, £), где М =(М^ М2, ..., Му, ...} - множество методов сегментации; СО = (О1, О2, ..., Оп} - множество из п используемых классификационных признаков;

£ - оператор классификации. Каждый классификационный признак Ох является множеством, состоящим из двух элементов (ах, Ъх} - противоположных свойств метода сегментации. Тогда декартово произведение СО всех используемых признаков (оппози-

{0 I = 1, 2, ..., 2й}:

ций) О1, О2, ..., Оп даст набор классификационных групп-кортежей

СО = (...((01 х 02) х 03) х 04...) = [0\г = 1,2,...,2й} =

= {(аь а2,..., ап ),..,(Ьь К ),...,(bl, b2,..., К )}.

В данном случае оператор классификации £ - отображение множества методов сегментации М во множество классификационных групп СО:

£ М ^ СО, £ (Му) = О1 .

Другими словами, сегментация представляет собой операцию разбиения конечного множества, на котором определена функция исходного изображения /(х,у), на к непустых связанных подмножеств ^ (/=[1,к]) в соответствии с некоторым предикатом Р, определяемым на множестве 5={51,52,...,5к). Предикат принимает истинные значения, когда любая пара точек из каждого подмножества 5^ удовлетворяет критерию однородности, основанному на оценке максимальной разности яркости отдельного пикселя и среднего значения яркости, вычисленного по соответствующей области.

В основе систем обработки изображений лежит разработка изменяющейся во времени экстенсиональной модели предметной области и аналитическая формализация, направленная на решение конкретных задач. При выборе способа представления областей возникает следующая альтернатива представления: внешними характеристиками (границей, контуром); внутренними характеристиками (совокупностью элементов изображения, составляющих область). В результате анализа существующих методов в соответствии с информационной системой признаков в работе предложена классификация сегментации изображений (рис.2).

Рис.2. Классификация методов сегментации

Методы выделения контуров изображений разбиваются на три группы: пространственное дифференцирование, функциональная аппроксимация, высокочастотная фильтрация.

Общим для всех методов является стремление рассматривать границу как область резкого перепада функции яркости изображения Лх,у). Отличает их вводимая математическая модель понятия контура изображения и алгоритм поиска краевых точек. В процессе развития систем обработки изображений появилось несколько концепций и подходов к представлению изображений и большое количество структур данных для реализации этих представлений [4, 5].

В методе полигональной аппроксимации итеративно строится такой многоугольник, который содержал бы минимальное число вершин и в то же время представлял фигуру с заданной точностью (рис.3).

а б

Рис.3. Полигональная аппроксимация (а) и построение ломаной контура (б)

При полярном кодировании контуров осуществляется сканирование контуров из центра масс радиальными лучами через равные углы (рис.4).

а б

Рис.4. Полярное (а) и цепное (б) кодирование контура

Угловые коды, обладая инвариантными свойствами относительно операций переноса и поворота, обеспечивают получение обобщенных характеристик для представления контуров изображений (рис.5).

а О

Рис.5. Метод углового кодирования (а) и топологического задания контура (б)

Пусть Ф = {£г - угловой код длины т; ^ - 1-й элемент кода (для прямоугольной

решетки {2,3,4,5,6}). Прямая, совпадающая с вертикалью, горизонталью или диагональю, задается в угловом коде последовательностью элементов прямоугольной решетки. Отклонение от прямой для 1-й точки кода Сг = 5 — . Оценить кривизну /-го элемента можно как

Чг = Е Су тоё

т,

у=г

где 11 - длина кодовой записи, на которой рассчитывается кривизна.

При вычислении кривизны для всех точек контура участком длиной 11 осуществляется сканирование вдоль всего углового кода контура. Отсюда получаем

Ч1 = 51 — £

(г—

)тоёт

— Е тоё т.

7=2+1—

Для следующего элемента кода: Ч(

г+1)тоёт

= 511 — Е тоё т — £

7=2+1—

(г+1+

)тоёт

Сравнивая выражения, получаем оценку кривизны в рекуррентном виде:

Ч(г+1)тоёт = Чг + £

(г—

— £ )тоёт (г+1+

)тоёт

Оценка q представляет собой сумму отклонений С на участке контура 11 (все отклонения суммируются с единичными весами). Изменять веса можно, используя оценку кривизны второго порядка, для получения которой участок длиной 12 сканируют

вдоль контура с учетом полученной ранее оценки q: Ц = Е Ч

] тоёт '

}=г -

2

2

I

2

г +

2

Величина Qi представляет собой сумму отклонений с весами, возрастающими от единицы до центра участка сканирования:

' к' " к ' -1 ' к' " /1'

+ г + +

_ 2 _ _ 2 _ _ 2 _ _ 2 _

а = Е С

к шо^

+

Е С

к шodт

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ ... +

Е С

к шodт

+

ЕС

к modт

к=1 -

" к' " 1' к=г - ' к ' " 1 ' +1 к=г - ' к ' " к ' -1 к=г - ' к' " к'

_ 2 _ _ 2 _ _ 2 _ _ 2 _ _ 2 _ _ 2 _ _ 2 _ _ 2 _

Максимальный вес в центре участка сканирования достигает величины 2[/2 /2] +1. Длина участка сканирования при этом равна 2[^ /2] + 2[/2 /2] +1, а количество отклонений в центре участка сканирования составляет 2{[^ /2] — [/2 / 2]} +1. При оценке кривизны более высоких порядков учитываются отклонения точек с различными весами:

а = Е

5/1 — Е $

к=]—

к шodm

В итоге получаем рекуррентную формулу, связывающую Qi и Q¡

(г +1)шodm

= & + $

(г +

" к' " к '

_ 2 _ _ 2 _

— $

)modm (г + 1+

г+1:

)шodm

Применение графовых моделей для обработки изображений в реальном времени упрощает решение прикладных задач благодаря возможности макетирования высокоуровневого алгоритма обработки зрительных данных для задач СТЗ. Идея, положенная в основу алгоритма трассировки, состоит в расщеплении вершины графа, которая участвует в создании цикла, на две или более частей. Это соответствует разделению (дог-легу) горизонтального сегмента на два или более новых сегментов. Варианты доглега отличаются друг от друга способами перераспределения контактов горизонтального сегмента между новыми сегментами. Местоположение контактов определяет существование и ориентацию ребер между соответствующими вершинами УУИ (У, И - соответственно вертикальный и горизонтальный сегмент). Если контакты расположены один над другим в соседних вертикальных слоях, что может иметь место в канале УУИ, то порядок соответствующих им горизонтальных сегментов может быть представлен в графе дополнительными ребрами (рис.6).

г +

+

г +

+

г +

>

2

2

/1

/

+

2

Оценка качества алгоритмов сегментации осуществляется с помощью показателей чрезмерной и недостаточной сегментации: FPR = ^2 ; FNR = 8 ^ ^2 . Общая

и 2 и 2

ошибка сегментации: МА= РРК + РЫК, где 51 - результат сегментации, полученный с помощью одного из методов сегментации; 52 - сегмент, построенный экспертом;

SC - контур сегмента, полученный с помощью одного из методов сегментации; - построенный экспертом контур сегмента [6, 7].

Интегральный показатель качества (ИПК) низкочастотной яркостной составляющей изображения имеет вид

ИПК = 0,33Ьп + 0,27аи + 0,2Кп + 0,13^+0,07вп,

N W

X XL

xy

L = ^^-; Ln =<

HW n

(L - L )

T/- v max mm/ .

^n=—255—;

L

1281 (255 - L )

128 1,

если

L < 107;

если L > 147; если L e (107...147);

— , если g < 50;

50 (100 - g)

N =

50

если g > 50;

N 256

где L - средняя яркость изображения; H, W - высота и ширина изображения; Lxy - яркость элемента изображения с координатами x и y; Nn - нормализованное значение числа информационных уровней; Kn - нормализованный параметр контраста; Ln - границы нормализованного значения средней яркости; on - среднеквадратическое отклонение. Частные критерии можно разбить на группы по приоритетам: (L, g), (L, N) и (в). Энтропия стоит на последнем месте вследствие ее наименьшего влияния на визуальное качество изображения.

Разработанный подход позволяет обобщить различные способы построения описаний систем, объединяет микро- и макроподходы в проектировании, делает возможным формализацию построения модели проектируемой системы обработки изображений, а также создает формальный аппарат проектирования СТЗ на стадии построения их описания.

Литература

1. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. - М.: Вильямс, 2004. - 928 с.

2. Сойфер В.А. Компьютерная обработка изображений. Часть 1 // Соросовский образовательный журнал. - 1996. - № 2. - С. 118-124.

3. Сойфер В.А. Компьютерная обработка изображений. Часть 2. Методы и алгоритмы // Соросовский образовательный журнал. - 1996. - № 3. - С. 110-121.

4. Колдаев В.Д. Эвристические алгоритмы контурной сегментации изображений // Изв. вузов. Электроника. - 2007. - № 4. - С.71-75.

5. Колдаев В.Д. Методы формирования признаков изображений // Научная мысль информационного века: Materialy X Mi^dzynarodowej naukowi-praktycznej konferencji «Naukowa mysl informacyjnej powieki -2014» (07-15 marca 2014 roku). Vol. 27. Matematyka, Fizyka. - Przemysl : Nauka i studia, 2014. - С. 50-54.

g n =<

6. Колдаев В.Д. Анализ контурной сегментации изображений в автоматизированных производственных системах // Оборонный комплекс - научно-техническому прогрессу России. - 2008. - Вып.4. -С.54-59.

7. Морозова Н.В., Смирнов А.В., Чжи Я Аунг. Коррекция изображения при выводе на печатающее устройство // Изв. вузов. Электроника. - 2010. - № 1. - С.90-92.

Статья поступила 4 апреля 2014 г.

Гагарина Лариса Геннадьевна - доктор технических наук, профессор, зав. кафедрой информатики и программного обеспечения вычислительных систем МИЭТ. Область научных интересов: автоматизация технологических процессов и производств, разработка автоматизированных информационных систем, проблемы высшего технического образования, международная мобильность кадров высшей квалификации.

Колдаев Виктор Дмитриевич - кандидат технических наук, доцент кафедры информатики и программного обеспечения вычислительных систем МИЭТ. Область научных интересов: выделение, идентификация и распознавание изображений в автоматизированных производственных системах; разработка процедурных алгоритмов сегментации изображений; анализ и формирование информационных массивов в системах принятия решений при создании изделий электронной техники. E-mail: koldaev.v@mail.ru

КРАТКИЕ СООБЩЕНИЯ

УДК 621.38.049.77

Интегральный антенный элемент со встроенным усилителем 5-мм диапазона длин волн на основе гетероструктур ЛЮаК/ОаК

П.П. Мальцев, О.С. Матвеенко, Ю.В. Федоров, Д.Л. Гнатюк, Д.В. Крапухин, А.В. Зуев, С.Л. Бунегина

Институт сверхвысокочастотной полупроводниковой электроники РАН

В настоящее время освоение диапазона 60 ГГц стимулируется, прежде всего, коммерческими потребностями производителей компьютерной, бытовой электронной техники, систем ограничения доступа и охранных систем [1, 2]. Важным техническим преимуществом данного диапазона является возможность интеграции антенн в систему на кристалле, реализующую устройство в целом. Использование диапазона 60 ГГц в сетях передачи данных позволяет создавать не взаимодействующие друг с другом сети, так как из-за высокого поглощения радиоволн данного диапазона в атмосфере обеспечивается скрытность каналов связи.

Усилитель имеет 4 каскада, построенных по схеме с общим истоком. Размеры усилителя составляют 2,26 х 1,15 мм (рис.1).

Смещение

на затворы

Рис.1. Топологический проект 4-каскадного усилителя

Расчеты проводились с применением электродинамического моделирования полного топологического проекта в САПР ADS при помощи метода моментов. Расчетный коэффициент усиления в диапазоне 57-64 ГГц составляет 16-21 дБ, коэффициент стоячей волны по напряжению (КСВН) по входу и выходу меньше 2 (рис.2). Усилитель имеет коэффициент шума ~ 6,4 дБ и мощность больше 100 мВт.

© П.П. Мальцев, О.С. Матвеенко, Ю.В. Федоров, Д.Л. Гнатюк, Д.В. Крапухин, А.В. Зуев, С.Л. Бунегина, 2014

i Надоели баннеры? Вы всегда можете отключить рекламу.