Научная статья на тему 'Биоинспирированные алгоритмы выделения информативных признаков изображений'

Биоинспирированные алгоритмы выделения информативных признаков изображений Текст научной статьи по специальности «Математика»

CC BY
533
102
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА ИЗОБРАЖЕНИЙ / КОНТУР / ОСОБАЯ ТОЧКА / БИОИНСПИРИРОВАННЫЙ АЛГОРИТМ / IMAGE PROCESSING / CONTOUR / SINGULAR POINT / BIOINSPIRED ALGORITHMS

Аннотация научной статьи по математике, автор научной работы — Кучуганов Александр Валерьевич

Предлагаются биоинспирированные алгоритмы, основанные на достижениях современной физиологии механизмов зрения, позволяющие повысить качество выделения информативных признаков на изображении и, соответственно, анализа и извлечения знаний из изображений: оператор-анализатор локальных областей, выделяющий особые и контурные точки, а также направления на соседние контурные точки; алгоритмы корреляционной оптимизации и экстраполяционного уточнения положения особых точек, динамической адаптации чувствительности и разрешающей способности локального анализатора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article introduces the bioinspired algorithms based on achievements in modern visual mechanisms physiology. They allow increasing the quality of selecting the informative criteria on the image, analysis and extraction of knowledge from the images: operator-analyzer of local domains, selecting singular and outline points as well as the direction to the neighbor outline points; algorithms of correlation optimization and extrapolation correction of singular point position, dynamic adaptation of sensitivity and resolution of local analyzer.

Текст научной работы на тему «Биоинспирированные алгоритмы выделения информативных признаков изображений»

УДК 004.4

БИОИНСПИРИРОВАННЫЕ АЛГОРИТМЫ ВЫДЕЛЕНИЯ ИНФОРМАТИВНЫХ ПРИЗНАКОВ ИЗОБРАЖЕНИЙ

А.В. Кучуганов

Ижевский государственный технический университет им. М.Т. Калашникова, г. Ижевск Е^У: Aleks_KAV@udm.ru

Предлагаются биоинспирированные алгоритмы, основанные на достижениях современной физиологии механизмов зрения, позволяющие повысить качество выделения информативных признаков на изображении и, соответственно, анализа и извлечения знаний из изображений: оператор-анализатор локальных областей, выделяющий особые и контурные точки, а также направления на соседние контурные точки; алгоритмы корреляционной оптимизации и экстраполяционного уточнения положения особых точек, динамической адаптации чувствительности и разрешающей способности локального анализатора.

Ключевые слова:

Обработка изображений, контур, особая точка, биоинспирированный алгоритм. Key words:

Image processing, contour, singular point, bioinspired algorithms.

Существует множество программ цифровой обработки изображений [1, 2]. Их целью, как правило, является повышение качества изображения в том или ином аспекте, всевозможные манипуляции, в т. ч. ретуширование и редактирование. Одним из основных направлений обработки изображений является автоматизация решения прикладных задач, например, автоматическая векторизация чертежей, рисунков, схем. Но качество существующих векторизаторов, например: Spotlight Pro, Ra-sterVect, Vextractor, Vectory, зачастую неудовлетво-ряет пользователей из-за большого количества получаемых отрезков - в среднем в 3-5 раз больше, чем при ручной обводке. Соответственно повышается объем хранимых данных, снижается качество и возможности дальнейшего использования.

Информативными признаками называют полезную для решения некоторой задачи информацию, извлеченную из исходной информации. При этом основным критерием выбора системы признаков и способов их выделения является риск потерь. Для широкого круга задач распознавания объектов и анализа их формы с целью поддержки принятия решений чаще всего используют точки, где скачкообразно меняется яркость или цвет. Из них составляются линии контуров и границ однородных областей, а на линиях - углы, пересечения и т. п.

Д. Хьюбел и Т. Визель (Нобелевская премия, 1981 г.), исследуя механизмы зрения низших позвоночных и млекопитающих, сумели выяснить логическую последовательность переработки сигналов, поступающих из сетчатки глаза, и высказали несколько предположений относительно того, какая организация коры головного мозга могла бы это обеспечить. Новый подход не только стимулировал выдвижение гипотез о механизмах, лежащих в основе зрительного восприятия, но и воодушевил тех, кто работал на других направлениях. В 1983 г. Гордон М. Шеперд выдвинул гипотезу о том, что переработка информации внутри функ-

циональных корковых единиц не является параллельной или последовательной, как предполагалось ранее, а опирается на связи, обеспечивающие оба типа обработки. Проводимые физиологами исследования дают огромный материал для гипотез и широкое поле для исследований в области совершенствования технического зрения.

На основе биоинспирированных методов для улучшения качества выделения информативных признаков на изображении на этапе локального анализа построены:

• оператор-анализатор локальных областей, осуществляющий анализ лучей, исходящих из центрального пикселя окрестности 3x3 или 5x5, выбор направления смещения окрестности, выделение особых точек (конец ветви, разветвление, угол) и границ площадных объектов.

На этапе фрагментарного анализа:

• корреляционная оптимизация положения особых точек (ОТ) путем рекурсивного анализа зоны артефактов - дополнение метода имитации тремора зрачка глаза примата;

• инерционное уточнение положения ОТ путем экстраполяции фрагментов исходящих ветвей -метод имитации «дрейфа» зрачка глаза примата;

• «захват ОТ» - скачкообразный переход в оптимизированную особую точку, как только линия входит в зону артефактов - метод имитации «саккад» зрачка глаза примата;

• повышение чувствительности локального анализатора - если в процессе трассировки контура количество исходящих ветвей из центра локального анализатора становится меньше либо равно единице, то яркостной порог динамически уменьшается до тех пор, пока не будет найдено продолжение линии (имитация механизма аккомодации хрусталика глаза примата);

• смена уровней разрешающей способности -модель аккомодации хрусталика;

• трассировка (отслеживание) линий контура и границ областей.

4 3 2

5 gx,y 1

6 7 8

а

Рис. 1. Виды анализируемых окрестностей: а) 3x3; б) 5x5 и анализируемые лучи

Рассмотрим эти методы более подробно.

Для выделения локальных характеристик изображения по яркости анализируются два вида окрестностей заданного пикселя: окрестность R1 размером 3x3 и окрестность R2 размером 5x5 (рис. 1).

Анализ лучей, исходящих из центрального пикселя окрестности, заключается в следующем: чтобы в дальнейшем произвести идентификацию точки, необходимо проанализировать перепады яркостей в окрестностях R=1 и R=2 относительно выбранной центральной точки, введем дополнительное множество TB (Type beam) лучей, исходящих из пикселя gxy. Множество TB можно представить в следующем виде:

TB = {tb,};

Р(г;2), если (Р(гМ - Р( j > р) V

tbj =

V ej) -e(rf) < Р) Л Л (tbj- ф 255)Л(в(т/) < вО-Д))V

v (в(-ж) -в(Г2) > Р)

иначе 255,

(1)

где Р(ф - яркостьу-й точки в окрестности радиуса R=2,у'=1...16; Р - исходное пороговое значение яркости, заданное пользователем.

Формулу (1) можно интерпретировать следующим образом. Если разность яркостей предыдущего и текущего лучей больше либо равна Р, т. е. произошел спуск на темный луч, или если разность яркостей меньше порогового значения, но текущий луч темнее или равен по яркости предыдущему темному лучу, то пиксели находятся в яркостной «впадине». Яркость текущего луча заносится в множество ТВ с индексом номера луча (рис. 1). Когда текущий луч находится в яркостной впадине, он сравнивается с последующим и, если разность превышает или равна пороговому значению, он также заносится в множество ТВ.

Несколько соседних темных лучей составляют «темный» сектор, например, сектор, образованный лучами г32, г42 (рис. 2). Здесь и далее, поскольку все лучи исходят из одного центра, для краткости будем обозначать их индексом конечной точки.

Величина порога Р автоматически снижается, если хотя бы одна из соседних окрестностей принадлежит контуру, но в рассматриваемом текущем пикселе продолжение контура не найдено. Необходимо отметить, что порог Р - это единственный порог, задаваемый пользователем для обработки любых типов изображений, что соответствует требованию минимизации количества порогов.

Вычисление вектора контурной линии в заданной точке. Любой пиксель gxy изображения О может быть отнесен либо к контурам объектов на изображении, либо к множеству фоновых точек. Если очередной пиксель имеет исходящие темные сектора, то он принадлежит множеству контурных точек.

Каждый темный сектор заменяется направлением, указывающим на следующий пиксель контурной линии. Для более точного определения вектора вычисляется «центр тяжести» сектора, состоящего из соседних темных лучей. При этом считается, что чем темнее пиксель, тем выше его вес. Направление на центр тяжести считается искомым направлением контурной линии на следующий пиксель.

Множество направлений А=[а,}, исходящих из контурной точки, определяется следующей формулой для каждой а{.

а =

X ((255 - tb,) •«( j))

j=i

-, пока tb, ф 255

360, в противном случае,

где I изменяется от 1 до 8, т. к. на окрестности R2 не может быть более 8 независимых направлений одновременно.

Тогда количество ветвей КШ^ху), исходящих из точки gx.y, равняется количеству элементов множества А.

Таким образом, любой пиксель изображения мы можем отнести либо к множеству К точек объектов, либо к фону:

gX|УeK, если КЩ^гО, КсО.

Выделение особых точек. Используя полученные данные, мы можем определить тип окрестности.

М)

Рис. 2. Определение принадлежности точки к множеству темных лучей

Выделим из множества К точек объектов изображения подмножество ОТ и подмножество Ь линий объектов на изображении. Особыми точками ОТ=|о/;| будем считать точки типа разветвление, конец ветви и острый угол (рис. 3).

а 6 в

Рис. 3. Особые (узловые) точки изображения: а) конец ветви; б) разветвление; в) угол

Таким образом, точка принадлежит линиям объектов на изображении, если имеет два исходящих направления и угол между ними более 90°. На рис. 4 показан пример работы локального анализатора.

Рис. 4. Контуры, полученные рекурсивным локальным анализатором 5x5: до аппроксимации 4412 отрезков; после аппроксимации - 124 отрезка, 374 дуги

Границы площадных объектов. Эта дополнительная характеристика введена по результатам экспериментов. На аэрокосмических снимках часто встречаются площадные объекты, например, леса, озера и т. п., края которых необходимо выделить.

Аналогичная задача возникает при обработке рентгеновских, томографических и других снимков.

При стандартном режиме работы оператора анализа яркостей, находясь на границе площадного объекта, мы получим одно направление на яр-костную середину, т. е. внутрь объекта, вместо необходимых нам двух направлений по «краям» (рис. 5).

Рис. 5. Анализ границ площадного объекта

Поскольку направления по «краям» есть направления лучей на границах черного сектора, то изменим массив А так, что

а(КЖ) = а (г) и а(КЖ +1) = а(у),

если(гЬ(/) Ф 255) л(Л(1 -1) = 255) л(гЬ(у) Ф 255) л

л(гЬ(у +1) = 255) л (г - у > 5),

где изменяются 1.16 и соответствуют направлениям (рис. 1); а(/), а(1) - углы начала и конца черного сектора из пикселя ^ху); КЖ- количество ветвей из пикселя (£^), значение изменяется от 1 до 8.

То есть если ширина темного сектора линии становится, например, больше 5 пикселей, то оператор анализа окрестности данной точки автоматически переходит в режим слежения по краю и вместо одного направления на яркостную середину сектора выдает два направления движения по «краям».

При выделении фрагментов объектов на изображении используются следующие методы и алгоритмы.

Корреляционная оптимизация положения особых точек. В процессе автономного анализа локальных областей изображения, который осуществляется построчным сканированием полутонового изображения с помощью оператора-анализатора локальных областей, как правило, в области сближения, пересечения или окончания линий выделяется не одна, а некоторое компактное подмножество (кластер) особых точек, которые образуют зону артефактов. Величина этой зоны зависит от ширины линий и размеров анализирующего фильтра (3x3, 5x5 и т. д.). Отбраковка ОТ в артефактной зоне позволяет не только снизить количество «шумовых» отрезков, но и повысить качество последующей аппроксимации контуров отрезками прямых и дуг.

Дифференциация и выбор ОТ, наиболее адекватной понятию «особая точка», происходит рекурсивно, путем корреляционного (сопоставительного) анализа ОТ и поиска локального экстремума по яркости (рис. 6). Для этого из любой найденной ОТ происходит смещение на шаг Н=1 по направлениям исходящих ветвей, и если новая ОТ имеет меньшую среднюю яркость в своей окрестности, то рекурсивно вызывается данная функция. Тем самым, как-бы имитируется тремор зрачка глаза примата.

В результате весь кластер ОТ заменяется одной точкой, имеющей наиболее темную окрестность:

Зо^м/дуо),

где о/щд - точка с минимальной яркостью из множества ОТ; оіі - /-я точка из множества ОТ; /=1...к, где к количество точек в области ОТ; - функция выбора точки с минимальной яркостью из области ОТ.

Экстраполяционное уточнение особых точек, имитирующее инерционность перемещение зрачка при анализе линий («дрейфа» зрачка глаза примата), осуществляется для ОТ типа «разветвление» и «угол» путем расчета мнимой точки пересечения ветвей, исходящих из ОТ. Для этого из ранее отобранной ОТ вы-

полняется шаг Н=2 (или более) в каждом из направлений ветвей (рис. 7). В полученных точках вычисляются направления «назад» а\=а+п, где а - направление продолжения ветви. Искомая уточненная ОТ есть точка пересечения всех направлений «назад».

Рис. 7. Уточнение особой точки по пересечению исходящих ветвей

Зона артефактов

Оптимизированная

ОТ

Рис. 8. Скачкообразный переход в оптимизированную особую точку

Трассировка линий. Следующий этап второго уровня анализа изображений - трассировка и слияние в цепочки точек, принадлежащих контурам, т. е. точек, в которых количество исходящих ветвей КЖ=2, и разность углов между ними больше 90°. Началом и концом цепочки являются особые точки.

Последовательно перебирая ОТ и все направления из них, мы выделим все цепочки (множество

Рис. 9. Отслеживание контурных линий: а) исходное изображение; б) высокий порог на перепад яркости; в) низкий порог; г) адаптивный порог

К) на изображении. Каждая следующая точка цепочки вычисляется по формулам: х5=х„+ео8(а);

У=Уп—На)

где хп, уп - точки, принадлежащие К (на первом шаге ОТ); а, - направление на следующий пиксель (на первом шаге г-е направление из ОТ).

Известно, что процесс трассировки линий весьма чувствителен к помехам. Если на черно-белых (двухградационных) или цветных изображениях для выделения контуров объектов достаточно отслеживать смену цвета, то на полутоновых линии определяются переходом через несколько градаций яркости. Во многих случаях контуры размыты в поперечнике и плавно исчезают при движении вдоль линии, постепенно сливаясь с окружением.

Для повышения устойчивости процесса трассировки предлагается применять выявленные в процессе моделирования и экспериментов дополнительные функции поиска продолжения:

1. Захват ОТ - скачкообразный переход в оптимизированную особую точку, как только линия входит в зону артефактов (рис. 8).

2. Переход на слежение по краю - автоматическая замена направления вглубь объекта на два направления движения по «краям» в местах, где линейный объект переходит в площадной.

3. Повышение чувствительности локального анализатора - если в процессе трассировки контура коли-

чество исходящих ветвей из центра локального анализатора становится меньше либо равно единице, то яркостной порог динамически уменьшается до тех пор, пока не будет найдено продолжение линии. Адаптация порога позволяет отслеживать на изображении даже очень тонкие (яркостно слабые) линии, если удалось «зацепиться» за такую линию на каком-то участке при исходном яркостном пороге (рис. 9). Если же изначально установить минимальный порог, то появляется много шумовых линий.

4. Смена разрешающей способности дополняет модель аккомодации хрусталика. Уровни разрешающей способности - это заданное пользователем количество изображений, где, начиная с исходного, каждое последующее сжимается вдвое. Оператор анализа локальных областей при сужении линии автоматически переходит на изображение с уменьшенной разрешающей способностью. Данный прием позволяет более корректно обрабатывать разрывы линий и помехи на изображении - линия остается линией при изменении ширины в 2-4 раза.

Таким образом, предложенные биоинспириро-ванные алгоритмы, основывающиеся на достижениях современной физиологии механизмов зрения, позволяют повысить качество выделения информативных признаков на изображении и, соответственно, анализа и извлечения знаний из изображений.

Работа выполнена при поддержке РФФИ (проекты № 11-07-00632-а, 11-07-00783-а).

СПИСОК ЛИТЕРАТУРЫ 2. Шапиро Л., Стокман Дж. Компьютерное зрение. - М.: БИ-

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М.: Н°М. Морэторга знаний, 2°06. - 752 с.

Техносфера, 2006. - 1072 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поступила 24.09.2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.