УДК 528.72:004.93
С. М. Борзов \ А. О. Потатуркин 1 2
1 Институт автоматики и электрометрии СО РАН пр. Акад. Коптюга, 1, Новосибирск, 630090, Россия
2 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия
E-mail: [email protected]; [email protected]
ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ПРОСТРАНСТВЕННЫХ ПРИЗНАКОВ ПРИ КЛАССИФИКАЦИИ СПУТНИКОВЫХ ИЗОБРАЖЕНИЙ РАЗЛИЧНОГО РАЗРЕШЕНИЯ *
Рассматривается возможность использования пространственной информации при ландшафтной классификации спутниковых изображений высокого разрешения. Приводятся результаты экспериментальных исследований информативности статистических и структурных признаков при обнаружении антропогенных территорий. Показано, что с увеличением пространственного разрешения обрабатываемых данных с 10 до 2,5 м эффективность обнаружения объектов техносферы на естественном фоне посредством поиска аномалий в локальной структуре изображений возрастает в 5 и более раз.
Ключевые слова: дистанционное зондирование Земли, пространственные признаки, структура изображений, пространственные аномалии, поиск объектов.
Введение
С запуском спутников высокого разрешения (Ikonos, 1999 г., 3,28 м; QшckBird, 2001 г., 2,44 м и т. д.) стало очевидным, что использование при обработке поступающих изображений лишь спектральных признаков не обеспечивает необходимой достоверности классификации, поэтому усилия многих ученых направлены на разработку технологий совместного анализа спектральной и пространственной информации. Так, показано, что при поиске объектов техносферы целесообразно дополнительно учитывать такие характеристики изображений, как форму однородных областей, текстурные свойства и т. п. [1; 2]. Однако эффективность использования различных пространственных признаков существенно зависит от разрешения анализируемых изображений (размера на поверхности Земли соответствующего одному пикселю регистрируемых изображений). Территории жилой застройки на изображениях разрешением 30 и более метров могут быть легко обнаружены при визуальном изучении, определяющим признаком при этом является текстура антропогенных зон. Отдельные объекты на таких изображениях не различимы и обуславливают лишь отличие их локальных статистических характеристик. Если разрешение увеличить до нескольких метров, то появляется возможность различать здания, дороги и другие элементы. Однако, поскольку форма различных наблюдаемых объектов техносферы существенно отличается, она не может играть ключевую роль при классификации. И все же оператор, руководствуясь, по всей видимости, характерной локальной структурой изображения, безошибочно относит соответствующие территории к зонам жилой застройки. Таким образом, очевидно, что при классификации изображений различного разрешения определяющими оказываются разные признаки. Данная работа посвящена исследованию зависимости эффективности статистиче-
* Работа выполнена при поддержке РФФИ (гранты № 11-07-00202, 11-07-12083-офи-м-2011), Программы Президиума РАН (проект № 15.3) и Программы СО РАН (интеграционный проект № 74).
ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2012. Том 10, выпуск 3 © С. М. Борзов, А. О. Потатуркин, 2012
ских и структурных пространственных признаков при обнаружении антропогенных зон от разрешения обрабатываемых спутниковых изображений. Для оценки эффективности признаков использован подход, основанный на применении одномерных критериев их адекватности для разделения заданных классов [3].
Выбор пространственных признаков
Важнейшими признаками фрагментов изображений являются статистические характеристики яркости и модуля пространственного градиента яркости, рассчитываемые на основе гистограмм:
1 N-1
• среднее значение ц = —£ i ■ G(i);
N i=0
J] N-1
—£ (ц - i)2 ■ G(i);
N 1=0
N-1
• энергия F1 = £ G(i)2;
i=0
N-1
• энтропия F2 = £ G(i)log G(i),
i=0
где N - число градаций яркости изображения; G(-) - гистограмма яркости (модуля пространственного градиента яркости) фрагмента.
Для классификации ландшафтов, отличающихся текстурой изображения, используются также статистические характеристики второго порядка, определяемые на основе матриц смежности (совместной встречаемости) Харалика [4]. Такая матрица P(i, j, d, у) представляет собой оценку вероятности обнаружить в окрестности пикселя изображения яркостью i расстоянии d и при угловом направлении у пиксель яркости j. В данной работе ограничимся рассмотрением лишь пикселей, находящихся в непосредственной близости (d = 1), и выполним усреднение матриц по всем ориентациям. На этой основе могут быть сформированы признаки:
N-1
• однородность F3 = £ P(i, j) /(1 + \i - j\);
i, j=0
N-1
• контраст Fa = £ P(i, j) x (i - j)2;
i, j=0
N-1
• различие F5 = £ P(i, j) x |i - j\;
i, j=0
N-1
• энтропия F6 = £ P(i, j) log P(i, j);
i, j=0
N-1
• энергия F7 = £ P(i, j)2.
i ,j=0
При обнаружении объектов техносферы по изображениям важным свойством зон интереса является их характерная пространственная структура. В частности, для антропогенных зон свойственно наличие большого количества «особых точек», т. е. таких отсчетов, окрестность которых существенно отличается от окрестностей соседних. Поиск таких точек может быть осуществлен с применением детектора Харриса [5], основанного на выделении окрестностей отсчетов типов «край» и «угол». Подобие окрестности каждого отсчета изображения соседним можно охарактеризовать функцией
E(u, v) = £ [I(x + u, y + v) -1(x, y)]2 = [u, v] ■ M ■
Q( x, y)
?
где 1(х, у) - яркость в точке (х, у); 0(х, у) - окрестность анализируемой точки, а М - матрица из частных производных:
Поэтому собственные значения А1 и А2 матрицы М определяют тип окрестности. В частности, если разность между А1 и А2 велика, то данная окрестность типа «край», если А1 и А2 велики и А^А2 - окрестность типа «угол».
Для классификации окрестностей отсчетов, используя trace M = A4 + А2 и det M = A4 • А2, формируются функция отклика «край» -
L = (trace M)2 - 4•detM
и функция отклика «угол» -
R = det M - 0,04-(trace M)2. Далее осуществляется поиск локальных максимумов функций отклика. Точки изображения, соответствующие найденным максимумам, являются особенными.
В качестве структурных признаков фрагментов при классификации изображений могут быть использованы [6]:
Fs =< R(х, y) >; F9 = ^/(r( х, yf) -(R( х, y)f;
F1o =< R( х,, yt) >;
F11 =^R(xr, y y) - (R( Xi, y )f; Fi2 =<^( Xi, y) >;
F13 ^^/(ÄRcX^yi^y^ÄRcXi^yi^1,
где xi, yi - координаты i-й обнаруженной особой точки, а (*} - усреднение по фрагменту.
Другой важной характеристикой структуры изображений является его фрактальная размерность [7], определяемая с использованием интенсивности в качестве третьей координаты. Разработано большое количество методов расчета этого параметра. В данной работе вычисление фрактальной размерности выполняется методом покрытий, предложенным в [8]. С этой целью сначала строятся две поверхности U(1)(х, y), V(1)(х, y) такие, что значения I(х, y) располагаются между ними. Верхняя поверхность U(1)(х, y) состоит из точек, которые всегда, по крайней мере, на 1 превышают I(х, y):
U(1)(х, y) = max[I(х, y) +1, I(х - i, y - j)],i, j e Q.
Нижняя поверхность V (1)( х, y) содержит точки всегда, по крайней мере, на 1 ниже, чем
I (х, y):
V(1)(х, y) = min [I(х, y) -1,I(х - i, y - j)],i, j e Q. Затем аналогичным образом строятся поверхности U(2) (х, y), V(2) (х, y):
U(2) (х,y) = max [U(1) (х,y) +1, U(1)(х - i, y - j)],i, j e Q;
V(2)(х,y) = min[V(1)(х,y) -1, V(1)(х -i,y - j)],i, j eQ.
Площади ^(1) и A(2) покрытий для фрагмента S, образованных построенными поверхностями, есть
A(1) = X (U(1)(х,y) - V(1)(х,y)) / 2 ;
х, yeS
А(2) =Х (и(2)(х,У)-V(2)(х,у))/4.
х, уе£
Фрактальная размерность определяется как
= 2 - (1п А(2) - 1п А(1))/1п2. Для фигур со слабо изрезанной внутренней структурой (куб, клин и т. п.) фрактальная размерность будет близка к 2. Чем больше перепады и частота изменения интенсивности, тем больше фрактальная размерность приближается к 3.
Эффективность признаков
при различном пространственном разрешении
классифицируемых изображений
Исследование эффективности различных признаков при поиске объектов техносферы на естественном фоне проводилось с использованием изображения окрестности новосибирского Академгородка, полученного со спутника QuickBird. Из данного изображения формировался набор фрагментов (рис. 1), относящихся к зоне городской застройки (класс «город»),
д
Рис. 1. Фрагменты классов «фон»: а - сосновый лес; б - лиственный лес; в - поле; г - «город» и д - «дачи»
0.14
0,12 0.1 р, 0.08 0.06 0.04 0,02 О
V _■_ ^-
3
Р,
♦Фон ■ Город А Дачи
а б
Рис. 2. Распределение фрагментов в системах признаков энергия - энтропия (а) и среднее значение - СКО функции отклика «угол» (б)
сельской застройки (класс «дачи»), соснового и лиственного леса, поля (класс «фон»). С целью изучения зависимости эффективности признаков от пространственного разрешения классифицируемого изображения каждый фрагмент был преобразован путем дополнительно -го масштабирования с коэффициентами 1 : 1, 1 : 2 и 1 : 4, что, с учетом разрешения спутника QuickBird, соответствует разрешению 2,5, 5,0 и 10,0 м. Для всех фрагментов сформированного таким образом набора определялись значения перечисленных выше признаков.
На рис. 2 в качестве примера приведены полученные распределения фрагментов различных классов (для масштаба 1 : 1) в системах признаков энергия - энтропия и среднее значение - СКО функции отклика «угол». Следует отметить, что характер распределений различен. Так, для статистических признаков классы более компактны. Для структурных наблюдается существенно больший разброс фрагментов антропогенных классов, при этом их распределения в значительной степени перекрываются.
По полученным данным для всех масштабов выполнялось сопоставление эффективности каждого из исследуемых признаков при обнаружении антропогенных фрагментов (объединенного класса «город» и «дачи») на основе методов Байеса и Неймана - Пирсона путем определения межклассового расстояния по данному признаку.
Байесовский метод поиска основан на определении разделяющей функции (порога -в случае одного признака) путем анализа обучающей выборки и минимизации вероятности ошибки классификации. При его реализации в данной работе используется предположение о нормальном законе распределения каждого класса, и разделимость классов оценивается путем вычисления нормированного расстояния между ними:
I (Ь) (о)|
К " К, )|
г =
О,.(Ь) + О,.(о)
При реализации метода Неймана - Пирсона не используется никакое предположение о распределении класса неприродных объектов, и пороговое значение выбирается лишь исходя из среднеквадратичного отклонения класса «фон» (распределение объектов класса «фон» здесь также предполагается нормальным). Если объекты техносферы на наблюдаемой территории являются довольно редким явлением, оценка статистических параметров распределений каждого признака может выполняться по всему входному изображению, и такой подход позволяет осуществлять поиск аномалий в анализируемых данных. Оценка разделимости классов в данном случае выполняется путем определения нормированного расстояния от центра кластера «фон» до ближайшего объекта обнаруживаемого класса:
= шт(|ц,(Ь) -^(о)(к)|) Г = о. (Ь) ,
при этом если тт()) < ц/Ь) < тах(Р(о)(k)), то полагается г2 = 0 . Здесь и выше Р(о)(k) -значение признака . для фрагмента к; ц/Ь), ц/о) - средние значения, а ц/о), о/о) - среднеквадратичные отклонения этих двух классов по данному признаку (индексы Ь, о относятся к классам «фон», «город» и «дачи» соответственно). Полученные значения критериев г1 и г2 для фрагментов различных масштабов приведены в таблице.
Установлено также, что высокая эффективность последней категории признаков при обнаружении объектов неприродного происхождения характерна именно для спутниковых изображений высокого пространственного разрешения. Нормированные зависимости эффективности признаков от размера элемента разрешения изображений представлены на рис. 3.
Критерии г1 и г2 для фрагментов различных масштабов
Критерий г1, м Г2, м
Разрешение 10 5 2,5 10 5 2,5
Статистические признаки яркости
0,93 0,93 0,92 0,66 0,62 0,61
с 1,88 1,84 1,83 4,03 4,03 4,30
Р 1,29 1,30 1,32 1,12 1,09 1,16
Р2 1,33 1,58 1,54 1,13 1,76 1,68
Статистические признаки модуля пространственного градиента яркости
1 ,60 1,69 1,81 3,09 2,87 2,36
с 1,65 1,62 1,50 4,98 6,21 8,84
Р 1,86 1,58 1,46 1,95 1,54 1,30
Р2 1,01 1,42 1,39 0 0,85 1,41
Статистические признаки на основе матриц смежности
Р 0,55 1,08 1,10 0 1,03 0,81
Р4 1,13 1,80 0,99 3,03 10,30 8,31
Р 1,10 1,45 1,47 0,43 1,48 1,49
Рб 1,33 1,91 1,82 0,98 2,96 2,41
Р 0,69 1,19 1,14 0,09 1,09 0,99
Структурные признаки на основе функции отклика угла Харриса
Р8 0,53 0,37 0,34 19,73 34,31 105,74
Р 0,44 0,34 0,33 37,17 96,36 642,82
Ро 0,49 0,41 0,34 27,67 67,08 246,52
Р1 0,42 0,35 0,33 97,56 149,30 902,45
Р2 0,45 0,36 0,34 34,51 109,16 375,40
Рз 0,41 0,34 0,33 70,99 245,97 1181,71
Структурные признаки на основе фрактальной размерности
Р4 0,39 0,57 1,82 0 0 2,17
Ра «./Л
б
а
в
г
Рис. 3. Зависимость эффективности пространственных признаков от разрешения обрабатываемых изображений: а - статистика яркости; б - статистика модуля пространственного градиента яркости; в - статистика яркости второго порядка; г - структурные признаки по функции отклика угол
Видно, что с его увеличением от 10 до 2,5 м разделимость классов по признакам, сформированным на основе определения статистических характеристик яркости и модуля пространственного градиента яркости, изменяется незначительно. Наибольшее изменение (в 3,5 раза) достигнуто при применении признака энтропии, рассчитанного по матрицам смежности Ха-ралика. Для признаков же, сформированных на основе функции отклика Харриса, наблюдается более существенное увеличение разделимости классов. Так, по среднему значению функции отклика разделимость с увеличением разрешения увеличивается в 5 раз, а по признакам, характеризующим число и параметры найденных особых точек, - в 9-18 раз.
Заключение
В результате исследований показано, что при решении задачи обнаружения антропогенных зон на основе поиска пространственных аномалий структурные признаки, сформированные на основе детектора Харриса, обладают большей эффективностью по сравнению со статистическими характеристиками первого и второго порядка. Так, разделимость с их помощью классов «фон» и «город» (по критерию «расстояние до ближайшего соседа») в десятки раз выше, чем при использовании классических текстурных признаков. При этом высокой информативностью данная категория признаков характеризуется именно при обработке изображений высокого разрешения. Показано, что с увеличением разрешения от 10 до 2,5 м разделимость классов по указанным признакам возрастает в 5 раз и более, эффективность же статистических признаков при этом изменяется незначительно.
Список литературы
1. Борзов С. М., Козик В. И., Потатуркин О. И. Поиск объектов неприродного происхождения на основе многоспектральной обработки данных дистанционного зондирования Земли // Автометрия. 2010. № 6. С. 9-15.
2. Nobrega R. A. A., O'Hara C. G., Quintanilha J. A. An Object-based Approach to Detect Road Features for Informal Settlements near Sao Paulo, Brazil // «Object-Based Image Analysis» / Eds. T. Blaschke, S. Lang, G. J. Hay. Springer, 2008.
3. Swain P. H. Fundamentals of Pattern Recognition in Remote Sensing // In Remote Sensing: The Quantitative Approach / Eds. P. H. Swain, S. M. Davis. N. Y.: McGraw-Hill, 1978.
4. Харалик Р. М. Статистический и структурный подходы к описанию текстур // ТИИРЭ. 1979. Vol. 5. С. 98-118.
5. Harris С., Stephens М. A Combined Corner and Edge Detector // Proceedings of The Fourth Alvey Vision Conference. Manchester, 1988. Р. 147-151.
6. Борзов С. М., Нежевенко Е. С., Потатуркин О. И. Поиск объектов неприродного происхождения с использованием их структурных особенностей // Автометрия. 2010. № 5. С.36-42.
7. Mandelbrot B. B. The Fractal Geometry of Nature. N. Y.: W. H. Freeman and Company, 1982.
8. Peli T. Multiscale Fractal Theory and Object Characterization // J. Opt. Soc. 1990. Am. A. Vol. 7. No. 6. P. 1101-1112.
Материал поступил в редколлегию 15.05.2012
S. M. Borzov, A. O. Potaturkin
SURVEY OF SPATIAL ATTRIBUTES' EFFECTIVENESS IN CLASSIFICATION OF SATELLITE IMAGERY OF VARIOUS RESOLUTIONS
This article elaborates on possibility of spatial information utilization in classification of high resolution remote sensing imagery. In it the results of empiric survey on dependency of statistical and structural image attributes on the resolution of satellite imagery in tasks of detection of anthropogenic territories are presented. It is shown that, when using the anomaly detection in local structure method, effectiveness of technosphere objects' segregation from natural background increases five and more times with refining of the spatial resolution of an image from 10 to 2,5 m.
Keywords: remote sensing, spatial attributes, image structure, spatial anomalies, object detection.