Научная статья на тему 'Комплексная обработка гиперспектральных изображений на основе спектральной и пространственной информации'

Комплексная обработка гиперспектральных изображений на основе спектральной и пространственной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
547
119
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ / HYPERSPECTRAL IMAGE CLASSIFICATION / ВЫДЕЛЕНИЕ ИНФОРМАТИВНЫХ ПРИЗНАКОВ / EXTRACTION OF INFORMATIVE FEATURES / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / PRINCIPAL COMPONENT ANALYSIS / МЕТОД ОПОРНЫХ ВЕКТОРОВ / SUPPORT VECTOR MACHINE / СПЕКТРАЛЬНЫЕ И ПРОСТРАНСТВЕННЫЕ ПРИЗНАКИ / SPECTRAL AND SPATIAL CHARACTERISTICS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борзов Сергей Михайлович, Мельников Павел Владимирович, Пестунов Игорь Алексеевич, Потатуркин Олег Иосифович, Федотов Анатолий Михайлович

Рассмотрены методы тематической обработки гиперспектральных изображений, приведены результаты их экспериментального исследования. Предложена схема классификации гиперспектральных изображений, позволяющая учитывать как спектральные, так и пространственные характеристики. Для реализации этой схемы могут быть использованы традиционные для мультиспектральных изображений поэлементные классификаторы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Борзов Сергей Михайлович, Мельников Павел Владимирович, Пестунов Игорь Алексеевич, Потатуркин Олег Иосифович, Федотов Анатолий Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Integrated processing of hyperspectral images on the basis of spectral and spatial information

In this рареr wе аddrеss thе mеthоds оf thе hуреrsресtrаl imаgе сlаssifiсаtiоn. А nеw imаgе сlаssifiсаtiоn sсhеmе is рrороsеd. It иsеs bоth sресtrаl аnd sраtiаl infоrmаtiоn ехtrасtеd frоm аn imаgе. It аlsо аllоws tо сlаssifу hуреrsресtrаl imаgеs with thе hеlр оf trаditiоnаl аlgоrithms иsеd fоr mиltisресtrаl imаgеs еvеn fоr vеrу limitеd trаining dаtаsеts. Тhе sсhеmе соnsists оf thrее stаgеs: 1) rеdисtiоn оf fеаtиrе sрасе dimеnsiоnаlitу; 2) sиреrwisеd рiхеlwisе сlаssifiсаtiоn; 3) rеfining оf сlаssifiсаtiоn mар иsing sраtiаl infоrmаtiоn. Sеvеrаl аlgоrithms аrе соnsidеrеd fоr еасh stаgе. Рrinсiраl Соmроnеnt Аnаlуsis (РСА), Вlоск Рrinсiраl Соmроnеnt Аnаlуsis (ВРСА) аnd Мinimиm Nоisе Frасtiоn (МNF) аrе иsеd fоr first stаgе whilе Махimиm Liкеlihооd (МL) аnd Sирроrt Vесtоr Масhinе (SVМ) аrе еmрlоуеd fоr thе sесоnd stаgе. Маjоritу Filtеr (МF), Рrоbаbilitу-bаsеd Маjоritу Filtеr (РМF) аnd Мinimиm Sраnning Fоrеst (МSF) аrе tакеn fоr thе third stаgе. Тhе sсhеmе wаs tеstеd оn twо rеfеrеnсе hуреrsресtrаl imаgеs Indiаn Рinеs (224 сhаnnеls) аnd Раviа Univеrsitу (103 сhаnnеls) with diffеrеnt nиmbеr оf trаining sаmрlеs (100, 200, 400 аnd 800 sаmрlеs реr сlаss). Тhе rеsиlts shоw thаt nиmbеr оf fеаtиrеs саn bе rеdисеd bу оrdеr оf mаgnitиdе withоиt dеgrаdаtiоn оf сlаssifiсаtiоn qиаlitу. 20 МNF fеаtиrеs аrе sиffiсiеnt fоr Indiаn Рinеs imаgе аnd 15 ВРСА fеаtиrеs аrе sиffiсiеnt fоr Раviа Univеrsitу. If N/k < 15 (whеrе N is а nиmbеr оf trаining sаmрlеs реr сlаss аnd k is а nиmbеr оf fеаtиrеs) thе ассиrасу оf МL сlаssifiеr dесrеаsеs signifiсаntlу. Usе оf sраtiаl infоrmаtiоn саn inсrеаsе сlаssifiсаtiоn ассиrасу bу 6-8 %.

Текст научной работы на тему «Комплексная обработка гиперспектральных изображений на основе спектральной и пространственной информации»

Вычислительные технологии

Том 21, № 1, 2016

Комплексная обработка гиперспектральных изображений на основе спектральной и пространственной информации

С.М. Борзов1, П. В. Мельников2, И. А. Пестунов2'* , О.И. Потлтуркин1,3, А. М. Федотов2'3

1 Институт автоматики и электрометрии СО РАН, Новосибирск, Россия 2Институт вычислительных технологий СО РАН, Новосибирск, Россия 3 Новосибирский государственный университет, Россия *Контактный e-mail: pestunov@ict .sbras.ru

Рассмотрены методы тематической обработки гиперспектральных изображений, приведены результаты их экспериментального исследования. Предложена схема классификации гиперспектральных изображений, позволяющая учитывать как спектральные, так и пространственные характеристики. Для реализации этой схемы могут быть использованы традиционные для мультиспектральных изображений поэлементные классификаторы.

Ключевые слова: классификация гиперспектральных изображений, выделение информативных признаков, метод главных компонент, метод опорных векторов, спектральные и пространственные признаки.

Введение

В области аэрокосмического дистанционного зондирования Земли наблюдается активное внедрение гиперспектральных сканирующих систем, обеспечивающих съемку в видимом и инфракрасном диапазонах спектра (0.4-2.5 мкм) [1]. Поэтому появились потенциальные возможности использования высокоинформативных гиперспектральных изображений (ГСИ) для решения широкого круга научных и практических задач. Однако существенным сдерживающим фактором для реализации этих возможностей является отсутствие приемлемого инструментария для автоматизированного анализа снимков.

К главным особенностям ГСИ относятся высокое спектральное разрешение (порядка нескольких нанометров) и большое число (до нескольких сотен) спектральных компонент (каналов). Значительное увеличение числа каналов ГСИ порождает так называемую проблему "проклятия размерности", из-за которой многие традиционные (для мультиспектральных данных) алгоритмы тематической обработки становятся непригодными. Кроме того, возникает также проблема репрезентативности обучающих выборок (ОВ) для классификаторов с обучением. Известно, что для обеспечения приемлемого качества классификации минимальный объем ОВ для параметрических классификаторов составляет порядка 10d точек на класс (где d — число каналов), для непараметрических — 50d точек [2, 3]. При работе с ГСИ получение обучающих выборок

© ИВТ СО РАН, 2016

таких объемов, как правило, не представляется возможным. По этой причине популярные алгоритмы классификации зачастую оказываются непригодными (например, классификатор максимального правдоподобия ввиду плохой обусловленности выборочных ковариационных матриц классов).

Одним из подходов к решению указанных проблем является разработка новых эффективных алгоритмов классификации, учитывающих особенности гиперспектральных изображений [4, 5]. Другой подход связан с сокращением числа используемых спектральных признаков и применением традиционных алгоритмов классификации муль-тиспектральных изображений [6].

Сокращение числа признаков можно производить как путем выбора информативной подсистемы спектральных каналов [7], так и посредством линейных или нелинейных преобразований исходных признаков. Такие преобразования осуществляются с помощью методов факторного анализа [8], нейронных сетей [9], метода случайных проекций [10], вейвлет-преобразований [11], метода главных компонент (МГК) [12] и др. При большом числе каналов и высоком спектральном разрешении соседние каналы ГСИ зачастую обладают сильной взаимной корреляцией. Поэтому при работе с ГСИ хорошо зарекомендовал себя метод главных компонент [13], позволяющий выделять некоррелированные линейные комбинации признаков.

Для тематической обработки ГСИ применяется широкий класс методов классификации: максимального правдоподобия [14], опорных векторов [15], по спектральному углу [16], на основе дерева решений [17] и др. В результате экспериментальных исследований установлено, что наилучшие результаты, как правило, демонстрируют классификаторы, основанные на методе опорных векторов с использованием радиальной базисной функции [18-20].

Все перечисленные методы относятся к так называемым поэлементным классификаторам, которые учитывают лишь спектральную информацию и классифицируют каждый пиксель независимо от остальных, поэтому получаемые с их помощью картосхемы обладают чрезмерной раздробленностью и сложны в интерпретации. В то же время значительная часть информации, содержащаяся в изображениях, заключена в пространственных характеристиках, описывающих взаимное расположение соседних пикселей [21]. В работах [22-24] показано, что использование пространственных признаков позволяет значительно повысить качество классификации гиперспектральных изображений.

В данной работе предложена схема классификации гиперспектральных изображений, которая позволяет учитывать как спектральную, так и пространственную информацию, содержащуюся в изображении. Приводится анализ методов, обеспечивающих практическую реализацию этой схемы.

1. Схема классификации гиперспектральных изображений

Предлагаемая схема классификации гиперспектральных изображений состоит из трех этапов: 1) сокращение размерности пространства спектральных признаков; 2) поэлементная классификация с обучением; 3) уточнение получаемой картосхемы с помощью методов, учитывающих пространственную информацию.

На первом этапе выделяется информативный набор спектральных признаков с целью сокращения избыточности исходных данных. Этот этап позволяет для тематиче-

ской обработки ГСИ применять традиционные алгоритмы, хорошо зарекомендовавшие себя при анализе мультиспектральных изображений. Кроме того, он позволяет уменьшить объем вычислений, выполняемых на последующих этапах обработки. Для реализации первого этапа используются широко известный метод главных компонент [25] и две его модификации — блочный метод главных компонент [26] и метод минимизации шумовых помех [27].

На втором этапе обработки выполняется поэлементная классификация с обучением на основе использования выделенной информативной системы признаков. Используются два метода — классический метод максимального правдоподобия, широко применяемый при распознавании изображений, и метод опорных векторов, который хорошо зарекомендовал себя при обработке ГСИ [18, 24].

На третьем этапе уточняется картосхема, построенная с помощью поэлементных классификаторов. Для этого используется пространственная информация, содержащаяся в изображении. Для реализации этого этапа применяются три алгоритма постобработки картосхемы — мажоритарный фильтр [32], вероятностный мажоритарный фильтр и метод минимального остовного леса [24].

2. Краткое описание используемых методов

Введем следующие обозначения: П = {шг, г = 1,... , N} — множество пикселей изображения; С = [с\,... , См} — множество классов; х = (х\,... , Хо) & X С КЛ — вектор признаков, характеризующий каждый пиксель; V = {(х.г,Сг), г = 1 ,...,Ыу, х & X, Сг & С} — обучающая выборка объема Му; 6 : КЛ ^ С — классификационное решающее правило.

Метод главных компонент применяется для выделения некоррелированных линейных комбинаций признаков. Построение главных компонент сводится к задаче вычисления выборочной ковариационной матрицы данных

(здесь Е = — ^ х — выборочное среднее) и поиска ее собственных чисел {Л^} и соб-N Хех

ственных векторов {^}. Матрица Е является симметричной и неотрицательно определенной, поэтому ее собственные числа и векторы можно вычислить итеративно. На каждой итерации из текущей матрицы ковариации вычитается ее проекция на полученный на предыдущем этапе собственный вектор:

В результате находятся следующее по величине собственное число и соответствующий ему собственный вектор.

С помощью МГК формируется новый набор векторов у = Ах, где матрица А составлена из собственных векторов, расположенных в порядке убывания их собственных чисел. Для уменьшения числа признаков используются только первые к главных компонент: А = [у(1) ■ ■ ■ .

хех

1

Е<<+1) = Е« - Д(, где А(г) и — собственное число и собственный вектор, полученные на г-й итерации.

Блочный метод главных компонент (БМГК). На основе анализа матрицы ковари-ации выполняется разделение множества каналов изображения на блоки. В один блок относятся соседние каналы, корреляция между которыми превышает заданный порог. К каждому блоку каналов применяется МГК. Затем производится выбор необходимого количества информативных компонентов для каждого блока. В данной работе информативные признаки выбираются посредством визуального анализа полученных компонентов. Этот способ позволяет эксперту визуально оценить информативность каждого полученного признака.

Метод минимизации шумовых помех (Minimum Noise Fraction, MNF). В основе метода лежит идея линейного преобразования признаков, при котором в новой системе координат отношение сигнал/шум уменьшается с ростом номера координаты. Алгоритм работает в предположении, что значения признаков являются суммой полезного сигнала и некоррелированного с ним шума:

x = s + n.

Тогда матрица ковариации векторов данных также будет являться суммой матриц ко-вариации векторов сигнала и шума:

Е = Es + Sn.

Алгоритм состоит из двух этапов. На первом этапе применяется МГК на основе ковариационной матрицы шума Еп. После преобразования шум будет иметь нулевую корреляцию. Этот процесс называется "обелением шума". На втором этапе применяется МГК на основе ковариационной матрицы исходных данных Е. Для работы алгоритма требуется информация о дисперсии шума в каждом канале. На практике при отсутствии такой информации используется статистическая оценка на основе исходных данных.

Для обработки гиперспектральных изображений [28] все чаще используется метод MNF. При большом числе перепадов яркости на изображении автоматическая оценка шума не всегда приводит к качественным результатам. В частности, в работе [29] показано, что при классификации изображений антропогенных территорий этот метод уступает методу главных компонент.

Для поэлементной классификации используются два метода — классический метод максимального правдоподобия, широко применяемый при распознавании изображений, и метод опорных векторов, который хорошо зарекомендовал себя при обработке ГСИ.

Метод максимального правдоподобия (Maximum Likelihood, ML) [3]. Решающее правило ML для случая нормально распределенных классов записывается в виде

¿(x) = argmaxр (x|c), р (x|c) = exP (-\ (x - АСГ S-1 (x - ,

сес (2-к

где р(х|с) — оценка плотности распределения вероятности для класса с; /Ес и Ес — выборочное среднее и ковариационная матрица класса с соответственно.

Поскольку в решающем правиле присутствует операция обращения матриц ковариации, применение метода МЬ корректно только в случае невырожденности этих матриц. Объем ОВ для каждого класса должен быть не менее (й + 1) [3]. Поэтому данный классификатор не может обеспечить устойчивые результаты при большой размерности пространства признаков и ограниченных объемах обучающих выборок.

Метод опорных векторов (Support Vector Machine, SVM) [30, 31]. В основе этого метода лежит построение оптимальной разделяющей гиперплоскости в пространстве признаков. Оптимальной считается разделяющая гиперплоскость, максимально удаленная от ближайших к ней точек разделяемых классов. Обучающая выборка для случая двух классов выглядит следующим образом:

V = {(x, е Rd,Cl е {—1,1}) ,i = 1,...,NV} .

Гиперплоскость, характеризуемая направляющим вектором w и смещением Ь, задается уравнением x • w — b = 0. Оптимальная гиперплоскость является решением задачи квадратичной оптимизации:

{

||w|| ^ min,

Ci (w • Xj — b) ^ 1, i = 1,..., Nv.

В данной работе используется алгоритм [31], который применим для случая линейно-неразделимых классов:

1

- ^ + к ^ т1п, 2 * w

г=1

Сг (w ■ х^ - Ь) ^ 1 - г = 1,... , Ыу, ^ 0, г = 1,...,МУ.

Здесь к — параметр регуляризации, задаваемый пользователем.

Кроме того, вместо скалярного произведения х ■ w в алгоритме используется радиальная базисная функция на основе гауссовского ядра

р(х, w) = е-7||х-^2, 0.

Решающее правило задается формулой

#(х) = sgn(x ■ w — Ь).

Особенностью данного алгоритма является то, что он определен только для случая двух классов. Существует два варианта обобщения его на случай М классов: построение гиперплоскостей между всеми парами классов и построение гиперсплоскостей, отделяющих один класс от всех остальных. В настоящей работе использован первый вариант алгоритма с параметрами 7 = 0.25 и к = 100.

Для постобработки картосхемы используются три алгоритма: мажоритарный фильтр, вероятностный мажоритарный фильтр и метод минимального остовного леса.

Мажоритарный фильтр (МФ) — простейший алгоритм постобработки, он широко применяется для уменьшения раздробленности и генерализации картосхем [32]. Каждый пиксель изображения относится к тому же классу, что и большая часть пикселей в некоторой заданной его окрестности. Чаще всего выбирается квадратная окрестность

размером 3 х 3 или 5 х 5 пикселей. Пример, иллюстрирующий работу алгоритма, представлен на рис. 1, а.

Вероятностный мажоритарный фильтр (ВМФ) является модификацией мажоритарного фильтра. Помимо картосхемы, полученной в ходе поэлементной классификации, также используются весовые коэффициенты, характеризующие вероятность отнесения пикселя к выбранному классу. При работе фильтра каждый пиксель относится к тому классу, который имеет наибольший суммарный вес пикселей в заданной окрестности рассматриваемого пикселя. Вероятность принадлежности пикселя к классу можно получить, например, при использовании классификатора ML и других вероятностных классификаторов. Пример работы ВМФ представлен на рис. 1, б.

Метод минимального остовного леса (Minimum Spanning Forest, MSF) описан в работе [24], где он применяется для классификации гиперспектральных изображений. Изображение представляется в виде графа, на котором строится минимальный остов-ный лес в соответствии с картосхемой, полученной с помощью поэлементного классификатора. Вершинами графа являются пиксели изображения; ребра соединяют смежные пиксели. Вес ребра определяется с помощью некоторой функции похожести пикселей в пространстве спектральных признаков (например, спектрального угла или евклидова расстояния).

Построенный граф используется в качестве источника пространственной информации для уточнения картосхемы. Вершины графа, соответствующие выбранным на картосхеме пикселям, помечаются метками классов этих пикселей. Помеченные вершины соединяются виртуальными ребрами, и выделяется минимальное остовное дерево. После удаления виртуальных вершин дерево распадается на несвязные компоненты (становится остовным лесом). В каждой компоненте остается по одному маркеру, метка класса которого распространяется на все вершины компоненты.

Для обеспечения независимости результата от выбора маркеров применяется ансамблевый подход. На каждой итерации ансамбля выбирается случайный набор маркеров, итоговая сегментация изображения строится на основе коллективного правила большинства голосов. В настоящей работе для построения минимального остовного дерева на модифицированном графе применяется классический алгоритм Крускала [33]. Метод MSF по сравнению с МФ и ВМФ значительно более трудоемкий.

3. Экспериментальное сравнение методов выделения признаков и алгоритмов классификации на основе спектральной информации

Для сравнения выбраны два изображения, которые широко используются при исследовании алгоритмов обработки гиперспектральных данных.

На первом изображении размером 145 х 145 пикселей представлена площадка опытного полигона Indian Pines (северо-запад штата Индиана, США) [34]. Изображение получено с помощью сенсора AVIRIS (Airborne Visible/Infrared Imaging Spectrometer) и состоит из 224 спектральных каналов в диапазоне 0.4-2.5 мкм. Нешумовыми, согласно визуальной оценке, являются 188 каналов: 1-97, 113-146 и 168-224. RGB-композит изображения, составленный из 54, 112 и 204 каналов, представлен на рис. 2, а. Для этого полигона имеется эталонная картосхема, содержащая 16 тематических классов

а

0.1 0.1 0.1

0.1 |ол 0.2 0.1

0.3 0.3

4 пикселя

3 пикселя

2 пикселя

б

0.4 = 0.1 х 4

0.4 = 0.1 х 2 + 0.2

0.6 = 0.3 х 2

Рис. 1. Пример работы мажоритарного (а) и вероятностного мажоритарного (б) фильтров на квадратной окрестности 3 х 3 пикселя

б

□ □ ■ ■

□ ■

Люцерна

Кукуруза (безотвальная обработка) Кукуруза (мелкая вспашка) Кукуруза (прополотая) Пастбище Покос

Скошенное пастбище

Сено

Овес

Соя (безотвальная обработка)

Соя (мелкая вспашка)

Соя (прополотая)

Пшеница

Лес

Строения/дороги Бетон/асфальт

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а

а

Рис. 2. RGB-композит (каналы 54, 112, 204) (а) и эталонная карта классов (б) изображения Indian Pines

аб

Рис. 3. RGB-композит (каналы 50, 70, 40) (а) и эталонная карта классов (б) изображения Pavia University

80 100 120 Число признаков

- Landsat SVM (100) ■ Landsat SVM (200)

МГК+SVM (100) МГК+SVM (200)

---Landsat ML (100)

----Landsat ML (200)

80 100 120 Число признаков

МГК+ML (100) МГК+ML (200)

МГК+ML (400)

\ >

\

\

\

>

- 1

80 100 120 Число признаков

80 100 120 Число признаков

Landsat SVM (100) Landsat SVM (200)

МГК+SVM (100) МГК+SVM (200)

---Landsat ML (100)

----Landsat ML (200)

MNF+ML (100) MNF+ML (200)

40 60

Число признаков

40 60

Число признаков

- МГК+SVM (100) МГК+SVM (400)

МГК+SVM (200) МГК+SVM (800)

- МГК+ML (100) МГК+ML (400)

МГК+ML (200) МГК+ML (800)

40 60

Число признаков

40 60

Число признаков

MNF+SVM (100) MNF+SVM (400)

MNF+SVM (200) MNF+SVM (800)

MNF+ML (100) MNF+ML (400)

MNF+ML (200) MNF+ML (800)

а

20

40

60

140 160

180

20

40

60

140 160

180

20

40

60

140 160

180

20

40

60

140 160

180

20

80

100

20

80

100

20

80

100

20

80

100

Рис. 4. Точность классификации изображений Indian Pines (а) и Pavia University (б) в зависимости от числа признаков, объема обучающей выборки и алгоритма классификации

(рис. 2, б). Классы, содержащие менее 100 точек ("люцерна", "скошенные пастбища", "овес" и "бетон/асфальт"), были исключены из рассмотрения.

На другом изображении размером 340 х 610 пикселей представлена сцена Pavia University, полученная сенсором ROSIS [34]. Изображение содержит 103 спектральных канала из диапазона 0.35-2.5 мкм. RGB-композит изображения, составленный из 50, 70 и 40 каналов, приведен на рис. 3, а. Для этого изображения также имеется эталонная картосхема, состоящая из девяти тематических классов (рис. 3, б).

Для демонстрации преимуществ гиперспектральных данных перед мультиспектраль-ными на основе изображения Indian Pines было создано синтезированное мультиспек-тральное изображение с восемью спектральными признаками, соответствующими каналам сенсора ETM+ спутника Landsat-7. Значения спектральных яркостей в этих каналах вычислялись путем усреднения значений по всем каналам гиперспектральных данных, попадающим в диапазоны длин волн, которые соответствуют каналам сенсора ETM+.

Оценка качества классификации выполнялась по контрольной выборке. Для этого эталонное множество объектов (векторы признаков пикселей эталонной картосхемы) разбивалось на две выборки: обучающую и контрольную. Обучающая выборка использовалась для настройки алгоритма, а контрольная — для вычисления точности классификации. Для увеличения достоверности результата точность классификации усреднялась по 15 запускам процедуры со случайно выбранными точками обучающей выборки. В данной работе под точностью классификации подразумевается отношение корректно классифицированных точек контрольной выборки к ее объему.

На рис. 4, а приведены графики зависимости средней точности классификации изображения Indian Pines от числа признаков, полученных с помощью МГК и MNF, для классификаторов ML и SVM при двух объемах обучающей выборки (100 и 200 точек на класс). Линии погрешностей на всех графиках отображают стандартное отклонение от среднего. Анализ графиков показывает, что максимальная точность классификации достигается при использовании 20 признаков. Следовательно, 20 спектральных признаков достаточно для качественной классификации данного изображения.

На рис. 4, а также представлены результаты обработки синтезированных данных Landsat-7, из которых видно, что гиперспектральные данные позволяют достичь значительно более высокого качества классификации по сравнению с синтезированными мультиспектральными. На рис. 4, б представлены результаты аналогичных экспериментов, полученные с использованием изображения Pavia University. Оно значительно больше, чем изображение Indian Pines, поэтому эксперименты выполнялись с обучающими выборками большего объема (100, 200, 400 и 800 точек на класс).

Графики, представленные на рис. 4, позволяют сделать два вывода. Во-первых, оптимальное число информативных признаков для всех алгоритмов — от 15 до 20. Дальнейшее увеличение числа признаков зачастую приводит к снижению качества классификации. Во-вторых, классификатор ML не позволяет получить качественный результат при малом объеме обучающей выборки (100 точек на класс) и большом числе признаков (100).

Блочный метод главных компонент позволил получить информативные наборы признаков для изображений Indian Pines (21 признак) и Pavia University (15 признаков). Число признаков в итоговом наборе определялось автоматически при работе метода. На рис. 5 представлены результаты сравнения рассматриваемых методов по качеству классификации. Независимо от выбора классификатора лучшее качество классифика-

Ш

А Н О О Я я

£

92

90

88

86

84

гЬ.

rbi

ii

ML SVM

□ □МГК 21 □□ БМГК 21 0OMNF21

о о

£

92

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

90

88

86

84

ML

SVM

□ □МГК 15 ОПБМГК 15 0DMNF 15

Рис. 5. Точность классификации при использовании различных методов выделения признаков: а — изображение Indian Pines (21 признак, 200 точек ОВ); б — изображение Pavia University (15 признаков, 200 точек ОВ)

а

ции изображения Indian Pines обеспечивает набор признаков MNF, а второй по качеству результат — набор признаков БМГК. Для изображения Pavia University оптимальным является набор признаков БМГК, а наборы МГК и MNF обеспечивают сравнимое качество.

4. Экспериментальное сравнение методов постобработки картосхем на основе пространственной информации

В эксперименте использовались наборы из 15 наиболее информативных признаков, построенных методом MNF для тестовых изображений Indian Pines и Pavia University. Объем обучающих выборок составлял 100 точек на класс. В таблице приведены средние значения и стандартные отклонения по результатам 50 экспериментов для трех рассмотренных выше методов уточнения картосхем. Для методов МФ и ВМФ использовалось окно размером 5 х 5 пикселей. Для поэлементной классификации применялись

Средняя точность классификации при использовании трех методов постобработки картосхем

Алгоритм постобработки Точность классификации и

Изображение стандартное отклонение (%)

ML SVM

МФ 93.61 (0.89) 92.21 (0.84)

Indian ВМФ 93.66 (0.93) —

Pines МБР Без постобработки 92.29 (1.03) 86.24 (0.66) 92.96 (0.85) 86.72 (0.7)

МФ 96.01 (0.8) 92.26 (0.81)

Pavia ВМФ 96.09 (0.79) —

University МБР Без постобработки 95.08 (0.8) 89.35 (0.82) 93.53 (0.82) 85.14 (0.73)

алгоритмы МЬ и БУМ; метод ВМФ применялся только совместно с классификатором максимального правдоподобия.

Из таблицы видно, что использование пространственной информации позволяет существенно (на 6-8 %) повысить качество классификации. Метод МБР приводит к наилучшим результатам при использовании совместно с классификатором БУМ, однако он очень трудоемок. При использовании классификатора МЬ метод ВМФ обеспечивает самое высокое качество классификации.

Заключение

В данной работе предложена схема классификации гиперспектральных изображений, которая позволяет при использовании поэлементных классификаторов учесть как спектральную, так и пространственную информацию, содержащуюся на изображении. Кроме того, она позволяет эффективно применять традиционные для мультиспектральных изображений классификаторы для обработки гиперспектральных изображений. Приведен анализ методов, обеспечивающих практическую реализацию этой схемы.

По результатам исследований с использованием изображений Indian Pines и Pavia University можно сделать следующие выводы.

• Для рассмотренных изображений методы выделения признаков позволяют на порядок сократить число спектральных признаков без существенного снижения качества классификации.

• Для обработки изображения Pavia University достаточно 15 признаков, полученных рассмотренными алгоритмами, а для изображения Indian Pines — 20 признаков. Дальнейшее увеличение числа признаков не приводит к улучшению качества классификации (а при малом объеме обучающей выборки с ростом числа признаков наблюдается ухудшение качества классификации).

• Для изображения Indian Pines наилучшие результаты обеспечивают признаки, построенные методом MNF, для изображения Pavia University — признаки, полученные с помощью БМГК.

• Использование пространственной информации позволяет повысить точность по-пиксельной классификации на 6-8%.

• Точность классификации гиперспектрального изображения превосходит точность классификации синтезированного мультиспектрального изображения Landsat-7 более чем на 15 %.

Благодарности. Работа выполнена при финансовой поддержке РФФИ (гранты № 13-07-12202-офи_м и № 14-07-31320-мол_а).

Список литературы / References

[1] Бондур В.Г. Современные подходы к обработке больших потоков гиперспектральной и многоспектральной аэрокосмической информации // Исследование Земли из космоса. 2014. № 1. С. 4-16.

Bondur, V.G. Modern approaches for processing of big hyperspectral aerospace data // Issledovanie Zemli iz Kosmosa. 2014. No. 1. P. 4-16. (In Russ.)

[2] Раудис Влияние объема выборки на качество классификации (обзор) // Статистические проблемы управления. 1984. Вып. 66. С. 9-42.

Raudis, Sh.Yu. Review of the effect of a sample size on the classification of the quality // Statistical Problems of Control. 1984. Vol. 66. P. 9-42. (In Russ.)

[3] Richards, J.A. Remote sensing digital image analysis. Berlin: Springer-Verlag, 1999. 240 p.

[4] Plaza, А., Benediktsson, J.A., Boardman, J.W., Brazile, J., Bruzzone, L., Camps-Valls, G., Chanussot, J., Fauvel, M., Gamba, P., Gualtieri, A., Marconcini, M., Tilton, J.C., Trianni, G. Recent advances in techniques for hyperspectral image processing // Remote Sensing of Environment. 2009. Vol. 113. P. S110-S122.

[5] Ablin, R., Sulochana, C.H. A survey of hyperspectral image classification in remote sensing // Intern. J. of Advanced Research in Computer and Communication Eng. 2013. Vol. 2(8). P. 2986-3003.

[6] Kuo, B.C., Landgrebe, D.A. A robust classification procedure based on mixture classifiers and nonparametric weighted feature extraction // IEEE Transactions on Geoscience and Remote Sensing. 2002. Vol. 40(11). P. 2486-2494.

[7] Martinez-Uso, A., Pla, F., Sotoca, J.M., Garcia-Sevilla, P. Clustering based band selection for hyperspectral images // IEEE Transactions on Geoscience and Remote Sensing. 2007. Vol. 45(12). P. 4158-4171.

[8] Lavanya, A., Sanjeevi, S. An improved band selection technique for hyperspectral data using factor analysis //J. Indian Society of Remote Sensing. 2013. Vol. 41(2). P. 199-211.

[9] Ratle, F., Weston, J. Semisupervised neural networks for efficient hyperspectral image classification // IEEE Trans. on Geoscience and Remote Sensing. 2010. Vol. 48(5). P. 2271-2282.

[10] Fodor, I. A survey of dimension reduction techniques: Technical Report UCRL-ID-148494. Oakland: University of California, 2002. 26 p.

[11] Bruce, L.M., Koger, C.H., Jiang, L. Dimensionality reduction of hyperspectral data using discrete wavelet transform feature extraction // IEEE Trans. on Geoscience and Remote Sensing. 2002. Vol. 40(10). P. 2331-2338.

[12] Смирнов С.И., Михайлов В.В., Остриков В.Н. Применение рандомизированного метода главных компонент для сжатия данных гиперспектральной съемки // Совр. пробл. дистанц. зондирования Земли из космоса. 2014. Т. 11, № 2. С. 9-17.

Smirnov, S.I., Mikhailov, V.V., Ostrikov, V.N. Randomized principal components method application for hyperspectral data compression // Sovremennye Problemy Distantsionnogo Zondirovaniya Zemli iz Kosmosa. 2014. Vol. 11(2). P. 9-17. (In Russ.)

[13] Imani, M., Ghassemian, H. Band clustering-based feature extraction for classification of hyperspectral images using limited training samples // IEEE Geoscience and Remote Sensing Lett. 2014. Vol 11(8). P. 1325-1329.

[14] Xiuping, J. Simplified maximum likelihood classification for hyperspectral data in cluster space // IEEE Geoscience and Remote Sensing Symp. 2002. Vol. 5. P. 2578-2580.

[15] Gualtieri, J.A., Cromp, R.F. Support vector machines for hyperspectral remote sensing classification // Proc. 27th AIPR Workshop: Advances in Computer-Assisted Recognition. 1999. P. 221-232.

[16] Meer, F. The effectiveness of spectral similarity measures for the analysis of hyperspectral imagery // Intern. J. Appl. Earth Obs. Geoinf. 2006. Vol. 8(1). P. 3-17.

[17] Goel, P.K., Prasher, S.O., Patel, R.M., Landry, J.A., Bonnell, R.B., Viau, A.A.

Classification of hyperspectral data by decision trees and artificial neural networks to identify weed stress and nitrogen status of corn // Computers and Electronics in Agriculture. 2003. Vol. 39. P. 67-93.

[18] Кузнецов А.В., Мясников В.В. Сравнение алгоритмов управляемой поэлементной классификации гиперспектральных изображений // Компьютерная оптика. 2014. Т. 38(3). C. 494-502.

Kuznetsov, A.V., Myasnikov, V.V. A comparison of algorithms for supervised classification using hyperspectral data // Computer Optics. 2014. Vol. 38(3). P. 494-502. (In Russ.)

[19] Shafri, H. The performance of maximum likelihood, spectral angle mapper, neural network and decision tree classifiers in hyperspectral image analysis //J. Computer Sci. 2007. Vol. 3(6). P. 419-423.

[20] Борзов С.М., Потатуркин О.И. Классификация типов растительного покрова по гиперспектральным данным дистанционного зондирования Земли // Вестник НГУ. Информационные технологии. 2014. Т. 12(4). С. 13-22.

Borzov, S.M., Potaturkin, O.I. Classification of landcover types based on hyperspectral remote sensing data // NSU J. Inform. Technologies. 2012. Vol. 12(4). P. 13-22. (In Russ.)

[21] Dey, V., Zhang, Y., Zhong, M. A review on image segmentation techniques with remote sensing perspective // ISPRS TC VII Symp. — 100 Years ISPRS. Vienna, Austria, July 5-7 2010. IAPRS: 2010 Vol. XXXVIII, pt 7A. P. 31-42.

[22] Зимичев Е.А., Казанский Н.Л., Серафимович П.Г. Пространственная классификация гиперспектральных изображений с использованием метода кластеризации k-means++ // Компьютерная оптика. 2014. Т. 38(2). C. 281-286.

Zimichev, E.A., Kazanskiy, N.L., Serafimovich, P.G. Spectral-spatial classification with k-means++ partitional clustering // Computer Optics. 2014. Vol. 38(2). P. 281-286. (In Russ.)

[23] Fauvel, M. Spectral and spatial methods for the classification of urban remote sensing data: PhD. Thesis. Islande: Grenoble Institute of Technology, 2007. 188 p.

[24] Bernard, K., Tarabalka, K., Angulo, J., Chanussot, J., Benediktsson, J.A.

Spectral-spatial classification of hyperspectral data based on a stochastic minimum spanning forest approach // IEEE Trans. on Image Processing. 2012. Vol. 21, iss. 4. P. 2008-2021.

[25] Pearson, K. On lines and planes of closest fit to systems of points in space // Philosophical Magazine. 1901. Vol. 2(11). P. 559-572.

[26] Пестунов И.А., Мельников П.В. Блочный метод главных компонент для выделения информативных признаков при классификации гиперспектральных изображений // Журн. Сиб. федер. ун-та. Техника и технологии. 2015. Т. 8(6). С. 715-725. Pestunov, I.A., Melnikov, P.V. Block principal component analysis for extraction of informative features for classification of hyperspectral images //J. SFU: Engineering & Technologies. 2015. Vol. 8(6). P. 715-725. (In Russ.)

[27] Green, A.A., Berman, M., Switzer, P., Craig, M.D. A transformation for ordering multispectral data in terms of image quality with implications for noise removal // IEEE Trans. on Geoscience and Remote Sensing. 1988. Vol. 26(1). P. 65-74.

[28] Vermillion, S.C., Sader, S.A. Use of the minimum noise fraction (MNF) transform to analyze airborne visible/infrared imaging spectrometer (AVIRIS) data of northern forest types // AVIRIS Workshop. JPL Publication, 1999. Available at: http://aviris.jpl.nasa.gov/proceedings/workshops/99_docs/62.pdf (accessed 23.11.2015).

[29] Борзов С.М., Потатуркин А.О., Потатуркин О.И., Федотов А.М. Исследование эффективности классификации гиперспектральных спутниковых изображений природных и антропогенных территорий // Автометрия. 2016. Т. 52, № 1. С. 3-10.

Borzov, S.M., Potaturkin, A.O., Potaturkin, O.I., Fedotov, A.M. A research of classification efficiency for hyperspectral satellite images of nature and anthropogenic territory // Optoelectronics, Instrumentation and Data Processing. 2016. Vol. 52, No. 1. P. 1-6.

[30] Cristianini, N. An introduction to support vector machines and other kernel-based learning methods. Cambridge: Cambridge Univ. Press, 2000. 189 p.

[31] Chang, C.-C., Lin, C.-J. LIBSVM: a library for support vector machines // ACM Trans. on Intelligent Systems and Technology. 2011. Vol. 2(27) P. 1-27.

[32] Hader, D.P. Image analysis: methods and applications. London: CRC Press, 2000. 480 p.

[33] Кормен Т.Х., Лейзерсон Ч.И., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ. 2-е изд. / Пер. с англ. М.: Изд. дом "Вильямс", 2010. 1296 с.

Cormen, T.H., Leiserson, C.E., Rivest, R.L., Stein, C. Introduction to algorithms (2nd ed.). Cambridge: MIT Press, 2001. 1184 p.

[34] Hyperspectral Remote Sensing Scenes. Available at: http://www.ehu.eus/ccwintco/index.php? title=Hyperspectral_Remote_Sensing_Scenes (accessed 22.06.2014).

Поступила в 'редакцию 16 ноября 2015 г., с доработки —15 декабря 2015 г.

Integrated processing of hyperspectral images on the basis of spectral and spatial information

Borzov, Sergey M.1, Melnikov, Pavel V.2, Pestunov, Igor A.2'*, Potaturkin, Oleg I.1'3, Fedotov Anatolii M.2,3

institute of Automation and Electrometry SB RAS, Novosibirsk, 630090, Russia 2Institute of Computational Technologies SB RAS, Kemerovo Branch, Russia 3Novosibirsk State University, Novosibirsk, 630090, Russia * Corresponding author: Pestunov, Igor A., e-mail: pestunov@ict.sbras.ru

In this paper we address the methods of the hyperspectral image classification. A new image classification scheme is proposed. It uses both spectral and spatial information extracted from an image. It also allows to classify hyperspectral images with the help of traditional algorithms used for multispectral images even for very limited training datasets. The scheme consists of three stages: 1) reduction of feature space dimensionality; 2) superwised pixelwise classification; 3) refining of classification map using spatial information. Several algorithms are considered for each stage. Principal Component Analysis (PCA), Block Principal Component Analysis (BPCA) and Minimum Noise Fraction (MNF) are used for first stage while Maximum Likelihood (ML) and Support Vector Machine (SVM) are employed for the second stage. Majority Filter (MF), Probability-based Majority Filter (PMF) and Minimum Spanning Forest (MSF) are taken for the third stage.

The scheme was tested on two reference hyperspectral images — Indian Pines (224 channels) and Pavia University (103 channels) — with different number of training

© ICT SB RAS, 2016

samples (100, 200, 400 and 800 samples per class). The results show that number of features can be reduced by order of magnitude without degradation of classification quality. 20 MNF features are sufficient for Indian Pines image and 15 BPCA features are sufficient for Pavia University. If N/k < 15 (where N is a number of training samples per class and k is a number of features) the accuracy of ML classifier decreases significantly.

Use of spatial information can increase classification accuracy by 6-8%.

Keywords: hyperspectral image classification, extraction of informative features, principal component analysis, support vector machine, spectral and spatial characteristics.

Acknowledgements. This research was partly supported by RFBR (grant No. 13-0712202, No. 14-07-31320).

Received 16 November 2015 Received in revised form 15 December 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.