Научная статья на тему 'Оценка возможности применения сингулярных чисел для классификации цифровых изображений площадных объектов земной поверхности'

Оценка возможности применения сингулярных чисел для классификации цифровых изображений площадных объектов земной поверхности Текст научной статьи по специальности «Математика»

CC BY
188
166
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВОЙ СНИМОК / СИНГУЛЯРНЫЕ ЧИСЛА / ДЕШИФРИРОВАНИЕ / РАСПОЗНАВАНИЕ / КЛАССИФИКАЦИЯ ОБЪЕКТОВ / АППРОКСИМАЦИЯ / ПАРАМЕТРЫ / DIGITAL IMAGE / SINGULAR VALUES / DECODING / IDENTIFICATION / IMAGE CLASSIFI CATION / APPROXIMATION / PARAMETERS

Аннотация научной статьи по математике, автор научной работы — Симинеев Алексей Александрович, Позднякова Наталия Александровна, Тарасова Евгения Ивановна

Существующие методы распознавания, использующие SVDразложение, основываются на применение всех матриц разложения, хотя известно, что только сингулярные числа определяются однозначно. В статье рассмотрена возможность применения сингулярных чисел для классификации площадных объектов местности по их изображениям на цифровых снимках. В качестве тест-объекта исследований выбран участок соснового леса природного парка «Самаровский чугас», расположенный в ХантыМансийском автономном округе. Территория заповедника покрыта материалами съемки, выполненной 12 мая 2000 г. космической съемочной системой Landsat-7 в панхроматическом, зеленом, красном и ближнем инфракрасном диапазонах спектра. В качестве признаков, позволяющих классифицировать изображения площадных объектов, предлагается использовать параметры a 0 и a 1 прямых, аппроксимирующих сингулярные числа матриц яркостей. Задача определения параметров решается методом наименьших квадратов. Средние квадратические ошибки параметров найдены по известной основной формуле оценки точности. Для наглядности вместо углового коэффициента a 1 рекомендуется использовать модуль угла наклона прямой |φ| = |arctg ( a 1)|. Методика распознавания объектов отработана на тест-объекте, а затем проверена на контрольных полигонах, в качестве которых использованы изображения водной поверхности р. Иртыш, застроенные территории г. Ханты-Мансийск, леса и болота. Показано, что поле признаков рассмотренных объектов представляет собой замкнутые, непересекающиеся области и не зависит от изменения общего фона изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Симинеев Алексей Александрович, Позднякова Наталия Александровна, Тарасова Евгения Ивановна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Assessment of possibility to use singular values for classification of digital images of Earth areal objects

The article discusses the possibility to use singular values to classify areal objects according to their appearance on the Landsat-7 digital images made in panchromatic, green, red, and infrared light ranges. It is proposed to use the parameters of a0 and a1 straight lines that approximate singular values of gray level matrices as a characteristic that allows classifying the images of areal objects. Methods of object identifi cation has been worked out by using a test object that resulted in verification of control objects. For this purpose, there were used the images of water surface of Irtysh river, built-up territories of the city of Khanty-Mansiysk, as well as forests and marshes. It is shown that a field of characteristics of the objects considered represents non-overlapping enclosed areas, and does not depend on changes of general background of the images.

Текст научной работы на тему «Оценка возможности применения сингулярных чисел для классификации цифровых изображений площадных объектов земной поверхности»

УДК 528.7:004.93'1

Вестник СПбГУ. Сер. 7. 2013. Вып. 4

А. А. Симинеев, Н. А. Позднякова, Е. И. Тарасова

ОЦЕНКА ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ СИНГУЛЯРНЫХ ЧИСЕЛ ДЛЯ КЛАССИФИКАЦИИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ ПЛОЩАДНЫХ ОБЪЕКТОВ ЗЕМНОЙ ПОВЕРХНОСТИ

Изображение земной поверхности на цифровом снимке представляет собой растр: матрицу B = (bi,j)m,n, состоящую из отдельных элементов (пикселов) bi,j, записанных в m строк (i = 1, 2, ..., m) и n столбцов (j = 1, 2, ..., n). Каждый пиксел характеризуется своим местоположением (i, j) и яркостью bi,j. Множества таких элементов, объединенных по величине яркости, образуют на снимке изображения отдельных объектов земной поверхности.

Для распознавания объектов по их изображениям применяются различные методы компьютерной классификации [1], в том числе и с использованием сингулярного разложения матриц (общепринятая аббревиатура — SVD) [2]. Несмотря на то, что SVD-разложение, возможно, является самым важным матричным разложением из всех известных [3], оно не нашло широкого применения в отечественной практике компьютерного анализа изображений.

Выделим в матрице B подматрицу Bk, состоящую из k строк и k столбцов (k < min (m, n). Тогда ее сингулярное разложение имеет вид [2, 3]

Bk = USVT,

(1)

где и, VТ — ортогональные матрицы размера (к х к), символ тильда у матрицы V введен для отличия матрицы от вектора поправок V (см. ниже); Т — верхний индекс, обозначающий операцию транспонирования матриц;

X =

— диагональная матрица размера (k х к);

>к J

стрст2 , • • •, ак — сингулярные числа (стх > ст2 > ••■ >ак > 0).

В отличие от матриц и и V, обладающих свойствами лишь частичной однозначности, сингулярные числа ст; (I = 1, 2,...,к) определяются однозначно [3]. Известно [2, 3], что количество чисел а ^ 0 соответствует рангу матрицы, а ее число обусловлен-

Симинеев Алексей Александрович — кандидат технических наук, доцент, Санкт-Петербургский государственный университет; e-mail: simineev.aa@gmail.com

Позднякова Наталия Александровна — старший преподаватель, Санкт-Петербургский государственный университет; e-mail: qlnat@mail.ru

Тарасова Евгения Ивановна — студент, Санкт-Петербургский государственный университет; e-mail: evgenia59-007@mail.ru

© А. А. Симинеев, Н. А. Позднякова, Е. И. Тарасова, 2013

ности к2 = атах/ ат;п (где атах, ат;п — максимальное и минимальное сингулярные числа).

Существующие методы распознавания, использующие аз ложение, ос-

новываются на применении всех матриц разложения (1). Так, в [4] предлагается использовать наборы троек, состоящих из сингулярного числа и соответствующих ему левого и правого сингулярных векторов матриц и и V. В [5] предварительно вычисляется нормальная матрица ВТВ, а затем ее полное сингулярное разложение. Однако вычисление матриц и и V связано с некоторым произволом [3], что может сказаться на результатах и привести к определенным сложностям при повторении вычислений в других условиях. Кроме того, известно [2], что числа обусловленности матриц В и ВТВ связаны соотношением к2(ВтВ) = (к2(В))2. Поэтому в случае плохой обусловленности матрицы В обусловленность матрицы ВТВ будет во много раз хуже. Вследствие чего переход к нормальным матрицам представляется необоснованным.

Рассмотрим возможность распознавания площадных объектов местности с использованием только одной матрицы разложения (1), а именно матрицы X. В качестве тест-объекта выберем участок соснового леса природного парка «Самаровский чугас», расположенный в Ханты-Мансийском автономном округе. Территория заповедника покрыта материалами съемки, выполненной 12 мая 2000 г. космической съемочной системой Landsat-7 в панхроматическом, а также зеленом (З), красном (К) и ближнем инфракрасном (ИК) диапазонах спектра [6]. Основные характеристики снимков приведены в табл. 1.

Таблица 1. Характеристики цифровых снимков тест-объекта

Параметры съемки и название характеристик Режим съемки

панхроматический многозональный

Высота орбиты, км 705

Время съемки (местное солнечное), час ± мин. 10 ± 15

Спектральный диапазон, мкм 0,52-0,90 0,53-0,61 (З) 0,63-0,69 (К) 0,78-0,90 (ИК)

Фокусное расстояние, см 243,8

Пространственное разрешение в надир, м 14,25 28,50

Радиометрическое разрешение, бит на пиксел 8

Изображение тест-объекта на панхроматическом снимке размером 32 х 32 пиксела разобьем на четыре равные части (элементарные участки). Схема расположения тест-объекта и контрольных полигонов приведена на рис. 1.

Сингулярное разложение матрицы яркостей первого участка размером 16 х 16 пикселов выполним с помощью программы $уй [7], особенностью которой является то, что, в отличие от теории [2, 3], числа а, не упорядочиваются по величине (табл. 2).

Рис. 1. Изображение тест-объекта и контрольных полигонов на фрагменте цифрового снимка.

Условные обозначения: 1 — населенный пункт Ханты-Мансийск; 2 — граница природного заповедника «Самаровский чугас»; 3 — тест-объект (1-4 номера участков); 4 — контрольные полигоны (9 — номер полигона).

Таблица 2. Значения сингулярных чисел матрицы яркостей

Номер Значение Номер Значение Номер Значение Номер Значение

1 648,709 5 25,023 9 15,188 13 6,177

2 38,892 6 21,606 10 13,719 14 1,371

3 34,684 7 20,274 11 12,425 15 3,439

4 32,177 8 18,224 12 10,192 16 2,831

Из табл. 2 видно, что а1 = 648,709 значительно отличается по величине от остальных сингулярных чисел. Кроме того, начиная с а15, нарушается естественный порядок убывания их значений.

Исключив а1 из дальнейшей обработки, расставим сингулярные числа в порядке их убывания и определим уравнение прямой а(х) = a0 + a1(x), аппроксимирующей

множество точек (i, аг), i = 2,...,16, взятых из табл. 2.

16

Решив указанную задачу под условием ^(ai -o(xi ))2 = min, где xi = i, найдем

i=2

значения параметров: a0 = 40,46, a1 = -2,5974. Параметр a1 = tg ф, где ф — угол наклона аппроксимирующей прямой к оси абсцисс. Очевидно, что ф = аrctg(a1) = -68°57'. Учтя вычисленные значения параметров, составим уравнение искомой прямой: а^) = 40,46 - 2,5974 x и нанесем его на график (рис. 2).

Для оценки точности найденных значений параметров в последнем приближении вычислим вектор поправок V, определим квадратичную форму VTV и матрицу весовых коэффициентов Q. Затем найдем средние квадратические ошибки (СКО) параметров [8]

maj JÖj, (2)

л п

где и = \1—- — ошибка единицы веса; п — количество

\ п - 2

сингулярных чисел (п < А—1); = 1, 2) — диагональные элементы матрицы Q.

Выполнив необходимые действия, по формуле (2) найдем: та = 2,1, та = 0,13. Аналогично вычислим значения сингулярных чисел, средние значения яркости Ь и параметры аппроксимирующих прямых для остальных участков тест-объекта. Обобщенные результаты экспериментальных исследований приведены в табл. 3.

Анализ данных табл. 3 показывает, что максимальное отклонение углов наклона ф от среднего значения (-69°00') не превышает 13'. В ходе вычислений было установлено, что количество сингулярных чисел, используемых для решения задачи, влияет на близость параметра а0 к среднему значению яркости Ь. Вследствие чего при определении параметров аппроксимирующих прямых использовалось различное количество сингулярных чисел. Кроме того, сравнение чисел обусловленности, приведенных в табл. 3, показывает, что матрицы яркостей третьего и четвертого участков плохо обусловлены. Объясняется это тем, что на указанных участках имеются небольшие поляны, элементы изображения которых Ь¡^ близки друг к другу по своей величине (яркости), существенно отличающейся от окружающего фона. Исправив яркости пикселов, соответствующих названным объектам, можно существенно улучшить обусловленность и сходимость результатов. Отметим также, что общее изменение фона практически не оказывает влияния на значения параметров. Так, увеличение яркостей всех пикселов матрицы Вк на 4 единицы приводит к изменению угла ф на пренебрегаемо малую величину равную 20", при этом параметр а0 остается без изменений.

Таблица 3. Результаты обработки панхроматических изображений тест-объекта

Номер участка Номера й Параметры прямой СКО ma1 Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2

ao a\

1 2-16 40,46 -2,5974 0,13 -68 57 40,45 473,14

2 3-16 40,06 -2,5759 0,14 -68 47 40,96 332,79

3 2-16 40,20 -2,6171 0,15 -69 05 41,30 6377,52

4 3-16 41,46 -2,6350 0,08 -69 13 41,32 15335,58

Тест-объект, помимо панхроматического, покрыт многозональными снимками, пространственное разрешение которых в два раза хуже (см. табл. 1). Вследствие чего изображение элементарных участков на них имеет размер 8 х 8 пикселов. Определим по приведенной выше методике параметры прямых, аппроксимирующих сингулярные

40 36 32

* 28

К!

и =

р 24

0 ^ |

1 20

г?

§ 16

I

12

I

\ 4 Л §

\ \

к 5

/ ф

0

2 6 10 14 18 I (х) — номера чисел

Рис. 2. Сингулярные числа и прямая, аппроксимирующая их значения.

числа матриц яркостей спектральных образов первого участка. Результаты вычислений приведены в табл. 4.

Таблица 4. Результаты обработки многозональных снимков

Спектральный диапазон Номера ^ Параметры прямой СКО ma1 Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2

Й0

З 3-7 28,22 -3,8205 0,32 -75 20 51,38 2410,73

К 2-7 27,34 -3,2515 0,58 -72 54 43,08 193,91

ИК 2-8 18,75 -2,5120 0,34 -68 18 46,62 15392,83

Из сравнения табл. 3 и 4 следует, что параметры я1 близки по величине только для инфракрасного и панхроматического снимков с изображением одного и того же участка леса.

Оценка возможности применения сингулярных чисел для классификации изображений других объектов местности на панхроматическом снимке приведена в табл. 5.

Из табл. 3 и 5 следует, что изображения различных объектов местности имеют параметры a0 и a1, отличающиеся друг от друга. Указанный фактор позволяет использовать названные величины в качестве признаков для распознавания объектов по их изображениям. Классификация объектов по рассматриваемым признакам приведена на рис. 3, где вместо параметра al для наглядности показан модуль угла наклона |ф| = |аг^

Таблица 5. Результаты обработки изображений контрольных полигонов

Название и номера полигонов Параметры прямой Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2

Й0

Болото, 5 29,16 -1,9242 -62 32 46,38 17121,92

6 28,17 -1,7936 -60 52 47,48 2016,16

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 29,18 -1,8109 -61 06 47,30 499,50

Городская застройка, 8 53,04 -3,3585 -73 25 51,36 578,89

9 56,01 -3,4092 -73 39 55,46 473,31

10 51,15 -3,2349 -72 49 50,64 908,27

Лес, 11 36,88 -2,6372 -69 14 36,73 4669,20

Водная поверхность, 12 25,89 -1,7095 -59 40 30,18 814,45

13 26,77 -1,7488 -60 14 29,78 688,29

14 25,13 -1,7232 -59 52 29,78 8768,89

Анализ рис. 3 показывает, что поле признаков таких площадных объектов, как сосновый лес, застроенные территории, болото, водная поверхность реки Иртыш представляют собой замкнутые, непересекающиеся области, т. е. могут быть уверенно классифицированы с помощью предлагаемых параметров a0 и a1. Более четкое различение водной поверхности от болота возможно с привлечением средних зна-

55

50

'S 42

S 40

35

30

25

55 60 65 70 75 | Ф | — модуль угла наклона

Рис. 3. Двумерное поле признаков площадных объектов местности.

чений яркости b или снимка в ближней инфракрасной зоне. Так, в ИК-диапазоне модули |ф| для указанных объектов (13 и 6 участки) соответственно равны 32°45' и 51°44'.

Таким образом, параметры a0 и a\ прямых, аппроксимирующих сингулярные числа матриц яркостей, не зависят от изменения общего фона изображений и могут быть использованы в качестве признаков для распознавания площадных объектов местности по их изображениям на цифровых снимках, в том числе и разновременных.

Литература

1. Шовенгердт Р. А. Дистанционное зондирование. Модели и методы обработки изображений / пер. с англ. М.: Техносфера, 2010. С. 428-474.

2. Деммель Дж. Вычислительная линейная алгебра. Теория и приложения / пер. с англ. М.: Мир, 2001. 430 с.

3. Уоткинс Д. С. Основы матричных вычислений / пер. с англ. М.: БИНОМ. Лаборатория знаний, 2006. С. 282-302.

4. Гальяно Ф. Р. Алгоритм классификации участков поверхности Земли на основе сингулярного разложения матриц // Информационные технологии. 2010. № 12. С. 35-37.

5. Прэтт У. Цифровая обработка изображений / пер. с англ. М.: Мир, 1982. Т. 1. 310 с.; Т. 2. 790 с.

6. Global Observatory for Ecosystem Services. Michigan State University.USA. URL: http://35.8.163.34/? version=Website&sensor=ETM&path=159&rpw=017 (дата обращения: 03.07.2009)

7. Куштин И. Ф., Куштин В. И. Геодезия: учеб.-практ. пособ. Ростов н/Д: Феникс, 2009. 909 с.

8. Форсайт Дж. Машинные методы математических вычислений / Дж. Форсайт, М. Малькольм, К. Моулер. М.: Мир, 1980. С. 248-256.

Статья поступила в редакцию 19 июня 2013 г.

+

ородска [застро? ка +

С ОСНОВЫ! лес -U ф

Лес +

^ Водн Болото 1я повер: [НОСТЬ

i Надоели баннеры? Вы всегда можете отключить рекламу.