Научная статья на тему 'Комплексный анализ пространственно-распределенных объектов с применением метода главных компонентов и геоинформационных технологий'

Комплексный анализ пространственно-распределенных объектов с применением метода главных компонентов и геоинформационных технологий Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
300
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТРАНСТВЕННЫЕ СВОЙСТВА ОБЪЕКТОВ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ (МГК) / МЕТОД ПРОСТРАНСТВЕННОГО АНАЛИЗА (МПА) / ЗАПАС ВОДЫ В СНЕЖНОМ ПОКРОВЕ

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Перемитина Татьяна Олеговна

Для анализа пространственно-распределенных объектов исследования применение метода главных компонент оказывается недостаточным, так как он не позволяет учитывать их пространственные характеристики. В связи с этим разработан комплексный подход, направленный на учет пространственных свойств объектов. Подход основан на сочетании метода главных компонент и метода пространственного анализа с применением геоинформационных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Перемитина Татьяна Олеговна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPLEX ANALYSIS OF SPATIALLY-DISTRIBUTION OBJECTS WITH PRINCIPAL COMPONENT ANALYSIS AND GEOINFORMATION TECHNOLOGY APPLICATION

The application of principal component analysis (PCA) for spatially-distribution objects treatment is insufficient. PCA does not allow taking into account spatial characteristics of objects. In this connection the complex approach directed on the account of spatial properties of objects is developed. The base of approach is combination of both principal component analysis and spatial analysis with GIS technology. The principal component analysis is applied to statistical processing of the multivariate data. The method of the spatial analysis is used for the account of spatial properties of objects.

Текст научной работы на тему «Комплексный анализ пространственно-распределенных объектов с применением метода главных компонентов и геоинформационных технологий»

Доклады ТУСУРа. 2003 г. Автоматизированные системы обработки информации, управления и проектирования УДК 519.6

КОМПЛЕКСНЫЙ АНАЛИЗ ПРОСТРАНСТВЕННО-РАСПРЕДЕЛЕННЫХ ОБЪЕКТОВ С ПРИМЕНЕНИЕМ МЕТОДА ГЛАВНЫХ КОМПОНЕНТОВ И ГЕОИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Т.О. Перемитина

Для анализа пространственно-распределенных объектов исследования применение метода главных компонент оказывается недостаточным, так как он не позволяет учитывать их пространственные характеристики. В связи с этим разработан комплексный подход, направленный на учет пространственных свойств объектов. Подход основан на сочетании метода главных компонент и метода пространственного анализа с применением геоинформационных технологий.

Одной из существенных особенностей природных объектов является наличие пространственных свойств. Для анализа таких объектов важен учет их расположения, их геометрической формы (полигон, линия, точка) и их взаиморасположения с другими пространственными объектами исследования [1]. Как правило, природные объекты описываются большим числом характеристик и представляются в виде многомерных массивов. Для сокращения размерности и выявления значимых характеристик объектов исследования широко применяется метод главных компонент (МГК) [2]. Однако МГК не учитывает пространственные (топологические) свойства объектов. Пространственно-распределенные объекты удобно представлять в картографическом виде. Представление результатов анализа с использованием карт наглядно и достаточно информативно. Таким образом, объединение МГК и метода пространственного анализа (МПА) дает возможность исследовать не только характеристики объектов, но и их пространственные свойства.

При проведении комплексного анализа по схеме а (рис. 1) пространственно-распределенные на большой территории объекты исследования разбиваются на однородные группы по пространственному признаку. Проведение пространственного анализа данных предполагает разделение всех объектов на однородные группы с использованием геоинформационных средств (ГИС) и цифровых тематических карт. Каждая цифровая тематическая* карта отражает определенные пространственные свойства объектов, поэтому наложение нескольких карт позволяет получать более точные результаты пространственного анализа. В результате наложения выявляются зоны перекрытия исследуемых областей, на основании которых можно производить разделение объектов на однородные группы. Разделение множества объектов на однородные группы (классы) облегчает дальнейший анализ методом главных компонент.

Комплексный анализ по схеме Ъ (рис. 1) предполагает эвристическую классификацию объектов исследования в пространстве двух главных компонент, что позволяет разделить все объекты на однородные группы по значениям их характеристик. Проведение пространственного

анализа выявленных классов объектов средствами ГИС позволяет выявлять закономерности, связанные с пространственным взаиморасположением объектов.

Интерпретация результатов

Интерпретация результатов

Ч.

схема b

схема а

Рис. 1 - Схемы комплексного анализа многомерных данных

При исследовании пространственно-распределенных объектов возникает ряд задач, которые не могут быть решены традиционным применением МГК, а именно:

- предварительная подготовка массива данных к анализу (проверка данных на нормальность распределения, стандартизация, нормирование, восстановление пропущенных значений);

- формирование массивов данных в процессе обработки (построение новых массивов, разбиение массива на подмассивы);

- графическое отображение векторных нагрузок в пространстве двух главных компонент;

- графическое представление результатов анализа с отображением средних значений и доверительных интервалов для каждого класса объектов;

- учет пространственных свойств природных объектов исследования.

В связи с этим был разработан алгоритм комплексного анализа (рис. 2)„ основанный на сочетании МГК-анализа и метода пространственного анализа с применением ГИС, включающий пять дополнительных процедур, перечисленных выше. Алгоритм включает обе схемы проведения комплексного анализа, представленные на рис. 1.

На основе алгоритма комплексного анализа пространственно-распределенных объектов разработан программный комплекс (рис. 3). Программный комплекс включает модуль интерфейсов, модуль пространственного анализа (ПА) данных, модуль анализа методом главных компонент и модуль графического отображения.

Модуль интерфейсов предназначен для осуществления взаимодействия между такими разнородными частями системы, как модуль пространственного анализа (ПО ГИС) и модуль МГК-анализа (среда Delphi 5). Модуль пространственного анализа данных включает: подготовку атрибутивной таблицы; отображение объектов на различных цифровых картах (ЦК); выявление пространственных группирований объектов. Модуль МГК-анализа реализует алгоритм мето-

да главных компонент. Модуль графического отображения включает: графическое отображение объектов исследования в пространстве двух главных компонент; графическое представление нагрузок на две главные компоненты; векторное представление нагрузок в пространстве двух главных компонент; графическое представление результатов анализа с отображением средних значений и доверительных интервалов.

/ Данные /

/. ______/

В наличии картографические материалы о зонировании территории?

Нет

Да Привязка объектов !

исследования к ЦК |

г

| Проведение Разбиение массива

1 классификации --г на подмассивы

1

Подготовка массива к анализу МГК*

-1

>_г_

Вычисление и табличное | отображение главных | компонент J

Картографическое отображение классов на ЦК

Привязка объектов! к цифровой и топооснове I

! Визуальная \ классификация в пространстве двух главных компонент

Графическое отображение объектов в пространстве двух главных компонент

Да Проводить

классификацшо^?^^

^Г^Нет _*___-

Анализ нагрузок

Анализ классов пространственно однородных объектов в пространстве двух главных компонент

Выход

Рис. 2 - Алгоритм комплексного анализа пространственно-распределенных объектов

Рис. 3 - Структура программного комплекса анализа пространственно-распределенных объектов

Рассмотрим практическое применение данного подхода. Проведен анализ радиационного загрязнения окрестностей г. Томска в зоне воздействия крупного предприятия ядерного цикла по данным о содержании радиоактивных веществ в годичных кольцах деревьев, произрастающих в

зоне воздействия объекта радиационного загрязнения. Цель анализа - выявление закономерностей радиоактивного загрязнения окружающей среды в зависимости от расстояния до источника загрязнения.

Одним из важнейших факторов, формирующих радиационную обстановку Томской области, является Сибирский химический комбинат (СХК), расположенный в нескольких километрах от г. Томска, - крупнейшее в России предприятие по производству оружейного плутония.

Для анализа радиационной обстановки использовались данные дендрохроноиндикации [3] по удельной активности радиоуглерода, трития и цезия в годичных кольцах деревьев, произрастающих в 30-километровой зоне Сибирского химического комбината и за ее пределами (рис. 4). Деревья из деревень Георгиевки и Наумовки включены в анализ вследствие того, что они оказались «накрытыми» радиоактивным облаком, выброшенным СХК во время производственной аварии 6 апреля 1993 г. [4].

Рис. 4 - Пространственное отображение объектов исследования

Применение методики дендрохроноиндикации позволило получить ретроспективные данные приблизительно за 40-летний период. В результате были получены многомерные массивы данных, содержащие информацию о радиоактивном загрязнении окружающей среды окрестностей г.Томска с 1955 по 1992 г. Указанные данные были получены вед. науч. сотр. НИИ ББ при ТГУ В.Д. Несветайло [5].

Анализ показал, что максимальную активность трития имеет сосна, выросшая в 5-километровой зоне от реакторов СХК. Меньшее количество трития накапливают деревья в районах деревень Георгиевки и Наумовки (за пределами 30-километровой зоны), а сосна на окраине пос. Аникино (контрольная точка за пределами 30-километровой зоны) имеет* активность трития меньшую, чем в предыдущих случаях (рис. 5).

На рис. 6 графически представлены результаты анализа данных об активности трития в годичных кольиах деревьев с отображением средних значений и доверительных интервалов для гаждого анализируемого деоева. Данное отображение показывает, что между значениями

Лпкпапы ТУСУРа. г Автоматизиппяянные системы обработки информации, управления и проектирования концентраций трития в годичных кольцах исследуемых деревьев имеется статистически значи-

мое различие.

0.6

о4»

си

О О

<4

-0.4

А

о А А

7 И Г7 „

7 А % А У V ^О

А

■ /

А

Ж

о д.Георгиевка

А д.Наумовка

V П.АНИКИНО I

■ 5 км от реакторов |

4 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 ГК1 ( 99.98%)

Рис. 5 - Активность трития в образцах годичных колец деревьев

• д.Георгиевка |

▲ д.Наумовка I

▼ п.Аникино |

■ 5 км от реакторов!

30 35 40 45 ГК1 (99.98%)

50 55 60

Рис. 6 - Средние значения и доверительные интервалы активности трития в образцах годичных колец деревьев

Рассмотрим применение разработанного подхода для анализа природно-климатического состояния территории юго-востока Западно-Сибирской равнины. В качестве объема исследования выбрана территория в границах трех административных областей: Томской, Новосибирском и Омской (рис. 7). Центральную част, этой территории занимает Васюганская равнина. Для анализа ^иматических особенностей территории Васюганской равнины были использованы временные ряды среднегодовых значений температуры воздуха и количества атмосферных осадков за период 1955-1992 гг. (по 49 станциям), за период 1955-1985 гг. на 49 станциях Томской, Новосибирской и Омской областей. Сформированный для проведения исследовании файл

данных среднегодовых значений содержит 1862 записи.

Пространственный анализ с применением ГИС проводился наложением границ административных образований и условной границы территории Васюганской равнины на карту расположения метеостанций (рис. 7), результатом чего стало разбиение метеостанций на четыре группы в зависимости от их расположения на территориях Васюганской равнины и трех указанных выше административных областей.

для анализа климатических особенностей территории Васюганской равнины ло сравнению с примыкающими к ней территориями Омской, Томской и Новосибирской областей были

использованы шесть параметров по 49 метеостанциям территории юго-востока ЗападноСибирской равнины:

1) временные ряды среднегодовых значений температуры воздуха;

2) временные ряды среднегодовых значений количества атмосферных осадков;

3) максимальные годовые значения высоты снежного покрова;

4) максимальные годовые значения плотности снежного покрова;

5) максимальные годовые значения запаса воды в снежном покрове;

6) значения высоты станций над уровнем моря.

Результаты комплексного анализа данных с отображением средних значений и доверительных интервалов показали статистически значимое различие между выявленными четырьмя зонами (рис. 8).

\

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Легенда

> метеостанции Озёра /\ / Реки

Гранина: исследуемьх территорий | | Томская о б л г 1 Омская обл [ | Новосибирская обл | | Васюганская равчи

Рис. 7 - Расположение метеостанций на исследуемой территории

^172

о4

£167

¿162

Р157

* 152 147 142 137 132 127 122 117

Томская обл. Васюганская равнина Омская обл. Новосибирская обл.

<ж>

36 46 56 66 76 86

96 106 116

ГК 1 (70,94 %)

Рис. 8 - Отображение доверительных интервалов и средних значений классов объектов исследования в пространстве двух главных компонент (р = 80 %)

При переходе из исходного многомерного пространства к двумерному пространству главных компонент вычисляются проекции характеристик объектов исследований на оси главных компонент. Эти проекции называются нагрузками на главные компоненты [6], по значениям которых судят о вкладе каждого параметра объекта исследования в картину распределения объектов в пространстве двух главных компонент. Исследование нагрузок позволяет выявить наиболее вариабельные параметры или определить, какой из параметров имеет наибольшее значение. а какой наименьшее.

Использование разработанного подхода для анализа природно-климатических данных

территории юго-востока Западной Сибири позволило выявить особенности в климатическом состоянии Васюганской равнины по сравнению с сопредельными территориями (рис. 9). На первую главную, компоненту для Томской, Омской областей и Васюганской равнины наибольшее значение нагрузки имеет показатель 5 - запас воды в снежном покрове. Однако, хотя для Новосибирской области наибольший вклад дает показатель 6 - высота станции над уровнем моря, запас воды в снежном покрове также оказывает существенное влияние. Поэтому этот показатель следует рассматривать как существенный для всех исследуемых территорий, их отличия в климатическом состоянии определяются различием значений показателя водозапаса в снежном

покрове. _

1 1 Томская о$л.

У 1

0.916

I Омска* ебл.;

С1.335

С.00"7

-0.006

0.015

-0.004

-0,011

С .966

0.024

0.052

0014 0-00* 0-0П -0.019 -0 015 ______

1.22

-0.18

-0.026

1

2

Новосибирская обл.

0555

-0.002

0.097

0.142

0.01'

! Васюганская равнина |

0.915

0.528

0.054

0.002

-0.006

3.99

0.225

-0.006

0.066

-0.056

-0.506

0,007

С.051 0.041

-0.086 -0.088

Рис. 9 - Нагрузки на главные компоненты для территорий

Применение разработанного подхода в задачах анализа данных о- радиационном загрязнении окрестностей г. Томска позволило выявить закономерности уровня концентрации радиоактивных веществ в зависимости от расстояния до источника загрязнения.

В задачах анализа климатических особенностей территорий данный подход позволил исследовать пространственные особенности различных территорий, при этом анализ нагрузок переменных на главные компоненты дал возможность выявить наиболее значимые климатические характеристики для каждой исследуемой территории.

Таким образом, разработанный подход позволяет проводить комплексный анализ широкого класса пространственно-распределенных природных объектов, выявлять зависимости и значимые характеристики исследуемых объектов.

ЛИТЕРАТУРА

1. Кошкарев А.В., Тикунов B.C. Геоинформатика. - М.: Картгеоцентр-Геодезиздат, 1993. -

213 с.

2. Дубров A.M. Обработка статистических данных методом главных компонент. - М.: Статистика, 1978. - 135 с.

3. Несветайло В.Д. Дендрохроноиндикация как метод ретроспективного мониторинга // В кн.: Проблемы исследования и преодоления экологической опасности в промышленном регионе. - Кемерово, 1990. - С. 100-109.

4. Израэль Ю., Артемов Е., Пахомов В., Чириков В. и др. Радиоактивное загрязнение местности в результате аварии на радиохимическом заводе в Томске-7 II Метеорология и гидрология. - 1993.-№ 6. - С. 5-8.

5. Peremitina T., Nesvetajlo V., Polichtchouk Y. Radiochemical contamination analysis based on dendrochronoindication data // Proceeding of the 4th Yugoslav Symposium Chemistry and Environment with international participation. - Beograd, 2001. - Pp. 428-430.

6. Андрукович П.Ф. Применение метода главных компонент в практических исследованиях. - М.: Изд-во МГУ, 1973. - Вып. 36. - 124 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.