Научная статья на тему 'Опыт использования статистических методов для анализа экологических данных'

Опыт использования статистических методов для анализа экологических данных Текст научной статьи по специальности «Математика»

CC BY
487
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЭРОФОТОСЪЕМКА / ОБОБЩЕННАЯ ХАРАКТЕРИСТИКА ЦВЕТА / ПОСТРОЕНИЕ КАЛИБРОВОЧНЫХ КРИВЫХ / ЭКОЛОГИЧЕСКИЕ ДАННЫЕ / ОРДИНАРНЫЙ КРИГИНГ / БИНАРНАЯ РЕГРЕССИЯ / AERIAL PHOTOGRAPHY / GENERALIZED COLOR CHARACTERISTIC / CONSTRUCTION OF CALIBRATION CURVES / ECOLOGICAL DATA / ORDINARY KRIGING / BINARY REGRESSION

Аннотация научной статьи по математике, автор научной работы — Буре Владимир Мансурович, Митрофанова Ольга Александровна

Существует ряд задач, связанных с прогнозом пространственного распределения экологических параметров. В работе в качестве примеров применения статистических методов для анализа экологических данных рассматриваются две схожие задачи. Первая задача заключается в количественной оценке обеспеченности растений азотом по данным аэрофотосъемки. Точный прогноз потребности растений в питательных веществах в период выращивания необходим для эффективного использования удобрений, выгодной урожайности и высокого качества продукции. Метод решения этой задачи основан на анализе оптических характеристик растений по цифровым изображениям. Для усовершенствования данного метода разработан модуль, отвечающий за автоматическое построение калибровочных кривых для количественной оценки обеспеченности растений азотом. Вторая задача заключается в оценке уровня экологического показателя в выделенной зоне поля. Предполагается, что исходными данными является набор экологических или агрохимических параметров, измеренных контактным способом, а также аэрофотоснимок рассматриваемого объекта. В статье предложен подход к решению задачи с совместным использованием методов кригинга и бинарной регрессии. На первом этапе проводится вариограммный анализ, после чего строится набор оценок экологического параметра с помощью метода ординарного кригинга. Далее задается пороговое значение параметра для рассматриваемой зоны, вводится фиктивная переменная, которая принимает значение 1, если значение параметра превысило пороговое, и 0 в ином случае. Таким образом, получается основа для логистической регрессии, где в факторы входит набор оценок, спрогнозированных методом кригинга. Кроме того, в статье представлены примеры реализации рассмотренных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Буре Владимир Мансурович, Митрофанова Ольга Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN EXPERIENCE OF USING STATISTICAL METHODS FOR THE ANALYSIS OF ECOLOGICAL DATA

There is a number of problems associated with the prediction of the spatial distribution of ecological parameters. In this paper, two similar problems are considered as examples of the application of statistical methods for the analysis of ecological data. The first problem is to quantify the nitrogen status of plants relying on aerial photos. Accurate prediction of plant nutritional needs during the growing season is necessary for efficient use of fertilizers, optimal yields and high quality products. A method of solving this problem is based on the analysis of the optical characteristics of plants in digital images. To improve this method, a module responsible for automatic construction of calibration curves for the quantitative assessment of plant nitrogen status was developed. The second problem is to assess the level of ecological indicators in selected field areas. It is assumed that the initial data are a set of ecological or agro-chemical data measured in situ, as well as an aerial photographic image of the object. This paper proposes approaching this problem by using a combination of the kriging and binary regression methods. The first step is variogram analysis, and then a set of ecological parameter estimates is built by the ordinary kriging method. Next, we set a threshold level for the given zone, introduce a dummy variable that takes the value 1 if the parameter value exceeds the threshold, and 0 otherwise. Thus, we get a basis for a logistic regression where factors include a set of estimates predicted by kriging. The article also presents application examples for these methods.

Текст научной работы на тему «Опыт использования статистических методов для анализа экологических данных»

Труды Карельского научного центра РАН

№ 8. 2017. С. 12-20 БОТ: 10.17076/ша1528

УДК 004.01:006.72 (470.22)

ОПЫТ ИСПОЛЬЗОВАНИЯ СТАТИСТИЧЕСКИХ МЕТОДОВ ДЛЯ АНАЛИЗА ЭКОЛОГИЧЕСКИХ ДАННЫХ

В. М. Буре, О. А. Митрофанова

Санкт-Петербургский государственный университет

Агрофизический научно-исследовательский институт, Санкт-Петербург

Существует ряд задач, связанных с прогнозом пространственного распределения экологических параметров. В работе в качестве примеров применения статистических методов для анализа экологических данных рассматриваются две схожие задачи. Первая задача заключается в количественной оценке обеспеченности растений азотом по данным аэрофотосъемки. Точный прогноз потребности растений в питательных веществах в период выращивания необходим для эффективного использования удобрений, выгодной урожайности и высокого качества продукции. Метод решения этой задачи основан на анализе оптических характеристик растений по цифровым изображениям. Для усовершенствования данного метода разработан модуль, отвечающий за автоматическое построение калибровочных кривых для количественной оценки обеспеченности растений азотом. Вторая задача заключается в оценке уровня экологического показателя в выделенной зоне поля. Предполагается, что исходными данными является набор экологических или агрохимических параметров, измеренных контактным способом, а также аэрофотоснимок рассматриваемого объекта. В статье предложен подход к решению задачи с совместным использованием методов кригинга и бинарной регрессии. На первом этапе проводится вариограммный анализ, после чего строится набор оценок экологического параметра с помощью метода ординарного кригинга. Далее задается пороговое значение параметра для рассматриваемой зоны, вводится фиктивная переменная, которая принимает значение 1, если значение параметра превысило пороговое, и 0 в ином случае. Таким образом, получается основа для логистической регрессии, где в факторы входит набор оценок, спрогнозированных методом кригинга. Кроме того, в статье представлены примеры реализации рассмотренных методов.

Ключевые слова: аэрофотосъемка; обобщенная характеристика цвета; построение калибровочных кривых; экологические данные; ординарный кригинг; бинарная регрессия.

V. M. Bure, O. A. Mitrofanova. AN EXPERIENCE OF USING STATISTICAL METHODS FOR THE ANALYSIS OF ECOLOGICAL DATA

There is a number of problems associated with the prediction of the spatial distribution of ecological parameters. In this paper, two similar problems are considered as examples of the application of statistical methods for the analysis of ecological data. The first problem is to quantify the nitrogen status of plants relying on aerial photos. Accurate prediction of plant nutritional needs during the growing season is necessary for efficient use of fertilizers, optimal yields and high quality products. A method of solving this problem is based on the analysis of the optical characteristics of plants in digital images. To improve this method, a module responsible for automatic construction of calibration curves for the quantitative assessment of plant nitrogen status was developed. The second problem is to assess the level of ecological indicators in selected field areas. It is assumed that the initial data are a set of ecological or agro-chemical data measured in situ, as well as an aerial photographic image of the object. This paper proposes approaching this problem by using a combination of the kriging and binary regression methods. The first step is variogram analysis, and then a set of ecological parameter estimates is built by the ordinary kriging method. Next, we set a threshold level for the given zone, introduce a dummy variable that takes the value 1 if the parameter value exceeds the threshold, and 0 otherwise. Thus, we get a basis for a logistic regression where factors include a set of estimates predicted by kriging. The article also presents application examples for these methods.

Keywords: aerial photography; generalized color characteristic; construction of calibration curves; ecological data; ordinary kriging; binary regression.

Введение

В настоящее время важное значение имеют различные аспекты статистического анализа экологических данных, а также методы анализа цифровых изображений при решении следующих экологических задач [1, 5]:

• обнаружение чрезвычайных ситуаций;

• мониторинг состояния растений;

• прогноз урожайности;

• дифференцированное внесение азотных удобрений;

• мониторинг состояния мелиоративных систем;

• и др.

Довольно часто возникают задачи, связанные с прогнозом пространственного распределения экологических данных. Рассмотрим в качестве примеров две схожие задачи, которые заключаются в оценке обеспеченности растений азотом.

Прогноз потребности растений в питательных веществах в период выращивания необходим для эффективного использования удобрений, выгодной урожайности и высокого качества продукции. Особое значение имеет экономическая сторона применения удобрений, т. к.

азотсодержащие удобрения по стоимости их приобретения, транспортировки и внесения в настоящее время занимают до 30-50 % в себестоимости продукции растениеводства. Азот наиболее часто применяется для сельскохозяйственных культур в качестве удобрения [7].

Построение калибровочных кривых.

В первой задаче необходимо количественно оценить содержание азота в растениях на каждом участке поля по данным аэрофотосъемки. Решение этой задачи основано на анализе цветовых характеристик растений по аэрофотоснимкам. Для количественной оценки обеспеченности растений удобрением с помощью оптических методов следует разработать специальное программное обеспечение, которое позволит автоматизировать обработку информации и облегчит принятие решений о необходимости и дозе подкормки растений.

Применение кригинга и бинарной регрессии для анализа экологических данных. Не всегда требуется точная оценка потребности растений в питательных веществах как в первой задаче, в ряде задач достаточно оценить уровень содержания азота в выделенной зоне поля. Исходными данными второй задачи являются набор экологических параметров 2(хг), измеренных контактным способом, а также аэрофотоснимок обследуемого поля.

Необходимо оценить уровень обеспеченности растений азотом в каждой зоне поля.

Материалы и методы

Объектами исследования являются опытные сельскохозяйственные поля, расположенные на территории Меньковского филиала Агрофизического института (Ленинградская область, Гатчинский район, д. Меньково, координаты центра хозяйства 59°25' с. ш., 30°01' в. д.).

В настоящее время аэрофотосъемка полей осуществляется с помощью автоматизированного беспилотного летательного аппарата вертолетного типа Геоскан-401 (квадрокоптер), на котором закреплены две цифровые камеры (видимого и инфракрасного диапазонов). Квадрокоптер позволяет оперативно получать изображения сельскохозяйственных полей с хорошим разрешением.

Задача 1. Решение задачи количественной оценки обеспеченности растений азотом основано на анализе цветовых характеристик растений по аэрофотоснимкам. В процессе фотосинтеза растений под действием солнечного света образуется органическое вещество. Непосредственным участником этого процесса является хлорофилл, который определяет зеленый цвет листовой поверхности и стеблей растений. И хотя в процессе фотосинтеза растений принимают участие множество элементов минерального питания, в ряде работ установлено, что наибольшая корреляционная взаимосвязь наблюдается между обеспеченностью их азотом и содержанием хлорофилла. Таким образом, дефицит азотного питания сопровождается изменением цвета листьев растений и растительного покрова [7].

Для интерпретации цветовых параметров применяется модель цветового пространства CIELAB. В системе Lab цветовой параметр L всегда положителен и обозначает светлоту; a > 0 обозначает параметр красной составляющей, a < 0 - зеленой, b > 0 - желтой, b < 0 -синей.

Полученные материалы аэрофотосъемки содержат растровые изображения сельскохозяйственных полей, а также координаты центров фотографирования и опорных точек. Таким образом, полученные изображения привязаны к глобальной системе позиционирования (геопривязка). По результатам аэрофотосъемки строится ортофотоплан с помощью программы Agisoft Photoscan. Изображение сельскохозяйственного поля содержит тестовые площадки (рис. 1) - небольшие участки поля, на которые была внесена определенная

доза азота (например, 0, 30, 50, 70, 90, 110 кг действующего вещества на 1 га). В результате средние значения цветовых характеристик растений на каждой из тестовых площадок являются эталонами, на основе которых можно оценить содержание азота на остальных участках поля (модель с обучением). После проведения количественной оценки содержания азота в растениях на аэрофотографии выделяются зоны посева, требующие подкормки, и в специальной программе генерируются технологические карты, необходимые для дифференцированного внесения азотных удобрений.

Оценку обеспеченности растений азотом можно провести двумя путями: напрямую сравнивать цветовые характеристики с эталонными либо построить калибровочную кривую также на основе характеристик эталонов. Для получения корректных результатов целесообразно построить калибровочную кривую, описывающую зависимость дозы азота на тестовых площадках от характеристики цвета растений. Следует отметить, что для каждого изображения строится своя калибровочная кривая. В связи с этим также целесообразно создание математического модуля, позволяющего автоматизировать построение калибровочных кривых.

Рис. 1. Аэрофотоснимок с тестовыми площадками (числами обозначены дозы внесенного азота на каждую из тестовых площадок, соответственно 0, 30, 50, 70, 90, 110 кг действующего вещества на 1 га)

Задача 2. В основе решения задачи прогноза пространственного распределения экологических данных лежат два метода статистического анализа: ординарный кригинг и логистическая регрессия.

Ординарный кригинг позволяет прогнозировать распределение экологического параметра на основе набора наблюдений [3]:

п п

¿(хо) = ^ ^(хг), ^ Аг = 1, (1)

г=1 г=1

где 2(жг) - наблюдаемое значение в местоположении Хг; Аг - неизвестный вес для него; 2(жо) - прогнозируемое значение в местоположении жо; п - количество наблюдений. Вес Аг зависит от установленной модели вариограм-мы для установленных точек, от расстояния до местоположения прогноза и от пространственных отношений между значениями вблизи от местоположения прогноза.

Для осуществления прогноза методом кри-гинга необходимо провести вариограммный анализ (анализ и моделирование корреляционной структуры данных). Пространственные отношения между наблюдениями характеризует полувариограмма (будем называть просто вариограммой):

7(Н) = 1 Уаг[2(ж) - 2(ж + Н)] =

= 1Е[2(ж) - 2(ж + Н)]2.

Чем ближе величины данных (меньше разница между ними), тем больше величина варио-граммы.

Вариограмма 7(Н) оценивается на основе экспериментальной вариограммы:

7(Н) =

1

(Н)

N (Н)

^ [2(жг) - 2(жг + Н)]2,

г=1

где N(Н) - число пар экспериментальных точек, разделенных вектором Н. В дальнейшем на основе экспериментальной вариограм-мы строится ее теоретическая модель. Варио-граммный анализ позволяет найти веса оценки ординарного кригинга (1).

На следующем этапе решения задачи осуществляется переход к логистической регрессии. Для этого устанавливается пороговое значение й для рассматриваемой зоны поля и вводится фиктивная переменная

'1, 2(ж) ^ й,

У(ж) =

0, 2(ж) < й.

В наблюдаемых точках экологический параметр известен, следовательно, известны величины у(жг) в этих точках. Кроме того, можно спрогнозировать величины экологического параметра в этих точках с помощью метода кри-гинга. Таким образом, получается основа для логистической регрессии, отражающей зависимость между вероятностью превышения порогового значения и объясняющими переменными [6]:

Р (у(жг) = 1|Фг) = Рг =

1

(2)

Как один из факторов логистической регрессии предлагается ввести набор значений, предсказанных методом кригинга [8]. Кроме того, в факторы могут входить цветовые параметры со снимка, в случае, если величина экологического параметра коррелирует со значением цвета. Вектор в можно оценить методом максимального правдоподобия.

Проверку значимости построенного уравнения логистической регрессии (2) можно провести по критерию отношения правдоподобия, а также с помощью критерия Вальда [6].

В результате можно для каждой точки поля вычислять вероятность Р(у(ж) = 1), в случае, если она окажется близка к 1, есть основания полагать, что в этой точке значение экологического параметра превышает пороговый уровень й, а если вероятность близка к 0, есть основания считать, что значение параметра ниже порогового уровня.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Построение калибровочных кривых.

Для точного определения потребности растений в азоте на каждом участке поля целесообразно создание математического модуля, позволяющего автоматизировать построение калибровочных кривых. Входными данными рассматриваемого модуля являются количество тестовых площадок, значения доз азота на каждой тестовой площадке и соответствующие им средние значения цветовых параметров а, Ь. Однако для построения калибровочной кривой, отражающей зависимость дозы азота на тестовых площадках от цвета листьев, необходимо представить параметры цвета в виде единой величины. В связи с этим предложено свернуть вектор параметров цвета в одно значение с использованием выпуклой линейной комбинации. Данное значение условно названо обобщенной характеристикой цвета СьаЬ, которая рассчитывается по формуле [4]:

Сьаь = + в!а* + в2^*

(3)

1 + ехр(—фТв)" Здесь Фг - факторы, объясняющие фиктивную переменную у(жг).

где а ^ 0, в1 ^ 0 и в2 ^ 0 - эмпирически подбираемые коэффициенты для каждого аэрофотоснимка поля, причем

а + в1 + в2 = 1.

При подборе коэффициентов а, в1, в2 необходимо обеспечить максимально выраженную линейную связь между дозой азота на тестовых площадках и обобщенной характеристикой цвета. Классическим методом решения подобных задач является линейное регрессионное моделирование [2]. При построении предполагается, что линейная модель наилучшим

образом характеризует зависимость между содержанием азота N и обобщенной характеристикой цвета О^аь:

N = + в^ОьаЬ + е, где во и в* - параметры модели, а е - случайная величина (возмущение), характеризующая влияние неучтенных факторов. Уравнение регрессии при этом примет вид:

N * = Ьо + Ъ1ОЬаь. (4)

Коэффициенты Ьо и Ь1 вычисляются методом наименьших квадратов:

bi =

n Е NiCiob - Е N Е

i=1 i=1 i=1

n n '

n E (CU)2 - (E c^rah))'

Lab' \ Lab'

i=1 i=1

bo = n W: Ni - ьл 'c

i=1

Lab

(5)

(6)

После этого проводится проверка адекватности модели. Соответственно рассчитываются полная сумма квадратов вариации отклика, а также две ее составляющие: сумма квадратов, объясненная регрессией, и остаточная сумма квадратов. Для оценки меры выраженности линейной связи используется коэффициент детерминации. Для того чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяется средняя ошибка аппроксимации. Оценка значимости уравнения регрессии в целом проводится на основе F-критерия Фишера, строится F-статистика.

Получив оптимальный набор коэффициентов, строится калибровочная кривая, позволяющая определить содержание азота на каждом элементарном участке поля.

Для реализации рассматриваемого модуля разработан алгоритм построения калибровочных кривых, осуществлена его проверка на адекватность. Схематично алгоритм основной функции построения можно представить следующим образом: // Входные данные:

Data: n - количество тестовых площадок;

N = (Ni,..., Nn) - значения содержания азота на площадках; L* = (L*, ...,L*n),

a* = (a*v...,a*n),b* = (b*, ...,b*ri) -соответствующие им цветовые параметры. // Выходные данные: Result: Эмпирически подобранные коэффициенты а, въ в2; уравнение калибровочной кривой; коэффициент детерминации R2; средняя ошибка аппроксимации ё; F-статистика.

//

max ^ 0;

for а е [0; 1] do {

for в1 е [а; 1] do {

в2 ^ 1 - а - в1; Вычисление значений C^ab =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= (CLa^ Cnab) по ф°рмуле (3);

if Значения CLab монотонны then {

// Построение линейной регрессионной модели:

Вычисление коэффициентов уравнения линейной регрессии по формулам (5), (6);

Вычисление новых смоделированных значений содержания азота N * = (N*, ...,Nn) по формуле (4); Вычисление сумм квадратов отклонений;

Вычисление средней ошибки аппроксимации;

Вычисление коэффициента детерминации R2; if R2 > max then ma^ R2;

}

}

}

Вычисление F-статистики.

Таким образом, находим такой набор коэффициентов а, ßi, ß2, при котором коэффициент детерминации максимален и, соответственно, линейная зависимость параметров N и О^аЬ наиболее выражена.

Модуль реализован в среде разработки Visual Studio 2012 Professional с использованием дополнительной библиотеки ZedGraph и языка программирования C#. На рисунке 2 представлен пример результатов расчета модуля.

1 CD 200 300 400 500 200400 600

20 -К -

ю -

90 135

0 45

- 20 - 15

100 200 300 400 500

distance

200 400 «00

Рис. 2. Пример результатов расчета модуля построения калибровочных кривых

Пример построенной калибровочной кривой иллюстрирует рисунок 3.

Рис. 3. Пример построенной калибровочной кривой

Применение кригинга и бинарной регрессии для анализа экологических данных. Покажем применение этих методов на двух смоделированных примерах с использованием языка программирования И. Смоделируем два набора величин (50 и 144 значения соответственно) некоторого экологического параметра 21 и 22 (например, показания ^тестера интенсивности окраски листьев растений) по двум различным схемам распределения на участке поля. Смоделиру-

ем также две выборки объема 50 и 144 точек из нормального распределения с математическим ожиданием 0 и среднеквадратиче-ским отклонением 1, которые будут соответствовать случайным величинам е1 и е2 («белый шум»), и добавим их к смоделированным наборам данных: 21 = 21 + е1; 22 = 22 + е2. Установим порог й = 350.

На рисунке 4 представлены карты-схемы распределения смоделированных данных на участке поля.

Положение на карте

Положение на карте

о о

о о

о о

со

о о <ч

о о

• о о • 0

0*0- 0

. . 0 • 0

0 0 О 0 0

00 • 0 0

00 0 • .

0 о 0 • 0

ООО» 0

0 0 0 0 0

-100 О 100 200 300 400

X

О0>-«00о0000

° • оООО ооООо о ооооооСЮооОо « оооОООООоо« ооОООООООСЮ«

о . ОООООООООО

о оОО оООоООО о О •ООООООО О О О ••оООоОоОООо О ОООООООООО»

00' • • 1 • • О О о • 0«0''00»1*'0

Т-I-1-1-1-1-г~

О 100 200 300 400 500 600

Рис. 4. Карты-схемы распределения смоделированных данных на участке поля (диаметры кругов пропорциональны величине данных)

Предварительно осуществляется проверка ограничений и предположений геостатистики (стационарность и мультинормальность). По-

сле предварительного анализа осуществляется вариограммный анализ, в результате которого строится экспериментальная вариограмма

и устанавливается теоретическая модель ва-риограммы. Экспериментальные вариограм-мы рассматриваемых примеров по четырем

направлениям (0, 45, 90 и 135°) с установленными моделями вариограмм иллюстрирует рисунок 5.

а Построение калибровочных прямых | [^lOsiih-^-l

Входные данные

N L а Ь

0 160 105 179

30 148 100 177

60 132 100 173

90 123 102 170

ОК I

120 99 105 161

150 86 107 156

180 77 109 153

210 75 109 152

Вьосодоые данные

alpha beta 1 beta2

0.88 0.00 0.12

Калибровочная прямая Построить график

N - 353.50 -5.77 C.Lab

Коэффисиент детерминации Средняя ошибка

0.97 7.11 V.

Рис. 5. Экспериментальные вариограммы по четырем направлениям с установленными моделями ва-риограмм

На основе результатов вариограммного анализа применяется ординарный кригинг. Поочередно из набора смоделированных наблюдений исключается одно значение, после чего оно оценивается методом кригинга с помощью функции krige(). Таким образом, получаем два набора значений экологического параметра, предсказанных методом ординарного кригинга в наблюдаемых точках.

С помощью выявленных данных строятся три логит-модели в каждом примере с помощью функции glm(). Оценка значимости моделей проводится по критерию отношения прав-

доподобия. Исходные данные для построения следующие: зависимая переменная Т = 1, если показание N-тестера более или равно 350, иначе принимает значение 0; в качестве объясняющих переменных рассматриваются переменные X и У - координаты наблюдений, а также N^£<1 - предсказанные методом кригинга величины параметра в наблюдаемых точках. В таблице 1 представлены результаты построения логит-моделей рассматриваемых смоделированных примеров, из которых видно, что все модели статистически значимы.

Таблица 1. Результаты построения логит-моделей рассматриваемых примеров

Результаты расчета Пример 1 Пример 2

логит-модель 1: зависимая переменная Т, объясняющие переменные X и У

Коэффициент хи-квадрат 37.36926 7.943813

Уровень значимости 3.840071e-09 0.009418745

логит-модель 2: зависимая переменная Т, объясняющие переменные X, У и

Коэффициент хи-квадрат 51.0379 117.7156

Уровень значимости 2.355682e-11 1.18768e-25

логит-модель 3: зависимая переменная T, объясняющая переменная Npred

Коэффициент хи-квадрат 30.26213 82.66378

Уровень значимости 1.945903e-08 4.92086e-20

Примечание. Уровни значимости смоделированных коэффициентов во всех логит-моделях

меньше 0.05

На заключительном этапе сравниваются данные логит-модели. Так как все три модели в каждом примере вложенные, предварительное сравнение осуществляется с помощью функции апоуа(). В результате получаем, что полная логит-модель 2 работает лучше сокращенных. Кроме того, создана дополнительная тестовая база для каждого примера: поочередно из набора наблюдений исключается одна точка и осуществляется анализ, как

Заключение

В работе продемонстрированы возможности применения статистических методов для анализа экологических данных на примере двух схожих задач. Рассмотренные задачи заключаются в прогнозе пространственного распределения экологических данных. Кроме того, представлены практические примеры реализации предложенных подходов. На основе проведенного исследования можно сформулировать следующие выводы:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• применение статистических методов в задачах, связанных с анализом экологических данных, является весьма актуальным и перспективным направлением;

• описанные методы - доступные, недорогие и достаточно точные приемы прогноза распределения экологических данных;

• метод построения калибровочных кривых, отражающих зависимость дозы азота от обобщенной характеристики цвета, наиболее точно позволяет оценить целесообразность внесения азотных удобрений;

• совместное применение кригинга и бинарной регрессии дает возможность решать ряд актуальных экологических проблем: мониторинг состояния растений,

предскажут в этой точке значение вероятности Р(Т = 1) все три логит-модели. В первом примере вторая модель показала себя лучше сокращенных моделей в 37 точках из 50, а во втором примере - в 107 точках из 144. Кроме того, процент неправильно предсказанных точек также меньше во второй логит-модели в обоих примерах. В таблице 2 представлена выборка из 10 точек построенной тестовой базы для первого примера.

прогноз урожайности, дифференцированное внесение азотных удобрений и др. На основе полученных в практической реализации результатов можно полагать, что целесообразно использовать полную логит-модель, однако этот подход требуется рассмотреть на ряде дополнительных примеров.

Литература

1. Буре В. М. Методология статистического анализа опытных данных. СПб.: С-Петерб. гос. ун-т, 2007. 141 с.

2. Буре В. М, Парилина Е. М. Теория вероятностей и математическая статистика: учебное пособие. СПб.: Лань, 2013. 416 с.

3. Демьянов В. В., Савельева Е. А. Геостатистика: теория и практика. М.: Ин-т проблем безопасности развития атомной энергетики РАН; Наука, 2010. 327 с.

4. Митрофанова О. А., Буре В. М., Канаш Е. В. Математический модуль для автоматизации колориметрического метода оценки обеспеченности растений азотом // Вестн. С.-Петерб. ун-та. Сер. 10. Прикладная математика. Информатика. Процессы управления. 2016. Вып. 1. С. 85-91.

5. Якушев В. П., Буре В. М. Подходы к обнаружению статистических зависимостей. СПб.: С.-Петерб. гос. ун-т, 2003. 64 с.

Таблица 2. Выборка из тестовой базы логит-моделей для первого примера

№ X У Z Т Npred Модель 1 Модель 2 Модель 3

1 100 50 352 1 351.1794 0.99025 0.99993 0.96233

2 250 50 348 0 350.2188 0.60916 0.34788 0.82778

3 200 100 347 0 350.2588 0.71082 0.07791 0.84101

4 150 150 354 1 349.9958 0.73760 0.99664 0.67032

5 150 200 353 1 349.6525 0.51356 0.92354 0.49262

6 50 300 353 1 349.5278 0.77216 0.99804 0.42703

7 150 300 348 0 348.954 0.15470 0.04604 0.20274

8 50 400 345 0 349.0604 0.43531 0.00086 0.24526

9 100 450 347 0 348.1283 0.04580 0.00743 0.04201

10 150 500 348 0 347.3104 0.00361 0.00146 0.00755

6. Якушев В. П., Буре В. М., Парилина Е. М. Бинарная регрессия и ее применение в агрофизике. СПб.: Агрофиз. ин-т, 2015. 36 с.

7. Якушев В. П., Канаш Е. В., Конев А. А., Ко-втюх С. Н., Лекомцев П. В., Матвеенко Д. А., Петрушин А. Ф., Якушев В. В., Буре В. М., Осипов Ю. А., Русаков Д. В. Теоретические и методические основы выделения однородных технологических зон для дифференцированного

применения средств химизации по оптическим характеристикам посева: практическое пособие. СПб.: Агрофиз. ин-т, 2010. 60 с.

8. Fernandes G. B., Artes R. Spatial dependence in credit risk and its improvement in credit scoring // European Journal of Operational Research. 2016. No. 249. P. 517-524.

Поступила в редакцию 11.03.2017

References

1. Bure V. M. Metodologiya statisticheskogo analiza opytnykh dannykh [Statistical analysis methodology of the experimental data]. St. Petersburg: St. Petersburg St. Univ. Publ., 2007. 141 p.

2. Bure V. M., Parilina E. M. Teoriya vero-yatnostei i matematicheskaya statistika: uchebnoe posobie [Probability theory and mathematical statistics: a study guide]. St. Petersburg: Lan's Publ., 2013. 416 p.

3. Dem'yanov V. V., Savel'eva E. A. Geosta-tistika: teoriya i praktika [Geostatistics: theory and practice]. Moscow: Nuclear Safety Inst. of the RAS, Nauka Publ., 2010. 327 p.

4. Mitrofanova O.A., Bure V.M., KanashE.V. Matematicheskii modul' dlya avtomatizatsii kolorimetricheskogo metoda otsenki obespechennosti rastenii azotom [Mathematical module to automate the colorimetric method for estimating nitrogen status of plants]. Vestnik of St. Petersburg Univ. Ser. 10. Applied Mathematics. Computer Science. Control Processes. 2016. Iss. 1. P. 85-91.

5. Yakushev V. P., Bure V. M. Podkhody k obnaruzheniyu statisticheskikh zavisimostei [Approaches to detect statistical relationships].

St. Petersburg: St. Petersburg St. Univ. Publ., 2003. 64 p.

6. Yakushev V. P., Bure V. M, Parilina E. M. Binarnaya regressiya i ee primenenie v agrofizike [Binary regression and its application in agrophysics]. St. Petersburg: Agrophys. Institute, 2015. 36 p.

7. Yakushev V. P., Kanash E. V., Konev A. A., Kovtyukh S. N., Lekomtsev P. V., Matveenko D. A., Petrushin A. F., Yakushev V. V., Bure V. M., Osipov Yu. A., Rusakov D. V. Teoreticheskie i metodicheskie osnovy vydeleniya odnorodnykh tekhnologicheskikh zon dlya differentsirovannogo primeneniya sredstv khimizatsii po opticheskim kharakteristikam poseva: prakticheskoe posobie [Theoretical and methodological foundations of homogeneous areas selection for differentiated application of chemicals from the optical characteristics of crop: a practical guide]. St. Petersburg: Agrophys. Institute, 2010. 60 p.

8. Fernandes G. B., Artes R. Spatial dependence in credit risk and its improvement in credit scoring. European Journal of Operational Research. 2016. No. 249. P. 517-524.

Received March 11,2017

СВЕДЕНИЯ ОБ АВТОРАХ:

Буре Владимир Мансурович

профессор, д. т. н.

Санкт-Петербургский государственный университет Университетская наб., 7/9, Санкт-Петербург, Россия, 199034

Агрофизический научно-исследовательский институт Гражданский пр., 14, Санкт-Петербург, Россия, 195220 эл. почта: vlb310154@gmail.com тел.: (812) 4284286

CONTRIBUTORS:

Bure, Vladimir

St. Petersburg State University

7/9 Universitetskaya Emb., 199034 St. Petersburg, Russia

Agrophysical Research Institute

14 Grazhdanskiy Pr., 195220 St. Petersburg, Russia

e-mail: vlb310154@gmail.com

tel.: (812) 4284286

Митрофанова Ольга Александровна

аспирант

Санкт-Петербургский государственный университет Университетская наб., 7/9, Санкт-Петербург, Россия, 199034

Агрофизический научно-исследовательский институт Гражданский пр., 14, Санкт-Петербург, Россия, 195220 эл. почта: omitrofa@gmail.com тел.: (812) 5341511

Mitrofanova, Olga

St. Petersburg State University

7/9 Universitetskaya Emb., 199034 St. Petersburg, Russia

Agrophysical Research Institute

14 Grazhdanskiy Pr., 195220 St. Petersburg, Russia

e-mail: omitrofa@gmail.com

tel.: (812) 5341511

i Надоели баннеры? Вы всегда можете отключить рекламу.