Научная статья на тему 'Байесовское оценивание при агрохимических обследованиях'

Байесовское оценивание при агрохимических обследованиях Текст научной статьи по специальности «Математика»

CC BY
104
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АГРОХИМИЧЕСКОЕ ОПРОБОВАНИЕ / БАЙЕСОВСКОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ / AGROCHEMICAL SURVEYS / BAYESIAN ESTIMATION OF DISTRIBUTION PARAMETERS

Аннотация научной статьи по математике, автор научной работы — Благовещенский Юрий Николаевич, Самсонова Вера Петровна

В схеме агрохимического обследования пробоотбор является одним из самых затратных этапов. Использование априорной информации о распределении свойств (байесовский подход) позволяет сократить число отбираемых проб на 5-10% при сохранении точности оценивания. Введение региональных баз данных почвенного картографирования является необходимым условием для применения байесовского подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Bayesian approach in agrochemical surveys

In the scheme of agrochemical survey sampling is one of the most costly stages. The use of a priori information about distributions of properties (the Bayesian approach) allows to reduce the number of samples to be taken by 5-10% while maintaining the accuracy of assessment. Maintenance of regional databases of soil mapping is a necessary condition for the application of the Bayesian approach.

Текст научной работы на тему «Байесовское оценивание при агрохимических обследованиях»

УДК 631.421

БАЙЕСОВСКОЕ ОЦЕНИВАНИЕ

ПРИ АГРОХИМИЧЕСКИХ ОБСЛЕДОВАНИЯХ

Ю.Н. Благовещенский, В.П. Самсонова

В схеме агрохимического обследования пробоотбор является одним из самых затратных этапов. Использование априорной информации о распределении свойств (байесовский подход) позволяет сократить число отбираемых проб на 5—10% при сохранении точности оценивания. Введение региональных баз данных почвенного картографирования является необходимым условием для применения байесовского подхода.

Ключевые слова: агрохимическое опробование, байесовское оценивание параметров распределения.

Введение

Цель агрохимического обследования полей — определение обеспеченности почв питательными веществами. Стандартное опробование заключается в разбивке угодья на участки фиксированной площади (элементарные участки), отборе 30—40 индивидуальных проб на каждом из них и приготовлении смешанного образца, который затем передается в лабораторию для анализа [2]. Размер элементарных участков в зависимости от природных особенностей территории и уровня применяемых удобрений колеблется от 2 до 40 га; в Нечерноземной зоне их размер чаще всего равен 5 га. Результаты агрохимического обследования используются при решении вопросов о необходимости внесения мелиорантов и удобрений. Минимальная единица для воздействия — поле.

В схеме агрохимического обследования пробоотбор является одним из самых затратных этапов. Нарушения на этой стадии могут обесценить всю дальнейшую работу. Поэтому обоснование возможного уменьшения числа отбираемых проб без потери качества выводов представляет весьма актуальную задачу для современной агрохимии. В статье предлагается решать ее, используя информацию, накопленную агрохимической службой, для байесовского оценивания параметров распределения свойств на угодье.

Теория:

алгоритмы байесовского оценивания

Байесовская модель наблюдений. Пусть в результате отбора п образцов с одного и того же поля в рамках агрохимического обследования получены данные X = (хь ..., xп) о почвенных свойствах. Как правило, статистический анализ ведется в предположении, что выборка Хпредставляет совокупность независимых и одинаково распределенных случайных величин, причем практически для всех важных почвенных свойств можно

считать, что либо они, либо их логарифмы подчиняются нормальному распределению. Исключения возникают лишь при наличии на поле резко контрастирующих участков, например, из-за его укрупнения за счет распашки недавней вырубки леса. В классической модели предполагается, что наблюдения подчиняются нормальному распределению с неизвестными числовыми значениями среднего а и дисперсии b2, т.е. распределению с плотностью

f< I ач 1 ( (x -a)2 )

f (x | a, b) = —r= exp - ,

bV2rc ^ 2b2 )

где а и b — конкретные числа, хотя и неизвестные нам.

В байесовской модели почвенного свойства возникает дополнительный объект — некое «воображаемое» множество однотипных полей, на которых действует тот же нормальный закон распределения, но его параметры варьируют от поля к полю как некие случайные величины £ и п. В результате выбор конкретного поля для обследования рассматривается как выбор конкретных числовых значений величинами £ и п, например, £ = а и п = b.

По сути, классический подход базируется на том, что среднее может быть любым числом, дисперсия — любым положительным числом, а между средним и дисперсией нет никакой связи. В отличие от этого байесовский подход допускает неравноправность возможных числовых значений среднего и дисперсии, что более реалистично, чем полная равноправность. Например, едва ли среднее значение содержания гумуса по полю (а не значение его в отдельном образце!) окажется выше 5% на серых лесных освоенных почвах. И еще: весьма часто дисперсия будет выше на тех полях, где больше гумуса в среднем, так что связь между значениями среднего и дисперсии вполне возможна.

Появление нового объекта расширяет наши возможности, поскольку теперь мы можем использовать опыт экспериментальных исследований в определении того, какие значения среднего и дисперсии и с какими вероятностями можно ожидать на выбранном для обследования поле. Это априорное и, в определенной степени, субъективное знание претворяется в выбор совместного распределения для случайных величин £ и п, которое называется априорным. Пример использования априорной информации для деталей машин можно найти в [2].

Выбор априорного распределения Н(а, Ь) = = Р {£ < а, п < Ь }в байесовском подходе является одной из главных составных частей метода и заключает в себе все то новое, что создает конкуренцию классическому оцениванию и одновременно вызывает новые проблемы при анализе данных. Если не углубляться в математические тонкости, то байесовская модель состоит из двух иерархически расположенных относительно друг друга случайных величин, одна из которых, Х\, ..., Хп, представляет повторную выборку с одним и тем же нормальным распределением компонент, а другая, £ = (£, п), определяет параметры неизвестного нормального распределения. Иерархия состоит в том, что распределение компонент конкретизируется только тогда, когда величины £ = (£, п) принимают то или иное конкретное значение. Другими словами, нормальное распределение с параметрами а и Ь является условным распределением —Хр 1 <] < п, когда £ = а и п = Ь.

Естественно, что новые данные X = (хь ..., хп) об измеряемом свойстве повлияют на шансы появления тех или иных значений среднего и дисперсии, их априорное распределение изменится, это будет уже условное распределение

Н(а, Ь) = Р {£ < а, п < Ь/Х1 = хь ..., Хп = хп},

которое называется апостериорным и учитывает содержащуюся в Х информацию.

Обозначим через к (а, Ь) и к (а, Ь) плотности априорного распределения Н(а, Ь) и апостериорного Н(а, Ь), и пусть/п(X|а,Ь)=/(х11а,Ь)-...-/(хп|а, Ь) обозначает плотность условного распределения Р X < Х1, ..., Хп < хп/£ = а, п = Ь}. Тогда

к (а, Ь) =

1

Сп (X)

•/(X|а, Ь)-к (а, Ь),

где Сп (X) — нормирующий множитель, независящий от параметров. Это и есть главная формула Байеса в рассматриваемой нами ситуации.

Следует сказать, что в предположении равных шансов у всех точек на прямой для среднего и у всех точек на положительной полупрямой для дисперсии «высокая» математика доказала, что плотность к (а, Ь) совпадает с функцией правдоподобия, а значения ап (X) и Ьп (X), при которых к (а, Ь) достигает максимума, будут оценками максимального правдоподобия, ап(X) = х = — (х1 +... + хп) и _п

Ьп (X) = Яп = ((Х1 - х)2 + ... + (хп - х)2).

Байесовские оценки ап (X) и Ьп (X) находят точно так же — из условия максимума плотности к (а, Ь), или, что эквивалентно, максимума функции /п(X| а, Ь) • к (а, Ь), в которой особые сложности доставляет множитель к (а, Ь) — априорная плотность распределения случайных параметров £ = (£, п). Естественно, что степень «сложности» зависит от вида функций к (а, Ь) и от того, как они сочетаются с функцией /п (X| а, Ь). До настоящего времени лучший способ обойти эти сложности — использовать в качестве априорного распределения для случайных параметров распределения, сопряженные с распределением наблюдаемых величин1 [1, 4]. Главное достоинство этого семейства распределений в том, что из принадлежности к нему априорного распределения следует принадлежность к нему и апостериорного распределения с новыми, но легко вычисляемыми параметрами.

Семейство сопряженных распределений. Рассмотрим вместо дисперсии ее обратную величину, которая называется мерой точности, и определим априорное распределение пары (£, р), р = = (1/п2), реализация которой представляет пару (а, г), где а — среднее, г = (1/Ь2) — мера точности. Распределение Рд^ (£ < и, р < t) принадлежит семейству сопряженных с нормальным распределений и называется гамма-нормальным, если:

мера точности р = (1/п2) подчиняется гамма-распределению Г (я | к, А) с плотностью у (я | к, А) =

А к $к-\

= -ехр (-Ая), где Г (к) — гамма-функция

Г (к)

Эйлера;

распределение £ при условии, что р = г, является нормальным распределением с параметрами ^ = М£ (математическое ожидание £) и qr =(Б£)-1 (мера точности £).

Как уже говорилось, выбрав априорное распределение из такого семейства, мы получим, что апостериорное распределение снова будет гамма-нормальным, но уже с другими параметрами. Допустим пока, что мы каким-то образом выбра-

1Впервые были введены и исследованы американскими учеными Г. Райфа и Р. Шлейфером в 1961 г. [4].

ли значения всех четырех параметров (Л, X, л, q) и подсчитали X и sn по выборке X = (хь ..., хп). Тогда параметры Ц, Ц апостериорного распределения пары (£, р), в котором учтены новые наблюдения XI = Х1, ..., Xn = хп, вычисляются по следующим формулам:

~ , 1 ц , ^ ЦП (х - ц)

k = k + — п, X = X + ——+—--,

2 2 2 (ц + п)

_ nX ~

ц =-, ~ = q+n.

q + п

(1)

Если известны параметры апостериорного распределения, т.е. условного распределения пары (£, р) не до, а после результатов наблюдений X! =

= Х1, ..., Xn = xn, то распределение 1 = (1-ц) ■

I ~

в этих новых условиях подчиняется распределению Стьюдента с 2k -степенями свободы1. Это и является основой для нахождения доверительного интервала для неизвестного среднего на исследуемом поле.

Параметры априорного распределения. Чтобы использовать (1), необходимо знать параметры Л, X, л, q. Для этого имеется всего два пути: либо воспользоваться базой данных о средних и дисперсиях, если таковая имеется, либо найти экспертное решение этой задачи2. В любом случае финальная часть работы по определению параметров Л, X, л, q должна будет проводиться по одним и тем же формулам, связывающим их с

7—22 "

оценками 1, р, и математических ожиданий

и дисперсий случайных параметров £ и р. Вот эти формулы:

г (р), Р т X 1 k = —Г, Х л = 1 q = г~Г-7.

8р k -1 S|

(2)

Пусть база данных содержит сведения о средних ak и дисперсиях Ь2 , где k — рабочий номер поля, k =1,2,..., m (т — общее число полей, у нас m = 9). Тогда оценки £, р, sЦ и яр вычисляются

по хорошо известным формулам:

1 = — (а1 + ... + ат), т

8 2 = тЧ ■ ((а1 -1)2 + ... + (ат -1)2),

т -1

р = т"( Р1 + ... + Рт),

^ = ^Т ■ ((Р1 - + ... + (Рт - Р)2 ), т -1

где рk = (1Ь1), k = 1, 2, ..., т.

Порядок действий по байесовскому анализу. Формальная схема байесовского оценивания в предположении, что наблюдения подчиняются нормальному закону распределения, достаточно проста и состоит из нескольких последовательных действий.

(А1). Используя базу данных вычисляют £,

— 2 2

р, 81 и ^р, а затем — параметры

Л, X, л, q априорного распределения по формулам (2). В отсутствие базы

7—2 2 данных значения 1, р, 81 и определяются путем тех или иных экспертных «оценок». (А2). По выборке X = (х1, ..., хп) вычисляются две статистики:

х = — (х1 +... + хп) и

8п = ((Х1 - X)2 + ... + (Хп - X)2 ).

(А3). По формулам (1) вычисляются параметры k, X, Ц, Ц апостериорного распределения пары (£, р). (А4). По уровню значимости е (например, е =0,05) вычисляется соответствующий порог (е) по распределению Стьюдента с 2~ -степенями свободы (квантиль уровня 1 — 1/2 ■ е). (А5).Для случайного среднего, т.е. для 1 с учетом полученных наблюдений, вычисляется доверительный интервал с уровнем значимости е:

ц

~ ,ч ~ I ~ t2k (е), Ц +

' k ■ ц

k ■ ц

■ ¿2 Л (е)

1 Следует только иметь в виду, что в общем случае число степеней свободы может быть дробным числом, но это несущественно, так как современные статистические пакеты настроены на любое положительное число степеней свободы.

2 Например, для распределения £ можно взять плотность нормального распределения с центром в точке 2,5 и с таким же стандартным отклонением в интервале (0; 5), приравняв ее к нулю вне этого интервала. Далее, принять гипотезу о независимости коэффициентов вариации V = (п/£) от £ и экспертно определить, что V имеет треугольное распределение в диапазоне варьирования V!). После этого все необходимые для определения параметров Л, X, л, Ц характеристики могут быть вычислены.

(А6). Дополнительно вычисляется с тем же уровнем значимости «классический» доверительный интервал (без использования байесовской информации)

X--;==—, X + -

л1п-1 л/п-1

шение длин этих интервалов:

и отно-

еп =

12 к (£) 2 Х(п -1)

^п-1(е)'8п у к ~

Предъявление результатов анализа. Для реализации такого подхода к анализу при наличии базы данных о средних и дисперсиях ничего не надо, кроме проведения расчетов (А1)—(А6). Однако для того чтобы иметь право на совокупность этих действий, надо проверить, можно ли считать, что полученные наблюдения X = (Х1, ..., хп) подчиняются нормальному закону распределения. Это — минимум, поскольку гипотезу о совместном распределении пары (£, р), во-первых, крайне трудно проверить, а во-вторых, отклонения от нее должны мало сказываться на выводах о качестве оценок среднего.

Результаты байесовского анализа при описанном выше подходе удобно представлять одновременно с методами «классического» анализа (оценка максимального правдоподобия). Например, можно написать, что среднее на изучаемом поле равно:

X

— при байесовском подходе — ~ ± , к ~ ^ ~

V к ~

с уровнем значимости е;

— по методу максимального правдоподобия —

— , ¿п-1(е)'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

" ,-—с тем же уровнем е.

\п-1

х ±-

В заключение можно сравнить длины интервалов, подсчитав еп: если еп < 1, то байесовский

доверительный интервал уже в gn = (1/еп) раз, а если еп >1, что бывает весьма редко, то «классический» интервал уже байесовского в еп раз.

Объекты и методы исследования

Пробы отобраны в Карачевском р-не Брянской обл. на серых лесных (агросерых) почвах из пахотного слоя (0—20 см) на девяти полях общей площадью около 1000 га. В соответствие с ГОСТ 28168 [3], каждое поле разбивали на участки по 5 га, по главной диагонали которьи проводили отбор почвы для составления смешанного образца. Число первичных проб на элементарном участке практически одинаково (±1 проба). В образцах определяли рН, содержание гумуса, подвижных фосфора и калия, кальция, магния и серы. Дальнейший анализ данных проводили на примере содержания гумуса, поскольку его статистическое распределение в пределах угодья, как правило, подчиняется закону нормального распределения [6].

Результаты и их обсуждение

Все поля имеют низкое среднее содержание гумуса, за исключением поля 6, где этот показатель может быть отнесен к категории «очень низких» (табл. 1). Коэффициенты вариации умеренные и лишь в одном случае они превышают 25, в другом — < 20%.

При проведении расчетов сначала убедимся в том, что имеем дело с нормально распределенными выборками, что проще проверить графически, методом построения О—О-диаграмм: для выборки размера п вычисляются квантили ип (/) стандартного нормального распределения уровней }/(п + 1) в паре с выборочными квантилями хп (/), ] = 1, ..., п (члены вариационного ряда по возрастанию). Суть О—О-диаграмм в том, что для нормальных выборок точки (ип(/), хп(/)), ] = 1, ..., п, должны укладываться вдоль прямой, а показателем близости к прямой служит коэффициент де-

Таблица 1

Основные статистические характеристики содержания гумуса, %

Статистическая характеристика П.1 П. 2 П. 3 П. 4 П. 5 П. 6 П. 7 П. 8 П. 9

Число наблюдений 40 13 41 13 9 10 15 19 51

Среднее 2,84 3,81 2,75 2,29 2,18 1,65 3,18 2,55 2,42

Стандартное отклонение 0,70 0,96 0,53 0,41 0,48 0,44 0,67 0,60 0,69

Коэффициент вариации 24,6 25,2 19,3 17,9 22,1 26,5 20,9 23,7 28,6

Минимум 2,27 3,44 2,39 1,93 1,98 1,34 2,7 2,22 1,93

Максимум 4,14 5,9 4,41 3,08 2,96 2,53 4,41 3,72 3,85

Коэффициент детерминации (графическая проверка нормальности) 0,977 0,924 0,966 0,981 0,98 0,859 0,924 0,956 0,971

Поле 2

• у • / •

• Я2 = 0,9237

1 1 | I

-3

-2

-1

Поле 3

И2 = 0,9658

| I | 1

-3

-2

-1

Рис. 1. р—р-диаграммы для проверки нормальности выборок с полей 2 (слева) и 3 (справа): по оси абсцисс — квантили стандартного нормального распределения. Дополнительно на диаграммах дается значение коэффициента детерминации R2

терминации, который равен квадрату коэффициента корреляции между квантилями нормального распределения и выборочными.

Рассмотрим два поля из девяти, р—р-диа-граммы которых типичны (рис. 1). Мы видим, что линеаризация достаточно высокая, но имеются заметные отклонения на краях. Подобного рода «выбросы» характерны для почвенных исследований из-за множества естественных и неконтролируемых факторов: случайное попадание экскрементов крупных млекопитающих, вынос наверх песка кротами, сбои агротехники и многое другое. На левой части рисунка удаление двух крайних точек дает значение Я2 = 0,977 вместо указанного, а на правой — удаление одного очевидного выброса дает с Я2 = 0,9933.

Из всех полей некоторые сомнения может вызвать лишь поле 6, на котором значение коэффициента детерминации минимально — Я2 = 0,859 (при этом коэффициент корреляции между рядами квантилей равен 0,927). Однако это отклоне-ние4 вполне укладывается в статистическую модель нормальности для девяти полей при требо-

вании 95%-й надежности. Это проверяется на точных критериях совместной проверки нормальности всех девяти полей, однако приведение здесь теоретических основ такой проверки и всех расчетов выходит за рамки целевых установок этой статьи.

Расчеты параметров априорного распределения средних и мер точности5 для каждого из девяти полей проводятся при использовании в качестве базы данных результатов наблюдений на остальных восьми полях (для поля 1 — поля 2, ... , 9, для поля 2 — все поля, кроме 2-го, и т.д.). Далее, по наблюдениям X = (хь ..., хп) на выбранном поле вычисляем байесовскую оценку среднего Хв, 95%-й доверительный интервал (1В — половина его длины) и даем для сравнения аналогичные величины при обычном подходе: среднее Х$г, и Ш — половина длины доверительного интервала с тем же уровнем значимости. Дополнительно определяем число наблюдений (п^в), которое необходимо при обычном подходе для достижения той же точности среднего, которую дает байесовский подход (табл. 2).

Таблица 2

Сравнительные результаты обычного и байесовского подходов к оцениванию

Вычисляемая характеристика П. 1 П. 2 П. 3 П. 4 П. 5 П. 6 П. 7 П. 8 П. 9

Обычные оценки среднего 2,84 3,808 2,753 2,29 2,177 1,654 3,185 2,551 2,417

Байесовские оценки среднего 2,836 3,725 2,75 2,313 2,217 1,749 3,156 2,554 2,42

Половина длины 5%-го доверительного интервала для обычной оценки 0,226 0,603 0,169 0,258 0,392 0,330 0,382 0,299 0,196

Половина длины 5%-го доверительного интервала для байесовской оценки 0,215 0,453 0,172 0,292 0,368 0,318 0,342 0,281 0,188

Размер выборки 40 13 41 13 9 10 15 19 51

Необходимое, по Байесу, число наблюдений 36 8 42 16 8 9 12 17 47

4 Оно может быть также следствием потери данных: именно на этом поле значения содержания гумуса «потеряны» в 12 образцах из 22, в которых анализ других свойств проведен (т.е. выборка неполноценная).

5 Напомним, что мера точности — величина, обратная дисперсии.

Числа пш, которые характеризуют размер «выигрыша» (или «проигрыша») байесовских оценок перед обычными, вычисляются по соотношению между длинами их 5%-х доверительных интервалов следующим образом.

Можно проверить, что длина интервала при небольшом варьировании выборкой путем добавления или выбрасывания данных в пределах ±10% размера выборки обратно пропорциональна Vп -1, где п — размер выборки в пределах варьирования. Это обосновывается моделированием нормальных выборок в диапазоне размеров от 9 до 100. Вследствие этого

т=

с

1В =

с

4П-1' -1

■ 1В

так что пМв = 1 - (п -1) | —

Как уже говорилось, пробоотбор является одним из самых затратных этапов в агрохимическом обследовании. Поэтому методы, позволяющие сократить необходимое число проб без ущерба в обоснованности выводов, представляют большой интерес. К сожалению, оценивание по Байесу по нормально распределенным выборкам встречается в литературе весьма редко6 и практически не исследовано его качество в области реальных выборок, когда их размер варьирует от нескольких единиц до нескольких десятков, а варьирование ожидаемого значения дисперсии может исчисляться и в 5—10% и изменяться в разы. Наши данные частично заполняют этот пробел, однако это лишь капля в море.

Из табл.2 следует, что по выборкам, размер которых дан в последней строке, байесовское оценивание не изменило бы качество результатов, но позволило бы на этих девяти полях сократить число проб с 211 до 195, т.е. снизить объем работ и затраты на отбор проб и их лабораторный анализ примерно на 7,5%. И это немало.

При попарном сравнении чисел в двух последних строках мы видим, что на поле 4 обычный подход для достижения того же качества требует меньшего размера выборки, чем байесовский. Это некий артефакт по отношению ко всей совокупности расчетов и общего мнения в публикациях. Но, по данным табл. 1, поле 4 имеет наименьшее стандартное отклонение, или максимальное значение меры точности. Это позволяет думать, что выигрыш оценок по Байесу существенно зависит от вариабельности наблюдений: чем она меньше, тем меньше можно выиграть за счет дополнитель-

Рис. 2. Характеристика «выигрыша» оценок по Байесу: по оси абсцисс — значения мер точности, по оси ординат — «выигрыш», измеряемый величиной (1 — еП (%), где вп — отношение длины 5%-го доверительного интервала по Байесу к длине аналогичного интервала при обычном оценивании среднего

ных знаний, и наоборот, при большей вариабельности выигрыш (относительный) будет больше. Конечно, это всего лишь гипотеза, но такая тенденция прослеживается (рис. 2).

Отметим, что пограничные ситуации этой гипотезы очевидны: если вариабельность столь мала, что ее можно принять за нуль, то любое единичное наблюдение будет достаточно для характеристики ситуации и без байесовского улучшения (выигрыш будет отрицательным). Однако при очень большой вариабельности (мера точности близка к нулю) практически любые сведения, ее уменьшающие, дают очень большой выигрыш в относительных величинах. Поэтому данная гипотеза кажется нам перспективной для принятия решений о выборе метода оценивания.

Ключевым моментом для проведения байесовского оценивания параметров распределений является наличие априорной информации, а именно, баз данных о варьировании тех или иных свойств на сельскохозяйственных объектах. В настоящее время в открытом доступе имеется лишь обобщенная информация, например, данные о средних значениях агрохимических свойств по районам некоторых областей [5], что явно недостаточно при работе с конкретными угодьями. Дальнейшее продвижение в этом направлении возможно, если такого рода базы будут созданы для отдельных хозяйств.

Заключение

Таким образом, использование априорной информации об изменчивости почвенных свойств

2

6В статье [1] есть пример байесовского оценивания среднего в нормально распределенной выборке размера 10: для него ширина 5%-го доверительного интервала по Байесу составляет примерно зд от аналогичного интервала при обычном оценивании среднего и дисперсии.

позволяет сократить число проб, отбираемых при агрохимическом обследовании и, соответственно, уменьшить затраты на хранение, подготовку и

анализ проб. Базы даных результатов обследований отдельных угодий — необходимое условие применения байесовского подхода в агрохимии.

СПИСОК ЛИТЕРАТУРЫ

1. Айвазян С.А. Байесовский подход в экономет-рическом анализе // Прикладная эконометрика. 2008. № 1 (9).

2. Борисов Ю.С., Благовещенский Ю.Н. Совершенствование методов прогноза ресурсов изделий, разрушающихся от усталости (Использование банка данных). М., 1990.

3.ГОСТ28168-89.М., 1989.

4. Райфа Г., Шлейфер Р. Прикладная теория статистических решений. М., 1977.

5. Прудников П.В., Карпеченко С.В., Новиков А.А., Поликарпов Н.Г. Агрохимическая характеристика почв Брянской области. Брянск, 2007.

6. Самсонова В.П. Пространственная изменчивость почвенных свойств на примере дерново-подзолистых почв. М., 2008.

Поступила в редакцию 15.08.2015

BAYESIAN APPROACH IN AGROCHEMICAL SURVEYS

Yu.N. Blagoveshchenskiy, V.P. Samsonova

In the scheme of agrochemical survey sampling is one of the most costly stages. The use of a priori information about distributions of properties (the Bayesian approach) allows to reduce the number of samples to be taken by 5—10% while maintaining the accuracy of assessment. Maintenance of regional databases of soil mapping is a necessary condition for the application of the Bayesian approach.

Key words: agrochemical surveys, Bayesian estimation of distribution parameters.

Сведения об авторах

Благовещенский Юрий Николаевич, докт. физ.-матем. наук. E-mail: vkbun@mail.ru.

Самсонова Вера Петровна, докт. биол. наук, доцент каф. общего земледелия и агроэкологии МГУ им. М.В.Ломоносова. E-mail:vkbun@mail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.