Вестник Томского государственного университета. Биология
2010 № 3 (11)
ЭКОЛОГИЯ
УДК 630.18
Н.В. Кокорина, П.Б. Татаринцев
Югорский государственный университет (г. Ханты-Мансийск)
МЕТОДИЧЕСКИЕ ВОПРОСЫ ВЫБОРА ТЕСТ-ОБЪЕКТОВ БИОИНДИКАЦИИ С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМА СРАВНЕНИЯ КОЭФФИЦИЕНТОВ ВАРИАЦИИ
Предложены алгоритм расчета статистической значимости различий между коэффициентами вариации и методика его использования при выборе оптимального тест-объекта биоиндикации атмосферного загрязнения на примере Pinus si-birica и Picea obovata при исследовании состояния их ассимиляционных органов в районе сжигания попутного газа на факельных установках. Предлагается производить отбор тест-объектов биоиндикации в результате обработки эмпирических данных с помощью дисперсионного анализа за счет последующего сравнения коэффициентов вариации признаков по построенному алгоритму. Межпородные сравнения показателей изменчивости дают возможность выбора индикатора, обладающего достаточной выраженностью реакций и не требующего значительного объема выборки. Правильность алгоритма сравнения коэффициентов вариации подтверждена результатами моделирования по методу Монте-Карло.
Ключевые слова: коэффициент вариации; биоиндикация; темнохвойные породы.
Биомониторинг как составная часть экологического мониторинга позволяет получить интегральную оценку последствий действия на окружающую среду комплекса загрязняющих веществ. Для зонирования территории, т.е. выделения зон с относительно одинаковым уровнем техногенного воздействия, используются методы биоиндикационных исследований, связанные с учетом изменений анатомо-морфологических параметров и габитуальных признаков организмов. К числу наиболее часто используемых для зонирования территории биоиндикационных критериев относятся состояние и продуктивность лесных насаждений. В качестве индикаторов состояния природной среды в зонах загрязнения используется сумма признаков и интегральных показателей, характеризующих состояние деревьев или древо-стоев в целом.
Для характеристики состояния отдельных организмов наиболее доступным способом индикации является оценка изменений морфометрических признаков под воздействием факторов окружающей среды. Наличие растений, различающихся по морфологическим параметрам, позволяет популяции полнее использовать природные ресурсы и сохранять устойчивость в изменяющихся условиях среды [1. С. 29].
Каждому признаку свойственна определенная величина индивидуальной изменчивости, причем разные признаки одного генотипа варьируют под действием факторов среды не однотипно, т.е. для каждого признака характерны пределы его варьирования [2. С. 215]. Трудоемкость применения биоиндика-ционного критерия, а следовательно, и его практическая значимость определяются в первую очередь изменчивостью признака.
Показателями изменчивости признака являются дисперсия S2, стандартное отклонение Sx и коэффициент вариации Cvx . Коэффициент Cvx не зависит от единиц измерения, поэтому удобен для сравнительной оценки различных выборочных совокупностей - он позволяет получить информацию об особенностях норм реакции разных видов растений и их признаков. Однако в литературе, посвященной изучению изменчивости биологических признаков, не представлена оценка статистической значимости наблюдаемых различий в коэффициентах вариации, что приводит к некорректным выводам, поскольку, во-первых, являясь случайными величинами, они проявляют изменчивость от выборки к выборке, а во-вторых, выборочные коэффициенты обладают разным смещением для разных выборок. Таким образом, оценка коэффициента
S
вариации, полученная по формуле Cvx = ~x 100%, является смещенной и по-
x
этому на практике допускает систематическую ошибку, но в тоже время она обладает свойством состоятельности (систематическая ошибка с ростом объема выборки уменьшается). Наличие систематической ошибки в оценке коэффициента вариации не позволяет в полной мере осуществлять сравнение выборочных коэффициентов.
Задачами исследования являются нахождение алгоритма расчета статистической значимости различий между двумя коэффициентами вариации, а также оценка прикладного значения величин коэффициентов вариации признаков - их прогнозной ценности для выбора оптимального тест-объекта биоиндикации при определении его сопряженности с изменениями индиката.
К настоящему времени накоплен значительный объем сведений по аккумуляции поллютантов в биологических объектах, выявлены виды-индикаторы загрязнений окружающей среды. Однако отсутствие координации и единого методического подхода в проведении исследований по биомониторингу загрязнений подчас делает невозможным сравнение и практическое применение материалов, полученных разными исследователями. В связи с этим актуальность приобретают сравнительные исследования реакций биоиндикаторов на факторы загрязнения в сходных условиях.
Морфометрические параметры ассимиляционных органов имеют адаптивное значение, поэтому являются удобными маркерными признаками, учитывая которые можно судить о состоянии растительного организма в условиях техногенного пресса. Нами производилась сравнительная оценка использования одно- или двулетней хвои сосны сибирской (Pinus sibirica Du Tour) и ели сибирской (Picea obovata Ledeb.) для установления зависимости массы хвои и охвоенности побегов от уровня атмосферного загрязнения в результате сжигания попутного газа на факельных установках в районе Приобского
месторождения нефти (ХМАО-Югра). Сопряженный анализ количественных параметров сосны сибирской и ели сибирской проводился с использованием образцов, полученных с ключевых участков, заложенных на различном расстоянии от стационарного источника загрязнения в соответствии с преобладающими направлениями ветров в течение года.
В ходе исследования производился расчет внутрипопуляционной изменчивости биоиндикационных показателей по возрастным состояниям для двух хвойных пород путем анализа показателей массы 100 шт. хвоинок текущего и прошлого года жизни обеих пород деревьев, охвоенности (массы хвои на единицу длины побега) их годичных и двухлетних побегов в двух направлениях от источника загрязнения. В качестве критериев изменчивости количественных признаков (массы хвои и охвоенности побегов) использовались их средние значения, дисперсии и коэффициенты вариации.
Для установления отличий средних показателей между ключевыми участками по градиенту загрязнения данные обрабатывались методом однофакторного дисперсионного анализа. Опровержение нулевой гипотезы о равенстве средних с помощью дисперсионного анализа позволило применить критерий Ньюмена-Кейнса для множественных сравнений. Сочетание двух методов обработки данных (однофакторного дисперсионного анализа и множественных сравнений) позволило оценить выраженность морфологических реакций на атмосферное загрязнение двух древесных пород с учетом возраста хвои. Определение пригодности анализируемых признаков для практических целей биоиндикации производилось путем сопоставления полученных данных с результатами расчета показателей изменчивости.
Чувствительность критерия Фишера ^-критерия), применяемого в дисперсионном анализе, при малом значении теоретического коэффициента вариации CvX высока, поэтому отсутствие статистически значимых различий значений показателя между ключевыми участками в таком случае означает отсутствие влияния загрязнения на данный морфологический признак. Высокая чувствительность критерия Фишера позволяет уменьшить объем выборки. При среднем или повышенном значении CvX чувствительность F-критерия понижена, что приводит к необходимости увеличения объема выборки в случае отсутствия статистически значимых различий. На практике это делает невозможным использование индикатора в связи со значительным ростом трудоемкости исследований.
ст.
Теоретический коэффициент вариации Су£=^~Ч 100%, где ст? - стан-
\шА
дартное отклонение, - математическое ожидание случайной величины £ .
Коэффициент вариации используется для сравнения рассеивания двух и более признаков, имеющих различные единицы измерения. Таким образом, он представляет собой относительную меру рассеивания, выраженную в процентах.
Для решения задачи сравнения двух выборочных коэффициентов вариации будем считать, что имеются две выборки X и У объемами пх и Пу из двух
нормально распределенных генеральных совокупностей N(mx—X) и N(mY,oY) соответственно. Параметры mx, mY, ox, oy на практике обычно неизвестны, поэтому в дальнейших рассуждениях будем опираться на их выборочные
оценки. Коэффициенты вариации CvX = 100% и CvY = 100% для ука-
mX mY
занных совокупностей в связи с этим будут нам неизвестны, но их также можно оценить.
Такие оценки, как выборочное среднее или выборочная дисперсия, уже достаточно хорошо исследованы, а вот оценка коэффициента вариации в литературных источниках практически никак не характеризуется с точки зрения ее числовых характеристик и типа распределения. Сравнение двух наблюдаемых коэффициентов вариации требует ответа на вопрос: являются ли наблюдаемые различия случайными и теоретические коэффициенты вариации равны между собой или же различия так велики, что это никак нельзя отнести на счет случайности и теоретические коэффициенты не совпадают.
Вычислим выборочные оценки. Средние:
1 nx 1 ny
x =—Zx, y = — Zy. (11)
nx i=1 Пу i=1
Дисперсии:
1 nx 2 1 ny 2
% = -ЦZ(y -x)2, S^ = Z(y, -y)2 . (1.2)
nx - 1 i=1 ny - 1 i=1
S
Отношение Cvx =~X 100% используется на практике в качестве оценки тео-x
ретического коэффициента вариации CvX. В чистом виде величина
S
Cvx =~Х 100% непригодна для сравнения, основной причиной этого является x
неизвестный тип распределения Cvx . Попытка охарактеризовать тип распределения Cvx привела к результату, малопригодному для практического использования. Кроме того, использование моделирования методом Монте-Карло показало наличие систематического смещения эмпирического коэффициента относительно теоретического (Cvx оказывается несколько меньше CvX). Обойти данное препятствие можно путем двух сравнений: Sx с Sy и x с y .
Когда коэффициенты вариации в двух совокупностях совпадают, отношения выборочных средних и выборочных среднеквадратичных отклонений будут примерно одинаковыми. Действительно, если CvX = CvY, то верно со-
О X —Y
отношение —^ , из которого следует, что
mx mY
о X m^x , 1 ,-*х
— = —^ = r . (1.3)
oy mY
Из соотношения (1.3) следует, что различия в параметрах распределений, обладающих одинаковыми коэффициентами вариации, определяются только мас-
штабным коэффициентом г. Практически это означает, что если удастся показать, что наблюдаемые различия в средних и среднеквадратичных отклонениях составляют одинаковую величину, то тем самым будет доказано равенство коэффициентов вариации в рассматриваемых совокупностях. В соответствии с этим принципом нулевая гипотеза будет следующей: существует такое число
Го х = г ■ Оу
г > 0, что верны два утверждения И.
. Альтернативная гипотеза за-
ключается в том, что такого числа г не существует.
Если справедлива нулевая гипотеза, то случайная величина
^ =■ %
г2 Х2
(1.4)
имеет распределение Фишера с Vх = пх -1 и V = пу -1 степенями свободы, а величина
Т =
х - г • у
Хх -г • у
где
ХХ - г.- =
(пх - 1)Х2 + г2 •(пу - 1)х
2 ( У
пх + пу - 2
1 1
— + —
(1.5)
- У
имеет распределение Стьюдента с V = пх + пу - 2 степенями свободы [3.
С. 213]. Данный факт был подтвержден результатами моделирования по методу Монте-Карло.
При моделировании были получены 1000 пар выборок объемом по 20 наблюдений в каждой. Первая выборка взята из нормального распределения с параметрами (1; 0,3), вторая - также из нормального распределения с параметрами (2; 0,6). Таким образом, СуХ = СуУ = 0,3 и г = 0,5. Гистограмма отношения (1.4) хорошо согласуется с теоретической функцией плотности распределения Фишера (рис. 1).
Рис. 1. Гистограмма отношения (1.4) и его теоретическая функция плотности
Точно так же гистограмма отношения (1.5) хорошо согласуется с ожидаемым теоретическим распределением Стьюдента (рис. 2).
X
Рис. 2. Гистограмма отношения (1.5) и его теоретическая функция плотности
Результаты моделирования подтверждают правильность алгоритма сравнения коэффициентов вариации. Для обоснования справедливости нулевой гипотезы следует найти такое число г, чтобы наблюдаемые значения указанных критериев Е и Т одновременно обладали бы «большими» вероятностями, т.е. выше некоторого установленного порога значимости, например р = 0,05. В таком случае каждый из критериев попадает в свою область принятия. Если такое число г найти невозможно, то один из критериев обязательно оказывается в критической области и нулевую гипотезу следует отклонить как утверждение, противоречащее наблюдаемым данным.
Для задачи сравнения коэффициентов вариации конкретная величина г не так важна. Важен сам факт ее существования. Поэтому дальнейшие действия будут заключаться в поиске некоторого числа г, при котором оба утверждения нулевой гипотезы нельзя было бы отвергнуть при выбранном уровне значимости р = 0,05.
Для каждого конкретного г можно вычислить конкретное значение статистик Е и Т. Обозначим полученные числа соответствующими символами Ег и Тг. Для каждого из чисел Ег и Тг можно вычислить вероятности событий
P
F.,
■< F < F„
= f (r) и P (| > Tr ) = t(r) . Функция t(r)
характеризует веро-
ятность ошибки первого рода для нулевой гипотезы в части сравнения средних значений, f (r) характеризует вероятность ошибки первого рода для нулевой гипотезы в части сравнения среднеквадратичных отклонений. Минимальная из этих ошибок h (r) = min {t (r), f (r)} характеризует справедливость
нулевой гипотезы в целом.
Действительно, пусть минимальное значение из двух вероятностей -t (r ) = 0,9. Значит, часть нулевой гипотезы о средних мы отклонить не можем, т.к. велика вероятность ошибки, но тогда и часть нулевой гипотезы о дисперсиях мы отклонить не можем, т.к. для нее вероятность ошибки еще больше. Следовательно, чтобы найти подходящий r, нужно максимизировать функцию h (r).
Задача нахождения максимума h (r) сводится к задаче нахождения точки пересечения двух функций t (r) = f (r). Алгоритм расчетов продемонстриру-
ем на примере сравнения показателей охвоенности разновозрастных побегов сосны сибирской. В результате эксперимента были получены следующие результаты: X = 0,986, у = 0,835, 5; = 0,252, ^ = 0,229, пх = 315, пу = 414.
Построим две функции
Т (г ) = .
X - Г • у
і
Пх + Пу - 2
V
—+— пх пу
у
Подставив найденные оценки, получим
, ч |0,986-0,835г|
Т (г) = 360,63^^ 1 =т.
^19,962 + 21,658г2
Функция t(г) строится следующим образом: если р((х, п) - функция распределения Стьюдента с п степенями свободы, то t (г) = 2 (1 - pt (Т (г), V) .
Построим функцию / (г): если рЕ (х, п, т) - функция распределения Фишера с п и т степенями свободы, то
Г ( 1 Л
1 - рЕ (Е (г), Ух, уу ) + рЕ
/ (г ) =
, V,., V
Р (г )> 1
1 - рР
Р (г )
Р (г )
+ рР (р (г), vy, vx ), Р (г) < 1
Найденное решение уравнения t (г) = / (г): г = 1,16. Для этого г имеем t(г) = /(г) = 0,327 , Тг = 0,969, Ег = 1,11 (рис. 3).
и
Рис. 3. Точка пересечения критериев Стьюдента и Фишера на примере сравнения изменчивости охвоенности побегов прошлого и текущего годов сосны сибирской
Интерпретировать полученный результат можно следующим образом: если тх = 1,16 тУ и ох = 1,16 оу, то наблюдаемые данные не противоречат обоим утверждениям нулевой гипотезы (нельзя отклонить ни одно из утверждений, поскольку вероятность ошибки велика - 0,327). Следовательно, нет оснований считать, что совокупностиX и У обладают разной изменчивостью.
Согласно Лакину Г.Ф. (1980), при величине коэффициента вариации до 10% изменчивость оценивается как слабая, при 11-25% - как средняя, при достижении значения более 25% трактуется как сильная [4. С. 51]. Для сопоставления изменчивости морфометрических признаков древесных пород более подходящей является эмпирическая шкала, предложенная С.А. Мамаевым (1969). Эта шкала отражает закономерности формообразования древесных растений, определяющие амплитуду изменчивости, и имеет практическое значение [5. С. 5].
В соответствии с поставленными в исследовании задачами нами производились межпородные и межвозрастные сравнения показателей изменчивости (табл. 1, 2). Согласно шкале С. А. Мамаева, охвоенность побегов сосны демонстрирует повышенный уровень изменчивости (Сух = 25-30%), в то время как расчет указанного показателя для ели выявил величины коэффициента вариации охвоенности (Сух = 35-39%), соответствующие высокому уровню изменчивости. Использование предложенной нами методики сравнения коэффициентов вариации выявило наличие статистической значимости отличий указанных показателей (табл. 1).
Т а б л и ц а 1
Сравнение коэффициентов вариации биоиндикационных показателей сосны сибирской и ели сибирской
Ключевой участок Побег второго года жизни Побег первого года жизни
Pinus sibirica Picea obovata Pinus sibirica Picea obovata
О4 é О4 £ О4 £ О4 £
Охвоенность побегов
Восточное направление 315 25,53 302 34,73** 414 27,41 359 38,36**
Южное направление 147 29,97 135 35,41 206 29,96 193 35,74
Масса хвои
Восточное направление 68 8,06 66 21,10** 54 17,31 55 11,17*
Южное направление 30 8,50 30 18,31** 30 16,11 32 17,24
* р<0,01 - уровень значимости при 95%; ** р<0,001 - уровень значимости при 99%.
Анализ значений дисперсий и коэффициентов вариации массы хвои показывает большую однородность, т. е. меньшую изменчивость признака по сравнению с охвоенностью побегов. Оценка вариабельности массы хвои выявила отличия коэффициентов вариации, рассчитанных для двух древесных пород, причем с возрастом хвои разрыв в межпородных отличиях изменчивости массы хвои увеличивается: для прошлогодней хвои сосны сибирской зна-
чения коэффициента снижаются в два раза, для ели сибирской во столько же возрастают. Величины коэффициентов изменчивости массы хвои по ходу роста растения показывают изменения вариабельности показателя от среднего уровня к пониженному и низкому по шкале С. А. Мамаева (табл. 2).
Т а б л и ц а 2
Сравнение коэффициентов вариации биоиндикационных показателей, рассчитанных для разновозрастных побегов
Ключевой участок Pinus sibirica Picea obovata
Побег второго года жизни Побег первого года жизни Побег второго года жизни Побег первого года жизни
é é
Охвоенность побегов
Восточное направление 315 25,53 414 27,41 302 34,73 359 38,36
Южное направление 147 29,97 206 29,96 135 35,41 193 35,74
Масса хвои
Восточное направление 68 8,06 54 17,31** 66 21,10 55 11,17**
Южное направление 30 8,50 30 16,11* 30 18,31 32 17,24
* р<0,01; ** р<0,001 - уровни значимости.
Вариабельность морфометрического признака древесной породы, соответствующая высокому уровню изменчивости (Сух > 35%), определяет его непригодность в качестве биоиндикационного ввиду необходимости значительного увеличения объема выборки, что снижает его практическую ценность. Кроме того, надежность выводов, полученных с использованием признака, обладающего высоким Сух, будет невысокой. Это обусловлено значительным разбросом выборочных оценок, поскольку точность большинства статистических оценок - таких, как выборочное среднее, выборочная дисперсия, выборочный коэффициент корреляции и др., связана с дисперсией наблюдаемого признака обратной связью. В нашем опыте в качестве предпочтительного тест-объекта биоиндикации была определена сосна сибирская, для которой доказана меньшая внутрипопуляционная изменчивость вегетативных параметров по сравнению с елью.
Статистически значимых отличий между коэффициентами вариации ох-военности годичных и двухлетних побегов сосны сибирской и ели сибирской выявлено не было. Следовательно, можно утверждать, что возраст побега оказывает значительное влияние только на вариабельность массы хвои и, следовательно, на объем выборки в натурных исследованиях, в то время как коэффициент вариации относительного показателя - массы хвои на единицу длины побега - сохраняет стабильное значение в течение жизни хвои, что определяет приоритетность его использования в целях биоиндикации.
Сходство коэффициентов вариации охвоенности разновозрастных побегов сосны сибирской говорит о необходимости одинаковых объемов выборки,
значит, наличие отличий результатов морфометрии отражает только чувствительность маркера к воздействию загрязнителей. В результате сопряженного анализа показателей охвоенности побегов было выявлено, что наиболее пригодным биоиндикационным признаком для оценки атмосферного загрязнения является охвоенность побегов первого года жизни сосны сибирской (Ріпш 8іЬігіса). Использование данного количественного признака в мониторинге загрязнений дополнит визуальные методы оценки лесных насаждений по га-битуальным признакам (определение суммарной доли ослабленных в различной степени деревьев, дефолиации крон, диспигментации хвои и пр.).
Исследование изменчивости морфометрических признаков организмов позволит более целенаправленно проводить отбор маркеров для биоиндика-ционных исследований. Такой отбор предполагает обработку данных с помощью дисперсионного анализа, а затем, если удалось выявить, что различия между ключевыми участками неслучайны, последующее сравнение коэффициентов вариации признаков по построенному алгоритму. Данная методика сравнения коэффициентов вариации может быть использована для характеристики изменчивости количественных признаков организмов, определяющей их пригодность для биоиндикации, - для обоснования выбора индикатора, обладающего достаточной выраженностью реакций и не требующего для их оценки значительного объема выборки. Установление статистической значимости сравнительной оценки коэффициентов вариации определяет корректность суждения о потенциальных возможностях применения отдельных маркерных признаков биоиндикаторов. Эффективность применения методики сравнительной оценки изменчивости признаков была подтверждена результатами обследования состояния ассимиляционных органов сосны сибирской и ели сибирской в районе сжигания попутного газа на факельных установках.
Литература
1. Злобин Ю.А. Принципы и методы изучения ценотических популяций растений. Казань:
Изд-во Казан. ун-та, 1989. 146 с.
2. Жученко А.А., Король А.Б. Рекомбинация в эволюции и селекции. М.: Наука, 1985. 400 с.
3. Крамер Г. Математические методы статистики. М.: Мир, 1975. 659 с.
4. Лакин Г.Ф. Биометрия. М.: Высшая школа, 1990. 352 с.
5. Мамаев С.А. Основные принципы методики исследования внутривидовой изменчивости
древесных растений // Индивидуальная и эколого-географическая изменчивость растений. Свердловск, 1975. С 3-14.
Поступила в редакцию 19.02.2010 г.
Natalya V. Kokorina, Pavel B. Tatarintcev
Ugra State University, Khanty-Mansyisk, Russia
METHODICAL CHOICE QUESTIONS OF BIOINDICATION TEST OBJECTS BY COEFFICIENTS OF VARIATION COMPARISON ALGORITHM
The evaluation of changes in morphometric traits of plants is the most affordable way of biological indication of environmental impact of atmospheric pollution. The labour-intensiveness of the application and, consequently, the practical significance of the bioindicative criterion is determined by trait variability, an indicator which is the coefficient of variation. An algorithm for calculating the statistical significance of differences between the coefficients of variation and assessment of its predictive value for biological indication of the example of Siberian pine (Pinus sibirica Du Tour) and Siberian spruce (Picea obovata Ledeb.) in the area of burning gas at torches on oilfields was introduced. It is proposed to make the selection of test objects of bioindication by processing the empirical data using analysis of variance by the following comparison of the coefficients of variation for traits of constructing an algorithm. Interbreed comparisons of variability allow to choose the indicator, having strongly marked reactions and not requiring a large sample size. The results of Monte-Carlo simulation confirm the correctness of the comparison algorithm.
Key words: factor of a variation; bioindication; dark-conifers breeds.
Received February 15, 2010