УДК 579.2:519.2
Турская А.Л.12, Букин Ю.С.3, Степанов А.В.1, Маркова Ю.А.1, Верхотуров В.В.2
1 Сибирский институт физиологии и биохимии растений СО РАН 2 Иркутский государственный технический университет 3 Лимнологический институт СО РАН E-mail: [email protected]
ИССЛЕДОВАНИЕ ЗАКОНОМЕРНОСТЕЙ БИОХИМИЧЕСКИХ ПРОЦЕССОВ В РАСТЕНИЯХ С ПОМОЩЬЮ СРЕДЫ ПРОГРАММИРОВАНИЯ R
В статье показана возможность использования среды программирования R для изучения образования защитных соединений в растениях при бактериальном заражении. С помощью статистического критерия Шапиро-Уилка и методов однофакторного дисперсионного и регрессионного анализа было достоверно подтверждено влияние длительности заражения микроорганизмом Escherichia coli проростков редиса на интенсивность генерации активных форм кислорода.
Ключевые слова: среда программирования R, биометрия, фитоиммунитет, активные формы кислорода, Escherichia coli.
Введение
В основе ответных реакций растительной клетки на внедрение микроорганизма лежит сложная сеть биохимических процессов. В результате таких процессов меняется активность ряда ферментов, происходит накопление защитных соединений. Изменения всех этих переменных величин во времени и пространстве составляют кинетику биологических процессов, которую сложно оценить стандартными статистическими методами. Подобного рода задачи успешно решаются в среде программирования R. Среда R позволяет проводить как первичный анализ данных (таблицы, графики), так и математическую статистику со всеми приложениями.
R является свободно распространяемым программным обеспечением, которое достаточно просто устанавливается под Windows, Mac OS X, Linux, базовая комплектация R занимает немного места на жестком диске и включает в себя все функции, необходимые для статистического анализа; для более серьезной работы всегда можно дополнительно установить вспомогательные пакеты с необходимыми функциями [3].
Актуальность изучения ответных реакций растений на бактериальное заражение обусловлена растущим количеством заболеваний, вызываемых условно-патогенными микроорганизмами и, следовательно, необходимостью установления закономерностей циркуляции в окружающей среде, а также выявления новых источников заражения человека. Многими исследованиями показано, что в природных условиях энтеробактерии способны колонизировать различные ткани и органы растений, сохраняться в них дли-
тельное время, что представляет серьезную угрозу возникновения кишечных заболеваний человека при употреблении в пищу свежих растений или их плодов [1, 11, 14].
Продукция активных форм кислорода (АФК) является одним из первых событий в защитном ответе растений на вторжение микроорганизма, они играют роль сигнальных молекул, а также служат защитными соединениями в стрессовых условиях [10, 12]. Время возникновения реакции образования АФК может колебаться от нескольких минут до часов, но, как правило, наблюдаются ранний и более поздний окислительный «взрыв» [6].
Для проводимого исследования была поставлена следующая цель: с помощью статистического анализа выявить закономерности, по которым менялась концентрация АФК с течением времени в корнях проростков редиса (Raphanus sativus L.) при заражении их кишечной палочкой Escherichia coli. Для достижения цели были сформулированы следующие задачи: выбор статистических методов и анализ с их помощью искомой зависимости; выбор методов и их реализация для графической визуализации искомой зависимости.
Материалы и методы
1. Экспериментальные данные по динамике измерения концентрации активных форм кислорода
E. соН - важнейший модельный микроорганизм, условный патоген человека и животных, относящийся к группе возбудителей кишечных инфекций. Для статистического анализа были взяты данные по измерению концентрации
АФК в корнях проростков редиса при заражении их E. coli.
Измерения концентрации АФК проводили в динамике времени, в течение 5 часов. Через определенные промежутки времени после инокуляции (5, 15, 30, 60, 180, 360 минут) определяли интенсивность образования АФК с помощью флуоресцентного красителя DCF-DA (2',7'-дихлорофлуоресцеин диацетат) в концентрации 1 мкМ. DCF-DA широко используется как маркер внутриклеточных оксидантов в животных и растительных тканях [13]. DCF-DA, проникая в клетки, гидролизуется внутриклеточными эстеразами с выделением DCF. В реакции с перекисью водорода или гидроперок-сидами образуется DCF-производное соединение, которое может обнаруживаться флуоресценцией при длине волны возбуждения и испускания 480 и 530 нм соответственно.
На рисунке 1 представлены изображения корня редиса, полученные с помощью эпифлу-оресцентного микроскопа Axio Observer Z1 (Carl Zeiss, Германия). Светящиеся участки показывают интенсивность образования АФК в клетках корня. Обработка и анализ изображений проводились в программе Axio Vision, где содержание АФК выражали в условных единицах флуоресценции.
2. Первичная обработка и подготовка данных для расчетов с помощью языка программирования R
Данные, полученные в ходе экспериментов, сохранялись в электронных таблицах Microsoft Excel. Массив данных формировался в виде трех колонок. В первую колонку заносился номер измерения, во вторую колонку заносилось время (в минутах), прошедшее после заражения, при котором проводилось измерение показателей концентрации АФК, в третью колонку заноси-
лось значение измеренного показателя концентрации АФК. Результаты контрольных опытов были занесены в таблицу с показателем времени 0 минут, прошедших с момента заражения.
После формирования массива данных в программе Microsoft Excel, он был сохранен в формате .csv с разделителями запятая между столбцами. Формат данных csv может быть прочитан стандартными функциями языка программирования R. Для чтения данных в формате csv служит функция:
>data<-read.csv(file="C://Rrab//my_data/ /data.csv")[7].
В качестве аргументов этой функции выступает переменная file, которая хранит в себе строку с полным именем файла, содержащего данные в формате csv. Данные считываются в переменную (в примере это переменная data) типа фрейм. Фреймы в языке программирования R представляют собой сложные структуры, содержащие в себе несколько векторов (массивов данных) одинаковой размерности. Имена внутренних векторов фрейма соответствуют названиям столбцов в файле формата csv [9]. Например, в нашем случае, столбец со временем, прошедшим после заражения, был обозначен как time. Обратиться к этому столбцу как к вектору в фрейме data можно с помощью конструкции data$time, а к конкретному элементу вектора (например к 10) по его индексу data$time [10]. Столбец с показателями концентрации АФК был обозначен как afk. Обратиться к этому столбцу как к вектору во фрейме можно с помощью конструкции data$afk. В случае рассматриваемого массива данных вектор data$time выступал в качестве фактора, определяющего принадлежность конкретного измеренного показателя концентрации АФК определенному времени, прошедшему с момента за-
Рисунок 1. Корни проростков редиса, окрашенные флуоресцентным красителем DCF-DA. Через 1 час после заражения E. coli (слева); незараженные корни, контроль (справа). Масштабный отрезок - 200 мкм.
ражения корней проростков редиса кишечной палочкой.
3. Методы, используемые для статистической обработки данных
Критерий Шапиро-Уилка Данный критерий проверяет гипотезу H0 -исследуемая выборка распределена по нормальному закону [2]. В языке программирования R критерий реализован в виде функции: > shapiro.test(x), где x - вектор, содержащий значения проверяемой выборки [8].
Однофакторный дисперсионный анализ с помощью непараметрического критерия Крас-кела-Уоллиса
Данный критерий проверяет гипотезу H0 -выбранные градации фактора не влияют на средние значения в сравниваемых выборках [4]. В языке программирования R критерий реализован в виде функции: >kruskal.test(x~fac), где x - вектор, содержащий массив данных, fac - переменная типа фактор, указывающая принадлежность измерения определенной градации фактора [7]. Критерий Вилкоксона-Манна-Уитни С помощью данного критерия можно сравнить две выборки на предмет равенства их средних значений [4]. Гипотеза H0 - средние значения двух выборок достоверно не различаются. В качестве альтернативных гипотез могут выступать следующие предположения H1 - средние значения в выборках достоверно отличаются, H2 - среднее значение в первой выборке больше, чем во второй выборке и H3 - среднее значение в первой выборке меньше чем, во второй выборке. В языке программирования R критерий реализован в виде функции: > wilcox.test(x,y,alternative ="greater"), где x - вектор, содержащий массив данных первой выборки, y - вектор, содержащий массив данных второй выборки, alternative - параметр, задающий альтернативную гипотезу [7].
Оценка параметров регрессии методом наименьших квадратов
Для оценки параметров регрессионной зависимости с помощью метода наименьших квадратов в языке программирования R существует функция: > nls(y ~ a * xA2+b*x+c, Data, start = list(a=1,b=1,c=1)), где y ~ a * xA2+b*x+c - предполагаемая зависимость для регрессионного анализа между зависимой и независимой переменной, Data - переменная типа фрейм, содержащая экспериментальные значения независи-
мой переменной x и соответствующие значения зависимой переменной y, start - список, содержащий начальные значения для параметров регрессионной функции [9].
F критерий Фишера
Использовался в работе для тестирования гипотезы H0 - кривая с выбранными параметрами при регрессионном анализе способна адекватно отразить наблюдаемую экспериментальную зависимость между рядами данных [5]. В языке программирования R критерий реализован в виде функции: > var.test(yr,yp), где yr - наблюдаемые значения зависимой переменной, yp - ожидаемые (рассчитанные с помощью регрессионной функции) значения зависимой переменной [3].
4. Методы графической визуализации результатов
Для визуализации распределения величин в выборках первичных данных использовался метод боксплотов (ящик с усами). В языке программирования R графическая функция боксп-лот имеет следующий вид: > boxplot(x~fac), где x - вектор, содержащий массив данных, fac -переменная типа фактор, указывающая принадлежность измерения определенной градации фактора [7].
Построение графика распределения на плоскости точек, отражающих зависимость средних показателей концентрации АФК от времени, прошедшего с момента заражения кишечной палочкой, осуществлялось с помощью следующей функции: > plot(x~t), где x -вектор, содержащий средние значения показателей АФК, t - вектор, содержащий моменты времени, соответствующие значению вектора x.
Визуализация кривой, отражающей регрессионную зависимость на графике распределения на плоскости точек, показывающих зависимость средних показателей концентрации АФК от времени, прошедшего с момента заражения кишечной палочкой, осуществлялось с помощью следующей функции: > lines(x,t), где x - вектор, содержащий рассчитанные с помощью регрессионной зависимости средние показателей концентрации АФК, t - вектор, содержащий временные точки, прошедшие с момента заражения бактериальной культурой, в которые производился расчет средних показателей концентрации АФК.
Результаты и обсуждение
1. Проверка исходных данных на предмет соответствия закону нормального распределения
При проверке выборок на предмет соответствия нормальному закону распределения с помощью критерия Шапиро-Уилка были получены вероятности принятия нулевой гипотезы, представленные в таблице 1.
Нулевая гипотеза соответствия выборки закону нормального распределения отвергалась при вероятности ее меньше, чем 0,1. Из таблицы 1 видно, что при времени, прошедшем с момента заражения t=0 и t=360, нулевая гипотеза о соответствии выборок закону нормального распределении, не может быть принята. Из этого следует, что для дальнейшего статистического анализа необходимо использовать непараметрические статистические критерии.
2. Однофакторный дисперсионный анализ выборок
Перед проведением однофакторного дисперсионного анализа массив данных был визуализирован в виде боксплотов (рис. 2). На рисунке видно, что медианы выборок показателей концентраций АФК, полученных при разном времени с момента заражения, различаются между собой. Максимальное различие достигает 100 процентов.
При использовании критерия Краскела-Уоллиса вероятность принятия нулевой гипотезы об отсутствии достоверных различий между средними значениями выборок оказалась равной 0,049, что существенно меньше вероятностного порога 0,1. Это означает, что между выборками существуют достоверные различия по их средним значениям. Следовательно, наблюдаемые различия между выборками, полученными при различных периодах времени, прошедших с момента заражения носят закономерный (неслучайный) характер.
На рисунке 2 видно, что уже через 5 минут воздействия бактерии E. coli уровень АФК в корнях проростков редиса достоверно повышается по сравнению с контрольным вариантом. Максимальное содержание АФК наблюдается через 3 часа после инокуляции, а к 5 часам пока-
затель стрессового ответа значительно снижается. Это согласуется с литературными данными о характере «всплеска» уровня АФК у растений при биотическом стрессе; первый пик является неспецифическим и возникает в первые минуты после взаимодействия растения с микроорганизмом, что наблюдается в нашем случае, а второй связан со специфическим узнаванием партнеров [6].
3. Попарное сравнение средних значений в выборках
Результаты попарного сравнения выборок на предмет равенства средних значений с помощью критерия Вилкоксона-Манна-Уитни представлены в таблице 2. Из таблицы видно, что нулевая гипотеза об отсутствии достоверных различий между средними значениями может быть принята при уровне ее достоверности больше, чем 0,1 только при сравнении выборок, соответствующих моментам времени 5, 15 и 360 и моментам времени 30, 60 и 180, прошедших с момента заражения. При попарном сравнении выборок, соответствующих моментам времени 5-30, 5-60, 5-180, 15-30, 15-60, 15-360, 30-360, 60360 были получены достоверные различия по средним показателям концентрации АФК.
Рисунок 2. Зависимость концентрации АФК в корнях проростков редиса от времени заражения бактерией E. coli
Таблица 1. Значения вероятностей принятия нулевой гипотезы Н0 соответствия выборок показателей концентрации АФК закону нормального распределения
Время после заражения, мин t 0 t 5 t 15 t 30 t 60 t 180 t 360
p-value 0,08014 0,4487 0,1896 0,8036 0,9647 0,4005 0,05
С помощью критерия Вилкоксона-Манна-Уитни была оценена вероятность принятия нулевой гипотезы (отсутствие достоверных различий между выборками) против вероятности принятия альтернативной гипотезы о том, что среднее значение в первой сравниваемой выборке больше, чем во второй сравниваемой выборке. Результаты данного сравнения представлены в таблице 3.
Таким образом, использование критерия Вилкоксона-Манна-Уитни позволяет сделать вывод о том, что средние значения показателей концентрация АФК в моменты времени 30, 60 и 180 минут, прошедших с момента заражения достоверно больше показателей концентрации АФК в моменты времени 5, 15 и 360 минут, прошедших с момента заражения.
4. Регрессионный анализ
В качестве модели кривой для регрессионного анализа была выбрана квадратичная зависимость, имеющая следующий общий вид: у=ахА2+Ьх+с. Независимой переменной х выступает время, прошедшее с момента заражения бактериальной культурой, в качестве зависимой переменной у выступает средняя концентрация АФК.
В процессе расчетов были получены следующие значения для коэффициентов регрессии: а = -0,033±0,015; Ь = 5,6±2,17; с = 2130,94±252,27. Исходные средние значения для выборок вместе с линией тренда в виде квадратичной зависимости представлены на рисунке 3.
Дисперсии показателей концентрации свободных радикалов для экспериментальных значений составило оп = 543,52, дисперсия показателей концентрации свободных радикалов, рассчитанных по квадратичной аппроксимации, составила ог = 399,95. Значение Р критерия Фишера для рассчитанных значений дисперсии составило 0,5415, для этого значения критерия вероятность принятия нулевой гипотезы об отсутствии достоверных значений между дисперсиями составляет р-уа1ие = 0,4743. Полученное значение р-уа1ие > 0,1, что означает принятие нулевой гипотезы. В нашем случае это говорит о том, что зависимость между временем, прошедшим с момента заражения, и средней концентрацией АФК может быть достаточно точно приближена квадратичной зависимостью с указанными значениями параметров.
Таблица 2. Значения вероятностей принятия гипотезы Н0 об отсутствии достоверных различий между средними значениями выборок показателей концентрации АФК
1 5 1 15 1 30 1 60 1 180 1 360
1 5 0 0,7959 0,1051 0,1051 0,0630 0,2475
1 15 0,7959 0 0,2799 0,2799 0,0892 0,4813
1 30 0,1051 0,2799 0 0,4813 0,5787 0,0524
1 60 0,1051 0,2799 0,4813 0 0,3527 0,0355
1 180 0,0630 0,0892 0,5787 0,3527 0 0,0115
1 360 0,2475 0,4813 0,0524 0,0355 0,0115 0
Таблица 3. Матрица результатов оценки принятия или отвержения нулевой гипотезы Н0 об отсутствии достоверных различий против альтернативной гипотезы Н1 - значения в первой выборке больше, чем во второй выборке для показателей концентрации АФК
1 5 1 15 1 30 1 60 1 180 1 360
1 5 0 > > > < >
1 15 > 0 > > < >
1 30 > > 0 > > <
1 60 > > > 0 > <
1 180 < < > > 0 <
1 360 > > < < < 0
Знак «>» в таблице означает принятие гипотезы Н1, знак «<» означает принятие гипотезы Н0
0 50 100 150 200 250 300 350 время (мин.), прошедшее с момента заражения
Рисунок 3. Зависимость между временем, прошедшим с момента заражения проростков редиса бактериальной культурой, и концентрацией АФК,
выраженная в виде точек, соответствующих реальным наблюдениям и регрессионной кривой квадратичной функции. На графике приведено полученное в ходе анализа данных уравнение квадратичной зависимости
В результате проведенного статистического анализа закономерностей изменения концентрации АФК в корнях проростков редиса при бактериальном заражении с помощью средств языка программирования И выяснено, что уровень концентрации АФК в начальные моменты времени растет, затем достигает определенного максимума в точке 180 минут с момента заражения, после чего начинает снижаться. Максимальная концентрация АФК в опыте в
среднем в два раза превышала показания контроля (отсутствие заражения кишечной палочкой). Это согласуется с литературными данными об активации неспецифического защитного ответа растения сразу после взаимодействия с чужеродным микроорганизмом посредством, так называемых, образраспознающих рецепторов. В результате происходит окислительный «взрыв» вследствие накопления активных форм кислорода [8, 12].
6.10.2014
Список литературы:
1. Алексеенко А.Л. Особенности взаимодействия условно-патогенных энтеробактерий с растениями. Автореферат дис. на соиск. уч. степ. канд. биол. наук. Иркутск. - 2010. 22 с.
2. Закс Л. Статистическое оценивание. М.: Статистика. - 1976. 598 с.
3. Зарядов И.С. Введение в статистический пакет R: типы переменных, структуры данных, чтение и запись информации, графика. М.: Изд-во Российского университета дружбы народов. - 2010. 207 с.
4. Ивантер Э.В. Элементарная биометрия: учеб. пособие. Петрозаводск: Изд-во ПетрГУ. - 2010. 104 с.
5. Лакин Г.Ф. Биометрия. М.: Высшая школа. - 1990. 352 с.
6. Полесская О.Г. Растительная клетка и активные формы кислорода. Под ред. И.П. Ермакова. М.: КДУ. - 2007. 140 с.
7. Baayen R.H. Analyzing Linguistic Data. A Practical Introduction to Statistics Using R. UK: Cambridge University Press. - 2008. 369 pp.
8. Boiler T.A., Felix G.A. Renaissance of Elicitors: Perception of Microbe-Associated Molecular Patterns and Danger Signals by Pattern-Recognition Receptors // Annual Review of Plant Biology. - 2009. - V.60. - Р. 379-406.
9. Crawley M.J. The R Book. England: John Wiley and Sons Ltd. - 2007. 951 pp.
10. Daudi A., Cheng Z., O'Brien J. A. et al. The Apoplastic Oxidative Burst Peroxidase in Arabidopsis is a Major Component of Pattern-Triggered Immunity // Plant Cell. - 2012. - V.24. - № 1. - Р. 275-287.
11. Kirzinger M.W., Nadarasah G., Stavrinides J. Insights into Cross-Kingdom Plant Pathogenic Bacteria // Genes. - 2011. - V.2. -№ 4. - Р. 980-997.
12. O'Brien J. A., Daudi A., Finch P. et al. Peroxidase-Dependent Apoplastic Oxidative Burst in Cultured Arabidopsis Cells Functions in MAMP-Elicited Defense // Plant Physiology. - 2012. - V.158. - Р. 2013-2027.
13. Rodriguez-Serrano M., Romero-Puertas M.C., Zabalza A. et al. Cadmium effect on oxidative metabolism of pea (Pisum sativum L.) roots. Imaging of reactive oxygen species and nitric oxide accumulation in vivo // Plant Cell Environ. - 2006. - V.29. - P. 1532-1544.
14. Tyler H.L., Triplett E.W. Plants as a Habitat for Beneficial and/or Human Pathogenic Bacterium // Annu. Rev. Phytopathol. -2008. - V.46. - Р. 53-73.
Сведения об авторах:
Турская Анна Леонидовна, научный сотрудник лаборатории фитоиммунологии Сибирского института физиологии и биохимии растений СО РАН, магистрант Института кибернетики им. Е.И. Попова Иркутского государственного технического университета, кандидат биологических наук, e-mail: [email protected]
Степанов Алексей Владимирович, научный сотрудник лаборатории физиологической генетики растений Сибирского института физиологии и биохимии растений СО РАН,
e-mail: [email protected]
Маркова Юлия Александровна, заведующая лабораторией фитоиммунологии Сибирского института физиологии и биохимии растений СО РАН, доктор биологических наук,
e-mail: [email protected]
664033, г. Иркутск, ул. Лермонтова, 132, тел. (3952) 426753
Верхотуров Василий Владимирович, заведующий кафедрой технологии продуктов питания и химии Института пищевой инженерии и биотехнологии Иркутского государственного технического университета, доктор биологических наук, профессор, e-mail: [email protected]
664074, г. Иркутск, ул. Лермонтова, 83, тел. (3952) 405178
Букин Юрий Сергеевич, старший научный сотрудник лаборатории геносистематики, Лимнологический институт СО РАН, кандидат биологических наук, e-mail: [email protected]
664033, г. Иркутск, ул. Улан-Баторская, 3, тел. (3952) 422623