УДК 57.081.23:681.3
МЕТОДИКА ВОССТАНОВЛЕНИЯ УТРАЧЕННЫХ ДАННЫХ ПРИ ОБРАБОТКЕ РЕЗУЛЬТАТОВ СТАЦИОНАРНОГО ОПЫТА МЕТОДОМ ДИСПЕРСИОННОГО АНАЛИЗА
С. В. Фролова, доцент, канд. с.-х. наук;
Л. И. Никонорова, ст. преподаватель;
Л. В. Бобрович, профессор, доктор с.-х. наук
Мичуринский государственный аграрный университет, т. (47545) 4-45-21, e-mail: [email protected]
Рассмотрен подход к обработке экспериментальных данных с биологическими объектами методом приведения неортогональных схем к схемам ортогональным за счет восстановления вариантов, содержащих выпавшие данные.
Ключевые слова: дисперсионный анализ, методика, статистические приёмы, эксперимент.
Как уже было отмечено нами ранее [1,
2, 3], в экспериментальной работе исследователям, в силу учащающегося воздействия природных стресс-факторов, часто приходится сталкиваться со случаями выпадения данных по вариантам опыта, что при проведении дисперсионного анализа в ходе обработки результатов эксперимента выражается как отсутствие варианта в одной или двух клетках исходной таблицы дисперсионного анализа. В этих случаях для проведения корректной обработки результатов могут оказаться очень полезными простейшие статистические приемы, позволяющие теоретически приблизительно вычислить отсутствующие показатели. Естественно, что в результате выпадения данных опыт становится неполным и проводить сравнения вариантов при разном количестве повторных делянок в них нельзя (при ортогональной схеме дисперсионного анализа). Для получения результатов необходимо использовать специальные методики, дающие объективный результат с определённой степенью точности. Это может быть один из описанных нами ранее методов [1, 2, 3].
Целью данной работы мы ставим описание ещё одного подхода к обработке результатов исследований при частичной утрате опытных данных, который состоит в том, что опыт с сохранившимися делянками приводится к опыту с полным набором делянок для каждого варианта и повторения, т. е. средние тех вариантов, по которым нет данных, приводятся к сравнимому виду со всеми прочими средними. «Восстановить» точно утраченную дату той или иной делянки, не учтенной вследствие повреждения и браковки (по различным причинам), нельзя. Можно только теоретически приблизительно вычислить наиболее вероятное, ожидаемое количественное значение признака, который и проставляют в пустую клетку таблицы дисперсионного анализа. Эти значения вычисляют исходя из наличия сопряженных показателей по вариантам и повторениям. При этом теоретически вычисленные значения не должны ничего изменять в фактических эффектах по вариантам.
Исходя из этого, можно заключить, что вычисленные значения утраченных данных по неучтенным делянкам должны показать
Нива Поволжья
№ 4 (9) ноябрь 2008
29
такую эффективность действия изучаемого фактора, которая была бы равна средней эффективности во всех оставшихся повторениях по тому же варианту.
Мы в наших исследованиях значения выпавших делянок восстанавливали [4] при помощи формулы
(1)
где n - число повторений в опыте;
j - число делянок с выпавшими датами у того варианта, для которого восстанавливаются значения этих делянок;
її - число вариантов с полным набором делянок;
М Р - сумма поделяночных значений вариантов с полным набором делянок в том повторении, где восстанавливается утраченное значение (Х);
М ^ - сумма невыпавших поделяночных значений того варианта, для которого восстанавливается выпавшее значение;
М V- сумма поделяночных вариантов с полным набором делянок тех повторений, в которых не выпали поделяночные даты того варианта, для которого восстанавливаются утраченные данные.
При группировке экспериментальных данных в матрицы для проведения соответствующих исследований мы использовали новую компьютерную программу GLORIA (разработанную доцентом кафед-
ры информатики МичГАУ, канд. с.-х. наук С. В. Фроловой), формирующую случайным образом из генеральных совокупностей различных изучаемых показателей повторности по каждому опытному варианту, которые далее обрабатываются методом дисперсионного анализа с учетом восстановленных данных в программе ASTRA того же автора.
К сожалению, исследователи достаточно редко используют методики восстановления частично утраченных в опыте данных, да и в случае их использования чаще прибегают к восстановлению их путем усреднения оставшихся значений по вариантам с выпавшими делянками, что может быть не совсем корректно, так как не учитывается все многообразие воздействующих на опытные варианты и повторения факторов. Предлагаемая же методика позволяет избежать этого. Причем, следует помнить, что в применяемой формуле знаменатель должен быть отличен от нуля, т. е. нельзя обрабатывать по этой схеме результаты опыта, где выпали данные хотя бы по одному повторению в каждом варианте, либо по какому-либо варианту в целом.
Как показывают наши исследования, применение этого метода восстановления данных корректно в случаях с утратой от 1 до 3 дат по опыту в целом, если число вариантов составляет до 5. Это не означает,
Таблица ї
Исходная матрица для проведения дисперсионного анализа
Вариант (сорт) Повторения
I II III IV V VI VII VIII IX X
Северный синап 12,б 11,0 13,2 10,5 13,3 14,5 15,0 14,8 14,9 10,0
Спартан 10,1 10,9 10,5 11,5 10,7 9,0 10,5 10,3 9,0 9,0
Уэлси 10,2 9,б 10,2 10,2 10,0 9,8 11,5 10,0 12,3 11,0
Таблица 2
Исходная матрица с выпавшими данными
Вариант (сорт) Повторения
I II III IV V VI VII VIII IX X
Северный синап 12,5 13,2 10,5 13,3 15,0 14,8 14,9 10,0
Спартан 10,1 10,9 10,5 11,5 10,7 9,0 10,5 10,3 9,0 9,0
Уэлси 10,2 9,5 10,2 10,0 9,8 11,5 1,0 12,3 11,0
Таблица З
Таблица для вычисления значений по выпавшим делянкам
Вариант (сорт) Повто рения Сумма
I II III IV V VI VII VIII IX X № 1 М Vx № 3 М Vx М V
Северный синап 12,5 13,2 10,5 13,3 15,0 14,8 14,9 10,0 104,2 - 81,6
Спартан 10,1 10,9 10,5 11,5 10,7 9,0 10,5 10,3 9,0 9,0
Уэлси 10,2 9,5 10,2 10,0 9,8 11,5 10,0 12,3 11,0 - 94,5 91,0
зо
Агрономия
Таблица 4
Таблица анализа рассеяний при восстановлении данных
Рассеяние Сумма квадратов £0 Число степеней свободы СҐ Дисперсия 52 Ро Р 05
Общее 88,97 26
Повторностей 30,17 9
Вариантов 48,89 2 24,44 16,51 6,01
Остаточное 9,91 15 1,48
что в прочих случаях следует браковать опыт в целом, так как можно использовать другие методики, в частности обработку по неортогональной схеме дисперсисонного анализа или приведение его к ортогональной схеме в тех случаях, когда это возможно.
Для иллюстрации техники восстановления данных по выпавшим делянкам рассмотрим пример с нашими данными по диаметру штамбиков в опыте с саженцами яблони трех сортов во втором поле плодового питомника.
Подставляя в формулу (1) соответствующие числовые значения, получим:
- для второго повторения
(10-2)*10,9 + 7*104,2-81,6 „„ „
Х=------- -------------------— =13,1;
(10 - 2) *7
- для шестого повторения
(10 - 2) *9 + 7*104,2 - 81,6
Х=------- ----------------—=12,9;
(10 - 2) *7
- для третьего повторения
(10-1)*10,5 + 7*94,5-91
Х----------------------------10,6.
(10 -1) *7
После этого статистическую обработку данных проводят как в обычной схеме дисперсионного анализа. Только в остаточное число степеней свободы вносят изменение, которое заключается в исключении из этого числа количества выпавших делянок. Это обусловливается тем, что восстановленные данные по существу не определяют значения вариантов с выпавших делянок, а только корректируют их на основе имеющихся данных. Заключительная таблица дисперсионного анализа принимает в этом случае вид (табл. 4).
(I х,)2
С--
3781,14 ,
„=(£ *)2 -с =88,97 *
£ О П=£( П % -с=30,17'
£Оа=^"Уп -с=48,89,
£ о =£О „-£О-£ О п=9,91.
В формулу определения средней величины также вносят изменения. В тех
случаях, когда сравниваются варианты с нормальным и одинаковым числом делянок, используют обычную формулу:
(2)
Если же сравнивают варианты с неодинаковым числом делянок, вместо повторности берут среднюю арифметическую из повторностей этих двух вариантов - в данном случае сортов.
Настоящая работа является продолжением исследований в направлении особенностей применения методов математической статистики и компьютерного моделирования для планирования и обработки результатов эксперимента в исследованиях с биологическими объектами, в частности с плодовыми растениями, в т. ч. дисперсионного анализа, проводимыми коллективом авторов МичГАУ в течение последних двух десятилетий.
Работа выполнена при финансовой поддержке РФФИ, грант № 06-07-96317 р_центр_а.
Литература
1. Никонорова, Л. И. К вопросу обработки экспериментальных данных в плодоводстве при их частичной утрате / Л. И. Никонорова, С. В. Фролова, Л. В. Бобрович // Актуальные проблемы развития АПК: сборник трудов всероссийской конференции. -Саратов, 2006. - С. 27-30.
2. Никонорова, Л. И. Использование неортогональных схем дисперсионного анализа в стационарном опыте в исследованиях по плодоводству в зависимости от необходимого числа повторностей / Л. И. Ни-конорова, Л. В. Бобрович, С. В. Фролова // Вопросы современной науки и практики / Университет им. В. И. Вернадского. - Тамбов, 2006. - № 3(5). - С. 27-32.
3. Фролова, С. В. К вопросу обработки опытных данных при их частичной утрате в стационарном опыте / С. В. Фролова, Л. И. Никонорова, Л. В. Бобрович // Экологические проблемы отраслей народного хозяйств:
Нива Поволжья № 4 (9) ноябрь 2008 31
сборник трудов международной конференции. - Пенза, 2006. - С. 197-200.
4. Снедекор, Дж. У. Статистические методы в применении к исследованиям в сель
ском хозяйстве и биологии / Дж. У. Снедекор. - М.: Изд-во с.-х. литературы, журналов и плакатов, 1961. - 561 с.
32
Агрономия