Научная статья на тему 'Методика восстановления утраченных данных полевого опыта'

Методика восстановления утраченных данных полевого опыта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
484
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛЕВОЙ ОПЫТ / ФАКТОРИАЛЬНАЯ СХЕМА / РЕГРЕССИОННЫЙ АНАЛИЗ / СТАТИСТИЧЕСКИЕ КРИТЕРИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пружин Михаил Константинович

Предложено использование регрессионного анализа данных, полученных по сокращенным факториальным схемам, для восстановления утраченной информации при проведении полевых опытов. Отмечено, что эту методику следует применять только в крайних, критических ситуациях, когда опытный участок или отдельные делянки полевого опыта подвергались несанкционированным воздействиям

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пружин Михаил Константинович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика восстановления утраченных данных полевого опыта»

МЕТОДИКА ВОССТАНОВЛЕНИЯ УТРАЧЕННЫХ ДАННЫХ ПОЛЕВОГО ОПЫТА

М.К. Пружин

Аннотация. Предложено использование регрессионного анализа данных, полученных по сокращенным факториальным схемам, для восстановления утраченной информации при проведении полевых опытов. Отмечено, что эту методику следует применять только в крайних, критических ситуациях, когда опытный участок или отдельные делянки полевого опыта подвергались несанкционированным воздействиям.

Ключевые слова: полевой опыт, факториальная схема, регрессионный анализ, статистические критерии.

В процессе проведения полевых опытов возникает множество ситуаций, вследствие которых на отдельных делянках опыта не удается получить результирующие показатели. В этих случаях обычно пытаются восстановить выпавшие данные на основе алгоритмов, учитывающих результаты, получаемые на соседних делянках опыта в пределах повторения или блока. Смысл этого подхода заключается в однозначном предсказании того или иного уровня выходного показателя, гипотетически достигаемого в действительности. Этот метод дает адекватные результаты только при потере незначительного количества информации с делянок опытов, имеющих маловариантные схемы. В тех случаях, когда проводятся сложные многофакторные полевые опыты, исследователь должен иметь достаточно надежный инструмент восстановления утраченных данных на случай несанкционированных событий. При этом восстанавливаться должна не конкретная дата, а выявляемая в опыте зависимость. Считаем, что этому в наибольшей мере отвечает метод регрессионного анализа данных полевого опыта с использованием сокращенных факториальных схем.

Преимущество этого подхода заключается в том, что утраченные данные восстанавливаются на основе информационной модели регрессионного анализа, отражающей изучаемое явление в целом, а не как единичное событие, которое всегда имеет низкую вероятность наступления. Названный информационный подход к восстановлению выпавших данных осуществляется следующим образом.

На первом этапе из полной факториальной схемы подбирается соответствующая дробная реплика, в которую входят данные с неповрежденных делянок опыта. Для выбора сокращенной факториальной схемы (СФС) используется или специальные каталоги, или программы для ЭВМ. Затем по каждой повторности опыта проводится регрессионный анализ, результаты которого используются для восстановления выпавших данных. На последнем этапе получают математическую модель и другие результаты, используя фактические и восстановленные расчетным методом данные.

В качестве доказательства надежности предлагаемого подхода была выполнена его проверка на конкрет-

ных экспериментальных данных по урожайности сахарной свеклы и ячменя (таблица 1).

Таблица 1 - Эффективность восстановления выпавших данных в полевом опыте.

Боз = 3,49; 1сз = 2,20

* - 1 - фактические данные по всем вариантам опыта; 2 - расчетные данные на основе всех фактических вариантов; 3 - объединенные фактические и расчетные данные по выпавшим делянкам; 4-расчетные данные на основе данных по п.3.

** - Б - критерий Фишера; Бё - ошибка разности; Е,% - допустимая ошибка, %; г - коэффициент корреляции; т - относительная частота; р - критерий Тейла.

Приведенные в таблице 1 материалы показывают, что при потере 7 вариантов из схемы 3х3х3 предлагаемый метод восстановления информации обеспечивает получение результатов, которые характеризуются высокой степенью сопряженности с фактическими данными. В моделируемой ситуации при утрате 14 вариантов опыта (з2%) результаты восстановления менее надежны, о чем свидетельствуют показатели критериев Фишера и Тейла по урожайности ячменя. Однако если задача экспериментальных исследований заключается в

Типы сравнений ) Число выпавших вариантов Статистические критерии**-1

Б Бё Е,% г т Р

Сахарная свекла

1-2 0 1,39 0,01 7,3 0,93 0,67 0,025

1-3 7 0,50 0,42 4,4 0,98 0,83 0,013

2-4 7 0,25 1,44 3,2 0,99 1,00 0,009

1-3 14 3,08 0,29 10,9 0,90 0,58 0,032

2-4 14 0,60 0,43 4,9 0,99 0,83 0,014

Ячмень

1-2 0 1,83 0,74 7,2 0,98 0,83 0,026

1-3 7 2,63 -0,52 8,7 0,98 0,58 0,031

2-4 7 5,30 -1,08 12,0 0,96 0,83 0,044

1-3 14 6,06 -0,55 13,2 0,95 0,42 0,047

2-4 14 6,30 -0,87 14,2 0,94 0,58 0,053

С 77 75 81 93 94 89

АА 6 3 3 3 2 4

моделировании элементов или систем земледелия в целом, то исследователя будет интересовать не величина конкретного выходного показателя для того или иного варианта, а изменение коэффициентов модели в связи с утратой и последующим восстановлением информации.

Таблица 2 - Сравнительная оценка результатов регрессионного анализа при восстановлении выпавших

Результаты регрессионного анализа, полученные путем обработки фактических и восстановленных данных для 7 и 14 вариантов полевого опыта приведены в таблице 2.

Представленные в таблице 2 результаты свидетельствуют о возможности адекватного отражения изучаемого процесса даже в тех случаях, когда может возникнуть непредвиденная утрата данных с 52% вариантов опыта. Полученные коэффициенты регрессии, характеризующие воздействие факторов на урожайность сахарной свеклы и ячменя, были близкими в разных случаях восстановления данных. Кроме того, доля вклада главных эффектов в варьирование урожайности также существенно не различалась.

Таким образом, метод регрессионного анализа данных факториальных полевых опытов может применяться для восстановления утраченной информации. Однако этот прием следует использовать только в крайних, критических ситуациях, когда опытный участок или отдельные делянки стационарного опыта подвергались несанкционированным или стихийным воздействиям. Восстановление выпавших данных методом регрессионного анализа на основе теории планирования эксперимента в таких случаях позволит сохранить общую информативность опыта и обеспечить адекватное воспроизведение выявляемых информационных зависимостей.

Информация об авторе

Пружин Михаил Константинович, доктор сельскохозяйственных наук, профессор, декан финансового факультета ФГБОУ ВПО «Курская ГСХА».

вариантов _ опыта

Воздействие факторов Число исключенных вариантов

Сахарная свекла Ячмень

0 | 7 | 14 0 | 7 | 14

Коэффициенты регрессии, т/га

0 43,30 42,80 42,90 3,50 3,50 3,60

А -1,19 -1,34 -1,27 -0,03 -0,07 -0,09

В 2,13 2,61 2,18 0,1 0,18 0,22

С 5,39 5,72 6,19 0,90 0,98 0,97

АВ 0,16 0,47 0,56 -0,04 0,05 0,11

АС 0,56 0,64 -0,07 -0,01 -0,01 -0,06

ВС -0,15 -0,24 0,48 0 0,01 0,04

АА -2,53 -2,01 -2,08 -2,09 -0,27 -0,35

ВВ -0,61 -0,64 -0,20 -0,01 -0,01 -0,07

СС -1,08 -1,13 -1,72 -0,03 -0,01 -0,01

Доля вклада главных эффектов в варьирование, %

А 4 4 3 0 1 1

В 12 16 10 3 3 5

i Надоели баннеры? Вы всегда можете отключить рекламу.