Научная статья на тему 'Сравнительная эффективность числового и кодированного выражения факторов'

Сравнительная эффективность числового и кодированного выражения факторов Текст научной статьи по специальности «Сельское хозяйство, лесное хозяйство, рыбное хозяйство»

CC BY
67
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННЫЙ АНАЛИЗ / КОЛИЧЕСТВЕННЫЕ И КАЧЕСТВЕННЫЕ ФАКТОРЫ / ЧИСЛЕННЫЕ И КОДИРОВАННЫЕ СПОСОБЫ ВЫРАЖЕНИЯ / РАВНЫЙ И НЕРАВНЫЙ ШАГ МЕЖДУ УРОВНЯМИ / ВАРИАНТ ОПТИМАЛЬНОГО ИСПОЛЬЗОВАНИЯ / REGRESSION ANALYSIS / QUANTITATIVE AND QUALITATIVE FACTORS / DIGITAL AND CODED METHODS OF EXPRESSION / AN EQUAL AND UNEQUAL STEP BETWEEN THE LEVELS / VARIANTS OF OPTIMAL USE

Аннотация научной статьи по сельскому хозяйству, лесному хозяйству, рыбному хозяйству, автор научной работы — Пыхтин И. Г., Ширин И. В.

На основании расчетов теоретических значений урожайности культур регрессионным методом при двухи трехфакторных схемах полевого опыта с различным набором количественных и качественных факторов определены возможности их численного и кодированного выражения для случаев с неодинаковым соотношением между факторами, равного и неравного шага между уровнями. Предложены для практического использования наиболее оптимальные варианты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по сельскому хозяйству, лесному хозяйству, рыбному хозяйству , автор научной работы — Пыхтин И. Г., Ширин И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE EFFICIENCY OF DIGITAL AND CODED FACTOR EXPRESSION WHILE PROCESSING DATA OF FIELD EXPERIMENTS BY THE REGRESSION METHOD

Based on the calculations of theoretical values of crop yielding capacity with the help of the regression method in two-andthree-factorial patterns of the field experiment, with different sets of qualitative and quantitative factors the possibilities of their digital and coded expression for the cases with different correlation between them, and of an equal and unequal step between the levels are determined. Most optimal variants are offered for practical use.

Текст научной работы на тему «Сравнительная эффективность числового и кодированного выражения факторов»

В.Н. Семенов // Доклады РАСХН. - 1998. - № 6.

7. Желнаков Л.И., Антонов С.А. Современные тенденции изменения климата в Ставропольском крае // Проблемы интенсификации и экологизации земледелия России: Материалы науч. прак. конф., 14-15 июня, 2006 г. /Донской НИИСХ. Рассвет, 2006.

REGIONAL CHANGES OF WEATHER CONDITIONS AND THEIR INFLUENCE ON THE FARM - PRODUCTION

S.N.Shevchenko, V.A.Korchagin,O.I.Gorjanin,

Summary. In article the analysis of results of 103-years supervision over dynamics of weather conditions on the average Volga Region is resulted. It is established, that changed weather conditions are especially favorable for increase of efficiency of winter crops. In this connection the expediency of expansion of their crops of specific and their high-quality structure is proved. Ways most an effective utilization of the raised bioclimatic potential of the region developed in conditions of global change of a climate are offered.

Key words: temperature of air, a rainfall, winter crops, grades, technologies, soil fertility.

УДК 631.001.57

СРАВНИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ ЧИСЛОВОГО И КОДИРОВАННОГО ВЫРАЖЕНИЯ ФАКТОРОВ ПРИ ОБРАБОТКЕ ДАННЫХ ПОЛЕВЫХ ОПЫТОВ РЕГРЕССИОННЫМ МЕТОДОМ

И.Г. ПЫХТИН, доктор сельскохозяйственных наук, ведущий научный сотрудник И.В. ШИРИН, аспирант ВНИИ земледелия и защиты почв от эрозии E-mail: vnizem@kursknet.ru

Резюме. На основании расчетов теоретических значений урожайности культур регрессионным методом при двух- и трехфакторных схемах полевого опыта с различным набором количественных и качественных факторов определены возможности их численного и кодированного выражения для случаев с неодинаковым соотношением между факторами, равного и неравного шага между уровнями. Предложены для практического использования наиболее оптимальные варианты.

Ключевые слова: регрессионный анализ, количественные и качественные факторы, численные и кодированные способы выражения, равный и неравный шаг между уровнями, вариант оптимального использования.

В современном сельскохозяйственном производстве при характеристике конечных результатов выращивания продукции (урожайность, содержания белка, клейковины, масла) широкое распространение получили математические модели, особенно полиномы различного порядка (нормальные, квадратичные, полустепенные) [1].

Применение таких моделей весьма полезно, особенно в том случае, когда полевые опыты ведутся не по полнофакторным схемам.

Однако практика использования полиномов показала, что есть ряд аспектов, которые никак нельзя не учитывать.

Во-первых, они наиболее адекватны, если рассчитываются по факторам, имеющим несколько уровней с равным шагом между ними.

Во-вторых, полиномы наиболее полезны, если

рассчитываются по дробным репликам, включающим не менее 50 % вариантов от полнофакторных схем [2].

К числу недостатков полиномов надо отнести также:

трудность интерпретации, особенно специалистами, не владеющими исходными положениями;

наличие в расчетных величинах серьезных расхождений с фактическими данными (до 10...15 %);

сложность расчетов при включении в полнофакторные схемы качественных и количественных факторов.

И, пожалуй, наиболее слабым звеном построения уравнений регрессии остается использование в системе качественных факторов кодированных величин.

К числу таких факторов можно отнести тип севооборота (предшественник), способ обработки почвы, погодные условия, экспозицию склона и др. При отсутствии показателей, определяющих их уровень, кодирование факторов будет зависеть от личных взглядов исследователя. Например, влияние зернотравяного, зернопропашного и зернопаропропашного севооборота можно кодировать по степени воздействия на продуктивность культуры как 0,1,2 или как -1,0,1, а если ставить во главу угла содержание гумуса в почве, то, соответственно, как 2,1,0 или 1,0,-1. Если же характер влияния не определен, то в любом другом соотношении. Во всех случаях интервал между уровнями остается неравным, и уравнения регрессии будут отличаться по величине свободного члена, коэффициентов при независимых переменных и знаков перед ними.

Цель исследований - уточнить эффективность числового и кодированного выражения факторов при обработке экспериментальных данных полевых опытов регрессионным анализом.

Задачи исследования:

определить возможность использования число__ Достижения науки и техники АПК, №03-2010

Таблица 1. Сравнительная эффективность использования численных показателей и кодированных величин в ПФСЗ2 при расчете урожайности сахарной свеклы (1989 г., северная экспозиция, факторы: минеральные удобрения - Х1? органические -

Вари- ант Содержание варианта Фактическая урожайность, ц/га Расчетная урожайность (ц/га) при использовании

ЫРК, кг навоз, т численных показателей (Г) кодированных величин

0,1,2 (Щ I -1,0,+1 от

1 0 0 240 234 234 234

2 0 24 228 261 261 261

3 0 48 337 310 310 310

4 260 0 343 329 329 329

5 260 24 342 329 329 329

6 260 48 325 352 352 352

7 520 0 341 361 361 361

8 520 24 356 335 335 335

9 520 48 331 331 331 331

НСР05 - - 35,5 - - -

Степень Р, % 100 100 100

сопряженности по Т 0,03 0,03 0,03

критериям х2 12,3 12,1 12,1

X 0,66 0,66 0.66

вых и кодированных величин в двухфакторных схемах с одинаковым шагом между уровнями;

уточнить эффективность использования кодированных величин качественных факторов в полнофакторной схеме с двумя факторами на трех уровнях (ПФСЗ2) и с тремя факторами на трех уровнях (ПФСЗ3) при условии неопределенности их влияния;

оценить возможности совместного использования количественных и качественных факторов в ПФСЗ3 как с точки зрения адекватности уравнений регрессии, так и целесообразности расчетов по ним, направленности действия главных эффектов факторов;

предложить наиболее рациональные варианты для решения подобного рода задач.

Условия, материалы и методы. Для решения поставленных задач мы математически обработали ряды экспериментальных данных многолетнего многофакторного опыта ВНИИ земледелия и защиты почв от эрозии, который ведется с 1984 г. Математической обработке подвергали не все варианты опыта, а только схемы ПФСЗ2 и ПФСЗ3. Рассматривали следующие факторы: качественные - экспозиция склона, предшественник, обработка почвы; количественные - органические удобрения, минеральные удобрения. Использованные культуры - сахарная свекла, озимая пшеница, ячмень.

Степень сопряженности рядов данных оценивали по частоте совпадения (Р %),

индексу Тейла (Т), хи-квад-рату (х2) и X Колмогорова.

В первом случае, расхождение признавалось су-щественным, если оно превышало НСР05, в трех остальных - если оно превышало соответствующие табличные значения.

Результаты и обсуждение. На первом этапе в полнофакторной схеме ПФСЗ2 сравнивали расхождение между фактическими и расчетными данными влияния минеральных и органических удобрений на урожайность сахарной свеклы (табл. 1) и ячменя (табл. 2) при выражении факторов через численные показатели и кодированные величины.

Мы установили, что в этом случае использование численных и кодированных величин для расчетов теоретических значений урожайности культур обеспечивает высокую адекватность полиномов второго порядка при оценке по всем приведенным критериям.

Оба способа выражения могут широко применяться, если факторы имеют одинаковый шаг между уровнями. Существенное расхождение между эмпирическими и теоретическими значениями возможно только в одном случае из девяти.

Из двух рассмотренных вариантов кодирования (0,1,2 и -1,0,+1) предпочтение нужно отдавать первому, так как в этом случае легко рассчитать главные эффекты факторов с учетом их кривизны, и они близки к величинам, определяемым по алгоритму Йейтса.

Например, если главный эффект фактора «оди-Таблица 2. Сравнительная эффективность использования численных показателей и кодированных величин в ПФСЗ2 при расчете урожайности ячменя (1990 г., водораздел, факторы: минеральные удобрения - X,, орга-

* Уравнения регрессии:

I - У=233,69+0,4856Х1+0,691Х2-0,0043Х,Х2-0,0005Х ,2+0,0188Х.

II - У=233,69+126,25X^16,583X^26,75X^-31,17X^10,83Х22

III - У=329,444+37,1667X^11,5X^26,75X^-31,17Х*+10.83Х/

Вари- ант Содержание варианта Фактическая урожайность, ц/га Расчетная урожайность (ц/га) при исп ользо ван ии

ЫРК, навоз, кг т численных I показателей (Iі) \ кодированных величин

I 0,1,2 (II*) ] -1,0, *1 (III*)

1 0 0 43,3 43,8 43,8 43,8

2 0 6 45,8 44,2 44,2 44,2

3 0 12 43,2 44,2 44,2 44,2

4 90 0 50,2 51,3 51,3 51,3

5 90 6 52,8 51,5 51,4 51,4

6 90 12 50,9 51,2 51,1 51,1

7 180 0 46,8 45,3 45,1 45,1

8 180 6 42,1 45,1 44,9 44,9

9 180 12 45,6 44,5 44,4 44,4

НСРоб - 2,5 - - -

Степень Р,% 89 89 89

сопряженности по Т 0,015 0,024 0,016

критериям х2 0,41 0,40 0,44

X 0,11 0,11 0,11

* Уравнения регрессии:

I - У=43,84+0,1590Х+0,1069Х2-0,0005X^-0,0008Х2-0,0065Х2

II - У=43,85+ 14.3083Х+0,6417Х2-0,275Х}<2-6,833Х*-0,233Х2

III - У=51,4556+0,3667Х,-0,1Х2-0,275X^6,8333Х2-0,2333Х^

нарная доза ЫРК», рассчитанный по алгоритму Йейтса для фактических данных урожайности сахарной свеклы составил 45,2 %, то определенный таким же способом для расчетных величин - 34,8 %, непосредственно по уравнениям регрессии - 54,0 %, а при расчете главных эффектов с учетом действия нелинейности фактора (квадратичности эффекта)

- 39,5 и 40,6 % соответственно. Идентичные результаты дает расчет главного эффекта ЫРК для урожайности ячменя. Определенный по фактическим величинам с использованием алгоритма Йейтса он составляет 15,3 %, без учета нелинейности по расчетным величинам 16,9 %, по уравнениям регрессии 32,6 %, а с учетом - 17,9 и 17,1%.

При использовании кодирования типа -1; 0; +1 свободный член характеризует состояние системы при среднем уровне определяющих факторов, то есть действие одинарной дозы удобрений уже включено в величину урожая.

Увеличение в ПФСЗ2 доли качественных факторов, вплоть до полного исключения количественных, ведет к росту расхождений между эмпирическими и теоретическими значениями, особенно при выражении качественных факторов через среднюю продуктивность по фону (табл. 3).

Из всех возможных типов кодирования наиболее допустимыми, в таких случаях, оказалось их выражение в величинах, построенных на логических принципах (III, IV тип), исходя из знаний многолетнего

Таблица 3. Сравнительная эффективность использования кодированных величин в ПФСЗ2 при расчете урожайности озимой пшеницы (1992 г., северная экспозиция, факторы: предшественник - Х1, обработка почвы - Х2)

Вари- ант Содержание варианта Фактическая урожайность, ц/га Расчетная урожайность (ц/га) при кодировании типа*

предшест- венник обработка почвы I** II III IV V

1 травы 2-х лет безотвальная 51,9 48,4 48,4 49,1 49,1 48,9

2 пользования отвальная 46,4 52,4 52,4 46,2 46,2 48,5

3 поверхностная 42,1 49,1 49,1 45,1 45,1 42,9

4 травы одного безотвальная 39,6 42,3 42,3 39,0 39,0 41,6

5 года отвальная 44,3 47,2 47,2 42,0 42,0 41,5

6 пользования поверхностная 38,2 42,1 42,1 41,0 41,0 39,0

7 черный пар безотвальная 42,0 42,8 42,8 44,5 44,5 43,0

8 отвальная 42,0 47,3 47,3 39,5 39,5 42,7

9 поверхностная 39,7 43,1 43,1 39,6 39,6 38,1

НСР05 2,8 - - - - -

Степень сопряженности по критериям Р, % 66 66 100 100 100

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т 0,05 0,05 0,03 0,03 0,02

х2 3,52 3,52 0,97 0,97 0,70

X 0,99 0,99 0,33 0,33 0,11

тип кодирования:

тип коди рова ния предшественник обработка почвы

предпосылка травы 1 года пользов ания травы 2х лет пользов ания черный пар отваль ная безот- вальная поверх- ностная

I исходя из уро- 0 1 2 2 1 0

II жайности по фону -1 0 1 1 0 -1

III исходя из логики 1 0 2 1 0 2

IV 0 -1 1 0 -1 1

V исходя из соотношения 0 0,1 0,15 0,10 0,11 0

**Уравнения регрессии:

I - У=37,3389-1,5333Х+7,3333Х2-0,45ХХ2+2,5167Х12-2,3833Х22;

II- У=42,8222+3,05Х+2,1167Х2-0,45ХХ2+2,5167Х12-2,3833Х22;

III- У=44,5056-5,8Х1-7,4667Х2+ 1,95Х,Х+3,3167Х2+2,5167Х22;

IV- У=39,0222+2,7833Х,-0,4833Х2+1,95Х,Х+3,3167Х2+2,51 67Х22;

V- У=38,9713-79,5225Х+39,6839Х+202, 703Х,Х+706,667Х2-142,424Х22.

действия факторов, или же из соотношений по фонам (V тип).

Наиболее интересно с таких позиций определение теоретических значений урожайности культур в экспериментах типа ПФСЗ3 с различным сочетанием качественных и количественных факторов (табл. 4).

Проведенный расчет для урожая озимой пшеницы в 1992 г. с сочетанием факторов - предшественник, минеральные и органические удобрения показал на увеличивающееся число рассчитанных вариантов (от 22 % до 26 %) с существенными отклонениями от эмпирических значений при одновременном ухудшении всех критериев сопряженности.

Увеличение в ПФСЗ3 доли качественных факторов до 66...100 % также не способствовало росту степени сопряженности данных, хотя и не уменьшало ее, по сравнению с первым соотношением. В каждых 6 из 27 вариантов теоретические значения не совпадали с эмпирическими.

Более важным обстоятельством стал способ выражения качественных факторов.

Выражение их через урожайность по фону приводило к получению уравнений регрессии явно нецелесообразных для последующего анализа, так как свободный член не отражал состояние системы при каком-то уровне факторов и не позволял оценить их вклад, исходя из коэффициентов при независимых переменных.

Наиболее пригодным, как и для ПФСЗ2, оказалось кодирование через 0,1,2 или -1,0, + 1. При этом в последнем случае имел место тот же недостаток, который был отмечен ранее.

Между этими типами кодирования не было существенных расхождений по критериям сопряженности (степени совпадения данных, индексу Тейла, Хи-квадрату, Х-Колмогоро-ва).

Следует заметить, что при кодировании качественных факторов часто возникает вопрос, чему какой код присваивать из-за неоднозначности действия по годам или очень близких результатов. Например, в нашем случае урожайность озимой пшеницы в 1992 г. в среднем при поверхностной обработке по всем предшественникам составила 39,0, при безотвальной -43,9 и при вспашке - 43,8 ц/га. То есть, кодирование надо было выражать через 0,2,1. Однако логика свидетельствует, что при посеве по пласту двухлетних трав лучший способ вспашки, а по черному пару - поверхностная об-Достижения науки и техники АПК, №03-2010

*

Таблица 4. Сводная таблица оценки сопряженности эмпирических и тео- ческих значениях на каж-ретических данных в ПФСЗ3 с различным соотношением количественных и дые 9 вариантов возможно

качественных факторов

Степень сопряженно-

Фактор Способ выражения факторов сти по критериям

Р, % \ Т

Озимая пшеница, 1992 г.

Предшественник, Численный: предшественник - тра-

минеральные вы 1 года (42,9*); травы 2 года

удобрения, органи- (49,3); черный пар (47,9); мине-

ческие удобрения. ральные удобрения - 0,100,200; органические удобрения - 0,6,12.

Кодированный: 0; 1; 2 78 0,03 5,1 0,77

-1; 0; +1 74 0,03 5,83 0,96

НСРо,5 4,6 78 0,03 5,83 0,96

Предшественник, Численный: предшественник - тра-

обработка почвы, вы 1 года (39,4); травы 2 года

минеральные (41,7); черный пар (45,5); обработка

удобрения. почвы - поверхностная (39,0); безотвальная (43,9); отвальная (43,8); минеральные удобрения -

0,100,200. 81 0,02 2,11 0,19

Кодированный: 0; 1; 2 -1; 0; +1 78 0,02 2,30 0,38

81 0,02 2,30 0,38

НСРо,5 2,8

Ячмень, 1990 г.

Экспозиция склона, Кодированный: 0; 1; 2 83 0,02 2,03 0,42

предшественник, -1; 0; +1 78 0,02 2,03 0,42

обработка почвы НСРо,5 2,7

Критические значения показателей сопряженности - 0,05 38,9 1,36

*в скобках урожайность по фону

работка и кодирование в таком случае будет выглядеть совсем по-другому. При этом у полученных уравнений регрессии существенно отличаются коэффициенты при независимых переменных, что не позволяет оценить истинный вклад фактора и направленность его действия. Безусловно, этому способствует ещё и отсутствие нулевого уровня у качественных факторов, заведомо снижающего их главные эффекты.

В итоге, при анализе уравнений регрессии, рассчитанных по количественным факторам, в наибольшей степени возможна ошибка в оценке прямого действия и взаимодействия факторов, что требует от исследователя тщательного осмысления.

Выводы. При расчете по полиномам второй степени теоретических значений урожайности культур в ПФСЗ2 с количественными факторами, имеющими равный шаг (интервал) между уровнями, можно использовать как количественные, так и кодированные величины. При этом в рассчитанных теорети-

Литература.

1. Иванова Т.И. Прогнозирование эффективности удобрений с использованием математических моделей. - М.:Аг-ропромиздат, 1989. - 235с.

2. Сокращенные факториальные схемы полевого опыта / М.К.Пружин, А.П.Волобуев, С.С.Мащенко, А.Е.Кривчи-ков // Земледелие. - 1990. - №10. - С. 70-72.

COMPARATIVE EFFICIENCY OF DIGITAL AND CODED FACTOR EXPRESSION WHILE PROCESSING DATA OF FIELD EXPERIMENTS BY THE REGRESSION METHOD Pykhtin I.G., Shinn I.V.

Summary. Based on the calculations of theoretical values of crop yielding capacity with the help of the regression method in two-and- three-factorial patterns of the field experiment, with different sets of qualitative and quantitative factors the possibilities of their digital and coded expression for the cases with different correlation between them, and of an equal and unequal step between the levels are determined. Most optimal variants are offered for practical use.

Key words: regression analysis, quantitative and qualitative factors, digital and coded methods of expression, an equal and unequal step between the levels, variants of optimal use.

одно существенное расхождение.

При использовании только качественных факторов, не имеющих количественной оценки, число ошибок возрастает и коэффициенты при независимых переменных в планах типа -1,0,+ 1 становятся практически непригодными для расчетов главных эффектов факторов.

В зависимости от типа кодирования существенно меняются коэффициенты перед независимыми переменными и направленность действия факторов, что обусловливает необходимость тщательного анализа полученных результатов, особенно если кодирование необоснованное.

Для полнофакторных планов ПФСЗ2 и пФсЗ3 наиболее пригодно кодирование типа 0,1,2, основанное на логическом подходе, базирующемся на накопленных знаниях. Перспективным может быть кодирование, рассчитанное из соотношения урожайности по фонам.

Наилучший метод для определения главных эффектов факторов по рассчитанным теоретическим значениям - алгоритм Йейтса.

При увеличении количества вариантов в полнофакторных схемах и при смешивании количественных и качественных факторов число существенных расхождений между экспериментальными и теоретическими значениями увеличивается, а отсюда возрастают значения Т, х2 и X, хотя они не достигают критических значений.

В полнофакторных схемах ПФСЗ3 при наличии большей доли качественных факторов, для расчетов уравнений регрессии лучше кодировать все факторы. Однако при этом число существенных расхождений между эмпирическими и теоретическими данными увеличивается и может достигать 20 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.