Научная статья на тему 'ИССЛЕДОВАНИЕ КОЛИЧЕСТВЕННОЙ ИНФОРМАЦИИ МЕТОДАМИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ АГРОНОМА'

ИССЛЕДОВАНИЕ КОЛИЧЕСТВЕННОЙ ИНФОРМАЦИИ МЕТОДАМИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ АГРОНОМА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
дисперсионный анализ / фактор / влияние / процесс / урожайность / взаимодействие / коэффициент корреляции / регрессионная модель / analysis of variance / factor / influence / process / productivity / connectivity / correlation coefficient / regression model

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бунтова Е.В.

В работе поставлена проблема применения современных методов математической статистики в процессе анализа данных научных исследований. Указаны основные причины возникшей проблемы. На примере анализа данных научных исследований агрономов показано применение некоторых методов математической статистики. В частности рассмотрены методы дисперсионного, корреляционного и регрессионного анализов, которые имеют место в практической деятельности специалиста агронома при исследовании связи между случайными величинами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A STUDY OF QUANTITATIVE INFORMATION, METHODS OF MATHEMATICAL STATISTICS IN PRACTICE AGRONOMIST

In work the problem of application of modern mathematical statistics methods in data mining research. Are the main causes of the problem. By analyzing data of scientific research agronomists shows the use of some methods of mathematical statistics. In particular, the article considers methods of dispersion, correlation and regression analyses that take place in the practice of expert agronomist in the study of relationships between random variables.

Текст научной работы на тему «ИССЛЕДОВАНИЕ КОЛИЧЕСТВЕННОЙ ИНФОРМАЦИИ МЕТОДАМИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ АГРОНОМА»

8. Барташевская Л.И., Зайцев А.С. Явление увеличения концентрации электронов в ацетиле но-кислородном пламени, вызванное электрическим полем // Электрофизика горения: Тезисы докладов

научно-практического семинара по электрофизике горения, 11 - 15 мая 1987 г. - Караганда, 1987. с. 44 - 45.

Бунтова Е.В.

канд. пед. наук, доцент кафедры «Физика, математика и информационные технологии» ФГБОУ ВО Самаркой государственной сельскохозяйственной академии, г. Самара

ИССЛЕДОВАНИЕ КОЛИЧЕСТВЕННОЙ ИНФОРМАЦИИ МЕТОДАМИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ АГРОНОМА

A STUDY OF QUANTITATIVE INFORMATION, METHODS OF MATHEMATICAL STATISTICS IN

PRACTICE AGRONOMIST

Buntova E. V.

cand. ped. sciences, associate Professor of "Physics, mathematics and information technology" doctor of

the Samarka state agricultural Academy, Samara

АННОТАЦИЯ

В работе поставлена проблема применения современных методов математической статистики в процессе анализа данных научных исследований. Указаны основные причины возникшей проблемы. На примере анализа данных научных исследований агрономов показано применение некоторых методов математической статистики. В частности рассмотрены методы дисперсионного, корреляционного и регрессионного анализов, которые имеют место в практической деятельности специалиста - агронома при исследовании связи между случайными величинами.

ABSTRACT

In work the problem of application of modern mathematical statistics methods in data mining research. Are the main causes of the problem. By analyzing data of scientific research agronomists shows the use of some methods of mathematical statistics. In particular, the article considers methods of dispersion, correlation and regression analyses that take place in the practice of expert agronomist in the study of relationships between random variables.

Ключевые слова: дисперсионный анализ, фактор, влияние, процесс, урожайность, взаимодействие, коэффициент корреляции, регрессионная модель.

Keywords: analysis of variance, factor, influence, process, productivity, connectivity, correlation coefficient, regression model.

В профессиональной деятельности экономиста, инженера, агронома постоянно возникает необходимость получать информацию и извлекать из нее ответы на многочисленные вопросы.

Любое решение, которое принимает специалист, требует применения методов обработки результатов наблюдений. Например, приведет ли внедряемое новшество к повышению качества продукции, зависит ли наблюдаемый процесс от заданного фактора, существует ли связь между исследуемыми величинами или насколько сильна имеющаяся связь.

В настоящее время, несмотря на неоспоримую значимость математической статистики, многие выпускники высшей школы, инженеры, ученые имеют достаточно смутное представление о современных методах математической статистики. Для аспирантов математическая статистика является чаще всего «красивой рамкой» для диссертации.

Одна из причин возникшей проблемы - это ограниченное количество аудиторных часов, отведенных учебными планами вузов на изучение математической статистки. Другая причина - огромное количество литературы по математической статистике, например, более миллиона работ по

статистическим методам, и разнобой в терминологии.

Таким образом, возникает проблема более тщательного подбора материала к преподаванию математической статистики для различных направлений подготовки специалистов. Из большого количества современных методов математической статистики следует выбрать те методы исследования количественной (качественной) информации о процессе, объекте или явлении, которые имеют наибольшее значение в работе специалиста определенного направления.

Задача состояла в том, чтобы исходя из часто решаемых задач практики специалистами направления подготовки - «агрономия», рассмотреть методы математической статистики, имеющие наибольшее значение в практической деятельности агронома.

Рассмотрим некоторые методы дисперсионного, корреляционного и регрессионного анализов, которые имеют место в практической деятельности специалиста - агронома при исследовании связи между случайными величинами.

Методами дисперсионного анализа устанавливается наличие влияния заданного фактора на изучаемый процесс, отображаемый наблюдаемой

статистической совокупностью выборочных данных [3,5].

Например, требуется проверить влияние удобрения и препарата для обработки семян на урожайность по данным приведенным в таблице 1. Пусть фактор А - это удобрение, а фактор В - пре-

парат для обработки семян. Таким образом, требуется провести двухфакторный дисперсионный анализ и проверить гипотезу о влиянии факторов А и В, их комбинаций на указанный признак -урожайность.

Данные о видах удобрений и препаратах для обработки семян

Таблица 1

Изучаемые факторы Урожайность зерна с 1 га в ц

Азотные удобрения (фактор В) Обработка семян (фактор А) Повторность Среднее

I II III

Без удобрений В1 без обработки (А1) 29,8 27,2 25,0 27,3

ЖУСС-1 (А?) 31,0 27,2 29,0 29,1

ЖУСС-2 (А3) 30,3 36,4 32,0 32,9

ЖУСС-3 (А4) 32,5 32,6 33,1 32,7

Аммонийная селитра В? без обработки (А1) 35,9 27,1 34,4 32,5

ЖУСС-1 (А?) 32,0 36,3 32,9 33,7

ЖУСС-2 (А3) 32,4 38,8 40,0 37,1

ЖУСС-3 (А4) 35,7 40,4 37,1 37,7

Мочевина Вз, без обработки (А1) 33,5 34,2 28,7 32,1

ЖУСС-1 (А?) 35,4 35,4 32,7 34,5

ЖУСС-2 (А3) 37,4 37,3 39,0 37,9

ЖУСС-3 (А4) 39,5 30,3 35,6 35,1

Сульфат аммония В4 без обработки (А1) 39,1 34,5 28,2 33,9

ЖУСС-1 (А?) 33,9 35,3 35,6 34,9

ЖУСС-2 (А3) 35,0 36,4 37,0 36,1

ЖУСС-3 (А4) 39,5 36,1 36,5 37,4

По исходным данным составляется таблица 2.

Исходные данные

Таблица 2

B A

¿1 ¿2 ¿3 ¿4

«1 29,8; 27,2; 25,0 31,0; 27,2; 29,0 30,3; 36,4; 32,0 32,5; 32,6; 33,1

«2 35,9; 27,1; 34,4 32,0; 36,3; 32,9 32,4; 38,8; 40,0 35,7; 40,4; 37,1

«3, 33,5; 34,2; 28,7 35,4; 35,4; 32,7 37,4; 37,3; 39,0 39,5; 30,3; 35,6

«4 39,1; 34,5; 28,2 33,9; 35,3; 35,6 35,0; 36,4; 37,0 39,5; 36,1; 36,5

Фактор А имеет четыре уровня АХ,А2,А3,А4, Заменяются серии значений их средними и

фактор В имеет четыре уровня Вх, В2, В3,, В4. результаты записываются в таблицу 3, где г - но-

мер столбца, ] - номер строки.

Таблица 3

Средние значения результатов наблюдений_

B A =

¿1 ¿2 ¿3 ¿4

«1 27,3 29,1 32,9 32,7 122,0

«2 32,5 33,7 37,1 37,7 141,0

«3, 32,1 34,5 37,9 35,1 139,6

«4 33,9 34,9 36,1 37,4 142,3

125,8 132,2 144,0 142,9 544,9

Используя данные таблицы 3, вычисляются ^ т л т

суммы согласно формулам ^ = у у х- ; = —у X? ; = — у

¿=1 7 = 1 ¿=1 7 = 1

4=1 / \./'=1

где к - количество столбцов, т - количество строк.

Согласно данным таблицы 3, соответствующие суммы принимают значения:

4 4

И = / / х17 = 18691,71;

т

= = 18625,6125;

=1 =1 = 18557,25. Вычисленные значения сумм используются для нахождения оценки дисперсий

Qi

VV*7

¿ = 1 7 = 1

18691,71

С 2 = 50 =

к

=1

= 18614,7225; Qi + Q - - Qs 8,625

(fc-1)(m-1)

5? = 5B =

9

Qs -Q4

= 0

,958; 5? -

Q4 57,473

т — 1

Влияние фактора А с достоверностью а признается значимым, если выполняется условие

52

50

где /1 = к — 1,/2 = (к — 1)(т — 1),Ъ(Д,/2) критическое значение критерия Фишера.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Используются оценки дисперсий для проверки условия при уровне значимости а = 0,05,/1 = 3, /2 = 9

19,99 > 3,86.

Таким образом, влияние фактора А с достоверностью а = 0,05 признается значимым.

Влияние фактора В с достоверностью а признается значимым, если выполняется условие

5|

^ > Ъ(Л,/2),

50

где /1 = к — 1,/2 = (к — 1)(т — 1),Ъ(Д,/2) критическое значение критерия Фишера.

Используются оценки дисперсий для проверки условия при уровне значимости а = 0,05, /1 = 3, /2 = 9

68,3625

3

к - 1 = 22,788.

3

= 19,158;

23,787 > 3,86. Таким образом, влияние фактора В с достоверностью а = 0,05 признается значимым.

Приведенный анализ предполагал независимость факторов А и В.

Для оценки влияния взаимодействия факторов А и В вычисляется дополнительная сумма

«■-ZU*2

¿7'

-VW

2

¿ = 1 7 = 1 V=1

где

Zj ZJ ZJ ~ v

¿ = 1 7 = 1 V=1

56384,9,

3

-1Y

3 V ^¿7'

17^

является средним из п параллельных наблюдений, т.е. при каждом сочетании факторов А и В на уровнях А;, В; соответственно необходима серия наблюдений Х;д, х^2, ..., ху„.

Для оценки влияния взаимодействия факторов А и В вычисляется дисперсия

Q5 - nQ1 56384,9 - 3 • 18691,71

шк(п - 1)

16 • 2

- 9,68,

и проверяется значимость взаимодействия факторов А и В критерием

п5? 52

> ^(Д,/"2),а = 0,05,/1 - (к - 1)(ш - 1) - 9,/2 - шк(п - 1) - 32.

В исследуемом процессе выполняется условие 3 • 0,958

-= 0,2969 < 2,5.

9,68

Таким образом, можно сделать вывод, что взаимодействие факторов А и В является фактором незначимым для урожайности.

Немаловажную роль в исследованиях специалиста - агронома имеет корреляционный анализ. Корреляционный анализ позволяет оценить силу

влияния заданного фактора на изучаемый процесс [1,2,3].

Задача исследования состояла в том, чтобы выяснить, урожайность каких сельскохозяйственных культур в Самарской области наиболее зависима от природных условий, т.е. от среднего значения температуры в вегетативный период и от среднего значения количества осадков в этот же период. Данные представлены в таблице 4.

к

44

3

m

п

AB

Таблица 4

Средняя урожайность культур, природные условия_

Год Средняя урожайность в ц/га Природные условия

Яровая Подсол- Овощи Овес Среднее значе- Среднее значе-

пшеница нечник ние температуры воздуха (апрель/сентябрь) ние количества осадков (апрель/сентябрь)

2005 8,7 8,9 272,39 10,5 16,1 29,3

2006 9,6 8,3 283,51 10,3 15,8 58,5

2007 11,4 8,2 273,20 12,6 16,4 57,2

2008 14,2 9,2 277,20 15,5 16,7 43,8

2009 13,1 8,6 271,90 17,2 16,6 32,9

2010 10,0 7,4 148,90 8,5 19,7 15,3

2011 16,3 12,0 230,30 19,6 16,1 75,6

2012 13,5 12,4 262,10 13,4 18,5 35,0

2013 16,1 14,9 255,40 14,2 17,2 58,2

2014 17,5 11,9 263,00 16,9 16,5 10,1

2015 14,5 11,1 257,40 17,6 17,0 11,5

Пусть У1 - средняя урожайность яровой пшеницы, У? - средняя урожайность подсолнечника, У3 - средняя урожайность овощей, У4 - средняя урожайность овса, - среднее значение температуры воздуха, X? - среднее значение количества осадков.

Анализ зависимости между случайными величинами У1 и Х1, У1 и X? с одновременной оценкой степени неслучайности их совместного изменения есть корреляционный анализ. Изменение случайной величины У1 , соответствующее изменению случайной величины (или X?), разбивается на две составляющие - стохастическую, связанную с неслучайной зависимостью У1 от (или X?), и случайную, связанную со случайным характером поведения У1 и (или X?). Стохастическая составляющая связи между У1 и (или X?) характеризуется коэффициентом корреляции. Коэффициент корреляции показывает, насколько связь между случайными величинами близка к строго линейной. Следует помнить, что коэффициент корреляции не учитывает возможной криволинейной связи между случайными величинами.

Выборочной оценкой коэффициента корреляции является случайная величина

=

ЕГ=1(*1 - x)(yt - у)

где

1 1 п х = —У ; у = — У у;; п — объем выборки. =1 =1 При малых объемах выборки (п < 15) лучшей оценкой коэффициента корреляции является оценка [5]

=

1 +

1

2(п - 3)

ryi,Zi,Z2

ГУ1,Ж1 + ГУ1,Ж2

Выборочный коэффициент корреляции для

переменных у и

-3,3708

г =

:= -0,099.

-^13,4856 • 85,9819 Оценка коэффициента корреляции 1 - 0,009801

1 +

г* = -0,099

= -0,105.

2(11 - 3)

Проверяется нулевая гипотеза о равенстве нулю модуля коэффициента корреляции Н0: |р| = 0 при альтернативной гипотезе Ях: |р| Ф 0.

Корреляция между случайными величинами признается значимой, если |г| > га, где га - критическое значение.

Критическое значение г0,05;11 = 0,602. Таким образом, |—0,0991 < 0,602, что говорит о том, что гипотеза о значимости корреляции между случайными величинами у и отклоняется.

Выборочный коэффициент корреляции для переменных у и Х2

29,8165

= 0,0467.

=

^4742,948 • 85,9819 Оценка коэффициента корреляции 1 - 0,0021801

г* = 0,0467

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1+

= 0,0496.

2(11 — 3)

Критическое значение г0,05;11 = 0,602. Таким образом, |0,0496| < 0,602, что говорит о том, что гипотеза о значимости корреляции между случайными величинами У1 и X? отклоняется.

Используя множественную корреляцию, установим существенность взаимосвязи переменной У1 с совокупностью переменных X?. Выборочный множественный коэффициент корреляции определим через парные коэффициенты корреляции

• у ту ту

2 'У1,Ж1 'Х2,У1

1- 2

-1" Xi,X2

0,009801 + 0,00218089 - 2 • (-0,099) • 0,0467 • (-0,432)

1 - 0,1868

= 0,0098,

с учетом того, что

2

109,288

^13,4856 • 4742,948

- -0,432.

Для проверки гипотезы Н0: |р| = 0 при альтернативной гипотезе Я1: |р| Ф 0 используется

статистика

F -

Г V

к

1

'У1,Ж1,Ж2

к - 1

где к - число переменных.

Расчетное значение статистики 0,0098 11 — 3 F =---= 0,03968.

1 — 0,0098 3 — 1

Критическое значение статистики ^,05;8;3 = а726.

Таким образом, F < F0,05.8.3 и соответствующая корреляция признается незначимой.

Таким образом, делается вывод о том, что между средней урожайностью яровой пшеницы и погодными факторами: температурой воздуха и количеством осадков, нет тесной линейной зависимости.

Аналогично устанавливается корреляционная зависимость между случайными величинами

У2,У3,У4 и'^1,^2.

Проведенный анализ дает возможность сделать вывод, что линейная зависимость между погодными факторами, которые определяет температура воздуха и среднее количество осадков, и урожайностью сельскохозяйственной культуры, наблюдается только у овощей.

Рассмотренные методы дисперсионного и корреляционного анализа позволяют выявить наличие связи между случайными величинами и оценить силу этой связи. Кроме решения перечисленных задач, на практике часто представляет интерес функциональный вид связи между случайными величинами. Следует помнить, что любая функция распределения полностью определяется своими параметрами [3,5]. Изменение функции распределения случайной величины Y от случайной величины X, заданной зависимостью = /(х),

где - среднее значение переменной Y, называется регрессией Y по X.

Цель регрессионного анализа состоит в объяснении поведения зависимой переменной У. Методы регрессионного анализа позволяют выбрать математическую модель и оценить адекватность отражения моделью установленной взаимосвязи случайных величин.

По выборочным данным можно найти только оценку истинной регрессии, содержащую ошибку, связанную со случайностью выборки. В основе регрессионного анализа лежит принцип наименьших квадратов, в соответствии с которым в качестве уравнения регрессии выбирается функция, доставляющая минимум сумме квадратов отклонений 5 = £"=1[у — /С^)]2. Вид функции /(х) определяется исходя из общего графического анализа зависимости между Y и X .

Схема регрессионного анализа включает в себя: нахождение выборочной оценки истинной регрессии, оценки статистической значимости выборочной регрессии в сравнении с безусловным разбросом значений уг, характеризующимся дисперсией, определение доверительных областей с заданной вероятностью включающих в себя истинную регрессию.

В качестве примера, рассмотрим построение множественных регрессионных моделей, показывающих зависимость урожайности сельскохозяйственных культур Самарской области от погодных условий в виде среднего значения температуры воздуха и среднего значения количества осадков в вегетативный период.

Корреляционный анализ позволил сделать вывод о том, что урожайность овощей имеет линейную зависимость от погодных условий. Таким образом, регрессионная модель примет вид у3 = + ^2х1 + ^3х2 + Методом наименьших квадратов получим оцененное уравнение множественной линейной регрессии у3 = /?1 + /?2х1 + /?3х2. Согласно методу наименьших квадратов составляется система нормальных уравнений, которая позволят определить оценки параметров уравнения регрессии, соответствующие минимальным отклонениям

V/?1+/?2 Vх:

п

п

=1 =1 п

Уз¿

V + / V х? + / V Xl¿X2¿ - V

=1 п

=1 п

=1 п

+//2 Vхl¿х2¿ + //3 - V:

=1 =1 =1 =1

У3¿X2

Согласно данным таблицы 4 составляется система нормальных уравнений

11/?1 + 186,6/?2 + 427,4/?3 = 2795,30 186,6/?1 + 3178,9/?2 + 7140,97/?3 = 47086,39 1427,40/?1 + 7140,97/?2 + 3178,9/?3 = 110623,3 = 663,476 /?2 = —24,24 /?3 = 0,047.

VTi,X2

=1

п

п

п

=1

п

V

Оцененное уравнение регрессии примет вид у3 = 663,476 — 24,24х1 + 0,047х?.

Далее, следует выяснить какая часть дисперсии переменной у3, объясняется оцененным уравнением регрессии, т.е. определить коэффициент детерминации Д?

р? = ^(уз)

7агОзУ

где 7аг(у3) и 7аг(у3) - выборочные дисперсии, которые вычисляются по формуле

7аг(уз) = — У(уз; — Уз)2, ^аг(;уз) п

=1

п

=1

Учитывая данные таблицы 5, определяют коэффициент детерминации Д ?.

Таблица 5

Урожайность овощей согласно эмпирическим данным и согласно данным модели

y3i 272,39 283,51 273,2 277,2 271,9 148,9 230,3 262,1 255,4 263,0 257,4

y3i 274,59 283,23 268,63 260,73 262,64 186,67 276,76 216,68 249,3 263,9 251,9

Выборочные дисперсии равны

14204 8180,863 ^аг(уз) = = 1291,27; 7аг(уз) =---

= 743,715.

Тогда коэффициент детерминации Д?

, 743,715 Д? = = 0,576,

1291,27

т.е. 57,6% дисперсии у3 объясняется оцененным уравнением регрессии.

Скорректированный коэффициент детерминации Д? рассчитывают по формуле

3—1

= 0,576 --(1 — 0,576)

11 — 3

= 0,47,

где Д? - коэффициент детерминации, п - число наблюдений, к - число коэффициентов в модели. Уменьшение значения скорректированного коэффициента детерминации может указывать на то, что одна из переменных в модели незначимо влияет на уз .

Высокий скорректированный коэффициент детерминации Д?^ не говорит о том, что верно выявлена причинно - следственная связь между переменными и не гарантирует отсутствия смещения оценок из-за некорректной спецификации.

Поэтому стоить обращать внимание на другие характеристики качества уравнения регрессии.

Согласно предпосылкам модели, случайные ошибки характеризуются постоянным разбросом или постоянной дисперсией, и данную дисперсию необходимо оценить, так как дисперсия - это характеристика влияния случайных факторов модели.

Несмещенная оценка дисперсии случайных ошибок с? имеет вид

<г2 = S2 = —У е.2 = —— • 6099,163 п - kZj i 11-3

Стандартная ошибка регрессии вычисляется по формуле

Sff = V^2 =

п - k

= 27,63.

=1У-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п

=1

N

Стандартная ошибка регрессии измеряет среднюю величину ошибки модели. Данная характеристика точности модели позволяет сравнивать между собой разные модели. Чем меньше стандартная ошибка регрессии, тем лучше модель, т.е. модель точнее.

Достоверность модели также оценивается по средней ошибке аппроксимации

|у3; — урз; I 1

-—— • 100% = — • 0,78649 • 100% уз 11

= 7,14 %.

Модели, имеющие среднюю ошибку аппроксимации менее 5%, считаются хорошими, менее 15% - удовлетворительными, а более 15% - неудовлетворительными.

Следует провести тестирование некоторых гипотез о качестве модели.

Начинают с теста на значимость коэффициента регрессии.

Рассматриваемая модель

уз = & + &х1 + £зх? + £-.

Тестируемая гипотеза Я0: = 0 - коэффициент при переменной х1 равен нулю, т.е. переменная х1 не оказывает значимого влияния на переменную у3.

Альтернативная гипотеза Я1: Ф 0, т.е. переменная х1 оказывает значимое влияние на переменную у3.

На первом шаге тестирования значимости коэффициента регрессии необходимо вычислить

расчетное значение - статистики

&

к 11

=1

= 762,39,

где ЛП^^? - сумма квадратов остатков, п -число наблюдений, к - число коэффициентов в модели.

Несмещенная оценка дисперсии 5? используется для расчета стандартных ошибок коэффициентов и стандартной ошибки регрессии.

^расч

^расч

S£(/?J

-24,24

= -3,23

5Я(/?2) 7,5 где 5Я(/?2) стандартная ошибка коэффициен-

та /?2, которая определяется по формуле =

М

52

ПХ1 i

762,39

13,4856

= 7,5.

2

i

2

На втором шаге выбирается уровень значимости, т.е. вероятность ошибки первого рода, вероятность отклонить гипотезу Я0, если на самом деле она верна (а = 0,05).

На третьем шаге определяют критическое значение статистики из таблиц - распределения Стьюдента [4], которое зависит от уровня значимости а и числа степеней свободы, которое равно (п —к)

С™ = 2,37, а = 0,05, п — к = 8.

кр ' ' ' '

На четвертом шаге сравнивается расчетное и критическое значение £ - статистик. Если | £расч | <

^ п_к

—24,24 — 2,37 • 7,5 < &2

£кр, то гипотезу Я0 нет оснований отклонить. В этом случае делают вывод о том, что переменная х1 не оказывает значимого влияния на переменную у3. Коэффициент при переменной х1, в данном случае, незначим.

В рассматриваемом случае |£расч| > £кр, следовательно, переменная х1 оказывает существенное влияние на переменную у3 .

Доверительный интервал для оценки коэффициента регрессии строится согласно формуле

</5к + *п-к-5Е(/к),

< -24,24 + 2,37 • 7,5,

42,015 < / < -6,47,

где /?к - оценка коэффициента &к, £п_ к - табличное значение статистики, 5Я(/?к) - стандартная ошибка коэффициента /?к.

Доверительный интервал - это интервал, внутри которого истинное значение оцениваемого коэффициента & находится с некоторой заданной вероятностью.

Аналогично оценивается параметр &3.

Тестируемая гипотеза Я0: &3 = 0. Альтернативная гипотеза Я^ &3 Ф 0.

Расчетное значение критерия &3 0,047

^расч

5£'(/?3) 0,0058

- 0,81,

где

5Я(/?з) -

N

52

- х2)

N

762,39

4742,948

^ПЯГЧ 1 < ti

- 0,0058.

сле-

В рассматриваемом случае г расЧ| < - кр довательно, переменная х2 не оказывает существенное влияние на переменную у3.

Доверительный интервал для оценки коэффициента регрессии строится согласно формуле &3 — ^0,05;8 • 5Е(Д,) < /?3 < /?3 + ¿0,05;8 • 5Е(Д,), 0,047 — 2,37 • 0,0058 < &3

< 0,047 + 2,37 • 0,0058, 0,033 < &3 < 0,06, где &3 - оценка коэффициента &3, £0,05;8 - табличное значение статистики, 5Я(/?3) - стандартная ошибка коэффициента &3.

В случае множественной регрессии недостаточно тестировать гипотезу для отдельной переменной. Возникает необходимость тестирование значимости уравнения в целом. Рассматриваемая модель

У3 = + &2Х1 + &3Х2 +

Тестируемая гипотеза Я0: &2 = &3 = 0, т.е. переменные х1, х2 не оказывают значимого влияния на переменную У3 или факторы, включенные в модель не существенны.

Альтернативная гипотеза Я1: хотя бы одна из переменных х1, х2 оказывает значимое влияние на переменную У3 .

Алгоритм проведения теста следующий.

На первом шаге вычисляется расчетное значение F статистики

Д2

V - к

F - ■

Fpac4 1 - Д2 к - 1,

0,576 11 -3

F ----

Грасч 1 - 0,576 3 -1

- 5,43,

где Д2 - коэффициент детерминации, п - число наблюдений модели, к - число коэффициентов модели.

На втором шаге выбирается уровень значимости а = 0,05.

На третьем шаге находится критическое значение F - статистики из таблиц F - распределения Фишера [4], которое зависит от уровня значимости а и числа степеней свободы, которые равны (п — к) и (к — 1)

Fкр = 4,46.

На четвертом шаге сравниваются расчетное и критическое значение F - статистик. Если ^расч < Fкр, то нулевая гипотеза Я0 не отклоняется, т.е. все переменные х1, х2 не оказывают значимого влияния на переменную У3 . В данном случае уравнение регрессии называется незначимым.

Так как Fрасч > Fф, то уравнение регрессии называется значимым.

Полученная модель удовлетворительная, чтобы модель была хорошая, изменяются значения параметров, стоящих при переменных х1, х2 в пределах найденных интервалов для &2 и &3 с целью улучшения качества модели. Особое внимание уделяется изменению параметра &2, которое имеет наибольшую значимость в построенной модели.

Аналогично строятся и оцениваются модели регрессии, показывающие зависимости изменения средних значений переменных У1, У2, У4 от изменения значений регрессоров х1, х2 .

Таким образом, в работе рассмотрены методы математической статистики, имеющие наибольшее значение в практической деятельности агронома - это методы дисперсионного, корреляционного и регрессионного анализов.

Список литературы

1. Ван дер Варден Б.Л. Математическая статистика / Пер. с нем.-М.: ИЛ, ИЛ, 1960.- 436 с.

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Закс Л. Статистическое оценивание / Пер. с нем.-М.: Статистика, 1976.- 598 с.

3. Крамер Г. Математические методы статистики / Пер. с англ.-М.: Мир, 1975.- 648 с.

4. Келли Т.Л. Статистические таблицы / Пер. с англ..-М.: ВЦ АН СССР, 1966.- 193 с.

5. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работни-ков.-М.: ФИЗМАТЛИТ, 2006.-816 с.

Кэд1р М.Ф.

магистрант Эсембаева Э.Р. магистрант Алпысбаева Б.Е. доктор PhD Калкозова Ж.К. к.ф.-м.н.

Казахский национальный университет им. аль-Фараби, г.Алматы, Казахстан

ФОРМИРОВАНИЕ АНОДНОГО ОКСИДА АЛЮМИНИЯ И ИХ СТРУКТУРНЫЕ

ОСОБЕННОСТИ

FORMATION OF ANODIC ALUMINUM OXIDE AND THEIR STRUCTURAL FEATURES

Kadir M.F.

undergraduate Assembayeva A.R. undergraduate Alpysbaeva B.E. Doctor PhD Kalkozova Zh.

Candidate of Physical and Mathematical Sciences Al-Farabi Kazakh National University, Almaty, Kazakhstan

АННОТАЦИЯ

Наноструктурные пленки на основе Al2O3 были получены методом электрохимического анодирования, а так же исследованы их структурные свойства. В ходе экперимента были определены оптимальные параметры процесса анодирования. В результате изменения данных параметров были получены пленки наноструктурными порами различных величин.

ABSTRACT

Nanostructured films AbO3 were obtained by different acids with using anodizing process and their structural features were observed. Indicated the optimal parameteres of the anodizing process for nanostructured.

Ключевые слова: процесс электрического анодирования, наноструктурные поры, электролит, пористый оксид алюминия.

Keyword: electrochemical anodizing process, nanostructured pore, electrolyte, porous aluminum oxide.

Благодаря своим структурным особенностям наноструктурные пористые пленки на основе оксида алюминия используются в различных отраслях техники: в особенности в качестве чувствительных слоев и покрытии для сенсорных устройств [1-3]. Нанопористые пленки на основе оксида алюминия формируются в результате электрохимического травления подложки алюминия в разных кислотах [4]. Нанопоры полученные таким путем имеют такие качества как, высокая упорядоченность пор, высокая пористость, самая простая технология получения [5,6]. А так же, благодаря контролю электрофизических, механических, температурных, коррозионных свойств и геометрических параметров (диаметр и длина) такие материалы широко преминяются в отраслях современной микроэлектроники: микробиологии, производстве датчиков газа, и используются в качестве матрицы для осаждения частиц. Можно достичь самой высокой чувствительности данных

датчиков путем вариации технологических параметров и определения оптимальных параметров формирования пор.

Чувствительный элемент датчика состоит из подложки алюминия с нанопористым оксидным слоем [7 - 9].

Пористые оксидные анодированные пленки могут формироваться на таких материалах (подложках) как, кремний, фосфид индия, титан, ниобий, тантал и т.д. Но самым перспективным материалом для формирования нанопористых структур является алюминий [10]. По сравнению с сапфиром, SiзN4 , с оксидом кремния преимуществом пористого оксида алюминия является высокая технологичность и низкая стоимость [11]. Анодированный оксид алюминия обладает наноразмер-ной ячеисто - пористой структурой, высокой механической прочностью, особенными диэлектрическими и оптическими свойствами. Изменяя условия анодирования можно получить пористый

i Надоели баннеры? Вы всегда можете отключить рекламу.