ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.233.5
Н.Н. Щелканов
НОВЫЙ МЕТОД РАЗДЕЛЕНИЯ ФИЗИЧЕСКОЙ ВЕЛИЧИНЫ НА ДВЕ КОМПОНЕНТЫ
Предложен новый метод нахождения коэффициентов линейной регрессии уравнения 1 = K0+K1X+K2Г с учетом случайных погрешностей физических величин 1, X и Г. Метод позволяет получать устойчивые и физически корректные коэффициенты регрессии К0 , К1 и К2 вне зависимости от используемого массива данных.
Ключевые слова: итерационный метод, линейная регрессия, случайные погрешности.
Обычно для разделения физической величины 1 на две компоненты (X и Г) используется статистический метод, основанный на линейном множественном регрессионном анализе массива экспериментальных данных [1]. В этом случае уравнение регрессии для величины 1 записывается в виде
где К0, К1, К2 - эмпирические коэффициенты, определяемые по статистическим характеристикам массивов 1, X, и Г.
Однако статистический метод, основанный на линейном множественном регрессионном анализе, имеет существенные недостатки. Во-первых, даже при отсутствии случайных погрешностей во входных величинах X и Г коэффициенты регрессии зависят от их диапазона изменчивости. Во-вторых, наличие случайных погрешностей во входных величинах X и Г приводит к занижению коэффициентов регрессии К1, К2 и завышению К0, причем чем больше эти величины случайных погрешностей, тем меньше К1, К2 и больше К0.
В [2-4] представлена обобщенная формула, позволяющая находить коэффициенты регрессии линейного уравнения Г = К0 + К1X для общего случая, когда разброс точек в корреляционной связи величин X и Г обусловлен как их случайными погрешностями измерений, так и неконтролируемыми физическими факторами. Формула имеет вид
г = Ко+^+к2г,
(1)
aX А 2pXГ
А _ В В А
(2)
где
(3)
<5]( и стГ - среднеквадратические отклонения величин X и Г; р^ - коэффициент корреляции между X и Г; бх- и 5Г - случайные среднеквадратические погрешности измерения X и Г для рассматриваемого массива данных.
1. Постановка задачи
Решается задача нахождения коэффициентов К0 К1, К2 уравнения (1), в котором 1 = 10+г, X=X0+х, Г = Г0+у, где 10, X0 и Г0 - случайные величины не подверженные случайным погрешностям, г, у и х - случайные погрешности. Разброс точек в корреляционной связи величин 1, X и Г обусловлен как случайными погрешностями, так и неконтролируемыми параметрами. Случайные погрешности г, у и х имеют СКО равные 52, 5Г и 5^ которые представляют собой случайные среднеквадратические погрешности величин 1, Г и X. Предполагается, что величины 1, Г и X не коррелируют с погрешностями г, у и х; погрешности г, у и х не коррелируют между собой.
2. Новый метод разделения на компоненты
В предлагаемом методе разделения на компоненты используется обобщенная формула линейной регрессии (2). Для нахождения коэффициентов регрессии уравнения (1) применяется численный итерационный метод [5-7]. Процедура вычисления коэффициентов регрессии заключается в следующем.
Задается один из коэффициентов регрессии уравнения (1), например К1, и находится среднеквадратическое отклонение разницы в = 1 _ КX _ К0
7р - -\]а2 + К1 <5X 2К1515Xрж
где и Сх- - среднеквадратические отклонения величин 1 и X, а р^ - нормиро
ванный коэффициент корреляции между 1 и X.
Далее находится нормированный коэффициент корреляции в с Г
Р1Г _ KlрXГ 5 X
ррг
(5)
где р1Г и р^ - нормированные коэффициенты корреляции между 1Г и XX
Затем вычисляется случайная среднеквадратическая погрешность величины в
5р - л/5! + К1 5X
и коэффициент регрессии
5в В1
К -
1
5Г А1 2ррГ
А _ В
В1 А1
А _ В
В1 А1
+4р,
РГ
(6)
(7)
где
А1 — а 1 |рвг|
1 _8?Д
1 _82А
В1 -
в
1 _|ррг|-
1 _8^ 52
1 _5?/'
5
(8)
5Г - случайная среднеквадратическая погрешность измерения величины Г, сг -среднеквадратическое отклонение величины Г.
Полученное значение коэффициента регрессии К2 используется для нахождения среднеквадратического отклонения разницы д = 1 - К2Г _ К0
— 452 + К2 5Г 2К2515Г р1Г ;
(9)
коэффициента корреляции д с X
Новый метод разделения физической величины на две компоненты
127
р — рZX51 К2р^5Г . (10)
рц^ _ ; (10)
случайной среднеквадратической погрешности величины д
5ц--М + К22 5Г (11)
и коэффициента регрессии
^ Вг.
5X А2 2р,
где А2 —
1 _р
MX|
¥Шг ■ В2 —. 1 _ы.
1 _52/ ст2
52
(13)
X
1 _5^/а^ ’ 2 \ 1 1 _52г/с
б*- - случайная среднеквадратическая погрешность измерения величины X .
Затем полученное значение коэффициента регрессии К1 подставляется в (4) и процедура нахождения коэффициентов К1 и К2 продолжается до выполнения условий
|К1,И_1 _ К1,и| <01, К2,т_1 _ К2,т\<02, (14)
где 01 и 02 _ некоторые наперед заданные числа, определяющие погрешность вычисления коэффициентов К1 и К2, т _ количество итераций.
Далее находится коэффициент регрессии К0 по известной формуле
к0 — I _ к X _ к2Г , (15)
где 1, X, Г _ средние значения физических величин 1, X и Г.
Заключение
Предложен новый метод разделения физической величины на компоненты с учетом случайных погрешностей измеряемых величин, который позволяет получать устойчивые и физически корректные коэффициенты регрессии независимо от используемого массива данных. Предложенный метод может быть использован в работах [8-12].
ЛИТЕРАТУРА
1. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
2. Щелканов Н.Н. Построение регрессионной зависимости между аэрозольными оптическими толщами атмосферы с учетом их случайных погрешностей // II заседание Рабочей группы проекта «Аэрозоли Сибири». Тез. докл. Томск: ИОА СО РАН, 1995. С. 16.
3. Щелканов Н.Н. Обобщенный метод построения линейной регрессии и его применение для построения однопараметрических моделей аэрозольного ослабления // Оптика атмосферы и океана. 2005. Т. 18. № 1-2. С. 86-90.
4. Щелканов Н.Н. Новый метод нахождения коэффициентов линейной регрессии между двумя физическими величинами // Вестник ТГУ. Управление, вычислительная техника и информатика. 2010. № 4 (13). С. 91-96.
5. Щелканов Н.Н. Итерационный метод разделения коэффициентов ослабления на две компоненты // Аэрозоли Сибири. XIII Рабочая группа: тез. докл. Томск: Изд-во ИОА СО РАН, 2006. С. 58.
6. Shchelkanov N.N. Iterative method of separation of the extinction coefficients into two components // Proc. of SPIE - The International Society for Optical Engineering. 200б. V. 6522. 65221O. 5p.
7. Shchelkanov N.N. Comparison of two methods of separation of the extinction coefficients into components // XIV Int. Symp. «Atmospheric and Ocean Optics. Atmospheric Physics»: Abstracts. Tomsk: IAO SB RAS, 2007. P. 159, 160.
8. Рублев А.Н., Григорьев Г.Ю., Удалова Т.А., Журавлева Т.Б. Регрессионные модели для оценки углеродного обмена в бореальных лесах // Оптика атмосферы и океана. 2010. Т. 23. № 01. С. 21-26.
9. Лысенко С.А., Кугейко М.М. Методика определения концентрации респирабельной фракции атмосферного аэрозоля по данным трехчастотного лидарного зондирования // Оптика атмосферы и океана. 2010. Т. 23. № 02. С. 149-155.
10. Лысенко С.А., Кугейко М.М. Восстановление оптических и микрофизических характеристик поствулканического стратосферного аэрозоля из результатов трехчастотного лидарного зондирования // Оптика атмосферы и океана. 2011. Т. 24. № 04. С. 308-318.
11. Афонин С.В. Апробация способа восстановления АОТ над сушей но спутниковым измерениям MODIS в ИК-диапазоне спектра // Оптика атмосферы и океана. 2011. Т. 24. № 08. С. 703-705.
12. Абдуллаев С.Ф., Назаров Б.И., Салихов Т.Х., Маслов В.А. Корреляции температуры нри-земной атмосферы и оптической толщи аридного аэрозоля по данным AERONET // Оптика атмосферы и океана. 2012. Т. 25. № 05. С. 428-433.
Щелканов Николай Николаевич
Институт оптики атмосферы им. В.Е. Зуева СО РАН, Томск
E-mail: snn@iao.ru Поступила в редакцию 25 мая 2012 г.
Shchelkanov Nikolai N. (Zuev Institute of Atmospheric Optics of the SBRAS). A new method for dividing a physical parameter into components.
Keywords: iterative method, linear regression, random errors.
A new method is proposed for determining the linear regression coefficients of the equation Z = Ko+KX+^Y taking into account random errors of the physical parameters Z, X and Y. The method allows obtaining the stable and physically correct regression coefficients K0, Kl and K2 independently on the considered data array.