Научная статья на тему 'Новый метод разделения физической величины на две компоненты'

Новый метод разделения физической величины на две компоненты Текст научной статьи по специальности «Математика»

CC BY
122
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИТЕРАЦИОННЫЙ МЕТОД / ЛИНЕЙНАЯ РЕГРЕССИЯ / СЛУЧАЙНЫЕ ПОГРЕШНОСТИ / ITERATIVE METHOD / LINEAR REGRESSION / RANDOM ERRORS

Аннотация научной статьи по математике, автор научной работы — Щелканов Николай Николаевич

Предложен новый метод нахождения коэффициентов линейной регрессии уравнения Z = K 0+KX+K 2Y с учетом случайных погрешностей физических величин Z, X и Y. Метод позволяет получать устойчивые и физически корректные коэффициенты регрессии K0, K1 и K2 вне зависимости от используемого массива данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A new method for dividing a physical parameter into components

A new method is proposed for determining the linear regression coefficients of the equation Z = K0+KX+K2Y taking into account random errors of the physical parameters Z, X and Y. The method allows obtaining the stable and physically correct regression coefficients K0, K1 and K2 independently on the considered data array.

Текст научной работы на тему «Новый метод разделения физической величины на две компоненты»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2013

Управление, вычислительная техника и информатика

№ 4(25)

УДК 519.233.5

Н.Н. Щелканов

НОВЫЙ МЕТОД РАЗДЕЛЕНИЯ ФИЗИЧЕСКОЙ ВЕЛИЧИНЫ НА ДВЕ КОМПОНЕНТЫ

Предложен новый метод нахождения коэффициентов линейной регрессии уравнения 1 = K0+K1X+K2Г с учетом случайных погрешностей физических величин 1, X и Г. Метод позволяет получать устойчивые и физически корректные коэффициенты регрессии К0 , К1 и К2 вне зависимости от используемого массива данных.

Ключевые слова: итерационный метод, линейная регрессия, случайные погрешности.

Обычно для разделения физической величины 1 на две компоненты (X и Г) используется статистический метод, основанный на линейном множественном регрессионном анализе массива экспериментальных данных [1]. В этом случае уравнение регрессии для величины 1 записывается в виде

где К0, К1, К2 - эмпирические коэффициенты, определяемые по статистическим характеристикам массивов 1, X, и Г.

Однако статистический метод, основанный на линейном множественном регрессионном анализе, имеет существенные недостатки. Во-первых, даже при отсутствии случайных погрешностей во входных величинах X и Г коэффициенты регрессии зависят от их диапазона изменчивости. Во-вторых, наличие случайных погрешностей во входных величинах X и Г приводит к занижению коэффициентов регрессии К1, К2 и завышению К0, причем чем больше эти величины случайных погрешностей, тем меньше К1, К2 и больше К0.

В [2-4] представлена обобщенная формула, позволяющая находить коэффициенты регрессии линейного уравнения Г = К0 + К1X для общего случая, когда разброс точек в корреляционной связи величин X и Г обусловлен как их случайными погрешностями измерений, так и неконтролируемыми физическими факторами. Формула имеет вид

г = Ко+^+к2г,

(1)

aX А 2pXГ

А _ В В А

(2)

где

(3)

<5]( и стГ - среднеквадратические отклонения величин X и Г; р^ - коэффициент корреляции между X и Г; бх- и 5Г - случайные среднеквадратические погрешности измерения X и Г для рассматриваемого массива данных.

1. Постановка задачи

Решается задача нахождения коэффициентов К0 К1, К2 уравнения (1), в котором 1 = 10+г, X=X0+х, Г = Г0+у, где 10, X0 и Г0 - случайные величины не подверженные случайным погрешностям, г, у и х - случайные погрешности. Разброс точек в корреляционной связи величин 1, X и Г обусловлен как случайными погрешностями, так и неконтролируемыми параметрами. Случайные погрешности г, у и х имеют СКО равные 52, 5Г и 5^ которые представляют собой случайные среднеквадратические погрешности величин 1, Г и X. Предполагается, что величины 1, Г и X не коррелируют с погрешностями г, у и х; погрешности г, у и х не коррелируют между собой.

2. Новый метод разделения на компоненты

В предлагаемом методе разделения на компоненты используется обобщенная формула линейной регрессии (2). Для нахождения коэффициентов регрессии уравнения (1) применяется численный итерационный метод [5-7]. Процедура вычисления коэффициентов регрессии заключается в следующем.

Задается один из коэффициентов регрессии уравнения (1), например К1, и находится среднеквадратическое отклонение разницы в = 1 _ КX _ К0

7р - -\]а2 + К1 <5X 2К1515Xрж

где и Сх- - среднеквадратические отклонения величин 1 и X, а р^ - нормиро

ванный коэффициент корреляции между 1 и X.

Далее находится нормированный коэффициент корреляции в с Г

Р1Г _ KlрXГ 5 X

ррг

(5)

где р1Г и р^ - нормированные коэффициенты корреляции между 1Г и XX

Затем вычисляется случайная среднеквадратическая погрешность величины в

5р - л/5! + К1 5X

и коэффициент регрессии

5в В1

К -

1

5Г А1 2ррГ

А _ В

В1 А1

А _ В

В1 А1

+4р,

РГ

(6)

(7)

где

А1 — а 1 |рвг|

1 _8?Д

1 _82А

В1 -

в

1 _|ррг|-

1 _8^ 52

1 _5?/'

5

(8)

5Г - случайная среднеквадратическая погрешность измерения величины Г, сг -среднеквадратическое отклонение величины Г.

Полученное значение коэффициента регрессии К2 используется для нахождения среднеквадратического отклонения разницы д = 1 - К2Г _ К0

— 452 + К2 5Г 2К2515Г р1Г ;

(9)

коэффициента корреляции д с X

Новый метод разделения физической величины на две компоненты

127

р — рZX51 К2р^5Г . (10)

рц^ _ ; (10)

случайной среднеквадратической погрешности величины д

5ц--М + К22 5Г (11)

и коэффициента регрессии

^ Вг.

5X А2 2р,

где А2 —

1 _р

MX|

¥Шг ■ В2 —. 1 _ы.

1 _52/ ст2

52

(13)

X

1 _5^/а^ ’ 2 \ 1 1 _52г/с

б*- - случайная среднеквадратическая погрешность измерения величины X .

Затем полученное значение коэффициента регрессии К1 подставляется в (4) и процедура нахождения коэффициентов К1 и К2 продолжается до выполнения условий

|К1,И_1 _ К1,и| <01, К2,т_1 _ К2,т\<02, (14)

где 01 и 02 _ некоторые наперед заданные числа, определяющие погрешность вычисления коэффициентов К1 и К2, т _ количество итераций.

Далее находится коэффициент регрессии К0 по известной формуле

к0 — I _ к X _ к2Г , (15)

где 1, X, Г _ средние значения физических величин 1, X и Г.

Заключение

Предложен новый метод разделения физической величины на компоненты с учетом случайных погрешностей измеряемых величин, который позволяет получать устойчивые и физически корректные коэффициенты регрессии независимо от используемого массива данных. Предложенный метод может быть использован в работах [8-12].

ЛИТЕРАТУРА

1. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.

2. Щелканов Н.Н. Построение регрессионной зависимости между аэрозольными оптическими толщами атмосферы с учетом их случайных погрешностей // II заседание Рабочей группы проекта «Аэрозоли Сибири». Тез. докл. Томск: ИОА СО РАН, 1995. С. 16.

3. Щелканов Н.Н. Обобщенный метод построения линейной регрессии и его применение для построения однопараметрических моделей аэрозольного ослабления // Оптика атмосферы и океана. 2005. Т. 18. № 1-2. С. 86-90.

4. Щелканов Н.Н. Новый метод нахождения коэффициентов линейной регрессии между двумя физическими величинами // Вестник ТГУ. Управление, вычислительная техника и информатика. 2010. № 4 (13). С. 91-96.

5. Щелканов Н.Н. Итерационный метод разделения коэффициентов ослабления на две компоненты // Аэрозоли Сибири. XIII Рабочая группа: тез. докл. Томск: Изд-во ИОА СО РАН, 2006. С. 58.

6. Shchelkanov N.N. Iterative method of separation of the extinction coefficients into two components // Proc. of SPIE - The International Society for Optical Engineering. 200б. V. 6522. 65221O. 5p.

7. Shchelkanov N.N. Comparison of two methods of separation of the extinction coefficients into components // XIV Int. Symp. «Atmospheric and Ocean Optics. Atmospheric Physics»: Abstracts. Tomsk: IAO SB RAS, 2007. P. 159, 160.

8. Рублев А.Н., Григорьев Г.Ю., Удалова Т.А., Журавлева Т.Б. Регрессионные модели для оценки углеродного обмена в бореальных лесах // Оптика атмосферы и океана. 2010. Т. 23. № 01. С. 21-26.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Лысенко С.А., Кугейко М.М. Методика определения концентрации респирабельной фракции атмосферного аэрозоля по данным трехчастотного лидарного зондирования // Оптика атмосферы и океана. 2010. Т. 23. № 02. С. 149-155.

10. Лысенко С.А., Кугейко М.М. Восстановление оптических и микрофизических характеристик поствулканического стратосферного аэрозоля из результатов трехчастотного лидарного зондирования // Оптика атмосферы и океана. 2011. Т. 24. № 04. С. 308-318.

11. Афонин С.В. Апробация способа восстановления АОТ над сушей но спутниковым измерениям MODIS в ИК-диапазоне спектра // Оптика атмосферы и океана. 2011. Т. 24. № 08. С. 703-705.

12. Абдуллаев С.Ф., Назаров Б.И., Салихов Т.Х., Маслов В.А. Корреляции температуры нри-земной атмосферы и оптической толщи аридного аэрозоля по данным AERONET // Оптика атмосферы и океана. 2012. Т. 25. № 05. С. 428-433.

Щелканов Николай Николаевич

Институт оптики атмосферы им. В.Е. Зуева СО РАН, Томск

E-mail: snn@iao.ru Поступила в редакцию 25 мая 2012 г.

Shchelkanov Nikolai N. (Zuev Institute of Atmospheric Optics of the SBRAS). A new method for dividing a physical parameter into components.

Keywords: iterative method, linear regression, random errors.

A new method is proposed for determining the linear regression coefficients of the equation Z = Ko+KX+^Y taking into account random errors of the physical parameters Z, X and Y. The method allows obtaining the stable and physically correct regression coefficients K0, Kl and K2 independently on the considered data array.

i Надоели баннеры? Вы всегда можете отключить рекламу.