Научная статья на тему 'Алгоритм расчета величин смещений у коэффициентов линейной и параболической регрессионных зависимостей, получаемых традиционным методом наименьших квадратов при метрологической аттестации средств измерений'

Алгоритм расчета величин смещений у коэффициентов линейной и параболической регрессионных зависимостей, получаемых традиционным методом наименьших квадратов при метрологической аттестации средств измерений Текст научной статьи по специальности «Математика»

CC BY
113
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННЫЕ ЗАВИСИМОСТИ / REGRESSIONAL RELATIONSHIPS / ОЦЕНКИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ / LEAST SQUARE METHOD ESTIMATES / СМЕЩЕНИЕ ОЦЕНОК / ДОПУСТИМЫЕ ПОГРЕШНОСТИ ИЗМЕРЕНИЙ НЕЗАВИСИМОЙ (ВХОДНОЙ) ПЕРЕМЕННОЙ / ALLOWABLE INACCURACY OF INDEPENDENT (INPUT) VARIABLE MEASUREMENTS / ESTIMATION BIAS

Аннотация научной статьи по математике, автор научной работы — Исаев А. Б., Алнадфа А., Халаби С. М.

При проведении метрологической аттестации образцовых средств измерений (СИ) нельзя пренебречь погрешностью образцовых СИ, поскольку она сравнима с погрешностью аттестуемых СИ. Этот факт вызывает появление значительного смещения (систематической погрешности) у оценок традиционного метода наименьших квадратов. На примере линейной и параболической аппроксимирующих регрессионных зависимостей получены аналитические выражения для количественных оценок смещений у оценок традиционного метода наименьших квадратов для параметров этих регрессионных зависимостей как функций допустимых случайных погрешностей измерений входной переменной (входного сигнала). Введены заранее задаваемые верхние границы величин смещений у параметров линейной и параболической восстанавливаемых функциональных регрессионных зависимостей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Исаев А. Б., Алнадфа А., Халаби С. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithm for bias of coefficients of linear and parabolic regression relationships obtained using conventional least square method in metrological certification of instrumentation

Metrological certification of calibration instruments cannot neglect inaccuracy of calibration instruments as it is comparable to the inaccuracy of the instruments under certification. This fact causes considerable bias (systematic inaccuracy) of estimates obtained using the conventional least square method. In terms of the linear and parabolic approximating regressional relationships, the analytical expressions are derived for quantitative estimation of bias of values obtained by the conventional least square method for the parameters of the regressional relationships as functions of allowable random error in measurement of input variable (input signal). The author introduces predefined upper limits for bias of the parameters of linear and parabolic recovering functional regressional relationships.

Текст научной работы на тему «Алгоритм расчета величин смещений у коэффициентов линейной и параболической регрессионных зависимостей, получаемых традиционным методом наименьших квадратов при метрологической аттестации средств измерений»

- © А.Б. Исаев, А. Алнадфа,

С.М. Халаби, 2015

УДК

А.Б. Исаев, А. Алнадфа, С.М. Халаби

АЛГОРИТМ РАСЧЕТА ВЕЛИЧИН СМЕЩЕНИЙ У КОЭФФИЦИЕНТОВ ЛИНЕЙНОЙ И ПАРАБОЛИЧЕСКОЙ РЕГРЕССИОННЫХ ЗАВИСИМОСТЕЙ, ПОЛУЧАЕМЫХ ТРАДИЦИОННЫМ МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ ПРИ МЕТРОЛОГИЧЕСКОЙ АТТЕСТАЦИИ СРЕДСТВ ИЗМЕРЕНИЙ

При проведении метрологической аттестации образцовых средств измерений (СИ) нельзя пренебречь погрешностью образцовых СИ, поскольку она сравнима с погрешностью аттестуемых СИ. Этот факт вызывает появление значительного смещения (систематической погрешности) у оценок традиционного метода наименьших квадратов. На примере линейной и параболической аппроксимирующих регрессионных зависимостей получены аналитические выражения для количественных оценок смещений у оценок традиционного метода наименьших квадратов для параметров этих регрессионных зависимостей как функций допустимых случайных погрешностей измерений входной переменной (входного сигнала). Введены заранее задаваемые верхние границы величин смещений у параметров линейной и параболической восстанавливаемых функциональных регрессионных зависимостей. Ключевые слова: регрессионные зависимости, оценки метода наименьших квадратов, смещение оценок, допустимые погрешности измерений независимой (входной) переменной.

При метрологической аттестации определяют реальные значения метрологических характеристик (МХ) конкретного, аттестуемого экземпляра средств измерений (СИ), и получать эти метрологические характеристики стремятся в реальных условиях эксплуатации СИ или, по крайней мере, максимально к ним приближенным.

Так, при получении реальной статистической характеристики преобразования (например, градуированной характеристики) реальные условия эксплуатации СИ как раз и характеризуется наличием погрешностей измерений как на входе, так и на выходе аттестуемого СИ.

Предположение об измерении одной из величин с пренебрежимо малыми погрешностями сильно идеализирует реальную ситуацию, особенно при отсутствии соответствующих образцовых средств. Кроме того, во многих случаях в процессе аттестации приходится определять зависимости метрологических характеристик от влияющих факторов. Эти зависимости определяются по результатам совместных измерений и использованием метода наименьших квадратов (МНК). Однако применение этого метода для получения достоверных и эффективных оценок зависимостей требует выполнения следующих условий:

• одна из переменных (например, аргумент) измеряется с пренебрежимо малыми погрешностями, т.е. погрешность измерения второй переменной (функции) имеет нормальное распределение с математическим ожиданием равным нулю;

• результаты измерений статически независимы.

При аттестации прецизионной аппаратуры с помощью каких-либо образцовых средств измерений, пренебречь погрешностью образцовых СИ невозможно, так как она соизмерима с погрешностью аттестуемых СИ, т.е. [Ах] ~ [х]. Тем самым нарушается первая из предпосылок успешной применимости МНК, что неизбежно приведет к появлению систематических погрешностей у оценок МНК, т.е. к заметной смещенности его оценок.

Рассмотрим линейную модель у = а0 + а1 х где у и х - полученные экспериментальные данные; а0, а1 - МНК оценки истинных параметров модели а0а1, и получим аналитические зависимости между величинами Дх и 8а0, 8а1, где 8а0 и 8а1 обозначены смещения оценок, т.е. 8а0 = Ма0 - а0,8а1 = Ма1 - а1. Пусть истинное значение х. будет ^ т.е. х: = + Ах;, где х. - измеренное значение независимой переменной, фактически получаемое экспериментатором в 2-й точке (хотя он полагает, что получает х. =

Следует подчеркнуть, что экспериментатор ошибочно полагает М {х;} = , тогда как на самом деле М {х;} ^ , т.е. М {Ах;} ^ 0 , где М {х;} означает операцию взятия математического ожидания величины х.. Так как

( N N N N Л N / N ч2

§0 = [1уI*? -£уЛ£х I/ N£ х2 -(£х

V 1=1 1=1 1=1 1=1 ) 1=1 V 1=1 или используя для компактности обозначения сумм Гаусса

N N N N

£х, = [х],£х2 =[х2],= [у],£ху =[ху] 1=1 1=1 1=1 1=1 и т.д. получаем

а0 ={[У][ х2 ]-[ ху ][ х ]} / ^ [х2 ]-[х]2}. (1)

Подставив в (1) х1 = - Ах;, придем к выражению

а = [ у Е2 ] - [ у£Е] + 2[ у ][ Ах^] - [ у Ах Е] + [ у ][ Ах2 ] - [ у Ах][ Ах ] - [ у^][ Ах ] 0 N [^2] - [^]2 + N [Ах2] - [Ах ]2 + 2N [Дх£] - 2[Ах Е] . (2)

Но (1) можно представить в виде а0 = а0н + 8а0 , где а0 н = {[ у ]-[ у / {N [^ ]-[^} -

несмещенная часть оценки параметра а0, которая получается при условии Дх = 0, т.е. совпадения измеренного значения с истинным.

Если в (2) заменить все Дх. на Ах; = (0 < а < 1), то придем к

а = [ у Е2 ] + 2[ у ][ Ах^] + [ у Ах2 ] - [ у^Е] - [ уд Ах ] - [ у Ах Е] - [ уАх ][ Ах] =

0 N Г ] + 2а^2 ] + а2 N ] - [^]2 - 2а[^]2 - а[^]2

= ([ у Е2] - [ у Ж])(1 + а)2 = [ у Е2] - [ у Ж] (N Г] - Ш1 + а)2 N [^2] - [^]2 ,

т.е. а0 = а0н и, следовательно, 8а0 = 0 , смещение а0 отсутствует. Этот результат понятен на интуитивном уровне, так как а0 - параметр сдвига - равняется

координате прямой линии регрессии при х = 0, т.е. a0 = у(0), и аргумент х, если можно так сказать, не присутствует в этой точке (Дх(0) = а0 = 0). Рассмотрим МНК оценку для a1

- = N ху ] - [ у ][ х]

1 N [ х2] - [ х ]2 (3)

Проделав аналогичные математические операции для этой оценки, получим

(N [ у£] - [ у № + а) = 1

= —

1 (N[f] - [^]2)(1 + а)2 1Н 1 + а (4)

Sa1 = M(a1 - a1) = [а / (1 + а)] a1. (5)

Видно, что МНК оценка для a1 из (3) , является смещенной, и смещение может быть равно а / (1 + а) .

Теперь можно ответить на вопрос, при каких погрешностях аргумента можно использовать обычный МНК и пренебречь смещением у a1, а при каких погрешностях х смещение будет велико, и необходимо изменить алгоритм обработки или компенсировать смещение с помощью (5)?

Выражая величину Sa1 в долях a1, полагая Sa1 = ka1,0 < k < 1 и требуя, чтобы смещение не превосходило некоторого k0a1 (k0 = 0,005;0,1;...) , из (5) получаем неравенство, связывающее предельно допустимое смещение коэффициента a1 с предельно допустимой погрешностью измерения

x(а / (1 + а))a1 < k0a1 ^ а / (1 + а) < k0 . Решив, получим

а < k0/(1 + k0) (6)

Если эксперимент допускает 8ä1 < 0,01a1 (Sa = 1%) , то, как нетрудно получить из (6), а < 0,011. Таким образом, если требования к эксперименту допускают систематическую погрешность, обусловленную смещением a1 до 1%, то МНК можно применять лишь при условии: Дх; < 0,011^., или Дх; < 1,1%. Рассмотрим далее полиномиальную регрессию второго порядка

y = a0 + a1 x + a2x2 .

Оценки МНК для параметров этой модели будут

2

„ = N [yx2 ] [x2 ] - [yx2 ] [x]2 - [y] [x2 ]2 + [yx] [x2 ] [x] + [y][x][x3 ] - N[x3 ][yx]

a2 = N[x2][x4] - [x4][x]2 + 2[x3][x2][x] - N[x3]2 - [x2]3 ; (7)

N [ xy ] - [ x][ y ] - a2( N[ x3] - [ x2][ x ]) N [ x2] - [ x]2

(8)

a = [y] - a1[x] - a2[x ]; (9)

a0 = N ' ()

Подставив в (7) xi = + Дк1, Дк1 = , получим

a1 =

Эо =

(N [ у ] ] - [ у ] ] - [ у ] ]2 + [ у ] [¡] + [ у ЕЕ2 ] - N [¡3 ][ у ¡])(1 + а)4 N[¡2 Е4 ] - Г Е]2 + 2[|3 Е2 Е] - N[¡3 ]2 - [¡2 ]3)(1 + а)

2" (1 + а)2 (10)

[8а2] = а2н(а2 + 2а)/(1 + а2), где значение а2Н ясно из (10).

Аналогично, подставив в (8) Дх; = и х: = + Дх; и положив

а = N [¡у ] - [¡][ у ] - а2н (N [^3] - ГЕ]) Й1Н N [¡2] - [¡]2 ,

получим

„ N(1 + а)[^у] - (1 + аЕ][у] - (1 + а)-2 а2н N[(1 + а)3 ¡3 ] - [(1 + а)2 ¡2 ][(1 + а)£]|

(11)

N [(1 + а)2 ¡2] - [(1 + а)

а2 Н

(1 + а)3(N[у£] - [¡][у]) - а2н(1 + а)3(N[¡3] - [¡¡2Щ 1

= а1н"

(1 + а)4(N¡2] - [¡]2) 1н 1 + а

Так же находим оценку а0 . Введем предварительно аон = {[у] - аш[¡] - а2н[¡2]1/ N , (13)

т.е. а0н = а0 (х = ¡), и получим, учтя (10), (12):

- = [ у ] - аш (1 + а)-1(1 + а)[ ¡] - а2 н (1 + а )-2(1 + а)2[ ¡2] = [ у ] - аш [ ¡] - а2 н [ ¡2] = а° = N ~ N "а

(14)

т.е. а° = а°н и а° оценка несмещенная, как и для линейной модели. Оценки а1, а2 смещены

Ма1 = а1н /(1 + а) ; (15)

Ма2 = а2н /(1 + а)2 , (16)

где а1н, а2 н (10), (11).

На основании (15) и (16) приходим к следующим неравенствам:

п^й ^ а „ а2 + 2а

0 < §а1 < --а1< §а2 < --"2 а2.

1 + а (1 + а)

Аналогично, как и ранее, требуется, чтобы смещение оценок а1 и а2 не превосходило соответствующих величин к0а1 и к0а2, получим неравенства, связывающие предельно допустимые смещения коэффициентов а1 и а2 с допустимыми погрешностями измерения аргумента х:

а / (1 + а) < к0 ^ а < к0(к0 -1);

<-1 1/(1 - к0) <-1 + ^ 1/(1 - к0)'

а

(а2 + 2а)/(1 + а)2 < к0 ^ ^ —_' (17)

В качестве а, характеризующего предельно допустимую погрешность измерения х, следует, естественно, выбрать второй, наибольший корень.

Таким образом, в каждом случае, прежде чем воспользоваться МНК для обработки данных, необходимо определять требуемую точность получаемой модели (оценивать систематический эффект неадекватности) и, используя неравенства (6), (17), рассчитывать допустимые погрешности измерения независимой переменной.

Используя предложенную методику, можно обобщать полученные результаты на любой вид аппроксимирующей модели, коэффициенты которой можно определять с помощью МНК.

Однако следует отметить, что если попытаться обобщить полученные в статье результаты на стандартную модель многофакторной регрессии, то мы неизбежно столкнемся с серьезными вычислительными трудностями, и объем вычислений быстро возрастает по мере увеличения числа факторов многофакторной регрессии У = X— + Ду , где X - матрица плана эксперимента, Ду -суммарные погрешности измерения величины у, — - вектор параметров (см. формулы (2) и (3)).

При использовании в расчетах величин —0, — 1 компонент вектора параметров, даваемых (2) и (3),легко видеть, что число простейших арифметических операций (сложение, вычитание, деление) может возрасти в десятки раз при неоднократно встречающихся в этом случае операциях с матрицами (умножение, нахождение обратных матриц и т.д.). Мы не приводим здесь в силу его громоздкости аналитического выражения для смещения у вектора — многофакторной регрессии [1], содержащего двойные и тройные произведения матриц X и матриц погрешностей Ду, но легко видеть, что получение точности результатов даже порядка нескольких процентов (см. (6), (7), (15-17)) приводит к катастрофической потере требуемой точности (1-5%) уже при перемножении и вычислении обратных матриц с матрицами третьего порядка и выше.

В этом случае, там, где это возможно, использовать результаты нашей статьи, касающиеся линейной и параболической однофакторных регрессий (см. [1], [2]).

_ СПИСОК ЛИТЕРАТУРЫ

1. Hodges S.D., Moore P.G. Date uncertainties and l.s. regression // Applied statistics, 1972, vol. 21, № 2.

2. Исаев А.Б., Алнадфа А. Итерационно-взвешенный алгоритм построения линейной разделяющей функции регрессии в задаче классификации образов, признаки которых отягощены погрешностями измерений // Горный информационно-аналитический бюллетень. -2015. - № 5. - C. 336-341. [¡233

КОРОТКО ОБ АВТОРАХ_

Исаев А.Б.1 - профессор, Финансовый университет при правительстве РФ,

e-mail: a.borisovich@mail.ru,

Халаби С.М.1 - кандидат технических наук,

Алнадфа А.1 - аспирант, e-mail: antwan.tiger@gmail.com,

1 РУДН.

UDC

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ALGORITHM FOR BIAS OF COEFFICIENTS OF LINEAR AND PARABOLIC REGRESSION RELATIONSHIPS OBTAINED USING CONVENTIONAL LEAST SQUARE METHOD IN METROLOGICAL CERTIFICATION OF INSTRUMENTATION

Isaev A.B.1, Professor, Financial University under the Government of Russian Federation,

e-mail: a.borisovich@mail.ru,

Khalabi S.M.1, Candidate of Technical Sciences,

Alnadfa A.1, Graduate Student, e-mail: antwan.tiger@gmail.com,

1 Peoples' Friendship University of Russia, 113093, Moscow, Russia.

Metrological certification of calibration instruments cannot neglect inaccuracy of calibration instruments as it is comparable to the inaccuracy of the instruments under certification. This fact causes considerable bias (systematic inaccuracy) of estimates obtained using the conventional least square method. In terms of the linear and parabolic approximating regressional relationships, the analytical expressions are derived for quantitative estimation of bias of values obtained by the conventional least square method for the parameters of the regressional relationships as functions of allowable random error in measurement of input variable (input signal). The author introduces predefined upper limits for bias of the parameters of linear and parabolic recovering functional regressional relationships.

Key words: regressional relationships, least square method estimates, estimation bias, allowable inaccuracy of independent (input) variable measurements.

REFERENCES

1. Hodges S.D., Moore P.G. Date uncertainties and l.s. regression. Applied statistics, 1972, vol. 21, no 2.

2. Isaev A.B., Alnadfa A. Gornyy informatsionno-analiticheskiy byulleten'. 2015, no 5, pp. 336-341.

УМНАЯ КНИГА - ПРЕДМЕТ ПЕРВОЙ НЕОБХОДИМОСТИ_

Я ТЕБЕ НЕ ВЕРЮ (продолжение)

Приведу типичный диалог между инвестором и квалифицированным издателем:

Инвестор: «Что-то дорогая книга получилась, я этого не ожидал. Наверное, прибыль огромная».

Издатель: «Прибыли от твоей книги вообще нет. Пока. Наоборот, нам пришлось вложить в нее свои немалые средства. Ты же видел финансовый отчет, там указаны расходы, вплоть до самых незначительных».

Инвестор: «Буду я еще разбираться в ваших бумагах. Там сам черт ногу сломит. К тому же бумага все стерпит».

Издатель: «Сложного в отчете ничего нет. Да мы с тобой в начале проекта, до подписания договора, все это уже обговорили. Можно было оценить расходы и доходы от продаж заранее. Что же ты раньше молчал?»

Инвестор: «Вначале надо было мне все объяснить популярно, мне ваши издательские хитрости непонятны».

Издатель: «Подожди! Перед каждой технологической операцией я тебя спрашивал, нужна ли она? Называл ее стоимость, трудоемкость и квалификацию исполнителя. Ты соглашался, а теперь капризничаешь».

Продолжение на с. 388

i Надоели баннеры? Вы всегда можете отключить рекламу.