Научная статья на тему 'НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ ПАРНОЙ ОДНОПАРАМЕТРИЧЕСКОЙ РЕГРЕССИИ В УСЛОВИЯХ НЕДОСТАТКА СТАТИСТИКИ'

НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ ПАРНОЙ ОДНОПАРАМЕТРИЧЕСКОЙ РЕГРЕССИИ В УСЛОВИЯХ НЕДОСТАТКА СТАТИСТИКИ Текст научной статьи по специальности «Математика»

CC BY
100
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАМЕТРИЧЕСКАЯ РЕГРЕССИЯ / НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ / МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ / ДИСПЕРСИЯ / НЕСМЕЩЁННАЯ ОЦЕНКА / СОСТОЯТЕЛЬНАЯ ОЦЕНКА / PARAMETER REGRESSION / NONLINEAR ESTIMATION / EXPECTATION / VARIANCE / UNBIASED ESTIMATE / CONSISTENT ESTIMATE

Аннотация научной статьи по математике, автор научной работы — Гетманская Ирина Васильевна

Параметрическая регрессия - это математическая модель какого-либо явления в виде функциональной зависимости между параметрами этого явления, одни из которых зависимая переменная и независимые аргументы функции, а другие её неизвестные оцениваемые параметры. Так как измерения зачастую отягощены погрешностями, то построение модели проводят в вероятностной схеме постановки задачи, а оценки неизвестных параметров осуществляются статистическими методами с помощью оценочных уравнений. Для нелинейной регрессии, не являющейся внутренне линейной, оценочные уравнения относительно оцениваемого параметра аналитически не решаются. В этом случае пользуются методами итерации, результативность которых зависит от начального приближения. Для обобщённого минимально-контрастного оценивания нелинейной однопараметрической парной (одного аргумента) регрессии существует итерационная формула. Её составляющие - реализации оцениваемого параметра регрессии, найденные аналитически или численно по функции регрессии при измеренных значениях зависимой переменной и независимого аргумента без учёта ошибок измерения. Средняя этих реализаций с определённой точностью приближения является состоятельной оценкой, что ранее доказано с помощью найденных числовых характеристик реализаций. Эту оценку можно использовать в качестве начальной в итерационной формуле оценивания параметрической регрессии. В данной работе рассматривается реализация оцениваемого параметра с приближённо нулевой дисперсией не только как начальное приближение, но и как самодостаточная оценка, если её точность удовлетворительная. Она - приближение оцениваемого параметра известной точности соразмерной кубу среднеквадратичного отклонения исходных данных. Приведенные в работе результаты имитационного эксперимента оценивания параметров регрессий предлагаемым методом приближения и с помощью состоятельной оценки согласуются с теоретическими обоснованиями методов. Их сравнение в пользу приближения, если объём исходных данных меньше десяти. При этом, отклонение от истинного значения оцениваемого параметра меньше отклонения сравниваемой состоятельной оценки максимум на два порядка (в 188 раз) минимум в 1,5 раза. Условия оптимальности метода предполагает его использование в исследованиях редких явлений, а также в дорогостоящих экспериментах в широком (экономическом и гуманитарном) смысле этого слова. Результативность метода оценивания можно предвосхитить, проверив до опыта выполнение условий формирования оценки, которые зависят от диапазона значений аргумента функции регрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NONLINEAR ESTIMATION STEAMY ONE-PARAMETER REGRESSION IN TERMS OF LACK OF STATISTICS

Parametric regression is a mathematical model of a phenomenon in the form of functional dependence between the parameters of this phenomenon, one of which is a dependent variable and independent arguments of a function, and the other is its unknown estimated parameters. Since measurements are often burdened with errors, the construction of the model is carried out in the probabilistic scheme of the problem statement, and the estimates of unknown parameters are carried out by statistical methods using evaluation equations. For a nonlinear regression that is not intrinsically linear, the estimated equations with respect to the estimated parameter are not analytically solved. In this case, iteration methods are used, the effectiveness of which depends on the initial approximation. There is an iterative formula for generalized minimal-contrast estimation of non-linear one-parameter pair (one argument) regression. Its components are the implementations of the estimated regression parameter found analytically or numerically by the regression function at measured values of the dependent variable and the independent argument without taking into account the measurement errors. The average of these realizations with a certain approximation accuracy is a consistent estimate, which was previously proved by the numerical characteristics of the realizations found. This estimate can be used as an initial estimate in an iterative parametric regression estimation formula. In this paper, the implementation of the estimated parameter with approximately zero variance is considered not only as an initial approximation, but also as a self-sufficient estimate, if its accuracy is satisfactory. It is an approximation of the estimated parameter of known accuracy proportional to the cube of the standard deviation of the initial data. The results of the simulation experiment for estimating regression parameters by the proposed approximation method and by means of a consistent assessment are consistent with the theoretical descriptions of the methods. Their comparison is in favor of approximation, if the volume of the original data is less than ten. In this case, the deviation from the true value of the estimated parameter is less than the deviation of the compared state estimate by a maximum of two orders of magnitude (188 times) by at least 1.5 times. Conditions of optimality of the method assumes its use in studies of rare phenomena, as well as in expensive experiments in the broad (economic and humanitarian) sense of the word, he effectiveness of the evaluation method can be anticipated by checking to experience the fulfillment of the conditions of evaluation formation, which depend on the range of values of the argument of the regression function.

Текст научной работы на тему «НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ ПАРНОЙ ОДНОПАРАМЕТРИЧЕСКОЙ РЕГРЕССИИ В УСЛОВИЯХ НЕДОСТАТКА СТАТИСТИКИ»

Сск 10.36724/2409-5419-2020-12-3-54-62

НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ ПАРНОЙ ОДНОПАРАМЕТРИЧЕСКОЙ РЕГРЕССИИ В УСЛОВИЯХ НЕДОСТАТКА СТАТИСТИКИ

ГЕТМАНСКАЯ Ирина Васильевна

Сведения об авторе:

к.т.н., доцент Московского технического университета связи и информатики, г. Москва, Россия, getmi@mail.ru

АННОТАЦИЯ

Параметрическая регрессия - это математическая модель какого-либо явления в виде функциональной зависимости между параметрами этого явления, одни из которых зависимая переменная и независимые аргументы функции, а другие её неизвестные оцениваемые параметры. Так как измерения зачастую отягощены погрешностями, то построение модели проводят в вероятностной схеме постановки задачи, а оценки неизвестных параметров осуществляются статистическими методами с помощью оценочных уравнений. Для нелинейной регрессии, не являющейся внутренне линейной, оценочные уравнения относительно оцениваемого параметра аналитически не решаются. В этом случае пользуются методами итерации, результативность которых зависит от начального приближения. Для обобщённого минимально-контрастного оценивания нелинейной однопараметрической парной (одного аргумента) регрессии существует итерационная формула. Её составляющие - реализации оцениваемого параметра регрессии, найденные аналитически или численно по функции регрессии при измеренных значениях зависимой переменной и независимого аргумента без учёта ошибок измерения. Средняя этих реализаций с определённой точностью приближения является состоятельной оценкой, что ранее доказано с помощью найденных числовых характеристик реализаций. Эту оценку можно использовать в качестве начальной в итерационной формуле оценивания параметрической регрессии. В данной работе рассматривается реализация оцениваемого параметра с приближённо нулевой дисперсией не только как начальное приближение, но и как самодостаточная оценка, если её точность удовлетворительная. Она - приближение оцениваемого параметра известной точности соразмерной кубу среднеквадратичного отклонения исходных данных. Приведенные в работе результаты имитационного эксперимента оценивания параметров регрессий предлагаемым методом приближения и с помощью состоятельной оценки согласуются с теоретическими обоснованиями методов. Их сравнение в пользу приближения, если объём исходных данных меньше десяти. При этом, отклонение от истинного значения оцениваемого параметра меньше отклонения сравниваемой состоятельной оценки максимум на два порядка (в 188 раз) минимум в 1,5 раза. Условия оптимальности метода предполагает его использование в исследованиях редких явлений, а также в дорогостоящих экспериментах в широком (экономическом и гуманитарном) смысле этого слова. Результативность метода оценивания можно предвосхитить, проверив до опыта выполнение условий формирования оценки, которые зависят от диапазона значений аргумента функции регрессии.

КЛЮЧЕВЫЕ СЛОВА: параметрическая регрессия; нелинейное оценивание; математическое ожидание; дисперсия; несмещённая оценка; состоятельная оценка.

Для цитирования: ГетманскаяИ.В. Нелинейное оценивание парной однопараметрической регрессии в условиях недостатка статистики // Наукоемкие технологии в космических исследованиях Земли. 2020. Т. 12. № 3. С. 54-62. СЫ: 10.36724/2409-5419-2020-12-3-54-62

Введение

В наукоёмких технологиях, как правило, решаются задачи построения математических моделей различных явлений в виде функциональной зависимости их числовых параметров. Существует два подхода такого построения: геометрический или, исходя из теории описываемого явления. Примерами геометрического подхода могут служить аппроксимация линейными и нелинейными функциями при построении моделей геофизических [1], биологических [2] процессов, для решения задач экономического и эколого-экономического содержания [3, 4] и многих других. Формирование моделей с применением методов дифференциального и интегрального исчисления таких явлений как, процессов в химическом реакторе [5], электромагнитное излучение полупроводниковых материалов [6, 7] или свободное падение сферы в несжимаемой Ньютоновой жидкости [8, С.35],— примеры второго подхода.

Построенная с точностью до неизвестных параметров модель может быть использована для их оценки по значениям известных параметров. Например, в диагностике полупроводниковых материалов с помощью модели их катодолюминесцентного излучения [6, 7] по измерениям интенсивности излучения и энергии падающих электронов можно оценить параметры полупроводниковой мишени.

Зачастую измерения отягощены ошибками из-за неточности измерительного прибора, а модель, ввиду неучтённых факторов, может содержать систематические ошибки. Поэтому, в модель вносят случайную составляющую, и её построение проводят в вероятностной схеме постановки задачи, а уточнение и использование — статистическими методами [8-11].

1. Постановка задачи

Чтобы установить связь между зависимой Y е Т с Ж и независимой переменной х е К с Ж, в предположении того, что У имеет случайный разброс, возможная модель зависимости переменных —

У = г (х) + 8. (1)

Здесь 8 е Ж — случайная ошибка, г (х) — регрессия, которая по определению1 — условное математическое ожидание

г(х) =Е [У/х]

случайной величины У, при условии, что х принимает какое-либо случайное или неслучайное значение. В работе предполагается, что х неслучайная (детерминированная) величина. Из определения г (х) и (1) следует, что

Е [8 /х] = Е [8] = 0. (2)

'Боровков А.А. Математическая статистика, 3-е изд. М.: Физматлит, 2007. C.282

Если вид регрессии г (х) = г (х, 6) определён с точностью до неизвестного параметра 6 е Ж, то функцию г (х, 6) называют параметрической регрессией, а параметр 6 — регрессионным коэффициентом (РК).

Наблюдаемое в ^м эксперименте значение величины У обозначают у. и называют откликом при заданном значении фактора х . е Ж, где у. = (г (х., 6) + 8.) е Ж , 8. — значение случайной величины 8.

Согласно (2) величина 8 центрированная. Допустим, что она равноточная с дисперсией

Гаг [8/х] = Гаг [8] = с2. (3)

В перечисленных условиях задача регрессионного анализа — это оценка неизвестного значения РК 6 по п независимым наблюдениям (х., у), / = 1, п отклика и фактора.

К классическим методам оценивания РК относится метод максимального правдоподобия, который можно использовать, если известен закон распределения случайной погрешности 8. В случае, когда этот закон нормальный, результат метода максимального правдоподобия — оценочное уравнение РК, реализующее метод наименьших квадратов (МНК).

Современный подход состоит в использовании методов, основанных на более общих предположениях относительно случайных величин [12-15]. В регрессионном анализе к ним относится метод минимально контрастного оценивания параметрической регрессии [13], включающий в себя, как элемент многообразия, оценку МНК, семейство оценок Мешалкина, медианную оценку, каждая из которых имеет свои условия оптимальности.

Если модель нелинейная и не является внутренне линейной (внешне нелинейной, трансформирующейся) функцией [16], то оценочное уравнение явно не решается относительно оцениваемого параметра. В этом случае модель можно линеаризовать, что «...часто приносит значительно больше потерь, чем выгод» [10]. В связи с этим, получили распространение итерационные методы, сходимость которых зависит от «удачного выбора начального приближения оцениваемого параметра» [11]. Так, в работе [16] в качестве предварительной оценки для одношаговых итерационных процедур Ньютоновского типа оценивания регрессионных моделей рассматриваются явные состоятельные оценки. Для итерационной формулы минимально контрастного оценивания параметра парной регрессии рассматривается состоятельное начальное приближение, которое — средняя составляющих итерационную формулу. В работе [17] точность состоятельной оценки выше точности начального приближения работы2. В данной работе

2Гетманская И.В. Оптимизация минимально контрастного оценивания нелинейной однопараметрической пар-ной регрессии: Диссертация на соискание учёной степени кандидата технических наук. 2009. 121 с.

предлагается повысить точность начального приближения, выбрав в его качестве из составляющих формулу оценивания ту, дисперсия которой равна нулю.

2. Реализации регрессионного коэффициента

Предположим, что в своих областях определения однозначные функции у = г (х, 6) и 6 = 9(х,у) дважды дифференцируемы по 6 первая и по у вторая. Функция 0 = 0(х, у) неявно задана уравнением

а) функция регрессии у=г (х, 0) строго монотонная по 0,

б) существуют частные производные ге', ге"е, ге'де и q е ЭТ: q>0 и |ге'| > q, тогда РРК 0(х,у) в точке (х,у) еЛ — смещенная оценка истинного значения 6 с приближением смещения

2 п

М)

(ие))

у - г (х, 0) = 0.

Обозначим: —область определения функции

0 = 0(х,у): 5 = {(Х,у)е КхУ} с ЭТ2;

0 — область допустимых значений функции 0 = 0(х, у) : 5

(4)

А = {(х, у )еКхТ :| у - У (х )| = |е|< 1}сй2,

где е значение 8, У (х) = г (х,9) — уравнение линии уровня, при истинном значении 0, поверхности, заданной в декартовой системе координат Оху0 функцией 0 = 9(х, у);

Н — множество исходных данных оценивания:

Н = {{,У):(-Х,Уi) еКхУ,I = 1,п ^ \Н\= п;

С — множество реализаций РК (РРК):

Н п А п

с <=©,

С = {0- : 0- = 9Х, у), I = 1, т\, \с\=т (т < п).

Неслучайная функция 0(х,у) от случайного аргумента (вектора) (х,у) - случайная величина, что «.. .очевидно»3 и не требует доказательства. Поэтому значения РРК 9* = 6(х.,у.) закономерной функции от значений (х.,у.) случайного аргумента — значение случайной величины.

Далее приведены приближения математического ожидания и дисперсии РРК, метод получения которых представлен в работе [17] в виде доказательства двух теорем.

Теорема 1

Если в условиях постановки задачи в области К х © с ЭТ2:

Теорема 2

При выполнении условий теоремы 1 дисперсия РРК в точке (х, у) е Л приближённо равна

Var [6(х, у )]=;

(ге'(х,9))

Условия теоремы 1 возникли из теории представления функции 0 = 0(х, у) в окрестности точки (х, У (X)) формулой Тейлора. Согласно этой теории третье слагаемое

2

многочлена

■ееМ)

= о (е). Исходя из теории сравне-

2 (М)Г

ния функций для ее П(0, 5) из окрестности точки 0 достаточно малого радиуса

5 (0 < 5 < 1) |о(ек)| = |о(ек+1)| <х\£к+1|, X: 1е ЭТ, 0 < X< да.

Для ее и(0,1) в работе [18] найдено значение Х=1.

В результате условие выполнения теорем 1 и 2 приобретает удобную для практического применения форму: в точках (х, 6)еКх©сЭТ2, где 6 — истинное значение оцениваемого параметра, (х, у)е5пЛ

"ее (х,е)

(М))

< 2.

Согласно теоремам 1 и 2 и определения смещенной

оценки

е [е;]^е+,

где wi = w (,е) = -

Уаг [е-];

Теория вероятностей. М.: МГТУ им. Н.Э. Баумана. 1999. С. 222.

Кудрявцев Л.Д. Курс математического анализа. М.: Высш. шк., 1988. Т. 1. С. 295. 5Кудрявцев Л.Д. Курс математического анализа. М.: Высш. шк., 1988. Т. 1. С.220. бМатематическая статистика. М.: Изд-во МГТУ им. Н.Э.Баумана, 2001, С.56.

2

:

2

ст

Определим множества В, G следующим образом: В: В с Ж2, В с Нп А п 5", В — множество точек (х у), в которых выполняются условия теорем 1 и 2:

>ее(, 6)

((x ,0))3

(5)

G : G с ©, B-

f (x, У, )

+ G, J(xp y) = 0 (x, y)- w (x, 0),

где

'9) = -

>98 (1) 2 (8(,8));

3 ''

(6)

G = {(3; : êt =9'- wt, 9* e C, i = 1,1

| B | = | G | = l, (l < ш).

В работе [18] с точностью приближения о (е2) доказано, что V©; е С несмещенная оценка, то есть

E [èi] = 9,

и то, что ее дисперсия Var

(M))

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 '

(7)

(8)

3. Оптимизация оценивания регрессионного коэффициента

В качестве начального приближения итерационной формулы оценивания РК в работе2 использовалось среднее РРК:

e; = п-1 ze;

i =1

(9)

которое с точностью приближёния о(8) числовых характеристик является состоятельной оценкой РК2.

В работе [17] доказана состоятельность оценки РК средним элементов множества G

ё = 1 - X е,,

¡=1

точность приближения которой о(82) совпадает с точностью приближения числовых характеристик 9, и на порядок выше точности оценки (9).

Приведённые в работе [18] результаты вычислительного эксперимента оценивания РК согласуются с обосно-

ваниями оценивания, а именно, в множестве G приближённо несмещённых оценок РК оптимальными являются 9 к с наименьшими дисперсиями

k =Arg min Varl 9. I.

i:ê; eG L J

Поскольку оценки с приближённо нулевыми дисперсиями могут образовывать целое множество, то имеет смысл в качестве оптимальной выбрать, например, среднее его элементов.

4. Приближение РК

Обозначим:

G0 — множество несмещённых оценок РК с приближённо нулевой дисперсией, G0 ç G,

G0 ={èi : èi e G, Var[èi ] = o(e2 ), i =

lGol= П («o < l). Теорема 3

Если G0 Ф 0, то точечная оценка РК

9 = no1 I èi-i:9 ¡eGn

(10)

приближение РК точности о(82).

Доказательство. Равенство нулю дисперсии случайной величины является необходимым и достаточным условием того, что она не случайная, а закономерная величина (константа), с математическим ожиданием, равным этой константе.

Если дисперсия оценки РК равна нулю, то эта оценка не случайная, а закономерная, равная математическому ожиданию этой оценки. Поэтому, оценки 0, е С0 в рамках точности приближения о (е2) их дисперсий и математического ожидания, с нулевой дисперсией — закономерные величины, равные математическому ожиданию оценок Е | 0, | = 0 согласно (7). Таким образом, 9¡ = 9 + о(е2), то есть 91 — приближение 0.

Величина

0 = п-1 X 01= По"1 X(+о(е?)) = е+п-1 Хо(е?),

¡:0|еСо ¡=1 ' ¡=1

, "о / 2 ч

где «о X о (е I — среднее значение бесконечно малых

о (е2) = о (е2). Так как порядок среднего бесконечно малых не может быть меньше порядка малости самого значения о(82), то 0 = 9 + о(е2), что и требовалось доказать.

Аналогично условию (5) формирования множества G найдено условие формирования подмножества G0 с G:

2

ст

|re'(x ,9)|>|i,

(11)

■ = |о (б? )|<х-|б?| «х-

где J—, так как ---

((,е))2

после усреднения, а X = 1.

Полученные выводы проверены в численном (имитационном) эксперименте [19].

5. Численный эксперимент оценивания РК

В численном эксперименте, проводимом в компьютерной системе символьной математики MAPLE7, исходные данные оценивания (x , y ) е H параметрической регрессии моделировались по формуле (1) с заданными функциями регрессии r(x, 9) при заданном значении РК 9. В таблице приведены параметры и результаты 12-ти экспериментов оценивания РК регрессий вида:

r (х,9) = exp (х3/92),

г(Х,е)= g^-m)(х- l-expC-a-x)^, (13)

a-m

a

(12)

a = 6• п •p • 0/m.

Регрессия (12) является составляющей регрессионной модели интенсивности катодолюминесцентного излучения полупроводников в результате воздействия пучка электронов энергии x, где 9 — диффузионная длина неравновесных носителей заряда. Регрессия вида (13) -модель [8, С. 35] пройденного расстояния за время x сферой радиуса р массы m в результате свободного падения в несжимаемой жидкости вязкости 9, m0—масса жидкости, вытесняемой сферой.

Выборка объема n случайной величины 8 — значения е каждое из которых сумма значений трёх случайных величин: равномерного, нормального и показательного распределения, генерированных методом Монте-Карло, реализованным утилитой в системе MAPLE. Выборка

Б

Параметры экспериментов оценивания РК и абсолютные погрешности результатов

№ экс. Параметры и результаты

(a,b) 9 a? n e* - el m n0 le - el le - e|/k - e

1 (0,1, 1,5) 1 0,35 0,123 0,043 8 0,126 6 4 0,028 0,024 5,25

2 (0,1, 1,5) 1 0,52 0,27 0,14 8 0,13 4 3 0,039 0,026 5

3 (0,1, 1,5) 1 0,25 0,063 0,016 8 0,045 7 4 0,002 0,003 15

4 (0,01,1) 1 0,6 0,36 0,22 10 0,074 5 3 0,096 0,084 0,88

5 (0,05, 5) 4 0,78 0,6 0,47 6 0,26 4 3 0,014 0,011 23,6

6 (0,05, 5) 4 0,95 0,9 0,86 6 0,015 3 3 0,026 0,026 0,58

7 (0,05, 5) 4 0,597 0,356 0,21 6 0,113 4 3 0,001 0,0006 188,3

8 (1, 3) 2 0,64 0,41 0,26 7 0,036 7 5 0,025 0,024 1,5

9 (0,1, 8) 1 0,49 0,25 0,12 11 0,096 7 2 0,088 0,089 1,08

10 (1, 10) 0,7 0,215 0,046 0,0099 9 0,103 7 3 0,003 0,0028 36,7

11 (5, 20) 3 0,35 0,12 0,042 9 0,034 8 4 0,02 0,02 1,7

12 (5, 20) 3 0,29 0,082 0,024 7 0,215 7 2 0,07 0,025 8,6

7Говорухин В., Цибулин В. Компьютер в математическом исследовании: Учебный курс. СПб.: Питер, 2001. С.21.

8Гетманская И.В. Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии: Диссертация на соискание учёной степени кандидата технических наук. 2009, С.114.

центрировалась относительно средне выборочной

- П / ■ - - 2

8 = Е 8,- п, а именно, У i = 1,п 8. = 8. - 8. Значение с

¿=1 /

дисперсии 8 оценивалось исправленной выборочной дис-

„ _2 ^ «9 ^ 2

персией стЕ, являющейся состоятельной оценкой с ,

а.2

— \2

= (n -1)-1 1(8,--8)

i=1

Элементы множества С 9° = 9(х,, у1) находились, как решения уравнений (4) относительно 0 в области D = [6 - 6/2, 6 + 6/2] «предполагаемых» значе-

ний РК: D п©^0 .Для модели (12) 9(х, ^ ) = ,

S = {(х, y):(х < 0)л(у e(0,l))v( х > 0 )л(у > 1)) . Для модели (13) уравнение (4) относительно 9 аналитически не решается, поэтому оно решалось численным методом половинного деления, программно реализованным10 в среде MAPLE.

Мера множества РРК | С | = m, как правило, была меньше меры множества исходных данных оценивания | H | = n > m, так как зачастую 3 к: 1 < k < n, (x,, y) i S. Если уравнение (4) относительно 9 имело множество решений, то из него выбиралось одно, входящее в область «предполагаемых» значений D.

Оценки числовых характеристик РРК: w(x,, 9) и Var |§, J по формулам (6) и (8) соответственно, зависящих от оцениваемого параметра 9, проводились с его начальным приближением 9^, найденным по формуле (9). Множества B и G формировались на основании условия (5), а множество G0 — условия (11). Оценки точности приближения осущест-

влялись с помощью исправленных средне выборочных центральных моментов

|о(е*-1 )| = \й(е*)|<хИ яХ-а",

где X = 1, ак ~ .

В таблице сведены параметры и результаты оценивания РК модели (12) в экспериментах 1-8 и модели (13) в экспериментах 9-12.

На рис. 1 изображена модель 4-го, а на рис. 2-9-го экспериментов.

Столбцам таблицы соответствуют следующие параметры: 6 — истинное значение оцениваемого параметра,

_2

(а, й)еК — диапазон изменения значений фактора, о£, ое, и3 — исправленная средне выборочная дисперсия модельной погрешности е и её степени ^ и 3/2 соответственно, п, т, п0 — объёмы множеств Н, С, и G0.

Результаты оценивания приведены в виде абсолютных погрешностей начального приближения - э| по формуле (9) и оценки по формуле (10), а также их

отношений |б -0|/|б^ -б|.

Оценка по формуле (10) получена одношаговой итерацией, поэтому соответствующая формуле оценка состоит из двух результатов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сравнение результатов оценивания РК позволяет сделать вывод о целесообразности применения формулы (10) в условиях малых объёмов исходных данных оценивания, когда п < 10.

Так, в 4-м эксперименте оценка начального приближения по формуле (9) точнее, чем 0 по формуле (10),

Рис. 1. Результат моделирования данных в 4 эксперименте: 1 -регрессия вида (12), 2 - точки с координатами (x, y)

Рис. 2. Результат моделирования данных в 9 эксперименте: 1 - регрессия вида (13), 2 - точки с координатами (x ., y )

3

'Математическая статистика, М.: Изд-во МГТУ им. Н.Э.Баумана, 2001, С.63.

10Гетманская И.В. Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии: Диссертация на соискание учёной степени кандидата технических наук. 2009, С.109.

а в 9-м оценки одной точности. Это демонстрирует доказанную в работе2 состоятельность оценки при п^-да, что в реальных экспериментах эквивалентно п > 10 (в нашем случае п = 10 и 11). В 6-м эксперименте оценка 0^ также точнее, чем оценка 0 . Это можно объяснить тем, что средняя РРК по формуле (9) — эквивалент МНК, для которого известное условие оптимальности — большие погрешности исходных данных. Эксперимент 6 в серии из 12-ти с наибольшей погрешностью ст и 0.95 < 1.

В остальных 9-ти экспериментах оценка 0 точнее, чем 0 • минимум в 1,5 максимум в 188 раз. Во всех 12-ти экспериментах оценка точности результатов оценивания РК

|0 - е| = в ■ о3, в е [0,002, 1,04]

с помощью куба осреднённой погрешности исходных данных оценивания 9 — 9 < 03 согласуется с её теоретическим обоснованием: р < 1.

Заключение

В работе предлагается нелинейная оценка однопара-метрической парной регрессии, построенная с помощью реализаций оцениваемого параметра в точках, координаты которых соответствуют наблюдениям фактора и отклика.

Найденная несмещённая оценка параметра с приближённо нулевой дисперсией, становится не случайной, а приближением известной точности закономерной величины, истинного значения оцениваемого параметра.

Условия формирования множества несмещённых оценок РК и его подмножества приближений РК зависят от известного вида регрессии, дисперсии исходных данных и неизвестного оцениваемого параметра. В некотором начальном приближении последнего можно планировать эксперимент, определив область измеряемых значений фактора таким образом, чтобы множество приближений РК было непустым, а эксперимент результативным.

Рассматриваемая оптимизация нелинейного оценивания РК при определённых условиях приводит к повышению точности оценивания, по сравнению с состоятельной оценкой (среднее значение РРК), как минимум в 1.5 раза и максимум в 188 раз.

Условиями оптимальности предлагаемой оценки в множестве реализаций регрессионного коэффициента с поправкой до её несмещённости являются: 1) малый, меньше 10, объём исходных данных оценивания, 2) неопределённый закон распределения случайных составляющих модель.

"Степанов С.Е. Разработка оптимального по порядку емкости метода измерений и обработки данных: Автореф. дис. ... канд. физ.-мат. наук. Обнинск: Институт атомной энергетики. 2000. С.5

В выше перечисленных условиях применение классических методов необоснованно. В тоже время, подобные условия возможны в исследованиях редких явлений, например, в вулканологии, или сейсмологии, или в наблюдении астрономических объектов, а также явлений, связанных с дорогостоящими экспериментами, например, при автоматизации испытаний самолётов на прочность [20], или в опасных для окружающей среды экспериментах. Так, в катодолюминесцентной диагностике материалов важной задачей является уменьшение радиационной нагрузки на исследуемый объект. В работе11 рассматриваются связанные с этим вопросы оптимизации по объёму измерений, при решении прямых задач в катодолюминес-центных исследованиях материалов.

Литература

1. Гусева Е. В., Корчагин С. А. Совместное использование взаимно обратных функций при регрессионном анализе и решении обратных задач // Автоматизация, телемеханизация и связь в нефтяной промышленности. 2017. № 6. С. 35-40.

2. Капсамун А. Д., Иванов Д. А., Павлючик Е. Н., Иванова Н. Н., Васильева Е. А. Элементы метаболизма кальция в организме молочных коров в зимних и летних рационах кормления // Бюллетень науки и практики. 2018. № 9. С. 119-126.

3. Полежаев В. Д., Полежаева Л.Н. Нелинейные модели парной регрессии в курсе эконометрики // Современные проблемы науки и образования. 2018. № 4. URL: https://science-education. ru/ru/article/view?id=27855 (дата обращения 10.12.2019).

4. Бенц Д. С. Моделирование эколого-экономической эффективности Уральского региона // Journal ofnew economy. 2019. Т. 20. № 4. С. 70-87. DOI: 10.29141/2073-1019-2019-20-4-4.

5. Неваиницын В.Ю., Лабутин А.Н., Волкова Г.В., Корсакова Н. Э. Управление концентрацией целевого продукта в химическом реакторе с применением нелинейного робаст-ного алгоритма // Сборник докладов Международной научно-практической конференции «Наукоемкие технологии и инновации» (Белгород, 29 апреля 2019). Белгород: Изд-во БГТУ, 2019. Ч. 10 С. 89-93.

6. Van Roosbroeck W. Injected current transport in semi-infinite semiconductor and determination of lifetimes and surface recombination velocities // J. Appl. Phys. 1955. Vol. 26. No. 1. Pp. 380-387.

7. Михеев Н. Н., Никоноров И. М, Петров В. И., СтеповичМ. А. Определение электрофизических параметров полупроводников в растровом электронном микроскопе методами наведённого тока и катодолюминесценции // Известия АН СССР. Серия физическая. 1990. Т. 54. № 2. C. 274-280.

8. Бард Й. Нелинейное оценивание параметров: пер с англ. М.: Статистика, 1979. 349 с.

9. ДемиденкоЕ. З. Линейная и нелинейная регрессия. М.: Финансы и статистика, 1981. 302 с.

10. Ермаков С.М., Жиглявский А. А. Математическая теория оптимального эксперимента. М.: Наука, 1987. 319 с.

11. Айвазян И. С., ЕнюковИ. С., Мешалкин Л. Д. Прикладная статистика: исследование зависимостей. М.: Финансы и статистика, 1985. 487 с.

12. Хардле В. Прикладная непараметрическая регрессия: пер с англ. М.: Мир, 1993. 349 с.

13. Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. М.: Финансы и статистика, 2000. 224 с.

14. Seber G. A.F., Wild C. J. Nonlinear regression. New York etc.: John Wiley & Sons, Inc., Hoboken, 1989. XX. 768 p.

15. Jureckova J., Sen P., Picek J. Methodology in robust and nonparametric statistics. New York: CRC Press, 2013. 394 p.

16. Линке Ю.Ю., Борисов И. С. О построении явных оценок в задачах нелинейной регрессии // Теория вероятностей и её применения. 2018. Т. 63. Вып. 1. С. 29-56.

17. Гетманская И. В. Состоятельная оценка параметра однопараметрической парной регрессии // Вестник МГТУ им. Н. Э. Баумана. Серия Естественные науки. 2006. № 3. С. 3-1.

18. Гетманская И. В. Оптимизация нелинейного несмещённого оценивания параметрической регрессии // Сборник статей по материалам XXXVII международной заочной научно-практической конференции «Научная дискуссия: вопросы математики, физики, химии, биологии». М.: Интернаука, 2016. № 2(30) С. 24-36.

19. Орлов А. И. Метод статистических испытаний в прикладной статистике // Заводская лаборатория. Диагностика материалов. 2019. Т. 85. № 5. С. 67-79.

20. Долгов А. С., Левченко М.М., Левченко М. А. Нетрадиционные методы аппроксимации результатов измерений при автоматизации испытаний самолётов на прочность // Приборы и системы. Управление, контроль, диагностика. 2018, № 11. С. 1-6.

NONLINEAR ESTIMATION STEAMY ONE-PARAMETER REGRESSION IN TERMS OF LACK OF STATISTICS

IRINA V. GETMANSKAYA

Moscow, Russia, getmi@mail.ru

ABSTRACT

Parametric regression is a mathematical model of a phenomenon in the form of functional dependence between the parameters of this phenomenon, one of which is a dependent variable and independent arguments of a function, and the other is its unknown estimated parameters. Since measurements are often burdened with errors, the construction of the model is carried out in the probabilistic scheme of the problem statement, and the estimates of unknown parameters are carried out by statistical methods using evaluation equations. For a nonlinear regression that is not intrinsically linear, the estimated equations with respect to the estimated parameter are not analytically solved. In this case, iteration methods are used, the effectiveness of which depends on the initial approximation. There is an iterative formula for generalized minimal-contrast estimation of non-linear one-parameter pair (one argument) regression. Its components are the implementations of the estimated regression parameter found analytically or numerically by the regression function at measured values of the dependent variable and the independent argument without taking into account the measurement errors. The average of these realizations with a certain approximation accuracy is a consistent esti-

KEYWORDS: parameter regression; nonlinear estimation; expectation; variance; unbiased estimate; consistent estimate.

mate, which was previously proved by the numerical characteristics of the realizations found. This estimate can be used as an initial estimate in an iterative parametric regression estimation formula. In this paper, the implementation of the estimated parameter with approximately zero variance is considered not only as an initial approximation, but also as a self-sufficient estimate, if its accuracy is satisfactory. It is an approximation of the estimated parameter of known accuracy proportional to the cube of the standard deviation of the initial data. The results of the simulation experiment for estimating regression parameters by the proposed approximation method and by means of a consistent assessment are consistent with the theoretical descriptions of the methods. Their comparison is in favor of approximation, if the volume of the original data is less than ten. In this case, the deviation from the true value of the estimated parameter is less than the deviation of the compared state estimate by a maximum of two orders of magnitude (188 times) by at least 1.5 times. Conditions of optimality of the method assumes its use in studies of rare phenomena, as well as in expensive experiments in the broad (economic and humanitarian) sense of the word, he effectiveness of the evaluation method can

be anticipated by checking to experience the fulfillment of the conditions of evaluation formation, which depend on the range of values of the argument of the regression function.

REFERENCES

1. Guseva E. V., Korchagin S. A. The joint use of mutually inverse functions in regression analysis and inverse problems solution. Avtom-atizatsiya, telemechanizatsiya i svyaz' v neftyanoiy promyshlennosti [Automation, telemechanization and communication in the oil industry]. 2017. No 6. Pp. 35-40. (In Rus)

2. Kapsamun A. D., Ivanov D. A., Pavlyuchik E. N., Ivanova N. N., Vasi-leva E. A. Elements of calcium metabolism in the organism of dairy cows in winter and summer feeding rations. Bulletin of Science and Practice. 2018. No. 9. Pp. 119-126. (In Rus)

3. Polezhaev V. D., Polezhaeva L. N. Nonlinear paired regression models in the econometrics course. Modern problems of science and education. 2018. No 4. URL: https://science-education.ru/ru/ar-ticle/view?id=27855 (date of access 10.12.2019). (In Rus)

4. Benc D. S. Modelling of environmental and economic effciency: A case of the Ural region. Journal of new economy. 2019. Vol. 20. No 4. P. 70-87. DOI: 10.29141/2073-1019-2019-20-4-4. (In Rus)

5. Nevinitsyn V. Yu., Labutin A. N., Volkova G. V., Korsakova N. Uh. Up-ravlenie kontsentratsiey tselevogo produkta v khimicheskom reak-tore s primeneniem nelineynogo robastnogo alglritma [Control of the concentration of the target product in a chemical reactor with application of nonlinear robust algoritma]. Sbornik dokladov Mezh-dunarodnoy nauchno-prakticheskoy konferentsii "Naukoemkie tekh-nologii i innovatsii» Sbornik trudov konferencii" [Collection of reports of the International scientific and practical conference "knowledgeIntensive technologies and innovations", Belgorod, April 29, 2019]. Belgorod, 2019. Pt. 10. Pp. 89-93. (In Rus)

6. Van Roosbroeck W. Injected current transport in semi infinite semiconductor and determination of lifetimes and surface recombination velocities. J. Appl. Phys. 1955. Vol. 26. No. 1. Pp. 380-387.

7. Micheev N. N., Nikonorov I. M., Petrov V. I., Stepovich M. A. Opre-delenie elektrofizicheskikh parametrov poluprovodnikov v rastro-vom elektronnom mikroskope metodami navedennogo toka i ka-todolyuminestsentsii [Determination of electrophysical parameters of semiconductors in a scanning electron microscope by methods of induced current and cathodoluminescence]. Izvestiya AN SSSR. Seri-ya fizicheskaya [Izvestia of the USSR Academy of Sciences. A series of physical]. 1990. Vol. 54. No 2. Pp. 274-280. (In Rus)

8. Bard Y. Nonlinear parameter estimation. New York etc.: Academic Press, 1974. 341 p.

9. Demidenko E. Z. Lineynaya i nelineynaya regressiya [Linear and nonlinear regression]. Moscow: Finansi I Statistika, 1981. 302 p. (In Rus)

10. Ermakov S.M., Zhiglyavskiy A.A. Matematicheskaya teoriya op-timal'nogo eksperimenta [Mathematical theory of optimal experiment]. Moscow: Nauka, 1987. 319 p. (In Rus)

11. Ayvazyan I. S., Enyukov I. S., Meshalkin L. D. Prikladnaya statistika: issledovanie zavisimostey [Applied statistics: research of dependences]. Moscow: Nauka. 1985. 487 p. (In Rus)

12. K Hardle W. Applied nonpararnetric regression. Cambridge: Cambridge University Press, 1990. 333 p.

13. Shurygin A. M. Prikladnaya stokhastika: robastnost', otsenivanie, prognoz [Applied stochastics: robustness, estimation, forecast]. Moscow: Finansy i statistika, 2000. 224 p. (In Rus)

14. Seber G.A.F.,Wild C.J. Nonlinear regression. New York etc.: John Wiley & Sons, Inc., Hoboken, 1989. XX. 768 p.

15. Jureckova J., Sen P., Picek J. Methodology in robust and nonpara-metric statistics. Boca Raton; London; New York: CRC Press, 2013. 394 p.

16. Linke Yu. Yu., Borisov I. S. Constructing explicit estimators in nonlinear regression problems. Theory of Probability and its Applications. 2018. Vol. 63. No. 1. Pp. 29-56. (In Rus)

17. Getmanskaya I. V. Consistent Parameter Estimate for One-parameter Paired Regression. Herald of the Bauman Moscow State Technical University. Series Natural Sciences. 2006. No 3. Pp. 3-11. (In Rus)

18. Getmanskaya I. V. Optimizatsiya nelineynogo nesmeshchennogo otsenivaniya parametricheskoy regressii [Optimization of nonlinear unbiased estimation of parametric regression]. Sbornikstateypo ma-terialam XXXVII mezhdunarodnoy zaochnoy nauchno-prakticheskoy konferentsii "Nauchnaya diskussiya: voprosy matematiki, fiziki, khimii, biologii" [Collection of articles based on the materials of the XXXVII international correspondence scientific and practical conference " Scientific discussion: questions of mathematics, physics, chemistry, biology"]. Moscow: Internauka, 2016. No. 2(30). Pp. 24-36. (In Rus)

19. Orlov A. I. Statistical simulations method in applied statistics. Industrial Laboratory. Zavodskaya laboratoriya. Diagnostika materialov [Industrial Laboratory. Diagnostics of Materials]. 2019. Vol. 85. No. 5. Pp. 67-79. DOI: 10.26896/1028-6861-2019-85-5-67-79 (In Rus)

20. Dolgov A. S., Levchenko M. M., Levchenko M. A. Unconventional methods of approximation of measurement resultsin automation of aircraft strength tests. Instruments and Systems: Monitoring, Control, and Diagnostics. 2018. No 11. Pp. 1-6. (In Rus)

INFORMATION ABOUT AUTHOR:

Getmanskaya I.V., PhD, Associate Professor of the Moscow technical University of communications and Informatics.

For citation: Getmanskaya I.V. Nonlinear estimation steamy one-parameter regression in terms of lack of statistics. H&ES Research. 2020. Vol. 12. No. 3. Pp. 54-62. doi: 10.36724/2409-5419-2020-12-3-54-62 (In Rus)

i Надоели баннеры? Вы всегда можете отключить рекламу.