ОБЩИЕ ВОПРОСЫ МЕТРОЛОГИИ И ИЗМЕРИТЕЛЬНОЙТЕХНИКИ
УДК 531.7.08 DOI 10.21685/2307-5538-2019-1-13
Б. Л. Свистунов, А. Ф. Зубков, Ю. С. Гусынина
МЕТОД ВЫБОРА ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ОЦЕНКИ ДЕЙСТВИТЕЛЬНОГО ЗНАЧЕНИЯ РЕЗУЛЬТАТА ИЗМЕРЕНИЯ НА ОСНОВЕ ПРИНЦИПА МАКСИМУМА ЭНТРОПИИ
B. L. Svistunov, A. F. Zubkov, Y. S. Gusynina
METHOD OF SELECTING THE DENSITY OF DISTRIBUTION OF A RANDOM VALUE OF EVALUATING THE VALUE
OF THE MEASUREMENT RESULT ON THE BASIS OF THE PRINCIPLE OF THE MAXIMUM OF ENTROPY
Аннотация. Актуальность и цели. Рассматривается задача получения в результате измерительного эксперимента действительных оценок физических величин. Материалы и методы. Результатом измерительного эксперимента является получение оценок действительных значений физических величин. Показателем степени доверия к полученным оценкам является погрешность их определения. Достоверность оценки погрешностей определяют на основе теории вероятностей и математической статистики. Это дает возможность для каждого конкретного случая выбирать средства и методы измерений, обеспечивающие получение результата, с погрешностью, не превышающей заданных границ с необходимой достоверностью. Задание неопределенности в виде n-мерной доверительной области, которая включает действительные значения определяемых в ходе эксперимента величин zi с некоторым уровнем значимости 1 — а, требует знания распределения вероятностей переменных zt. Результаты. Во многих случаях достаточно сложно предложить гипотезу о распределении оценки zi. Обоснованным является предложение о распределении оценки результатов измерений на основе использования нормального закона распределения, что формулируется на основе выводов центральной предельной теоремы. В этом случае представляется естественным рассматривать n-мерный эллипсоид £ как доверительную область, внутри которой лежит действительное значение определяемых в ходе эксперимента величин. В реальных условиях при небольшом n предположение о нормальном распределении может не выполняться; в этих случаях предложено выдвигать другую гипотезу о плотности распределения оценки Z. Предположение о распределении f (z) заменяется условием, для которого нормальное распределение имеет максимальную энтропию. Выводы. При выборе подходящего распределения в вычис-
© Свистунов Б. Л., Зубков А. Ф., Гусынина Ю. С., 2019
лении оптимального значения уровня значимости Z рассматривается принцип максимума энтропии. В решении задачи используются стандартные математические преобразования, позволяющие определить число n и оптимальные значения уровня значимости 1 -а0 = f (n). Предельный случай больших n может быть успешно использован в описании функциональных зависимостей.
Abstract. Background. In this paper, we consider the problem of obtaining, as a result of the measurement experiment, real estimates of physical quantities. Materials and methods. The result of the measurement experiment is to obtain estimates of the real values of physical quantities. An indicator of the assurance level in the estimates is the error in determining them. The reliability of error estimation is determined on the basis of probability theory and mathematical statistics. This makes it possible, for each specific case, to choose the means and methods of measurement that ensure the obtaining of the result, with an error not exceeding the prescribed limits with the required reliability. Setting the uncertainty in the form of an n-dimensional confidence area that includes the actual values of the zi values determined during the experiment with a certain level of significance 1 — a requires knowledge of the probability distribution of the variables zi. Results. In many cases it is rather difficult to propose a hypothesis about the distribution of the estimate zt. The proposal to distribute the evaluation of measurement results based on the use of the normal distribution law is justified, which is based on the conclusions of the central limit theorem. In this case, it seems natural to consider the n -dimensional ellipsoid £ as a confidence area, within which lies the real value of the quantities determined in the course of the experiment. Under real conditions, with a small n, the assumption of a normal distribution may not be fulfilled; in these cases it is suggested to put forward another hypothesis about the distribution density of the estimate Z. The assumption of the distribution of f (z) is replaced by the condition for which the normal distribution has the maximum entropy. Conclusions. When choosing the appropriate distribution in the calculation of the optimal value of the significance level Z, the maximum entropy principle is considered. The solution of the problem uses standard mathematical transformations, which allow to determine the number n and the optimal values of significance level 1 — a0 = f (n). The limiting case of large n can be successfully used in the description of functional dependencies.
Ключевые слова: результат измерения, энтропия, закон распределения, уровень значимости.
Keywords: result of measurement, entropy, distribution law, significance level.
Описание явлений реального мира, поведения систем тесно связано с проведением экспериментов, получением результатов «-измерений, последующей их обработкой с целью получения действительных значений физических величин. Степень доверия к полученным результатам определяется погрешностью их вычислений [1]. В качестве меры неопределенности полученных оценок можно представить неопределенность в виде «-мерной доверительной области, которая покрывает действительные значения, определенные в ходе эксперимента величин с некоторым уровнем значимости 1 — а .
В рассматриваемом случае требуется знать распределение вероятностей случайных величин zi, являющихся оценкой реальных значений измерений величин. В простейшем случае прямых и многократных измерений единственной физической величины [2] и предположении нормального распределения погрешности при отсутствии ее систематической ошибки можно рассматривать распределение Стьюдента. В сложных случаях достаточно трудно вычислить распределение оценки zi на основе использования гипотез об известных или предполагаемых распределениях измеряемых величин [3]. Обоснованным является наиболее вероятное пред-
положение о распределении оценки обработки результатов измерений, например, нормальное распределение [4]. В общем случае гипотеза о нормальном распределении принимается на основе выводов центральной предельной теоремы для случайных величин, входящих в систему и влияющих на ее конечный результат в одинаковой степени.
Случайная величина zi может быть представлена нормальным распределением систем [5] двух случайных величин (X, У), которому отвечает функция плотности
/у) = (2пСхСу) '*ехр
( ( "2
( х - а ^
V С х у
2 ( у ^
+ У - аУ
V СУ у
(1)
уу
где ах = ц (х), ау = ц (у) - математические ожидания случайных величин X и У;
12 1
Сх = (0(х)) 2, С = (0(у))2 - средние квадратические отклонения случайных величинX, У.
Геометрическим местом точек, каждой из которых отвечает равенство значений функции /(х, у), является эллипс. Одинаковым значениям функции плотности / (х, у) отвечает постоянное значение показателя степени
С у 2 = const = к2,
(х - ах )Сх~2 +(у - ау)
(х - ах )2 (Схк)-2 +(у - ау )2 (Сук)-2 = 1.
(2)
Уравнение (2) является уравнением эллипса с центром в точке (ах, ау) и главными полудиаметрами ксх, кс , параллельными соответствующим координатным осям.
При изменении к е (0; ^ ) получаем семейство подобных и одинаково расположенных эллипсов, каждому из которых отвечает свое, постоянное значение функции / (х, у). Эллипсы
являются эллипсами равной плотности вероятности. Для условий
выражение (2) представим
\Вх = р^2с х,
Еу =рл/2с у
(х- ах )2 (к Ех )-2 + (у ау )2 (к Еу ) = 1.
(3)
(4)
Из условия (4) при к = 1 получаем уравнение единичного эллипса главных срединных отклонений, при к = 4 - полного эллипса рассеивания.
Если элементы zi, у{ матрицы - столбцов 2 и У интерпретировать как координаты п -мерного евклидова пространства, то плотность вероятностей можно представить
/0 (2 ) = ((^)-1 ехр V-2( - у )Ч-1 (z - у)) ,
(5)
где оценки значений у и 8у используются в качестве ожидаемых значений ц = (ц..) и ковариационной матрицы 2 = $у оценки, принимается
Ц = ац= у. (6)
Оценки 2 следует рассматривать как случайные величины, р = ( е Я) является вероятностью того, что область Я охватывает точку с действительным значением измеряемой величины [6].
Из условия (5) плотность вероятности постоянна на поверхности «-мерного эллипсоида £, образуемого всеми z, для которых выполняется условие
(z — y)т Sy-' (z — y) < const = X2 («,1 — a). (7)
Эллипсоид, представленный условием (7), можно рассмотреть как доверительную область, внутри которой лежит действительное значение определяемых в ходе эксперимента величин. Условия (2) и (7) равнозначны в рассматриваемой схеме решений. Постоянная в условии (7) определяется из равенства (1 — a) - квантиля распределения X2 (n,1 — a) с n степенями свободы, интегралу нормального распределения (5) по эллипсоиду £
p (z е£) = |/ (z)dz = 1 — a. (8)
£
Эллипсоид £ является областью минимального объема среди всех областей R с p (z е£)> 1 — a, поэтому он выбран в качестве доверительной области.
Предположение о нормальном распределении в равенстве оценок математическому ожиданию и ковариационной матрице (в соответствии с уравнениями (5) и (6)) может не выполняться, поэтому необходимо искать способы их замены.
Если предположить, что оценка Z имеет некоторую неизвестную плотность распределения, то интегрирование, аналогичное выражению (8), по тому же самому эллипсоиду, определяемому уравнением (7), даст вероятность
P(Zе£) = /(z)dz = p Ф1 — a. (9)
£
Показано, что имеется оптимальный уровень значимости 1 — a0, на основании которого определяется соответствующая вероятность p = p* (вычисленная с использованием выражения (5)), характерная для всех распределений, в некотором смысле близких к нормальному. Для специальных распределений p* может сильно отличаться от 1 — a0 [8], поэтому р может быть равно 1—a для некоторого неоптимального значения 1—a. Поскольку действительное распределение неизвестно, следует принимать во внимание все возможные распределения.
Вышеуказанные предположения о распределении / (z) заменяются более слабым условием
J(z — y fs;1 (z — y)/z (z)dz = n. (10)
Нормальное распределение не только удовлетворяет этому условию, но и имеет максимальную энтропию J/(z)ln/(z)dz среди всех плотностей вероятностей, удовлетворяющих
(10). Это существенно, так как при выборе подходящего распределения используется принцип максимума энтропии [7].
Первым шагом в вычислении оптимального значения уровня значимости является стандартное преобразование U = (BT) (z — y) оценки Z с помощью верхней треугольной матрицы B, получаемой путем декомпозиции Sy = BTB ковариационной матрицы Sy по Cholesky. Матрица B существует и несингулярна, если Sy несингулярна и положительно определена.
Пусть /0 (и) является плотностью вероятности случайной величины U. Ее нормальное распределение имеет вид
/0 (и )= / 1 exp(—1 ити). (11)
>/(Пг 2
Доверительный эллипсоид е трансформируется в п-мерную сферу ф радиуса г, получаемого из равенства ити < г2 = X2 (п,1 - а) в соответствии с выражением (7). С учетом того, что В = ^ёйу, выражения (9) и (10) принимают вид
Р(2ее) = Р(ие ф ) = |/(и)-и = р Ф1 -
ф
\ити/и (и )-и = п.
а,
(12)
(13)
На втором шаге и преобразуется в случайные величины Т =—ити и О = и/л/2Т , соответствующие п-мерному единичному вектору или пространственному углу.
Пусть /т (х) является плотностью вероятностей Т . Тогда интегрирование по углу в выражениях (8) и (9) дает
Р(2ее) = Р(ие ф )= Р
(
2 Л г2/2
0 <т <-
= | /т(г)-х = рф 1 -а,
(14)
/т (г )-х = п.
(15)
Равенство р = 1 - а выполняется для нормальной плотности распределения, определенной выражением (11), путем интегрирования по углу
/° (т )=—х (п/2-1)е-'.
^ ' Г(п/2)
(16)
Для условия т = х2/2 получается распределение X2 с п степенями свободы. Следовательно, из выражения (14) следует, что г2 является действительно (1 - а) -
квантилью распределения х2 (п,1 - а).
Неизвестная плотность распределения /т (г) разлагается в ряд с использованием обобщенных ортогональных полиномов Лагерра (х):
/т (х )=/Т (х
Полиномы при V = -1 определяются выражением
1 ^к ¿«(х )=1 х-''в1-- (+ке-) к У ' к! -хкУ '
и для них справедливо отношение ортогональности
(х )4^(х )-х = ±Г ( + к +1)5 д.
о к!
Коэффициенты ак в выражении (17) определяются следующим образом:
(17)
(18)
(19)
ак = к! Г(п/2) ГГт (х)^(п/2-1)(х)-х. к Г (п/2 + к)) п ' к
к=0
Когда ) = 1 из уравнения (20) получается, что а0 = 1, поскольку плотность вероятности нормализуется.
Производя то же самое с () = v + 1 — I и принимая во внимание уравнение (15), получим, что а = 0 и
í ~ í я—^
fT (Т) = /Т (t) 1 + Jatâ J (t)
(21)
Это условие должно быть проинтегрировано в соответствии с выражением (14), чтобы получить р :
(22)
p = 1 — a + a2J/т0(t)LV22 J (t)dt + R3.
Остаточный член Я3 содержит все дополнительные составляющие, обусловленные интегрированием членов разложения плотности распределения с коэффициентами ак (к > 3). Интеграл в последнем выражении может быть взят, если учесть выражения (16) и (18):
2 л2
2ГÍ2IJ/т (t)zfJ(t)dt = J^(
It(я/2—1)e-í
Í я+i > t2 e
V J
я я
tJ=t2e-t Í я +1 — t I.
(23)
Вклад этого интеграла в р уравнения (22) стремится к нулю 4311 '=7=и/2+1 или
г2 = х2 (п,1 — а 0 )= п + 2.
Это является лучшим выбором (1 — а) -квантиля, так что
Р = р* = 1 — а0 + Я3 ,
*
т.е. при этом имеется только отличие третьего порядка р от соответствующего уровня значимости 1 — а, который получается в ходе оптимизации и определяется выражением
я/2+1
1 — a) = —-Ц- J t*/2—11
° Г(я/2) J
1e-í¿
(24)
соответствующим уравнениям (16) и (14), р* равна 1 — а0 для всех плотностей, удовлетворяющих выражениям (10) или (13) и содержащих коэффициенты ак = 0, (к > 3). Зависимость от
пространственного угла может быть произвольной.
При п = 1 доверительный эллипсоид вырождается в доверительный интервал, пределы которого при 1 — а0 =91,67 % , в условии (1) 5у1 =оу1 - среднее квадратическое отклонение.
Заключение
1. Случай больших п характерен при определении множества точек функциональной зависимости при уровне значимости, зависящем от п .
2. Предложенный метод позволяет получить действительные оценки физических величин в проводимых экспериментах, обеспечивая погрешность до 4-го знака.
Библиографический список
1. Петров, Б. Н. Принцип инвариантности в измерительной технике / Б. Н. Петров, В. А. Викторов, Б. В. Лункин, А. С. Совлуков. - Москва : Наука, 1976. - 243 с.
Measuring. Monitoring. Management. Control
I
2
2. Свистунов, Б. Л. Преобразователи параметров емкостных и индуктивных датчиков в напряжение / Б. Л. Свистунов // Измерительная техника. - 2001. - № 6. - С. 50-52.
3. Гусынина, Ю. С. Математико-статистическое моделирование производственной системы / Ю. С. Гусынина // Человек, общество и государство в современном мире : сб. науч. тр. Междунар. науч.-практ. конф. : в 2 т. - Пенза, 2016. - С. 241-244.
4. Зубков, А. Ф. Построение вероятностной модели эксплуатации технических систем с учетом стоимостных показателей их состояний / А. Ф. Зубков, О. В. Деркаченко, Ю. С. Гусынина // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Экономические науки. - 2007. - № 52-4. -С. 284-289.
5. Розенберг, В. Я. Введение в теорию точности измерительных систем / В. Я. Розенберг. -Москва : Сов. радио, 1975. - 304 с.
6. Свистунов, Б. Л. Вторичные измерительные преобразователи для взаимоиндуктивных датчиков / Б. Л. Свистунов, В. Г. Полосин. - Пенза : Изд-во Пенз. гос. ун-та, 2001. -90 с.
7. Туз, Ю. М. Структурные методы повышения точности измерительных устройств / Ю. М. Туз. - Киев : Вища школа, 1976. - 285 с.
8. Свистунов, Б. Л. Двухканальные устройства измерения параметров электрических цепей с промежуточным частотно-временным преобразованием / Б. Л. Свистунов // Датчики и системы. - 2001. - № 4. - С. 25-28.
Свистунов Борис Львович
доктор технических наук, профессор, кафедра физики, Пензенский государственный технологический университет (Россия, г. Пенза,
проезд Байдукова/ул. Гагарина, 1а/11) E-mail: [email protected]
Зубков Александр Федорович
кандидат технических наук, профессор, кафедра математики, Пензенский государственный технологический университет (Россия, г. Пенза,
проезд Байдукова/ул. Гагарина, 1а/11) E-mail: [email protected]
Гусынина Юлия Сергеевна
кандидат технических наук, доцент, кафедра математики, Пензенский государственный технологический университет (Россия, г. Пенза,
проезд Байдукова/ул. Гагарина, 1а/11) E-mail: [email protected]
Svistunov Boris Lvovitch
doctor of technical sciences, professor, sub-department of physics, Penza State Technological University (1a/11 Baydukov passage / Gagarin street, Penza, Russia)
Zubkov Alexander Fedorovich
candidate of technical sciences, professor, sub-department of mathematics, Penza State Technological University (1a/11 Baydukov passage / Gagarin street, Penza, Russia)
Gusynina Yuliya Sergeevna
candidate of technical sciences, associate professor, sub-department of mathematics, Penza State Technological University (1a/11 Baydukov passage / Gagarin street, Penza, Russia)
Образец цитирования:
Свистунов, Б. Л. Метод выбора плотности распределения случайной величины оценки действительного значения результата измерения на основе принципа максимума энтропии / Б. Л. Свистунов, А. Ф. Зубков, Ю. С. Гусынина // Измерение. Мониторинг. Управление. Контроль. - 2019. - № 1 (27). -С. 95-102. - БО! 10.21685/2307-5538-2019-1-13.