УДК 681.2.083
ОПРЕДЕЛЕНИЕ И АНАЛИЗ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ, ОБЕСПЕЧИВАЮЩЕЙ ОПТИМАЛЬНОЕ ЧИСЛО МНОГОКРАТНЫХ ИЗМЕРЕНИЙ
В.Я. Копп, А.И. Балакин, Н.М. Меликян, Н.А. Балакина
Сформулирована и доказана теорема, позволяющая определить вид плотности распределения, обеспечивающий максимум энтропии суммы двух случайных величин, сосредоточенных на конечных интервалах, при заданной суммарной дисперсии. Показана возможность использования усеченного нормального распределения, которое значительно упрощает обработку результатов. Произведен анализ полученного закона.
Ключевые слова: максимум энтропии, случайная величина, погрешность средств измерений, многократные измерения, плотность распределения.
Решить проблемы повышения качества продукции в машино- и приборостроении невозможно без обеспечения точности контрольно-измерительных операций, имеющих особое значение при изготовлении прецизионных деталей, так как ошибки при разбраковке могут привести к отказу механизмов, содержащих данные изделия.
Одним из актуальных направлений повышения точности измерений является разработка прогрессивных процессов измерений, основанных, например, на использовании многократных измерений, позволяющих существенно повысить точность контрольных операций. Учитывая, что современные рыночные отношения диктуют частую смену продукции, ведущую к уменьшению объемов партий изделий и производительности в целом при значительном повышении требований к качеству, недостаток многократных измерений, заключающийся в снижении производительности, окупается их значительными преимуществами в точности.
Таким образом, одним из наиболее важных параметров многократных измерений является их количество.
При оценке точностных свойств измерительных приборов из паспортных данных известно значение предельной погрешности во всём диапазоне измерения. При этом необходимо учитывать, что в пределах допустимых значений измеряемой величины точность средств измерений должна изменяться. Так, в области середины поля допуска она может быть меньше, а по мере приближения к границам должна увеличиваться, чтобы уменьшить вероятность выхода за эти границы воспроизводимой величины. Вследствие того, что прибор имеет погрешность, то при его показаниях, соответствующих предельным или близким к ним значениям измеряемой величины, ограниченной допуском, нельзя достоверно утверждать,
что воспроизводимая величина находится в пределах этого допуска. Для того чтобы получить достоверную информацию о том, что измеряемая величина находится в допустимых пределах, необходимо уменьшить поле допуска этой величины на значение удвоенной предельной погрешности прибора. Однако это значительно сужает область допустимых значений, что усложняет в целом технологический процесс. Увеличение числа многократных измерений практически устраняет указанный недостаток, тем самым повышая точность результата измерения [1]. Однако использование данного метода приводит к увеличению времени измерения, что оказывает влияние на производительность производственных систем в целом. Поэтому необходимо определять минимально необходимое число измерений, обеспечивающих заданную точность. Определить необходимое число измерений можно на основе анализа дифференциальной энтропии [2]. Одной из основных сложностей при этом является определение вида плотности распределения погрешности измерения, базирующееся на принципе максимума энтропии Джейнса.
В работе [2] предлагается определять необходимое число многократных измерений на основе анализа дифференциальной энтропии. В источнике [2] приведена и доказана теорема, согласно которой максимальную дифференциальную энтропию случайной величины, сосредоточенной на конечном интервале, обеспечивает композиционный закон, который для
2 (Ь - а)2
случая, когда ее дисперсия удовлетворяет соотношению а2 < --—, где
а и Ь - предельные значения случайной величины, является усеченным нормальным законом. В этом случае алгоритм определения минимально необходимого числа измерений, обеспечивающего требуемую точность, следующий. Расчет ведется итерационно с учетом того, что в соответствии с центральной предельной теоремой теории вероятности дисперсия среднего значения при многократных измерениях уменьшается в п раз, а его математическое ожидание и пределы изменения случайной величины не изменяются. Задаются дисперсия и пределы. Определяются параметры усеченного нормального закона и исходя из этого находится доверительная вероятность результата измерений. Если она неудовлетворительна, то дисперсия уменьшается и ищется новое значение числа измерений. Процесс продолжается до тех пор, пока не будет обеспечена заданная доверительная вероятность.
Однако полученные результаты могут давать несколько завышенную оценку числа измерений. Это вызвано тем, что сумма двух усеченных законов дает вид плотности, которая имеет нулевые значения на границах интервала, внутри которого сосредоточена случайная величина, что не соответствует усеченному нормальному закону.
Целью работы является оценка погрешности при использовании усеченного нормального распределения для определения оптимального числа многократных измерений, а также анализ полученного закона, обеспечивающего максимум дифференциальной энтропии и имеющего нулевые значения плотности на границах интервала.
Постановка задачи: необходимо определить в общем виде плотности распределения случайной величины (СВ) у = а + а2, являющейся суммой двух независимых СВ а^ и а 2, сосредоточенных на конечных интервалах, обеспечивающей максимум ее неопределенности, причем дисперсию СВ у обозначим dу.
ь
Плотность этой величины имеет вид р£(х) = |Р2(х - у)р\(у^у.
-а
Если определять плотность как решение вариационной задачи, то получим усеченный нормальный закон. Однако данное решение не удовлетворяет поставленной задаче, так как не выполняется условие Р£ (-2а) = р£ (2Ь) = 0.
Поэтому задачу необходимо сначала поставить задачу в более общем виде. Найти плотности распределений р^( х), Р2( х),обеспечивающие максимум функционала
Р1(х), Р2(х) ® тах
( Ь
2Ь Г Ь
Н диф / -2а
X 1п
I Р2(х - у)Р1(у^у
у
dx
Л
I Р2( х - у) Р1( У)dУ х -а (1)
V -а
при ограничениях:
Ь
1 Р1( у^у = 1; (2) -а
Ь
2
Iу • Р1(у)dУ = dl; (3)
-а
Ь
1 Р2( у )dy = 1; (4)
-а
Ь
2
I у • Р2( У)dy = d 2, (5)
-а
где dl - дисперсия СВ а1; d2 - дисперсия СВ а2.
Вид функционала (1) автоматически обеспечивает выполнение условий Р£ (-2а) = Р£ (2Ь) = 0.
Поставленная выше задача является вариационной задачей с изопе-риметрическими ограничениями. В отличие от классической постановки, в данной задаче пределы интегрирования функционала и ограничений не совпадают. Для приведения ее к классическому виду будем решать задачу
а! +а 2
не относительно суммы двух СВ а^ и а 2, а относительно СВ р В этом случае функционал (1) будет иметь вид
2
Р1(х),Р2(х) ® тах ( Ъ
Н диф- - I
-а
Ъ
|2 • Р2(2х - у)Р1(У)йу X |_-а
X 1п
12 • Р2(2х - у)Р1(у)Лу
V-а
/J
йх
(6)
При этом ограничения (2) - (5) остаются без изменений, а энтропия Нр СВ р будет
Н р - Н у- 1п2,
где Ну - энтропия СВ у.
Необходимо отметить, что так какСВ у имеет излом, вследствие того что СВ а1 и а2 сосредоточены на конечном интервале [а, Ъ], то:
12Р2(2х - у)Р1(у)йу:
- а
Ф ( х)
: 12Р2(2х - у)Р1(у)йу у( х)
где у( х) -
а,
х е
г2 х+а
|2Р2(2х - у)Р1(y)dy, х е
-а Ъ
|2Р2(2х - у)Р1(ух е
2х-Ъ Ъ - а
Ъ - а
а,
Ъ-а
2
Ъ
а,
2
2х - Ъ, хе
Ъ-а
2 :
Ъ
Ф( х) -
2х + а,
Ъ,
хе
хе
Ъ-а
а,
Ъ-а 2 :
2
Ъ
Для решения поставленной задачи используем уравнение Эйлера. Причем функция Лагранжа в данном случае имеет вид
Ф( х)
Ф = - 12Р2(2х - у)Р1(у)йу X
у( х)
Ф( х) ^ (7)
X 1п 12Р2 (2х - у)Р1(у)йу
^(х) у
+1Р1 (х) +12 х 2 Р1 (х) + 1з Р2 (х) +14 х 2 Р2 (х).
>
Хотя функция Ф имеет излом, использование уравнения Эйлера справедливо, так как функционал не содержит производных искомых функций и, следовательно, условие Вейерштрасса-Эрдмана выполняется.
Считая р>1 независимой переменной, берем производную от выражения (7) и приравниваем ее к нулю:
ЭФ ф(,х)
= - \ 2р2(2х - у)бу х у( х)
' Ф( х) Л
12Р2(2х - у)Р!(у)йу
ЭР1( х)
х
1п
V У( х)
Решая уравнение относительно
Ф( х)
: ! 2 Р2(2 х
у( х)
+1
+ 11 +12 х2 = 0.
Р X (х)
ср
у) Р1( у)Лу,
получаем
Ф( х)
11
Ф( х) 12 Р2(2 х-у)ёу
12Р2(2х - у)Р1(у)йу = е
= е У( х)
х е
12 х
Ф( х)
12 Р2(2 х-у)ф у( х)
у( х)
Ф(х)
Ф(х)
Учитывая, что 12 Р2 (2 х - у)йу = 12 Р2 (у )ф, то
у( х)
Ф(х)
у( х) __1
Ф(х)
12 Р2( у )Ф
12Р2(2х - у)Р1(у)йу = е
= е У(х)
12 х
Ф( х) 12 Р2( >0Ф х е У( х)
у( х)
Аналогично, дифференцируя выражение (7) по Р2, получаем
_1з_
Ф( х)
Ф( х) 12 Р1( у)Лу
12р2(2х - у)Р1(у^у = еУ(х) У ( х)
-1
14 х Ф( х) 12 Р1( у)^у х е У(х)
(8)
(9)
(10)
При этом плотность распределения Рхср (х) (8) СВ Ь обеспечивает
экстремум функционала (6). Если увеличить СВ Ь в два раза, соответственно изменив ее плотность, то новое выражение плотности будет обеспечивать экстремум функционала (1). При этом энтропия СВ Ь увеличится на
1
константу равную 1п(2). Соответственно необходимо изменить и правые части выражений (9) и (10). После преобразования выражения (9) и (10) примут вид
_1 12х2
Ф( х) Ф( х)
ф( х) I Р2( У № 4" I Р2( У)Ф
РЕ(х) = IР2(х _ У)Р1(У)№У = еу(х) X е у(х) ; (11)
у (х)
_1 14х2
Ф(х) Ф(х)
Ф(х) IР1(у)№у 4" IР1(у)ёу
РЕ(х) = IР2(х _ У)Р1(У)Ф = еу(х) X е у(х) . (12)
у (х)
а, х е [_ 2а, Ь _ а] Гх + а, х е [_ 2а, Ь _ а]
х _ Ь, х е [Ь _ а, 2Ь] ' [Ь, х е [Ь _ а, 2Ь]
Получить точное решение системы функциональных интегральных уравнений первого рода (11) и (12) в общем виде относительно Р1( у) и Р2( У) крайне сложно. Однако, исследовав полученные зависимости, можно указать частные решения, которые могут иметь определенное прикладное значение, например при проведении многократных измерений. Приравнивая правые части выражений (11) и (12), получаем
1 1 ^2 х2 1з 1 14 х2
Ф( х) ф( х) ф( х) ф( х)
I Р2(у)№у 4- I Р2(у)ф I Р1(у)ёу 4- I р:(у)ф
е у(х) X е у(х) = е у(х) х е у(х)
Очевидным условием для получения одного из возможных решений является равенство
Ф(х) Ф(х)
I Р1( У)^У = I Р2( У)№У, (13)
у(х) у(х)
что естественно может быть выполнено при Р1 (у) = Р2 (у).
Упростим исходную задачу и сформулируем ее следующим образом: при заданной плотности распределения Р2(у) найти плотность распределения ре (х), обеспечивающую максимум функционала (1), при ограничениях:
Ь
I Р2(х _ у)Р1(у)Ф = 1; (14)
_а Ь
I у Р2(х _ у)Р1(у)№у = №у. (15)
_а
Ее решение найти можно.
Предположим, что а 2 имеет усеченный нормальный закон распределения, обеспечивающий ей, как доказано в [2], максимум энтропии
Р2( у) = е1'*-^1'2 , (16)
где 11, 12 определяются из условий (4), (5).
Подставляя в (11) выражение (16), получим плотность распределения суммы двух функций Рх (х), обеспечивающую максимум функционала (1)
Ф( х)
I Р2( х - у) Р1( у )йу =
у( х)
11 1 12х2 (17)
Ф(х) 1' 1 2л/ Ф(х) Л 2л/
| е1! еу 12 йу 4- | е11-1еу 12 йу
е У( х) х е У( х)
Для определения множителей Лагранжа 11, 12 в выражении (17) необходимо подставить его в ограничения (14), (15) и решить полученную систему уравнений относительно 11, 12.
Отметим, что решение уравнения Эйлера является необходимым условием экстремума функционала (1). Проверка достаточного условия не проводилась, поэтому глобальный экстремум не гарантирован.
Результаты моделирования приведены на рис. 1, где кривой 1 представлена плотность распределения Рх СВ у.
Сравним полученный вид закона распределения Рх с законом распределения суммы двух СВ, имеющих одинаковые нормальные усеченные законы распределения. Отметим, что данное решение соответствует условию (13). Вид закона представлен на рис. 1 кривой 2. Численное решение показало, что с точностью до 4-го знака после запятой значения энтропий совпадают.
На рис. 2 представлен график зависимости значений энтропии композиции двух СВ а1 и а 2 от дисперсии й при заданной дисперсии йу.
Анализируя зависимость, представленную на рис. 2, можно сказать, что энтропия композиции двух СВ а1 и а2 имеет максимальное значение
при й,1 = й 2.
Далее были проведены исследования влияния соотношения границ интервалов сосредоточения СВ а1 и а2. Интервалы этих величин брались таким образом, чтобы их сумма после свертки была равна заданному значению.
В качестве примера приведём исследования, при которых значение границ интервала композиционного закона равно [- 4, 4], закон распределения СВ а^ и а 2 усеченный нормальный. При этом значения дисперсии композиции двух СВ а^ и а 2 брались равными 0,1; 0,2; 0,3; 0,4.
Графические зависимости представлены на рис. 3.
Рис. 1. Вид плотности распределения:1 - плотность распределения р£ СВу;2 - плотность полученного закона
Рис. 2. Зависимость значений энтропии композиции двух СВ а1 и а2 от дисперсии при заданной йу
Проведя анализ полученных данных, можно сделать вывод: максимальные значения энтропии получаются при использовании одного интервала максимально близкого к суммарному значению, при этом интервал второй функции должен дополнять его.
Таким образом, можно указать еще один подход к решению поставленной задачи для случая, когда СВ а1, а2 сосредоточены на разных интервалах, а в качестве известной функции принимается функция достаточно близкая к 8 -функции, существующая на интервале близком к нулю.
Рис. 3. Зависимость значений энтропии композиции двух СВа! и а2 от дисперсии йу и значений границ интервала функции
Известно, что
2b
л(х) = I л(У)8(х - у¥У .
- 2а
Результаты моделирования при известной функции Р2 (х) близкой к 8 -функции, у которой дисперсия и пределы близки к нулю, приведены на рис. 4. На этом же рисунке приведен вид усеченного нормального закона, обеспечивающего максимальную энтропию. Чем ближе указанная функция к 8 -функции, тем ближе кривая 1 к кривой 2.
Результаты исследований позволяют сформулировать следующую теорему.
Теорема. Необходимые условия максимума энтропии суммы двух СВ, сосредоточенных на конечных интервалах, имеющих одинаковые границы, при заданной дисперсии суммы йу обеспечиваются плотностями
распределения слагаемых СВ, удовлетворяющих условиям:
1i
j( х)
J Pi (y)dy
-1
12ix
x e
j( х) 4- J Pi (y)dy
y( х)
(i = 1,2),
j( х)
J P2( х - y) Pl( y)dy = e y (х)
y( х)
где Iii, 12i - константы, определяемые из выражений: b b
rs
J P2(х - y)Pi(y)dy = 1; J y P2(х - y)Pi(y)dy = dy,
- a - a
а пределы интегрирования имеют вид
Г- а, х е [- 2a, b - a] Гх + a, х е [- 2a, b - a];
х - b, х е [b - a, 2b] lb, х е [b - a, 2b].
y( х)
Следствие. Необходимые условия максимума энтропии достигаются при выполнении условий (рис. 4):
Л(У) = Р2(У); ^11 =112, 121 = 122 .
Рис. 4. Вид плотности распределения 1 - усеченного нормального закона Р1(х); 2 - свертки закона Р1(х) и функции Р2(х) близкой к Ъ-функции
Сформулированная теорема позволяет определить вид плотности распределения, обеспечивающий максимум энтропии суммы двух случайных величин, сосредоточенных на конечных интервалах, при заданной суммарной дисперсии. Произведенная оценка применимости усеченного закона распределения показала возможность его использования, что значительно упрощает обработку результатов.
Исследования выполнены при финансовой поддержке министерства образования и науки Российской Федерации по базовой части Государственного задания №2014/702, проект № 3858.
Список литературы
1. Информационно-измерительная техника и технологии / В.И. Калашников, С.В. Нефедов, А.Б. Путилин [и др.]; под ред. Г.Г. Ранеева. М.: Высшая школа, 2002. 454 с.
2. Анализ дифференциальной энтропии при многократных технических измерениях в машино-приборостроении / В.Я.Копп, А.А.Скидан, А.И.Балакин, О.В.Филипович // Вестник СевГТУ: Сб. науч. тр. 2008. Вып. 93.С. 164 - 171.
Копп Вадим Яковлевич, д-р техн. наук, проф., v_kopp@,mail.ru, Россия, Севастополь, Севастопольский государственный университет,
Балакин Алексей Игоревич, канд. техн. наук, доц., lehabaarambler.ru, Россия, Севастопольский государственный университет,
Меликян Нерсес Мартикович, асп., 0666809171amail.ru, Россия, Севастополь, Севастопольский государственный университет,
Балакина Наталья Анатольевна, ассист., 040578aramhler.ru, Россия, Севастополь, Севастопольский государственный университет
DEFINITION AND THE ANALYSIS OF DENSITY OF DISTRIBUTION PROVIDING OPTIMUM NUMBER OF REPEA TED MEASUREMENTS
V. Ya. Kopp, A.I. Balakin, N. M. Melikyan, N. A. Balakina
The theorem allowing to define the type of density of distribution providing a maximum of entropy of the sum of two random variables concentrated on final intervals at the set summary dispersion is formulated and proved. It is shown that possibility of use of the truncated normal distribution considerably simplifies processing of results. The analysis of the received law is made.
Key words: entropy maximum, random variable, error of measuring instruments, repeated measurements, distribution density.
Kopp Vadim Yakovlevich, doctor of technical sciences, professor, v_kopp@,mail. ru, Russia, Sevastopol, Sevastopol State University,
Balakin Alexey Igorevich, candidate of technical sciences, docent, leha-baqrambler.ru, Russia, Sevastopol State University,
Melikyan Nerses Martikovich, postgraduate, 066680917la mail.ru, Russia, Sevastopol, Sevastopol State University,
Balakina Natalya Anatolyevna, assistant, [email protected], Russia, Sevastopol, Sevastopol State University