ОБЗОРЫ
ТЕОРЕТИЧЕСКАЯ И МАТЕМАТИЧЕСКАЯ ФИЗИКА
Сравнительный анализ качества редукции для вероятностной и возможностной моделей измерения
Д. А. Балакинa, Ю. П. Пытьевb
Московский государственный университет имени М. В. Ломоносова, физический факультет, кафедра математического моделирования и информатики.
Россия, 119991, Москва, Ленинские горы, д. 1, стр. 2.
E-mail: a [email protected], [email protected]
Статья поступила 07.06.2016, подписана в печать 08.08.2016.
В работе сравниваются несколько новых и известных методов решения задачи интерпретации данных измерительного эксперимента для вероятностных и возможностных моделей измерений и анализируется зависимость их качества от полноты и точности модели измерительного эксперимента. Показано, что оптимальное использование имеющейся у исследователя априорной информации о модели измерения позволяет значительно повысить точность интерпретации данных измерения. В ряде случаев погрешность при возможностной интерпретации данных измерения оказалась меньше, чем при вероятностной, хотя при возможностной интерпретации минимизируется не величина погрешности, как в вероятностной, а ее необходимость. Это связано с тем, что априорная информация может быть достаточна для того, чтобы моделировать входной сигнал нечетким вектором, но недостаточна для того, чтобы его моделировать случайным вектором.
Ключевые слова: математическая модель измерения, редукция измерения, оптимальные решения, измерительно-вычислительные системы.
УДК: 519.25. PACS: 02.50.Le.
Введение
Как известно [1], такие широко распространенные методы «обработки» результатов измерений, как метод наименьших квадратов [2, 3] и его регуля-ризованные варианты [4, 5], метод максимальной энтропии [6-8] и др., в которых решение задачи интерпретации данных измерений находится путем минимизации функционала, не имеющего прямого отношения к погрешности интерпретации, не гарантируют максимальную точность интерпретации. Подобные методы не могут служить основой теории измерительно-вычислительных преобразователей (ИВП) как средств измерения, поскольку при априори заданном измерительном преобразователе (ИП)1 не позволяют реализовать максимальную точность ИВП как средства измерения, не позволяют определять оптимальные параметры ИП, при которых достигается предельная точность ИВП как средства измерения и т. д. Разумеется, если метод «обработки данных измерений» позволяет оценить погрешность интерпретации, то именно ее и следует минимизировать. Заметим, однако, что в ряде случаев функционал наименьших квадратов естественно возникает и в задачах минимизации ошибки интерпретации
данных измерений, как, например, в случае нормального распределения ошибок измерений, а также в возможностной редукции, если распределение возможностей шума зависит от его евклидовой нормы (см. далее замечание 3).
Цель настоящей работы — обратить внимание читателя на новые математические методы «обработки» данных измерений, позволяющие реализовать максимальную точность ИВП как средства измерения, а также оптимально учесть доступную исследователю априорную информацию об измерительном эксперименте и об исследуемом объекте.
Рассмотрим типичную схему измерений, в которой в результате взаимодействия измеряемого объекта, среды и ИП на входе ИП формируется (измеряемый) сигнал f, принадлежащий конечномерному2 евклидову пространству Т, несущий информацию об измеряемом объекте и среде (рис. 1) [1, 10, 11]. ИП преобразует f в сигнал
£ = Af + V, (1)
где A: Т ^ X — оператор, моделирующий физические процессы в ИП (и далее обозначающий моделируемый им ИП), взаимодействующем с измеряемым объектом и со средой, определяющие преобразова-
1 В ряде случаев ИП — измерительный прибор.
2 Предположение о конечномерности пространств Т, X, Ы делается для упрощения изложения и не является принципиальным. О редукции в случае бесконечномерных Т, X или Ы см., например, [1, гл. 7, 8, 10], [9], [10, гл. 4].
2 ВМУ. Физика. Астрономия. № 2
Среда
ИБП
ИП, среда и измеряемый объект, взаимодействующие в процессе измерения
у ( = А/+„ У^^^у1 то
_I Априорная и дополнительная информация
Среда
Среда
Исследуемый объект, взаимодействующий со средой
Рис. 1. Схема измерительного эксперимента. / — входной сигнал измерительного преобразователя (ИП), ^ — его выходной сигнал, поступающий в вычислительный преобразователь (ВП), V — шум, А — оператор, моделирующий физические процессы в ИП, взаимодействующем с измеряемым объектом и со средой, Я£ — выходной сигнал измерительно-вычислительного преобразователя (ИВП), и — оператор, моделирующий
идеальный ИП
ние / в сигнал А/, X — конечномерное евклидово пространство значений сигнала £, V — погрешность, шум ИП (см. рис. 1, верхняя часть).
Результат измерения зависит от параметров измеряемого объекта, взаимодействующего с ИП, значения которых могут быть существенно искажены этим взаимодействием, а исследователя, как правило, интересуют значения параметров исследуемого объекта, не возмущенного измерением. Связь параметров измеряемого и исследуемого объектов описывается моделью идеального ИП, заданной оператором и: Т — Ы, где Ы — конечномерное евклидово пространство значений интересующих исследователя параметров. На вход идеального ИП поступает тот же сигнал, что и на вход реального ИП, но на его выходе сигнал и/ равен значениям параметров исследуемого, а не измеряемого объекта (см. рис. 1, правая нижняя часть). Как правило, идеальный ИП не может быть реализован «в железе» из-за физических ограничений. Задача редукции измерения £ к виду, свойственному измерению на идеальном ИП и, состоит в нахождении оператора редукции Я: X —^ Ы, для которого Я£ — в известном смысле наиболее точная версия значения и/.
Пусть при измерении по схеме (1) А — линейный оператор, шум V ограничен условием ||Qv|| < 1, где невырожденный линейный оператор Q известен,
и = I (поскольку МНК не позволяет оценить и/). Тогда «классический» вариант метода наименьших квадратов предписывает определять оценку измеренного по схеме (1) значения / как /0 из условия
||£ - А/о|| = т1п{||£ - А/ '||Ш£ - А/ ')|| < 1, /' еТ},
(2)
не имеющего прямого отношения к точности определения /0 как оценки /.
Редукция измерения определяется оператором Я, при котором максимальное значение погрешности интерпретации Я£ как оценки значения и/ минимально:
Н(Я, и) = 8ЫР{||Я£ - и/1||/ еТ, V е X, |^|| < 1}.
' Ш1П .
Я: Х^и
(3)
Как показано в [1], если Q, А — линейные невырожденные операторы, и — линейный оператор, то минимум Н(Я, и) достигается при
Я = Я* = и (A*Q*QA)-1A*Q*Q
и равен Ци(A*Q*QA)-1 и*||1/2, где у — операторная норма, причем преобразование £, определенное оператором Я*, минимизирует погрешность (3) в классе всех (необязательно линейных) Я.
Как известно [12], оценка / метода наименьших квадратов определяется из условия (2) и рав-
на [13] Ш = (A* A + wA*Q*QA)-1(A* + uA*Q*Q)£, где ш — принадлежащий [0, корень уравнения ||Q(Z - Afu)\\ = 1, если такой корень существует, и 0 в противном случае. Ее точность не выше, чем точность оценки редукции при U = I, а задача (2), вообще говоря, не может быть «преобразована» в задачу получения наиболее точной версии выходного сигнала заданного измерительного прибора U, т. е. метод наименьших квадратов не позволяет непосредственно оценивать интересующие исследователя параметры Uf исследуемого объекта.
Замечание 1. Поскольку выбор минимизируемой нормы невязки в МНК (в том числе и регуляри-зованном), как правило, не обусловлен каким-либо общим принципом, связанным с минимизацией погрешности, далее всюду, где рассматривается МНК и его оценка, используется евклидова норма.
Если в (1) f — априори произвольный вектор, принадлежащий F, v — случайный вектор, принимающий значения в X, имеющий математическое ожидание Ev = 0 и невырожденный ковариационный оператор Sv: V x GX Svx = Ev(x, v), то аналогично условию (3) в этом случае линейный оператор R*: X ^ U редукции определяется как минимизирующий максимальную по f среднеквадратичную (с. к.) погрешность интерпретации RZ как
результата Uf: h(R, U) = supE\\R(Q-Uf ||2 - min .
f R: x^U
Эта погрешность минимальна [1] при R, равном оператору несмещенной редукции
R* = U (S-1/2A)-S-
и равна h(R*, U) = tr (U(A*S-1A)-1U*), где - обозначает псевдообращение, если
U(I - A-A)= 0,
(5)
и равна бесконечности, если это условие не выполнено. В этом случае задача неразрешима и при и = I, тогда оценка (4) формально существует, оценка обычного МНК существует, но не единственна, существование и единственность регуляризованного МНК зависит от способа регуляризации.
Если же f — реализация случайного вектора Ф, статистически независимого от шума, то, согласно [1, §6.1.4], наиболее точной в с. к. версией Uf является
UFA* (AFA* + Sv)-1 (Z - Af0) + f
(6)
где /0 — математическое ожидание, а Р — ковариационный оператор ф .
В качестве примера применения метода редукции рассмотрим задачу оценивания входного сигнала по данным измерений по схеме (1), где матричные элементы оператора А выбраны как в [14]:
11
Aj = (1 - а) —
nw 1 + (\i — j\/w)2
+
+ а
1
2
nw2
1/2
(4)
: ехр(-\1 - ]\2/(2ш>2)), I, ]' = 1,..., М,
(7)
где а = 0.2, т = 3 — «ширина» аппаратной функции измерительного преобразователя, моделируемого оператором А. Случайные погрешности измерений имеют нулевое математическое ожидание и корреляционный оператор = о21.
Сигнал / на входе ИП
Результат измерения
ю-9, *12)= ю-3
Редукция, (4) и (8),
Х«0.6
Обычный МНК, X я 1.5 ■ 105
Регупяризованный МНК, у « 2.3 • 102
Рис. 2. Результаты редукции измерения £ (б) входного сигнала / (а) при отсутствии априорной информации и при и = I: в — оценка несмещенной линейной редукции и(Т—1/2А)-Т-1/2£ (4), которая в данном случае совпадает с оценкой, минимизирующей необходимость потерь (8); г — оценка обычного МНК ащтт\\А/ — £\\2; д — оценка регуляризованного МНК а^тт(\\А/ — £\\2 + а\\/\\2), в котором параметр а
/ еТ / еТ
определен по невязке, а в качестве ограничения на квадрат нормы шума выбрано его математическое ожидание
На рис. 2 при M = dim F = dim U = 100 приведены результаты интерпретации измерений для произвольного f (см. разд. 2). В этом случае проведены два цикла измерений, причем во втором дисперсии погрешностей измерений в 106 раз больше, чем в первом. Результат редукции имеет меньшую с. к. погрешность х = EUf - Uf II2 (по определению, ибо в методе редукции погрешность минимизируется, а ни в обычном, ни в регуляризованном МНК — нет), чем результаты остальных методов, что связано с более полным учетом в методе редукции априорной информации о шуме (в методе редукции используется ковариационный оператор шума, в обычном МНК информация о шуме не используется, в регуляризованном МНК используется информация о математическом ожидании нормы шума), а в результате применения обычного МНК сигнал неразличим на фоне шума. На рис. 3 при M = dim F = dim X = dim U = 100 приведены результаты интерпретации измерений для случайного или нечеткого f (см. разд. 3). Результаты вероятностной редукции и редукции для второго варианта теории возможностей близки и имеют существенно меньшую с. к. погрешность, чем результат редукции для первого варианта, поскольку в них более точно передаются пики сигнала (но больше шум на «плато»).
Замечание 2. Величина с. к. погрешности интерпретации — далеко не полная характеристика качества решения задачи интерпретации, поскольку исследователь воспринимает график как источник информации об интересующем его объекте. Такая
информация зачастую содержится в пиках, наклонах и других деталях графика, которые неплохо выделяются зрительным анализатором человека из весьма интенсивного шума.
1. Элементы теории возможностей
Теория возможностей [15, 16] является альтернативой теории вероятностей. В настоящей статье применяются два ее варианта. В отличие от вероятности Pr, возможность P и необходимость N являются мерами, определенными на алгебре P(П) всех подмножеств пространства элементарных событий П со значениями в отрезке [0,1], причем для каждого A е P(П) значения P(A) и N(A) определяют лишь относительные возможность и необходимость событий: если P(A) > P(B), то событие A более возможно, чем событие B; если N(A) > N(B), то событие A более необходимо, чем событие B, а численные значения мер возможности и необходимости, отличные от 0 и 1, не имеют содержательной интерпретации. В первом варианте теории возможностей операция • умножения значений возможности определена как a • b == min{a, b}, операция • умножения значений необходимости —
как a • b = max{a, b}, во втором варианте теории
возможностей а • Ь = аЬ, а • Ь = 1 — (1 — а)(1 — Ь), а, Ь е [0,1]. Для любых событий А и В в обоих вариантах Р(А и В) = тах{Р(А), Р(В)}, Ы(А п В) = тт{Ы(А), Ы(В)}; для Р-независимых
событий А и В Р(А п В) =Р(А) • Р(В), т.е. в первом варианте Р(А п В) = тт{Р(А), Р(В)}, во втором варианте Р(А п В) = Р(А) Р(В); необходимость
def
10
4
о
Сигнал / на входе ИП
Результат измерения а' = 10 "7
Вероятностная оценка (6), Х«35
10
i||kjL J I I 0 Wfjyyii^
д
,.,.. 0
г г
Возможностная оценка, Возможностная оценка,
первый вариант теории возможностей (17) второй вариант теории возможностей (14),
1 52 у « 35
Рис. 3. Результаты редукции измерения £ (б) входного сигнала / (а) при и = 1 и априорной информации: / — реализация нечеткого вектора ф, имеющего распределение необходимостей кф(/) = Ь(||/ — /1\\2/ф2), / , и распределении необходимостей шума к(у) = Ь(||у||2/а"2): в — вероятностная оценка (6); г и д — оценки редукции а^тт Ь(||(/ — /1)|2/ф2) • Ь(||£ — А/||2/а"2) для первого и второго вариантов
/ е^
теории возможностей
объединения N-независимых событий А и В Ы(А и В) = Ы(А) ? Ы(В), т.е. в первом варианте Ы(А и В) = тах{Ы(А), Ы(В)}, во втором варианте ы(а и В) = 1 - (1 - Р(А))(1 - Р(В)). Таким образом, существенное для рассматриваемой задачи отличие двух вариантов теории возможностей заключается в том, как определена независимость событий.
Формальным аналогом случайного элемента в теории вероятностей в теории возможностей является нечеткий элемент (величина, вектор). В отличие от случайного элемента (величины, вектора) в теории вероятностей, определенного как измеримая функция на вероятностном пространстве, нечеткий элемент определяется как функция на пространстве с мерами Р, Ы, т. е. нечеткого пространства. Для того чтобы задать нечеткий элемент £, можно задать распределения возможностей g£ и необходи-мостей Н£ его значений. Для любого х из области значений, которые может принимать £, значение g£(х) — возможность равенства £ = х, а значение Н£(х) — необходимость неравенства £ = х, подробнее см. [15, 16].
Заметим, что возможность как альтернативная вероятности модель вероятностной случайности прогнозирует относительную предопределенность, шанс каждого исхода испытаний, моделью которого служит некоторое вероятностное пространство [16].
2. Априорная информация о принадлежности входного сигнала заданному множеству и ее представления в теории вероятностей и теории возможностей
В вероятностных моделях измерений шум V обычно считается случайным элементом, а сигнал / на входе ИП априори может быть любым вектором Т (рис. 1). Альтернативным является моделирование шума с помощью формализма теории возможностей [15, 16], т. е. как нечеткого элемента. При этом в отличие от теории вероятностей, где отсутствие априорной информации об / не позволяет рассматривать / как случайный вектор с каким-либо априори заданным распределением вероятностей его значений, теория возможностей позволяет моделировать априори произвольный / &Т как нечеткий элемент ф, все значения в Т которого одинаково возможны, поскольку «равновозможность» не зависит от выбора шкалы.
Пусть ф и V — нечеткие (в смысле первого или второго варианта теории возможностей [15, 16]) векторы, принимающие значения в евклидовых пространствах Т и X соответственно и имеющие распределения необходимостей соответственно Нф(/) = 0, / &Т и к"(у) = Ь(||£-1/2у||2), у , где ТV: X ^ X — положительно определенный оператор, являющийся формальным аналогом ковариационного оператора шума V, Ь(-): [0, то] ^ [0, 1] — строго монотонно возрастающая непрерывная функция, Ь(0) = 0, а необходимость потерь п1(и/, V)
при оценивании Uf значением v такова, что n\(Uf, v) = 0 при Uf = v и nl(Uf, v) > 0 при Uf = v. Тогда необходимость потерь при использовании оператора редукции R: X — Ы есть [15, § 7.2] NL(R) = inf hv(x - Af) i n\(Uf, Rx). Оператор
xeX ,f eF
редукции, минимизирующий необходимость потерь:
R£ = U (S-1/2A)-S-1/2£ + U a(£), (8)
где a(-): X — N(A) — произвольная функция. Видно, что при выполнении условия U(I-A-A) = 0, при котором в вероятностной постановке величина Uf может быть оценена с конечной с. к. погрешностью, оптимальная (минимизирующая необходимость потерь) оценка (8) единственна и совпадает с оценкой (4), ибо Ua(£) = 0. Следовательно, в этом случае при априори произвольном сигнале f на входе МП с.к. погрешность редукции для вероятностной и возможностной моделей измерений, выполненных по схеме (1), одинаковы.
Однако при наличии априорной информации о возможных значениях f это уже не так. Рассмотрим задачу редукции измерения в тех же условиях, что выше, но при условии, что априори известно множество F1 cF, которому принадлежит f.
Теорема 1. Пусть ф и v — нечеткие (в смысле первого или второго варианта теории возможностей) векторы, принимающие значения в евклидовых пространствах F и X соответственно и имеющие совместное распределение необходимо-стей{
h- (f, y)J Ь №-1/2У"2) , f ^ y GX ,(9)
U f eF\Fb
где Sv: X — X — положительно определенный оператор, b(0: [0, то] — [0,1] — полунепрерывная снизу строго монотонно возрастающая функция, b(0) = 0, необходимость потерь при оценивании Uf значением v nl(Uf, v) = 0 при Uf = v и nl(Uf, v) > 0 при Uf = v. Тогда любой оператор редукции R: X — Ы, минимизирующий необходимость потерь, удовлетворяет условию R££=x = Uf (x), где f (x) — произвольное решение задачи
||S-1/2(x - Af )||2 ~ min . (10)
f eFi
В случае монотонно неубывающей функции b(0 любой оператор редукции из вышеописанного класса минимизирует необходимость потерь, но существуют и другие оптимальные правила оценивания.
Доказательство. Как показано в [15, §7.2], при выполнении условий теоремы решение задачи редукции Rx при каждом результате измерения £ = x является решением задачи на минимум необходимости потерь
NL(Rx) = inf h^v (f, x - Af) i n\(Uf, Rx) - min, (11)
f eF RxeU
причем потери не необходимы только при Rx = Uf
и поскольку min hv'v(f, x - Af) • nl(Uf, Rx) =
RxeU
h*-v (f, x - Af)
min (f, x - Af)
RxeU
• min nl(Uf, Rx) = (f, x - Af), где
RxeU
Rx
минимум по Rx достигается при единственном Rx = Uf, то решение задачи (11) R*x = Uf (x), где f (x) — решение задачи hv'v(f, x - Af) ~ min, которая
с учетом (9) эквивалентна задаче (10).
f eF
Замечание 3. Задача (10) формально аналогична задаче условной минимизации функционала МНК, в котором норма та же, что и в распределении (9). Для ее решения можно использовать известные алгоритмы (см., например, [13, 17, 18] и для рассматриваемого далее случая [19]). Подчеркнем, что в общем случае МНК норма может быть выбрана произвольно, но функционал необходимости потерь определяется распределением входного сигнала и шума. В [14] для другого распределения шума, а именно при
^ \ ,т £ ^Ь(у^ / кф (/, у) = <'=1--^т * у ех,
и / еТ\Ти
где у, — координаты вектора у в базисе, в котором координаты вектора V независимы в смысле первого варианта теории возможностей, е, характеризует «разброс» V,, может быть задано набором
линейных ограничений, задача редукции сводится к задаче линейного программирования.
Задача редукции для вероятностной модели схемы измерений (1) при условии / е рассмотрена в [1, §7.2], где использован следующий факт: если £ = £(£) — какое-либо решение задачи интерпретации измерения £, то проекция ( на и= {и/\/ е Т1}, т.е. решение П(£) задачи на минимум УС — П(0112 = ¡п^еи^ УС — "||2, имеет меньшую с. к. погрешность, чем С, если иТ1. Пусть и = I. Уточнение оценки Я*£ при и = I (см. (4)) определим рекуррентным процессом
f+1 = n(R&), 6 =
0 ■
(12)
где , = 0,1,..., /о = Я* £ при и = I, Я — оператор редукции к и = I измерения по схеме
£, = \ А) / + ( I При любом шуме V, т. е. для ИП
при шуме, ковариационныи оператор которого
(!)
\0 X v)
. ДругоИ вариант уточнения — неподвиж-
10
2 0
10
..iliÜlllhiiltil I "ЧРЩМ.
Сигнал / на входе ИП
10
,i.illm..i.i.I I
^•PipfllUlL
Оценка (13), х * 21
Результат измерения £, er2 = 10"7
10
■ I I
В озможно стная оценка (10), х » 20
Рекуррентная оценка /100( 12),Х«21
100 ^
X 50
С. к. погрешность х
в зависимости от а1-
Рис. 4. Результаты редукции измерения £ (б), входного сигнала ИП / (а) и оператора А (7), М = 102 при априорной информации о неотрицательности входного сигнала, / е = {/' е /' > 0}: в — ре-
редукции к П(Я*£), П — ортогональный
куррентный метод (12), 100 отображении f ^ П I R , fT
проектор на ; г — неподвижная точка этого отображения (см. (13)); д — возможностная оценка (10)
аг§тт||£71/2(х — А/)||2; е — зависимость с. к. погрешности х, выделено использованное на остальных /
графиках значение а2: верхняя группа линий — погрешность оценки (12), средняя (пунктир) — редукции (13), нижняя — возможностной редукции (10), отдельные линии соответствуют распределениям шума: нормальному, равномерному в шаре, равномерному в прямоугольном параллелепипеде и такому, при котором координаты шума независимы и имеют сдвинутое и масштабированное бета-распределение
,1
10
ни
Сигнал / на входе ИП
Результат измерения а2 = 10"7
10
10
Рекуррентная оценка /100(12),х*11
—1д
Оценка (13), х » 9.3
Возможностная оценка (10), х « 21
Рис. 5. Результаты редукции измерения £ (б), входного сигнала ИП / (а) и оператора А (7), М = 102 при априорной информации о неотрицательности и ограниченности входного сигнала, / 6 = {/' € /' > 0, II/'II2 ^ ?2}, где q равно норме истинного входного сигнала /, теми же методами, что и на рис. 4, в-д
ная точка процесса (12), т. е. решение уравнения
/ = п
('С
(13)
относительно /.
На рис. 4 и 5 приведены результаты численного эксперимента, в котором оператор А определен формулой (7) при М = 102. В первом случае (/ априори неотрицателен и неограничен) результаты воз-можностной редукции имеют несколько меньшую с. к. погрешность, чем остальные результаты, что обусловлено лучшим подавлением возможностной редукцией шума там, где истинный входной сигнал был равен 0. Во втором случае ( / априори неотрицателен и ограничен) оценка (13) вероятностной редукции имеет несколько меньшую с. к. погрешность, чем рекуррентная оценка, и вдвое меньшую с. к. погрешность, чем возможностная оценка, что связано с большим подавлением шума на «плато» сигнала.
Замечание 4. В связи с тем, что далее сравниваются результаты возможностной и вероятностной моделей редукции, возникает вопрос о статистическом моделировании в вычислительном эксперименте шума как нечеткого элемента с заданным распределением возможностей [20]. Тем не менее в настоящей работе вероятностные и возможностные модели сравниваются по статистическому критерию, согласно которому все модели сравниваются по величине с. к. погрешности, а не по возможности неверного оценивания. Поэтому в данном случае оправдано использование данных, приготовленных статистически (т. е. при вероятностной, а не при возможностной интерпретации независимости входного сигнала / и погрешности V), как в вероятностной, так и в воз-можностной моделях редукции. Естественно ожидать, что при таком сравнении погрешностей веро-
ятностной и возможностной редукции погрешность вероятностной редукции априори не больше, чем возможностной. Это предположение оправдывается, если в модели измерения сигнал априори ограничен или если он — реализация случайного вектора (см. след. раздел), но не в рассмотренном в этом разделе случае априори произвольного неограниченного / , поскольку в этом случае априорной информации недостаточно для моделирования / случайным вектором, но достаточно для его моделирования нечетким вектором.
3. Теоретико-возможностная и теоретико-вероятностная априорная информация
Результаты возможностной и вероятностной редукции отличаются и в том случае, когда входной сигнал / — не произвольный вектор из Т1 с Т, а реализация случайного или нечеткого вектора ф, который далее считается статистически независимым от шума.
Пусть ф и V — независимые в смысле первого (второго) варианта теории возможностей нечеткие векторы, имеющие распределения необходимо-стей Нф(/) = Ьф(||/^1/2(/ -/0||2), / еТь Нф(/) = 1, / 6Т\ТЬ и Н"(у) = К(||Х-1/2у||2), у & X, где Р1: Т ^ Т, SV: X ^ X — положительно определенные операторы, Ьф(-): [0, то] ^ [0,1], ЬV(■): [0, то] ^ [0,1] — строго монотонно возрастающие, непрерывные функции, Ьф(0) = 0, ЬV(0) = 0 (совместное распределение необходимостей ф и V есть Нф'(/, у) = Ьф(||/^1/2(/ -/0||2) ?^(||Х-1/2у||2), / & Т1, Нф,1/(/, у) = 1, / & Т \ Т1), необходимость потерь п1(и/, V) при оценивании и/ значением V такова, что п1(и/, V) = 0 при и/ = V и п1(и/, V) >0 при и/ = V. Тогда оценка и/, минимизирующая необходимость потерь, есть [15] и/(х), где /(х) —
(любое) решение задачи минимизации [15, 21]
(f, x - Af ) = (14)
= MIFf 1/2(f - f1)||2) • bv(||£f 1/2(x - Af )||2) ~ min,
t eF1
где x — результат измерения £, a • c = min{a, c} для первого варианта теории возможностей и a • c = = 1 - (1 - a)(1 - c) для второго варианта теории возможностей, a, c е [0, 1] (см. разд. 1).
Построение оценки значения Uf для вероятностной модели измерений, дополненной условием f е Fi, аналогично описанному в предыдущем разделе, как уточнение оценки (6) определено рекуррентным процессом
/+1 = n(R£), £ =
f0
w
i = 0, 1, . . .
(15)
В (15) /о — оценка (6), R — оператор редукции
A
к U = I измерения по схеме £ =
при любом шуме v, т.е. для ИП
10
I
/ v N
f +
W
A
I I
Ф - f0
V v J
при шуме,
J fl
А
(XV 0
0
F
0 0
ковариационный оператор которого
х0 0 £ VJ
для простоты предполагается, что и = I. Другой вариант уточненной вероятностной оценки (6) определяется, аналогично (13), как решение уравнения
/
/ = п
R
\
f0 /f
(16)
относительно /.
При операторе А, определенном формулой (7), при М = 102 результаты уточнений интерпретации сравнивались в численном эксперименте. На рис. 6 показаны результаты вероятностной редукции (15) и (16) и результаты редукции (14) для первого и второго вариантов теории возможностей в случае Т1 = {/ е Т\/ ^ 0} .В этом случае результаты вероятностной редукции имеют меньшую с. к. погрешность, чем результаты возможностной редукции в связи с большим подавлением шума на «плато» сигнала, аналогично рис. 5. На рис. 3, в-д показаны результаты вероятностной и возможностной редукций в случае Т1 = Т. В этом случае, как показано в [15], для первого варианта теории возможностей при Ьф = ЬV результат возможностной редукции определен выражением
/1 + РА* (АРА* + ^(£)£ )71 (£ — А/1), (17)
10
Сигнал / на входе ИП
10
li.
Оценка (16), х ~ 6.4
Результат измерения Рекуррентная оценка <т2=1(Г7 /100(15),х*6.4
д - е
10
0
10
0
г г
Возможностная оценка, Возможностная оценка,
первый вариант второй вариант
теории возможностей (14), теории возможностей (14),
Х«19 х«19
Рис. 6. Результаты редукции измерения £ (б) входного сигнала / (а) при априорной информации: / — реализация нечеткого вектора ф, имеющего распределение необходимостей кф(/) = Ь(||/ — /1|2/ф2), / е , кф(/) = 1, / е 7 \ , /1 = 0, ф2 = 10, = {/' е 7 \ /' > 0} и распределении необходимостей
шума к (у) = Ь(||у||2/а2): в — рекуррентный метод (15), 100 отображений / ^ П (£, /0,
редукции к П(Я*£); г — неподвижная точка этого отображения (см. (16)); д и е — оценки редукции
а^тт Ь(||(/ — /1)|2/ф2) • Ь(||£ — А/||2/а2) для первого и второго вариантов теории возможностей /
где w(£) — принадлежащий [0, то) корень уравнения
u\\(X-1/2AFA* S-1/2 + ul )-1S-1/2(£ - A/i)y = = \\F 1/2A*S-1/2(S-1/2AFA*S-1/2 + ul )-1 x
x S-1/2(£ - A/1)\\,
если такой корень существует, и 0 в противном случае. Заметим, что эта оценка подобна известной в математической статистике оценке Джейм-са-Стейна [1, § 3.3], [22, 23].
4. Синтез измерительного прибора на измерительно-вычислительном преобразователе
В отличие от задачи наиболее точного синтеза выходного сигнала идеального ИП, которая рассматривалась выше, в этом разделе рассматривается задача оптимального синтеза непосредственно измерительного прибора.
Для несмещенной редукции (4) точный синтез на ИВП выходного сигнала заданного идеального прибора U имеет смысл лишь при условии, что точно известна модель схемы измерения, поскольку в противном случае требование h(R, U) = supE\\R(£) - Uf \\2 < то не может быть f ет
выполнено. Эта ситуация характерна для задач, в которых множество F1 возможных значений f не является ограниченным.
Пусть и — ИП, который требуется синтезировать на ИВП. Независимо от того, может быть синтезирован входной сигнал и или нет, рассмотрим задачу
\\RA - и\\2HS
min ,
R: trRS„R*<h
h ^ 0,
(18)
решение RHS(h) которой определит сигнал RHS(h)£ как искаженный шумом RHS(h)v выходной сигнал ИБП RHS(h)A, самого близкого (в смысле нормы Гильберта-Шмидта \\-\\hs) к идеальному U , при априорном ограничении на уровень шума E\\RHS(h)v\\2 < h, h ^ 0. Если AA* и Sv — невырожденные операторы, то при 0< h < tr U(A*S VA)-U* RHS(h) = UA*(AA* + u(h)Sv )-1, где u(h) — корень уравнения tr RHS(h)S vRHS(h) = h. При h ^ tr U(A*SVA)-U* оператор RHs(h) = R*, где R* — оператор несмещенной редукции (4).
Замечание 5. Хотя при h < tr RHS(h)SvRHS(h) supE\\RHS(h)£ - Uf \\2 = то, тем не менее если U
f ет
удовлетворяет условию (5) (допускает несмещенную редукцию), то для любого фиксированного f е F можно указать такое h < tr RHS(h)SvRHS(h), при котором E\\RHS(h)£ - Uf \\2 < h(R*, U) [1, §9.1]. Таким образом, выбирая h, можно получить меньшую погрешность интерпретации RHS(h)£ как выходного сигнала Uf, чем при несмещенной редукции. Для произвольного f этой рекомендацией воспользовать-
0 5нз 20
Оперативная характеристика
-г
10
Исходный сигнал /
Сигнал а1 = 10"7
а, А = 28
10
0
ДА = 8
10
Ъ
7, А = 0.7
а, к = 3 0,к= 3
Рис. 7. а — Оперативная характеристика семейства задач ||RA — U ||Hs
min
R: trRSvR*<h
7, fc=3
, h > 0, (18). Выбирая
точку на ней, исследователь указывает приемлемый для него компромисс между невязкой синтеза gнs = ЦЯт(к)А - и ||Нз и уровнем шума к = 1г Яш(к)^Я^(к), Яш(к) = ащтт[ЦЯА - и |Н \ Я: Х^Ы, 1г Я^Я* < к}. Результаты редукции измерения £ (в) входного сигнала / (б), «усиленные» умножением на число, чтобы нивелировать ослабление сигнала «целиком»: г-е — при выборе выделенных точек оперативной характеристики и и = I; ж-и — при выборе выделенных точек и и с аппаратной функцией «не шире» к = 3
10
1*1 ЛЬйпааЬ. АЛ А
а, к = 28
0,к = 3
7, к = 3
Рис. 8. Результаты редукции измерения £ (7, в) входного сигнала / (7, б), «усиленные» умножением на число, чтобы нивелировать ослабление пиков сигнала: (а-в) — при выборе выделенных на рис. 7, а точек оперативной характеристики и и = I; (г-е) — при выборе выделенных точек и и с аппаратной функцией
«не шире» к = 3
ся невозможно, поскольку неизвестно значение У/У , от которого зависит оптимальное к, но исследователь может получить выигрыш в точности, воспользовавшись оперативной характеристикой задач (18).
Зависимость близости ЯНэ(к)А к и удобно охарактеризовать графиком зависимости левой части (18) от к, называемой оперативной характеристикой семейства задач (18) синтеза ИП и на заданном ИВП. Выбирая точку на оперативной характеристике, исследователь указывает приемлемый, по его мнению, компромисс между невязкой синтеза ¿н = ||Яш (к)А — и||Н5 и уровнем шума к = ^ ЯНз(к)£^Н8(к). Пример такого выбора показан на рис. 7, 8.
Уменьшение с. к. погрешности редукции может также быть достигнуто выбором и из класса операторов, не ухудшающих заметность важных для исследователя деталей сигнала ЯНэ(к)£, но приводящих к дополнительному подавлению шума [10, 24-26]. Пример выбора такого и с аппаратной функцией «не шире» к показан на рис. 7, ж и 8, г-е (и, имеющего симметричную ленточную матрицу Тёплица с шириной ленты не более к [1, теорема 9.2.1] при к = 3 и выборе исследователем точек а, 7, 5 на рис. 7, а).
На рис. 7 результат редукции «усиливался» умножением на число так, чтобы нивелировать ослабление сигнала «целиком», при этом пики / были ослаблены, но уменьшился шум на «ровных» участках сигнала. На рис. 8 результат редукции «усиливался» умножением на число так, чтобы нивелировать ослабление пиков и соответственно, в отличие от рис. 7, «ровный» участок сигнала был восстановлен со значительной погрешностью, но пики сигнала — существенно точнее.
Замечание 6. Может показаться, что более естественна в (18) операторная норма ||-||, а не норма
Гильберта-Шмидта Ц-Цш, т.е. следовало бы решать задачу ЦЯА — и||2 - ттЯ: 1Г, к ^ 0. Оказалось, однако, что, например, при и = I решение последней задачи приводит к неожиданно «плохой» редукции, совпадающей с несмещенной редукцией (4) (рис. 2) с точностью до множителя, зависящего от точки на оперативной характеристике; следовательно, таким путем улучшить качество несмещенной редукции нельзя.
Заключение
Как показано в статье, оптимальное использование имеющейся у исследователя априорной информации о модели измерения позволяет значительно повысить точность интерпретации данных измерения. При этом, как правило, эффект от учета дополнительной информации тем больше, чем менее полна исходная модель измерений. Например, в показанном на рис. 4 случае априори произвольного входного сигнала учет информации о его неотрицательности уменьшает с. к. погрешность оценки значительно больше, чем в показанном на рис. 6 случае случайного входного сигнала, а для априори произвольного входного сигнала учет его неотрицательности тем больше уменьшает с. к. погрешность, чем больше уровень шума измерения (см. рис. 4, е).
Как видно из рис. 4-6 качество рекуррентной оценки (12), (15) незначительно хуже, чем оценки (13), (16). Примечательно, что в ряде показанных случаев, а именно если входной сигнал — априори произвольный элемент известного множества, охарактеризованного рядом ограничений, и для истинного значения входного сигнала среди этих ограничений относительно много активных, качество возможностной редукции оказалось лучше, чем вероятностной, хотя в возможностной редукции минимизируется не величина погрешности, как в вероятностной, а ее необходимость. Это связано с тем,
что такая априорная информация достаточна для того, чтобы моделировать входной сигнал нечетким элементом, но недостаточна для того, чтобы его моделировать случайным элементом.
Сложность вычисления результата редукции (количество затрачиваемых на вычисления ресурсов: времени, памяти компьютера и т. д.) существенно зависит от вида априорной информации. Например, как отмечено в замечании 3, если при условиях теоремы 1 множество F1 допустимых значений входного сигнала может быть охарактеризовано линейными или квадратичными ограничениями, то для вычисления результата возможностной редукции применимы эффективные алгоритмы условной минимизации функционала наименьших квадратов. В случае когда входной сигнал — реализация нечеткого вектора, вычисление результата возможностной редукции требует минимизации функционала (14), отличающегося от функционала наименьших квадратов, по всем допустимым значениям f, что является более сложной задачей в общем случае, но не при одинаковой «форме» (функциях bv и Ьф в (14)) распределений необходимостей значений входного сигнала и шума (см. (17)). Сложность вычисления результата вероятностной редукции зависит от сложности ортогонального проецирования на F1, поскольку вычисление оценок вероятностной редукции (4), (12), (6), (15) за вычетом проецирования сводится к решению систем линейных уравнений, причем в случае оценок (12) и (15) — с одинаковой матрицей, и системы уравнений с той же матрицей решаются при вычислении (13) и (16).
Работа выполнена при финансовой поддержке РФФИ (грант 14-07-00441).
Список литературы
1. Пытьев Ю.П. // Методы математического моделирования измерительно-вычислительных систем. 3-е изд., перераб. и доп. М., 2012.
2. Рао С.Р. // Линейные статистические методы и их применения. М., 1968. (Rao C.R. // Linear Statistical inference and Its Applications. New York, NY, 1965.)
3. Rao C.R., Toutenburg H., Shalabh, Heumann C. // Linear Models and Generalizations: Least Squares and Alternatives. 3rd ed. Berlin, 2007.
4. Тихонов А.Н., Арсенин В.Я. // Методы решения некорректных задач. 2-е изд. М., 1979. (Tikhonov A.N., Arsenin V.Y. // Solutions of Ill-posed Problems. Washington, D.C., 1977.)
5. Тихонов А.Н., Гончарский А.В., Степанов В.В., Ягола А.Г. // Численные методы решения некорректных задач. М., 1990. (Tikhonov A.N., Gonchar-sky A.V., Stepanov V.V, Yagola A.G. // Numerical Methods for the Solution of Ill-posed Problems. Dordrecht, 1995.)
6. Amato U., Hughes W. // Inverse Problems. 1991. 7, N 6. P. 793.
7. Borwein J.M. // Mathematical Programming. 1993. 61. P. 251.
8. Леонов А.С. // Сибирский матем. журн. 2000. 41, № 4. С. 863. (Leonov A.S. // Siberian Math. J. 2000. 41, N 4. P. 716.)
9. Чуличков А.И., Юань Б. // Вестн. Моск. ун-та. Физ. Астрон. 2014. № 3. С. 15. (Chulichkov A.I., Yuan B. // Moscow University Phys. Bull. 2014. 69, N 3. P. 218.)
10. Пытьев Ю.П. // Математические методы интерпретации эксперимента. М., 1989.
11. Чуличков А.И. // Основы теории измерительно-вычислительных систем сверхвысокого разрешения. Линейные стохастические измерительно-вычислительные системы. Тамбов, 2000.
12. Kacewicz, B.Z., Milanese M., Tempo R., Vicino A. // Systems & Control Letters. 1986. 8, N 2. P. 161.
13. Bjorck A. // Numerical Methods for Least Squares Problems. Philadelphia, PA, 1996.
14. Чуличков А.И., Юань Б. // Вестн. Моск. ун-та. Физ. Астрон. 2015. № 5. С. 24. (Chulichkov A.I., Yuan B. // Moscow University Phys. Bull. 2015. 70, N 5. P. 353.)
15. Пытьев Ю.П. // Возможность как альтернатива вероятности. 2-е изд., перераб. и доп. М., 2016.
16. Пытьев Ю.П. // Вестн. Моск. ун-та. Физ. Астрон. 2017. № 1. C. 3.
17. Lawson C.L., Hanson R.J. // Solving Least Squares Problems. Philadelphia, PA, 1995.
18. Strutz T. // Data Fitting and Uncertainty (A practical introduction to weighted least squares and beyond). 1st ed. Wiesbaden, 2010.
19. Bro R., De Long S. // J. of Chemometrics. 1997. 11, N 5. P. 393.
20. Пытьев Ю. П., Животников Г. С. // Интеллектуальные системы. 2001. 6, № 1-4. С. 63.
21. Балакин Д.А., Матвеева Т.В., Пытьев Ю.П., Фалом-кина О.В. // Интеллектуальные системы. 2014. 18, № 3. С. 61.
22. James W., Stein C. // Proc. Fourth Berkeley Symp. Math. Statist. Prob. 1. Berkeley, CA, 1961. P. 361.
23. Lehmann E.L., Casella G. // Theory of Point Estimation. 2nd ed. New York, NY, 1998.
24. Пытьев Ю.П. // ДАН СССР. 1980. 255, № 3. С. 540.
25. Козлов А.А., Пытьев Ю.П. // ЖВМиМФ. 1987. 27, № 3. С. 323. (Kozlov A.A., Pyt'yev Yu.P. // USSR Computational Mathematics and Mathematical Physics. 1987. 27, N 2. P. 1.
26. Жохов Н.Н., Козлов А.А., Пытьев Ю.П. // Математическое моделирование. 1991. 3, № 7. С. 57.
A comparative analysis of reduction quality for probabilistic and possibilistic measurement models D.A. Balakina, Yu.P. Pyt'evb
Department of Mathematical Modeling and Computer Science, Faculty of Physics, Lomonosov Moscow State University, Moscow 119991, Russia.
E-mail: a [email protected], b [email protected].
In this article, several known and new methods of solving the measurement data interpretation problem for probabilistic and possibilistic measurement models are compared and the dependency of their quality on the completeness and accuracy of the measurement model is analyzed. It is shown that optimal use of a researcher's prior information about the measurement model allows one to significantly increase the accuracy of the interpretation of measurements. In some cases the error of possibilistic interpretation was less than that of probabilistic one, even though possibilistic interpretation minimizes the necessity of the error, rather than the mean squared error. This is due to the fact that prior information may be sufficient to model the input signal using a fuzzy vector, but insufficient to model it using a random vector.
Keywords: mathematical model of measurement, measurement reduction, optimal decisions, measuring-computing systems. PACS: 02.50.Le. Received 7 June 2016.
English version: Moscow University Physics Bulletin. 2017. 72, No. 2. Pp. 101-112.
Сведения об авторах
1. Балакин Дмитрий Александрович — аспирант; тел.: (495) 939-41-78, e-mail: [email protected].
2. Пытьев Юрий Петрович — доктор физ.-мат. наук, профессор, зав. кафедрой; тел.: (495) 939-13-32, e-mail: [email protected].