Научная статья на тему 'Математическая Обработка коррелированных парных данных'

Математическая Обработка коррелированных парных данных Текст научной статьи по специальности «Математика»

CC BY
129
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Математическая Обработка коррелированных парных данных»

УДК 528.1 В.А. Падве СГГ А, Новосибирск

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА КОРРЕЛИРОВАННЫХ ПАРНЫХ ДАННЫХ

Геодезистам приходится сталкиваться с ситуацией, когда необходимо обрабатывать и анализировать парные данные, относящиеся к одному и тому же геодезическому построению. Это могут быть данные, полученные в разное время или по различным технологиям.

Простейшие варианты этой задачи хорошо известны. Это двойные измерения. Они могут быть равноточными или нет, зависимыми или нет. Пусть «п» - общее число данных, образующих две совокупности парных величин, по «к» значений в каждой, т. е. п = 2к.

Векторную модель истинных значений УП1 дважды измеряемых одних и тех же величин Хк1 можно представить в форме блочной матрицы:

¥т = (Хт; Хт), (1)

обозначив малыми буквами соответствующие числовые данные:

ут = (хт; х'т). (2)

Трём случаям независимых совокупностей числовых данных соответствуют такие ковариационные матрицы:

а2 I 0

0 I

(3)

В 0

Ку = 0 в

(4) в 0

ку = 0 В'

совокупности и пары равноточные;

пары равноточные, совокупности - нет;

- неравноточные совокупности и пары [1].

(5)

в к

Ку = к В'

Обработка данных, коррелированных внутри пар, но независимых внутри совокупностей [1], характеризуется «полной» матрицей:

- независимые совокупности, коррелированные пары.

(6)

Матрицы (3) - (6) состоят из таких блоков: I - единичная матрица; О -диагональная дисперсионная матрица первой совокупности; О' -диагональная дисперсионная матрица второй совокупности; К -диагональная матрица корреляционных моментов пар данных; ст2 - дисперсия равноточных данных.

Данные, коррелированные внутри совокупностей, но попарно независимые, характеризуются блочно-диагональной ковариационной матрицей (стохастическая составляющая модели):

У

Ку =

к.

0

0 к

(7)

Они могут быть обработаны с использованием одной из классических (коррелатной или параметрической) версий МНК-оптимизации данных, укрупнённая блок-схема которых приводится ниже.

Моделирование Линеаризация Нормализация

Ф(У)=0 BV+W=0 1\1Л-\Л/=0

У=Р(Х)

Уравнивание М НК-коррекция Решение НУ

X =х+ XX V =-к,ктЛ Л=N"1W

Детерминированная часть математической модели парных данных (уравнения связи) принимает вид, определяемый как структурой данных, так и версией МНК-оптимизации: коррелатной (КВ) или параметрической

(ПВ).

При обработке парных данных уравнения связи (УС) - это простые линейные функции:

Фк1(¥п1) = Хк1 - Хк1 = 0к1 - КВ- (8)

Ак1

¥п1 = ^(Хы) =

- ПВ.

(9)

В параметрических уравнениях связи (9) в качестве параметров используются измеряемые (определяемые) величины Хк1. Их приближённые значения Х0к1 полагаются равными первичным данным, т. е.:

Х0Ы = Хк1. (10)

Коэффициенты линеаризованных условных или параметрических уравнений поправок представляют собой блоки единичных матриц:

Вкп - Скк (I

Апк -

-I

кк

Ч1ккУ

кк

ПВ.

КВ;

(11)

(12)

Свободные члены этих уравнений, с учётом (2) и (8), будут равны: 4^1 = Фк1(уш) = хи - х'и = Е>ы, КВ, (13)

(т. е. «разности» пар - это «невязки» условных УС).

Ьп1 = Уп1 - Рді(хкі) =

ҐХ Л Хк1

Х

Хк1

ПВ.

(14)

'к1

ЧХк1^ ^_Вк1У

Дальнейшее развитие процесса МНК-оптимизации коррелированных парных данных имеет смысл, если разности-невязки не превышают допустимых значений:

4°"=<1-а/2*Л/(К*+К*'Ь> (У) = 1,2,...,к). (15)

Здесь 1:1_а/2 - (ЮО - а/2)%-ая квантиль нормального распределения. Единичные недопустимые разности свидетельствуют о грубых промахах в отдельных первичных или вторичных данных. Такие пары данных должны быть исключены из дальнейшей обработки. Массовые недопустимые разности свидетельствуют о систематических расхождениях между совокупностями первичных и вторичных данных.

Коэффициенты нормальных уравнений, для обеих версий, - это функции ковариационных матриц данных (7):

Мкк = ВКВ1 =КХ + КХ- КВ; К-кк = АТК-1 А = К'1 +К

(16)

ПВ.

(17)

Свободные члены нормальных параметрических уравнений являются функциями как разностей Dk1, так и ковариационной матрицы повторных данных Кх-:

=АТК'1Ь= -КХЬ. (18)

Решение нормальных уравнений с коэффициентами (16) или (17) и свободными членами (13) или (18), соответственно, даёт коррелаты или V/11 К-п о правки к параметрам.

Л

к1

Х

к1

^к1; = Ккк^к1.

(19)

(20)

Переход к МНК-поправкам в данные (2) зависит от версии: ук1 = -КхЛк1; Уы = +Кх.Лк1 КВ; (21)

ПВ. (22)

^к1 - Хк1

В

к1

Наконец, уравненные значения данных и параметров будут равны:

Хк1 = Хкі + ^кі= хкі + ^кі КВ; (23)

Хкі=хкі+хкі ПВ. (24)

Оценку точности данных можно выполнить, вычислив апостериорное значение масштабного показателя точности. Априори он полагался равным единице. Формулы будут зависеть от версии:

И

ВІА

Ік^кі

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к

^Тт^-Ь

-х'

у1кКх- Эк1

к

КВ;

ПВ.

(25)

(26)

Апостериорные ковариационные матрицы

данных и параметров равны, соответственно:

уравненных значении

Ку =

Кх К Кх К

X

X

; Кх = М' (к

х(х')

■кх(х0м-1кх(х>)) = ку АВ;

я-1 я я-1 я

-1

-1

-1

ПВ.

(28)

Обработка парных данных обычно ограничивается оценкой точности измерений и средних значений пар. Важнейший практический вопрос -«Существенна ли разница между технологиями, с помощью которых были получены первичные и вторичные данные?» явно не ставится. Его можно перефразировать в форме статистической гипотезы: «Значимо ли среднее значение разностей, как остаточных систематических факторов, воздействующих на исследуемые технологии»?

Для ответа на этот вопрос необходимо проверить нулевую гипотезу «о незначимости среднего значения разностей», т. е.

Н0 = { Е(Н) = 0 } (29)

против альтернативной На={Е(Н)*0}. (30)

Воспользуемся тестом [2]

d

ш-

(31)

где ё - среднее значение равноточных (или неравноточных), зависимых (или независимых) разностей, а ш^ - средняя квадратическая погрешность

этого среднего. Полагая распределение данных нормальным, мы будем иметь нормальным распределение любых линейных функций таких данных, каковыми являются все вышеназванные средние значения разностей. Тест (31) сравнивается с квантилью стандартного нормального распределения на уровне значимости «а»:

1т = 1:1-а/2. (32)

Если % > 1г, то нулевая гипотеза (29) «о незначимости среднего значения разностей» - отвергается, т.е. использованные технологии приводят к результатам, имеющим систематические отличия. Эти отличия, оцениваемые в виде средних значений разностей, вводятся в исходные разности:

(1' = (1-Н.

Приводимая ниже таблица (таб. 1) содержит необходимые формулы.

Таблица 1

*

Данные Параметры Независимые равноточные Независимые неравноточные Зависимые неравноточные

Среднее значение Н = [сЦ/к (33) 5 = М/[р] (37) 3 = [Р<Ч/[Р] (41)

СКО среднего =л/вд/к (34) =л/[Р^]/к(38) т| = 1" *М*1:'Т(42)

Точность данных ц2 = [ёё]/2к (35) \х2 =[рё(1]/2к(39) \12 = [Рё(1]/к (43)

Точность исправленных данных 2 [сГсГ] а = — — (36) 2(к -1) 2 [рй'сГ] Ц = — (40) 2(к-1) 2 [РС1'СГ] Ц = 1 (44) 2(к-1)

В формулах (33) - (44) введены обозначения, частично согласованные с учебником [1]. Нормальная матрица коррелат (16) является ковариационной матрицей разностей-невязок, т. е. = К0. По зависимым неравноточным разностям вычисляется их среднее (41). Обозначим обратную матрицу нормальных уравнений через Ркк, и назовём её «квази-весовой» матрицей разностей т. е.

^=Ркк={Р,}- (45)

Элементы этой матрицы используются для вычисления числителя и знаменателя формул (41) и (42):

[Р] = ЦР„; Р, = 1РЙ; [РА = * <1;); [Р<И] = да,.

1 j j 1 1 j

(43)

Формулы (37) - (40) описывают случай независимых неравноточных данных. Матрица (45) становится диагональной:

^ =ркк = (11ае{р1,р2,...,рк} = . (44)

СТ1 ст2 стк

Обозначения в формулах (37) - (39) - стандартные:

[р]=Ер, ; [р<4=Кр, * а, ); [Раа]=Хр, * ^. (45)

1 1 1

1. Машимов М.М. Методы математической обработки астрономо-геодезических измерений. Москва, Издание ВИА, 1990.

2. Дж. Лоллард. Справочник по вычислительным методам статистики. Москва, «Финансы и статистика», 1982.

© В.А. Падве, 2005

i Надоели баннеры? Вы всегда можете отключить рекламу.