К ПРИМЕНЕНИЮ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ДАННЫХ GPS ПРИЕМНИКОВ
Искендеров И.А.
кандидат физика-матиматических наук, зав. каф. Авионики
Национальная Академия Авиации Фараджев В.И. магистр
Национальная Академия Авиации
TO APPLICATION OF METHODS OF MATHEMATICAL STATISTICS FOR INCREASING ACCURACY OF DATA OF GPS
RECEIVERS
Iskenderov I.A.
Candidate of Physics and Mathematics, Head of the Department of Avionics
National Academy of Aviation Faradjev V.I. Master
National Academy of Aviation
АННОТАЦИЯ
В данной работе рассматриваются особенности GPS приемников работающих в гражданском режиме и приводятся результаты аппроксимации данных с последующей статистической обработкой результатов измерений. ABSTRACT
In this article, the features of GPS receivers working in the civil mode are considered and the results of data approximation with subsequent statistical processing of the measurement results are given.
Ключевые слова: матиматическая статистика, аппроксимация, обработка результатов измерений, GPS приемники.
Keywords: mathematical statistics, approximation, processing of measurement results, GPS receivers.
Проведенное исследование особенностей аппаратуры спутниковой навигации, особенно бортовой аппаратуры летательных аппаратов показали, что несмотря на ряд функциональных возможностей разновидностей GPS-приемников и интегрированных навигационных систем, построенных на их основе, необходимо разрабатывать новые методы и средства, обеспечивающие улучшение эксплуатационно-технических характеристик и повышения надежности навигационной информации, получаемой спутниковой радионавигационной системой.
Как известно, для увеличения точности определения местоположения объекта (ВС, автомобиля и т.д.) с помощью GPS-приемников гражданского режима используются дифференциальные режимы GPS, обеспечиваемые с помощью таких систем как LAAS, WAAS, MSAS, GAGAN и т.д. Однако дифференциальный режим требует наличие дополнительных локальных, региональных или широко зональных наземных или воздушных систем [1,2].
В ходе проводимых исследований выяснено, что применение численных методов математического моделирования и методов статистической обработки результатов измерений с использованием прикладных программ дает возможность в значительной степени повысить точность измерений, без использования дифференциального режима.
Целью данной работы является получение уравнения регрессии в программной среде MS Excel и проведение обработку результатов измерений с использованием этой программы.
Анализ возможностей и особенностей методов статистической обработки показал, что регрессионный анализ является одним из наиболее удобных средств обработки результатов измерений проводимых GPS приемником, который позволяет установить связь между некоторым параметром Y наблюдаемого явления и величиной xi, x2, x3,..., которое объясняет изменение Y. В данном случае это связь между широтой (x) и долготой (у), обеспечивающая определение местоположения объекта с помощью приемника спутниковой системы навигации GPS [2].
Использование программы MS Excel для обработки табличных данных результатов измерений оказалось наиболее эффективным, так как после проведения несложных расчетов в среде MS Excel получились довольно таки достаточно точные данные, после обработки результатов измерений.
Для проведения исследований были взяты данные полученные с использованием GPS модуля NEO-6M и добавлены в Excel в виде таблицы. Для проведения предварительного анализа за основу были взяты 25 измерений (рис.1). Для более значительных массивов данных целесообразно ис-
пользовать полином Лагранжа и составлять базисный полином.
Для полного анализа результатов измерений были использованы различные варианты регрессионного анализа, в частности линейная, параболическая и логарифмическая регрессии.
Особенности применения линейной регрессии.
Для получения отчета по модели регрессии, в начале, была выполнена команда MS Таблица 1
Регрессионная статистика
Множественный R 0,992693901
R-квадрат 0,985441181
Нормированный R-квадрат 0,984808189
Стандартная ошибка 3,60683E-06
Наблюдения 25
Excel: Сервис/Анализ данных/Регрессия. Далее в диалоговом окне Регрессия были введены: Входной интервал Y, Входной интервал X, Метки (так как Входные интервалы Х, Y включают в себя подписи сверху), Уровень надежности (0.05), Остатки, Стандартизованные остатки (выявлять статистические выбросы), График остатков, График подбора [3]. В результате получен следующий отчет:
Таблица 2
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 2,02528E-08 2,02528E-08 1556,798497 1,245^-22 Остаток 23 2,992^-10 1,30093E-11 Итого 24 2,0552E-08
Таблица 3
Оценка параметров уравнения регрессии
тг л. л. Стандартная ^ P- тт „„„, Верхние
Коэффициенты г ^статистика „ Нижние 95%
ошибка Значение 95%
Y-
81,78722841 0,803753979 101,7565455 4,91648Б-32 80,12453662 83,44992019
пересечение
x -0,78579582 0,019915605 -39,4562859 1,24519Б-22 -0,826994389 -0,744597252
Таблица 4
Вывод остатка
Наблюдение Предсказанное y Остатки Стандартные остатк
1 50,07402254 8,46041E-06 2,396111998
2 50,07403197 3,03086E-06 0,85838468
3 50,07403747 -2,46971E-06 -0,699456788
4 50,07404376 -7,56073E-07 -0,214130927
5 50,0740524 -2,39983E-06 -0,679665924
6 50,0740524 -2,39983E-06 -0,679665924
7 50,07405869 -6,86194E-07 -0,194340066
8 50,07406497 -6,97256E-06 -1,974730312
9 50,07406812 -6,11574E-06 -1,732067382
10 50,0740799 -2,90268E-06 -0,822081393
11 50,07408305 -2,04586E-06 -0,579418465
12 50,0740854 3,59675E-06 1,0186513
13 50,07408855 3,45356E-06 0,978099718
14 50,07409483 1,1672E-06 0,330567523
15 50,07409483 5,1672E-06 1,463425578
16 50,07409483 1,1672E-06 0,330567523
17 50,07409798 -1,97598E-06 -0,559627601
18 50,07410033 -3,33372E-07 -0,09441589
19 50,07410033 -3,33372E-07 -0,09441589
20 50,07410662 1,38026E-06 0,390909973
21 50,07410976 5,23708E-06 1,48321644
22 50,07411841 5,93324E-07 0,168037905
23 50,07411841 5,93324E-07 0,168037905
24 50,07411605 -1,04929E-06 -0,297173807
25 50,07411841 -3,40668E-06 -0,964820151
Анализ полученных результатов. • 0 < R < 0,3: связь слабая или отсутствует
1. Оценим тесноту связи между фактором х и • 0,3 < R < 0,7: связь средняя
результатом Y в данной выборке: • 0,7 < R < 1: связь тесная
Множественный коэффициент корреляции R R = 0,992693901, т.е. связь между признаками
(табл. 1) тесная.
2. Оценим качество регрессионной модели:
Коэффициент детерминации R2 (табл. 1) R2 =
0,985441181 т.е. в 98.54% случаев изменения х приводят к изменению у.
3. В таблице «Дисперсионный анализ» (табл.2) на пересечении столбца «SS» и строки «Регрессия» находится значение объясненной дисперсии (RSS = 2,02528E-08); на пересечении столбца «SS» и строки «Остаток» находится значение остаточной дисперсии (ESS = 2,99213E-10), на пересечении столбца «SS» и строки «Итого» находится значение общей дисперсии (TSS = 2,0552E-08).
4. Значимость уравнения регрессии.
Коэффициенты корреляции и детерминации,
которые свидетельствуют о наличии связи между показателями X и Y были рассчитаны по выборке. Возможно, что обнаруженная взаимосвязь присутствует в данных только этой выборки, и не будет характерной для всей генеральной совокупности. Выдвигается нулевая гипотеза, которая утверждает, что для всей генеральной совокупности значение коэффициента детерминации R2 = 0 (следовательно, и коэффициент корреляции R=0), то есть, между X и Y никакой взаимосвязи нет и выявленная нами взаимосвязь данных - не что иное, как продукт случайного сочетания определенных пар значений X и Y.
Значимость F (табл. 2) - вероятность выполнения нулевой гипотезы для коэффициента детерминации R2. При этом, если:
• Если значимость F < 5% , то R2 статистически значим с надежностью 95%. Другими словами, по крайней мере, для 95 выборок из 100 рассчитанные коэффициенты детерминации будут значимо отличны от нуля.
• Если значимость F > 5%, то R2 статистически незначим с надежностью 95%. F = 1,24519E-22%, т.е. R2 и уравнение регрессии в целом статистически значимы с надежностью 95%
5. Анализ коэффициентов регрессионной модели.
5.1. Значения коэффициентов уравнения (столбец «Коэффициенты» табл. 3).
Строка Y-пересечение содержит все характеристики для анализа свободного члена уравнения регрессии.
Строка с названием фактора содержит все характеристики для анализа коэффициентов a и b -коэффициента уравнения при рассматриваемом факторе.
а = 81,78722841; b = -0,78579582 (1)
Уравнение регрессии:
у = -0.786 х + 81.787 (2)
5.2. Значимость коэффициентов уравнения регрессии.
Значения коэффициентов регрессии были рассчитаны по данным выборки. Необходимо убедиться, что рассчитанные коэффициенты будут статистически значимы (т.е. отличны от нуля для значительной части выборок из рассматриваемой генеральной совокупности) и войдут в модель. Для оценки статистической значимости коэффициента
41
регрессии выдвигается нулевая гипотеза о равенстве коэффициентов регрессии нулю. Для коэффициента bi математическая форма записи нуль-гипотезы и альтернативной ей гипотезы следующая:
• Ho: b = 0 - коэффициент незначим;
• Hi: b Ф 0 - коэффициент значимый;
P-значение (табл. 3) - вероятность выполнения нулевой гипотезы для соответствующего коэффициента:
• Если P-значение <5%, то коэффициент статистически значим с надежностью 95%, и включается в модель;
• Если P-значение >5%, то коэффициент статистически незначим с надежностью 95%.
Примечание: Если коэффициент «а» статистически незначим, то можно перестроить модель, установив в диалоговом окне «Регрессия» флажок «Константа-ноль».
Р(-0,78579582) = 1,24519Я -22% (значим) (3)
5.3. Доверительный интервал для коэффициентов регрессии. (столбцы «Нижние 95%» и «Верхние 95%» табл. 3).
-0,826994389 < Ъ < -0,744597252 (4)
6. Анализ статистических выбросов.
По величине стандартных остатков определяются статистические выбросы - наблюдения, которые достаточно далеко отклоняются от построенной прямой регрессии.
Наблюдение считается статистическим выбросом, если стандартный остаток по модулю больше или равен 2. Такое наблюдение удаляется из рассматриваемой выборки и регрессия перестраивается только в том случае, если R < 0,7 или параметры регрессии незначимы. Величина S2 рассчитана в отчете EXCEL в табл. 2: S2 = 1,30093E-11
7. Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
l = ayi-y*|:yi100% (5)
п
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
- 1717
А = 1717100% = 6.87% (6)
2.5 v '
В среднем, расчетные значения отклоняются от фактических на 6.87%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
8. Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.
E = O38806= 0.80 (8)
Л О -1 л о 4 '
Средний коэффициент эластичности Е показывает, на сколько процентов в среднем по сово- т, л.4""4" , ^
„ Коэффициент эластичности меньше 1. Следо-
купности изменится результат у от своей средней V , 0/
ж ю/ вательно, при изменении Х на 1%, У изменится
величины при изменении фактора х на 1% от свое го среднего значения [3-5].
Коэффициент эластичности находится по формуле:
Е = = ь- (7)
дху у
менее чем на 1%. Другими словами - влияние Х на У не существенно.
Особенности применения параболической регрессии.
В результате получен следующий отчет:
Таблица 5
Регрессионная статистика
Множественный R
0,992693882
R-квадрат 0,985441143
Нормированный R-квадрат 0,941329888
Стандартная ошибка 3,60684Е-06
Наблюдения 25
Регрессия
Остаток
Итого
df SS
2 2,02528E-08
23 2,99214E-10
25 2,0552E-08
Дисперсионный анализ
MS
1,01264E-08 1,30093E-11
1556,794316
Таблица 6
Значимость F 2,02833E-24
Оценка параметров уравнения регрессии
Коэффициенты Стандартная ^статистика Р-Значение ошибка
Таблица 7
Нижние Верхние 95% 95%
Y-
пересечение
65,93065119
0,401877433
164,0566149
8,45815E-37
65,09930438 66,761998
65535
-0,009735315
0,000246737
-39,45623292
0,010245729 0,0092249
F
0
0
0
0
x
2
x
Таблица 8
Вывод остатка
Наблюдение Предсказанное y Остатки Стандартные остатки
1 50,07402254 8,46044E-06 2,445526426
2 50,07403197 3,03088E-06 0,876088117
3 50,07403747 -2,4697E-06 -0,713877037
4 50,07404376 -7,56073E-07 -0,218545972
5 50,0740524 -2,39983E-06 -0,693682051
6 50,0740524 -2,39983E-06 -0,693682051
7 50,07405869 -6,86204E-07 -0,19835013
8 50,07406497 -6,97257E-06 -2,015451608
9 50,07406812 -6,11576E-06 -1,767785333
10 50,0740799 -2,90269E-06 -0,839035997
11 50,07408305 -2,04588E-06 -0,591369295
12 50,0740854 3,59674E-06 1,039651892
13 50,07408855 3,45355E-06 0,998264533
14 50,07409483 1,16719E-06 0,337381643
15 50,07409483 5,16719E-06 1,493598524
16 50,07409483 1,16719E-06 0,337381643
17 50,07409798 -1,97599E-06 -0,571168105
18 50,07410033 -3,33375E-07 -0,096363477
19 50,07410033 -3,33375E-07 -0,096363477
20 50,07410662 1,38026E-06 0,39897119
21 50,07410976 5,23708E-06 1,513801318
22 50,07411841 5,93341E-07 0,171507781
23 50,07411841 5,93341E-07 0,171507781
24 50,07411605 -1,04927E-06 -0,303297235
25 50,07411841 -3,40666E-06 -0,9847091
Анализ полученных результатов. 2. Оценим качество регрессионной модели:
1. Оценим тесноту связи между фактором х и Коэффициент детерминации R2 (табл. 5) R2 =
результатом У в данной выборке: 0,985441143 т.е. в 98.54% случаев изменения х
R = 0,992693882, т.е. связь между признаками приводят к изменению у. тесная.
3. В таблице «Дисперсионный анализ» (табл.6) на пересечении столбца «SS» и строки «Регрессия» находится значение объясненной дисперсии (RSS = 2,02528E-08); на пересечении столбца «SS» и строки «Остаток» находится значение остаточной дисперсии (ESS = 2,99214E-10), на пересечении столбца «SS» и строки «Итого» находится значение общей дисперсии (TSS = 2,0552E-08).
4. Значимость уравнения регрессии.
F = 2,02833E-24%, т.е. R2 и уравнение регрессии в целом статистически значимы с надежностью 95%
5. Анализ коэффициентов регрессионной модели.
5.1. Значения коэффициентов уравнения (столбец «Коэффициенты» табл. 7).
а = 65,93065119; Ъ = 0; с = -0,009735315 (9)
Уравнение регрессии:
у = -0.009735315 х2 + 0 х + 65.931 (10)
5.2. Доверительный интервал для коэффициентов регрессии. (столбцы «Нижние 95%» и «Верхние 95%» табл. 7).
0 < Ъ < 0 (11) 0,010245729 < с < -0,0092249 (12)
6. Анализ статистических выбросов. Величина S2 рассчитана в отчете EXCEL в
табл. 6: S2 = 1,30093E-11
7. Ошибка аппроксимации.
100% (13)
- 1 717
А = 171-100% = 6.87% (14)
В среднем, расчетные значения отклоняются от фактических на 6.87%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
8. Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
Е = (Ь + 2ах")^ (15)
Е = (0 + 2 - 0.009735315 • 38.806)38806 =
0.96 (16)
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно [5-8].
Особенности применения логарифмической регрессии.
В результате получен следующий отчет:
Таблица 9
Регрессионная статистика
Множественный R
0,99269392
R-квадрат 0,98544122
Нормированный R-квадрат 0,984808229
Стандартная ошибка 3,60683E-06
Наблюдения 25
Регрессия
Остаток
Итого
df
1
Дисперсионный анализ
SS MS
Таблица 10
2,02528E-08
23 2,99212E-10
24 2,0552E-08
2,02528E-08 1,30092E-11
1556,802677
Значимость F 1,24515E-22
Таблица 11 Оценка параметров уравнения регрессии
Стандартная
Коэффициенты -
ошибка
статистика
P-Значение Нижние 95% Верхние 95%
Y-
пересечение
167,3426546
2,9721098
56,304330 3,79407E-26 161,194377
173,4909323
ln(x)
-31,71315444
0,8037530
-39,456338 1,24515E-22
-33,37584439 -30,05046448
П
F
t
Таблица 12
Вывод остатка
Наблюдение Предсказанное y Остатки Стандартные остатки
1 50,07402254 8,46039E-06 2,396107229
2 50,07403197 3,03085E-06 0,858381809
3 50,07403747 -2,46971E-06 -0,69945979
4 50,07404376 -7,56074E-07 -0,214131418
5 50,0740524 -2,39982E-06 -0,679665028
6 50,0740524 -2,39982E-06 -0,679665028
7 50,07405869 -6,86184E-07 -0,194337493
8 50,07406497 -6,97255E-06 -1,974729415
9 50,07406812 -6,11573E-06 -1,732065955
10 50,0740799 -2,90267E-06 -0,822078766
11 50,07408305 -2,04585E-06 -0,579415728
12 50,0740854 3,59676E-06 1,018655936
13 50,07408855 3,45358E-06 0,978103938
14 50,07409483 1,16721E-06 0,33056989
15 50,07409483 5,16721E-06 1,463429444
16 50,07409483 1,16721E-06 0,33056989
17 50,07409798 -1,97598E-06 -0,559627043
18 50,07410033 -3,3337E-07 -0,094415246
19 50,07410033 -3,3337E-07 -0,094415246
20 50,07410662 1,38026E-06 0,390909601
21 50,07410976 5,23707E-06 1,483216555
22 50,07411841 5,93306E-07 0,168033183
23 50,07411841 5,93306E-07 0,168033183
24 50,07411605 -1,0493E-06 -0,297178236
25 50,07411841 -3,40669E-06 -0,964826372
Анализ полученных результатов. 2. Оценим качество регрессионной модели:
1. Оценим тесноту связи между фактором х и Коэффициент детерминации R2 (табл. 9) R2 =
результатом У в данной выборке: 0,98544122 т.е. в 98.54% случаев изменения х при-
R = 0,99269392, т.е. связь между признаками водят к изменению у. тесная.
3. В таблице «Дисперсионный анализ» (табл.10) на пересечении столбца «SS» и строки «Регрессия» находится значение объясненной дисперсии (RSS = 2,02528E-08); на пересечении столбца «SS» и строки «Остаток» находится значение остаточной дисперсии (ESS = 2,99212E-10), на пересечении столбца «SS» и строки «Итого» находится значение общей дисперсии (TSS = 2,0552E-08).
4. Значимость уравнения регрессии.
F = 1,24515E-22%, т.е. R2 и уравнение регрессии в целом статистически значимы с надежностью 95%
5. Анализ коэффициентов регрессионной модели.
5.1. Значения коэффициентов уравнения (столбец «Коэффициенты» табл. 11).
а = 167,3426546; Ъ = -31,71315444 (17)
Уравнение регрессии:
у = -31.713 /п(х) + 167.343 (18)
5.2. Значимость коэффициентов уравнения регрессии.
Р (-31,71315444) = 1,24515Я 22% (значим) (19)
5.3. Доверительный интервал для коэффициентов регрессии. (столбцы «Нижние 95%» и «Верхние 95%» табл. 11).
-33,37584439 < Ъ < -30,05046448 (20)
6. Анализ статистических выбросов. Величина S2 рассчитана в отчете EXCEL в
табл. 10: S2 = 1,30092E-11
7. Ошибка аппроксимации.
А
я _ £1уг-Ы:уг
100% (21)
- 1717
А = 171-100% = 6.87% (22)
2.
В среднем, расчетные значения отклоняются от фактических на 6.87%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
8. Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
— - (23)
Эжу у
Е = -3138806= -24.98 (24)
л о л л о 4 /
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно [8-9].
Таблица 13
Сравнение линейной, парабалической и логарифмической регресии
Показатели Линейная регрессия
Параболическая регрессия
Логарифмическая регрессия
Индекс (коэффициент) корре- 0,992693901
ляции
0,992693882
0,99269392
Коэффициент детерминации
0,985441181
0,985441143
0,98544122
Уравнение регресии
у = -0.786 x + 81.787 у = -0.009735315 x2 + 0 x + 65.931 у = -31.713 ln(x) + 167.343
Надежность уравнения регрессии
Уравнение регрессии значимо
Уравнение регрессии значимо
Уравнение регрессии зна-
чимо
Надежность коэффициентов
-0,78579582 (значим);
0 (значим); -0,009735315 (значим);
-31,71315444 (значим);
Ошибка аппроксимации
6.87
6.87
6.87
Коэффициент эластичности
0.80
0.96
-24.98
п
Подставив значения х в уравнение линейной регрессии можно получить следующую диаграмму, приведенную на рис. 1.
-----Линия регрессии • Исходные табличные данные
40,358100 40,358080 40,358060 40,358040
< к
2 40,358020 S
3
40,358X0
40,357980
40,357960
40,357940 50,
чч • \ Хо
«Ч
\ V
я
ч х.
ь
074 50,07402 50,07404 50,07406 50,07408 50,0741 50,07412 50,07414
ДОЛГОТА
Рис. 1. Графическая зависимость между координатами (в).
Вторым способом аппроксимации данных с приемника GPS возможно с помощью полиномов. Однако стоит учесть, что для построения полинома необходимо вывести его уравнение.
Полиномиальный тренд применяется для описания значений временных рядов, попеременно возрастающих и убывающих. Полином отлично подходит для анализа большого набора данных нестабильной величины (например, продажи сезонных товаров). Полином — это степенная функция у=ах2+Ьх+с (полином второй степени) и
G Н I I
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Исходные табличные данные -—Полиномиальная (Исходные табличные данные)
y=ax3+bx2+cx+d (полином третей степени) и т.д. Степень полинома определяет количество экстремумов (пиков), т.е. максимальных и минимальных значений на анализируемом промежутке времени.
С помощью программы MS Excel можно построить полиномы 2, 3 ... 6 степени. Нужно всего лишь ввести исходные данные в виде таблицы. Построить график и добавить в этот график линию тренда. Далее нужно всего лишь настроить линию тренда для полинома.
L М N Я
Формат линии тренда * х
Параметры линии тренда т
• V»
IV X
1 N,
9 "N* е
40,357940 -
50,0740280,0740330,0740480,0740580,0740680,0740780,0740880,07409150,0741050,0741180,0741260,074130 ДОЛГОТА
40,357982 50,074
+ 57982 50,074
¿¿7982 J 57978 50,074 50,07
'±¿'57975 50,07
Д-57975 50,07
40,357967 50,074
40,357963 50,074
40,357952 50,074
40,357952 50,074
40,357955 50,074
40,357952 50,074
Нет линий • Сплошная линия Градиентная линия Автовыбор
Цвет
Прозрачность I-
Ширина Составной тип
Тип начальной стрелки
Рис. 2. Параметры линии тренда графика табличных данных
Так же в этой графе имеется возможность добавления уравнения данного полинома и такой показатель как R (величина достоверности аппроксимации). Для того чтобы выбрать наиболее достоверную аппроксимацию необходимым чтобы
R был максимально приближен или равен 1. Аппроксимация со значением R>1 не считается достоверным. Значение R во многом зависит от числа измерений и степени полинома. Это можно заметить на следующих рисунках.
Аппроксимация для 30 измерений
у = -Щ7677*2 + 10 992,3559х - 275 158,7376 RJ = 0,9288
л
о о №»0
у = 13 976 432,00х3 - 2 099 575 092,79х; +105 134 499 998,58х - 1 754 841 273 607,07
[ I I g-0,66 _ |
374100 50,074120 50,074140 50,074160 50,07418)
О
Рис. 3. Аппроксимация для 30 измерений
Аппроксимация для 20 измерений
у = 3 875,34x2 - 388 109,74х + 9 717 202,75 R: = 0.98
79Л 1 v = -23 048 016,00x3 + 3 462 336 233.22x2 -173 373 884 501,66х + 2 893 855 651 500,53
_R'=0,94_' __
7960 ----- —--——;--—;-1—!-
50,0741« 50,074133 50,074160 50.0741Л 50.0741S) 50.0741S0 500742 (В 50,0742 Ю 50,074220 50,074230 50,074240
Рис. 4. Аппроксимация для 20 измерений
Аппроксимация для 10 измерений
у = -193,58х2 + 19 385,40х - 485 292,00
1. Г R1 -1,00
' 1 у = 27 792 680,00х3 - 4 175 088 145,31х2 + 209 064 173 504,44х - 3 489 573 323 261,14
R* = 0.88
40,35796 И-'-1-
50,074140 50,074150 50,074160 50,074170 50,074180 50,074190 50,074200 50,074210 50,074220 50,074230 50,074240
Рис. 5. Аппроксимация для 10 измерений
Красные линии (и формулы) на этих рисунках соответствуют полиномам 2 - ой степени. А синие
линии (и формулы) - полиномам 3-ей степени. Отсюда видно, что с увеличением числа измере-
ний изменяется коэффициенты уравнений, показатель R и наибольшей достоверностью обладают полиномы 2 - ой степени. 30 измерений - R=0,92 20 измерений - R=0,98 10 измерений - R=1,00
Заключение
Анализ данных полученных GPS модулем NEO-6m и расчеты с применением регрессионнно-го анализа с использованием MS Excel покозали что после проведения статистической обработки можно довести точность измерений координат до 2-5 м, тем самым обеспечит решение некоторых навигационных задач без использования дополнительных средств.
Проведенный регрессионный анализ показал что независимо от того какой вид регресси применяется их коэффициент детерминации остаются приблизительно равными, т.е. в 98.54% случаев изменения х приводят к изменению у. Так же следует отметить тот факт, что во всех трех видах регрессионной модели множественный коэффициент корреляции R остается равным 0,99, что свидетельствует о том что связь между x и y согласно условию 0,7 < R < 1 тесная.
Примененный метод полиномной аппроксимации показал что в случае 25 измерений следует воспользоваться полиномом второй степени так как коэффициент достоверности максимально приближен к 1 (0,98). Однако с увеличением числа измерений коэффициент достоверности полинома
второй степени уменьшается. В связи с этим для аппроксимации большого объема данных необходимо воспользоваться полиномом 3, 4, ..., 6 степени.
Литература
1. Комаров Р. В. Методические аспекты оценки точности спутниковых измерений. Ученые записки Казанского университета. Серия Физико-математические науки. г. Казань. 2008. с. 46
2. Синякин А. К.,Кошелев А. В. Вопросы корреляционной обработки GPS-сигналов. Интерэкспо Гео-Сибирь. 2005. г. Новосибирск
3. Практикум по эконометрике: Учеб. пособие/ И.И. Елисеева, С.В. Курышева Н.М. Гордеенко и др. Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2005.
4. Эконометрика. Учебник./ Елисеева И.И., Курышева С.В., Нерадовская Ю.В. Под ред. И.И. Елисеевой. —М.: Проспект, 2010.
5. Валентинов В.А. Эконометрика. Учебник. -М.: Дашков, 2010.
6. Орлова И.В. Экономико-математические методы и модели. Выполнение расчетов в среде Ехсе1. Практикум. - М.: ЗАО Финстатинформ, 2000.
7. Щербаков а. С., косарев н. С. Статистический анализ точности определения положений спутников систем ГЛОНАСС и GPS. Вестник СГУГИТ (сибирского государственного университета геосистем и технологий). Выпуск № 2 (26) / г. Новосибирск. 2014. с. 9