Научная статья на тему 'ВЕРОЯТНОСТНЫЙ И СТРУКТУРНЫЙ МЕТОД СЖАТИЯ ДАННЫХ ГЛОБАЛЬНЫХ НАВИГАЦИОННЫХ СПУТНИКОВЫХ СИСТЕМ'

ВЕРОЯТНОСТНЫЙ И СТРУКТУРНЫЙ МЕТОД СЖАТИЯ ДАННЫХ ГЛОБАЛЬНЫХ НАВИГАЦИОННЫХ СПУТНИКОВЫХ СИСТЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
14
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЖАТИЕ НОРМАЛЬНОГО ПРОЦЕССА / СЖАТИЕ ПО ХАФФМАНУ / МАСКА СПУТНИКОВ И СИГНАЛОВ / МУЛЬТИСИГНАЛЬНЫЕ СООБЩЕНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борискин Алексей Дмитриевич

Статья посвящена двум способам сжатия данных глобальных навигационных спутниковых систем (ГНСС). Первый способ - вероятностный, когда более вероятные значения кодируются коротким кодом, а менее вероятные - более длинным. Второй способ - структурный, позволяет более компактно представить информацию о номерах спутников и сигналов в виде маски.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ВЕРОЯТНОСТНЫЙ И СТРУКТУРНЫЙ МЕТОД СЖАТИЯ ДАННЫХ ГЛОБАЛЬНЫХ НАВИГАЦИОННЫХ СПУТНИКОВЫХ СИСТЕМ»

Электронный журнал «Труды МАИ». Выпуск № 41

www.mai.ru/science/trudy/

УДК: 629.783

Вероятностный и структурный метод сжатия данных глобальных навигационных спутниковых систем

А. Д. Борискин

Аннотация

Статья посвящена двум способам сжатия данных глобальных навигационных спутниковых систем (ГНСС). Первый способ - вероятностный, когда более вероятные значения кодируются коротким кодом, а менее вероятные - более длинным. Второй способ -структурный, позволяет более компактно представить информацию о номерах спутников и сигналов в виде маски.

Ключевые слова:

сжатие нормального процесса; сжатие по хаффману; маска спутников и сигналов; мультисигнальные сообщения.

^кращения:

ГНСС - Глобальные Навигационные Спутниковые Системы.

RTCM3 - Radio Technical Commission for Maritime Services (международный формат записи дифференциальных данных версии 3).

CMR - Compact Measurement Record (формат записи дифференциальных данных фирмы TRIMBLE.

Введение

Задачи сжатия являются ключевыми в системах хранения, обработки и передачи ГНСС данных. Наибольшее распространение сжатие получило в дифференциальной навигации, когда требуется передача измерений привязываемого приемника на базовый через каналы с ограниченной пропускной способностью. Не менее востребовано сжатие и

при записи «сырых» измерений приемника (особенно высокогерцовых) на флеш память для их последующей пост обработки.

Основным способом сжатия ГНСС измерений является уменьшение их динамического диапазона. Существующие методы, позволяет сузить диапазон кодовых измерений до ±300[м] или 16[бит] (при шаге квантования в 2[см]), а фазовых до ±2048[ц] (ЯТСМ3, СМЯ) или 20[бит] (при шаге квантования в 1/256[ц]). Для более эффективного сжатия, совместно с существующими методами, можно использовать и другие. Среди них -вероятностное и структурное сжатие, речь о которых пойдет в данной статье.

Вероятностное сжатие.

Вероятностное сжатие широко используется при работе с различными типами данных. Оно эффективно при условии, что функция распределения кодируемой величины отлична от равномерной. Тогда, для записи наиболее вероятных значений используют короткий двоичный код, а для записи менее вероятных - более длинный код. Как результат, суммарный объем информации уменьшается по сравнению с обычным битовым уплотнением.

Часто вероятностное сжатие используется с величинами, распределенными по нормальному закону. В этом случае, эффективность сжатия зависит от 2-х параметров:

1. Дисперсия данных: На Рис. 1 представлены 2 процесса с различными дисперсиями {<5=1[м] и <5=0.5[м]) и одинаковым шагом квантования (А=0.5[м]). Очевидно, что вероятностное сжатие 2-ого процесса будет эффективнее, т.к. оно имеет меньшую дисперсию.

Рисунок 1. Сжатие данных с разной дисперсией.

2. Шаг квантования данных: На Риа 2 представлены 2 процесса с различным шагом квантования, или, что равнозначно, с различной длиной бинарного слова. Вопрос, где сжатие более эффективно не столь очевиден и требует дополнительных расчетов.

Рис. 2. Сжатие данных с разным шагом квантования.

1. Шаг квантования = 0.5м

2. Шаг квантования = 1 м

0.8

_ 0.6

0.4

0.2

.». lili

С помощью компьютерного моделирования для различной длины бинарных слов («) и эффективного диапазона (Мт) были получены серии кривых, определяющих эффективность {Ь=Р(Ы<з,п)) вероятного сжатия по Хаффману (Рис. 3). Эффективность для заданных характеристик п и Ы, рассчитывалась по формуле

Ь = (ЫШс-1) 100% (1)

N - количество бит при битовом уплотнении

Ыс - среднее количество бит при вероятностном сжатии

Рис. 3. Коэффициент сжатия

Для объяснения графика рассмотрим пример: пусть необходимо оценить эффективность сжатия нормального случайного процесса в диапазоне Т=±5[м] с дисперсией <у=0.5[м] и шагом квантования в 2[см]. При обычном битовом уплотнении понадобится log2(10/0.02)=9[биm] информации. По графику находим пересечение линии, соответствующей п=9[бит], и эффективного диапазона кодирования Ы<з=Т Ь=5 0.5=10 и получаем порядка 30% или 9/1.3~7[бит].

Основные принципы вероятностного сжатия могут быть применимы и к ГНСС измерениям. Для его эффективного использования необходимо найти такую линейную комбинацию измерений, функция распределения которой, будет иметь минимальную дисперсию. Существующие комбинации ГНСС измерений, такие как кодовые и фазовые коррекции (RTCM2), разностные измерения (RTCM3, CMR) плохо подходят. Они имеют широкий диапазон (порядка 200-300[м]) и их дисперсия и математическое ожидание меняются во времени и сильно зависят от угла возвышения спутника. Для увеличения степени сжатия необходимо воспользоваться свойством сильной корреляции измерений во времени.

Рассмотрим приращение основных измерений во времени.

Арг = (АЛ - + АО + АТ) / \ + А1 + А?]1/>л

Арх =АЛ + М1+АО + АТ + М + Аг]р1 ^

А<р2=(АО-Ы2+АО + АТ)/Л1+А1 + Аг}92

• Л^ /»/, Ар1[м] - приращение фазовых и кодовых измерений

• А/ /л// приращение ухода часов приемника относительно системного времени.

• Л/,, АО, А'/' [м] приращение ионосферной, орбитальной, тропосферной ошибок измерений.

• Аг/(р1,Аг/р1,Аг/1р2[м]-приращение шумовых и других ошибок измерений.

Введем понятие разностного измерений, тогда приращение разностных измерений можно выразить через приращение фазового измерения на первой частоте.

ЛД = + СР

А(р2 = А срх + О)

• С р., С(р - ошибки восстановления, представляющие собой случайные величины.

При отсутствии срывов слежений, функция разностного фазового измерения будет определяться изменением ионосферы, скорость которой ограничена и не превышает 3[см/сек], а для кодового разностного измерения - шумовой ошибкой и не превышает 3[м]. Приращение разностного фазового измерения можно рассматривать как нормальный случайный процесс с усредненной среднесуточной дисперсией <Ъ[мм/сек]. Зная

начальное значение разностного фазового измерения и его приращения, можно безошибочно восстановить полное разностное фазовое измерение. При шаге квантования в 0.5[мм] для передачи фазового измерения (А (р2) с частотой 1[Гц] понадобится log2(3[см]/0.05[см])=6[биm], а при использовании вероятностного сжатия (Рис. 3: п=6, N=3/0.3=10 ---> Ь=60%) - 5/1.6~3.1[бит].

Структурное сжатие.

ГНСС данные состоят не только из измерений, в них также присутствуют дополнительные идентификаторы измерений, такие как: номера спутников и сигналов, а также их количество. В зависимости от того, в какой последовательности и как записана эта информация, можно осуществить дополнительное сжатие.

Рассмотрим пример: пусть необходимо записать последовательность целых чисел 32,1,6,7,13,3,15. Известно, что диапазон любого числа в последовательности находится в промежутке от 1 до 32. Существует 2 способа записи приведенной последовательности.

Первый, и наиболее распространенный - последовательная запись, когда целые числа (точнее их бинарный код) записываются друг за другом. В этом случае, суммарный объем данных будет равен 5*7=35[бит] (5 - количество бит необходимое для записи 1-ого числа, 7 -количество чисел в последовательности).

В случае если в последовательности нет повторяющихся чисел и важны только их значения, но не порядок следования, тогда возможна их запись в виде маски. Маска представляет собой последовательность бит размером в их диапазон (32), где единицы стоят на позициях, соответствующих значениям чисел. Для рассматриваемого примера, маска будет иметь вид 10100110000010100000000000000001. Суммарный объем данных будет равен 32 бит независимо от количества чисел в последовательности.

Второй способ требует меньше бит и потому может рассматриваться как способ сжатия. Сжатие с использованием маски имеет смысл, когда количество чисел в последовательности больше некоторого предельного значения которое может быть рассчитано как:

N>K/log2(K) (4)

• ^ диапазон чисел в последовательности.

Для ГНСС данных также можно использовать масочный подход для сжатия. С помощью них можно передавать информацию о номерах спутников и сигналах.

Известно, что один спутник может излучать множество сигналов, причем несколько на одной частоте. В статье будут использоваться сокращения названий сигналов, используемых в стандарте ЯШЕХ. Рассмотрим пример: пусть приемник следит за спутниками 1,3,6,7,13,15,32 и сигналами Ю(2), ^(4), 2P(10), 2M(15). В таблице слежения (Таблица 1) буквой X обозначены те сигналы, из всех возможных, за которыми следит в данный момент приемник. Диапазон в 40 спутников выбран с запасом, и является максимальным для всех существующих и планируемых ГНСС систем, диапазон в 24 сигнала, также выбран с запасом. В Таблице 2 приводится соответствие между номером сигнала и его общепринятым обозначением.

Таблица

. Таблица слежения приемника

Спутни 1 2 3 4 5 6 7 8 1 1 1 1 3 4 Маска

к 2 3 4 5 2 0 сигнало

Сигнал в

1 0

2 X X X X X X X 1

3 0

4 X X X X X 1

5 0

6 0

7 0

8 0

9 0

10 X X X X X 1

11 0

12 0

13 0

14 0

15 X X X X 1

16 0

24 0

Маска спут-ов 1 0 1 0 0 1 1 0 0 0 1 0 1 1 0

Под сигналом подразумевается не только физические характеристики сигнала, такие как частота, тип модуляции и т.д., но и способы слежения за ним. Серым цветом в Таблице 2 выделены наиболее распространенные в настоящее время сигналы.

Таблица 2. Идентификация сигналов

Номер сигнала ОРБ, RINEX обозначение БВАБ, RINEX обозначение ГЛОНАСС, RINEX обозначение ОаШео, RINEX обозначение

1

2 1С 1С 1С 1С

3 1Р 1Р 1А

4 ш 1В

5 1У Ж

6 12

7

8 2С 2С 6С

9 2Р 2Р 6А

10 2W 6В

11 2У 6X

12 62

13

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14 71

15 2Б 70

16 2Ь 7X

17 2X

18 81

19 8Q

20 8Х

21

22 5! 51 51

23 5Q 5Q 5Q

24 5Х 5Х 5Х

Существует несколько способов записи информации о номерах следимых спутников и сигналов.

Первый - это структура с внутренними циклами, которая в том или ином виде используется в протоколах RTCM3 и CMR. Информация о номерах спутника передается в первом цикле, а информация о номере сигнала во вложенном в него втором цикле. На Рж 4 обозначена описанная выше схема.

Рисунок 4. Структура с вложенными циклами_

Начало

Кол-во спутников N (5 бит)

Номер спутника п1 (6 бит) Кол- во сигналов К спутника п1 (4 бит) Номер сигнала к1 (5 бит)

Номер сигнала К1 (5 бит)

Номер спутника N (6 бит)

Конец

Рассчитаем объем информации необходимый для записи номеров спутников и сигналов по схеме, изображенной на Рисунке 4. Будем исходить из предположения, что количество спутников, за которыми одновременно следит приемник, не превышает 32, а количество сигналов одного спутника не превышает 16.

£ = 5 + (6 + 4)-Ж + 5- 5' = 5 + 10-7 + 5- 21 = 180[бм/и] (5)

• И— количество спутников.

• £ - количество сигналов.

Другим способом записи является запись с использованием масок. Таблицу слежения можно представить в виде 3-ех отдельных масок:

• Маска сигналов (серая вертикальная строка в Таблице 1)

• Маска спутников (серая горизонтальная строка в Таблице 1)

• Композитная таблица масок (Таблица 3)

Таблица 3. Композитная таблица масок

Спутники 1 3 6 7 13 15 32

Сигналы

2 1 1 1 1 1 1 1

4 1 1 1 0 1 0 1

10 1 1 1 0 1 0 1

15 1 0 0 1 0 1 1

Композитная таблица масок получается из «таблицы слежения» путем удаления нулевых столбцов и строк. Ее размер равен NsatNsig, где Nsat - это количество спутников (=количеству единиц в маске спутников), а Nsig - это количество сигналов (=количеству единиц в маске сигналов).

Рисунок 5. Структура без вложенных циклов_

Начало.

Маска сигналов (24 бит) Маска спутников (40 бит) Композитная маска (Nsat•Nsig) Конец

Рассчитаем объем информации необходимый для записи номеров спутников и сигналов по схеме, изображенной на рисунке 5.

Ь = 24 + 40 + NsatNsig = 64 + 28 = 12[бит\ (6)

Из представленного примера видно, что запись информации о номерах спутников и сигналов в виде масок, позволяет сжать этот тип информации более чем в 2 раза.

Заключение

В статье изучена возможность использования вероятностного сжатия при работе с ГНСС данными. Оценена эффективности сжатия по Хаффману величины, распределенной по нормальному закону. Предложены конкретные примеры для ГНСС данных, где вероятностное сжатие имеет целесообразное применение.

Наряду с вероятностным, рассмотренно структурное сжатие, при котором информация о номерах спутников и сигналов передается в виде масок. Представленние данных в виде маски не только позволяет произвести дополнительное сжатие, но и решает многие проблемы сушествуюших форматов хранения данных, таких как RTCM3 (в котором не существует возможности сохранять более 2-ух измерений одного спутника одновременно). На основе предложенного автором метода, в RTCM3 комитете разработаны новые сообщения (MSM - мультисигнальные сообщения), для записи сырых измерений приемника и полностью совместимостимых с RINEX форматом.

Библиографический список

1. William J Kellar. Transmission of RTK Corrections and Measurements using Optimal Coding.

Journal of Global Positioning System, 2006

2. Leick. A. GPS satellite surveying. Second Edition. John Wiley&Sons Inc., 1995. 584 стр.

3. Тепляков. И.М. и др. Радиосистемы передачи информации. - М. Радио и Связь, 1982.

264 стр.

4. Bradford W. Parkinson. Global Positioning System: Theory and Applications. Volume 1.

American Institute of Aeronautics, 1996. 793 стр.

Сведения об авторах

Борискин Алексей Дмитриевич, аспирант Московского авиационного института (государственного технического университета).

МАИ, Волоколамское ш., 4, Москва, А-80, ГСП-3, 125993; тел:1582518; e-mail: adbor@mail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.