Научная статья на тему 'Анализ частоты повторений RLE-блоков в семействах бинарных кодов, наилучших по минимаксному критерию автокорреляционной функции'

Анализ частоты повторений RLE-блоков в семействах бинарных кодов, наилучших по минимаксному критерию автокорреляционной функции Текст научной статьи по специальности «Математика»

CC BY
192
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПСЕВДОСЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ / PSEUDO-RANDOM SEQUENCES / ХАОТИЧЕСКИЕ СИГНАЛЫ / CHAOTIC SIGNALS / КОДЫ БАРКЕРА / BARKER CODES / МИНИМАКСНЫЙ КРИТЕРИЙ / MINIMAX CRITERION / АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ / AUTOCORRELATION FUNCTION / КОДИРОВАНИЕ ДЛИН СЕРИЙ / RUN LENGTH ENCODING

Аннотация научной статьи по математике, автор научной работы — Ковылин Александр Александрович, Злобин Дмитрий Владимирович, Родионов Александр Юрьевич

Рассматриваются вопросы отыскания двоичных псевдослучайных последовательностей с автокорреляционной функцией, близкой к идеальной, предназначенных для использования в современных системах передачи информации, в том числе в мобильной связи и интерфейсах беспроводной передачи данных. При синтезе наборов двоичных последовательностей поставлена задача комплектования их на основе минимаксного критерия, по которому последовательность считается оптимальной в соответствии с предполагаемой областью применения. Получены оптимальные последовательности размерностью до 52, для них проведен анализ кодирования длин серий. Выявлены закономерности в распределении количества серий различной длины в кодах, оптимальных по выбранному критерию, что в дальнейшем позволит оптимизировать процесс поиска таких кодов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Frequency analysis of RLE-blocks repetitions in the series of binary codes with optimal minimax criterion of autocorrelation function

The article describes the problem of searching for binary pseudo-random sequences with quasi-ideal autocorrelation function, which are to be used in contemporary communication systems, including mobile and wireless data transfer interfaces. In the synthesis of binary sequences sets, the target set is manning them based on the minimax criterion by which a sequence is considered to be optimal according to the intended application. In the course of the research the optimal sequences with order of up to 52 were obtained; the analysis of Run Length Encoding was carried out. The analysis showed regularities in the distribution of series number of different lengths in the codes that are optimal on the chosen criteria, which would make it possible to optimize the searching process for such codes in the future.

Текст научной работы на тему «Анализ частоты повторений RLE-блоков в семействах бинарных кодов, наилучших по минимаксному критерию автокорреляционной функции»

4. Молекулярно-биологические базы данных // Объединенный центр вычислительной биологии и биоинформатики [Электронный ресурс]. - Режим доступа: http://jcbi.ru/baza/index.shtml, свободный. Яз. рус. (дата обращения 16.05.2012).

5. Stoesser G., Baker W., van den Broek A. et al. The EMBL Nucleotide Sequence Database // Nucleic acids research. - 2002. - V. 30. - № 1. - P. 21-26.

6. Emmert D.B. The European Bioinformatics Institute (EBI) databases // Nucleic acids research. - 1994. -V. 22. - № 17. - P. 3445-3449.

7. Geer L.Y., Marchler-Bauer A., Geer R.C. et al. The NCBI BioSystems database // Nucleic acids research. -2010. - V. 38 (Database issue). - D492-496.

8. Benson D.A., Karsch-Mizrachi I., Lipman D.J. et al. GenBank // Nucleic acids research. - 2005. - V. 33. -suppl. 1. - D34-38.

9. Bernstein F.C. The Protein Data Bank: a computer-based archival file for macromolecular structures // Journal of molecular biology. - 1977. - V. 112. - № 3. - P. 535-542.

10. Henrick K., Feng Z., Bluhm W. et al. Remediation of the Protein Data Bank Archive // Nucleic acids research. - 2008. - V. 36. - Suppl. 1. - D426-D433.

11. Joosten R.P., Beek T.A.H., Krieger E. et al. A series of PDB related databases for everyday needs // Nucleic acids research. - 2011. - V. 39. - Suppl. 1. - D411-D419.

12. Vriend G. WHAT IF: a molecular modeling and drug design program // Journal of Molecular Graphics. -1990. - V. 8. - Is. 1. - P. 52-56.

13. Башмаков А.И., Старых В. А. Систематизация информационных ресурсов для сферы образования: классификация и метаданные. - М.: Европейский центр по качеству, 2003. - 384 с.

14. Дейт К.Дж. Введение в системы баз данных. - 8-е изд. - М.: Вильямс, 2005. - 1328 с.

15. Горев А., Ахаян Р., Макашарипов С. Эффективная работа с СУБД. - СПб: Питер, 2006. - 704 c.

16. Кузнецов С. Д. Базы данных: языки и модели: Учебник. - М.: Бином. Лаборатория знаний, Интернет-университет информационных технологий, 2008. - 720 с.

17. Монахов В. Язык программирования Java и среда NetBeans. - 2-е изд. - СПб: БХВ-Петербург, 2009. - 720 с.

18. Хейк Б. JDBC: Java и базы данных. - М.: Лори, 1999. - 320 с.

19. Ноутон П., Шилдт Г. Java 2. - СПб: БХВ-Петербург, 2008. - 1072 с.

20. Steelman A., Murach J. Murach's Java Servlets and JSP. - 2nd ed. - Fresno, CA, USA: Mike Murach & Associates, 2008. - 729 p.

21. Hooft R. A WHAT IF check report: what does it mean. - 2007 [Электронный ресурс]. - Режим доступа: http://swift.cmbi.ru.nl/gv/pdbreport/checkhelp/explain.html, свободный. Яз. рус. (дата обращения 16.05.2012).

Никитин Тимофей Александрович - Санкт-Петербургский государственный политехнический университет,

студент, [email protected]

Порозов Юрий Борисович - Санкт-Петербургский национальный исследовательский университет

информационных технологий, механики и оптики, кандидат медицинских наук, зав. лабораторией, [email protected]

УДК 621.391

АНАЛИЗ ЧАСТОТЫ ПОВТОРЕНИЙ КЬЕ-БЛОКОВ В СЕМЕЙСТВАХ БИНАРНЫХ КОДОВ, НАИЛУЧШИХ ПО МИНИМАКСНОМУ КРИТЕРИЮ АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ А.А. Ковылин, Д.В. Злобин, А.Ю. Родионов

Рассматриваются вопросы отыскания двоичных псевдослучайных последовательностей с автокорреляционной функцией, близкой к идеальной, предназначенных для использования в современных системах передачи информации, в том числе в мобильной связи и интерфейсах беспроводной передачи данных. При синтезе наборов двоичных последовательностей поставлена задача комплектования их на основе минимаксного критерия, по которому последовательность считается оптимальной в соответствии с предполагаемой областью применения. Получены оптимальные последовательности размерностью до 52, для них проведен анализ кодирования длин серий. Выявлены закономерности в распределении количества серий различной длины в кодах, оптимальных по выбранному критерию, что в дальнейшем позволит оптимизировать процесс поиска таких кодов.

Ключевые слова: псевдослучайные последовательности, хаотические сигналы, коды Баркера, минимаксный критерий, автокорреляционная функция, кодирование длин серий.

Введение

В связи с ростом популярности систем, использующих хаотические сигналы, актуально изучение функций, имеющих с ними интегральное соответствие, на основе псевдослучайных последовательностей

АНАЛИЗ ЧАСТОТЫ ПОВТОРЕНИЙ КЬБ-БЛОКОВ В СЕМЕЙСТВАХ БИНАРНЫХ КОДОВ .

с наилучшими автокорреляционными свойствами. В соответствии с теоремой Винера-Хинчина сигналы с идеальной автокорреляционной функцией (АКФ) имеют наилучшие стохастические свойства. Подобные последовательности имеют широкое применение в системах радиолокации, синхронизации, расширения спектра и т.п. Отмечено использование шумоподобных последовательностей при анализе цепочек дезоксирибонуклеиновой кислоты (ДНК).

Учитывая большой интерес к представленной научной теме, встает вопрос о синтезе более длинных последовательностей, нежели те, что используются на сегодняшний день. Поиск оптимальных кодов большой длины методом простого перебора является весьма ресурсозатратной задачей. Все это подталкивает к созданию других методов поиска, обеспечивающих заданный критерий оптимальности, но при этом содержащих меньшее количество вычислительных операций, а следовательно, обладающих меньшим временем расчета. В работе авторами рассматривается один из способов оптимизации такого поиска.

Оптимальные дискретные сигналы

Для количественного определения степени отличия сигнала и (/) и его смещенной во времени копии и ( — т) принято вводить АКФ сигнала и ):

да

Ви (т) = | и () и ( - т) Ж .

—да

Для дискретного сигнала и = {и0, и1,..., им—1} АКФ имеет следующий вид:

да

Ви (П) = X и}—п .

]=—да

При синтезе оптимальных дискретных сигналов принято использовать минимаксный критерий: оптимальным считается сигнал с наименьшим уровнем наибольшего из боковых лепестков АКФ. Такой критерий отвечает существу проблемы [1].

Дискретные сигналы с наилучшей структурой АКФ являются объектом интенсивных исследований. Среди них большую известность получили сигналы Баркера. Эти сигналы обладают уникальным свойством: при всех п Ф 0 значения их АКФ не превышают единицы. Установлено, что не существует сигналов Баркера с числом элементов, большим 13. Однако в [2] говорится о том, что если последовательность Баркера длиной более 13 существует, то п = 189 260 468 001 034 441 522 766 781 604 (т.е. более 2 1030).

Свойства полученных кодов

В результате поиска всех существующих последовательностей по заданным критериям посредством разработанного алгоритма было обнаружено семейство кодов, с учетом зеркальных и обратных последовательностей. В табл. 1 приведено сравнение рассчитанных значений максимального уровня бокового лепестка (УБЛ) АКФ и значений, приведенных в [3]. Следует отметить, что параметры некоторых обнаруженных последовательностей превосходят результаты, приведенные в [3]. Такие параметры отмечены в табл. 1 символом (+).

Длина кода Максимальный УБЛ АКФ Количество

расчет литература [3] кодов

14 2 2 72

15 2 2 104

16 2 2 80

17 2 2 32

18 2 2 16

19 2 2 8

20 2 2 24

21 2 2 24

22 3 3 3024

23 3 3 4084

24 3 3 6864

25 2+ 3 8

Длина кода Максимальный УБЛ АКФ Количество кодов

расчет литература [3]

33 3 - 1132

34 3 - 408

35 3+ 4 888

36 3+ 4 1288

37 3+ 4 440

38 3 - 136

39 3 - 240

40 3+ 4 456

41 3+ 4 120

42 3+ 5 32

43 3+ 4 96

44 3+ 4 120

Длина кода Максимальный УБЛ АКФ Количество кодов

расчет литература [3]

26 3 3 1936

27 3 3 3096

28 2 2 16

29 3 3 2244

30 3 3 688

31 3 3 2008

32 3 - 3376

Длина кода Максимальный УБЛ АКФ Количество кодов

расчет литература [3]

45 3 - 32

46 3+ 5 8

47 3+ 4 8

48 3+ 5 32

49 4 - 392704

50 4 - 201352

51 3 - 8

52 4 - 264464

Таблица 1. Сводная таблица кодов

К примеру, один из кодов длиной 52 будет иметь вид (0100101001000001011101000001001100111110011111001110).

Можно отметить, что отношение главного пика АКФ к максимальному УБЛ для кодов длиной 51 и 28 элементов больше, чем у 13-элементного кода Баркера (рис. 1). Это говорит о существовании последовательностей длиной, превосходящей коды Баркера, обладающих лучшим отношением максимума АКФ к боковому лепестку.

03

55 03

40

50

-40

-50

Рис. 1. АКФ оптимальных кодов длиной 13, 28 и 51 соответственно с нормой на максимальный уровень

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

бокового лепестка

В современных системах радиоэлектроники широко применяются псевдослучайные последовательности, сформированные по определенным правилам, например, М-последовательности, последовательности Де Брейна, последовательности Гордона-Милса-Велча (GMW) [4]. Однако их длина кратна степени 2 +1, что существенно ограничивает выбор длины кода. При этом значения УБЛ АКФ с ростом длины последовательности уступают аналогичным показателям предложенных кодов (табл. 2).

Максимальное значение УБЛ АКФ при длине

Последовательности последовательности

15 16 17 31 32 33

М-последовательности 3 - - 4 - -

Последовательности Де Брейна - 3 - - 4 -

GMW-последовательности - - 3 - - 6

Найденные коды 2 2 2 3 3 3

Таблица 2. Выборочное сравнение последовательностей по максимальному УБЛ АКФ

АНАЛИЗ ЧАСТОТЫ ПОВТОРЕНИЙ RLE-БЛОКОВ В СЕМЕЙСТВАХ БИНАРНЫХ КОДОВ ...

Анализ кодирования длин серий

Поиск кодов большой длины методом простого перебора вариантов оказывается весьма громоздким и является проблемой даже для современных вычислительных мощностей: время поиска всех бинарных последовательностей (по заданным критериям) длиной 52 элемента составляло около 180 дней на вычислительном сервере (4*4 ядра с тактовой частотой 3,2 ГГц) [5]. Между тем имеется явная тенденция применять сигналы с все большей размерностью, и это оправдывает поиск других методов синтеза, не связанных с подобными трудностями.

В настоящей работе проводится исследование частоты повторений RLE-блоков (Run-Length Encoding, кодирование длин серий) бинарных последовательностей, полученных с помощью разработанного программного приложения. При кодировании длин серий кодовая последовательность разбивается на блоки, состоящие из идущих подряд одинаковых элементов кода. Код при этом записывается как последовательность длин этих блоков. Таким образом, если рассмотреть известную бинарную последовательность Баркера длиной 13 - (1111100110101), то запись ее в формате RLE выглядит как (5221111), количество анализируемых RLE-блоков составит 7, а число уникальных блоков - 3.

Анализ сигнатур кодов показал характерное количество RLE-блоков, из которых были рассчитаны доли от общей длины кода (рис. 2). Это хорошо согласуется с теоремой Винера-Хинчина, так как конкретные RLE-блоки отвечают за нахождение определенных частот внутри кода, а неравномерность количества элементов в разных блоках показывает равномерность спектральной плотности кода.

14

«

Si

8

ю

о «

н о

(D

ч

а

12 10 8 6 4 2

С

I" . ¿А —

L = 4 v

4 8 12 16 20 24 28 32 36 40 44 48 52 Длина кодовой последовательности Рис. 2. Количество Р1_Е-блоков длиной 1, 2, 3 и 4 элемента в зависимости от длины кода

Существуют три основных свойства любой двоичной псевдослучайной последовательности, которые могут быть использованы в качестве проверки на случайность. Это сбалансированность, цикличность и корреляция. Циклом (группой) называется непрерывная последовательность одинаковых двоичных чисел. Появление одной двоичной цифры автоматически начинает новый цикл. Длина группы равна количеству цифр в нем. Желательно, чтобы в каждом фрагменте последовательности приблизительно половину составляли циклы обоих типов длиной 1, приблизительно одну четверть - длиной 2, приблизительно одну восьмую - длиной 3 и т.д. [6]. Таким образом, доля содержания конкретной группы в рассматриваемом коде определяется выражением Р, = 2-',

где ' - длина группы. В результате проведенного авторами в рамках данной работы исследования синтезированных сигнатур кодов вышеупомянутое распределение оказалось несколько иным:

Р1 = 2-'-1. (1)

Варианты такого распределения представлены на рис. 3 (утолщенная линия). Распределение долей RLE-блоков в коде имеет медианный характер, так как сумма RLE-блоков в заданной пропорции не равна длине кода. Необходимую длину кода дополняют отклоненные от медианного значения RLE-блоки большой длины. В действительности эти отклонения незначительно будут влиять на время расчета кода необходимой длины. Алгоритм расчета подобных кодов предполагает рекуррентный анализ вновь найденных кодов для обновления значений распределения RLE-элементов в кодах. Количество RLE-элементов большой длины для найденных кодов имеет хаотический характер в пределах определенных чисел, в то время как число RLE-блоков малой длины имеют характерную линейную зависимость от длины кода, с распределением (1). С увеличением длины кода RLE-элементы большой длины также начинают подчиняться распределению (1).

Это предполагает сокращение времени расчета кодов, в отличие от метода простого перебора, в котором время расчета имеет степенную зависимость от длины кода.

10

о «

н

о о

ч &

1 2 3 4 5 6 7 8 9 10 11 12 13 Длина RLE-блока а

20

о 15

н о

(D

10

ч о

0

1 2 3 4 5 6 7 8 9 10 11 12 13 Длина RLE-блока б

Рис. 3. Диапазон значений количества RLE-блоков в кодах длиной 30 (а) и 52 (б) (утолщенная линия - аппроксимирующая кривая)

Равномерность спектральной плотности кода - главное условие для получения минимального значения УБЛ его АКФ. График зависимости доли блока в коде от длины блока (рис. 3) хорошо апроксими-руется экспоненциальной функцией.

Заключение

В результате поиска оптимальных двоичных последовательностей с размерностью, большей 13, было обнаружено существование кодов, превосходящих по своим автокорреляционным свойствам все известные. Выявлена тенденция к периодическому повышению «качества» кода с увеличением его длины, что говорит об актуальности дальнейшего поиска более длинных кодов.

Анализ частоты повторений RLE-блоков в найденных семействах бинарных кодов позволил выявить закономерности распределения количества блоков в зависимости от длины кода (1). Данные закономерности в дальнейшем позволят сузить область поиска оптимальных кодов при решении задач по синтезу и оптимизации структуры сложных сигналов.

Литература

1. Гантмахер В.Е., Быстров Н.Е., Чеботарев Д.В. Шумоподобные сигналы. Анализ, синтез, обработка. -СПб: Наука и техника, 2005. - 400 с.

2. Mossinghoff M.J. Wieferich pairs and Barker sequences // Designs, Codes and Cryptography. - 2009. -V. 53. - № 3. - P. 149-163.

3. Свердлик М.Б. Оптимальные дискретные сигналы. - М.: Советское радио, 1975. - 200 с.

4. Golomb S.W., Gong G. Signal design for good correlation for wireless communication, cryptography and radar. - US: Cambridge University Press, 2005. - 438 p.

5. Чусов А.А., Ковылин А.А., Стаценко Л.Г., Миргородская Ю.В. Параллельный поиск сигналов с заданными взаимно и автокорреляционными свойствами на многопроцессорных платформах // Известия вузов. Радиоэлектроника. - 2010. - Т. 54. - № 8. - С. 29-35.

6. Скляр Б. Теоретические основы и практическое применение: Пер. с англ. - 2-е изд., испр. - М.: Виль-ямс, 2004. - 1104 с.

Ковылин Александр Александрович Злобин Дмитрий Владимирович Родионов Александр Юрьевич

Дальневосточный федеральный университет, инженер, [email protected]

Дальневосточный федеральный университет, инженер, [email protected]

Дальневосточный федеральный университет, кандидат физ.-мат. наук, доцент, [email protected]

5

0

5

i Надоели баннеры? Вы всегда можете отключить рекламу.