Научная статья на тему 'Сравнение статистик тестов серий и аппроксимированной энтропии'

Сравнение статистик тестов серий и аппроксимированной энтропии Текст научной статьи по специальности «Математика»

CC BY
120
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕСТОВАЯ СТАТИСТИКА / ТЕСТ СЕРИЙ / ТЕСТ АППРОКСИМИРОВАННОЙ ЭНТРОПИИ

Аннотация научной статьи по математике, автор научной работы — Киевец Н.Г., Корзун А.И.

Показывается, что выражения для тестовых статистик серий и аппроксимированной энтропии являются эквивалентными при рассмотрении пересекающихся серий одинаковых длин и при длинах исследуемых последовательностей →∞. Экспериментально подтверждено совпадение результатов, полученных при тестировании последовательностей различных длин.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF SERIAL AND APPROXIMATE ENTROPY TEST STATISTICS

It is shown that mathematical expressions for serial and approximate test statistics are equivalent on conditions that concerned overlapping series have the same lengths and observable sequence length →∞. The test result coincidence is experimentally confirmed.

Текст научной работы на тему «Сравнение статистик тестов серий и аппроксимированной энтропии»

Доклады БГУИР

2014 № 3 (81)

УДК 004.056.5:519.254

СРАВНЕНИЕ СТАТИСТИК ТЕСТОВ СЕРИЙ И АППРОКСИМИРОВАННОЙ ЭНТРОПИИ

Н.Г. КИЕВЕЦ, А.И. КОРЗУН

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь

Поступила в редакцию 27 декабря 2013

Показывается, что выражения для тестовых статистик серий и аппроксимированной энтропии являются эквивалентными при рассмотрении пересекающихся серий одинаковых длин и при длинах исследуемых последовательностей п ^да. Экспериментально подтверждено совпадение результатов, полученных при тестировании последовательностей различных длин.

Ключевые слова: тестовая статистика, тест серий, тест аппроксимированной энтропии.

Введение

На сегодняшний день остается открытой проблема зависимости статистических тестов, используемых для тестирования генераторов случайных чисел (ГСЧ) [1]. Применение зависимых тестов приводит к неоправданному увеличению временных затрат и может привести к неверным выводам о качестве генератора [2].

Одной из наиболее используемых систем тестирования ГСЧ является система №8Т [3]. Данная система включает тест серий и тест аппроксимированной энтропии, тестовая статистика которых вычисляется на основе частот появления в исследуемой последовательности пересекающихся серий различной длины.

В данной работе приводится сравнение тестовых статистик теста серий и теста аппроксимированной энтропии для выявления зависимости тестов и подтверждение полученных выводов экспериментальными данными.

Анализ статистик теста серий и аппроксимированной энтропии

Целью применения статистических тестов является принятие либо отклонение выдвинутой гипотезы о случайности исследуемой последовательности. В каждом тесте рассчитывается статистика, на основе которой определяется значение вероятности Р, характеризующей приемлемость выдвинутой гипотезы. В системе №8Т для прохождения теста необходимо выполнение условия: Р > 0,01. В тестах серий и аппроксимированной энтропии рассчитываются статистики , имеющие распределение «хи-квадрат». При таком распределении статистики вероятность Р рассчитывается по формуле: ш к

!

г2 *е

Р = —-, (1)

ш к_1

| г2 е ~Ыг

о

где К - число степеней свободы распределения.

Система №8Т содержит два теста серий. В данной статье рассматривается тест, в котором рассчитывается статистика:

X2 =

0т+1 2 -1 г,ш 2т-1

— - ^ ^2

п к=0 п ,_п

(2)

,=0

где (т +1) и т - длины рассматриваемых пересекающихся серий, п - длина исследуемой последовательности, „к - число появлений в последовательности серии к -го вида длины (т +1), V - число появлений в последовательности серии , -го вида длины т .

В

тесте

аппроксимированной энтропии рассчитывается

X2 = 2п(1п 2 - АрЕп (т)), где

АрЕп(т) = 9(т) -9(т+1) -

(т) , (V ^

аппроксимированная энтропия, 9 / — 1п

1=0 п

г1т) ТЛ ^(т+1)

статистика:

(3)

(4)

2 -1

, 9

(т+1) _

Е ^ ь

г „Л

к=0

Заменим в (4) величины 9(т) и 9(т+ ' эквивалентными соотношениями при п ^да [4]:

п(т)

9(т) ~ -т 1п 2 + — ЕX2 , где XI = 4пI— -

т 2т-1

Е X,2 , где = л/п У' 1

2п Е ' V п 2"

9

(т+1)

2 т+1 2т+1 -1 / „ 1

-(т + 1)1п 2 + — Е^ где У =4пI п

2п

к=0

Получаем выражение для аппроксимированной энтропии:

гут 2т-1 лт+1 2т+1 -1 от 2т-1 1

АрЕп(т) = -т 1п2 + — Е 72 + (т + 1)1п2--Е Ук = -т 1п2 + — Е пI - —

2п 7=0 2п 2п г=о V п 2

2т+12т+ г ^ 1 V2 , „ 2г2;~11( п V 2т+1 1■11 ( п

+т 1п2 + 1п2 - — Е п\^г| = 1п2 + — Е-I- — I--Е -к, -

к=о V п 2 ) 2п 7=0 п V ' 2т) 2п и п

Подставив полученное выражение для АрЕп(т) в (2), имеем:

к ^т+1

X =2п

' \ „ 2™ 2т-11 I п V2 2™+12-А11 I п 1п 2 + — --I--^ -

1п 2 -

V V

т+1

2п 1=о п

2п

к=0

п V к 2 т+1

2

= 2п

( 2т+1 2т+1 -1 ^

2п

Е1

V

т 2т-1

к=0

--

п V к 2 т+1

2 2® 2т-11

—Е11V, --

2п 1=0 п

2

,т+1 2т+1 -1

Е

к=0

„к 2 ™+1

- ^ е| V,-—

п ЕГ 2

2 г. т+1 2т+1

Е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к=0

2п„,

т +1

V

к I п

т +1

2

т 2т

- Е

п Т=0

1

2 2п I п V,--+ \ —

г 2" V2"

V К ' у

2

> т+1 2т+1 -1

п

Е

к =0

т +1

--

2п

т +1

2 -1 ?т+1

„к + 2--2

Е

к=0

т +1

2 2т 2т-1 2 2т 2п 2т-1

Е

,=0

V 2 +■

I ,„ \2 0т+1 2т+1 -1

- ■ 2»1 = Е „2 -

п

п 2 т+1 к=0 п V 2

т+1 -1 2т+1 -1 г— 2т-1 2т -1

Е „к2 - 2 Е „к+п—Е V2+2 Е ^- п.

п 2т

Е

I=0

V, -

п

к =0

к=0

1=0

1=0

2т+1-1

к=0

2т -1

Так как Е„к = п и Е V = п, то получаем выражение для х2:

1=0

>т+1 2т+1 -1

2т+1 2т+1 -1 2т 2т-1 ^

х2 = — Е „к2 - 2п+п—Е V2+2п - п=— Е

и ' ' и ' ' и ' '

т 2т-1

к=0

п

,=0

к=0

т

2 2 2 „к -—Е V .

п

,=0

V п у

2

2

п

п

п

2

п

п

Получилось, что выражение (5) для теста аппроксимированной энтропии совпадает с выражением (2) для теста серий. Так как для обоих тестов величины К равны и К = 2т, получаем равные значения Р, что видно из формулы (1).

Таким образом, показано, что при п ^да значения вероятностей Р для теста аппроксимированной энтропии и теста серий совпадают, что говорит об их зависимости.

Экспериментальные исследования

С целью подтверждения правильности принятых допущений проведены экспериментальные исследования. Проверялось условие |P1 - P2 —>0 при n —да, где P1 -

значение вероятности, полученное для теста серий; P2 - значение вероятности, полученное для теста аппроксимированной энтропии. Для этого из двух электронных пластиковых карт (ЭПК) с операционной системой MINOS c помощью аппаратно-программного комплекса [5] извлечено по 1000 ключей длиной 1024 бит.

Для каждой из ЭПК №1 и №2 сформировано 1000 последовательностей a, где i -номер последовательности. При этом i -я последовательность сформирована из i ключей, представленных в двоичном коде и записанных в поток данных побитно. Полученные последовательности протестированы с использованием MATLAB [6]. Задан параметр m = 3. Для достижения наглядности на рисунке представлено каждое десятое значение |P1—P2 . Видно практически полное совпадение значений P1 и P2 для n >500000 бит. Заметим, что даже при относительно небольших значениях n |P1—P2 не превышает 1% от максимально возможного значения, равного 1.

204800 409600 614400 819200 1024000 Зависимость величины |Р1 - Р2 от длины тестируемой последовательности п:

+ - для последовательностей из ЭПК №1, Л - для последовательностей из ЭПК №2

В табл. 1 содержатся значения вероятностей Р1, Р2 и разности |Р1—Р2| для каждой 50-й последовательности. Таблица позволяет увидеть, как изменяются Р1 и Р2 с ростом п. Отчетливо видна тенденция приближения значений Р1 и Р2 при увеличении п. Тенденция характерна для последовательностей, выработанных генераторами различных карт.

Таблица 1. Значения вероятностей Р1, Р2 и разностей |Р1-Р2|, полученных при тестировании последовательностей, длины которых кратны 51200 битам

1 п, бит Последовательности из ЭПК №1 Последовательности из ЭПК №2

Р1 Р2 |Р1-Р2| Р1 Р2 |Р1-Р2|

50 51200 0,7111 0,7121 0,0010 0,2219 0,2272 0,0054

100 102400 0,1940 0,1966 0,0026 0,7877 0,7902 0,0026

150 153600 0,2893 0,2966 0,0073 0,3343 0,3355 0,0013

200 204800 0,3607 0,3665 0,0057 0,2723 0,2746 0,0023

250 256000 0,1333 0,1404 0,0071 0,0736 0,0749 0,0013

300 307200 0,4354 0,4396 0,0041 0,2786 0,2819 0,0033

350 358400 0,3404 0,3414 0,0009 0,5725 0,5734 0,0009

400 409600 0,4130 0,4116 0,0014 0,6240 0,6252 0,0011

450 460800 0,6164 0,6164 0,0001 0,7383 0,7388 0,0005

500 51200 0,5342 0,5341 0,0001 0,6745 0,6746 0,0001

550 563200 0,5753 0,5749 0,0004 0,7490 0,7489 0,0000

600 614400 0,6085 0,6084 0,0001 0,5319 0,5318 0,0001

650 665600 0,5776 0,5775 0,0001 0,4233 0,4234 0,0000

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

700 716800 0,6556 0,6553 0,0003 0,3216 0,3220 0,0005

750 768000 0,5893 0,5891 0,0002 0,4425 0,4430 0,0005

800 819200 0,7549 0,7546 0,0003 0,5677 0,5673 0,0004

850 870400 0,6357 0,6352 0,0005 0,5711 0,5710 0,0001

900 921600 0,8916 0,8916 0,0000 0,7058 0,7060 0,0002

950 972800 0,8085 0,8084 0,0001 0,5854 0,5857 0,0003

1000 1024000 0,9691 0,9691 0,0000 0,6798 0,6797 0,0001

В табл. 2 и 3 представлены значения Р1, Р2 и |Р1 — Р2| для последовательностей,

длины которых отличаются на 4096 бит. Из таблиц видно, что увеличение 54-й последовательности на 45056 бит привело к более существенному изменению вероятностей Р1 и Р2, чем увеличение 954-й последовательности на то же количество бит. Это объясняется тем, что чем длиннее последовательность, тем незначительнее меняет ее добавление некоторого количества бит. Табл. 2 и 3 показывают, что значения |Р1—Р2| на порядок меньше

для длинных последовательностей с номерами от 954 до 998, чем для относительно коротких последовательностей с номерами от 54 до 98.

Таблица 2. Значения вероятностей Р1, Р2 и разностей |Р1-Р2|, полученных при тестировании последовательностей длиной от 55296 до 1003523 бит

1 п, бит Последовательности из ЭПК №1 Последовательности из ЭПК №2

Р1 Р2 Р1-Р2| Р1 Р2 |Р1-Р2|

54 55296 0,8295 0,8295 0,0000 0,3527 0,3561 0,0033

58 59392 0,8041 0,8035 0,0006 0,3172 0,3201 0,0028

62 63488 0,8206 0,8212 0,0006 0,3108 0,3149 0,0041

66 67584 0,6635 0,6648 0,0013 0,3638 0,3684 0,0046

70 71680 0,6594 0,6614 0,0020 0,3825 0,3876 0,0051

74 75776 0,5070 0,5098 0,0028 0,4841 0,4878 0,0037

78 79848 0,4387 0,4395 0,0008 0,5987 0,6012 0,0025

82 83944 0,2208 0,2231 0,0023 0,5573 0,5599 0,0026

86 88040 0,3061 0,3084 0,0022 0,7140 0,7155 0,0014

90 92136 0,3209 0,3227 0,0018 0,7921 0,7931 0,0010

94 96208 0,3178 0,3197 0,0019 0,7127 0,7148 0,0021

98 100352 0,2481 0,2517 0,0035 0,7702 0,7723 0,0021

Таблица 3. Значения вероятностей Р1, Р2 и разностей |Р1-Р2|, полученных при тестировании последовательностей длиной от 97896 до 1021952 бит

i n, бит Последовательности из ЭПК №1 Последовательности из ЭПК №2

Р1 Р2 |Р1-Р2|*104 Р1 Р2 |Р1-Р2|*103

954 976896 0,7825 0,7825 0,2002 0,6182 0,6185 0,2769

958 980992 0,8166 0,8167 0,5935 0,6134 0,6137 0,3073

962 985088 0,8721 0,8722 0,4031 0,6486 0,6486 0,0149

966 989184 0,8905 0,8905 0,2937 0,6629 0,6631 0,1488

970 993280 0,9091 0,9091 0,0211 0,7031 0,7031 0,0462

974 997376 0,9337 0,9337 0,1770 0,7018 0,7019 0,0613

978 1001472 0,9371 0,9372 0,1981 0,7056 0,7057 0,1165

982 1005568 0,9411 0,9411 0,3784 0,6879 0,6880 0,0747

986 1009664 0,9385 0,9385 0,1474 0,6591 0,6590 0,0699

990 1013760 0,9464 0,9465 0,2898 0,7237 0,7237 0,0493

994 1017856 0,9627 0,9627 0,2722 0,6961 0,6961 0,0344

998 1021952 0,9771 0,9771 0,0612 0,7000 0,6999 0,0930

На рисунке видна область значений |P1 - P2\ при сравнительно небольших длинах последовательностей, в пределах которой значение |P1 — P2| может быть больше значения 0,01.

Для более детального рассмотрения этой области значений был проведен эксперимент. Из ЭПК MINOS извлечено 1152 ключа длиной 1024 бит. Полученный массив ключей разбит на 48 групп по 24 ключа. Из ключей каждой группы, представленных в двоичном коде, сформирована битовая последовательность. Получено 48 последовательностей, каждая длиной 24576 бит. В табл. 2 представлены значения P1 и P2 для всех последовательностей. Все

значения |P1—P| принадлежат диапазону [ 1,3400-10 5; 0,0213].

Таблица 4. Значения вероятностей Р1 и Р2, полученных при тестировании 48 последовательностей

длиной 24576 бит

№ Р1 Р2 № Р1 Р2 № Р1 Р2 № Р1 Р2

1 0,0051 0,0051 13 0,7979 0,7978 25 0,8678 0,8648 37 0,5647 0,5703

2 0,3817 0,3917 14 0,9244 0,9223 26 0,5701 0,5682 38 0,5069 0,5139

3 0,2143 0,2113 15 0,8709 0,8707 27 0,5424 0,5434 39 0,9875 0,9876

4 0,7966 0,8008 16 0,1032 0,1013 28 0,2342 0,2350 40 0,0993 0,0999

5 0,3879 0,3848 17 0,0169 0,0197 29 0,8167 0,8169 41 0,4887 0,4954

6 0,2719 0,2740 18 0,1748 0,1755 30 0,9330 0,9324 42 0,5459 0,5482

7 0,8588 0,8587 19 0,6879 0,6838 31 0,0173 0,0183 43 0,4717 0,4717

8 0,1949 0,1889 20 0,5769 0,5744 32 0,3509 0,3477 44 0,6026 0,6088

9 0,4957 0,4912 21 0,3100 0,3113 33 0,2418 0,2446 45 0,6871 0,6880

10 0,9507 0,9513 22 0,6068 0,6120 34 0,6294 0,6291 46 0,1072 0,1076

11 0,5089 0,5096 23 0,3000 0,2984 35 0,8213 0,8216 47 0,7865 0,7864

12 0,0885 0,0867 24 0,0407 0,0377 36 0,1313 0,1526 48 0,9268 0,9271

Заключение

Полученные выражения для тестовых статистик тестов серий и аппроксимированной энтропии и результаты экспериментальных исследований по тестированию последовательностей различных длин показали, что тесты являются эквивалентными при рассмотрении серий одинаковых длин и при длинах исследуемых последовательностей п ^да. На основании того, что выявлена высокая степень зависимости двух тестов, целесообразно исключить один из них из системы тестирования.

COMPARISON OF SERIAL AND APPROXIMATE ENTROPY TEST STATISTICS

N.G. KIYEVETS, A.I. KORZUN Abstract

It is shown that mathematical expressions for serial and approximate test statistics are

equivalent on conditions that concerned overlapping series have the same lengths and observable sequence

length n The test result coincidence is experimentally confirmed.

Список литературы

1. Statistical testing of random number generators. [Электронный ресурс]. - Режим доступа: http://infosec.pku.edu.cn/~tly/oldversion/nist-nissc-1999/papers/p24.pdf. - Дата доступа: 13.11.2012.

2. Turan M.S., Doganaksoy A., Bozta§ S.// Proceedings of the 5th International Conference «Sequences and Their Applications - SETA 2008 ». September, 14-18, 2008. P. 18-29.

3. A statistical test suite for random and pseudorandom number generators for cryptographic applications. [Электронный ресурс]. - Режим доступа: http://csrc.nist.gov/publications/nistpubs/800-22-rev1a/SP800-22rev1a.pdf. - Дата доступа: 13.11.2012.

4. Rukhin A. // J.of Applied Probability. 2000. Vol. 37. P. 88-100.

5. Киевец Н.Г., Корзун А.И. // Электроника инфо. 2013. №6 (96). С. 158-160.

6. Бондаренко В.Ф., Дубовец В.Д. MatLab. Основы работы и программирования, компьютерная математика. Минск, 2010.

i Надоели баннеры? Вы всегда можете отключить рекламу.