Идентификация информационных характеристик динамических систем на основе оптимальной дискретизации многоканальных данных*

Кирьянов Кирилл Геннадьевич

РАДИОФИЗИКА

УДК 681.51

ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ОПТИМАЛЬНОЙ ДИСКРЕТИЗАЦИИ

МНОГОКАНАЛЬНЫХ ДАННЫХ*

Нижегородский госуниверситет им. Н.И. Лобачевского,

ФГУП «Нижегородский научно-исследовательский приборостроительный институт «Кварц»

kkg83@sandy.ru

Поступила в редакцию 01.10.2009

Предложен и проверен экспериментально метод идентификации информационных характеристик многоканальных (к + г)-полюсных фрагментов сложных динамических систем (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) на основе оптимальной дискретизации по базовым параметрам векторных (многоканальных) к-входных и г-выходных аналоговых и дискретных процессов ограниченного размаха и продолжительности.

Ключевые слова: оптимальные базовые параметры векторных данных, структурная идентификация грубых (структурно-устойчивых) динамических систем по оптимальным базовым параметрам исходных аналоговых или дискретных процессов, предсказуемость, избыточность, ненадёжность, пропускная способность.

Введение

Проблемам получения математических моделей (ММ) и характеристик объектов управления в науке и технике посвящено большое число работ с самыми различными конкретными целями и постановками задач (см., например, [1-3]). Многообразие подходов к проблеме указывает, с одной стороны, на теоретическую и практическую их актуальность, а с другой - на некоторую неудовлетворённость полученными теоретическими результатами и, в большей степени, результатами их практического применения в различных областях знаний, в том числе и в радиофизических исследованиях. Отметим некоторые недостатки традиционных подходов:

- несогласованность между собой существующих процедур структурной и параметрической идентификации сложных динамических объектов (систем);

- различия в подходах и методах идентификации аналоговых и дискретных (цифровых) сигналов и систем;

Доклад прочитан на объединенном семинаре кафедр теории колебаний, радиотехники, безопасности информационных систем и коммуникаций РФФ ННГУ 28.05.2009 г.

- «негрубость» идентифицированных математических моделей, т.е. сильная чувствительность параметров моделей как к малым изменениям исходных экспериментальных данных, так и к изменениям априорных сведений о структуре моделей, что особенно сильно проявляется в случае сложных разветвлённых систем.

Поэтому настоящая работа, являющаяся продолжением рассмотрения эффективного метода оптимальной дискретизации (оптимального «загрубления») по уровню и времени исходных экспериментальных многоканальных данных [4], направлена не только на совершенствование метода идентификации и контроля динамических параметров структуры ДС (как это было фактически в работе [5]), но и на измерение важных практически информационных характеристик (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) сложных многоканальных ДС (со структурами ^ + г)-полюсных фрагментов сетей и каналов связи).

1. Математическая и структурная модели (к + г)-полюсного фрагмента сложной динамической системы сети связи

Математическая и структурная модели, как и в работе [5], выбраны в удобной для дальней-

иі

У,

Рис. 1. Структурная схема многоканального (к+г)-полюсного фрагмента ДС сложной сети связи с недоступными для наблюдения и измерения внутренними (х; , Х;+1) и доступными внешними (и; , у;) в шинах-узлах процессами

шего теоретического рассмотрения и практического использования форме оптимально дискретизованной (загрубленной) по уровням и времени дискретной динамической системы (ДДС) со стандартной многоканальной (векторной) канонической структурой синхронного автомата Хаффмана - Глушкова [6] (рис. 1).

Для структурной идентификации характеристик схемы вместо не всегда доступных для непосредственного наблюдения векторов (X;), входящих в канонические уравнения «выходов» (X) и «динамики» (у) ДДС, далее рассматриваются только необходимые и доступные для наблюдения и измерения векторные синхронные входные

н(1)...н(к)

выходные I Уг =

,(1)

руженных связей ОБП с энтропией и избыточностью текстов Шеннона.

2. Математические модели процессов в доступных для наблюдения узлах схемы рис. 1

Любой из доступных для наблюдения и измерения в узлах канала связи схемы рис. 1 процессов, например выходной векторный процесс у(0 = = |У(0,-У(0,...У(0], с кусочно-

непрерывными компонентами по времени t е [0, Т] подвергаем дискретизции по времени и уровню и преобразуем в «векторный текст»

Т е Yr, 1 < ] < г, с шагом по

Уг =

у),...у {,...$'

Д1)

?) у\11 ...у-г)

времени Дt = |_ТМ ], I®] - целая часть 0 , с це-дис- лочисленными компонентами у/ е[0,ч — 1]у,

кретные выборочные процессы С I = 0, 1, 2,..., Ч > 1, 0 < / <М-1, 1 < ] < г, и постулируем везде далее:

- ММ процесса у({) в виде эквидистантного по времени, векторного ряда целых чисел

М — 1 и размерностей ^ г и k + г , соответственно.

Структуру ММ схемы рис. 1 можно получить путём реконфигурации любой динамической системы, состоящей из конечного числа динамических подблоков со структурой схемы рис. 1, к структуре одной эквивалентной ДС в форме схемы рис. 1 [2, 6, 7]. Она позволяет проводить по измеренным взаимозависимым ОБП исходных экспериментальных входных и выходных текстов структурную идентификацию:

А) векторных динамических характеристик и параметров системы (полностью характеризующих внутреннюю структуру векторных связей схемы рис. 1 (при этом последующая параметрическая идентификация вектор-пара-метрар блоков схемы рис. 1 осуществима лишь при частных видах уравнений X и у [5, 7]));

Б) векторных информационных (берущих для ДС своё начало от «термодинамических.») характеристик и параметров структуры схемы рис. 1 (ненадёжности, пропускной способности канала в сети связи и т.д.) без знания её внутренней структуры благодаря использованию обна-

У = (Уо>Уі ’..'Уг ’...’Ум-2’Ум-і) или, в развёрнутом виде,

У =

У0’..’Уп-1’..’Уі-п+1’..’Уі ’..’Ук-п+1’..’Ук’..’Ум-1

УІ..’УГп-і’..’УІп+і’..’Угі’..’Ук-п+і’..’Ук’..’Угм-1

(1)

(1')

— ограничения по размаху и продолжительности

— да < < У* ^) < Утах < ^ е[°,Т 1 (2)

1 < ] < г,

исходных (до дискретизации по формуле (3)) непрерывных и разрывных аналоговых компонент векторных данных;

— способ приведения компонент исходных данных к форме (1) (к форме «текста» с конечным алфавитом) за счет их предварительной

Т

дискретизации при t = г • At путём «АЦ-преоб-разования»

У і =

у] (г • а t) - у т іп [о ’Т ]

У т ах

(3)

[0,Т]— утш [0,Т]

1 < ] < г ;

— ММ дискретной ДС (ДДС) источника временного ряда (1) в форме дискретного абстрактного конечного автомата с алгебраической структурой из конечных множеств входящих в них переменных уг и с уравнением динамики (с программой восстановления по А.Н. Колмогорову или с так называемым прогнозирующим оператором (ПО) векторного временного ряда (1) в виде уравнения нелинейной регрессии) размерности (порядка) п:

у,+п = $Уг,У+1, - ,у,+ п-\; п), 0 < г <М- п , (4) и параметров (пеП =[0, ч - 1]г).

Величина п является порядком ПО ряда (1), а ММ ПО, как известно, - весьма общим, но, тем не менее, частным случаем уравнений динамики у[...] и выходов Х[...] в схеме рис. 1.

Аналогичные в соответствующих алфавитах условия (1)-(4) предполагаются для ММ вход-

иУ, =

ного иг = [иг(1)...и\к)]

и^..^) У?\..УІг) ]

и комбинированного

текстов.

3. Оптимальная дискретизация источников входных и выходных данных в системе связи рис. 1

Процедура оптимизации для любого текста в схеме рис. 1, например уг, состоит в нахождении ОБП Чу, р и пу.ор1 по критерию минимального «объёма» (числа точек-состояний) Ы(М,ч,п;уфм]) = Ыу(ч,п) генератора этого текста:

(Чy;opt,ny;opt) = arg minЫ(М,Ч,п;Уге[0,М]) (5)

Че[Чтт>Чтах ],пе[пт1п>птах]>М =М 0

путём восстановления фазовой траектории (ФТ) без её самопересечений по экспериментальным данным с источника текста уг, удовлетворяющего условиям (1)—(3) в дискретном фазовом пространстве (ФП) минимального объёма ДДС [3-5]. При этом из-за монотонности логарифмической функции одновременно обеспечивается минимум энтропии Хартли (минимум потерь исходной информации с источника текста с Ыу (ч,п) равновероятными состояниями), так как

Еу;тт = тІП ^2 ^(М’Ч’П;УгфМ]) =

9е[9тіп.9тах ]-пе[птІп-птах ]М =М0

= 1о^ тіп = пу,орі ' 1о^ Чу,орі ,

(6)

___ /-1пУ;орї

где ^у;тіп = ду,орг ■

Процедура оптимальной дискретизации (5) исходных процессов даёт конкретные векторные стационарные синхронные «Mqn-тексты», так как в ПО (2) время г не входит явно.

Далее индексы символов (например, дискретного времени, числа компонент г данных (1), основания логарифма и т.п.) будем как вводить для более полного раскрытия смысла контекстов, так и опускать там, где это не приводит к неточности.

Отметим, что оптимально-загрубленные до

Г

одного из дг = д возможных вариантов уровня выборки векторных г-компонентных рядов (1)

имеют ФП большего объёма N...

= д УОР1 =

гутіп дг,у;орґ

_ ' пУ;орі

-- Чу-ОрГ и в г раз большую энтропию по ОБП:

Еу;тт = Ыу;шт = Г ' ny;opt ' Чy;opt , (6 )

которая может также зависеть от выбираемых границ области поиска ОБП. При этом процедура (5) нахождения ОБП Чур ипу.р может

реализоваться программно вложением исходных данных в ФП размера (6') как в гиперкуб с п чг = ЧГ-точечными рёбрами, так и в гиперкуб с (г • п ) ч-точечными рёбрами.

Отметим также, что введенные в работе ключевые процедуры и операции (восстановление векторных выборок текстов в ФП (6), вычисление избыточности и энтропии Шеннона для векторных текстов и др.) выполняются в совместимых с соотношениями (1)-(6) алгебраических структурах. При этом векторные энтропии по ОБП: а) не изменяются при перестановках строк компонент векторов и б) связаны соотношениями:

Еи = Е

иу,У = const єYг

ЕУ = Е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

иУ;и = const еи

.(7)

Видим, что величина 1/чу. р играет роль

«малого параметра» исходной ДС, преобразованной («загрублённой») путём оптимальной дискретизации в ДДС вида (4) порядка пу.р ,

согласованного с Чу;0р1. При этом ОБП Чу.р, пу.р и Ыу ;Шщ в выражении (6) можно интерпретировать, соответственно, как «пространственную» и «временную» «сложности» текста (уг), а значит, и исходного процесса у^), а

Т

уг; тіп = Чу-р - как

минимальный объём ФП N

связанной со «сложностью» (по терминологии А.Н. Колмогорова [7]) программы (4) для восстановления текста Уг (а значит, с точностью У-орі и исходного процесса y(t)) . Такая возможность для скалярного текста была показана в работе [4] путем построения по исходному

тексту Уг прогнозирующего оператора (4) в виде таблицы истинности. Обобщение аналогичного утверждения для векторного текста (1) даётся ниже в теореме 2.

4. Связи ОБП компонент векторных текстов в наблюдаемых шинах-узлах иг, Уг и иУг схемы рис. 1

Из соотношений (5) и (6) для ОБП-анализа векторных текстов (1) в узлах сети рис. 1 следует

Теорема 1. 1) Если векторный текст Уг (или любой другой в фрагменте сети рис. 1: иг ’ иУг ’... и т.д.) имеет одинаковые компоненты’ то его минимальная векторная энтропия Е¥ тіп и векторные ОБП дУ и пуу совпадают

с минимальной энтропией Еу. тіп и ОБП ч]у.орі

и п]у.ор1 подвекторов 3 = 1, 2, ...’ г;

2) Если векторный текст уг имеет разные компоненты’ то минимальная энтропия

Т7У

Е тіп векторного г-компонентного текста у не больше’ чем максимальная из энтропий

подвекторов’ т.е. еУУ; тіп < тах Ц. тіп ’ 3 = 1

2,..., г .

Теорема помогает сделать согласованный выбор областей поиска ОБП векторных текстов природных и модельных процессов (см. примеры в разделе 10), а также получать с помощью соотношения (6') ограничения на значения ОБП компонент текстов.

5. Связь ОБП наблюдаемых текстов иг > уг и иуг с их предсказуемостью

Из введенных обозначений (1)-(3) и алгоритма восстановления ФТ векторных Mqn-текстов (рядов) в ФП следует важная для настоящей работы

Теорема 2. Для векторного временного ряда (1)’ удовлетворяющего условиям (2)’ существует математическая модель источника ряда в виде уравнения нелинейной регрессии (4) в форме прогнозирующего оператора’ который по пор1 начальным’ следующим подряд с шагом ДіорЛ = Т/Мр чорі -значным выборкам исходного ряда (1) позволяет вычислить все оставшиеся М-порі выборок.

Теорема 2 для векторного ряда (1) доказывается аналогично случаю скалярного ряда [4] путём установления взаимно-однозначного соответствия, например, между алфавитами векторов-столбцов ряда (1) и вспомогательных скаляров. Кроме того, теорема 2:

- характеризует «голографическое» свойство векторного Мдп-текста (1) - «восстанавливаемость» (с точностью 1/дор() с помощью ПО (4) любых сочетаний «замен» символов в поле

у/ , 5 < г < М -1, 1 < 3 < г, по порі

известным

предшествующим и следующим подряд векторам-столбцам;

— позволяет естественным образом ввести понятие «предсказуемости» (прогнозируемости) (Рг) поведения векторного ПО (4) как отношения энтропии предсказываемой части векторных текстов к энтропии базовой (начальной части)

Рг =

орі

+1 =

(8)

= (М-порі) /порі + 1 = М/порі < М ,

из которого следует

Теорема 3. Предсказуемость (8) векторного текста (1):

а) зависит явно только от длины М и порядка Лор( ПО (4);

б) не может превышать длины М векторного текста;

в) возрастает с ростом М’ если «МдоріпорГтекст» при своём продолжении сохраняет ОБП’ то есть при ДМ > 0 остаётся стационарным «(М + ДМ)чоріпорі-текстом».

Доказательство теоремы следует из возможности представления функции f ПО (4) в форме таблицы истинности по тексту полной длины М.

Из утверждения п. б) следует, что при порі = 1 (то есть при «радиусе корреляции» символов текста псог= порі+1 равном 2), например, когда соседние векторные выборки зависимы функционально (уг+1 = f (уг), 0 < г < М -1 [4]) и являются компонентами «состояния» порож-

дающего их динамического источника (см., например, [5, 10]), предсказуемость Рг текста максимальна и равна М.

6. Связи ОБП с векторной избыточностью текстов и1, уг и иуг

Для ММ текста (1) ключевое соотношение между его ОБП Еу. ш;п = пуг-р • ^2 Чу;ор1

(6)

есть инвариант минимума энтропии по ОБП разностного уравнения (4) оптимально дискретизованного процесса (1) и не содержит явно параметра избыточности (Б) исходных данных. Рассматриваемые ниже важные информационные характеристики текстов каждого из узлов фрагментов схемы рис. 1 в наших задачах анализа и идентификации данных связаны с энтропией и избыточностью данных связанных со структурой схем.

В работе [4], при определении ОБП, сведения об избыточности данных учитывались выбором различных приближений критерия оптимальности ОБП для энтропии Шеннона. Выбор приближения зависел от наличия определённой априорной информации о виде модельного представления энтропии источника данных, что не всегда удобно. Поэтому для дальнейшего рассмотрения возможностей ОБП-анализа данных удобнее учитывать явно параметры энтропии и избыточности исходных данных.

Для вычисления избыточности текстов (1) ([9, с. 243-332]) путём вычисления энтропии Шеннона (Н) требуется их эргодичность, в отличие от оценок ОБП по алгоритму (5), не требующих ансамбля реализаций текстов. Получение оценок энтропии текстов конечной длины М является самостоятельной задачей теории вероятностей и статистики (см., например, [9, с. 669-686]). Однако кажущиеся коллизии «примиряются» результататами работ А.Н. Колмогорова (см., например, [8]), в которых показывается, что «основные понятия теории информации должны и могут быть обоснованы без помощи обращения к теории вероятностей и так, что понятия «энтропия» и «количество информации» оказываются применимыми к индивидуальным объектам» или, в нашем случае, к конкретным текстам и их источникам.

Поэтому результаты вычисления информационных характеристик сигналов и систем по полученным далее формулам (разделы 6-9), зависящим от Н, по имеющимся текстам конечной длины М нами рассматриваются как «идентификационные метки» или «сигнатуры» сигналов и систем. Ясно, что при практической

возможности увеличения длины М и в случае наблюдающейся при этом тенденции к сходимости меток достоверность последних может, при необходимости, оцениваться с помощью неравенства П.Л. Чебышева.

Учёт избыточности Б при ОБП-анализе текстов даёт следующая

Теорема 4. Соотношение между ОБП и Б (инвариантами энтропии Еш;п б>0 разностного уравнения для ПО) оптимально дискретизованного векторного Мчп-текста (1), переходящее в равенство (6) при Б = 0, имеет вид:

Етт.Б>0 = nopt;D>0 • (1^2 Чг.Б>0;opt — Б) =

- n

• log2(q,

2(qr,'D >0 .opt

72D) =

- nopt.D >0(1 — K) • log2 q

(9)

2 qr,-D >0.opt

- nopt.D >0 • log 2 ^D&iopV

nopt;D >0

где К — коэффициент избыточности, имеющий вид

К = Б/Нг,тах = 1 — Ег,тт.Б>0/Er;min;D=0 .(10) Доказательство утверждения вытекает из следующих фактов:

- способа (3) «АЦ-преобразования» данных при оптимальной дискретизации

Н„

= log 2 4r:opt = r •

(11)

5 2 Чr;opt ' Чopt’

- вводимого определения понятия средней избыточности, приходящейся на компоненту векторного процесса (далее - просто избыточности)

D — Dr = (Hr. max HD>0)

rr - соотношения

Er ■. min ■. D > 0 D ^ 0

=log2 qopt—Нш°; (12)

H

Er. min .D=0

D >0

n

opt

(13)

справедливого при D > 0 (см., например, формулу (7) при ps ф const в работе [4]).

Заметим, что при эргодичности текста энтропия Шеннона подсчитывается по формуле g-граммной энтропии F Pratt, которая, как показано в [9, с. б70], при граммности g = 1 переходит в «обычную» форму для расчета энтропии Шеннона:

s=q—1

H — Hg=l =— Zps log2 ps , ps = Ms/M, s=0

M—1

Ms = Z5( Уі—s), i=0

r

8( У г — s) =■

0, если уг ф s

1, если уг = s

(14)

Из уравнений (10)—(12) при наличии ненулевой избыточности текста происходит уменьшение числа оптимальных уровней квантования

текста до величины ЧD>o■opt//2 , и, следовательно, теорему 3 можно усилить дополнительным утверждением:

г) возрастает с уменьшением его избыточности по Шеннону, так как:

Pr =■

M

= M •

(log2 qD>0 .opt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—D)

n

= M •

D>0.opt

log2( q

E

2 ( 4D>0,-opt

'2 D)

opt min.D >0

D ^0

(15)

Emin :D >0

M/n

opf

7. Связи ОБП и энтропий по ОБП с энтропией Шеннона в шинах-узлах иг, уг и иуг

Из уравнений (10)—(13) также следуют связи между энтропией Шеннона и энтропией по ОБП в наблюдаемой шине-узле уг схемы рис. 1:

H — Hmax D r • log2 qy;D>0;opt

— D < r • log2 qy.D^opt (0 < D < Hmax),

H — Hmax — D = Emin,D>o/nD>0.opt —

— D < E

min.D>0

>o/ nD>0.

opt

(1б)

(17)

(0 < D < Hmax) ,

совпадающие при D = 0, т.к.

, Emin,y,D&0 D^0

r • log2 qy.Dso.opt----- ------------->

ny;D>0;opt 52 qyopt

^^r • log2 qy.opt —-^ = 0 .

пу-,гр

а для энтропии текстов в шинах-узлах иг и иуг схемы рис. 1 размерность г изменяется на k и

k + г.

8. Связи ОБП с функцией ненадежности передачи информации

В пионерской работе Шеннона ([9, с. 333402]), посвящённой криптографии, в качестве меры неопределенности связи введены понятия «функций ненадёжности» передачи информации, которые могут характеризовать качество канала передачи данных рис. 1 от узла к узлу иг и, наоборот, от узла иг к узлу уг по

близости к нулю значений соответствующих условных энтропий Hu/y и Hy/u . Справедлива

учитывающая избыточности в векторных текстах

Теорема 5. Функция ненадёжности векторного канала связи от уг к ui, для текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (18)-(20):

H u/y — H uy-H y = log qk+r.uy.D > 0.opt

— log Qr.y.D >0.opt — (Dk+r.uy — Dry ) = (18)

! qk+r.uy.D >0.opt / ,-4 r-ч \

= log -------і------^----( Dk + r.uy — Dry X

tfr.y.D > 0.opt

H — H -H =

H u/y ~ H uy H y ~

Ek + r.uy.D >0 Er.y.D > 0

(19)

k+r.uy.opt ^r.y.opt

(Dk+r.uy Dr,y ),

log

qk+ r.uy.D > 0.opt ^ry.D > 0.opt

E

k+r.uy.D >0

E

(20)

r.y.D > 0

^ nk+r.uy.D >0.opt ^r.y.D >0.opt J

Доказательство теоремы следует из выражений (16) и (17). Аналогичная теорема справедлива с перестановкой индексов иг и уг для передачи информации по каналу рис. 1 в «обратном» направлении, если тексты иг и уг известны, но нет информации о математической модели их связи.

Из соотношений (18) и (19) следует, что асимметричность канала связи Аиу не зависит

явно от избыточности текстов и определяется по формуле

Аиу = Ни/у — Ну/и = Ни — Ну, Аиу = — Ауи , (19')

из которой следует, что при Ни!у = 0,

Ну/и = Ну — Ни = 0 только При Ну = Ни .

В упомянутой работе Шеннона вводится понятие «расстояние единственности» (РЕ) или

«расстояние уникальности» прЕ шифрограммы в канале связи рис. 1, которое при Ниу = 0 является значением корня nГ.y.D>o■0pt уравнений (18) и (19) только для одного из всех возможных вариантов исходного сообщения иг [9].

Примеры характеристик текстов

Таблица 1

Идентификация информационных характеристик скалярных и векторных текстов, связанных с колебательным LCR-контуром и странным аттрактором Лоренца

Пример 1. Двумерный векторный и покомпонентные процессы синхронных изменений тока i и заряда q в колебательном LCR-контуре

Оптимальные БП подвектора i_file.txt: г = 1; М=1000; Рг=

- ОБП: qoptлr=748 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=19.09379 g=1 Н=8.73263 г^^ор^)=9.546894 D=loq(qopt)-Hq/r=0.81427

Оптимальные БП подвектора q_file.txt: г = 1; М=1000;

- ОБП: qoptЛr=697 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=18.89003 g=1 Н=8.64207 log(qopt)=9.445015 D=loq(qopt)-Hq/r=0.80295

Оптимальные БП 2-мерного процесса i_file.txt + q_file.txt г = 2; М=1000;

- ОБП: qoptЛr=141 из [2,1000]; nopt=1 из [1,30]; Рг=1000 Е=т^^орГ)=7.13955 g=1 Н=9.96578 rlog(qopt)=7.139551 D=loq(qopt)-Hq/г=2.15666

Пример 2. Трёхмерный векторный и покомпонентные процессы аттрактора Лоренца [2]

Оптимальные БП подвектора lornz-yl.txt: r = 1; М=1001;

- ОБП: qoptЛr=1026 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=30.00845 g=1 Н=8.9944б log(qopt)=10.002815 D=loq(qopt)-Hq/r= 1.00835

Оптимальные БП подвектора lornz-y2.txt: r = 1; М=1001;

- ОБП: qoptЛr=1500 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31 .б5224 g=1 H=9.10955 log(qopt)=10.550747 D=loq(qopt)-Hq/r=1.44120

Оптимальные БП подвектора lornz-y3.txt: r = 1; М=1001;

- ОБП: qoptЛr=1421 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31.41807 g=1 Н=9.252б5 log(qopt)=10.472691 D=loq(qopt)-Hq/r=1.22004

Оптимальные БП 3-мерного процесса lornz-yl.txt + lornz-y2.txt + lornz-y3.txt : r = 3; М=1001;

- ОБП: qoptЛr=311 из [300,1б00]; nopt=1 из [1,30]; Pr=1001 E=rnlog(qopt)=8.28077 g=1 Н=9.9б723 rlog(qopt)=8.280771 D=loq(qopt)-Hq/r=4.95836

Замечания к таблице1

1. В модельных примерах данных типа 1 и 2 с «большей» точностью (разрядностью чисел) компьютерных данных у «оптимально загрубленных» данных ОБП qopt оказывается больше (и 102-104), чем у экспериментальных аналоговых данных, как правило, с меньшим числом оптимальных уровней (и 2-102).

2. Векторные процессы примеров 1 и 2 образуют полный набор функционально связанных компонент состояния порождающих их ДДС, т.к. совокупный ОБП пр = 1.

3. Предсказуемость Рг = (М/пр) выше у векторных текстов с функционально связанными компонентами.

Для любого канала связи рис. 1 (четырёхполюсника, многополюсника, шифратора и т.д.) сообщение по каналу связи передается «надежно» (пример в разделе 10), когда «ненадежность» Ни/у канала связи близка к нулю и РЕ

можно определять как величину

РЕ /л 1 \

пу = nг;y;D>0;opt, (21) где

так как последующие выборки процесса у1 при

сти текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (22) и (23):

пРЕ =

Er;y;D>0 • nk+r;uy;D>0;opt

Ek+r;uy;D>0 nk+r;uy;D>0;opt (Duy Dy )

, (22)

* = ny;D>0;opt, пу,Б>0^ + 1,-,М — 1 могут быть

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

вычислены по пГ.у.Б>0;ор1 начальным, следующим подряд выборкам исходного ряда 1 по теореме 2 (формула (4)). Другое выражение для вычисления значения величины РЕ по ОБП даёт

Теорема 6. Расстояние единственности (21) для векторного канала связи рис. 1 при эргодично-

/ ТЛ тл \ 1 + r;uy;D >0;opt /г,,-.

(D uy - D y ) = log---------^. (23)

q r;y;D > 0 ;opt Утверждение теоремы 6 следует из соотношений (18) и (19) при условии H ujy = 0 .

Заметим также, что значение оценки РЕ, полученное в работе [11] для моделей входных и выходных текстов в КС без использования понятия избыточности, отличается от (21) множителем Ek+r;uy/Er;u ^ 1 .

Пример одноканальной системы связи

Таблица 2

Идентификация структуры математической модели транслятора генетического текста иг(1) (“РНК”)

^ У(1 («белок») Уотсона - Крика (см., например, [12]): и(^ = 3307-М=958Лх1 ген митохондрии дрожжей и кодируемой этим текстом последовательности аминокислотных остатков — у= 3307-АК-00-М=957Лх1 с «синхронизующими вставками» «00» для выравнивания фаз кодонов АК текста

входной текст - и (1) = 3307-М=958, їє [1-100].1х1 (и)

выходной текст - у р = 3307-АК-00-М=957, iє[1-100].txt (у) с «синхронизирующими вставками -00»

ДПФ-спектр входного текста и(1) = 3307-М=958.txt

(и). (Пик спектра на частоте f = 1/3 ниже уровня постоянной составляющей спектра при f = 0, но выше уровня его псевдослучайной информационной части)

ДПФ-спектр выходного текста

у

М=957.txt (у) с «синхронизующими вставками - 00». Более чёткий пик спектра на частоте f = 1/3 значительно выше уровня его информационной части)

Коды текстов и канала связи

Характеристики скалярных и векторных ______текстов в узлах каналов связи_____

ОБП ^,п) и энтропия по ОБП (Етїп) с указанием областей поиска

Размерность;

избыточность;

энтропия;

граммность;

предсказуемость

(г;Р;Н^;Рг)

Характеристики скалярных и векторных каналов связи

Информационная ненадёжность канала; расстояние единственности Н(и|у); пРЕ =Псрі

Пропускная способность канала С (нормирована на скорость тактирования данных; см. (25))

(и)

(4, 11)/(22) qopt = 4 є [3,100], nopt = 11 є [1,30];

1;

D(u) = 1.99941; Н(и) =0.00059; g=11;Pr=87

(у)

(5,21)/(48,76049) qopt = 5є[3,100], nopt = 21 є [1,30],

1;

D(y) =2.31707; Н(у) = 0.00486; г=21;Рг=45.5

(и^у)

(4, 11)/(22) qopt=4є[3,100], nopt=11є[1,30]

2;

D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=86.9

Н(и|у)=Н(иу)-Н(у) = Е(иу)/п(иу)-Е(у)/п(у)-

- (D(uy) -D(y)) = 22/11-22/11--(1,99971-1,99941) *

* 0; пРЕ =nopt = 11

С0^1=Е(и)/п(и)+Е(у)/п(у)

- Е(иу)/ п(иу)+ +(D(u)+D(y)-D(uy)) = 22/11+48,76048/21-22/11+ +(1.99941+2.31707-1.99971) = 2.3219+(2.31704)=4.63896

(у^и)

(4, 11)/ (22) qopt=4є[3,100], nopt=11 є [1,30],

2;

D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=87

Н(у|и)=Н(уи)-Н(и) = Е(уи)/гп(уи)-Е(у)/п(и) -- Ф(уи)^(и))= 22/11-48.76049/21- (1.99971-1.99941) = (2 - 2.3219)-(0.0003) = - 0.3222; 21

С1^0 = С0^1 = 4.63896

Замечания к таблице 2

1. Все полученные динамические и информационные характеристики канала связи сведены в таблицу 2.

2. Рисунки Фурье-спектров процессов и(г> и у (Ч транслятора поясняют «феномен числа 3 в генетике» - связь

(совпадение) размера «кодона» (состоящего из 3 нуклеотидов), а также 8-пика Фурье-спектра в белок-кодирующих участках РНК («генах») точно на периоде Т=3.

3. Для последовательностей нуклеотидов в гене и(1) = 3307-М=958.Ш митохондрии дрожжей найдены правильные ОБП q0pt=4 при области поиска [2, 100] , а ОБП пор4=П, характеризующие порядок их генератора-источника генетического текста («фермента») с широко известным в генетике периодом плотной спиральной укладки нуклеотидов в ДНК [12].

4. Характеристики ОБП девяти других генов, анализированных, но не представленных в таблице 2, зависят от D и Н и имеют HШ1X=log2q0pt=2 и алфавит нуклеотидов с qopt = 4.

5. ОБП qopt=4 и Еш„=22 аминокислотной последовательности - у*1 = 3307-АК-00-М=957^ с «синхронизующими вставками» «00» для выравнивания длин М текстов совпадают с ОБП входной нуклеотидной последовательности и([) .

6. Ненадёжности транслятора -Н(у\и)=Н(иу)-Н(и) = Е(иу)/п(иу)-Е(и)/п(и) - (О(иу)-О(и)) каналов и(Г) («РНК») ^ у(г) («белок») для всех исследованных текстов генов митохондрии дрожжей разной длины М (от 346 до 1812) при граммности g=nopt оказались равными нулю с точностью лучше 1%, что говорит о надёжности работы «аппарата» генетического кодирования, рассчитанной на основе предложенной математической модели, близкой к единице.

7. Полученные в примере результаты компьютерной идентификации аппарата трансляции универсального генетического кода соответствуют общеизвестным в генетике параметрам и указывают на перспективность применения предложенного метода структурной идентификации и для нанообъектов.

9. Связи ОБП с функциями пропускной способности при передаче информации в схеме рис. 1

В работе Шеннона [9] введено важное для теории и практики передачи информации широко используемое понятие пропускной способности (С) системы связи. Для её подсчёта можно воспользоваться любой из приведённых далее формул:

С = V • тах ры (ни - ни/у ) =

= V • таХ Ри (Ни + НУ - Ни/у )■

чениям ОБП, D и энтропии Н этих конкретных реализаций текстов по приведённым выше формулам. Поэтому, как уже было отмечено в разделе 6, рассматриваемую как сигнатуру пропускную способность С фрагмента рис. 1 сложной системы связи можно выразить через ОБП в двух эквивалентных формах на основе полученных выше связей (18)—(20)

С - С1 - Ни + Ну - Ниу =

(24)

( п • п ^

Чu;opt;Du >0 Пу;орґ^у >0

Пиу;орі;С>иу >0

- (Аи + Dy -Аиу)

(25)

иу

где V = 1/тср (сек-1) - скорость передачи информации, Те - длительность символа yг■єY, а V 0

V = Ъ0=1;2Т0 ^ Рщ - сРеДнее значение

длительности.

В отличие от традиционных задач оптимального кодирования текстов для обеспечения их безошибочной передачи по каналу с ограниченной пропускной способностью С далее везде следует полагать тср = те = 1 и V = 1, т.к. ММ временного ряда (1), достаточные для рассмотрения задач настоящей работы, можно считать «вторичными», т.е. результатом предварительного оптимального кодирования некоторого не рассматриваемого нами в настоящей работе «первичного» текста.

В нашем случае при идентификации систем рис. 1 распределения вероятностей ри и ру «индивидуальных» реализаций экспериментальных данных (1) уже учтены автоматически по зна-

С - С 2 - Ни + Ну - Ниу =

Еи,тіп;Аи>0 Еу;шш;Ву>0 Еиу;тт;Э >0

- + -

и;орі

1у;орі

П

- (26)

иу;орі

- (Аи + Ау - Аиу X

иу

так как очевидно, что

log Пu;opt;D >0 ' пy;opt;D >0 = Еи; тіп ;Би >0 + пuy;opt;D >0 nu;opt

Е у; тіп ;А > 0 Еиу; тіп > 0

(27)

п

uy;opt

10. Апробация метода и его практических приложений

Информационные характеристики некоторых каналов связи природных и модельных динамических систем, используемых в учебных занятиях со студентами ННГУ и являющихся фрагментами схемы рис. 1, и соответствующих

ny;opt

им скалярных и векторных текстов, полученных описанными в работе способами, даны в таблицах 1 и 2 результатов компьютерных экспериментов и замечаниях к ним.

Границы областей поиска для векторных и скалярных процессов подбирались с учётом теоремы 1, а также априорной информации о значениях возможных параметров процессов, как правило, так, чтобы ОБП пр и пр оказывались внутри области поиска.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заключение

1. Предложен и проверен моделированием метод структурной идентификации и анализа динамических и информационных характеристик многополюсных фрагментов сложных динамических систем и связанных с ними процессов - избыточности, предсказуемости, ненадёжности, пропускной способности каналов связи и др.

2. Метод основан на установленной связи энтропии и избыточности Шеннона оптимально дискретизованных по уровню и времени исходных векторных входных и выходных процессов, ограниченных по уровню и продолжительности, с их оптимальными базовыми параметрами (ОБП):

- оптимальными по уровню числами дискрет

пopt ^ Z+,

- оптимальными размерностями noptєZ+ -(порядками) динамических моделей источников-генераторов процессов.

3. Предложенный метод структурной идентификации и анализа динамических и информационных характеристик сложных систем (разделы 1-5) по экспериментальным данным полезен при решении многих задач, рассмотренных частично в прикладных разделах (6-10), и заслуживает внимания благодаря своей сравнительной простоте, методической направленности и информативности, так как теоретикам важна его основа - теория дискретных динамических систем (автоматов) и теория информации, практикам - простота интерпретации ОБП данных при анализе динамических и информационных характеристик динамических систем, получать которые традиционными видами обработки, не всегда учитывающими точность исходных данных, затруднительно.

Автор благодарит В.Д. Шалфеева, И.Я. Орлова, В.А. Таланова и участников семинара за учтённые в работе полезные замечания.

Работа выполнена при частичной поддержке Государственного контракта № 02.740.11.0003.

Список литературы

1. Льюинг Л. Идентификация систем. Теория для пользователя: Пер. с англ. / Под ред. Я.З. Цып-кина. М.: Наука. Гл. ред. физ.-мат.лит., 1991. 432 с.

2. Идентификация систем и задачи управления // Труды VII Международ. конф. SICPRO'09/ ИПУ РАН. М., 2009.

3. Kiryanov K.G. To a choice of the basic parameters of mathematical model of experimental data source // Proceedings 5-th International Specialists Workshop in Area Nonlinear Dynamics of Electronics Systems (NDES-97). Moscow, Russia, June 26-27, 1997. Pp. 400-403.

4. Кирьянов К.Г. Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 1. С. 39-46.

5. Кирьянов К.Г. Структурная идентификация динамических систем на основе оптимальной дискретизации многоканальных данных // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 6. С. 59-69.

6. Глушков В.М. Абстрактная теория автоматов // Успехи математических наук. М., 1961. Т. XVI. Вып. 5.

7. Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985.

8. Колмогоров А.Н. К логическим основам теории информации и теории вероятностей // Сб. трудов «Теория информации и теория алгоритмов» / Под ред. Ю.В. Прохорова. 1987. 332 с.

9. Шеннон К. Работы по теории информации и кибернетике / Пер. с англ. под ред. Р.Л. Добрушина и О.Б. Лупанова. М.: ИЛ, 1963.

10. Кирьянов К.Г., Грунина Е.А. Об определении достаточного числа отведений с изучаемой динамической системы // Тр. 9-й научн. конф. по радиофизике. 7 мая 2005 г. / Ред. А.В. Якимов. Нижний Новгород: TALAM, 2005.

11. Кирьянов К.Г., Горбунов А.А Структурная идентификация криптосистем на основе определения их базовых параметров // Труды VII Международ. конф. «Идентификация систем и задачи управления SICPR0'08». М.: ИПУ РАН, 2008. С. 1186-1196.

12. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем / Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: TALAM, 2002. 100 с.

IDENTIFICATION OF INFORMATION CHARACTERISTICS OF DYNAMIC SYSTEMS ON THE BASIS OF OPTIMAL DISCRETIZATION OF MULTICHANNEL DATA

K.G. Kiryanov

A method has been proposed and experimentally checked to identify information characteristics of multichannel (k+r)-pole fragments of complex dynamic systems (redundancy, predictability, unreliability, throughput, etc.). The method is based on the optimum discretization over basic parameters of vector (multichannel) k-input and r-output analog and discrete processes limited in scope and duration.

Keywords.: optimal basic parameters (OBP) of vector data, structural identification of coarse (structurally stable) dynamic systems (DS) by OBP of the initial analog or discrete processes, predictability, redundancy, unreliability, throughput.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кирьянов Кирилл Геннадьевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кирьянов Кирилл Геннадьевич

IDENTIFICATION OF INFORMATION CHARACTERISTICS OF DYNAMIC SYSTEMS ON THE BASIS OF OPTIMAL DISCRETIZATION OF MULTICHANNEL DATA

Текст научной работы на тему «Идентификация информационных характеристик динамических систем на основе оптимальной дискретизации многоканальных данных*»