РАДИОФИЗИКА
УДК 681.51
ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ОПТИМАЛЬНОЙ ДИСКРЕТИЗАЦИИ
МНОГОКАНАЛЬНЫХ ДАННЫХ*
© 2010 г. К.Г. Кирьянов
Нижегородский госуниверситет им. Н.И. Лобачевского,
ФГУП «Нижегородский научно-исследовательский приборостроительный институт «Кварц»
Поступила в редакцию 01.10.2009
Предложен и проверен экспериментально метод идентификации информационных характеристик многоканальных (к + г)-полюсных фрагментов сложных динамических систем (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) на основе оптимальной дискретизации по базовым параметрам векторных (многоканальных) к-входных и г-выходных аналоговых и дискретных процессов ограниченного размаха и продолжительности.
Ключевые слова: оптимальные базовые параметры векторных данных, структурная идентификация грубых (структурно-устойчивых) динамических систем по оптимальным базовым параметрам исходных аналоговых или дискретных процессов, предсказуемость, избыточность, ненадёжность, пропускная способность.
Введение
Проблемам получения математических моделей (ММ) и характеристик объектов управления в науке и технике посвящено большое число работ с самыми различными конкретными целями и постановками задач (см., например, [1-3]). Многообразие подходов к проблеме указывает, с одной стороны, на теоретическую и практическую их актуальность, а с другой - на некоторую неудовлетворённость полученными теоретическими результатами и, в большей степени, результатами их практического применения в различных областях знаний, в том числе и в радиофизических исследованиях. Отметим некоторые недостатки традиционных подходов:
- несогласованность между собой существующих процедур структурной и параметрической идентификации сложных динамических объектов (систем);
- различия в подходах и методах идентификации аналоговых и дискретных (цифровых) сигналов и систем;
Доклад прочитан на объединенном семинаре кафедр теории колебаний, радиотехники, безопасности информационных систем и коммуникаций РФФ ННГУ 28.05.2009 г.
- «негрубость» идентифицированных математических моделей, т.е. сильная чувствительность параметров моделей как к малым изменениям исходных экспериментальных данных, так и к изменениям априорных сведений о структуре моделей, что особенно сильно проявляется в случае сложных разветвлённых систем.
Поэтому настоящая работа, являющаяся продолжением рассмотрения эффективного метода оптимальной дискретизации (оптимального «загрубления») по уровню и времени исходных экспериментальных многоканальных данных [4], направлена не только на совершенствование метода идентификации и контроля динамических параметров структуры ДС (как это было фактически в работе [5]), но и на измерение важных практически информационных характеристик (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) сложных многоканальных ДС (со структурами ^ + г)-полюсных фрагментов сетей и каналов связи).
1. Математическая и структурная модели (к + г)-полюсного фрагмента сложной динамической системы сети связи
Математическая и структурная модели, как и в работе [5], выбраны в удобной для дальней-
иі
У,
Рис. 1. Структурная схема многоканального (к+г)-полюсного фрагмента ДС сложной сети связи с недоступными для наблюдения и измерения внутренними (х; , Х;+1) и доступными внешними (и; , у;) в шинах-узлах процессами
шего теоретического рассмотрения и практического использования форме оптимально дискретизованной (загрубленной) по уровням и времени дискретной динамической системы (ДДС) со стандартной многоканальной (векторной) канонической структурой синхронного автомата Хаффмана - Глушкова [6] (рис. 1).
Для структурной идентификации характеристик схемы вместо не всегда доступных для непосредственного наблюдения векторов (X;), входящих в канонические уравнения «выходов» (X) и «динамики» (у) ДДС, далее рассматриваются только необходимые и доступные для наблюдения и измерения векторные синхронные входные
н(1)...н(к)
выходные I Уг =
,(1)
руженных связей ОБП с энтропией и избыточностью текстов Шеннона.
2. Математические модели процессов в доступных для наблюдения узлах схемы рис. 1
Любой из доступных для наблюдения и измерения в узлах канала связи схемы рис. 1 процессов, например выходной векторный процесс у(0 = = |У(0,-У(0,...У(0], с кусочно-
непрерывными компонентами по времени t е [0, Т] подвергаем дискретизции по времени и уровню и преобразуем в «векторный текст»
Т е Yr, 1 < ] < г, с шагом по
Уг =
у),...у {,...$'
Д1)
?) у\11 ...у-г)
времени Дt = |_ТМ ], I®] - целая часть 0 , с це-дис- лочисленными компонентами у/ е[0,ч — 1]у,
кретные выборочные процессы С I = 0, 1, 2,..., Ч > 1, 0 < / <М-1, 1 < ] < г, и постулируем везде далее:
- ММ процесса у({) в виде эквидистантного по времени, векторного ряда целых чисел
М — 1 и размерностей ^ г и k + г , соответственно.
Структуру ММ схемы рис. 1 можно получить путём реконфигурации любой динамической системы, состоящей из конечного числа динамических подблоков со структурой схемы рис. 1, к структуре одной эквивалентной ДС в форме схемы рис. 1 [2, 6, 7]. Она позволяет проводить по измеренным взаимозависимым ОБП исходных экспериментальных входных и выходных текстов структурную идентификацию:
А) векторных динамических характеристик и параметров системы (полностью характеризующих внутреннюю структуру векторных связей схемы рис. 1 (при этом последующая параметрическая идентификация вектор-пара-метрар блоков схемы рис. 1 осуществима лишь при частных видах уравнений X и у [5, 7]));
Б) векторных информационных (берущих для ДС своё начало от «термодинамических.») характеристик и параметров структуры схемы рис. 1 (ненадёжности, пропускной способности канала в сети связи и т.д.) без знания её внутренней структуры благодаря использованию обна-
У = (Уо>Уі ’..'Уг ’...’Ум-2’Ум-і) или, в развёрнутом виде,
У =
У0’..’Уп-1’..’Уі-п+1’..’Уі ’..’Ук-п+1’..’Ук’..’Ум-1
УІ..’УГп-і’..’УІп+і’..’Угі’..’Ук-п+і’..’Ук’..’Угм-1
(1)
(1')
— ограничения по размаху и продолжительности
— да < < У* ^) < Утах < ^ е[°,Т 1 (2)
1 < ] < г,
исходных (до дискретизации по формуле (3)) непрерывных и разрывных аналоговых компонент векторных данных;
— способ приведения компонент исходных данных к форме (1) (к форме «текста» с конечным алфавитом) за счет их предварительной
Т
Т
дискретизации при t = г • At путём «АЦ-преоб-разования»
У і =
у] (г • а t) - у т іп [о ’Т ]
У т ах
(3)
[0,Т]— утш [0,Т]
1 < ] < г ;
— ММ дискретной ДС (ДДС) источника временного ряда (1) в форме дискретного абстрактного конечного автомата с алгебраической структурой из конечных множеств входящих в них переменных уг и с уравнением динамики (с программой восстановления по А.Н. Колмогорову или с так называемым прогнозирующим оператором (ПО) векторного временного ряда (1) в виде уравнения нелинейной регрессии) размерности (порядка) п:
у,+п = $Уг,У+1, - ,у,+ п-\; п), 0 < г <М- п , (4) и параметров (пеП =[0, ч - 1]г).
Величина п является порядком ПО ряда (1), а ММ ПО, как известно, - весьма общим, но, тем не менее, частным случаем уравнений динамики у[...] и выходов Х[...] в схеме рис. 1.
Аналогичные в соответствующих алфавитах условия (1)-(4) предполагаются для ММ вход-
иУ, =
ного иг = [иг(1)...и\к)]
и^..^) У?\..УІг) ]
и комбинированного
текстов.
3. Оптимальная дискретизация источников входных и выходных данных в системе связи рис. 1
Процедура оптимизации для любого текста в схеме рис. 1, например уг, состоит в нахождении ОБП Чу, р и пу.ор1 по критерию минимального «объёма» (числа точек-состояний) Ы(М,ч,п;уфм]) = Ыу(ч,п) генератора этого текста:
(Чy;opt,ny;opt) = arg minЫ(М,Ч,п;Уге[0,М]) (5)
Че[Чтт>Чтах ],пе[пт1п>птах]>М =М 0
путём восстановления фазовой траектории (ФТ) без её самопересечений по экспериментальным данным с источника текста уг, удовлетворяющего условиям (1)—(3) в дискретном фазовом пространстве (ФП) минимального объёма ДДС [3-5]. При этом из-за монотонности логарифмической функции одновременно обеспечивается минимум энтропии Хартли (минимум потерь исходной информации с источника текста с Ыу (ч,п) равновероятными состояниями), так как
Еу;тт = тІП ^2 ^(М’Ч’П;УгфМ]) =
9е[9тіп.9тах ]-пе[птІп-птах ]М =М0
= 1о^ тіп = пу,орі ' 1о^ Чу,орі ,
(6)
___ /-1пУ;орї
где ^у;тіп = ду,орг ■
Процедура оптимальной дискретизации (5) исходных процессов даёт конкретные векторные стационарные синхронные «Mqn-тексты», так как в ПО (2) время г не входит явно.
Далее индексы символов (например, дискретного времени, числа компонент г данных (1), основания логарифма и т.п.) будем как вводить для более полного раскрытия смысла контекстов, так и опускать там, где это не приводит к неточности.
Отметим, что оптимально-загрубленные до
Г
одного из дг = д возможных вариантов уровня выборки векторных г-компонентных рядов (1)
имеют ФП большего объёма N...
= д УОР1 =
гутіп дг,у;орґ
_ ' пУ;орі
-- Чу-ОрГ и в г раз большую энтропию по ОБП:
Еу;тт = Ыу;шт = Г ' ny;opt ' Чy;opt , (6 )
которая может также зависеть от выбираемых границ области поиска ОБП. При этом процедура (5) нахождения ОБП Чур ипу.р может
реализоваться программно вложением исходных данных в ФП размера (6') как в гиперкуб с п чг = ЧГ-точечными рёбрами, так и в гиперкуб с (г • п ) ч-точечными рёбрами.
Отметим также, что введенные в работе ключевые процедуры и операции (восстановление векторных выборок текстов в ФП (6), вычисление избыточности и энтропии Шеннона для векторных текстов и др.) выполняются в совместимых с соотношениями (1)-(6) алгебраических структурах. При этом векторные энтропии по ОБП: а) не изменяются при перестановках строк компонент векторов и б) связаны соотношениями:
Еи = Е
иу,У = const єYг
ЕУ = Е
иУ;и = const еи
.(7)
Видим, что величина 1/чу. р играет роль
«малого параметра» исходной ДС, преобразованной («загрублённой») путём оптимальной дискретизации в ДДС вида (4) порядка пу.р ,
согласованного с Чу;0р1. При этом ОБП Чу.р, пу.р и Ыу ;Шщ в выражении (6) можно интерпретировать, соответственно, как «пространственную» и «временную» «сложности» текста (уг), а значит, и исходного процесса у^), а
Т
уг; тіп = Чу-р - как
минимальный объём ФП N
связанной со «сложностью» (по терминологии А.Н. Колмогорова [7]) программы (4) для восстановления текста Уг (а значит, с точностью У-орі и исходного процесса y(t)) . Такая возможность для скалярного текста была показана в работе [4] путем построения по исходному
тексту Уг прогнозирующего оператора (4) в виде таблицы истинности. Обобщение аналогичного утверждения для векторного текста (1) даётся ниже в теореме 2.
4. Связи ОБП компонент векторных текстов в наблюдаемых шинах-узлах иг, Уг и иУг схемы рис. 1
Из соотношений (5) и (6) для ОБП-анализа векторных текстов (1) в узлах сети рис. 1 следует
Теорема 1. 1) Если векторный текст Уг (или любой другой в фрагменте сети рис. 1: иг ’ иУг ’... и т.д.) имеет одинаковые компоненты’ то его минимальная векторная энтропия Е¥ тіп и векторные ОБП дУ и пуу совпадают
с минимальной энтропией Еу. тіп и ОБП ч]у.орі
и п]у.ор1 подвекторов 3 = 1, 2, ...’ г;
2) Если векторный текст уг имеет разные компоненты’ то минимальная энтропия
Т7У
Е тіп векторного г-компонентного текста у не больше’ чем максимальная из энтропий
подвекторов’ т.е. еУУ; тіп < тах Ц. тіп ’ 3 = 1
2,..., г .
Теорема помогает сделать согласованный выбор областей поиска ОБП векторных текстов природных и модельных процессов (см. примеры в разделе 10), а также получать с помощью соотношения (6') ограничения на значения ОБП компонент текстов.
5. Связь ОБП наблюдаемых текстов иг > уг и иуг с их предсказуемостью
Из введенных обозначений (1)-(3) и алгоритма восстановления ФТ векторных Mqn-текстов (рядов) в ФП следует важная для настоящей работы
Теорема 2. Для векторного временного ряда (1)’ удовлетворяющего условиям (2)’ существует математическая модель источника ряда в виде уравнения нелинейной регрессии (4) в форме прогнозирующего оператора’ который по пор1 начальным’ следующим подряд с шагом ДіорЛ = Т/Мр чорі -значным выборкам исходного ряда (1) позволяет вычислить все оставшиеся М-порі выборок.
Теорема 2 для векторного ряда (1) доказывается аналогично случаю скалярного ряда [4] путём установления взаимно-однозначного соответствия, например, между алфавитами векторов-столбцов ряда (1) и вспомогательных скаляров. Кроме того, теорема 2:
- характеризует «голографическое» свойство векторного Мдп-текста (1) - «восстанавливаемость» (с точностью 1/дор() с помощью ПО (4) любых сочетаний «замен» символов в поле
у/ , 5 < г < М -1, 1 < 3 < г, по порі
известным
предшествующим и следующим подряд векторам-столбцам;
— позволяет естественным образом ввести понятие «предсказуемости» (прогнозируемости) (Рг) поведения векторного ПО (4) как отношения энтропии предсказываемой части векторных текстов к энтропии базовой (начальной части)
Рг =
орі
+1 =
(8)
= (М-порі) /порі + 1 = М/порі < М ,
из которого следует
Теорема 3. Предсказуемость (8) векторного текста (1):
а) зависит явно только от длины М и порядка Лор( ПО (4);
б) не может превышать длины М векторного текста;
в) возрастает с ростом М’ если «МдоріпорГтекст» при своём продолжении сохраняет ОБП’ то есть при ДМ > 0 остаётся стационарным «(М + ДМ)чоріпорі-текстом».
Доказательство теоремы следует из возможности представления функции f ПО (4) в форме таблицы истинности по тексту полной длины М.
Из утверждения п. б) следует, что при порі = 1 (то есть при «радиусе корреляции» символов текста псог= порі+1 равном 2), например, когда соседние векторные выборки зависимы функционально (уг+1 = f (уг), 0 < г < М -1 [4]) и являются компонентами «состояния» порож-
дающего их динамического источника (см., например, [5, 10]), предсказуемость Рг текста максимальна и равна М.
6. Связи ОБП с векторной избыточностью текстов и1, уг и иуг
Для ММ текста (1) ключевое соотношение между его ОБП Еу. ш;п = пуг-р • ^2 Чу;ор1
(6)
есть инвариант минимума энтропии по ОБП разностного уравнения (4) оптимально дискретизованного процесса (1) и не содержит явно параметра избыточности (Б) исходных данных. Рассматриваемые ниже важные информационные характеристики текстов каждого из узлов фрагментов схемы рис. 1 в наших задачах анализа и идентификации данных связаны с энтропией и избыточностью данных связанных со структурой схем.
В работе [4], при определении ОБП, сведения об избыточности данных учитывались выбором различных приближений критерия оптимальности ОБП для энтропии Шеннона. Выбор приближения зависел от наличия определённой априорной информации о виде модельного представления энтропии источника данных, что не всегда удобно. Поэтому для дальнейшего рассмотрения возможностей ОБП-анализа данных удобнее учитывать явно параметры энтропии и избыточности исходных данных.
Для вычисления избыточности текстов (1) ([9, с. 243-332]) путём вычисления энтропии Шеннона (Н) требуется их эргодичность, в отличие от оценок ОБП по алгоритму (5), не требующих ансамбля реализаций текстов. Получение оценок энтропии текстов конечной длины М является самостоятельной задачей теории вероятностей и статистики (см., например, [9, с. 669-686]). Однако кажущиеся коллизии «примиряются» результататами работ А.Н. Колмогорова (см., например, [8]), в которых показывается, что «основные понятия теории информации должны и могут быть обоснованы без помощи обращения к теории вероятностей и так, что понятия «энтропия» и «количество информации» оказываются применимыми к индивидуальным объектам» или, в нашем случае, к конкретным текстам и их источникам.
Поэтому результаты вычисления информационных характеристик сигналов и систем по полученным далее формулам (разделы 6-9), зависящим от Н, по имеющимся текстам конечной длины М нами рассматриваются как «идентификационные метки» или «сигнатуры» сигналов и систем. Ясно, что при практической
возможности увеличения длины М и в случае наблюдающейся при этом тенденции к сходимости меток достоверность последних может, при необходимости, оцениваться с помощью неравенства П.Л. Чебышева.
Учёт избыточности Б при ОБП-анализе текстов даёт следующая
Теорема 4. Соотношение между ОБП и Б (инвариантами энтропии Еш;п б>0 разностного уравнения для ПО) оптимально дискретизованного векторного Мчп-текста (1), переходящее в равенство (6) при Б = 0, имеет вид:
Етт.Б>0 = nopt;D>0 • (1^2 Чг.Б>0;opt — Б) =
- n
• log2(q,
2(qr,'D >0 .opt
72D) =
- nopt.D >0(1 — K) • log2 q
(9)
2 qr,-D >0.opt
- nopt.D >0 • log 2 ^D&iopV
nopt;D >0
где К — коэффициент избыточности, имеющий вид
К = Б/Нг,тах = 1 — Ег,тт.Б>0/Er;min;D=0 .(10) Доказательство утверждения вытекает из следующих фактов:
- способа (3) «АЦ-преобразования» данных при оптимальной дискретизации
Н„
= log 2 4r:opt = r •
(11)
5 2 Чr;opt ' Чopt’
- вводимого определения понятия средней избыточности, приходящейся на компоненту векторного процесса (далее - просто избыточности)
D — Dr = (Hr. max HD>0)
rr - соотношения
Er ■. min ■. D > 0 D ^ 0
=log2 qopt—Нш°; (12)
H
Er. min .D=0
D >0
n
n
opt
(13)
справедливого при D > 0 (см., например, формулу (7) при ps ф const в работе [4]).
Заметим, что при эргодичности текста энтропия Шеннона подсчитывается по формуле g-граммной энтропии F Pratt, которая, как показано в [9, с. б70], при граммности g = 1 переходит в «обычную» форму для расчета энтропии Шеннона:
s=q—1
H — Hg=l =— Zps log2 ps , ps = Ms/M, s=0
M—1
Ms = Z5( Уі—s), i=0
r
8( У г — s) =■
0, если уг ф s
1, если уг = s
(14)
Из уравнений (10)—(12) при наличии ненулевой избыточности текста происходит уменьшение числа оптимальных уровней квантования
текста до величины ЧD>o■opt//2 , и, следовательно, теорему 3 можно усилить дополнительным утверждением:
г) возрастает с уменьшением его избыточности по Шеннону, так как:
Pr =■
M
= M •
(log2 qD>0 .opt
—D)
n
= M •
D>0.opt
log2( q
E
2 ( 4D>0,-opt
'2 D)
opt min.D >0
D ^0
(15)
Emin :D >0
M/n
opf
7. Связи ОБП и энтропий по ОБП с энтропией Шеннона в шинах-узлах иг, уг и иуг
Из уравнений (10)—(13) также следуют связи между энтропией Шеннона и энтропией по ОБП в наблюдаемой шине-узле уг схемы рис. 1:
H — Hmax D r • log2 qy;D>0;opt
— D < r • log2 qy.D^opt (0 < D < Hmax),
H — Hmax — D = Emin,D>o/nD>0.opt —
— D < E
min.D>0
>o/ nD>0.
opt
(1б)
(17)
(0 < D < Hmax) ,
совпадающие при D = 0, т.к.
, Emin,y,D&0 D^0
r • log2 qy.Dso.opt----- ------------->
ny;D>0;opt 52 qyopt
^^r • log2 qy.opt —-^ = 0 .
пу-,гр
а для энтропии текстов в шинах-узлах иг и иуг схемы рис. 1 размерность г изменяется на k и
k + г.
8. Связи ОБП с функцией ненадежности передачи информации
В пионерской работе Шеннона ([9, с. 333402]), посвящённой криптографии, в качестве меры неопределенности связи введены понятия «функций ненадёжности» передачи информации, которые могут характеризовать качество канала передачи данных рис. 1 от узла к узлу иг и, наоборот, от узла иг к узлу уг по
близости к нулю значений соответствующих условных энтропий Hu/y и Hy/u . Справедлива
учитывающая избыточности в векторных текстах
Теорема 5. Функция ненадёжности векторного канала связи от уг к ui, для текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (18)-(20):
H u/y — H uy-H y = log qk+r.uy.D > 0.opt
— log Qr.y.D >0.opt — (Dk+r.uy — Dry ) = (18)
! qk+r.uy.D >0.opt / ,-4 r-ч \
= log -------і------^----( Dk + r.uy — Dry X
tfr.y.D > 0.opt
H — H -H =
H u/y ~ H uy H y ~
Ek + r.uy.D >0 Er.y.D > 0
(19)
k+r.uy.opt ^r.y.opt
(Dk+r.uy Dr,y ),
log
qk+ r.uy.D > 0.opt ^ry.D > 0.opt
E
k+r.uy.D >0
E
(20)
r.y.D > 0
^ nk+r.uy.D >0.opt ^r.y.D >0.opt J
Доказательство теоремы следует из выражений (16) и (17). Аналогичная теорема справедлива с перестановкой индексов иг и уг для передачи информации по каналу рис. 1 в «обратном» направлении, если тексты иг и уг известны, но нет информации о математической модели их связи.
Из соотношений (18) и (19) следует, что асимметричность канала связи Аиу не зависит
явно от избыточности текстов и определяется по формуле
Аиу = Ни/у — Ну/и = Ни — Ну, Аиу = — Ауи , (19')
из которой следует, что при Ни!у = 0,
Ну/и = Ну — Ни = 0 только При Ну = Ни .
В упомянутой работе Шеннона вводится понятие «расстояние единственности» (РЕ) или
«расстояние уникальности» прЕ шифрограммы в канале связи рис. 1, которое при Ниу = 0 является значением корня nГ.y.D>o■0pt уравнений (18) и (19) только для одного из всех возможных вариантов исходного сообщения иг [9].
Примеры характеристик текстов
Таблица 1
Идентификация информационных характеристик скалярных и векторных текстов, связанных с колебательным LCR-контуром и странным аттрактором Лоренца
Пример 1. Двумерный векторный и покомпонентные процессы синхронных изменений тока i и заряда q в колебательном LCR-контуре
Оптимальные БП подвектора i_file.txt: г = 1; М=1000; Рг=
- ОБП: qoptлr=748 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=19.09379 g=1 Н=8.73263 г^^ор^)=9.546894 D=loq(qopt)-Hq/r=0.81427
Оптимальные БП подвектора q_file.txt: г = 1; М=1000;
- ОБП: qoptЛr=697 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=18.89003 g=1 Н=8.64207 log(qopt)=9.445015 D=loq(qopt)-Hq/r=0.80295
Оптимальные БП 2-мерного процесса i_file.txt + q_file.txt г = 2; М=1000;
- ОБП: qoptЛr=141 из [2,1000]; nopt=1 из [1,30]; Рг=1000 Е=т^^орГ)=7.13955 g=1 Н=9.96578 rlog(qopt)=7.139551 D=loq(qopt)-Hq/г=2.15666
Пример 2. Трёхмерный векторный и покомпонентные процессы аттрактора Лоренца [2]
Оптимальные БП подвектора lornz-yl.txt: r = 1; М=1001;
- ОБП: qoptЛr=1026 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=30.00845 g=1 Н=8.9944б log(qopt)=10.002815 D=loq(qopt)-Hq/r= 1.00835
Оптимальные БП подвектора lornz-y2.txt: r = 1; М=1001;
- ОБП: qoptЛr=1500 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31 .б5224 g=1 H=9.10955 log(qopt)=10.550747 D=loq(qopt)-Hq/r=1.44120
Оптимальные БП подвектора lornz-y3.txt: r = 1; М=1001;
- ОБП: qoptЛr=1421 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31.41807 g=1 Н=9.252б5 log(qopt)=10.472691 D=loq(qopt)-Hq/r=1.22004
Оптимальные БП 3-мерного процесса lornz-yl.txt + lornz-y2.txt + lornz-y3.txt : r = 3; М=1001;
- ОБП: qoptЛr=311 из [300,1б00]; nopt=1 из [1,30]; Pr=1001 E=rnlog(qopt)=8.28077 g=1 Н=9.9б723 rlog(qopt)=8.280771 D=loq(qopt)-Hq/r=4.95836
Замечания к таблице1
1. В модельных примерах данных типа 1 и 2 с «большей» точностью (разрядностью чисел) компьютерных данных у «оптимально загрубленных» данных ОБП qopt оказывается больше (и 102-104), чем у экспериментальных аналоговых данных, как правило, с меньшим числом оптимальных уровней (и 2-102).
2. Векторные процессы примеров 1 и 2 образуют полный набор функционально связанных компонент состояния порождающих их ДДС, т.к. совокупный ОБП пр = 1.
3. Предсказуемость Рг = (М/пр) выше у векторных текстов с функционально связанными компонентами.
Для любого канала связи рис. 1 (четырёхполюсника, многополюсника, шифратора и т.д.) сообщение по каналу связи передается «надежно» (пример в разделе 10), когда «ненадежность» Ни/у канала связи близка к нулю и РЕ
можно определять как величину
РЕ /л 1 \
пу = nг;y;D>0;opt, (21) где
так как последующие выборки процесса у1 при
сти текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (22) и (23):
пРЕ =
Er;y;D>0 • nk+r;uy;D>0;opt
Ek+r;uy;D>0 nk+r;uy;D>0;opt (Duy Dy )
, (22)
* = ny;D>0;opt, пу,Б>0^ + 1,-,М — 1 могут быть
вычислены по пГ.у.Б>0;ор1 начальным, следующим подряд выборкам исходного ряда 1 по теореме 2 (формула (4)). Другое выражение для вычисления значения величины РЕ по ОБП даёт
Теорема 6. Расстояние единственности (21) для векторного канала связи рис. 1 при эргодично-
/ ТЛ тл \ 1 + r;uy;D >0;opt /г,,-.
(D uy - D y ) = log---------^. (23)
q r;y;D > 0 ;opt Утверждение теоремы 6 следует из соотношений (18) и (19) при условии H ujy = 0 .
Заметим также, что значение оценки РЕ, полученное в работе [11] для моделей входных и выходных текстов в КС без использования понятия избыточности, отличается от (21) множителем Ek+r;uy/Er;u ^ 1 .
Пример одноканальной системы связи
Таблица 2
Идентификация структуры математической модели транслятора генетического текста иг(1) (“РНК”)
^ У(1 («белок») Уотсона - Крика (см., например, [12]): и(^ = 3307-М=958Лх1 ген митохондрии дрожжей и кодируемой этим текстом последовательности аминокислотных остатков — у= 3307-АК-00-М=957Лх1 с «синхронизующими вставками» «00» для выравнивания фаз кодонов АК текста
входной текст - и (1) = 3307-М=958, їє [1-100].1х1 (и)
выходной текст - у р = 3307-АК-00-М=957, iє[1-100].txt (у) с «синхронизирующими вставками -00»
ДПФ-спектр входного текста и(1) = 3307-М=958.txt
(и). (Пик спектра на частоте f = 1/3 ниже уровня постоянной составляющей спектра при f = 0, но выше уровня его псевдослучайной информационной части)
ДПФ-спектр выходного текста
у
М=957.txt (у) с «синхронизующими вставками - 00». Более чёткий пик спектра на частоте f = 1/3 значительно выше уровня его информационной части)
Коды текстов и канала связи
Характеристики скалярных и векторных ______текстов в узлах каналов связи_____
ОБП ^,п) и энтропия по ОБП (Етїп) с указанием областей поиска
Размерность;
избыточность;
энтропия;
граммность;
предсказуемость
(г;Р;Н^;Рг)
Характеристики скалярных и векторных каналов связи
Информационная ненадёжность канала; расстояние единственности Н(и|у); пРЕ =Псрі
Пропускная способность канала С (нормирована на скорость тактирования данных; см. (25))
(и)
(4, 11)/(22) qopt = 4 є [3,100], nopt = 11 є [1,30];
1;
D(u) = 1.99941; Н(и) =0.00059; g=11;Pr=87
(у)
(5,21)/(48,76049) qopt = 5є[3,100], nopt = 21 є [1,30],
1;
D(y) =2.31707; Н(у) = 0.00486; г=21;Рг=45.5
(и^у)
(4, 11)/(22) qopt=4є[3,100], nopt=11є[1,30]
2;
D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=86.9
Н(и|у)=Н(иу)-Н(у) = Е(иу)/п(иу)-Е(у)/п(у)-
- (D(uy) -D(y)) = 22/11-22/11--(1,99971-1,99941) *
* 0; пРЕ =nopt = 11
С0^1=Е(и)/п(и)+Е(у)/п(у)
- Е(иу)/ п(иу)+ +(D(u)+D(y)-D(uy)) = 22/11+48,76048/21-22/11+ +(1.99941+2.31707-1.99971) = 2.3219+(2.31704)=4.63896
(у^и)
(4, 11)/ (22) qopt=4є[3,100], nopt=11 є [1,30],
2;
D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=87
Н(у|и)=Н(уи)-Н(и) = Е(уи)/гп(уи)-Е(у)/п(и) -- Ф(уи)^(и))= 22/11-48.76049/21- (1.99971-1.99941) = (2 - 2.3219)-(0.0003) = - 0.3222; 21
С1^0 = С0^1 = 4.63896
Замечания к таблице 2
1. Все полученные динамические и информационные характеристики канала связи сведены в таблицу 2.
2. Рисунки Фурье-спектров процессов и(г> и у (Ч транслятора поясняют «феномен числа 3 в генетике» - связь
(совпадение) размера «кодона» (состоящего из 3 нуклеотидов), а также 8-пика Фурье-спектра в белок-кодирующих участках РНК («генах») точно на периоде Т=3.
3. Для последовательностей нуклеотидов в гене и(1) = 3307-М=958.Ш митохондрии дрожжей найдены правильные ОБП q0pt=4 при области поиска [2, 100] , а ОБП пор4=П, характеризующие порядок их генератора-источника генетического текста («фермента») с широко известным в генетике периодом плотной спиральной укладки нуклеотидов в ДНК [12].
4. Характеристики ОБП девяти других генов, анализированных, но не представленных в таблице 2, зависят от D и Н и имеют HШ1X=log2q0pt=2 и алфавит нуклеотидов с qopt = 4.
5. ОБП qopt=4 и Еш„=22 аминокислотной последовательности - у*1 = 3307-АК-00-М=957^ с «синхронизующими вставками» «00» для выравнивания длин М текстов совпадают с ОБП входной нуклеотидной последовательности и([) .
6. Ненадёжности транслятора -Н(у\и)=Н(иу)-Н(и) = Е(иу)/п(иу)-Е(и)/п(и) - (О(иу)-О(и)) каналов и(Г) («РНК») ^ у(г) («белок») для всех исследованных текстов генов митохондрии дрожжей разной длины М (от 346 до 1812) при граммности g=nopt оказались равными нулю с точностью лучше 1%, что говорит о надёжности работы «аппарата» генетического кодирования, рассчитанной на основе предложенной математической модели, близкой к единице.
7. Полученные в примере результаты компьютерной идентификации аппарата трансляции универсального генетического кода соответствуют общеизвестным в генетике параметрам и указывают на перспективность применения предложенного метода структурной идентификации и для нанообъектов.
9. Связи ОБП с функциями пропускной способности при передаче информации в схеме рис. 1
В работе Шеннона [9] введено важное для теории и практики передачи информации широко используемое понятие пропускной способности (С) системы связи. Для её подсчёта можно воспользоваться любой из приведённых далее формул:
С = V • тах ры (ни - ни/у ) =
= V • таХ Ри (Ни + НУ - Ни/у )■
чениям ОБП, D и энтропии Н этих конкретных реализаций текстов по приведённым выше формулам. Поэтому, как уже было отмечено в разделе 6, рассматриваемую как сигнатуру пропускную способность С фрагмента рис. 1 сложной системы связи можно выразить через ОБП в двух эквивалентных формах на основе полученных выше связей (18)—(20)
С - С1 - Ни + Ну - Ниу =
(24)
( п • п ^
Чu;opt;Du >0 Пу;орґ^у >0
Пиу;орі;С>иу >0
- (Аи + Dy -Аиу)
(25)
иу
где V = 1/тср (сек-1) - скорость передачи информации, Те - длительность символа yг■єY, а V 0
V = Ъ0=1;2Т0 ^ Рщ - сРеДнее значение
длительности.
В отличие от традиционных задач оптимального кодирования текстов для обеспечения их безошибочной передачи по каналу с ограниченной пропускной способностью С далее везде следует полагать тср = те = 1 и V = 1, т.к. ММ временного ряда (1), достаточные для рассмотрения задач настоящей работы, можно считать «вторичными», т.е. результатом предварительного оптимального кодирования некоторого не рассматриваемого нами в настоящей работе «первичного» текста.
В нашем случае при идентификации систем рис. 1 распределения вероятностей ри и ру «индивидуальных» реализаций экспериментальных данных (1) уже учтены автоматически по зна-
С - С 2 - Ни + Ну - Ниу =
Еи,тіп;Аи>0 Еу;шш;Ву>0 Еиу;тт;Э >0
- + -
и;орі
1у;орі
П
- (26)
иу;орі
- (Аи + Ау - Аиу X
иу
так как очевидно, что
log Пu;opt;D >0 ' пy;opt;D >0 = Еи; тіп ;Би >0 + пuy;opt;D >0 nu;opt
Е у; тіп ;А > 0 Еиу; тіп > 0
(27)
п
uy;opt
10. Апробация метода и его практических приложений
Информационные характеристики некоторых каналов связи природных и модельных динамических систем, используемых в учебных занятиях со студентами ННГУ и являющихся фрагментами схемы рис. 1, и соответствующих
ny;opt
им скалярных и векторных текстов, полученных описанными в работе способами, даны в таблицах 1 и 2 результатов компьютерных экспериментов и замечаниях к ним.
Границы областей поиска для векторных и скалярных процессов подбирались с учётом теоремы 1, а также априорной информации о значениях возможных параметров процессов, как правило, так, чтобы ОБП пр и пр оказывались внутри области поиска.
Заключение
1. Предложен и проверен моделированием метод структурной идентификации и анализа динамических и информационных характеристик многополюсных фрагментов сложных динамических систем и связанных с ними процессов - избыточности, предсказуемости, ненадёжности, пропускной способности каналов связи и др.
2. Метод основан на установленной связи энтропии и избыточности Шеннона оптимально дискретизованных по уровню и времени исходных векторных входных и выходных процессов, ограниченных по уровню и продолжительности, с их оптимальными базовыми параметрами (ОБП):
- оптимальными по уровню числами дискрет
пopt ^ Z+,
- оптимальными размерностями noptєZ+ -(порядками) динамических моделей источников-генераторов процессов.
3. Предложенный метод структурной идентификации и анализа динамических и информационных характеристик сложных систем (разделы 1-5) по экспериментальным данным полезен при решении многих задач, рассмотренных частично в прикладных разделах (6-10), и заслуживает внимания благодаря своей сравнительной простоте, методической направленности и информативности, так как теоретикам важна его основа - теория дискретных динамических систем (автоматов) и теория информации, практикам - простота интерпретации ОБП данных при анализе динамических и информационных характеристик динамических систем, получать которые традиционными видами обработки, не всегда учитывающими точность исходных данных, затруднительно.
Автор благодарит В.Д. Шалфеева, И.Я. Орлова, В.А. Таланова и участников семинара за учтённые в работе полезные замечания.
Работа выполнена при частичной поддержке Государственного контракта № 02.740.11.0003.
Список литературы
1. Льюинг Л. Идентификация систем. Теория для пользователя: Пер. с англ. / Под ред. Я.З. Цып-кина. М.: Наука. Гл. ред. физ.-мат.лит., 1991. 432 с.
2. Идентификация систем и задачи управления // Труды VII Международ. конф. SICPRO'09/ ИПУ РАН. М., 2009.
3. Kiryanov K.G. To a choice of the basic parameters of mathematical model of experimental data source // Proceedings 5-th International Specialists Workshop in Area Nonlinear Dynamics of Electronics Systems (NDES-97). Moscow, Russia, June 26-27, 1997. Pp. 400-403.
4. Кирьянов К.Г. Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 1. С. 39-46.
5. Кирьянов К.Г. Структурная идентификация динамических систем на основе оптимальной дискретизации многоканальных данных // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 6. С. 59-69.
6. Глушков В.М. Абстрактная теория автоматов // Успехи математических наук. М., 1961. Т. XVI. Вып. 5.
7. Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985.
8. Колмогоров А.Н. К логическим основам теории информации и теории вероятностей // Сб. трудов «Теория информации и теория алгоритмов» / Под ред. Ю.В. Прохорова. 1987. 332 с.
9. Шеннон К. Работы по теории информации и кибернетике / Пер. с англ. под ред. Р.Л. Добрушина и О.Б. Лупанова. М.: ИЛ, 1963.
10. Кирьянов К.Г., Грунина Е.А. Об определении достаточного числа отведений с изучаемой динамической системы // Тр. 9-й научн. конф. по радиофизике. 7 мая 2005 г. / Ред. А.В. Якимов. Нижний Новгород: TALAM, 2005.
11. Кирьянов К.Г., Горбунов А.А Структурная идентификация криптосистем на основе определения их базовых параметров // Труды VII Международ. конф. «Идентификация систем и задачи управления SICPR0'08». М.: ИПУ РАН, 2008. С. 1186-1196.
12. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем / Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: TALAM, 2002. 100 с.
IDENTIFICATION OF INFORMATION CHARACTERISTICS OF DYNAMIC SYSTEMS ON THE BASIS OF OPTIMAL DISCRETIZATION OF MULTICHANNEL DATA
K.G. Kiryanov
A method has been proposed and experimentally checked to identify information characteristics of multichannel (k+r)-pole fragments of complex dynamic systems (redundancy, predictability, unreliability, throughput, etc.). The method is based on the optimum discretization over basic parameters of vector (multichannel) k-input and r-output analog and discrete processes limited in scope and duration.
Keywords.: optimal basic parameters (OBP) of vector data, structural identification of coarse (structurally stable) dynamic systems (DS) by OBP of the initial analog or discrete processes, predictability, redundancy, unreliability, throughput.