Научная статья на тему 'Идентификация информационных характеристик динамических систем на основе оптимальной дискретизации многоканальных данных*'

Идентификация информационных характеристик динамических систем на основе оптимальной дискретизации многоканальных данных* Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
157
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНЫЕ БАЗОВЫЕ ПАРАМЕТРЫ ВЕКТОРНЫХ ДАННЫХ / СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ ГРУБЫХ (СТРУКТУРНО-УСТОЙЧИВЫХ) ДИНАМИЧЕСКИХ СИСТЕМ ПО ОПТИМАЛЬНЫМ БАЗОВЫМ ПАРАМЕТРАМ ИСХОДНЫХ АНАЛОГОВЫХ ИЛИ ДИСКРЕТНЫХ ПРОЦЕССОВ / ПРЕДСКАЗУЕМОСТЬ / ИЗБЫТОЧНОСТЬ / НЕНАДЁЖНОСТЬ / ПРОПУСКНАЯ СПОСОБНОСТЬ / OPTIMAL BASIC PARAMETERS (OBP) OF VECTOR DATA / STRUCTURAL IDENTIFICATION OF COARSE (STRUCTURALLY STABLE) DYNAMIC SYSTEMS (DS) BY OBP OF THE INITIAL ANALOG OR DISCRETE PROCESSES / PREDICTABILITY / REDUNDANCY / UNRELIABILITY / THROUGHPUT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кирьянов Кирилл Геннадьевич

Предложен и проверен экспериментально метод идентификации информационных характеристик многоканальных (k + r)-полюсных фрагментов сложных динамических систем (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) на основе оптимальной дискретизации по базовым параметрам векторных (многоканальных) k-входных и r-выходных аналоговых и дискретных процессов ограниченного размаха и продолжительности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IDENTIFICATION OF INFORMATION CHARACTERISTICS OF DYNAMIC SYSTEMS ON THE BASIS OF OPTIMAL DISCRETIZATION OF MULTICHANNEL DATA

A method has been proposed and experimentally checked to identify information characteristics of multichannel (k+r)-pole fragments of complex dynamic systems (redundancy, predictability, unreliability, throughput, etc.). The method is based on the optimum discretization over basic parameters of vector (multichannel) k-input and r-output analog and discrete processes limited in scope and duration.

Текст научной работы на тему «Идентификация информационных характеристик динамических систем на основе оптимальной дискретизации многоканальных данных*»

РАДИОФИЗИКА

УДК 681.51

ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ОПТИМАЛЬНОЙ ДИСКРЕТИЗАЦИИ

МНОГОКАНАЛЬНЫХ ДАННЫХ*

© 2010 г. К.Г. Кирьянов

Нижегородский госуниверситет им. Н.И. Лобачевского,

ФГУП «Нижегородский научно-исследовательский приборостроительный институт «Кварц»

[email protected]

Поступила в редакцию 01.10.2009

Предложен и проверен экспериментально метод идентификации информационных характеристик многоканальных (к + г)-полюсных фрагментов сложных динамических систем (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) на основе оптимальной дискретизации по базовым параметрам векторных (многоканальных) к-входных и г-выходных аналоговых и дискретных процессов ограниченного размаха и продолжительности.

Ключевые слова: оптимальные базовые параметры векторных данных, структурная идентификация грубых (структурно-устойчивых) динамических систем по оптимальным базовым параметрам исходных аналоговых или дискретных процессов, предсказуемость, избыточность, ненадёжность, пропускная способность.

Введение

Проблемам получения математических моделей (ММ) и характеристик объектов управления в науке и технике посвящено большое число работ с самыми различными конкретными целями и постановками задач (см., например, [1-3]). Многообразие подходов к проблеме указывает, с одной стороны, на теоретическую и практическую их актуальность, а с другой - на некоторую неудовлетворённость полученными теоретическими результатами и, в большей степени, результатами их практического применения в различных областях знаний, в том числе и в радиофизических исследованиях. Отметим некоторые недостатки традиционных подходов:

- несогласованность между собой существующих процедур структурной и параметрической идентификации сложных динамических объектов (систем);

- различия в подходах и методах идентификации аналоговых и дискретных (цифровых) сигналов и систем;

Доклад прочитан на объединенном семинаре кафедр теории колебаний, радиотехники, безопасности информационных систем и коммуникаций РФФ ННГУ 28.05.2009 г.

- «негрубость» идентифицированных математических моделей, т.е. сильная чувствительность параметров моделей как к малым изменениям исходных экспериментальных данных, так и к изменениям априорных сведений о структуре моделей, что особенно сильно проявляется в случае сложных разветвлённых систем.

Поэтому настоящая работа, являющаяся продолжением рассмотрения эффективного метода оптимальной дискретизации (оптимального «загрубления») по уровню и времени исходных экспериментальных многоканальных данных [4], направлена не только на совершенствование метода идентификации и контроля динамических параметров структуры ДС (как это было фактически в работе [5]), но и на измерение важных практически информационных характеристик (избыточности, предсказуемости, ненадёжности, пропускной способности и др.) сложных многоканальных ДС (со структурами ^ + г)-полюсных фрагментов сетей и каналов связи).

1. Математическая и структурная модели (к + г)-полюсного фрагмента сложной динамической системы сети связи

Математическая и структурная модели, как и в работе [5], выбраны в удобной для дальней-

иі

У,

Рис. 1. Структурная схема многоканального (к+г)-полюсного фрагмента ДС сложной сети связи с недоступными для наблюдения и измерения внутренними (х; , Х;+1) и доступными внешними (и; , у;) в шинах-узлах процессами

шего теоретического рассмотрения и практического использования форме оптимально дискретизованной (загрубленной) по уровням и времени дискретной динамической системы (ДДС) со стандартной многоканальной (векторной) канонической структурой синхронного автомата Хаффмана - Глушкова [6] (рис. 1).

Для структурной идентификации характеристик схемы вместо не всегда доступных для непосредственного наблюдения векторов (X;), входящих в канонические уравнения «выходов» (X) и «динамики» (у) ДДС, далее рассматриваются только необходимые и доступные для наблюдения и измерения векторные синхронные входные

н(1)...н(к)

выходные I Уг =

,(1)

руженных связей ОБП с энтропией и избыточностью текстов Шеннона.

2. Математические модели процессов в доступных для наблюдения узлах схемы рис. 1

Любой из доступных для наблюдения и измерения в узлах канала связи схемы рис. 1 процессов, например выходной векторный процесс у(0 = = |У(0,-У(0,...У(0], с кусочно-

непрерывными компонентами по времени t е [0, Т] подвергаем дискретизции по времени и уровню и преобразуем в «векторный текст»

Т е Yr, 1 < ] < г, с шагом по

Уг =

у),...у {,...$'

Д1)

?) у\11 ...у-г)

времени Дt = |_ТМ ], I®] - целая часть 0 , с це-дис- лочисленными компонентами у/ е[0,ч — 1]у,

кретные выборочные процессы С I = 0, 1, 2,..., Ч > 1, 0 < / <М-1, 1 < ] < г, и постулируем везде далее:

- ММ процесса у({) в виде эквидистантного по времени, векторного ряда целых чисел

М — 1 и размерностей ^ г и k + г , соответственно.

Структуру ММ схемы рис. 1 можно получить путём реконфигурации любой динамической системы, состоящей из конечного числа динамических подблоков со структурой схемы рис. 1, к структуре одной эквивалентной ДС в форме схемы рис. 1 [2, 6, 7]. Она позволяет проводить по измеренным взаимозависимым ОБП исходных экспериментальных входных и выходных текстов структурную идентификацию:

А) векторных динамических характеристик и параметров системы (полностью характеризующих внутреннюю структуру векторных связей схемы рис. 1 (при этом последующая параметрическая идентификация вектор-пара-метрар блоков схемы рис. 1 осуществима лишь при частных видах уравнений X и у [5, 7]));

Б) векторных информационных (берущих для ДС своё начало от «термодинамических.») характеристик и параметров структуры схемы рис. 1 (ненадёжности, пропускной способности канала в сети связи и т.д.) без знания её внутренней структуры благодаря использованию обна-

У = (Уо>Уі ’..'Уг ’...’Ум-2’Ум-і) или, в развёрнутом виде,

У =

У0’..’Уп-1’..’Уі-п+1’..’Уі ’..’Ук-п+1’..’Ук’..’Ум-1

УІ..’УГп-і’..’УІп+і’..’Угі’..’Ук-п+і’..’Ук’..’Угм-1

(1)

(1')

— ограничения по размаху и продолжительности

— да < < У* ^) < Утах < ^ е[°,Т 1 (2)

1 < ] < г,

исходных (до дискретизации по формуле (3)) непрерывных и разрывных аналоговых компонент векторных данных;

— способ приведения компонент исходных данных к форме (1) (к форме «текста» с конечным алфавитом) за счет их предварительной

Т

Т

дискретизации при t = г • At путём «АЦ-преоб-разования»

У і =

у] (г • а t) - у т іп [о ’Т ]

У т ах

(3)

[0,Т]— утш [0,Т]

1 < ] < г ;

— ММ дискретной ДС (ДДС) источника временного ряда (1) в форме дискретного абстрактного конечного автомата с алгебраической структурой из конечных множеств входящих в них переменных уг и с уравнением динамики (с программой восстановления по А.Н. Колмогорову или с так называемым прогнозирующим оператором (ПО) векторного временного ряда (1) в виде уравнения нелинейной регрессии) размерности (порядка) п:

у,+п = $Уг,У+1, - ,у,+ п-\; п), 0 < г <М- п , (4) и параметров (пеП =[0, ч - 1]г).

Величина п является порядком ПО ряда (1), а ММ ПО, как известно, - весьма общим, но, тем не менее, частным случаем уравнений динамики у[...] и выходов Х[...] в схеме рис. 1.

Аналогичные в соответствующих алфавитах условия (1)-(4) предполагаются для ММ вход-

иУ, =

ного иг = [иг(1)...и\к)]

и^..^) У?\..УІг) ]

и комбинированного

текстов.

3. Оптимальная дискретизация источников входных и выходных данных в системе связи рис. 1

Процедура оптимизации для любого текста в схеме рис. 1, например уг, состоит в нахождении ОБП Чу, р и пу.ор1 по критерию минимального «объёма» (числа точек-состояний) Ы(М,ч,п;уфм]) = Ыу(ч,п) генератора этого текста:

(Чy;opt,ny;opt) = arg minЫ(М,Ч,п;Уге[0,М]) (5)

Че[Чтт>Чтах ],пе[пт1п>птах]>М =М 0

путём восстановления фазовой траектории (ФТ) без её самопересечений по экспериментальным данным с источника текста уг, удовлетворяющего условиям (1)—(3) в дискретном фазовом пространстве (ФП) минимального объёма ДДС [3-5]. При этом из-за монотонности логарифмической функции одновременно обеспечивается минимум энтропии Хартли (минимум потерь исходной информации с источника текста с Ыу (ч,п) равновероятными состояниями), так как

Еу;тт = тІП ^2 ^(М’Ч’П;УгфМ]) =

9е[9тіп.9тах ]-пе[птІп-птах ]М =М0

= 1о^ тіп = пу,орі ' 1о^ Чу,орі ,

(6)

___ /-1пУ;орї

где ^у;тіп = ду,орг ■

Процедура оптимальной дискретизации (5) исходных процессов даёт конкретные векторные стационарные синхронные «Mqn-тексты», так как в ПО (2) время г не входит явно.

Далее индексы символов (например, дискретного времени, числа компонент г данных (1), основания логарифма и т.п.) будем как вводить для более полного раскрытия смысла контекстов, так и опускать там, где это не приводит к неточности.

Отметим, что оптимально-загрубленные до

Г

одного из дг = д возможных вариантов уровня выборки векторных г-компонентных рядов (1)

имеют ФП большего объёма N...

= д УОР1 =

гутіп дг,у;орґ

_ ' пУ;орі

-- Чу-ОрГ и в г раз большую энтропию по ОБП:

Еу;тт = Ыу;шт = Г ' ny;opt ' Чy;opt , (6 )

которая может также зависеть от выбираемых границ области поиска ОБП. При этом процедура (5) нахождения ОБП Чур ипу.р может

реализоваться программно вложением исходных данных в ФП размера (6') как в гиперкуб с п чг = ЧГ-точечными рёбрами, так и в гиперкуб с (г • п ) ч-точечными рёбрами.

Отметим также, что введенные в работе ключевые процедуры и операции (восстановление векторных выборок текстов в ФП (6), вычисление избыточности и энтропии Шеннона для векторных текстов и др.) выполняются в совместимых с соотношениями (1)-(6) алгебраических структурах. При этом векторные энтропии по ОБП: а) не изменяются при перестановках строк компонент векторов и б) связаны соотношениями:

Еи = Е

иу,У = const єYг

ЕУ = Е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

иУ;и = const еи

.(7)

Видим, что величина 1/чу. р играет роль

«малого параметра» исходной ДС, преобразованной («загрублённой») путём оптимальной дискретизации в ДДС вида (4) порядка пу.р ,

согласованного с Чу;0р1. При этом ОБП Чу.р, пу.р и Ыу ;Шщ в выражении (6) можно интерпретировать, соответственно, как «пространственную» и «временную» «сложности» текста (уг), а значит, и исходного процесса у^), а

Т

уг; тіп = Чу-р - как

минимальный объём ФП N

связанной со «сложностью» (по терминологии А.Н. Колмогорова [7]) программы (4) для восстановления текста Уг (а значит, с точностью У-орі и исходного процесса y(t)) . Такая возможность для скалярного текста была показана в работе [4] путем построения по исходному

тексту Уг прогнозирующего оператора (4) в виде таблицы истинности. Обобщение аналогичного утверждения для векторного текста (1) даётся ниже в теореме 2.

4. Связи ОБП компонент векторных текстов в наблюдаемых шинах-узлах иг, Уг и иУг схемы рис. 1

Из соотношений (5) и (6) для ОБП-анализа векторных текстов (1) в узлах сети рис. 1 следует

Теорема 1. 1) Если векторный текст Уг (или любой другой в фрагменте сети рис. 1: иг ’ иУг ’... и т.д.) имеет одинаковые компоненты’ то его минимальная векторная энтропия Е¥ тіп и векторные ОБП дУ и пуу совпадают

с минимальной энтропией Еу. тіп и ОБП ч]у.орі

и п]у.ор1 подвекторов 3 = 1, 2, ...’ г;

2) Если векторный текст уг имеет разные компоненты’ то минимальная энтропия

Т7У

Е тіп векторного г-компонентного текста у не больше’ чем максимальная из энтропий

подвекторов’ т.е. еУУ; тіп < тах Ц. тіп ’ 3 = 1

2,..., г .

Теорема помогает сделать согласованный выбор областей поиска ОБП векторных текстов природных и модельных процессов (см. примеры в разделе 10), а также получать с помощью соотношения (6') ограничения на значения ОБП компонент текстов.

5. Связь ОБП наблюдаемых текстов иг > уг и иуг с их предсказуемостью

Из введенных обозначений (1)-(3) и алгоритма восстановления ФТ векторных Mqn-текстов (рядов) в ФП следует важная для настоящей работы

Теорема 2. Для векторного временного ряда (1)’ удовлетворяющего условиям (2)’ существует математическая модель источника ряда в виде уравнения нелинейной регрессии (4) в форме прогнозирующего оператора’ который по пор1 начальным’ следующим подряд с шагом ДіорЛ = Т/Мр чорі -значным выборкам исходного ряда (1) позволяет вычислить все оставшиеся М-порі выборок.

Теорема 2 для векторного ряда (1) доказывается аналогично случаю скалярного ряда [4] путём установления взаимно-однозначного соответствия, например, между алфавитами векторов-столбцов ряда (1) и вспомогательных скаляров. Кроме того, теорема 2:

- характеризует «голографическое» свойство векторного Мдп-текста (1) - «восстанавливаемость» (с точностью 1/дор() с помощью ПО (4) любых сочетаний «замен» символов в поле

у/ , 5 < г < М -1, 1 < 3 < г, по порі

известным

предшествующим и следующим подряд векторам-столбцам;

— позволяет естественным образом ввести понятие «предсказуемости» (прогнозируемости) (Рг) поведения векторного ПО (4) как отношения энтропии предсказываемой части векторных текстов к энтропии базовой (начальной части)

Рг =

орі

+1 =

(8)

= (М-порі) /порі + 1 = М/порі < М ,

из которого следует

Теорема 3. Предсказуемость (8) векторного текста (1):

а) зависит явно только от длины М и порядка Лор( ПО (4);

б) не может превышать длины М векторного текста;

в) возрастает с ростом М’ если «МдоріпорГтекст» при своём продолжении сохраняет ОБП’ то есть при ДМ > 0 остаётся стационарным «(М + ДМ)чоріпорі-текстом».

Доказательство теоремы следует из возможности представления функции f ПО (4) в форме таблицы истинности по тексту полной длины М.

Из утверждения п. б) следует, что при порі = 1 (то есть при «радиусе корреляции» символов текста псог= порі+1 равном 2), например, когда соседние векторные выборки зависимы функционально (уг+1 = f (уг), 0 < г < М -1 [4]) и являются компонентами «состояния» порож-

дающего их динамического источника (см., например, [5, 10]), предсказуемость Рг текста максимальна и равна М.

6. Связи ОБП с векторной избыточностью текстов и1, уг и иуг

Для ММ текста (1) ключевое соотношение между его ОБП Еу. ш;п = пуг-р • ^2 Чу;ор1

(6)

есть инвариант минимума энтропии по ОБП разностного уравнения (4) оптимально дискретизованного процесса (1) и не содержит явно параметра избыточности (Б) исходных данных. Рассматриваемые ниже важные информационные характеристики текстов каждого из узлов фрагментов схемы рис. 1 в наших задачах анализа и идентификации данных связаны с энтропией и избыточностью данных связанных со структурой схем.

В работе [4], при определении ОБП, сведения об избыточности данных учитывались выбором различных приближений критерия оптимальности ОБП для энтропии Шеннона. Выбор приближения зависел от наличия определённой априорной информации о виде модельного представления энтропии источника данных, что не всегда удобно. Поэтому для дальнейшего рассмотрения возможностей ОБП-анализа данных удобнее учитывать явно параметры энтропии и избыточности исходных данных.

Для вычисления избыточности текстов (1) ([9, с. 243-332]) путём вычисления энтропии Шеннона (Н) требуется их эргодичность, в отличие от оценок ОБП по алгоритму (5), не требующих ансамбля реализаций текстов. Получение оценок энтропии текстов конечной длины М является самостоятельной задачей теории вероятностей и статистики (см., например, [9, с. 669-686]). Однако кажущиеся коллизии «примиряются» результататами работ А.Н. Колмогорова (см., например, [8]), в которых показывается, что «основные понятия теории информации должны и могут быть обоснованы без помощи обращения к теории вероятностей и так, что понятия «энтропия» и «количество информации» оказываются применимыми к индивидуальным объектам» или, в нашем случае, к конкретным текстам и их источникам.

Поэтому результаты вычисления информационных характеристик сигналов и систем по полученным далее формулам (разделы 6-9), зависящим от Н, по имеющимся текстам конечной длины М нами рассматриваются как «идентификационные метки» или «сигнатуры» сигналов и систем. Ясно, что при практической

возможности увеличения длины М и в случае наблюдающейся при этом тенденции к сходимости меток достоверность последних может, при необходимости, оцениваться с помощью неравенства П.Л. Чебышева.

Учёт избыточности Б при ОБП-анализе текстов даёт следующая

Теорема 4. Соотношение между ОБП и Б (инвариантами энтропии Еш;п б>0 разностного уравнения для ПО) оптимально дискретизованного векторного Мчп-текста (1), переходящее в равенство (6) при Б = 0, имеет вид:

Етт.Б>0 = nopt;D>0 • (1^2 Чг.Б>0;opt — Б) =

- n

• log2(q,

2(qr,'D >0 .opt

72D) =

- nopt.D >0(1 — K) • log2 q

(9)

2 qr,-D >0.opt

- nopt.D >0 • log 2 ^D&iopV

nopt;D >0

где К — коэффициент избыточности, имеющий вид

К = Б/Нг,тах = 1 — Ег,тт.Б>0/Er;min;D=0 .(10) Доказательство утверждения вытекает из следующих фактов:

- способа (3) «АЦ-преобразования» данных при оптимальной дискретизации

Н„

= log 2 4r:opt = r •

(11)

5 2 Чr;opt ' Чopt’

- вводимого определения понятия средней избыточности, приходящейся на компоненту векторного процесса (далее - просто избыточности)

D — Dr = (Hr. max HD>0)

rr - соотношения

Er ■. min ■. D > 0 D ^ 0

=log2 qopt—Нш°; (12)

H

Er. min .D=0

D >0

n

n

opt

(13)

справедливого при D > 0 (см., например, формулу (7) при ps ф const в работе [4]).

Заметим, что при эргодичности текста энтропия Шеннона подсчитывается по формуле g-граммной энтропии F Pratt, которая, как показано в [9, с. б70], при граммности g = 1 переходит в «обычную» форму для расчета энтропии Шеннона:

s=q—1

H — Hg=l =— Zps log2 ps , ps = Ms/M, s=0

M—1

Ms = Z5( Уі—s), i=0

r

8( У г — s) =■

0, если уг ф s

1, если уг = s

(14)

Из уравнений (10)—(12) при наличии ненулевой избыточности текста происходит уменьшение числа оптимальных уровней квантования

текста до величины ЧD>o■opt//2 , и, следовательно, теорему 3 можно усилить дополнительным утверждением:

г) возрастает с уменьшением его избыточности по Шеннону, так как:

Pr =■

M

= M •

(log2 qD>0 .opt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—D)

n

= M •

D>0.opt

log2( q

E

2 ( 4D>0,-opt

'2 D)

opt min.D >0

D ^0

(15)

Emin :D >0

M/n

opf

7. Связи ОБП и энтропий по ОБП с энтропией Шеннона в шинах-узлах иг, уг и иуг

Из уравнений (10)—(13) также следуют связи между энтропией Шеннона и энтропией по ОБП в наблюдаемой шине-узле уг схемы рис. 1:

H — Hmax D r • log2 qy;D>0;opt

— D < r • log2 qy.D^opt (0 < D < Hmax),

H — Hmax — D = Emin,D>o/nD>0.opt —

— D < E

min.D>0

>o/ nD>0.

opt

(1б)

(17)

(0 < D < Hmax) ,

совпадающие при D = 0, т.к.

, Emin,y,D&0 D^0

r • log2 qy.Dso.opt----- ------------->

ny;D>0;opt 52 qyopt

^^r • log2 qy.opt —-^ = 0 .

пу-,гр

а для энтропии текстов в шинах-узлах иг и иуг схемы рис. 1 размерность г изменяется на k и

k + г.

8. Связи ОБП с функцией ненадежности передачи информации

В пионерской работе Шеннона ([9, с. 333402]), посвящённой криптографии, в качестве меры неопределенности связи введены понятия «функций ненадёжности» передачи информации, которые могут характеризовать качество канала передачи данных рис. 1 от узла к узлу иг и, наоборот, от узла иг к узлу уг по

близости к нулю значений соответствующих условных энтропий Hu/y и Hy/u . Справедлива

учитывающая избыточности в векторных текстах

Теорема 5. Функция ненадёжности векторного канала связи от уг к ui, для текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (18)-(20):

H u/y — H uy-H y = log qk+r.uy.D > 0.opt

— log Qr.y.D >0.opt — (Dk+r.uy — Dry ) = (18)

! qk+r.uy.D >0.opt / ,-4 r-ч \

= log -------і------^----( Dk + r.uy — Dry X

tfr.y.D > 0.opt

H — H -H =

H u/y ~ H uy H y ~

Ek + r.uy.D >0 Er.y.D > 0

(19)

k+r.uy.opt ^r.y.opt

(Dk+r.uy Dr,y ),

log

qk+ r.uy.D > 0.opt ^ry.D > 0.opt

E

k+r.uy.D >0

E

(20)

r.y.D > 0

^ nk+r.uy.D >0.opt ^r.y.D >0.opt J

Доказательство теоремы следует из выражений (16) и (17). Аналогичная теорема справедлива с перестановкой индексов иг и уг для передачи информации по каналу рис. 1 в «обратном» направлении, если тексты иг и уг известны, но нет информации о математической модели их связи.

Из соотношений (18) и (19) следует, что асимметричность канала связи Аиу не зависит

явно от избыточности текстов и определяется по формуле

Аиу = Ни/у — Ну/и = Ни — Ну, Аиу = — Ауи , (19')

из которой следует, что при Ни!у = 0,

Ну/и = Ну — Ни = 0 только При Ну = Ни .

В упомянутой работе Шеннона вводится понятие «расстояние единственности» (РЕ) или

«расстояние уникальности» прЕ шифрограммы в канале связи рис. 1, которое при Ниу = 0 является значением корня nГ.y.D>o■0pt уравнений (18) и (19) только для одного из всех возможных вариантов исходного сообщения иг [9].

Примеры характеристик текстов

Таблица 1

Идентификация информационных характеристик скалярных и векторных текстов, связанных с колебательным LCR-контуром и странным аттрактором Лоренца

Пример 1. Двумерный векторный и покомпонентные процессы синхронных изменений тока i и заряда q в колебательном LCR-контуре

Оптимальные БП подвектора i_file.txt: г = 1; М=1000; Рг=

- ОБП: qoptлr=748 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=19.09379 g=1 Н=8.73263 г^^ор^)=9.546894 D=loq(qopt)-Hq/r=0.81427

Оптимальные БП подвектора q_file.txt: г = 1; М=1000;

- ОБП: qoptЛr=697 из [2,1000]; nopt=2 из [1,30]; Рг=500 Е=т^^орГ)=18.89003 g=1 Н=8.64207 log(qopt)=9.445015 D=loq(qopt)-Hq/r=0.80295

Оптимальные БП 2-мерного процесса i_file.txt + q_file.txt г = 2; М=1000;

- ОБП: qoptЛr=141 из [2,1000]; nopt=1 из [1,30]; Рг=1000 Е=т^^орГ)=7.13955 g=1 Н=9.96578 rlog(qopt)=7.139551 D=loq(qopt)-Hq/г=2.15666

Пример 2. Трёхмерный векторный и покомпонентные процессы аттрактора Лоренца [2]

Оптимальные БП подвектора lornz-yl.txt: r = 1; М=1001;

- ОБП: qoptЛr=1026 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=30.00845 g=1 Н=8.9944б log(qopt)=10.002815 D=loq(qopt)-Hq/r= 1.00835

Оптимальные БП подвектора lornz-y2.txt: r = 1; М=1001;

- ОБП: qoptЛr=1500 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31 .б5224 g=1 H=9.10955 log(qopt)=10.550747 D=loq(qopt)-Hq/r=1.44120

Оптимальные БП подвектора lornz-y3.txt: r = 1; М=1001;

- ОБП: qoptЛr=1421 из [300,1б00]; nopt=3 из [1,30]; Pr=333 E=rnlog(qopt)=31.41807 g=1 Н=9.252б5 log(qopt)=10.472691 D=loq(qopt)-Hq/r=1.22004

Оптимальные БП 3-мерного процесса lornz-yl.txt + lornz-y2.txt + lornz-y3.txt : r = 3; М=1001;

- ОБП: qoptЛr=311 из [300,1б00]; nopt=1 из [1,30]; Pr=1001 E=rnlog(qopt)=8.28077 g=1 Н=9.9б723 rlog(qopt)=8.280771 D=loq(qopt)-Hq/r=4.95836

Замечания к таблице1

1. В модельных примерах данных типа 1 и 2 с «большей» точностью (разрядностью чисел) компьютерных данных у «оптимально загрубленных» данных ОБП qopt оказывается больше (и 102-104), чем у экспериментальных аналоговых данных, как правило, с меньшим числом оптимальных уровней (и 2-102).

2. Векторные процессы примеров 1 и 2 образуют полный набор функционально связанных компонент состояния порождающих их ДДС, т.к. совокупный ОБП пр = 1.

3. Предсказуемость Рг = (М/пр) выше у векторных текстов с функционально связанными компонентами.

Для любого канала связи рис. 1 (четырёхполюсника, многополюсника, шифратора и т.д.) сообщение по каналу связи передается «надежно» (пример в разделе 10), когда «ненадежность» Ни/у канала связи близка к нулю и РЕ

можно определять как величину

РЕ /л 1 \

пу = nг;y;D>0;opt, (21) где

так как последующие выборки процесса у1 при

сти текстов, удовлетворяющих условиям (1)-(4), определяется соотношениями (22) и (23):

пРЕ =

Er;y;D>0 • nk+r;uy;D>0;opt

Ek+r;uy;D>0 nk+r;uy;D>0;opt (Duy Dy )

, (22)

* = ny;D>0;opt, пу,Б>0^ + 1,-,М — 1 могут быть

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

вычислены по пГ.у.Б>0;ор1 начальным, следующим подряд выборкам исходного ряда 1 по теореме 2 (формула (4)). Другое выражение для вычисления значения величины РЕ по ОБП даёт

Теорема 6. Расстояние единственности (21) для векторного канала связи рис. 1 при эргодично-

/ ТЛ тл \ 1 + r;uy;D >0;opt /г,,-.

(D uy - D y ) = log---------^. (23)

q r;y;D > 0 ;opt Утверждение теоремы 6 следует из соотношений (18) и (19) при условии H ujy = 0 .

Заметим также, что значение оценки РЕ, полученное в работе [11] для моделей входных и выходных текстов в КС без использования понятия избыточности, отличается от (21) множителем Ek+r;uy/Er;u ^ 1 .

Пример одноканальной системы связи

Таблица 2

Идентификация структуры математической модели транслятора генетического текста иг(1) (“РНК”)

^ У(1 («белок») Уотсона - Крика (см., например, [12]): и(^ = 3307-М=958Лх1 ген митохондрии дрожжей и кодируемой этим текстом последовательности аминокислотных остатков — у= 3307-АК-00-М=957Лх1 с «синхронизующими вставками» «00» для выравнивания фаз кодонов АК текста

входной текст - и (1) = 3307-М=958, їє [1-100].1х1 (и)

выходной текст - у р = 3307-АК-00-М=957, iє[1-100].txt (у) с «синхронизирующими вставками -00»

ДПФ-спектр входного текста и(1) = 3307-М=958.txt

(и). (Пик спектра на частоте f = 1/3 ниже уровня постоянной составляющей спектра при f = 0, но выше уровня его псевдослучайной информационной части)

ДПФ-спектр выходного текста

у

М=957.txt (у) с «синхронизующими вставками - 00». Более чёткий пик спектра на частоте f = 1/3 значительно выше уровня его информационной части)

Коды текстов и канала связи

Характеристики скалярных и векторных ______текстов в узлах каналов связи_____

ОБП ^,п) и энтропия по ОБП (Етїп) с указанием областей поиска

Размерность;

избыточность;

энтропия;

граммность;

предсказуемость

(г;Р;Н^;Рг)

Характеристики скалярных и векторных каналов связи

Информационная ненадёжность канала; расстояние единственности Н(и|у); пРЕ =Псрі

Пропускная способность канала С (нормирована на скорость тактирования данных; см. (25))

(и)

(4, 11)/(22) qopt = 4 є [3,100], nopt = 11 є [1,30];

1;

D(u) = 1.99941; Н(и) =0.00059; g=11;Pr=87

(у)

(5,21)/(48,76049) qopt = 5є[3,100], nopt = 21 є [1,30],

1;

D(y) =2.31707; Н(у) = 0.00486; г=21;Рг=45.5

(и^у)

(4, 11)/(22) qopt=4є[3,100], nopt=11є[1,30]

2;

D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=86.9

Н(и|у)=Н(иу)-Н(у) = Е(иу)/п(иу)-Е(у)/п(у)-

- (D(uy) -D(y)) = 22/11-22/11--(1,99971-1,99941) *

* 0; пРЕ =nopt = 11

С0^1=Е(и)/п(и)+Е(у)/п(у)

- Е(иу)/ п(иу)+ +(D(u)+D(y)-D(uy)) = 22/11+48,76048/21-22/11+ +(1.99941+2.31707-1.99971) = 2.3219+(2.31704)=4.63896

(у^и)

(4, 11)/ (22) qopt=4є[3,100], nopt=11 є [1,30],

2;

D(uy) =1.99971; Н(иу) =0.00059; g=11;Pr=87

Н(у|и)=Н(уи)-Н(и) = Е(уи)/гп(уи)-Е(у)/п(и) -- Ф(уи)^(и))= 22/11-48.76049/21- (1.99971-1.99941) = (2 - 2.3219)-(0.0003) = - 0.3222; 21

С1^0 = С0^1 = 4.63896

Замечания к таблице 2

1. Все полученные динамические и информационные характеристики канала связи сведены в таблицу 2.

2. Рисунки Фурье-спектров процессов и(г> и у (Ч транслятора поясняют «феномен числа 3 в генетике» - связь

(совпадение) размера «кодона» (состоящего из 3 нуклеотидов), а также 8-пика Фурье-спектра в белок-кодирующих участках РНК («генах») точно на периоде Т=3.

3. Для последовательностей нуклеотидов в гене и(1) = 3307-М=958.Ш митохондрии дрожжей найдены правильные ОБП q0pt=4 при области поиска [2, 100] , а ОБП пор4=П, характеризующие порядок их генератора-источника генетического текста («фермента») с широко известным в генетике периодом плотной спиральной укладки нуклеотидов в ДНК [12].

4. Характеристики ОБП девяти других генов, анализированных, но не представленных в таблице 2, зависят от D и Н и имеют HШ1X=log2q0pt=2 и алфавит нуклеотидов с qopt = 4.

5. ОБП qopt=4 и Еш„=22 аминокислотной последовательности - у*1 = 3307-АК-00-М=957^ с «синхронизующими вставками» «00» для выравнивания длин М текстов совпадают с ОБП входной нуклеотидной последовательности и([) .

6. Ненадёжности транслятора -Н(у\и)=Н(иу)-Н(и) = Е(иу)/п(иу)-Е(и)/п(и) - (О(иу)-О(и)) каналов и(Г) («РНК») ^ у(г) («белок») для всех исследованных текстов генов митохондрии дрожжей разной длины М (от 346 до 1812) при граммности g=nopt оказались равными нулю с точностью лучше 1%, что говорит о надёжности работы «аппарата» генетического кодирования, рассчитанной на основе предложенной математической модели, близкой к единице.

7. Полученные в примере результаты компьютерной идентификации аппарата трансляции универсального генетического кода соответствуют общеизвестным в генетике параметрам и указывают на перспективность применения предложенного метода структурной идентификации и для нанообъектов.

9. Связи ОБП с функциями пропускной способности при передаче информации в схеме рис. 1

В работе Шеннона [9] введено важное для теории и практики передачи информации широко используемое понятие пропускной способности (С) системы связи. Для её подсчёта можно воспользоваться любой из приведённых далее формул:

С = V • тах ры (ни - ни/у ) =

= V • таХ Ри (Ни + НУ - Ни/у )■

чениям ОБП, D и энтропии Н этих конкретных реализаций текстов по приведённым выше формулам. Поэтому, как уже было отмечено в разделе 6, рассматриваемую как сигнатуру пропускную способность С фрагмента рис. 1 сложной системы связи можно выразить через ОБП в двух эквивалентных формах на основе полученных выше связей (18)—(20)

С - С1 - Ни + Ну - Ниу =

(24)

( п • п ^

Чu;opt;Du >0 Пу;орґ^у >0

Пиу;орі;С>иу >0

- (Аи + Dy -Аиу)

(25)

иу

где V = 1/тср (сек-1) - скорость передачи информации, Те - длительность символа yг■єY, а V 0

V = Ъ0=1;2Т0 ^ Рщ - сРеДнее значение

длительности.

В отличие от традиционных задач оптимального кодирования текстов для обеспечения их безошибочной передачи по каналу с ограниченной пропускной способностью С далее везде следует полагать тср = те = 1 и V = 1, т.к. ММ временного ряда (1), достаточные для рассмотрения задач настоящей работы, можно считать «вторичными», т.е. результатом предварительного оптимального кодирования некоторого не рассматриваемого нами в настоящей работе «первичного» текста.

В нашем случае при идентификации систем рис. 1 распределения вероятностей ри и ру «индивидуальных» реализаций экспериментальных данных (1) уже учтены автоматически по зна-

С - С 2 - Ни + Ну - Ниу =

Еи,тіп;Аи>0 Еу;шш;Ву>0 Еиу;тт;Э >0

- + -

и;орі

1у;орі

П

- (26)

иу;орі

- (Аи + Ау - Аиу X

иу

так как очевидно, что

log Пu;opt;D >0 ' пy;opt;D >0 = Еи; тіп ;Би >0 + пuy;opt;D >0 nu;opt

Е у; тіп ;А > 0 Еиу; тіп > 0

(27)

п

uy;opt

10. Апробация метода и его практических приложений

Информационные характеристики некоторых каналов связи природных и модельных динамических систем, используемых в учебных занятиях со студентами ННГУ и являющихся фрагментами схемы рис. 1, и соответствующих

ny;opt

им скалярных и векторных текстов, полученных описанными в работе способами, даны в таблицах 1 и 2 результатов компьютерных экспериментов и замечаниях к ним.

Границы областей поиска для векторных и скалярных процессов подбирались с учётом теоремы 1, а также априорной информации о значениях возможных параметров процессов, как правило, так, чтобы ОБП пр и пр оказывались внутри области поиска.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заключение

1. Предложен и проверен моделированием метод структурной идентификации и анализа динамических и информационных характеристик многополюсных фрагментов сложных динамических систем и связанных с ними процессов - избыточности, предсказуемости, ненадёжности, пропускной способности каналов связи и др.

2. Метод основан на установленной связи энтропии и избыточности Шеннона оптимально дискретизованных по уровню и времени исходных векторных входных и выходных процессов, ограниченных по уровню и продолжительности, с их оптимальными базовыми параметрами (ОБП):

- оптимальными по уровню числами дискрет

пopt ^ Z+,

- оптимальными размерностями noptєZ+ -(порядками) динамических моделей источников-генераторов процессов.

3. Предложенный метод структурной идентификации и анализа динамических и информационных характеристик сложных систем (разделы 1-5) по экспериментальным данным полезен при решении многих задач, рассмотренных частично в прикладных разделах (6-10), и заслуживает внимания благодаря своей сравнительной простоте, методической направленности и информативности, так как теоретикам важна его основа - теория дискретных динамических систем (автоматов) и теория информации, практикам - простота интерпретации ОБП данных при анализе динамических и информационных характеристик динамических систем, получать которые традиционными видами обработки, не всегда учитывающими точность исходных данных, затруднительно.

Автор благодарит В.Д. Шалфеева, И.Я. Орлова, В.А. Таланова и участников семинара за учтённые в работе полезные замечания.

Работа выполнена при частичной поддержке Государственного контракта № 02.740.11.0003.

Список литературы

1. Льюинг Л. Идентификация систем. Теория для пользователя: Пер. с англ. / Под ред. Я.З. Цып-кина. М.: Наука. Гл. ред. физ.-мат.лит., 1991. 432 с.

2. Идентификация систем и задачи управления // Труды VII Международ. конф. SICPRO'09/ ИПУ РАН. М., 2009.

3. Kiryanov K.G. To a choice of the basic parameters of mathematical model of experimental data source // Proceedings 5-th International Specialists Workshop in Area Nonlinear Dynamics of Electronics Systems (NDES-97). Moscow, Russia, June 26-27, 1997. Pp. 400-403.

4. Кирьянов К.Г. Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 1. С. 39-46.

5. Кирьянов К.Г. Структурная идентификация динамических систем на основе оптимальной дискретизации многоканальных данных // Вестник Нижегородского университета им. Н.И. Лобачевского. 2008. № 6. С. 59-69.

6. Глушков В.М. Абстрактная теория автоматов // Успехи математических наук. М., 1961. Т. XVI. Вып. 5.

7. Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985.

8. Колмогоров А.Н. К логическим основам теории информации и теории вероятностей // Сб. трудов «Теория информации и теория алгоритмов» / Под ред. Ю.В. Прохорова. 1987. 332 с.

9. Шеннон К. Работы по теории информации и кибернетике / Пер. с англ. под ред. Р.Л. Добрушина и О.Б. Лупанова. М.: ИЛ, 1963.

10. Кирьянов К.Г., Грунина Е.А. Об определении достаточного числа отведений с изучаемой динамической системы // Тр. 9-й научн. конф. по радиофизике. 7 мая 2005 г. / Ред. А.В. Якимов. Нижний Новгород: TALAM, 2005.

11. Кирьянов К.Г., Горбунов А.А Структурная идентификация криптосистем на основе определения их базовых параметров // Труды VII Международ. конф. «Идентификация систем и задачи управления SICPR0'08». М.: ИПУ РАН, 2008. С. 1186-1196.

12. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем / Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: TALAM, 2002. 100 с.

IDENTIFICATION OF INFORMATION CHARACTERISTICS OF DYNAMIC SYSTEMS ON THE BASIS OF OPTIMAL DISCRETIZATION OF MULTICHANNEL DATA

K.G. Kiryanov

A method has been proposed and experimentally checked to identify information characteristics of multichannel (k+r)-pole fragments of complex dynamic systems (redundancy, predictability, unreliability, throughput, etc.). The method is based on the optimum discretization over basic parameters of vector (multichannel) k-input and r-output analog and discrete processes limited in scope and duration.

Keywords.: optimal basic parameters (OBP) of vector data, structural identification of coarse (structurally stable) dynamic systems (DS) by OBP of the initial analog or discrete processes, predictability, redundancy, unreliability, throughput.

i Надоели баннеры? Вы всегда можете отключить рекламу.