Научная статья на тему 'Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки'

Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
497
94
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА (ДДС) / ТАБЛИЦА ИСТИННОСТИ / ОПТИМАЛЬНЫЕ БАЗОВЫЕ ПАРАМЕТРЫ / КРИТЕРИЙ МИНИМУМА ЭНТРОПИИ (ПОТЕРЬ ИНФОРМАЦИИ)

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кирьянов К. Г.

Предложен и опробован метод оптимальной дискретизации исходных экспериментальных данных, ограниченных по уровню и продолжительности Т. Дискретизация проводится по комбинированному критерию минимума энтропии (потерь информации) путём вычисления оптимальных базовых параметров (ОБП) Mopt, qopt, nopt для последующей цифровой обработки данных и форматирования. Мopt и qopt − оптимальные числа дискрет по осям координат, nopt − оптимальная размерность (порядок) модели Источника-генератора экспериментальных данных, а шаг оптимальной дискретизации по времени − Δtopt=Т/Мopt определяется без применения спектрального анализа и теоремы В.А. Котельникова.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимальная дискретизация экспериментальных данных для последующей цифровой обработки»

Радиофизика

Вестник Нижегородского университета им. Н.И. Лобаче вского, 2008, № 1, с. 39-46

УДК 681.51

ОПТИМАЛЬНАЯ ДИСКРЕТИЗАЦИЯ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ДЛЯ ПОСЛЕДУЮЩЕЙ ЦИФРОВОЙ ОБРАБОТКИ

© 2008 г. К.Г. Кирьянов

Нижегородский госуниверситет им. Н.И. Лобачевского, ФГУП ННИПИ «Кварц»

kkg@rf.nnov.ru

Поступила в редакцию 22.01.2008

Предложен и опробован метод оптимальной дискретизации исходных экспериментальных данных, ограниченных по уровню и продолжительности Т. Дискретизация проводится по комбинированному критерию минимума энтропии (потерь информации) путём вычисления оптимальных базовых параметров (ОБП) МорЬ дер,, пор, для последующей цифровой обработки данных и форматирования. Мор, и до0 - оптимальные числа дискрет по осям координат, пор, - оптимальная размерность (порядок) модели Источника-генератора экспериментальных данных, а шаг оптимальной дискретизации по времени -&оР!=Т/Мор, определяется без применения спектрального анализа и теоремы В.А. Котельникова.

Ключевые слова: дискретная динамическая система (ДДС), таблица истинности, оптимальные базовые параметры, критерий минимума энтропии (потерь информации).

Введение

Имеется достаточно много практических задач, методических проблем и всевозможных «мелких» причин, которые приводят к необходимости рассмотрения вопроса оптимальной дискретизации шкал экспериментальных данных для сохранения исходной информации, влияющей на точность расчётов при последующей их обработке на ЦВМ и передаче по каналам связи.

Эти проблемы возникают, например, когда требуется обработка непрерывных процессов конечной длительности Т. Во многих таких случаях не меняется изначальная частота дискретизации сигнала (£), которая не всегда выбирается в соответствии с теоремой В.А. Котельникова [1]. Чаще она выбирается из соображений практического удобства кратной, например секунде (минуте, часу, месяцу, году и т.д.), что свидетельствует о возможной потере необходимой информации уже на исходной стадии дискретизации сигнала, до последующей целевой обработки. В таких случаях очевидна необходимость перенастройки (переквантовки, «ресамплинга») исходных данных на оптимальную частоту /л с учетом сохранения в данных максимума исходной информации.

Выбор же по Котельникову осложняется тем, что при пологом и/или осциллирующем спаде модуля спектра на высоких частотах не всегда просто указать правила определения верхней частоты спектра /л. «Исправленный» искусственно пологий спад на резкий в спектре

исследуемых данных за счет применения «спектральных окон» (Хемминга, Хеннинга, Чебышева и т.д.), по которому удается сделать более точный отсчёт /с, приводит к изменению как формы огибающей выборок, так и информации в исходных данных.

Можно считать также практической проблемой наличие в исходных данных редких и с очень малой амплитудой аддитивных импульсных помех, спектр которых может быть очень широк. Это приводит к увеличению / для суммы «процесс+помеха» и неоправданному практически уменьшению шага дискретизации Д?=1/(2/С). В результате при дискретизации исходного аналогового сигнала по Котельникову увеличивается необходимое число М = Т/Д,= = 2/сТ выборок процесса за то же время Т. Другим неудачным попыткам и парадоксам применения теоремы В.А. Котельникова в теории связи посвящена большая часть интересной работы Л.М. Финка [3].

Настроенный патриотически читатель скажет, что не слишком ли много возникает коллизий при применении теоремы В.А. Котельникова к проблеме дискретизации данных? Ответ заключается в том, что выдающаяся теорема

В.А. Котельникова для дискретизации непрерывных процессов по времени верна, как и любая другая теорема, лишь при сформулированных условиях её справедливости [1-3], а отмеченные выше, полученные из неё утверждения, не всегда устраивающие практиков, являются точными. Всевозможные трудности возникают лишь при попытках применения теоремы вне

условий её справедливости. Наша формулировка причин неудачных попыток применения теоремы В.А. Котельникова на языке используемой в настоящей работе терминологии состоит в том, что в условиях её справедливости присутствуют физически нереализуемые на практике условия, содержащие (как говорили философы «дурные бесконечности»): 1) требование без-

ошибочного задания ординат процесса а, значит, необходимость бесконечного числа д =<» уровней их квантования и 2) требование абсолютно точного задания ординат процесса при всех точках бесконечно протяженной абсциссы, т.е. на интервале -да < 1 < да .

Другой более сложный «клубок» сходных проблем возникает при необходимости совместимой оптимальной дискретизации выборок исходных процессов не только по времени и уровню, но и целочисленному порядку (размерности) п математической модели (ММ) Источника процесса. Порядок п учитывает динамические связи между выборками данных и может использоваться, например, при прогнозировании процессов. В работах [4, 5] описываются пионерские методы Н. Лка1ке и Е. Рагсеп определения порядка п моделей аналоговых процессов без рассмотрения вопроса влияния на его точность дискретизации процесса по времени и уровню с трудно контролируемыми реализациями операций округления.

Таким образом видим, что методическим недостатком подходов в упомянутых выше задачах оптимальной дискретизации (квантования) исходных, полученных экспериментально, процессов являются трудности:

- явного введения оптимизируемых параметров дискретизации в ММ процессов и

- формулировки связанного с ММ процессов комбинированного Критерия оптимизации для согласованного учёта всех взаимных связей и ограничений на квантуемые величины.

На необходимость согласованного учёта связей в виде соотношения неопределённости для базовых парамеров (БП) нами ранее было указано в работе [8].

Цели исследования

Из сказанного выше следует, что изменения во времени экспериментального процесса определяются целочисленным порядком (размерностью) п математической модели Источника, порождающего этот процесс, а результаты любых преобразований процесса, включая квантование по уровню и дискретизацию по времени, должны рассматриваться совместно, т. к. они

взаимосвязаны с п. Поэтому, чтобы избежать методических трудностей обработки исходных экспериментальных данных на ЦВМ, требуется:

1) постулировать и обосновать смену Алгебраической Структуры (АС) математических моделей Источников экспериментальных процессов (временных рядов) на дискретные динамические системы (ДДС) - абстрактные автоматы, построенные на конечных множествах входящих в них переменных и параметров;

2) постулировать и обосновать выбор комбинированного Критерия минимума энтропии (минимума потерь информации), учитывающий связи между квантуемыми по времени (М), уровню (д) процессами и параметром (п) в моделях Источника исходных экспериментальных данных длины Т<ж;

3) предложить способ идентификации указанных выше оптимальных базовых параметров (ОБП) квантования МорЬ доръ пор1 (и связанного с ними шага квантования параметра А1ор1=Т/Мор,) ММ Источника исходных экспериментальных данных по единому целевому информационному Критерию минимума энтропии (минимума потерь исходной формации).

1. Выбор алгебраической структуры математической модели экспериментальных процессов

В качестве дискретной математической модели Источника исходных экспериментальных данных (эквидистантного временного ряда)

У = {Уг }ге[0,М-1] =

= (уо, у1,...,ум-2 , уМ-1) е ^2 , (1)

где уг-е2={0, д-1}, о < г <М-1, М = |_ТД, _ -

целая часть Т/Д,,

выбираем ДДС в форме абстрактного конечного автомата [6-8] с Алгебраической Структурой из конечных множеств, входящих в них переменных Уг, и

постулируем уравнение динамики (или т.н. прогнозирующего оператора (ПО) временного ряда (1)) в виде уравнения нелинейной регрессии) размерности (порядка) п:

Уг+п = /г(Уг, Уг+1, • • • , Уг+ п-й К) = /г, 0 < I < М-п (2)

и параметров (леП ={0, д-1}). Величина п является порядком ММ ПО данных. Заметим, что ограниченные по уровню и продолжительности непрерывные и разрывные аналоговые исходные данные

-да < Ушт < У(1) < Утах < , 1 е [0,Т] (3)

приводятся к форме (1) за счет их предварительного «АЦП-преобразования»

Уі =

У (iAt) - У mIn [0, T]

(q -1)

(3)

У тах [0, Т ] - У шш!0, Т ]

Из введенных обозначений фактически следует

Теорема 1. Для временного ряда (1), удовлетворяющего условиям (3), существует Математическая Модель Источника в виде уравнения нелинейной регрессии (2) в форме прогнозирующего оператора, который по п начальным, следующим подряд с шагом А1=Т/М, д-значным выборкам исходного ряда (1) позволяет вычислить все оставшиеся М-п выборок.

Таблица 1

Строка № i Аргументы прогнозирующего оператора («п-ки») - выборки из исходного ряда данных (1) Прогноз fi

0 У0 Уі Уп-1 Уп

l Уі У2 Уп Уп+1

k-n Уk -п У^п+1 Уы Уk

h yh -п yh -n+l У^і Уh

= [2 < qмин, q^m,] и n=n0&N=[l<n

mm ,lmax_

Из теоремы 1 следует, что при дискретизации по времени и уровню аналогового экспериментального процесса, допускающего представление (1), по любым следующим подряд п выборкам могут быть вычислены последовательно все оставшиеся выборки до М-ой включительно. Можно также сказать, что прогнозирующий оператор (2) определяет «условную достоверность» всех оставшихся выборок с точностью 1/д.

Доказательство существования ДДС в качестве ММ Источника ряда (1) заключается в возможности её непосредственного синтеза в форме таблицы истинности (ТИ) (таблица 1) [8, 9]. Для этого при начальных значениях

] строки

ТИ с номерами і=0,1,...,Ь=М-п+1< дп заполняются следующими подряд наборами «п-ок»

(Уі, Уі+1,..., Уі+п-і), интерпретируемых как аргументы д-значной логической функции / правой части (2) ПО и следующей за ними выборки, в качестве прогнозируемого им символа

у,+Пп є [0, до-1] •

Заполнение строк происходит до первой встречи следующего набора аргументов, совпадающего с любым из появившихся ранее. При этом, если следующие за совпадающими n-ми символы совпадают, то пополнение ТИ продолжается и заканчивается за шаг до несовпадения вызываемого одинаковыми n-ми прогнозируемого значения ряда (на шаге с номером строки h< M—n < qn). Подбирая значение n при q=q0 получаем непротиворечивую ТИ с высотой h=M-l. Временной ряд (1) с непротивореч-вой ТИ назовём «Mnq-рядом».

Видим, что базовые параметры (БП) q, n и M оказались связанными, но они могут быть, как увидим далее, не оптимальными. Их оптимальный выбор не возможен без компромисса, определяемого комбинированным Критерием качества дискретизации данных, рассматриваемым в разделе 2. Алгоритмы нахождения ОБП Mop, qopt и nopt рассматриваются в разделе 3.

2. Выбор критерия минимума энтропии в экспериментальных процессах

В качестве Критерия оптимальной дискретизации (и передискретизации) ограниченных по уровню и времени Т исходных экспериментальных данных для получения оптимального Mnq-ряда, нами выбран Критерий минимума энтропии (минимума потерь информации) Е по входящим в распределение ряда (1) наборам базовых параметров (M,n,q)

min Е (q,n,M;{ y },.е[0, m-ц) =

qefqmin.qmax ],ne[nmin,nmax ],Me[Mmin,Mmax ] (4)

= E (qopt, nopt, Mopt;{y} ie[o,Mopt-i}).

Из (4) видим, что для вычисления ОБП Mopt, qopt и nopt необходимо иметь дополнительно к исходной информации об Источнике данных в (1) априорную информацию об областях поиска параметров и аналитическом виде функции совместной энтропии анализируемого ряда данных. Ясно, что исследователь-практик всегда имеет какую-то априорную информацию об областях определения БП изучаемого Источника данных и не имеет (за исключением редких случаев) никакой информации о виде функции (функционала) совместной энтропии ряда (1). Решению последней проблемы помогает

Теорема 2. Оценка энтропии Шеннона полного временного Mnq-ряда (1), удовлетворяющего уравнению регрессии n-го порядка (2) и условиям (3), при М^оо целиком определяется энтропией его первых n членов.

Действительно,

Е (q n, M;{у, }1фм-1]) ■

■ H ((Уo, Уl,..., yn-i;...),( Уп , yn+i—Ум-i;...))=

= H (Уo, Уl,..., yn-i;...)+

+ HI (yn, У n+i,..., yM-i;...)

(5)

(Уо,..., Уп-1;...) = н (Уо,..., Уп-1;...)+0 = н (Уо,..., Уn-l;...),

т.к. условная энтропия Шеннона Н оставшейся части последовательности (1) символов процесса (текста) у длины М-п относительно её п начальных символов в силу уравнения (2) и условия (3) стремится к нулю теоретически при М^оо , а, практически, когда на длине М, содержится небольшое число (2-5, см. раздел 4) “размахов” исследуемого Мпд-ряда:

H (

'( Уп , Уп

yM-i;...),

/(У о,..., Уп-i;...)

)= 0.

(6)

Е ({yt }ге[о,м-i]; ^ n, м) =

теоремыiu 2 > = H(Уо,...,Уп-i;q,n,M) =

правилоБайеса ___

>■ H (Уо) + H (yi / Уо) +

+ H (У2 / Уo, yi) + ... + H (У п-2 / Уo, Уl,..., У п-3 ) + + H ( yn-i/ Уо, Уl, Уз,..., У п-2 )

марковость

*< H (Уо) + H (yi/Уо) +... +

+ H ( yn-i/ У п-2 ) = H ( Уо) +

+(п - i) • Еj=п-l p(уj/ уj-i) • log p(yJ / yj-i)

— > < H (yo) + H (yi) +

+ ... + H ( yn-2 ) + H ( yn-i)

°днородт°С ть > < n • H (y) =

при ps=Ум-

V,.•E'i=M i8(y,-s) , / •sr'-s= q-l ✓ \

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

--------(У^> < n • (-Es=o ps (У )

Таким образом, неопределенность всей последовательности у связана лишь с неопределенностью выбора самой начальной п-ки, а мера неопределенности (энтропия Шеннона) всего текста совпадает с энтропией начальной п-ки, служащей начальным условием для детерминированного автомата (2).

Полученное выражение Критерия в форме (5) не упрощает, однако, сложность его практической идентификации функции при априори неизвестной зависимости между значениями ряда (1). Поэтому для практической конкретизации комбинированного Критерия (4) исследователь может воспользоваться теоремой 3, устанавливающей соответствия между видом Критерия и имеющейся априорной информацией о законе распределения членов временного ряда (1).

Теорема 3. Функция энтропийного Критерия (4) аппроксимируется последовательностью неубывающих функций-Критериев энтропии распределения зависимых между собой членов временного ряда (1), зависящих от уровней априорной информации (марковость, независимость и т.д.) указанных в цепочке неравенств (7).

Действительно, используя свойства функций энтропии Шеннона для различных видов совместного распределения вероятностей членов временного ряда (1) - марковость, независимость и т.д. (и опуская для сокращения обозначений символы и области поиска параметров), имеем цепочку Критериев, справедливых при уровнях априорной информации, указанных в неравенствах (7)

• l0g ps (У)) ■ п • Hps *const =

при p'(У)=i/q > < (-п • q • % • log %) =

= n • log q ■ n • Hps=Const =

энтропия по базовым параметрам

(7)

= (bg N) ■ ЕВР (y) =

энтропия Колмогоров а для " высоковеро ятных " рядов (i)

■ •ЕК(У).

В соотношениях (7) над стрелками указаны уровни априорной информации (марковость и т.д.), необходимые для использования следующего за ними уровня приближения функции-Критерия, S(...) - дискретная 8-функция определяется как 8(х)=1 при х=0 и 8(х)=0 при х*о, N=qn- объём гиперкуба ограниченного фазового пространства ДДС (2) Источника данных, восстанавливаемого по экспериментальному ряду (1) [6-8]. Энтропия Шеннона и энтропия по базовым параметрам, приходящаяся на один символ текста, для случая ps ^ const оценивается по формулам

Hps *const - Ex1 ps (У) • l0g ps (У)

и Е = п • H

rL ^ps*const ,l ps*const

на основе вычисления ОБП М, п, д (раздел 3) и

набора вероятностей р5 = /М • £;=М 1 5(у, -5),

5= 0, 1,..., д-1. В случае р=еош1 энтропия Шеннона и энтропия по базовым параметрам оценивается только на основе ОБП:

Е = п • Н

р5=СОп5^ р5 =COnSt

H

ps =const

= п • log q .

и

3. Алгоритм выбора оптимальных базовых параметров источника данных

Процедура определения оптимальных базовых параметров (ОБП) структуры ММ Источника (2) экспериментальных данных (1) зависит от конкретного вида выбранного Критерия в соотношениях (7). Экспериментатор-исследователь имеет скудную априорную информацию о распределении членов ряда (1) и вынужден ограничиваться, как правило, четырьмя последними аналитическими выражениями для критериев в неравенствах (7). Например, для однородных независимых членов ряда с разными вероятностями уровней может использоваться критерий

mm Е ^ п м;{ у }ге[ом-i]) =

qe[qmin^mot ]пе[nmin ,nmax ],Me[Mmin Mmax ] (8)

= (l°g N) min ■ ЕВР ,

где вероятности p s вычисляются по самому ряду (1) по формуле

1 i =M-l

ps = tt Е5(Уі -s).

м i =0

nopt ■ H ~ nopt X

X (-ES=q-1 ps (У ) ■ log p. (У )) |min ^

(9)

Если же ряд (1) достаточно «длинный» (M>qn/2>>q) и можно считать вероятности всех q уровней ряда равными

ps = 1/ q, s е [о, q - l], то справедлива оценка

minE(q,п, },е[о,м-1]) =

qe[qmm,qmax],ne[nmm,nmax]Me[MmmMmax] (Ю)

= (logN)min ■ ЕВР ,

позволяющая находить базовые параметры по минимальному объёму N фазового пространства

ДДС (2).

Принадлежность «длинного» экспериментального ряда (1) к множеству «высоковероятных» рядов [io] предлагается оценивать по близости неравенства (11) к равенству, т.к. из соотношений (7) следует связь энтропии Шеннона с энтропией по базовым параметрам:

(ll)

^ (log N )min = EBP .

Достаточно протяженные высоковероятные ряды конечной длины по своей сути являются выборками известных в теоретической динамике т.н. ограниченных по уровню хаотических процессов, одной из важных характеристик которых является энтропия А.Н. Колмогорова. Она показывает скорость разбегания «соседних» траекторий в ограниченном объёме N дискретного фазового пространства. В данном случае, как следует из (7), дискретный аналог энтропии

Колмогорова [7, 8] оказывается связанным с энтропией по ОБП:

Ек (У) = yn ^ • Евр = 1/2,885 • Евр . (12)

Алгоритм поиска ОБП описан в ряде работ (см., например, [6-8]) и заключается в нахождении такой тройки чисел q, п и M, при которой энтропия соответствующего уровня имеющейся априорной информации (7) временного ряда (1) будет минимальна, например, энтропия (8). При этом, если есть доверие к изначально заданному числу точек дискретизации Мо или шагу дискретизации At=Ato=TMo, то определяются только ОБП qopt и nopt путём минимизации Критерия

arg min Е ( q , п , М :{ у, } 1Е [о, м о -1]) = (уз)

q е [ q min , q max ], П е [ П mm ,П max x ], M = M о

= (qopt,nopt).

Если же изначально имеются выборки из непрерывного процесса с неизвестным (или заведомо неоптимальным и требующим уточнения) шагом At, то исходный процесс по имеющимся Мо отсчетам восстанавливается в «непрерывный», например, методом сплайнов. Затем образуются новые наборы выборок исходного процесса с разным количеством выборок Mmin < M < Mmax или шагов дискретизации в интервале TMmax < At < T/Mmin, где T- длительность исходного процесса. Из упомянутых наборов тот набор будет иметь оптимальное число выборок Mopt и оптимальный размер шага Atopt=T /Mopt , на котором пара (q, п) даёт наименьшее значение критерия (4). Так определяется вся оптимальная тройка Mopt, qopt, nopt.

4. Результаты апробации метода

Для проверки теории и практических возможностей метода нами проводились эксперименты с различными классами данных (типовые модельные радиотехнические сигналы, характерные природные процессы, ряды данных в экономике и др.) при практической работе со студентами радиофизического факультета ННГУ и магистрантами ИРИТ при НГТУ.

Результаты экспериментов, показывающие отмеченные в работе особенности и возможности метода, приведены в табл. 2.

Все обозначения в табл. 2 пояснены в тексте работы. Подчёркиванием отмечены заслуживающие внимания особенности предложенного метода, которые подтверждают изложенные в работе соотношения. Отметим, что некоторые результаты анализа данных не удаётся непосредственно получить традиционными методами спектрального, корреляционного и вероятностного анализа.

Процесс (временной ряд) i = 0, 1, 2, ..., M - 1

Исходные данные ряда

Режим

поиска

Области и результаты поиска ОБП

р. ^const

M=41 такт,

qopt=11 из [2,100]; nopt=1 из [1,60];

Mop,=13 из [10,50];

Atop,=3.15385 такт; E=3.52214; H=3.52214; E/H=1=nopt

«развёртка»

p. = const

qopt=10 из [2,100]; nopt=1 из [1,60]; Mopt=11 из [10,50]; Atop,=3.72727 такт; E=3.32193;H=3.2193; E/H=1=nov,

2.

/ л

/

/ X

у

/

/

/

/

у

.. 1/

p. ^const

M=43 такт, Ato=1 такт

qopt =20 из [2,100]; nopt =1 из [1,60];

Mopt =41 из [40,50];

Ao, =1.04878 такт.; E=5.42093 ; H=5.42093 E/H=1=nopt

p. = const

«пила»

qopt=20 из [2,100]; nopt=1 из [1,60];

Mopt=41 из [40,50]; At0vt= 1.04878 такт; E=5.75489; H=5.75489 E H 1 npp!

3.

p. ^const

M = 1б0 тактов, период 32,

qopt=33 из [3,100]; nopt=2 из [1,60];

Mop,=150 из [150,170]; Atopt =1,0бб7 такт.; E=7.53481; H=3.76740 ; E/H=2=nopt

p. = const

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

«синус»

qopt=26 из [3,100]; nopt=2 из [1,60];

Mop= 150 из [150,170]; At^ =1,0бб7 такт.; E=9.90839;H=4.95420; E H 2 Пру,

4.

p. ^const

T =302 года, M=302, Ato=1 год

Ежегодный прирост колец деревьев

qop,=45 из [2,100];

Иор,=3 из [1,б0];

Mopt=303 из [301,303]; А,ор,=0.99б70 год; E=13.80384 ; H=4.60128 E/H=3,00000=novt

p. =const

«кольца»

qop,=45 из [2,100];

Иор,=3 из [1,б0]; Mopt=303 из [301,303]; А,ор,=0,99б7 год, E=16.47556; H=5.49185 E/H=3.00000=nopt N=91125

M=1001 такт Ato=1 такт

Одна из трёх детерминированных компонент состояния аттрактора Лоренца

p^const

qopt= 1026 из [800,1200]; Иор,=3 из [1,60]; Mopt=1001 из [999,1002]; Л,ор,=1,00000 такт.; E=27.99653 ; H=6.99913 E/H=3.000000 =n0vt

ps=const

«хаос»

qopt=924 из [800,1200]; Иор,=3 из [1,60];

Mop,= 1000 из [999,1002]; Atopt=1,00100 такт; E=38.73899; H=9.68475 E/H=2.999999=n0 N=788889024

opt

Ato=1 такт

1.

Ato=1 такт

Многоэкстремальность Mqn-ряда (1) является общим свойством анализируемых практически временных рядов со «стационарным» (т.е. слабо меняющимся при возрастании времени

Т=М-М) размахом уmax[o,T] - ymin[o,T] и может приводить к многоэкстремальности критериев (7) и необходимости разбиения областей БП на области одинаковых наборов значений ОБП. Многоэкстремальными являются все ряды, приведенные табл. 2 п.п. 2—5. Поэтому области поиска ОБП, имеющие непосредственный модельный физический смысл, рекомендуется назначать из априорной информации об Источнике данных и целей дискретизации.

В п. 1 табл. 2 для простейшего радиотехнического сигнала типа «развёртка» в обоих режимах поиска при pi ^ const и p^ = const получаем Ato<Atopt , что указывает на избыточность количества исходных выборок и возможность сокращения числа выборок М для представления такого сигнала.

Далее в п.п. 2—5 табл. 2 видим, что, в соответствии с соотношениями (7), в режиме p^const энтропия Шеннона, как и связанная с ней множителем n энтропия по ОБП, больше

чем в режиме Pi ф const: Eps=const — ^consb

Hps=const — Hps^const для энтропий во всех остальных примерах не монотонных временных рядов даже с весьма скромной статистикой.

Заметим, что в п. 2 при поиске БП M в интервале [40, 5о] Mopt = M. Это значение Mopt сохраняется для интервала поиска М порядка интервала монотонности огибающей или периода анализируемого ряда. Вне интервалов поиска, сохраняющих величину Mopt, могут наблюдаться скачкообразные изменения значения Mopt из-за многоэкстремальности критерия оптимизации (4), при многоэкстремальной огибающей временного ряда. Выбор интервала поиска Mopt не сохраняющего величину Mopt может иметь физический смысл, например при рассмотрении возможности синхронизации сложных сигналов.

Следует также отметить, что для анализируемых рядов в п.п. 2—5 их «простоту» и «cложность» удобно условно оценивать по величине объёма фазового пространства Nmin = = (qn)min по соотношению (11) или по приведённой в табл. 2 энтропии по БП или связанной с ней энтропией Шеннона. Тогда временные ряды п.п. 1-2 с ОБП n=1 и синусоидальный процесс в п. 3, имеющий ОБП п=2 (порождаемый источником-генератором 2-го порядка), можно условно отнести к простым, а ряды п.п. 4-5 с п =3 и более - к сложными за счёт роста не только их порядка n, но и числа уровней q.

Заключение

При использовании математической модели Источника как аналоговых, так и дискретных данных в виде дискретной динамической системы в форме конечного д-уровневого абстрактного цифрового автомата предложенный и рассмотренный в работе метод дискретизации экспериментальных данных даёт возможности:

• получения результатов вычислений оптимальных базовых параметров (ОБП) МорЪ Яорь Пр во множествах целых чисел;

• проведения последующей целевой обработки в ЦВМ и передачу по цифровым каналам связи проквантованных экспериментальных данных в алгебраических структурах с конечными множествами целых чисел. При этом результаты последующих вычислений не будут зависеть от принятых способов округлений в множестве действительных чисел в конкретном типе или экземпляре ЦВМ, обеспечивая их повторяемость;

• определения оптимального порядка математической модели Источника (генератора) исходного временного ряда (пор) вместе с другими дискретными ОБП по уровню (дор) и времени (Д?ор) по совместному критерию минимальной энтропии (потери информации) в исходных экспериментальных данных;

• определения ОБП при передискретизации эквидистантного временного ряда, если дискретизация в исходном процессе была выбрана не оптимально;

• отображение экспериментальных данных на графиках с оптимальным форматированием - величинами шагов на координатных осях для минимальной потери исходной информации.

• определения необходимых для практического применения параметров, выражаемых обычно в действительных числах, через ОБП, выражаемые в целых числах, например:

- оптимального шага дискретизации по оси абсцисс - Д?ор= Т/Мр (без использования теоремы В.А. Котельникова, требующей для своего применения спектрального анализа);

- оптимальной точности (уровня ошибок и/или степени зашумлённости) исходных экспериментальных данных по величине;

- 1/цорг (для условий применимости теоремы В.А. Котельникова требуется безошибочность исходных данных, заданных на интервале [-<»,+<»], т.е. д = дор1 = <»);

- оптимальной энтропии (числа двоичных разрядов при кодировании) на один символ текста (7) и её оценки сверху logqopt,

- эквивалентной оптимальной верхней частоты (среза) спектра процесса (без использования спектрального анализа) по формуле f ■ fd =l/(2A?opt)=Mopt/2T, и т.д.

Метод может оказаться полезным при создании новых способов анализа и измерений различных параметров аналоговых и дискретных процессов различной природы и проектирования на их основе новой измерительной аппаратуры на базе цифровой техники.

Список литературы

1. Котельников В.А. О пропускной способности «эфира» и проволоки в электросвязи («On the transmission capacity of 'ether' and wire in electrocommunication») // Первая Всесоюзная Конференция по вопросам связи, 14 января, 1933 (С. 9-29 в Сб. «Владимир Александрович Котельников. К 95-летию. М.: Издательство МЭИ, 2003. 76 с. ил. ISBN 5-7о46-о993-7»).

2. Люке Х.Д. Происхождение теоремы о выборках. (С. 31-39 в упомянутом в п. l сб. к 95-летию).

3. Финк Л.М. Сигналы. Помехи. Ошибки. Заметки о некоторых неожиданностях, парадоксах и заблуждениях в теории связи. Изд. второе. М.: Радио и связь, i984. 255 с.

4. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения. М.: Мир, 1990. 551 с.

5. Льюнг Л. Идентификация систем. Теория для пользователя: Пер. с англ. / Под ред. Я.З. Цыпкина. М.: Наука, 1991. 432 с.

6. Kiryanov K.G. To a choice of the basic parameters of mathematical model of experimental data source. Proceedings 5-th International Specialists Workshop in area Nonlinear Dynamics оf Electronics Sistems (NDES-97). Moscow, Russia, June 26-27, 1997. P. 4oo-4o3.

7. Кирьянов К.Г. Выбор оптимальных базовых параметров источников экспериментальных данных при их идентификации // Идентификация систем и задачи управления. Труды 3-й междун. конф. SICPR0'04/ ИПУ РАН. М., 2004. С. 187-2о8.

8. Кирьянов К.Г. Соотношение неопределённо-сти для базовых параметров генетических карт и применение его для идентификации нестационарных источников экспериментальных данных // Идентификация систем и задачи управления. Труды 5-й Международ. конф. SICPRO'o5/HHy РАН. М., 2оо6.

С. 155-182.

9. Яблонский С.В. Введение в дискретную математику: Учеб. пособие для вузов / Под ред. В.А. Садовничего. 4-е изд., стер. М.: Высш. шк., 2оо6. 392 с. (Серия «классический университетский учебник»).

10. Шеннон К. Работы по теории информации и кибернетике: Пер. с англ. под ред. Р.Л. Добрушина и О.Б. Лупанова. М.: ИЛ, 1963. С. 333-4о2.

OPTIMUM DIGITIZATION OF EXPERIMENTAL DATA FOR SUBSEQUENT DIGITAL PROCESSING

K. G. Kiryanov

A method for optimum digitization of initial experimental data limited by level and duration T has been proposed and tested. The digitization is carried out using a combined criterion of entropy minimum (information losses) by calculating optimum base parameters (OBP)Mopt, qopt, nopt for subsequent digital data processing and formatting. Here, Mopt and qopt are the optimum quantization step numbers over coordinate axes, nopt is the optimum dimension (order) of the experimental data source-generator model, and Alopt=T/Mopt is the step of optimum time digitization which is determined without application of spectral analysis and the Kotelnikov theorem.

i Надоели баннеры? Вы всегда можете отключить рекламу.