Научная статья на тему 'Статистика дробных моментов: новый метод количественного > произвольной случайной последовательности'

Статистика дробных моментов: новый метод количественного > произвольной случайной последовательности Текст научной статьи по специальности «Математика»

CC BY
516
79
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Нигматуллин Равиль Рашидович

Найден статистический смысл моментов целого ΔN(p) (p = 1, 2,…) и дробного ΔN(p) (0 p N произвольных точек. Моменты высших порядков позволяют свести анализируемую случайную последовательность к некоторому конечному набору k статистически устойчивых целых моментов Δk(p) (p = 1, 2,…, k), принадлежащих исходной последовательности. Найденные условия статистической устойчивости и близости, выраженные в терминах высших моментов ΔN(p) = ΔN+k(p) (p = 1, 2,…, k), позволяют найти k неизвестных устойчивых точек и предсказать возможное будущее (устойчивое по отношению к прошлому времени) поведение анализируемой случайной последовательности. Функция обобщенного среднего (ФОС), определяемая как GN(p) = (ΔN(p))1/p, может быть эффективно использована при анализе статистически близких случайных последовательностей, содержащих большое число измеренных точек (N ‡ 1). Найдены приближенные аналитические выражения для ФОС GN(p) для произвольных значений p из интервала (-∞ p произвольную случайную последовательность, преобразованную в пространстве моментов в детерминированную ФОС, и выразить количественно исходную случайную последовательность в терминах некоего «универсального» набора редуцированных (подгоночных) параметров, входящих в приближенное аналитическое выражение для ФОС. Эти подгоночные параметры могут быть использованы для построения так называемой калибровочной кривой, когда возникает необходимость сравнения одной случайной последовательности с другой по отношению к изменениям некоторого внешнего доминантного фактора (малого сигнала). Целочисленные моменты легко обобщаются на дробные и даже комплексные моменты, которые позволяют ввести определение нецелых моментов и ФОС, содержащие комплексные величины. ФОС может быть также рассмотрена как функция двух и более переменных для анализа многомерных случайных последовательностей, содержащих два, три и более независимых индекса. Следует особо подчеркнуть тот факт, что статистика дробных моментов (СДМ), предлагаемая в этой работе, совершенно свободна от каких-либо модельных (априорных) представлений и предположений о природе случайности и поэтому может быть эффективно использована для количественного сравнения произвольных случайных последовательностей, используя для этой цели набор подгоночных параметров, получаемых из сравнения соответствующих ФОС. Найдено соотношение между величиной дробного момента и параметром неэкстенсивности q, входящим в обобщенное определение энтропии, предложенное К. Цаллисом. Для доказательства сверхчувствительности метода, основанного на статистике дробных моментов (СДМ), рассмотрена важная проблема по защите пластиковых карточек, товарных знаков и других ценных документов от подделок. Некоторые поучительные примеры детектирования сверхслабых (S/N = 10-2, 10-3) сигналов, полученных на модельных данных и буквально «растворенных» в исходной последовательности, показывают высокую эффективность СДМ и могут быть использованы в качестве исходной базы для дальнейших приложений при сравнении реальных шумов, модифицированных внешним малым фактором. Анализ реальных данных по диэлектрической спектроскопии, реализованный в рамках СДМ, предоставляет уникальную возможность для количественного сравнения каждого отдельного экспериментального измерения и позволяет выразить влияние нейтральной аддитивной добавки с помощью калибровочной кривой без детального знания подгоночной функции, которую невозможно получить для сложных систем в рамках упрощенных моделей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Нигматуллин Равиль Рашидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Статистика дробных моментов: новый метод количественного > произвольной случайной последовательности»

УЧЕНЫЕ ЗАПИСКИ КАЗАНСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Том 147, кн. 2 Физико-математические пауки 2005

УДК 531.19—53.088—519.25

СТАТИСТИКА ДРОБНЫХ МОМЕНТОВ: НОВЫЙ МЕТОД КОЛИЧЕСТВЕННОГО «ПРОЧТЕНИЯ» ПРОИЗВОЛЬНОЙ СЛУЧАЙНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Р. Р. Нигматуллип

Аннотация

Найден статистический смысл моментов целого ДД (р = 1, 2,...) и дробно го ДД (0 < р < то) порядков, рассчитанных для некоторой случайной последовательности, содержащей N произвольных точек. Моменты высших порядков позволяют свести анализируемую случайную последовательность к некоторому конечному набору к статистически устойчивых целых моментов дкр) (р = 1, 2,...,к), принадлежащих исходной последовательности. Найденные условия статистической устойчивости и близости, выраженные в терминах высших моментов ДД = Ддг+к (Р =1, 2,. .. , к), позволяют найти к неизвестных устойчивых точек и предсказать возможное будущее (устойчивое по отношению к прошлому времени) поведение анализируемой случайной последовательности.

Функция обобщенного среднего (ФОС), определяемая как СД = ^дД^ , может быть

эффективно использована при анализе статистически близких случайных последовательностей, содержащих большое число измеренных точек (N ^ 1). Найдены приближенные аналитические выражения для ФОС для произвольных значений р из интервала

(—то < р < то). Они дают возможность подогнать произвольную случайную последовательность, преобразованную в пространстве моментов в детерминированную ФОС, и выразить количественно исходную случайную последовательность в терминах некоего «универсального» набора редуцированных (подгоночных) параметров, входящих в приближенное аналитическое выражение для ФОС. Эти подгопочпые параметры могут быть использованы для построения так называемой калибровочной кривой, когда возникает необходимость сравнения одной случайной последовательности с другой по отношению к изменениям некоторого внешнего доминантного фактора (малого сигнала). Целочисленные моменты легко обобщаются па дробные и даже комплексные моменты, которые ПОЗВОЛЯЮТ ввести определение нецелых моментов И ФОС; содержащие комплексные величины. ФОС может быть также рассмотрена как функция двух и более переменных для анализа многомерных случайных последовательностей, содержащих два, три и более независимых индекса. Следует особо подчеркнуть тот факт, что статистика дробных моментов (СДМ), предлагаемая в этой работе, совершенно свободна от каких-либо модельных (априорных) представлений и предположений о природе случайности и поэтому может быть эффективно использована для количественного сравнения произвольных случайных последовательностей, используя для этой цели набор подгоночных параметров, получаемых из сравнения соответствующих ФОС. Найдено соотношение между величиной дробного момента и параметром неэкстенсивности д, входящим в обобщенное определение энтропии, предложенное К. Цаллисом. Для доказательства сверхчувствительности метода, основанного па статистике дробных моментов (СДМ), рассмотрена важная проблема по защите пластиковых карточек, товарных знаков и других ценных документов от подделок. Некоторые поучительные примеры детектирования сверхслабых (S/N = 10- , 10-3) сигналов, полученных па модельных данных и буквально «растворенных» в исходной последовательности, показывают высокую эффективность СДМ и могут быть использованы в качестве исходной базы для дальнейших приложений при сравнении

реальных шумов, модифицированных внешним малым фактором. Анализ реальных данных по диэлектрической спектроскопии, реализованный в рамках СДМ. предоставляет уникальную возможность для количественного сравнения каждого отдельного экспериментального измерения и позволяет выразить влияние нейтральной аддитивной добавки с помощью калибровочной кривой без детального знания подгоночной функции, которую невозможно получить для сложных систем в рамках упрощенных моделей.

Введение

Общая цель любого метода развитого или предлагаемого в современной прикладной статистике заключается в том. чтобы улучшить чувствительность и селективность отношения сигнал/шум и уменьшить возможные систематические ошибки, связанные с временными флуктуациями возможных неконтролируемых параметров измеряемого прибора. Другой важной проблемой, существующей в прикладной математической статистике, является выработка некоего «универсального» языка для сравнения двух случайных последовательностей, имеющих в принципе различное количество N1 = N2 случайных точек.

В настоящее время существует ряд методов, которые могут быть использованы для решения первой проблемы. Можно отметить анализ параметра Херста для случайных последовательностей, имеющих изначально фрактальное происхождение [1]. Мощный метод, основанный на идее вейвлетов, обобщающих традиционный Фурье-анализ [2 5]. широко используется в настоящее время для извлечения слабых сигналов из шумов. Недавно для анализа различных шумовых последовательностей и их качественного сравнения был предложен метод, развитый Р.М. Юльме-тьевым н его учениками [6 8]. основанный на записи уравнений Цванцига Мори для дискретных случайных последовательностей. Необходимо упомянуть также феноменологический метод флуктуационно-шумовой спектроскопии (ФШС), предложенный С.Ф. Тимашевым с соавторами [9 11]. который оказался весьма эффективным для детектирования необычного (аномального) поведения различных случайных последовательностей, таких, как перемежаемость, самоорганизованная критичность, и выявления всплесков и разрывов различного рода.

Однако внимательный анализ современных методов по «прочтению» различных случайных последовательностей показывает, что в настоящее время не существует «универсального» языка для количественного сравнения одной произвольной случайной последовательности с другой, обладающими различными статистическими характеристиками. Иными словами, в настоящее время не существует универсального способа сокращенного описания (редукции) и количественного сравнения для двух и более случайных последовательностей произвольной природы. которые обладают различным или близким статистическим «рисунком». Более того, все перечисленные выше методы обладают малой чувствительностью к детектированию малого сигнала с амплитудой ($) по отношению к величине уровня шума (^, особенно в случаях, когда S/N ^ 1.

Совсем недавно автором данной работы были предложены новые статистические методы, основанные на идее квантованных гистограмм [12. 13] и построении упорядоченных флуктуационных вилок (разбросов) [14, 15]. Эти новые методы доказали свою высокую эффективность при детектировании слабых сигналов, которые полностью скрыты внутри анализируемой случайной последовательности. Единственным недостатком этих новых методов является тот факт, что они являются неуниверсальными и «работают» достаточно избирательно, причем причины такой избирательности зависят от скрытого в случайной последовательности тренда, который сильно меняет статистический «рисунок» исходной последовательно-

сти и является неконтролируемым фактором, препятствующим детектированию слабого сигнала. Чтобы выработать более универсальные методы по детектированию сверхслабых сигналов (S/N ^ 1), необходимо вернуться к «азам» исходной математической статистики и постараться выработать методы, которые не «чувствуют» наличие тренда и могут быть применены в ситуациях, когда этот тренд присутствует или полностью отсутствует.

На первый взгляд может показаться, что такая задача неразрешима, так как каждая случайная последовательность имеет свой неповторимый статистический рисунок, н поэтому любые попытки найти универсальный количественный и редуцированный язык для её описания бессмысленны и заведомо обречены на провал. Однако внимательный анализ существующих методов позволяет сформулировать следующий парадоксальный вопрос: можно ли произвольную случайную последовательность преобразовать в детерминированную гладкую кривую, выбрав в качестве независимой переменной такой контролируемый параметр, по отношению к которому исходная случайность становится детерминированной? При этом предполагается, что детерминированная кривая может быть подогнана под некоторую аналитическую функцию и представлена количественно неким набором подгоночных параметров.

Чтобы получить аргументированный и положительный ответ на этот вопрос, необходимо внимательно проанализировать простейшие методы, принятые для анализа случайных последовательностей в традиционной математической статистике. Если быть достаточно строгим по отношению к попеку «универсального» языка, пригодного для описания произвольной случайной последовательности без каких-либо априорных предположений о её статистической природе, то можно сказать, что зачатки такого «универсального» языка в статистике существуют с самого начала её становления. Автор имеет в виду, прежде всего, традиционное использование среднего арифметического и дисперсии (т. е. первого и второго моментов). Но когда такое сравнение в терминах среднего и дисперсии оказывается явно недостаточным, логично было пойти дальше и использовать целочисленные моменты более высоких порядков. Но в силу каких-то необъяснимых причин набор целочисленных моментов более высоких порядков (строго говоря, начиная с пятого) в современной статистике оказался невостребованным.

В этой статье предлагаем потенциальному читателю познакомиться с основами статистики дробных моментов (СДМ), включающей в себя весь набор целочисленных моментов более высоких порядков в качестве частного случая. СДМ, использующая в качестве независимой переменной индекс момента, оказывается весьма эффективной при детектировании сверхслабых сигналов, полностью скрытых в исходном шуме, но каким-то образом модифицирующих исходный шумовой тренд. СДМ является универсальной и совершенно не зависит от априорных предположений, накладываемых обычно на исходный шум, включает в себя традиционную статистику, основанную на 4-х целочисленных моментах, и предоставляет уникальную возможность по унифицированному и редуцированному количественному сравнению произвольной пары случайных последовательностей, имеющих в принципе различное число случайных точек (N1 = N2). Случайные отличия или искажения могут быть выражены количественно в терминах подгоночных параметров для детерминированной функции обобщенного среднего (ФОС), вычисленной в пространстве дробных моментов. ФОС определяется соотношением ОД) = (лД) >

где ЛД определяет абсолютное значение момента порядка р для последовательности, образованной из N точек. Подгоночные параметры ФОС, найденные с помощью метода собственных координат (СК), могут быть использованы в качестве

универсального и редуцированного языка для сравнения произвольных случайных последовательностей различного объёма друг с другом. Статистика дробных моментов совместно с ФОС помогает найти универсальную калибровочную кривую. когда некоторые подгоночные параметры имеют монотонную зависимость по отношению к некоторому доминантному внешнему фактору. Этот фактор слегка возмущает исходную последовательность, которая предполагается свободной от присутствия внешнего «сигнала». Внешний фактор или «сигнал» может быть ассоциирован с концентрацией растворенной малой примеси, температурой, влажностью н любым другим внешним контролируемым фактором.

Практическое применение СДМ и ФОС было недавно реализовано в работе [16]. где калибровочная кривая, построенная с помощью нового метода, позволила повысить чувствительность стандартного лабораторного ПК спектрометра более чем на порядок величины по отношению к детектированию малой концентрации растворенной примеси. Как уже упоминалось ранее, в традиционной статистике высшие моменты практически не используются, хотя для определенных приложений моменты третьего н четвёртого порядков, выраженные в терминах асимметрии и эксцесса, оказываются востребованными [17. 18].

В этой статье хотим показать новые потенциальные возможности СДМ для «количественного» прочтения произвольных случайных последовательностей. Эффективность СДМ основана на применении ФОС. которая, в свою очередь, может быть аппроксимирована с высокой точностью некоторой аналитической функцией. содержащей конечное число подгоночных параметров. Следует отметить, что выбор этой функции не является произвольным: её вид следует из самой структуры построения ФОС. Эти подгоночные параметры можно рассматривать как своеобразные «отпечатки пальцев», которые позволяют количественно сравнить в терминах этих параметров произвольные последовательности друг с другом. СДМ свободна от каких-либо модельных (априорных) представлений о природе шума и поэтому методы, основанные на СДМ, могут быть с успехом использованы для извлечения слабых сигналов и построения искомых калибровочных кривых для выборок различного объёма. Увеличивая количество подгоночных параметров, всегда можно (если в этом есть необходимость) найти количественные отличия между двумя случайностями. Если эти различия несущественны, то всегда можно определить доверительный интервал, попадая в который две сравниваемые последовательности становятся уже «неразличимыми». Ниже будет показано, как «работает» СДМ для малых выборок, различающихся между собой всего на одну(!) точку. Для таких последовательностей традиционные методы статистики становятся уже неприменимыми. Интересно отметить также, что СДМ тесно связана с параметром неэкс-тенспвностп ц, входящим в определение обобщенной энтропии по Цаллису. В этом подходе обобщенная энтропия получает новое истолкование и может быть также использована для сравнения различных последовательностей.

Содержание статьи разбито на следующие разделы. В разд. 1 рассматриваются вопросы предсказуемости и стабильности случайных последовательностей, выраженные в терминах целочисленных моментов высоких порядков. В разд. 2 показано, как найти подгоночные параметры ФОС с помощью метода СК. В том же разделе даны определения комплексных моментов и ФОС на случай многомерных (имеющих более одного индекса) случайных последовательностей. В разд. 3 показана связь между ФОС и обобщенной энтропией по Цаллису. Это соотношение расширяет возможности неэкстенсивной статистической механики по истолкованию стохастических свойств различных последовательностей. Важное практическое приложение по статистической защите пластиковых карточек и других ценных документов от подделок рассмотрено схематически в разд. 4. Некоторые

модельные эксперименты, демонстрирующие мощь СДМ в извлечении сверхслабых сигналов (S/N = 10-2, 10-3) и в детектировании статистической близости различных распределений, рассмотрены в разд. 5. Некоторые проблемы, основанные на анализе реальных диэлектрических данных и построении искомых калибровочных кривых без конкретных знаний о природе физической модели, рассмотрены в разд. 6. Основные результаты и выводы статьи приводятся в разд. 7.

1. Оценка статистической устойчивости случайных последовательностей, основанная на целочисленных моментах произвольного порядка

Рассмотрим некий отрезок случайной последовательности образованной системой j = 1, 2,..., N точек, локализованной в полосе ymin < {yj} < ymax. Для некоторого множества N случайных точек абсолютный момент порядка p определяется выражением:

1 N

AN=^Y,ylr (D

j=1

Основная проблема может быть поставлена следующим образом. Пусть основ-

N

бавляется другой случайный набор к точек. Спрашивается, какому условию должен удовлетворять случайный набор к вновь добавленных точек, чтобы сохранить неизменнылш величины первых к моментов, изначально принадлежащих исходной последовательности?

Математически это условие можно записать в виде

1 fc 1 N

(2>

s = 1 j=1

где p = 1, 2,..., k.

Решение этой проблемы может помочь в предсказании статистической устойчивости исходной последовательности. В Приложении условие (2) и соответствующее решение рассмотрены более детально. Условие (2) эквивалентно решению соответствующей нелинейной системы уравнений для отыскания искомого набора

к

Р I Р I I Р

Vn+1 + Vn+2 + • • • + VN+k _ A (p)

к ~ N • W

Здесь p = 1, 2,..., к. Используя рекуррентное соотношение Ньютона [19]

pap + ap—iSi + ap-2S2 + • • • + ao Sp = 0, a о = 1, (4)

где Sp = E yN+j ■

j=1

Система уравнений (3) может быть сведена к нахождению корней следующего хара кт ер и cm и че ско го полинома

yk + aiyk 1 + • • • + ak-iy + ak = 0 (5)

для произвольных k < N. Для k < 4 эта система уравнений может быть решена

аналитически [20], для 5 < к < 100 - численными методами [21] с помощью ста-

бильных алгоритмов, для к > 100 необходимо разработать специальные методы

с целью увеличения стабильности и точности получаемых корней полинома (5). Поучительно привести решения для одной н двух добавляемых точек.

добавляемая точка должна совпадать со средним арифметическим исходной последовательности.

две добавляемые точки должны совпадать со значениями среднеквадратичных отклонений. отсчитанных от среднего значения. Поэтому выражения (6) и (7) могут быть истолкованы как условие нахождения предсказуемых точек, сохраняющих статистическую устойчивость исходной случайной последовательности.

Для аналитического анализа выражений, соответствующим трем и четырём добавляемым точкам, удобно использовать выражения для относительных момен-

д (1)

тов, отсчитанных от первого момента Аы :

Основываясь на результатах, полученных в Приложении, легко прийти к выводу, что система уравнений (3) в этом случае упрощается и принимает вид

Учитывая, что М1 = 0, легко получить упрощенные выражения для отыскания искомых корней.

Случай трех корней г =1, 2, 3 (к = 3)

Эти выражения допускают дальнейшее аналитическое исследование, так как соответствующие уравнения для безразмерной переменной и содержат только один (6) (к = 3) и два (6 и с) параметра (к = 4).

Для к > 4 величины уы +к находятся численно. Поэтому поведение к точек (уЫ +ь УЫ+2, ..., уы +к) становится полностью предсказуемым, если эти точки

к=1

(1)

уы+1 = ;

(6)

к=2

3=1

3 = 1

= мр.

(9)

(Ю)

Случай четырёх корней: г =1, 2, 3,4 (к = 4)

и4 — 6и2 — 6и — с = 0,

(Н)

удовлетворяют системе (3). Для того чтобы выразить все моменты в одних и тех же размерных единицах, полезно определить следующее выражение

i/p

r<(p) _

GN —

N

— УV-

дг А^уз

1/p

(12)

Это выражение служит определением функции обобщенного среднего (ФОС) [19]. зависящей от величины текущего момента р. Полезно отметить основные свойства выражения (12). Для р = —1 оно определяет гармоническое среднее

g(—1) —

GN —

N

-1

1

Л$

(13)

Для p = 0 выражение (12) совпадает с геометрическим средним

1/N

lim G'

p—Q

(P)

N

exp

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

N

^Elnfe)

j=i

N

— yj

3=1

(14)

р = 1

значения определяются из соотношений

lim gN — max(yi,y2, • • • ,yN) = max(y),

lim G

p—> — ж

N — min(yi, У2, • • •, yN) = min(y).

(15)

ФОС gN для положительных значений p является монотонной функцией, т. е.

G(t) < G(s) GN < gN

для t < S И (yj — 0),

(16)

Если набор (уу) является положительным, то выражение (12) можно легко

р

класс моментов и рассмотреть наряду с целочисленными моментами произвольные дробные моменты индекса р € (0, те). Если исходная выборка содержит также отрицательные значения, то в этом случае можно рассечь исходную последовательность па две положительные части в соответствии с определением

y

(p)

\ ІУо + Ы),

y

(n)

(Уз ~ \'Уз\) •

(17)

Если есть необходимость, то нули, содержащиеся в выражениях (17), могут быть удалены. До этого мы рассмотрели случай, когда к добавляемых точек были расположены справа от исходной выборки. По аналогии можно рассмотреть ситуацию, когда предсказание статистической устойчивости вызывается точками, расположенными в «прошлом», т. е. слева от исходной выборки. Но анализ уравнения (3) показывает, что можно провести автоматическую редукцию исходной выбор-к

выборки. Если хотим сохранить систему (3) вновь в качестве инвариантного усло-

к

точек примет вид

к

Л

(p),

N,

p

1, 2 • • •,&•

(18)

Система уравнений (18) формально тождественна системе (3). но с одним принципиальным отличием. Она сводит исходную выборку (ух, у2, • • •, уД) к новому набору статистически устойчивых точек, расположенных внутри исходной выборки. В частности, для к = 1 редуцированная точка совпадает со средним арифметическим (6); для к = 2 редуцированные точки - с относительной дисперсией, отсчитанной от среднего значения (см. выражение (7)). Поэтому для к =1, 2 этот подход подтверждает «интуитивное» сведение исходной выборки к двум статистически устойчивым величинам, выраженным в терминах первого и второго моментов. Для к = 3,4 уравнения (10) и (11) восстанавливают другие статистически устойчивые точки, которые используют естественное определение меры асимметрии и эксцесса [18].

Для к > 4 можно продолжить поиск возможных статистических различий между двумя сравниваемыми выборками, если набор первых четырёх величин, выраженный в терминах статистически устойчивых точек, оказывается недостаточным для этой цели.

к

мых из эквивалентного условия

особенно в случаях, когда набор к достаточно велик (к > 100). В этом случае необходимо разработать специальные методы для сравнения двух ФОС.

2. Приближенные выражения для ФОС. Дробные и комплексные

моменты

Для приближенного решения уравнения (19), когда значения к > 100, и для более полного сравнения двух различных ФОС оД] и оД (когда N1,2 отличны друг от друга) полезно найти аналитическое выражение (подгоночную функцию), которая может подогнать заданную ФОС с приемлемой точностью. Для того чтобы найти искомую аналитическую функцию, необходимо рассмотреть следующее выражение

Параметр 0у = (уу/утах), выражающий отношение амплитуды уу к максимальному значению, всегда меньше единицы. Поэтому выражение (20) может быть записано в виде конечной комбинации экспоненциальных функций. Коэффициент Ао отражает вклад величин уу, которые близки к максимальному значению (уу/утах) < 1; другие коэффициенты Ап соответствуют вкладу совокупности случайных амплитуд уу с отношением (уу/утах) ^ 1. Основываясь на выражении

(20), легко записать приближенное выражение для ФОС, определённое формулой

(19)

1 N £

— ^ехр [р 1п (0у)] = Лз + ^ Ап ехр(-Апр). (20)

П= 1

(12)

5

1/р

(21)

п=1

где ап = Ап/Ао. Формула (21) позволяет «прочитать» произвольную случайную последовательность в терминах редуцированных количественных параметров

(ап, Ап), включая также площадь под кривой (ППК) оД и величину утах. Для вычисления заданных подгоночных параметров (ап,Ап) (п = 1, 2,. ..,в) можно использовать метод собственных координат (СК), который позволяет представить функцию (20) в виде совокупности прямых линий и найти значения подгоночных параметров, соответствующих глобальному минимуму. Не вдаваясь в детали этого эффективного метода, достаточно полно представленного в работах [23 25]. можно записать только основное линейное соотношение (ОЛС) для функции у8(р), содержащей три экспоненциальные функции (в = 3). Многочисленные модельные расчёты показывают, что при практическом применении выражения (21) для достижения приемлемой точности число различных экспонент не должно превышать трёх или четырёх. К примеру, ОЛС для трёх-экспонепциальпой функции (в = 3) может быть записано в виде

6

У (р) = Е X, (р). (22)

9=1

Здесь

У(р) = -<•••>,

- с ^

Х1(Р) = / — <• • •> , О1 = А1 + А2 + А3,

Ро = 1

- ( , (23)

А'г(р)= / (р — и) — <•••>, С2 = — (А1А2 + АхАз + А2А3),

-0 = 1

х3(р) = ± / (р-иуР^Ыи- (•••), С3 = А1А2А3.

Р0 = 1

Х4(р)= р3 -<•••> ,

Хб(р)= р2 -<•••>, (24)

Х6(Р) = р - <• • •>.

Величины О4, О5, Сб содержат неизвестные значения производных в начальной точке у3г)(р0) (г = 3, 2,1) и несущественны для расчета искомых корней {Аг} (г = 3, 2,1) методом наименьших квадратов (МН К). Символ < ... > в (23)—(24) определяет соответствующее арифметическое среднее, которое вычитается из соответствующей функции У(р), Х9 (р) для того, чтобы обеспечить основное требование < £ >= 0 метода МНК [26]. Неизвестные константы Ап (п = 0,1,...,в) также находятся методом МНК из соотношения (20). Здесь уместно подчеркнуть следующие важные достоинства ФОС, которые могут найти широкие применения при анализе случайных последовательностей различной природы:

а) Приближенное аналитическое выражение (21) обеспечивает «универсальную» количественную редукцию произвольной случайной последовательности к

Ап Ап утах

б) Вычисленные подгоночные параметры позволяют разделить амплитуды слу-

уу

п Ап Ап

ному) описанию рассматриваемой случайной последовательности.

в) В случаях, когда объём выборки достаточно велик (М > 100), такое редуцированное представление становится достаточно информативным по отношению

к некоторому внешнему фактору по сравнению с численной оценкой к корней системы уравнений (18). Для этого случая (М > 100) целесообразно подогнать и сравнить исходную функцию О^ с ок—), входящую в выражение (19) отдель-

Ап Ап

Сравнеиие высших моментов, формирующих две случайные и различные выборки (к = М), является более точным. При к =1, 2 получаем общепринятое сокращенное описание, выраженное в терминах среднего арифметического и стандартного отклонения. Но такое «общепринятое» описание, выраженное величинами только целых моментов Дх, Д2 , может оказаться неудовлетворительным для статистического разделения случайных последовательностей в большинстве случаев.

г) Численные расчеты показывают, что представление О^ по отношению к ОД является весьма информативным при сравнении случайных последовательностей. Если две случайные последовательности статистически близки друг другу (в смысле совпадения совокупности моментов), то зависимость О^ (О^) в про-р

едииице, и отсечкой, близкой к пулю. Возможные отклонения от этого простого критерия дают возможность детектировать нечто «странное» (присутствие сигнала или изменения прежнего статистического поведения) в сравниваемых статистических последовательностях. Примеры применения такого удобного представления рассмотрены в разд. 6. Этот простой анализ помогает в детектировании самоподобных (фрактальных) компонент, если они присутствуют в анализируемой случайной последовательности.

Допустим, что существует отрезок некоторой последовательности, амплитуды которого по отношению к сравниваемой последовательности приближенно удовлетворяют следующему равенству

— — А, (А^1), /• / 1.....1/. (25)

ит

Для такого отрезка легко показать, что две ФОС становятся пропорциональными друг другу, т. е.

О(у)м-г+1 = АО(м)м-г+1- (^)

Условие (26) расширяет понятие корреляции, введенное Пирсоном [26], и помогает обнаружить отрезок случайной последовательности, обладающий самоподобным (фрактальным) поведением. Интересно отметить, что самоподобное поведение идентифицируется для многих случайных последовательностей, если они должным образом упорядочиваются и представляются в виде ранжированного графика [15]. Смотри ниже выражение (34), которое может быть использовано в качестве «универсальной» подгоночной функции для распознавания фрактального поведения, скрытого в случайных последовательностях, имеющих различную статистическую природу.

Уравнение (26) позволяет определить статическую близость двух сравниваемых последовательностей. Если две последовательности имеют соответственно N1,2 случайных точек и в пространстве моментов удовлетворяют условию (А = 1 и Ь - две произвольные константы)

О(Р1 = АО(р2 + Ь (^

то такие две последовательности могут быть определены как статистически близ-

А

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ь = 0, то такие два отрезка могут быть определены как самоподобные (коррелиро-

А Ь р

такие две последовательности могут быть определены как статистически различные друг другу.

д) «Универсальное» описание последовательностей с помощью ФОС можно обобщить не только на действительные, но н на комплексные значения величины р. Такое двумерное обобщение может быть полезным для выявления более тонких различий, присутствующих в одномерных последовательностях. Когда параметр р выражается комплексным числом р = и + ¿V, то ФОС (12) преобразуется в поверхность вида

После некоторых алгебраических преобразований действительная и мнимая части ФОС могут быть представлены следующими соотношениями

(29)

¿=1

Ие ^^(м, V) = ехр (м, V)] 008 [Ф(м, V)] , Іт ^^(м, V) = ехр [^(и, V)] 8Іп [ф(и, V)];

(30)

Ф(и, V)

V ■ 1п І^Сі(гМ’) + <3|(гл, г?)] ^ и . г,)

1 ^

(Зі(и, V) = 1п — ^ (УзТ сов (г’ ' МЫ) = 1п {Мс{и, V)),

¿=1

1 ^

<32(ад V) = 1п — ^ (ад)" 8И1 (г> • 1п(ад)) = 1п (М8(ад г)),

¿=1

Последняя группа выражений требует специального исследования, чтобы выявить такие ситуации, когда применение комплексных моментов является оправданным и информативным.

о) Определение (12) допускает дальнейшее обобщение для двумерных последовательностей: .

N1 N2

С(р, д) =

1

»1», ^ ^ -л* л=1 ¿2 = 1

(32)

Эта поверхность может быть проанализирована аналогично выражению (12). если заменить одномерный параметр р на р+д. Для многомерных последовательностей, имеющих т различных компонент, по аналогии с выражением (32) можно записать следующее выражение

1 N1 N2 Nm т

ЕЕ---Е (^

л = 1 ¿2 = 1 = 1

Е р.

(33)

В работе [15] была идентифицирована некая «универсальная» функция, которая описывает распределение случайных точек в широком классе случайных последовательностей. Это распределение соответствует огибающей упорядоченных амплитуд (определяемых как ранжированный график), получаемой для детрендп-рованных (т. е. ие имеющих выраженного тренда) случайных последовательностей и имеющих относительно большую выборку случайных точек (Ж > 1000). Были проанализированы множества реальных последовательностей (медицина, метеорология, экономика и пр.) и было показано, что огибающая упорядоченных амплитуд (ранжированная последовательность) описывается функцией

у(*)= А1Г1 + А2Г2. (34)

Вычисленные подгоночные параметры этой функции (А^(/), А^(/), VI (/), ^(/)) по отношению к некоему внешнему фактору (/) могут быть проанализированы в терминах целых моментов (уравнение 5)) или с помощью ФОС (12). С ДМ, основанная на использовании высших (дробных) моментов, может быть использована для построения калибровочных кривых, которые применяются для детектирования значимого подгоночного параметра, характеризующего произвольную случайную последовательность (содержащую возможный тренд) по отношению к контролируемому внешнему фактору (концентрация добавки, величина внешнего поля, температура, давление, рН-фактор и т. д.). Здесь уместно вновь подчеркнуть, что СДМ не использует никаких модельных представлений, основанных на традиционных представлениях гауссовской статистики и её модификациях. Необходимо отметить также, что возможные приложения СДМ основаны на соотношении между идентифицированным числом добавленных точек (к) и исходным объёмом выборки (N). Если число различимых точек ограничено (к/Ж ^ 1), то количественная схема, основанная на вычислении ограниченного числа целых моментов в соответствии с формулами (6) (11), является вполне приемлемой. Если же необходимо сравнить большие выборки (к/Ж < 1, N ^ 1), когда значительный набор начальных моментов близок друг к другу, то подход, основанный на приближенном вычислении ФОС (21) с последующим вычислением подгоночных параметров с помощью метода СК, является наиболее предпочтительным. Иногда для построения искомой калибровочной кривой достаточно использовать соотношение (27), а затем взять ППК в качестве количественного параметра, вычисленного для относительной разности ^N2 — ^N1) /С^ • Примеры такого упрощенного подхода при детектировании внешнего фактора рассмотрены ниже в разд. 5.

3. Связь дробных моментов с выражением для неэкстенсивной

энтропии

Вернемся вновь к рассмотрению отрезка случайной последовательности как некоего набора j = 1, 2,..., N точек, локализованных в полосе ymin < {yy} < ymax ■ Для этих N случайно расположенных точек абсолютное значение величины момента порядка p определяется более общим выражением

N

ДР =Е Wj yp, (35)

j=1

где значения wy - дискретный набор априорных вероятностей, удовлетворяющих

стандартному условию нормировки

N

Ewj =1 (36)

y=i

ФОС, определённая ранее выражением (12), принимает следующий вид

1/p

N

j

j=1

I>J

- (Д<?01/Р. (37)

Последнее выражение позволяет получить выражение для обобщенной энтропии, предложенной Цаллисом [27 30]

т

1 - Е ^ -

= —кв—-------= -кв^-(38)

1 - д 1 - д

Здесь аду определяет некий набор вероятностей, характеризующих часть отрезка случайного ряда, параметр д определяет величину неэкстенсивного параметра, кв постоянная Больцмана.

Для того чтобы получить изящное выражение для неэкстенсивной энтропии, которое могло быть применимо для описания случайной последовательности произвольной природы, необходимо определить более точно выражение для набора вероятностей аду, связанных с неким отрезком случайной последовательности. Любая случайная выборка может иметь положительные или отрицательные значения случайных амплитуд, сосредоточенных в полосе ут;п < {уу} < утах- Вначале определяем две случайные, но положительные последовательности, рассчитанные относительно модуля |уу |

= \ (Уз + Ы), УУ = ~\ ('Уз ~ \Уз I) • (39)

Допустим, что числа точек для этих случайных последовательностей определяются, соответственно, величинами М± , подчиненными уеловию: = N.

Для этих N случайно локализованных точек вероятность появления случайной амплитуды уу может быть естественно определено выражениями

_ Уу+} _ _ У w3 - да- w3 ~ si-)’

.+ — -1— ...і — —I— (40)

где суммы

*(±’ = £ #’

¿=1

выбраны таким образом, чтобы обеспечить нормировку каждой вероятности из

(40) па единицу.

Снова вернемся к выражению (38). С учетом априорных вероятностей, определенных выражениями (37), функция ^ может быть переписана в виде

¿=1

»

(41)

Здесь новый индекс в определяет, соответственно, положительную и отрицательную (в = ±) ветви случайной последовательности. Сравнивая сумму в последнем выражении с определением высших моментов (35) и вероятностями из определения (40), можно установить искомое соотношение между фактором неэкстеисивиости д и величиной дробного момента порядка д — 1:

(*("’)

9-1

(.)

¿=1

9-1

1

(*(я):

-у Д(9Г)1) = Д(9Г)1).

9-1 ((з) ((з)

(42)

Последнее выражение справа справедливо для нормированных случайных последовательностей у^я) =^ у^я)/*(я). Используя похожие математические выкладки, приведшие к выражению (20), можно получить следующее выражение

М

*?’ = £

¿=1 т

ад^- ехр

аду ехр

— (д — 1)1п

1

¿=1

А

(«)

Е4

п= 1

ехр

— (д — 1) а(8

(43)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Можно дать следующую интерпретацию выражению (43). Обычно для характеристики некоторой случайной последовательности используются арифметическое среднее и величина стандартного отклонения. Но как было показано выше, эти величины являются приближенными и справедливы только для первых двух моментов (7) с двумя добавленными точками. Но, как показывает новая статистика, для характеристики случайной последовательности можно использовать класте-ризационную интерпретацию. В соответствии с этой трактовкой случайные амплитуды, имеющие примерно одинаковые величины априорных вероятностей, могут быть сгруппированы в кластеры. Если вероятность некоторой группы кластеров близка к единице ад^8’ = 1, то их вклад характеризуется амплитудой А0я). В другом предельном случае, когда вероятности некоторых амплитуд близки к нулю (Ця) = 0), то вклад этой к-й последней кластерной группы в выражении (43) ста-

(5)

повится пренебрежимо малым, т. е. А^ = 0. Друг ие промежуточные кластерные группы (п = 1, 2,..., к — 1) с вероятностью А(я) = 1п ^1/ад(я)^ будут ранжированы

(8)

между этими двумя предельными кластерами с амплитудами , определяемыми

методом СК. Другими словами, произвольная случайная последовательность имеет свою неэкстенсивную энтропию, характеризуемую величиной д, совпадающей с величиной (д — 1) момента, и сгруппированную в соответствии с кластерами, каждый их которых характеризуется величиной Л(я) = 1п ^1/и(я) ^ и А(я). Если все («)

значения иг в последнем выражении строго положительны, то значения д определены в интервале (—то <д — 1 < го). Если для некоторых кластеров и^ = 0

д

локализованы в интервале (1 < д < то ). Принимая во внимание выражение (43), формула (38) для обобщенной неэкстенсивной энтропии принимает следующий вид

5(±)

9

1 - Е

-кв

У=1

і - д:

(9-1)

1-

А0±) + Е ехр - (ч - 1) А.

|(±)

П=1

а±)

. (44)

Случайная последовательность может быть охарактеризована определенным набором параметров лП±) . Эти параметры, как следует из (44), имеют

те же самые значения дробного момента, что и для энтропии Цаллиса. Число кластеров п может быть идентифицировано методом СК. Поэтому энтропия Цаллиса получает дополнительное истолкование и может быть использована для описания

д

кализован в интервале 1 < д < то . Предельное значение энтропии (44) при д =1 определяется стандартным выражением

^(±)

N

-кв^Г

У = 1

иу ІП (иу

(45)

4. Статистическая защита ценных документов

Как хорошо известно, надежная защита денежных банкнот, пластиковых карточек, картин, старинных манускриптов и прочих ценных документов от их подделок мошенниками представляет собой серьёзную проблему в современном мире. Не вдаваясь в её детальный анализ, в этом разделе рассмотрим схематически возможное приложение метода СДМ для статистической защиты некоторой поверхности, которая должна быть надежно защищена от подделки (возможного копирования).

Предположим, что поверхность на рис. 1. представляет собой поверхность пластиковой карточки и случайные точки (отмеченные крестиками), нанесенные с помощью специальной маски, представляют собой некую статистическую защиту этой поверхности. Технология нанесения этих точек здесь не обсуждается, так как представляет собой отдельную и нетривиальную задачу. Число маркированных точек, равное 40, и место их локализации на заданной поверхности составляют некую конфиденциальную информацию. Существует некий потенциальный «мошенник», который хочет создать фальшивую карточку и тем самым заменить ею настоящую. Допустим, что он информирован о месте нанесения защитных точек и даже знает точное их число. В этом случае специальное устройство, «настроенное» на чтение истинных точек, легко распознаёт фальшивую карточку, ориентируясь на

Ж True points • False points

X Side

Рис. 1. Воображаемая поверхность пластиковой карточки, содержащая 40 истинных точек. отмеченных звездочками, и 40 имитированных (фальшивых) точек, отмеченных черными кружочками

тот факт, что моста нанесения истинных и фальшивых точек различаются между собой. Эти отличия легко детектируются в пространстве коэффициентов характеристического полинома и по числу отличающихся между собой корней. Эти различия показаны, соответственно, на рис. 2 и 3.

Допустим теперь более серьёзную ситуацию, когда потенциальный мошенник знает локализацию на поверхности всех истинных точек, за исключением одной. Эта возможная ситуация представлена на рис. 4. Возможно ли отличить статистическое различие всего в одну точку в данной ситуации? Ответ на этот вопрос является положительным н представлен на рис. 5 и 6. Вновь, как и в первом случае. можно эмпирически определить порядок характеристического полинома, который выявляет это различие. В рассматриваемом случае он равен 20. Появление комплексно-сопряженных корней делает эти различия особенно яркими. Если эта случайная последовательность отбирается как выборка из более расширенной совокупности и детектор, настроенный на «чтение» истинной карточки, «знает» объём выборки, отобранный для распознавания, зависящий от других случайных, но управляемых факторов, то подделка такой карточки становится попросту невозможной. Эта простая идея, лежащая в основе статистической защиты, для осуществления её в реальности естественно нуждается в определенной модификации и адаптации и может быть использована в совокупности с другими мерами защиты, используемыми для защиты ценных документов.

Интересно сравнить первый подход, основанный на вычислении искомых корней характеристического полинома (о), с вычислением ФОС. связанной с расчетом подгоночных параметров, фигурирующих в выражении (30). Результаты расчета подгоночной функции для второго случая, когда случайные последовательности различаются всего на одну точку, представлены на рис. 7.

Order of characteristic polynomial

Рис. 2. Показано качественное различие между двумя характеристическими полиномами. построенными при разных коэффициентах, вычисленных по формуле (4). Порядок характеристического полинома в этом случае равен 19

Number of roots (19)

Рис. 3. Различие между коэффициентами двух полиномов (рис. 2) становится более заметным. если вычислить 19 корней этих полиномов. Эти различия показаны стрелками. В результате расчетов могут появиться «пефизические» комплексные корпи. В этом случае они могут быть использованы для сравнения, так как численная программа, применяемая для их расчета, одпа и та же самая для обоих случаев

Ж TR • FL

X side

Рис. 4. Попытка потенциального мошенника имитировать все защитные (истшшые) точки. за исключением одной, показанной стрелкой. Возможно ли различить две случайные последовательности, отличающиеся всего лишь одной точкой?

Этот важный результат показывает, что случайные последовательности (отличающиеся всего на одну точку!) могут быть (если в этом есть необходимость) отделены друг от друга и. следовательно. ФОС может быть использована в качестве весьма чувствительного детектора для количественного «прочтения» и последующего разделения случайных последовательностей самой различной природы в терминах подгоночных параметров An и Ап.

5. Модельные эксперименты

5.1. Детектирование преобладающего фактора (сверхслабого сигнала). Проблема детектирования сверхслабых сигналов, когда амплитуда возможного сигнала (S) меньше, чем средняя амплитуда шума (N) (S/N < 1), является важной при анализе случайных последовательностей. Не вдаваясь в детальное обсуждение этой проблемы, покажем, как использовать ФОС для детектирования искажений, вызванных влиянием некоторого малого преобладающего фактора. Рассмотрим некий случайный модельный шум, имеющий равномерное распределение, с амплитудами, локализованными в интервале ni« £ [0,1]. Число точек равно j = 1, 2,..., N (N = 400), перемени ая локализована в интервале [0, 10.0].

К этому начальному шуму добавляем сигнал с малой амплитудой a £ [0.01, -0.1], выраженной в виде функции sin2(Q • Xj) (Q = 1). Математическая схема этого численного эксперимента может быть выражена в виде

nsj = nrnj (1 + a sin2(Qxj)).

(46)

Order of characteristic polynomial

Рис. 5. Этот рисунок дает утвердительный ответ и показывает, что искомое различие может быть выявлено па коэффициентах сравниваемых полиномов (в этом случае порядок полинома равен двадцати). Как видно из этого рисунка, исходное различие в одну точку порождает в этом представлении 7 различных коэффициентов! Порядок полинома находится эмпирически

Number of roots

Рис. 6. Различия, представленные па предыдущем рисунке, становятся более явственными, если вычислить корпи этих полиномов. Как и ранее, комплексные корпи выявляют наибольшие различия, которые порождаются всего лишь одной точкой (!), показанной па рис. 4

Number of moments

Рис. 7. Для случайных последовательностей, представленных па рис. 4. можно рассчитать ФОС и подогнать её по формулам (21) (23). Подгоночная функция содержит три экспоненты и соответствующие параметры равны (в скобках даны величины, соответствующие «фальшивой» функции): Лх = 0.5127 (0.4886), Л2 = 0.1740 (0.1765), Аз = 0.0631 (0.0876), Ах = -0.6983 (-0.6959), А2 = -0.2546 (-0.2548), Аз = -0.0921 (-0.0920). Эти величины могут быть использованы в качестве универсальной количественной меры для дифференциации двух близких последовательностей

Так как амплитуда добавленного сигнала очень мала, то сигнал визуально не может быть обнаружен, как это видно из рис. 8. Проблема может быть сформулирована следующим образом: возможно ли обнаружить влияние малого преобладающего фактора, который изначально выражен в виде функции ~ в1п2(Пж^), а затем выразить в форме возрастающей функции /(а) по отношению к монотонному изменению амплитуды а?

Для того чтобы найти искомую зависимость (которая может быть определена как калибровочная кривая), мы выполнили следующую процедуру:

1. В соответствии с определением (12) были вычислены ФОС. соответствующие исходному шуму и шуму, модифицированному малым сигналом. Наиболее удобным представлением для выявления влияния малого фактора является зависимость

N (содержащий возможный сигнал) против Со, N (ФОС для сегмента без сигнала), вычисленного в пространстве моментов. Рис. 9 показывает монотонное

а

сигнала N от функции С0, N, соответствующей «чистому» шуму.

2. Для того чтобы выразить эти монотонные изменения количественно в зави-

а

x

j

Рис. 8. Изображены две случайные последовательности. Одна (отмеченная серым цветом) содержит малое возмущение (сигнал) с амплитудой а = 0.07. Визуально присутствие сигнала незаметно. Необходимы специальные методы для выявления таких малых возмущений. Присутствие сигнала может быть замечено с помощью ФОС, вычисленной и представленной особым образом в пространстве дробных моментов

ванной относительной разностью

ЭД = (а^ - 4^)/ а^.

(47)

Величина ППК (5), вычисленная для функции .О(р), показана на рис. 8. Эта кривая, отражающая монотонное поведение фактора 5(а), может быть использована в качестве калибровочной кривой.

На практике трудно ожидать, что начальный «шум» и шум, искаженный присутствием малого сигнала, совпадают друг с другом. Поэтому с самого начала необходимо сравнить две случайные последовательности, а лишь после того «подозрительную» последовательность, искаженную присутствием сигнала (внешнего фактора). В качестве начального шума мы выбрали шум, подчиняющийся равномерному распределению. Калибровочная кривая, вычисленная для этого случая, показана на рис. 10. Она сдвинута по сравнению с идеальным случаем, когда исходный шум двух случайных последовательностей идентичен друг другу. Аналогичным образом мы рассмотрели случаи, когда амплитуда сигнала (а) в десять раз меньше и сосредоточена в интервале (0.001, 0.002, ..., 0.01). Все возможные ситуации математически могут быть выражены в виде

пв(ж') = пті(х') + а эт2 (Пж' + Ф (ж')) ехр

(ж' - (ж))

ПІП2 (ж' ).

(48)

а

G0.0

G0.01

G0.02

G0.03

03 H-----1----1----1----1----1----1----1----1----1----1----1----1----1----г-

0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

GMV0(p)

Рис. 9. Показана начальная стадия детектирования слабого возмущения. Возможные искажения. вызванные присутствием малого сигнала, могут быть обнаружены па графике против . Основной график образует прямую линию с единичным

наклоном и отсечкой, равной пулю. Малые возмущения вызывают вариацию этих параметров. Если внешний фактор (в этом конкретном случае величина амплитуды малого сигнала) вызывает монотонные искажения, то искомая калибровочная кривая может быть вычислена

Здесь nini, 2 (xj ) и Ф(х ) - случайные различные функции, экспоненциальная функция указывает па степень локализации малого сигнала. Вычисления функции (48) показывают, что, несмотря на малую величину амплитуды a G [10 3,10 2], возможно вычислить калибровочную кривую при различном влиянии таких факторов, как П, а и произвольном выборе функций nini,2(xj) и Ф(х5-). Соответствующие калибровочные кривые показаны па рис. 11с необходимыми пояснениями, приведенными в подписи к этому рисунку. Проведенные расчеты показывают, что локализация искомого сигнала (зависящая от величины а) и монотонное поведе-

a

при построении калибровочной кривой. Эти наблюдения, полученные на модельных данных, должны быть приняты во внимание при обработке реальных данных, когда необходимо «поймать» влияние малого внешнего фактора, полностью скрытого внутри анализируемой случайной последовательности.

5.2. Детектирование статистической близости. Статистика дробных моментов, выраженная в терминах ФОС, предоставляет уникальную возможность сравнить различные распределения и оценить их статистическую близость друг другу. Если для двух случайных последовательностей часть целых моментов (р = 0,1,..., к) близка друг другу (смотри определение (27)), то такие последовательности, представленные зависимостью G^1 gN , представляют собой прямую

Statistically close noise

20-

Identical

£ 15-

noise

O

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

<D

■o io-

to

<D

< 5‘

0-

0.00

0.02

0.04

0.06

0.08

0.10

Amplitude

Рис. 10. Показана заключительная стадия детектирования малого монотонного возмущения. Чувствительным фактором может служить величина ПИК, вычисленная для от-

рассчитать искомую калибровочную кривую. Нижняя кривая соответствует идеальной ситуации: исходный шум в обоих случаях один и тот же. Верхняя кривая соответствует более реалистическому случаю: исходные шумы различны, по подчиняются одному и тому же (равномерному) распределению

линию. К примеру, рис. 11 демонстрирует статистически близкие последовательности. Если распределения случайных точек различны, то можно ожидать, что их «статистические рисунки», выраженные в форме ФОС, также должны быть различными. Рис. 12 иллюстрирует эту идею, выраженную в виде функции (за~

висимость построена для нормального распределения), против ФОС, рассчитанных для других распределений. Как можно видеть из этого рисунка, поведения совокупности моментов для различных распределений разительно отличаются друг от друга. Результаты этого предварительного анализа могут быть использованы для обнаружения малого преобладающего фактора в тех случаях, когда его влияние изменяет исходное распределение.

Изначально на основе сыворотки новорожденного теленка (фирма «Сигма Олдрич» ) были приготовлены образцы с различной концентрацией глюкозы: 100 тМ,

10 тМ, 1 шМ, 0.1 тМ, 0.01 шМ, 0.001 шМ и 0.0001 шМ (концентрация даётся в

миллимолях). Диэлектрическая проницаемость образцов сыворотки была измерена при температуре 25° С в диапазоне частот 2.108 ^ 2.1010 Нг с использованием НР диэлектрического спектрометра. Для каждой пробы с заданной концентрацией глюкозы было проведено 20 идентичных измерений. Типичные зависимости комплексной проницаемости Ие (є) и Іт (є) от логарифма частоты для чистой

сыворотки без примеси глюкозы показаны на рис. 13. Проблема может быть сфор-

посителыгой разности

Именно вариации этой площади помогают

6. Обработка реальных данных

О

ZD

<

1.4

1.2

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

-1.2

-1.4

-1.6

-1.8

-2.0

-2.2

-2.4

-2.6

AUC-6

AUC1 AUC2 AUC3 -O— AUC4 -a— AUC5 ----AUC6

~T~

“Г

T

~r

~T~

~r

0.000 0.002 0.004 0.006 0.008 0.010

The value of the amplitude

Рис. 11. Здесь показаны различные калибровочные кривые, полученные из выражения (48). Кривая AUC-1 соответствует случаю: (nin,2(xj) = exp [(xj — (x))2 /а] = = Ф(xj) = 1); кривая AUC-2 (nin2(xj) = exp [(xj — (x))2 /а] = 1, Ф(xj) совпадает с равномерным распределением); кривая AUC-3 (nin2(xj) = Ф^) = 1, а = (x)2); кривая AUC-4 (nin2(xj) = Ф^) = 1 а = 1); кртая AUC-5 (exp [(xj — (x))2 /а] = Ф(xj) = 1, nin2(xj) совпадает с нормальным распределением): последняя кривая AUC-6 соответствует тому же набору параметров, что и кривая AUC-5, по число случайных точек в десять раз больше, N = 5000. Для всех остальных кривых, за исключением AUC-6, П = 1, N = 500

мулирована следующим образом: возможно ли вычислить калибровочную кривую без привлечения модельных представлений (при отсутствии информации о подгоночной функции) к такой сложной системе, как смесь сыворотки с глюкозой?

Эта проблема может быть решена в рамках метода СДМ при условии, что добавляемая жидкость (глюкоза в нашем случае) просто монотонно сдвигает изначальную кривую и не взаимодействует химически или физически с исходным базовым компонентом (сывороткой). Чтобы увидеть визуально возможные искажения в спектре, обусловленные добавлением глюкозы, удобно вычислить вторые базовые относительные моменты для величин Ие (е) и 1т (е) по формулам

Ф (Re (е))

M

M

Ф (Im (е)) =

M

m= 1

(49)

M

2

1

2

GMV-Gauss

Рис. 12. Этот рисунок иллюстрирует тот факт, что случайные последовательности, принадлежащие различным распределениям, могут быть визуально отделены друг от друга, если представить их в пространстве дробных моментов. Здесь все случайные последовательности, принадлежащие различным распределениям, нормированы в интервале [0,1]. Все дробные моменты вычислены в интервале [0.1, 200] с шагом кр = 0.4. Обозначения соответствуют следующим распределениям: «ОСвЬ», «ОСв2» нормальные распределения со средним значением, равным 0.5, и единичной дисперсией: «Оип!» соответствует равномерному распределению в интервале [0.01,1]; «01^а» соответствует бета-распределению с параметрами а = 0.1 и Ь = 0.5; «БЬпт» - это биномиальное распределение с т = 50 и р = 0.5. Можно заметить, что это распределение близко к нормальному. «Оехр»

- экспоненциальное распределение с параметром А = 50; «Dgam» описывает гамма-распределение с параметром в = 50; «Вро1в» - распределение Пуассона с в = 25; «Бл^Ы» -распределение Вэйбулла с параметром ад = 15. Анализируя этот рисунок, можно сказать, что каждое распределение имеет свой неповторимый статистический рисунок

Базовые относительные моменты определены в работах [15, 16]. Здесь индекс т означает номер текущего измерения, индекс М соответствует полному числу измерений (в нашем случае М = 20).

Рис. 14 и 15 показывают частотное поведение вычисленных значений относительных флуктуаций. Их визуальный анализ показывает, что эти функции располагаются .монотонно по отношению к различным концентрациям глюкозы. Этот факт позволяет разделить эти функции в пространстве моментов. Рассматривая каждую функцию как случайную последовательность и осуществляя ту же численную процедуру, описанную в разд. 6. можно вычислить искомую калибровочную кривую. Для этого случая достаточно рассчитать ППК для относительной разности О(р), определенную выражением (47). Соответствующие калибровочные кривые, вычисленные для действительной и мнимой частей относительных моментов второго порядка, показаны на рис. 16. Можно заметить, что эти кривые являются монотонными кривыми, но они не могут быть подогнаны под прямую линию,

1п(ю)

Рис. 13. Типичная кривая, демонстрирующая поведение комплексной восприимчивости измеренная для такой сложной жидкости, как сыворотка новорожденного теленка при (Т = 250 С). Эти кривые (если их подгоночная функция неизвестна) могут быть рассмотрены как случайные кривые. Другие кривые, измеренные для различных концентраций глюкозы, не показаны, так как они весьма близки друг другу

потому что эффект разделения, представленный на рис. 14 и 15. не является равномерным..

СДМ предоставляет новую возможность для проверки устойчивости и статистической близости различных измерений, полученных с помощью разных экспериментальных приборов. Кроме того, метод СДМ позволяет рассмотреть каждое измерение как некое уникальное «действие», а затем выразить результат каждого измерения количественно в терминах ППК с использованием выражения (47). Такого рода зависимости могут дать дополнительную информацию при анализе различных измерений. В частности, можно оценить более точно в пространстве моментов области неопределенности и рассмотреть распределение отклонений, полученных в течение всего эксперимента. Соответствующие зависимости ППК от номера измерения (ш = 1, 2,..., 20), полученные для чистой сыворотки и раствора с концентрацией глюкозы (с = 102), представлены на рис. 17.

7. Основные результаты

В этом разделе можно вкратце сформулировать основы статистики дробных моментов (СДМ), которая, несомненно, найдет широкое применение при количественном сравнении случайных последовательностей различной природы.

1. Набор величин высших моментов, которые оставляют неизменными величину начального отрезка случайной последовательности (условие (2)), позволяет по-новому оцепить и сравнить стабильность и близость случайных рядов и вы-

іп(ю)

Рис. 14. Набор кривых, соответствующих второму относительному моменту, вычисленных для Ие (е). Концентрация глюкозы монотонно увеличивается от верхней кривой к пижпей. Правда, следует отметить, что это увеличение неравномерное

1п(ю)

Рис. 15. Набор кривых, соответствующих второму относительному моменту, вычисленных для 1т (е). Как и на прежнем рисунке, концентрация глюкозы монотонно и неравномерно увеличивается от верхней кривой к пижпей

Log(c)

Рис. 16. Две калибровочные кривые. рассчитанные для ППК. изображенных па рис. 14 и 15. Эти кривые в силу неравномерности их возрастания не могут быть подогнаны под прямую лилию

разить эти характеристики в терминах целых (к ^ Ж) или дробных моментов (к = N ^ 1). Это условие в общем виде выражается соотношением (27).

к

кальной чувствительностью и помогают детектировать одну (!) «чужую» точку, которая различает две сравниваемые последовательности. Примеры по использованию такой чувствительности рассмотрены в разд. 4.

3. ФОС, определенная выражением (12). помогает преобразовать случайную последовательность в детермииироваииую функцию (21). Подгоночные параметры этой функции помогают сравнить количественно две случайные последовательности друг с другом. Это важное достоинство метода С ДМ, несомненно, найдет широкое применение при расчете различных калибровочных кривых и в анализе случайных последовательностей самой различной природы.

4. Целочисленные моменты могут быть легко обобщены на дробные и даже комплексные моменты, что позволяет расширить возможности новой СДМ в целом.

5. СДМ тесно связана с выражением для неэкстенсивной энтропии (44), что, несомненно, расширяет границы этого определения и помогает оценить количественно стохастические (энтропийные) свойства произвольной случайной последовательности с помощью набора дробных моментов.

6. Поучительные примеры, рассмотренные в этой статье, должны убедить потенциального читателя в преимуществах метода СДМ, которая позволяет решить некоторые новые проблемы: 1) дифференцирование статистической устойчивости и её возможное предсказание: 2) количественное сравнение различных случайностей между собой: 3) установление связи между ФОС и различными распределениями: 4) количественное детектирование влияния некоторого внешнего доминантного фактора (малого сигнала).

m (Number of current measurement)

Рис. 17. Анализ каждого набора повторяющихся измерений, осуществляемого с помощью ФОС и последующего расчета ПИК. позволяет пайти область неопределенности (па рисунке она заключена в рамку) заданного числа измерений и получить, таким образом, дополнительную и уникальную информацию об особенностях измерительного прибора, участвующего в процессе измерения. Эти кривые показаны для двух случаев: чистая сыворотка (величина ПИК отмечена центрированным прямоугольником и ромбом) и для концентрации C = 102 (величины ПИК отмечены черным ромбом и треугольником)

Мы перечислили задачи, которые лежат па поверхности, нет сомнения в том. что дальнейшие исследования в этом направлении позволят существенно расширить круг проблем, которые могут быть решены в рамках новой статистики дробных моментов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Приложение: вывод системы уравнений (3), (15) и их возможные

обобщения

Вначале имеет смысл рассмотреть случай k = 1. Для этого случая имеем

.(1) 1 , ч N — 1 .(1) 1

= ~N + У2 + + = N N-x + ]\ГУм =

= ^TV-l + (ум — ^TV-l) •

Если потребовать совпадения

да) = дш

ДN = дN-1,

то получается

1)

yN = ДN —1-

Для к = 2 имеем

:) - (А1)

Заменяя ад на , получим по аналогии (А1)

Из условия (р = 1, 2) следует

аду-1+ Уы 2

д(1) г/дг-1 + г/дг _ д(2)

к

ношению

к

плитуд,) локализованных внутри N точек. Для набора к точек, расположенных вне заданной случайной последовательности, необходимо заменить N—к ^ N. Эти простые математические выкладки допускают следующее обобщение. Возможно произвести замену абсолютной величины случайной переменной ур ^ (ад — а)Р,

где а - произвольная константа. Когда а = ^ = Д^, то абсолютное значение момента совпадает с величиной относительного момента, определенного соотношением (8).

Автор хочет выразить свою глубокую благодарность доктору Джеффу Смиту (Университет де Монфорта, г. Лэстер, Великобритания) за предоставленную возможность использовать экспериментальные данные по комплексной восприимчивости сыворотки для их последующего анализа методом С ДМ.

Частично эта работа выполнена в рамках проекта РТ (Л*1' 05-5.2-334/2005).

Из условия Д&> = Д^, (р =1, 2,... ,к) получаем

Summary

R.R. Nigmatullin. The statistics of higher (fractional) moments: new method of quantitative “reading” of any arbitrary random sequence.

The statistical meaning of higher ДД (p = 1, 2,...) and fractional ДД (0 < p < to) moments for an arbitrary random sequence of the length N has been found. The higher moments help to reduce the sequence analyzed to a finite set of k statistically stable parameters, keeping invariant the values of the first kth moments Д^ (p = 1, 2,... , k). The conditions of statistical stability and proximity expressed in terms of higher moments ДД = ДД+k (p =1, 2,. .. , k) help to find k unknown stable points and predict possible future behavior of the random sequence analyzed. The generalized mean value (GMV)-function defined as оД =

= (дД) is turned to be very effective in analysis of statistically close random sequences or containing large numbers of measured points (N ^ 1). The approximate analytical expression for an arbitrary p value from the range ( — to <p< to ) entering into оД has been found. It gives a possibility to transform any random sequence to the determined GMV curve and express quantitatively the reduced characteristics of any random sequence in terms of a “universal” set of the fitting parameters defined by the determined GMV-function. Statistical proximity factor can be used for construction of calibration curves, when it is necessary to compare one random sequence with another one to respect of variations of some given external factor (small signal). The higher moments are easily generalized for the fractional and even complex moments. In turn, the GMV-function can be also generalized and then calculated for 2D and 3D random sequences. The approach developed in this paper is free from any model assumption and can be extremely helpful in comparison of different random sequences using for these purposes the “unified” quantitative language based on introduction of the given set of fractional moments. The relationship between the value of the fractional moment and nonextensive parameter q entering into the definition of the non-extensive Tsallis entropy has been found. A possible model of statistical detection of plastic cards and other valuable documents demonstrating the effectiveness of the statistics of fractional moments has been considered. Some instructive examples in detection of superweak signals embedded into the basic random sequence (S/N = 10-2 , 10-3) based on model and real data confirm the effectiveness of new approach and can serve a new basis for numerous practical applications. Analysis of dielectric spectroscopy data by means of fractional moments gives unique possibility to compare quantitatively each measurement with each other and express the influence of a neutral additive in terms of calibration curve without concrete knowledge of the corresponding fitting function.

Литература

1. Feder E. Fractals. - N. Y., London: Plenum Press, 1988.

2. Daubechies I. Wavelets and their Applications // Comm. Pure Appl. Math. - 1988. -

V. 41. - P. 909.

3. Daubechies I. The basic aspects of wavelet theory // IEEE Trans. Inform Theory. -

1990. - V. 36. - P. 961.

4. Daubechies I. Ten Lectures on wavelets. - Philadelphia: CBMS Lecture Notes Series,

1991.

5. Caufman R. Wavelets and their applications. - Boston: John and Barlett Publishing,

1992.

6. Yulmetyev R, Hanggi P, Gafarov F. Stochastic dynamics of time correlation in complex

systems with discrete time // Phys. Rev. E. - 2000. - V. 62. - P. 6178.

7. Yulmetyev R, Hanggi P, Gafarov F. Quantification of heart rate variability by discrete non- stationary non-Markov stochastic processes // Phys. Rev. E. - 2002. - V. 65, No 4, Art. 046107.

8. Yulmetyev R.M., Gafarov F.M., Yulmetyeva D.G., Emelyanova N.A. Intensity approximation of random fluctuation in complex systems // Physica A. - 2002. - V. 303. -P. 425.

9. Timashev S.F. A new dialogue with nature. Stochastic and chaotic dynamics in the lakes // STOCHAOS / Eds. D.S. Broomhead, E.A. Luchinskaya, P.V.E. McClintock, T. Mulin. - Melville, N. Y.: AIP Conference Proceedings, 2000. - P. 238.

10. Timashev S.F. Self-Similarity in Nature. - Ibid. - P. 562.

11. Timashev S.F. Science of complexity: Phenomenological basis and possibility of application to problems of chemical engineering // Theoretical Foundation of Chem. Engineering. 2000. - V. 34. - P. 301-312.

12. Nigmatullin R.R. Recognition of nonextensive statistic distribution by the eigencoordinates method // Physica A. - 2000. - V. 285. - P. 547.

13. Nigmatullin R.R. Detection of weak signals based on a new class of transformations of random series // Physica A. - 2001. - V. 289. - P. 18.

14. Nigmatullin R.R., Toboev V.A., Smith G., Butler P. Statistical detection of the hidden distortions in diffusive spectra // J. Phys. D: Appl. Physics. - 2003. - V. 36. - P. 1044.

15. Nigmatullin R.R., Smith G. Fluctuation-noise spectroscopy and a “universal” fitting functions of amplitudes of random sequences // Physica A. - 2003. - V. 320. - P. 291.

16. Nigmatullin R.R., Smith G. The generalized mean value function approach: new statistical tool for the detection of weak signals in spectroscopy //J. Phys. D: Appl. Physics. -2005. - V. 38. - P. 328.

17. Mukundan R., Ramakrishnan K.R. Moment functions in image analysis. Theory and applications. - Singapore: World Scientific, 1998.

18. Giuliani A., Colafranceschi M., Webber Ch. (Jr.), Zbilut G.A. Complexity score derived from the principal component analysis of nonlinear order measures // Physica A. - 2001. -V. 301. - P. 567.

19. Abramovitz M., Stegan A. Handbook of Mathematical Functions. - N. Y.: Dover, 1972.

20. Mishina A.P., Proskuryakov I.V. Advanced Algebra. - M.: Fizmatgiz, 1962 (in Russian).

21. Belanov A.A. Solution of algebraic equations by Lobachevsky method. - M.: Nauka, 1989 (in Russian).

22. Nigmatullin R.R. Eigen-coordinates:new method of identification of analytical functions in experimental measurements // J. of Appl. Magn. Resonance. - 1998. - V. 14. -P. 601.

23. Abdul-Gader Jafar M.M., Nigmatullin R.R. Identification of a new function model for

the AC-impedance of thermally evaporated (undoped) selenium films using the Eigen-

coordinates method // Thin Solid Films. - 2001. - V. 396. - P. 280.

24. Nigmatullin R.R., Abdul-Gader Jafar M.M., Shinyashiki N., Sudo S., Yagihara S. Recognition of a new universal permittivity for glycerol by the use of the Eigen-coordinates method // J. of Non-Crystalline Solids. - 2002. - V. 305. - P. 96.

25. Al-Hasan M., Nigmatullin R.R. Identification of the generalized weibull distribution in wind speed data by the Eigen-coordinates method // Renewable Energy. - 2003. -V. 28. - P. 93.

26. Kendall M.G., Stuart A. The advanced theory of statistics. V. 1. - N. Y., London, Sydney, Toronto: Ch. Griffin & Co. LTD, 1962.

27. Tsallis C. Possible generalization of Boltzmann-Gibbs statistics // J. Stat. Phys. -

1988. - V. 52. - P. 479.

28. Tsallis C. Nonextensive thermostatistics and fractal // Fractals. - 1995. - No 3. - P. 541.

29. Tsallis C. Classical and quantum complexity and nonextensive thermodynamics // Chaos, Solitons and Fractals. - 2002. - V. 13. - P. 371.

30. Tsallis C. Nonextensive statistic: theoretical, experimental and computational evidences and connections // Braz. J. Phys. - 1999. - V. 29. - P. 1.

Поступила в редакцию 25.08.05

Нигматуллин Равиль Рашидович доктор физико-математических паук, профессор кафедры теоретической физики Казанского государственного университета.

E-mail: niymatÂÎ knet.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.