Научная статья на тему 'О формально исчисленных коэффициентах взаимной корреляции'

О формально исчисленных коэффициентах взаимной корреляции Текст научной статьи по специальности «Математика»

CC BY
95
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук
Ключевые слова
РЕГРЕССИОННЫЙ АНАЛИЗ / ВЗАИМНАЯ КОРРЕЛЯЦИЯ / ТРЕНД / ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ / REGRESSION ANALYSIS / CROSS CORRELATION / TREND / NUMERICAL EXPERIMENTS

Аннотация научной статьи по математике, автор научной работы — Петров Александр Васильевич

Цель. Целью исследования является нахождение методов оценивания нелинейных вероятностных зависимостей. Методы. Основными методами исследования являются теоретический вероятностный анализ и численные методы. Результаты. Проведение прикладных исследований с привлечением вероятностных характеристик использует знания не только о значениях этих характеристик, но и об их поведении в динамике. Формальное вычисление по крайней мере коэффициентов взаимной корреляции показало, что даже при таком некорректном вычислении имеется возможность получения дополнительных знаний об исследуемом объекте. Заключение. Результаты численных экспериментов показали, что формально вычисленные коэффициенты корреляции характеризуют заложенный в данных тренд. Причем степень выраженности этого тренда в значительной степени определяется уровнем влияния помехи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON FORMALLY CALCULATED CROSS-CORRELATION COEFFICIENTS

The purpose of the study is to find the estimation methods for nonlinear probabilistic dependencies. Methods. The main research methods are theoretical probabilistic analysis and numerical methods. Results. The pursuance of applied researches with the involvement of probabilistic characteristics uses both the knowledge about the values of these characteristics and their behavior in dynamics. A formal calculation of the coefficients of cross-correlations has showed that even this incorrect estimation provides an opportunity to obtain additional knowledge about the object under investigation. Conclusion. The results of numerical experiments have showed that formally calculated correlation coefficients characterize the trend inherent in the data. Moreover, the degree to which this trend is stated is largely determined by the interference influence level.

Текст научной работы на тему «О формально исчисленных коэффициентах взаимной корреляции»

Оригинальная статья / Original article УДК: 519.233.5

DOI: 10.21285/1814-3520-2016-8-110-117

О ФОРМАЛЬНО ИСЧИСЛЕННЫХ КОЭФФИЦИЕНТАХ ВЗАИМНОЙ КОРРЕЛЯЦИИ © А.В. Петров1

Иркутский национальный исследовательский технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Резюме. Цель. Целью исследования является нахождение методов оценивания нелинейных вероятностных зависимостей. Методы. Основными методами исследования являются теоретический вероятностный анализ и численные методы. Результаты. Проведение прикладных исследований с привлечением вероятностных характеристик использует знания не только о значениях этих характеристик, но и об их поведении в динамике. Формальное вычисление по крайней мере коэффициентов взаимной корреляции показало, что даже при таком некорректном вычислении имеется возможность получения дополнительных знаний об исследуемом объекте. Заключение. Результаты численных экспериментов показали, что формально вычисленные коэффициенты корреляции характеризуют заложенный в данных тренд. Причем степень выраженности этого тренда в значительной степени определяется уровнем влияния помехи.

Ключевые слова: регрессионный анализ, взаимная корреляция, тренд, численные эксперименты.

Формат цитирования: Петров А.В. О формально исчисленных коэффициентах взаимной корреляции // Вестник Иркутского государственного технического университета. 2016. № 8 (115). С. 110-117. DOI: 10.21285/1814-35202016-8-110-117

ON FORMALLY CALCULATED CROSS-CORRELATION COEFFICIENTS A.V. Petrov

Irkutsk National Research Technical University 83 Lermontov St., Irkutsk, 664074, Russia.

Abstract. The purpose of the study is to find the estimation methods for nonlinear probabilistic dependencies. Methods. The main research methods are theoretical probabilistic analysis and numerical methods. Results. The pursuance of applied researches with the involvement of probabilistic characteristics uses both the knowledge about the values of these characteristics and their behavior in dynamics. A formal calculation of the coefficients of cross-correlations has showed that even this incorrect estimation provides an opportunity to obtain additional knowledge about the object under investigation. Conclusion. The results of numerical experiments have showed that formally calculated correlation coefficients characterize the trend inherent in the data. Moreover, the degree to which this trend is stated is largely determined by the interference influence level.

Keywords: regression analysis, cross correlation, trend, numerical experiments

For citation: Petrov A.V. On formally calculated cross-correlation coefficients. Proceedings of Irkutsk State Technical University. 2016, no. 8 (115), pp. 110-117. (In Russian) DOI: 10.21285/1814-3520-2016-8-110-117

Введение

Числовые характеристики (параметры, числовые показатели и т.п.) являются мощнейшим инструментом научного, прикладного, технологического и всех других видов деятельности человека. Сегодня в деловых сферах, которые явно не относятся к точным наукам, отмечается устойчивое стремление сформировать свой предметно-ориентированный численный инструментарий описания событий, явлений, тен-

денций.

Ясно, что для каждой области применения формулируются собственные требования к числовым характеристикам. Обобщение их с системных позиций позволило выработать обобщенные требования к любым числовым характеристикам с общенаучной методологической точки зрения [1]:

1. Числовые характеристики долж-

1

1Петров Александр Васильевич, доктор технических наук, профессор кафедры автоматизированных систем, e-mail: [email protected]

Petrov Alexander, Doctor of Engineering, Professor of the Department of Automated Systems, e-mail: [email protected]

ны представлять собой величины, зависящие от функционирования системы, которые, по возможности, просто вычисляются из математического описания системы.

2. Числовые характеристики должны допускать приближенную оценку по экспериментальным данным;

3. Числовые характеристики должны давать наглядное представление об одном из свойств системы.

Обратим внимание на третье требование. Оно оговаривает обязательность привязки числового параметра к реальным свойствам системы. Без такой привязки параметр имеет только гипотетическую, предполагаемую наглядность. В этом случае можно говорить о некоторой теоретической или экспериментально вычисленной величине, как о бесполезной пока находке. Много примеров таких «находок» предоставляет математика. В теории вероятно-

стей имеют место теоретические описания начальных и центральных моментов. Математическая статистика предоставляет аппарат для приближенной оценки этих моментов по экспериментальным данным. Но вот какие свойства отображают начальные и центральные моменты с порядком, большим четырех, - описаний нет!

Обратим внимание не на проблему опережения теоретических достижений над практическим их использованием, а на прямо противоположную проблему - полезность и информативность практически полученных результатов, которые ставят перед теорией новые, неразрешенные вопросы. Обусловлено это гораздо большей близостью практических результатов к наглядности представлений о реальных свойствах объекта исследований. При этом речь будем вести только о характеристиках взаимосвязи.

Характеристики взаимосвязи

Числовые характеристики положения (например, математическое ожидание, мода и т.п.) и формы (дисперсия, асимметрия и т.п.) являются статическими характеристиками. Они не отражают динамики, заложенной в рядах наблюдений и, помимо своего значения, не представляют какой-либо дополнительной информации для понимания случайного явления.

Среди характеристик взаимосвязи (корреляция, спектральная плотность и т.п.) также имеются статические характеристики - различного рода коэффициенты корреляции (например, Спирмэна, ранговый). Но есть и такие, которые, помимо числового значения, выражаются и своей функцией от времени или частоты, и своей формой эти функции доставляют дополнительные сведения для познания исследуемого объекта.

Вопросам использования формы автокорреляционной функции для извлечения дополнительной информации уделяется специальное внимание в различных областях знаний: например, радиотехнике [2], гидравлике [3], медицине [4].

Характеристики взаимосвязи представляют собой математическое описание взаимодействия по крайней мере двух случайных величин. (Здесь рассматриваются только случайные величины и одномерные случайные процессы, а не случайные объекты более сложной природы). Это описание выражается в виде усредненных в вероятностном смысле арифметических операций над случайными величинами или некоторыми функциями от них. Из классического набора арифметических операций выпадают две - сложение и деление. Первая - по причине свойств математического ожидания (математическое ожидание суммы случайных величин равно сумме математических ожиданий), что не позволяет оценить вероятностные взаимосвязи. Вторая - по причине возможного деления на ноль. Усредненная разность носит название структурной, а усредненное произведение - корреляционной характеристики взаимосвязи.

В монографии [5] приведено описание характеристик стохастической взаимосвязи. Автор рассматривает 26 характери-

стик. Выделим те из них, которые являются функциями и, следовательно, способны доставить исследователю дополнительную информацию, выражаемую формой этой функции (в предположении стационарности в широком смысле процессов {X(t), teTJ и {Y(t), teTJ, где Т - множество значений параметра t):

- корреляционный (ковариационный) момент, ковариационная функция

Kx(t',t") = = M [( X(t') - M ( X ))•( X(t") - M ( X ))] ;

- коэффициент корреляции, автокорреляционная функция

Sx(ю)=

rX

, . ... KX(t',t") (t',t") = X 7 ;

D

X

- взаимный корреляционный (ковариационный) момент, взаимная ковариационная функция

кх у(х\п = = М [(х(г') - М (X ))■(¥(" - М (У ))];

- коэффициент корреляции, автокорреляционная функция

rX Y(t't ) =-'

ax -CTy

- моментная функция

Bx(t',t") = M [ X(t) ■ X(t")] ;

- взаимная моментная функция Bx x(t',t") = M[X(t) ■ Y(t")];

- спектральная плотность

J Kx( t ) ■

t=t"-1';

- взаимная спектральная плот-

SX,Y( ю) =

= J Kx Y(t) ■ e-™raT^ dT ,

t=t"-1';

- структурная функция

D(x)(t',t") = M (X(t') - Х(t"))2

- функция когерентности

ность

rX.Y( ю) =

\SX,Y(

Sx( ю ) ■ SY( ю )

Конечно, этот список может быть дополнен и другими функциями, отражающими стохастические взаимосвязи, но с непременным условием: дополнения должны, помимо значения, иметь еще один инструмент отображения взаимодействия случайных величин.

Отметим, что приведенные выше выражения справедливы только в случае стационарности в широком смысле процессов X(t) и Y(t). Следовательно, в иных условиях их использование не является математически корректным. Вместе с тем уместно напомнить слова Е.Е. Слуцкого, сказанные им в работе «К вопросу о логических основах исчисления вероятностей». В начале статьи: «Исчисление вероятностей излагается обычно как чисто математическая дисциплина. Таково оно и есть в своем основном содержании, взятом независимо от приложений» (курсив -А.В. Петров). И заключительный абзац: «Может быть, к чисто логическим аргументам эти заключительные замечания приба-

вят живое чувство, которое вызывается не логически формальными рассуждениями, а соприкосновением к непосредственному акту видения и постижения существа вещей и проблем» (курсив - А.В. Петров).

Опираясь на эти суждения и стремясь найти способы получения дополнительной информации о случайных явлени-

Результаты числ

Пусть имеется последовательность

Y = {ф( х^М x2),...M Xn)} + ^j, для элементов которой справедливо

xJ+1 = Xj + h, j = 1,2,...,n,

где h - приращение.

Образуем новую последовательность:

Yj ={y(Xi),y(X2),...MXn)M2 j,

где ф(Xj) - произвольная функция одного аргумента Xj;

ß^ ß2 - коэффициенты функции ф;

- помеха с задаваемыми вероятностными свойствами.

Будем производить формальную оценку коэффициента взаимной корреляции

M [( X - M ( X ))-(Y - M (Y ))]

rX,Y =-,

aX 'aY

ях, сугубо формально применим формулы вычисления корреляционных характеристик к функционально зависимым величинам, на которые аддитивно накладывается некоррелированная помеха с задаваемыми своими параметрами законами распределения вероятностей.

х экспериментов

варьируя значениями коэффициентов

Ь. р2.

Накладывались некоррелированные помехи с нормальным законом распределения вероятностей с нулевым математическим ожиданием и среднеквадратиче-скими отклонениями 0,01; 0,1; 1 и 10. Результаты усреднялись по 20-ти проведенным при одних и тех же исходных данных экспериментам, объем генерируемых выборок в каждом из которых равнялся 100 значениям.

На рис. 1 приведены результаты численных экспериментов при наложении помехи на линейную функцию. Очевидно ожидать, что при малых среднеквадратиче-ских отклонениях функциональная зависимость должна сильно проявляться, а при больших значениях среднеквадратических отклонений в значительной степени скрывать линейную зависимость.

На рис. 2-5 представлены полученные аналогичным образом результаты численных экспериментов, соответственно, для трендов: экспонента, произведение экспоненты на синус, синус и арккотангенс. (Формы трендов выбраны совершенно произвольно).

Выводы

Проведение прикладных исследований с привлечением вероятностных характеристик использует знания не только о значениях этих характеристик, но и об их поведении во времени или по мере изменения частоты. Теоретически обоснован-

ные способы вычисления этих характеристик не могут быть использованы в силу нестационарности исследуемых процессов.

Вместе с тем формальное вычисление по крайней мере коэффициентов взаимной корреляции показало, что даже при

таком некорректном вычислении имеется возможность получения дополнительных знаний об исследуемом объекте.

Полученные результаты численных экспериментов продемонстрировали, что формально вычисленные коэффициенты

а = 0,01

а = 0,1

о = 1

о = 10

Рис. 1. Коэффициент взаимной корреляции при линейном тренде Fig. 1. Coefficient of cross-correlation under the linear trend

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о = 0,01

о = 0,1

о = 1

о = 10

Рис. 2. Коэффициент взаимной корреляции при экспоненциальном тренде Fig. 2. Coefficient of cross-correlation under the exponential trend

о = 0,01

о = 0,1

о = 1

о = 10

Рис. 3. Коэффициент взаимной корреляции при экспоненциально-синусоидальном тренде Fig. 3. Coefficient of cross-correlation under the exponential and sinusoidal trend

о = 0, 01

о = 0,1

о = 1

о = 10

Рис. 4. Коэффициент взаимной корреляции при синусоидальном тренде Fig. 4. Coefficient of cross-correlation under the sinusoidal trend

о = 0,01

о = 0, 1

о = 1

о = 10

Рис. 5. Коэффициент взаимной корреляции при тренде - арккотангенс Fig. 5. Coefficient of cross-correlation under the arc cotangent trend

корреляции характеризуют заложенный в данных тренд. Причем степень выраженности этого тренда в значительной степени определяется уровнем влияния помехи.

Важным фактом, требующим дополнительных исследований, является способность коэффициента взаимной корре-

ляции отразить содержащийся в данных тренд. Для синусоидального тренда, например, он проявляется при значительно меньших значениях коэффициента взаимной корреляции, нежели при других видах трендов.

Библиографический список

1. Бусленко Н.П., Калашников В.В., Коваленко И.Н. Лекции по теории сложных систем. М.: Советское радио, 1973. 439 с.

2. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. 496 с.

3. Волгина А.В., Тарасов В.И., Зоммер Т.В. Экологическое прогнозирование примесей в турбулентном открытом потоке по корреляционной функции и ко-

эффициенту турбулентной диффузии // Вестник МГСУ. 2013. № 5. С. 141-149.

4. Зенков Л.Р. Клиническая электроэнцефалография. М.: Бином, 2013. 356 с.

5. Мирский Г.Я. Характеристики стохастической взаимосвязи и их измерение. М.: Энергоиздат, 1982. 320 с.

References

1. Buslenko N.P., Kalashnikov V.V., Kovalenko I.N. of complex systems]. Moscow, Sovetskoe radio Publ.,

Lekcii po teorii slognuh system [Lectures on the theory 1973, 439 p. (In Russian)

2. Rabiner L.R., Shafer R.V. Cifrovaiy obrabotka re-chevih signalov [Digital processing of speech signals]. Moscow, Radio i svaz Publ., 1981. 496 p. (In Russian)

3. Volgina L.R., Tarasov V.I., Zommer T.V. Ekologicheskoe prognozirovanie primesej v turbulent-nom otkrytom potoke po korrelacionnoj fynkcii i koeffi-cientu diffuzii [Ecological forecasting of admixtures in an open turbulent flow based on correlation function and turbulent diffusion coefficient]. Vestnik MGSU [Proceed-

Критерии авторства

Автор Петров А.В. несет ответственность за плагиат.

Конфликт интересов

Автор заявляет об отсутствии конфликта интересов.

Статья поступила 14.06.2016 г.

ings of Moscow State University of Civil Engineering]. 2013, no. 5, pp. 141—149. (In Russian)

4. Zenkov L.R. Klinicheskay elektroencefalografiy [Clinical electroencephalography]. Moscow, Binom Publ., 2013, 356 p. (In Russian)

5. Mirskij G.I. Harakteristiki stohasticheskoj vzai-mosviyzi I ih izmerenie [Stochastic interrelation characteristics and their measurement]. Moscow, Energoizdat Publ., 1982, 320 p. (In Russian)

Authorship criteria

The author Petrov A.V. bears the responsibility for plagiarism.

Conflict of interests

The author declares that there is no conflict of interests regarding the publication of this article.

The article was received on 14 June 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.