Научная статья на тему 'Характеризация средних величин шкалами измерения'

Характеризация средних величин шкалами измерения Текст научной статьи по специальности «Математика»

CC BY
283
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ПРИКЛАДНАЯ СТАТИСТИКА / НЕЧИСЛОВАЯ СТАТИСТИКА / ТЕОРИЯ ИЗМЕРЕНИЙ / АДЕКВАТНАЯ ФУНКЦИЯ / ДОПУСТИМОЕ ПРЕОБРАЗОВАНИЕ / ПОРЯДКОВАЯ ШКАЛА / ШКАЛА ИНТЕРВАЛОВ / ШКАЛА ОТНОШЕНИЙ / ХАРАКТЕРИЗАЦИОННЫЕ ТЕОРЕМЫ / MATHEMATICAL STATISTICS / APPLIED STATISTICS / NON-NUMERICAL STATISTICS / MEASUREMENT THEORY / ADEQUATE FUNCTION / ALLOWABLE TRANSFORMATION / ORDER SCALE / SCALE OF INTERVALS / SCALE OF RELATIONS / CHARACTERIZATION THEOREMS / СРЕДНИЕ ВЕЛИЧИНЫ / AVERAGE VALUES

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Согласно теории измерений статистические данные измерены в тех или иных шкалах. Наиболее широко используются порядковая шкала, шкалы интервалов и отношений. Статистические методы анализа данных должны соответствовать шкалам, в которых измерены данные. Термин "соответствие" уточняется с помощью понятий адекватной функции и допустимого преобразования шкалы. Основное содержание статьи описание средних величин, которые можно применять для анализа данных, измеренных в порядковой шкале, шкалах интервалов и отношений и некоторых других. Основное внимание уделено средним по Коши и средним по Колмогорову. Кроме средних, с указанной точки зрения проанализированы также многочлены и показатели связи. Подробные математические доказательства характеризационных теорем впервые приводятся в научной периодике. Показано, что в порядковой шкале имеется ровно n средних величин, которые можно применять, а именно, n порядковых статистик. Доказательство представлено в виде цепи из 9 лемм. В шкале интервалов из всех средних по Колмогорову можно использовать только среднее арифметическое. В шкале отношений из всех средних по Колмогорову допустимо применение только степенных средних и среднего геометрического. Указан вид адекватных многочленов в шкале отношений

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHARACTERIZATION OF AVERAGE VALUES BY MEANS OF MEASUREMENT SCALES

According to measurement theory, statistical data are measured in various scales. The most widely used ordinal scale, scales of intervals and relations. Statistical methods of data analysis should correspond to the scales in which the data is measured. The term "correspondence" is specified with the help of the concepts of an adequate function and an allowable scale transformation. The main content of the article is a description of the average values that can be used to analyze data measured in the ordinal scale, interval and relationship scales, and some others. The main attention is paid to the means for Cauchy and the means for Kolmogorov. In addition to the mean, from this point of view, polynomials and correlation indices are also analyzed. Detailed mathematical proofs of characterization theorems are given for the first time in scientific periodicals. It is shown that in the ordinal scale there are exactly n average values, that can be used, namely, n order statistics. The proof is represented as a chain of 9 lemmas. In the scale of intervals from all Kolmogorov means, only the arithmetic mean can be used. In the scale of relations from all the Kolmogorov means, only the power means and the geometric mean are permissible. The kind of adequate polynomials in the relationship scale is indicated

Текст научной работы на тему «Характеризация средних величин шкалами измерения»

УДК 519.2

01.00.00 Физико-математические науки

ХАРАКТЕРИЗАЦИЯ СРЕДНИХ ВЕЛИЧИН ШКАЛАМИ ИЗМЕРЕНИЯ

Орлов Александр Иванович

д.э.н., д.т.н., к.ф.-м.н., профессор

РИНЦ SPIN-код: 4342-4994

Московский государственный технический

университет им. Н.Э. Баумана, Россия, 105005,

Москва, 2-я Бауманская ул., 5, prof-orlov@mail.т

Согласно теории измерений статистические данные измерены в тех или иных шкалах. Наиболее широко используются порядковая шкала, шкалы интервалов и отношений. Статистические методы анализа данных должны соответствовать шкалам, в которых измерены данные. Термин "соответствие" уточняется с помощью понятий адекватной функции и допустимого преобразования шкалы. Основное содержание статьи - описание средних величин, которые можно применять для анализа данных, измеренных в порядковой шкале, шкалах интервалов и отношений и некоторых других. Основное внимание уделено средним по Коши и средним по Колмогорову. Кроме средних, с указанной точки зрения проанализированы также многочлены и показатели связи. Подробные математические доказательства характеризационных теорем впервые приводятся в научной периодике. Показано, что в порядковой шкале имеется ровно п средних величин, которые можно применять, а именно, п порядковых статистик. Доказательство представлено в виде цепи из 9 лемм. В шкале интервалов из всех средних по Колмогорову можно использовать только среднее арифметическое. В шкале отношений из всех средних по Колмогорову допустимо применение только степенных средних и среднего геометрического. Указан вид адекватных многочленов в шкале отношений

Ключевые слова: МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ПРИКЛАДНАЯ СТАТИСТИКА, НЕЧИСЛОВАЯ СТАТИСТИКА, ТЕОРИЯ ИЗМЕРЕНИЙ. СРЕДНИЕ ВЕЛИЧИНЫ, АДЕКВАТНАЯ ФУНКЦИЯ, ДОПУСТИМОЕ ПРЕОБРАЗОВАНИЕ, ПОРЯДКОВАЯ ШКАЛА, ШКАЛА ИНТЕРВАЛОВ, ШКАЛА ОТНОШЕНИЙ, ХАРАКТЕРИЗАЦИОННЫЕ ТЕОРЕМЫ

Рок 10.21515/1990-4665-134-070

UDC 519:2

Physics and mathematical sciences

CHARACTERIZATION OF AVERAGE VALUES BY MEANS OF MEASUREMENT SCALES

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

According to measurement theory, statistical data are measured in various scales. The most widely used ordinal scale, scales of intervals and relations. Statistical methods of data analysis should correspond to the scales in which the data is measured. The term "correspondence" is specified with the help of the concepts of an adequate function and an allowable scale transformation. The main content of the article is a description of the average values that can be used to analyze data measured in the ordinal scale, interval and relationship scales, and some others. The main attention is paid to the means for Cauchy and the means for Kolmogorov. In addition to the mean, from this point of view, polynomials and correlation indices are also analyzed. Detailed mathematical proofs of characterization theorems are given for the first time in scientific periodicals. It is shown that in the ordinal scale there are exactly n average values, that can be used, namely, n order statistics. The proof is represented as a chain of 9 lemmas. In the scale of intervals from all Kolmogorov means, only the arithmetic mean can be used. In the scale of relations from all the Kolmogorov means, only the power means and the geometric mean are permissible. The kind of adequate polynomials in the relationship scale is indicated

Keywords: MATHEMATICAL STATISTICS, APPLIED STATISTICS,NON-NUMERICAL STATISTICS, MEASUREMENT THEORY. AVERAGE VALUES, ADEQUATE FUNCTION, ALLOWABLE TRANSFORMATION, ORDER SCALE, SCALE OF INTERVALS, SCALE OF RELATIONS, CHARACTERIZATION THEOREMS

http://ej .kubagro.ru/2017/10/pdf/70.pdf

1. Введение

Статистические методы анализа данных должны соответствовать шкалам, в которых измерены данные. Основное содержание статьи -описание средних величин, которые можно применять для анализа данных, измеренных в порядковой шкале, шкалах интервалов и отношений. Подробные математические доказательства характеризационных теорем впервые приводятся в научной периодике. Кроме средних, проанализированы также многочлены и показатели связи.

2. Постановка задачи нахождения средних, результат сравнения которых устойчив относительно допустимых преобразований шкалы

Рассмотрим и-мерное, и > 2, пространство Яи векторов X = (х1, х2, ..., хп). Функцию /: Яи ® Я1 называем средней величиной или, короче, средним, если

шш(У, 1 = 1, 2, ..., и} <АХ) < шах(У, 1 = 1, 2, ..., и} (1)

при любом Xе Яп. Это - определение среднего по Коши [1, с.64].

Укажем некоторые виды средних. Средними являются порядковые статистики. Пусть Р: А ® Я1 - строго монотонная функция (т.е. строго возрастающая или строго убывающая) со связной областью определения А е Я1, а Р1 - обратная к ней. Средним является

g(X) = аТ(хг) , 0 < а1 < 1, I = 1,2,...,и, а1 + а2 +... + ап = 1. (2)

V 1<г<п

1 2

При Р(х) = х, 1пх, х" , х имеем среднее арифметическое, среднее геометрическое, среднее гармоническое, среднее квадратическое соответственно. Средние вида (2) с Р(х) = ха называем степенными средними; они определены при любом а ф 0, если А = (0,+¥. При а1 = и"1, 1 = 1, 2, ..., и, формула (2) дает общий вид так называемых ассоциативных средних, полученный А.Н. Колмогоровым [2], М. Нагумо и Б. де Финетти в 1930-31 гг., исходя из некоторой системы аксиом [1, с.151]. Поэтому

указанные средние называют "средними по Колмогорову" [3] (в некоторых публикациях - обобщенными средними по Колмогорову [4, 5]).

Пусть р - строго возрастающее преобразование прямой или луча в себя, т.е. - в терминах теории измерений [6] - преобразование шкалы. Обозначим р(Х) = (р(х1),р(х2),...,р(хи))е Яи.

Преобразование шкалы ( называем допустимым относительно функции /: Яи ® Я1, если /(Х1) < /Х2) тогда и только тогда, когда /(р(Х1) < /(р(Х2), при всех Х1,Х2 е Яи, т.е. результат сравнения значений функции / в двух точках устойчив относительно преобразования шкалы (. Согласно теории измерений, функция / называется адекватной относительно преобразования р или совокупности преобразований Ф = {р}, если р, соответственноз все ре Ф, являются допустимыми относительно/

Будем изучать две задачи.

(I). Дана совокупность Ф = {р} преобразований шкалы. Найти все средние / из данного класса, для которых все ре Ф являются допустимыми.

(II). Дано среднее/ Найти все преобразования шкалы р, допустимые относительно /.

Если Ф задает шкалу наименований, то у задачи (I), очевидно, нет решений. Решения задачи (I) для Ф, задающей порядковую шкалу (I), найдены в разделе 3. Решения задач (I) для Ф, определяющих шкалы отношений, интервалов, разностей и некоторых других, и задач (II) для средних по Колмогорову приведены в разделе 4. Адекватность некоторых других функций (многочленов, показателей связи) рассмотрены в разделах 5 и 6.

3. Адекватные средние в порядковой шкале

Совокупность Ф = {р} строго возрастающих преобразований р: Я1 ® Я1 называется ^-переводимой, если для любых упорядоченных наборов чисел х1 < х2 < ...< хи и у1 < у2 < ...< уи длины к найдется преобразование ре Ф такое, что р(х1) = у1,1 = 1,2,...,к.

Легко видеть, что группа Ф, задающая порядковую шкалу, является к-переводимой при любом к (способ построения р , осуществляющего перевод, дан в [5, с.110-111]).

Пусть Х1, Х2 е Яи . Будем писать Х1 < Х2 тогда и только тогда, когда х < х2 при всех 1 = 1, 2, ..., и.

Теорема 1 (теорема о медиане). Пусть Ф0- совокупность строго возрастающих преобразований шкалы, являющаяся 2и-переводимой. Пусть любое ре Ф0 является допустимым относительно среднего /: Яи ® Я1. Пусть /Х) непрерывна как функция Хе Яи. Пусть функция / является симметрической, т.е. не меняется при любой перестановке аргументов: /(Х) = /(х1 , х , ..., х и) = /(х(1), х(2), ..., х(и)), где х(/) - порядковые статистики, построенные по совокупности чисел х\ х2, ..., хи. Тогда найдется номер 1 такой, что /Х) есть ¡-я порядковая статистика, т.е. /(Х) = х(1) при любом Х е Яи.

Итак, имеется ровно и средних величин, удовлетворяющих условиям теоремы 1, а именно, и порядковых статистик. Среди них при и = 2т+1 выделяется медиана х(т+1). При и = 2т рассматривают "левую медиану" х(т) и "правую медиану" х(т+1). В качестве "показателя центральной тенденции" естественно использовать медиану. Именно поэтому мы называли теорему 1 "теоремой о медиане" [5, с.94]. Не менее естественно назвать теорему 1 теоремой о характеризации порядковых статистик [7].

Согласно теореме 1 при анализе данных, измеренных в порядковой шкале, рекомендуется использовать в качестве средних порядковые

статистики. Отметим, что для сравнения двух совокупностей данных, измеренных в порядковой шкале, не обязательно пользоваться средними. Можно применять любые ранговые критерии, поскольку, как показано в [5, с.112], класс адекватных статистик в порядковой шкале совпадает с классом ранговых статистик. Однако большая роль средних при описании данных не только вытекает из традиции, но и имеет причиной "наглядность" средних как результата сжатия информации, облегчающую формулировку гипотез для дальнейшего исследования в конкретной прикладной области.

Доказательство теоремы 1 представим с виде цепи лемм. Все рассматриваемые вектора Х таковы, что х1 < х2 < ...< хп, а преобразования ф принадлежат Ф0.

Лемма 1. Пусть вектора XI, X2 и X3, X4 таковы, что х1-1 < х2 < Х и хЗ-1 < x!4 < хЗ при всех / = 1, 2, ..., п (полагая х0 = х30 =-¥). Тогда существует преобразование фе Ф0 такое, что ф(Х1) = Х3,ф(Х2) = Х4.

Доказательство. Рассмотрим два упорядоченных набора 2п чисел:

Х2 х<1 Х2 х<1 ... Х1 Х2 х<1 ... Х2 х<1 , х4 < х1 < Х42 < Х32 <... < ХЗ-1 < Х4 < ХЗ <... < хП < Х3" .

В силу 2п-переводимости совокупности Ф0 существует преобразование фе Ф0, переводящее первый из этих наборов во второй. При этом ф(Х1) = Х3 и ф( X2) = Х4, что и требовалось.

Лемма 2. Пусть Х\ > Х2 (т.е. Х > х2 при всех / = 1, 2, ..., п). Тогда для любого е> 0 существует преобразование ф = ф(е) такое, что ф(Х1) = Х2 и Х5 < х2-1 + е при всех / = 2, 3, ..., п, где Х5 = ф(Х2).

Доказательство. Определим вектора Х3 и Х4 следующим образом. Положим хЗ = х2, если Х-1 < х2 < X, и хЗ =(х-1 + Х )/2 в противном случае. Пусть е > 0 достаточно мало, т.е.

е < штх - х\1).

2<¡<n 2 2 '

Положим х4 = х2-1 +е/2, 1 = 2,3,...,и. Наконец, пусть х1 и х4 - произвольные числа, меньшие х1 и х\ соответственно. Тогда, как легко видеть, вектора Х1, Х3 и Х2, Х4 удовлетворяют условиям леммы 1, а потому существует преобразование р такое, что р(Хг) = Х2 и р(Х3) = Х4. При х1-1 < х22 < х2, имеем р(х2) = р(х3) = х2-1 + е/2 < х2-1 + е, а при х2 < х-1 в силу монотонности р справедливо неравенство р(х2-1) < р(х-1), а потому р(х2,) < х2-1 < х2,-1 + е. Лемма 2 доказана.

Лемма 3. Пусть Х1 > Х2. Тогда существуют конечные последовательности векторов Х3, Х4, ..., Х[ и преобразований р1,р2,...,р1-2

такие, что Х1+1 = р(Х1), Х1+2 = р(Х1+1), 1 = 1,2,...,I-2, и хги <х,1

1 •

Доказательство. Положим е = (х1 - х1)/ и. Согласно лемме 2 существует преобразование р такое, что р(Х^ = Х2 и х3 < х2-1 + е, 1 = 2,3,..., и, где Х3 = р1(Х2). Поскольку р - строго возрастающее преобразование, то из х > х2 следует х2 = р1(х1) > р1(х2) = х3, т.е. Х2 > Х3. Применяя кХ2 и Х3 лемму 2, строим р2 и Х4 =р2(Х3), для которых х4 < х3-1 +е, 1 = 2,...,и. Тогда х41 < х21-2 + 2е, 1 = 3,4,...,и . Продолжая этот процесс, последовательно определяем р3,р4,... и Х5, Х6, ... так, чтобы р} (Х}) = Х+ и х/+2 < / +е, 1 = 2,...,и, где Х/+2 = р(Х^), / = 3,4,.... Тогда

хи+1 <х;-1 +е<х^2 + 2е<...<х2, + (и- 1)е, а х\ + (и- 1)е в силу определения е меньше х|. Лемма 3 доказана. Попутно выяснено, что можно положить I = и + 1.

Лемма 4. Пусть

(I) функция /: Яи ® Я1 является средним по Коши (см. (1));

(II) любое преобразование ре Ф0 является допустимым относительно/.

Тогда из Х1 > Х2 следует /(Х1) >/Х2).

Доказательство. Предположим противное: существуют вектора Х\ и Х2 такие, что Х1 > Х2, но ДХ1) </(X2). Согласно определению допустимости, неравенство /(X!) < f(X2) влечет /(ф(Х1) < /(ф(Х2)). (Строго говоря, для справедливости утверждения, высказанного в предыдущей фразе, к данному выше определению допустимости надо добавить условие: из /XI) = /X2) следует, что / (ф( X1) = / (ф( X2)). Это условие вытекает из определения допустимости, если {ф} - группа. Естественно принять, что Ф0 в теореме 1 - группа.) Рассмотрим последовательности X3, X4, ..., XI и ф1,ф2,...,ф1-2, построенные в соответствии с леммой 3 по X! и X2. Тогда из /(XI) < f(X2) и условия (II) настоящей леммы следует, что /ф^)</ф,)), т.е./X,) <Д^). Аналогично получаем/(Xl) <f(X2) < ... < /(X/). Однако по условию (I) настоящей леммы /(X1) > х1, а /(X,) < хк. Поскольку в соответствии с леммой 3 хк < х1, то /(XI) > /X,). Получили противоречие, доказывающее лемму 4.

В соответствии с условием переводимости все точки X = (х1, х2, ..., хп) такие, что х1 < х2 < ... < хп, равноправны. Нам понадобится проводить рассуждения, использующие понятия, связанные с окрестностью некоторой точки. Пусть для определенности это точкаX0 = (1, 2, ..., к). Нам

понадобятся также точки Xi =Xг(е), г = 1,2,...,к, такие, что Х = х0; -е = 7-е

при 7 ф / и Хг = х0 + е = г + е, где е - достаточно малое положительное число.

Лемма 5. Пусть функция /удовлетворяет условиям (I) и (II) леммы 4, а также условию

(III) функция/непрерывна на А = {X = (х1, х2, ..., хп): х1 < х2 < ... < хп}. Тогда существует ге{1,2,...,к} такое, что /(^г) > /^^ Доказательство. Предположим противное, пусть /(^г) < /^0) при всех г = 1, 2, ... , к.

Аналогично доказательству леммы 1 можно установить существование преобразования р1 , оставляющего Х0 на месте и

переводящего все координаты Хг, за исключением 1-й, сколь угодно

близко к соответствующим координатам Х0, а хг оставляющего на месте. Из непрерывности /(Х) (условие (III)) следует, что /(У) < /(Х0), где У = Х0 + (8\82..,8к), 8] = 0 при / ф1 и 81 =е .

В силу условия переводимости можно провести предыдущее рассуждение, вместо Х0 подставив У1. Получим, что </У1 ) < /(Х0), где = Х0 + (у1,/2,...,/), / = 0 при г ф 1 и г ф/, в то время как у = у =е.

Повторяя рассуждение к раз, получим, что /(Ж) < /Х0), где Ж = Х0 + (е,е,...,е). Однако Ж > Х0 и по лемме 4 должно быть /(Ж) > /(Х0). Противоречие.

Замечание. В доказательстве леммы 5 используется непрерывность / не на всем множестве А, а на его подмножестве. Однако из условия (II) леммы 4, условия переводимости и непрерывности / в какой-либо точке вытекает, как легко видеть, непрерывность / на всем А.

Лемма 6. Пусть/(Х) удовлетворяет условиям (I), (II) и (III) лемм 4 и 5. Пусть а - именно то 1 е{1,2,...,к}, при котором в силу леммы 5

/(Х1) > /(Х0). Пусть х1 > х2-1 при 1 = 2, 3, ..., к и ха > х2". Тогда/(Х1) >/Х2).

Доказательство. Аналогично доказательству леммы 1 нетрудно показать, что существует преобразование р , переводящее Х2 в Х0, а Х1 в вектор Х3 такой, что х3 = х'0 -е/2, если х'2 > х >х2-1, и х3 > х'0, если >х2, 1 Фа, наконец х3" = х" + 2е (это вытекает из условия 2к-переводимости теоремы 1). Тогда Х3 > Ха, а потому по лемме 4 /(Х3)>/(Ха). Поскольку по лемме 5 /(Ха) > /(Х0), то /(Х3) > /(Х0). Наконец, поскольку Ф0 - группа, то из /(Х3) = /(р(Х1)) > /(Х0) = /(р(Х2)) следует, что /(Х1) > /(Х2), а это и требовалось доказать.

Лемма 7. Пусть для функции /(X) выполнены условия (I), (II), (III), вектора XI и X2 таковы, что Хе >х2", где а - именно то ге{1,2,...,к}, при котором в силу леммы 5 /(Xг) > /(X0). Тогда/(XI) >/1X2).

Доказательство. Воспользуемся леммой 6. Для этого аналогично доказательству леммы 3 определим некоторую последовательность векторов X3, X4, ... , такую, что хг]+1 > хг~1 при г Фа, г = 2,...,к, и ха+1 >ха, но

всегда х°* < ха, 7 = 2,3,.... Наконец, х] < Х, г = 1,...,к, при некотором конечном

/. Если такая последовательность будет построена, то по лемме 6 /(X2) < /X) </(X¿4) < ... </X,). Однако по лемме 4 /(Xl) >/(X,). Поэтому /Х) > f(X2), что и требовалось.

Перейдем к построению требуемой потребности. Опишем оператор Р(г,Х,8), г ф а , где X и 8 - положительные числа, путем многократного применения которого построим последовательность X3, X4, ... . Пусть дан вектор X. Тогда вектор У = Р(г,£,8)X определяется так: уг = хг-1 +Х при г = 2, ..., к; у1 - произвольное число, меньшее х1, при г = 1; у = Х при 7 фа,7фг,7е {1,...,к}; наконец, уа = х а + 8. Если X и 8 достаточно малы (необходимый уровень малости определяется по X), то У е А, т.е. координаты У возрастают с увеличением номера координаты. Тогда по лемме 6 /(У) >/X).

Применим к X2 оператор Р(1,£,8), положив у1 = шт(х1 -1,х\). Получим X3. Применим затем Р(г,%,8) последовательно при г = 2,3,..., а -1, получим при этом X4,X,;,...,Xa+1. Тогда при достаточно малых X и 8 вектор Xa+1 таков, что Ха+1 < х1 при г = 1,.. ., а -1, Ха+1 = х2 при г = а +1,.. ., к и ха+1 < ха . Кроме того /(Xa+l)>/(Xа)>...>/(X,). Пусть теперь к8<%. Применим к Xa+l последовательно операторы Р(г,%,8) при г = а+1, а+2,..., к, получим Xа+2,Xa+3,...,X,+1. Тогда при достаточной малости 8 вектор Xk+1 таков, что хкк+1 < ха и, напомним, хО- < X. Следовательно, Xk+1 < X1. При этом

f (Xk+1) > f (Xk) >... > f (xa+1) >... > f (X2). Требуемая последовательность построена, что и доказывает лемму 7.

Лемма 8. Пусть для функции fX) выполнены условия (I), (II), (III). Тогда существует функция g: R1 ® R1 такая, что f (X) = g(xa), где a -именно то i е {1,2,...,k}, при котором в силу леммы 5 f (Xi) > f (X0).

Доказательство. Положим g(a) = f(Y), где y = a + (i-a), i = 1,2,...,k. Рассмотрим вектор X такой, что xa = a. Докажем, что f(X) = g(a). Рассмотрим X1(g) = X + y(1,1,...,1), y> 0 и X2(y) = X-y(1,1,...,1). Тогда X1(g) ® X

и X2(y) ® X при g® 0. По лемме 7 f (Xj(g)) > f (Y) = g(a) > f (X2(g)). Однако функция f(X) непрерывна (условие (III)), а потому f (X} (g)) ® f (X), j = 1,2, при g ® 0. Следовательно: f (X) = g(a) = g(xa).

Лемма 9. Пусть для функции f(X) выполнены условия (I), (II), (III). Тогда f (X) = xa, где a - именно то i е {1,2,..., k}, при котором в силу леммы 5

f (Xi) > f (X0).

Доказательство. Рассмотрим вектор X (g), у которого x! = a + (i -a)g, у > 0,i = 1,2,..., k. По лемме 8 f (X(g)) = g(a). Поскольку x > a - ky, x' < a + ky, то по условию (I) a-ky<g(a)<a + ky. Переходя к пределу при у®0, получаем, что g(a) = a. Лемма 9 доказана.

Завершение доказательства теоремы 1. Из леммы 9 следует, что все адекватные средние являются порядковыми статистиками. Легко видеть, что порядковые статистики удовлетворяют всем условиям, наложенным в теореме 1 на fX). Последний шаг в доказательстве теоремы 1 - переход от A к Rk. Переход от A к замыканию A основан на непрерывности f, а от замыкания A к Rk - на симметричности f. Теорема 1 доказана.

Если не требовать симметричности f, то адекватных средних значительно больше. Ими являются, например, f(X) = xl, i = 1, 2, ..., k.

Легко видеть, что функция / является устойчивым относительно сравнения непрерывным средним тогда и только тогда, когда

а) в каждой из к! областей {X: хг(1) < хг(2) < ... < хг(к)}, где а = (г(1), г(2), ... , ¡(к)) - перестановка (1, 2, ... , к), найдется индекс п(а) такой, что /(X) = хп(а) в этой области,

б) функция/(X) непрерывна в точках границ областей.

Теорема 1 впервые получена в [8], основные идеи приведенного выше доказательства опубликованы в [5]. Теми же методами доказывается [5, 0.119-120] и следующая теорема, впервые полученная в [9].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теорема 2. Пусть функция /: А ® Я1 удовлетворяет условиям (II) и (III). Пусть существуют вектора У и 2 такие, что ук < г1 и /(У) ф /(I). Тогда существует строго монотонная (т.е. строго возрастающая или строго убывающая) функция g: Я1 ® Я1 и номер ае{1,2,...,к} такие, что /(X) = g(ха). Верно и обратное: если функция g строго монотонна и непрерывна, то /(X) = g(ха) удовлетворяет условиям (II) и (III).

Решение задачи (II) раздела 2 дается следующей теоремой [5, с.121].

Теорема 3. Пусть g: Я1 ® Я1 - строго монотонная функция, /(X) = g(ха) допустима относительно ф. Тогда ф - строго монотонное преобразование.

Теорема 1 показывает, в частности, что в порядковой шкале нельзя пользоваться средним арифметическим, вообще суммами случайных величин. Это существенно ограничивает возможности прикладной статистики. Один из выходов состоит в том, чтобы смягчить условие допустимости - вместо его выполнения для всех значений аргументов требовать его выполнения с вероятностью, близкой к 1. Поскольку по закону больших чисел выборочное среднее арифметическое сходится к математическому ожиданию, то начнем с изучения влияния допустимых

преобразований на математическое ожидание. Изложение до конца раздела следует [5, с.152-156]. Другой подход предложен в [10].

Теорема 4. Пусть р(х) - непрерывная функция. Для произвольной случайной величины X из существования М(Х) следует существование

М(р(X)) тогда и только тогда, когда

р(х)

lim

х

< ¥

(3)

Доказательство. Если (3) выполнено, то с учетом непрерывности р заключаем, что существуют а > 0 и Ь такие, что | р(х) |< а | х | +Ь при всех х,

следовательно

+¥ +¥ +¥

М |р(X)|= | |р(х)| ёЕ(х) < а 11 х | ёР(х) + Ь | ёР(х) = аМ | X | +Ь, Е(х) = Р(X < х), (4) — ¥ —¥ —¥

т.е. из существования М^ вытекает существование М (р( X)).

Пусть теперь неравенство (3) не выполнено. Тогда существует

последовательность ап, п = 1 , 2, ... , такая, что

р(ап )

a„

> n

(5)

и |an|>1 при всех n. Имеем

1

1

1

< <¥:

(6)

с Па n2 | an | n>1 n2 следовательно, соотношение (6) определяет С корректно. Положим

Pn = . (7)

n 1 an 1

Тогда в силу (6) сумма всех pn равна 1. Рассмотрим случайную величину X, приписывающую точке an вероятность pn, n = 1, 2, ... . Тогда M(X) существует, поскольку

C

M | X |= ъ I anlPn = ъ n2 <¥.

(8)

Однако в силу (5)

C

M | j(X) |= Z \j(an) I Pn > Z - I a- P = Z - = +¥, (9)

n>1 n

и, следовательно, Mj( X) не существует. Теорема 4 доказана.

Теорема 5. Пусть случайные величины X и Y с функциями распределения F(x) и G(x) таковы, что их математические ожидания существуют, причем M(X) > M(Y). Необходимое и достаточное условие выполнения неравенства Mj(X) > Mj(Y) для любой строго возрастающей непрерывной функции j, удовлетворяющей (3), таково: F(x) < G(x) при всех x, причем существует x0, для которого F(x0) < G(x0). Доказательство. Интегрируя по частям, имеем

Mj( X) - Mj(Y) = J j( x) d (F (x) - G( x)) = j( x)(F (x) - G( x))

- J (F(x) - G(x))dj(x) = J (G(x) - F(x))dj(x). (10)

(Проведенные в (10) преобразования законны в силу существования M(X) и M(Y) и условия (3).)

Предположим, что найдется точка x0, в которой G(x0) - F(x0) < 0. Функции распределения F(x) и G(x) непрерывны слева (см. (4)), а потому их разность непрерывна слева. Следовательно, существуют x1 < x0 и d > 0 такие, что G(x) - F(x) < - d при x1 < x < x0. Существует непрерывная, строго возрастающая функция j( x) такая, что

j(xj) = 0, j(x0) = 1, lim j(x) = -e, lim j(x) = 1 + e.

Для этой функции условие (3) выполнено,

J (G(x) - F(x))dj(x) < J 2dj(x) - dJ dj(x) + J 2dj(x) = 4e - d, (11)

-¥ -¥ ДЦ ^0

что меньше 0 при 4e - d < 0.

Следовательно, условие Мр(X) > Мр(У) влечет ^(х) < G(x). Если ^(х) = G(x) при всех х, то Мр(X) = Мр(У), следовательно, найдется х0, для которого F(x0) < G(x0).

Докажем достаточность. Пусть Г^) < G(x) при всех x. Тогда в силу (10) Мр( X) > Мр(У). Пусть существует x0 такое, что Г^о) < G(x0). Тогда из-за непрерывности слева G(x) - Г(г) найдется 8 > 0 и x1 < x0 такие, что G( x) - Г (x) > 8> 0 при всех x е [ x1, x0]. Следовательно,

x0

М(р(X)) -М(р(У)) > {(x) = 8(р(X) - р(X)) > 0,

поскольку р строго возрастает. Теорема 5 доказана.

Отметим, что полученное в теореме 5 условие на Г и G инвариантно относительно допустимых в порядковой шкале преобразований. Оно выполнено, например, для распределений, отличающихся сдвигом: G(x) = Г(x + в), в> 0.

Теорема 6 [9]. Пусть XI, X2, ..., Xm - независимые одинаково распределенные случайные величины с функцией распределения Г^), а У1, У2, ..., Уп - независимые одинаково распределенные случайные величины с функцией распределения G(x), причем последовательности {X} и [У^ независимы между собой, М^) > М(У1). Чтобы вероятность события ( : р(X,)+р(X2)+...+р(Xт) > р(У1)+р(У2)+...+р(Уп)|

[ т п \

стремилась к 1 при шт(т, п) ® ¥ для любой строго возрастающей функции р, удовлетворяющей соотношению (3), необходимо и достаточно, чтобы при всех x выполнялось неравенство Г(г) < G(x), причем существовал x0, для которого Г^о) < G(x0).

Доказательство. По теореме 5 сформулированное в условии теоремы 6 требование на Г и G необходимо и достаточно для того, чтобы Мр(X) > Мр(У) при всех рассматриваемых р, при этом существование

Мр(Х1) и Мр(У1) вытекает из теоремы 4. При шт(т, п) по теореме Хинчина (см., например, [11, с.208])

р(^ + р(X2) +... + р(Хт) ®мр(У;) + (2) +... + () ®м{^{Х ) т п

по вероятности, откуда и следует требуемое.

Теорема 6 дает условия, при которых (в указанном выше смысле, ослабленном по сравнению с теоремой 1) можно пользоваться выборочным средним арифметическим при обработке результатов наблюдений, измеренных в порядковой шкале. Не всегда ясно, как проверить эти условия в реальных ситуациях. Для двух конкретных выборок ответ дается теоремой 5, если ^и О заменить эмпирическими функциями распределения. Если имеется много пар выборок, то можно проверить близость к 1 частоты выполнения для них условий, данных в теореме 5, или же попытаться использовать доверительные границы для Р и О, построенные по эмпирическим функциям распределения для объединенных выборок. Если же нет возможности надежно установить справедливость рассматриваемых условий, то для обработки реальных данных целесообразно использовать не средние арифметические, а медиану и другие члены вариационного ряда.

4. Адекватные средние в количественных шкалах

Перейдем к изучению средних вида (2) - взвешенных средних по Колмогорову. Излагаемые результаты впервые получены в [9], несколько обобщены в [12].

Рассмотрим задачу (II) раздела 2 для средних вида (2).

Теорема 7. Пусть преобразование шкалы р переводит в себя область определения функции Р из (2), эта область является связной, Р и

р дифференцируемы, причем производная Р'(х) = ^(х) не обращается в 0.

Пусть р допустимо относительно g(X) из (2). Тогда существуют числа а > 0 и Ь такие, что

р( x) = Г _1(аГ (x) + Ь) (12)

для всех x из области определения Г. Обратно, если р имеет вид (12), то р допустимо относительно е.

Доказательство. Из строгой монотонности Г следует, что р допустимо относительно g(X) тогда и только тогда, когда р допустимо относительно Г^^). Поскольку

Г (Е^)) = 2 а1 Г & ), (13)

1<г<п

то естественно ввести новые переменные у1 = Г^1), 1 = 1, 2, ..., п. Ясно, что р допустимо относительно ГЕ^)) тогда и только тогда, когда

т( у) = Г(р(Г"1(у))) (14)

допустимо относительно

И( у1, у2,..., уп) = 2 а1 у1.

1<1<п

Функция т определена на связном множестве Г(А) и в силу условий теоремы 7 дифференцируема.

По крайней мере два из коэффициентов а1, 1 = 1, 2, ... , п, в формуле (2) отличны от 0 и 1. Без ограничения общности можно считать, что таковы а1 и а2.

Зафиксируем у3, ..., уп. Обозначим У = (у1, у2). Тогда т допустимо относительно

сС(У) = аУ + а2)?.

Предположим, что т'(у0) < 0 при некотором у0е Г (А). Положим у1 = у2 = у>, у = у2 = у0 + е, где е > 0. Тогда С(У0 < С(У2), однако

с (т(^)) - с (т(У2)) = -т'(у0)(а1 + а2)е + о(е) > 0 при достаточно малом е, вопреки определению допустимости. Следовательно, т(у) > 0 при всех у е Г(А).

Предположим, что У (у')фУ(у") при некоторых у' и у" из Р(А). Положим у1 = у', у2 = у", у2 = у'-е, у22 = у"+е', где е и е' положительны. Тогда

ё (У) - ё (У2) = а1 е- а 2е', ё (у(Уг)) - ё (у(У2)) = «У (у' )е - а2 у (у'' )е'+о(е + е') при достаточно малых е и е'. Для получения противоречия с определением допустимости достаточно подобрать е и е' так, чтобы

(а1е - а2е' )(а>' (у' )е - а2У (у")е') < 0. (15)

Без ограничения общности можно считать, что у (у") > 0. Если

е, = а1 (У (у') + У( у")) е 2а2у'(у") '

то неравенство (15) справедливо. Следовательно, У (у') = У(у") при любых у' и у" из Р(А). Поскольку Р(А) связно, то существуют числа а > 0 и Ь такие, что

у(у) = ау + Ь . (16)

В случае а = 0 имеем противоречие с определением допустимого преобразования. Значит, а > 0.

Полагая х = ^(у) , получаем с помощью (14) и (16), что р( х) = Р -1у( у)) = Р (х) + Ь), а это и требовалось доказать.

Если р имеет вид (12), то в соответствии с (14) у задается формулой (16). Ясно, что такое у допустимо относительно И(у1, у2, ..., уп), откуда и следует обратное утверждение теоремы. Теорема 7 доказана.

До конца раздела считаем, что функция Р определена на связном множестве А е Я1.

Рассмотрим задачу (I) (см. раздел 2) для средних вида (2). Отметим сначала, что различные функции Р могут задавать одно и то же среднее. Так, среднее арифметическое получается при Р(х) = сх + ё, сф0, с и ё-любые числа.

Теорема 8. Пусть дифференцируемые функции Г1 и Г2 определены на одном и том же множестве, причем Г2' не обращается в 0, средние Е1(Т) и g2(X) имеют вид (2):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Е (X) = ГГ1 Г 2 а1Г1(^ )1, Е2 (X) = Г2-1 Г 2 а^2 (^ )",

41<г<п ) 41<1'<п )

и Е1(Т) = g2(X) для всех X из области определения. Тогда при некоторых с ф 0 и сС

F1(x) = с F2(x) + С (17)

и, кроме того,

а = а'2, 1 = 1,2,..., п. (18)

Обратно, из справедливости (17) и (18) вытекает, что Е1(^) = для всех X из области определения.

Доказательство. Без ограничения общности можно считать, что Г2 строго возрастает, а22 > а21 > 0. Тогда а11 > 0 . Из условия теоремы следует, что

а1л

1<1<п

2 а;^1) = Г2-11 2 а^^) . (19)

^ V 1<1<п ))

Продифференцируем обе части соотношения (19) по x1:

СГ1( Г2-1( 2))

а^'(x ):

С2

где

а'Л'( x1), (20)

2 = 20

20 = 2 а1^ ). (21)

1<1<п

Пусть а и Ь входят в область определения Г1 и Г2, а < Ь. Покажем, что существует число 20' такое, что для любого x1 е [а, Ь] можно так подобрать x , x . ..., x , чтобы 20 = 20' при всех x1 е [а, Ь], где 20 определено в (21).

Пусть ..., ^ произвольны. Положим

20 ' = а2Г2 (а) + а22Г2 (Ь) + 2 а2Г2 (^ ) .

3<1<п

12 При увеличении x будем уменьшать x так, чтобы

а2 Р2( х1) + а22 Р2( х2) = а^а) + а22 Р2(Ь)

т.е. положим

х2 = К-

С а1 ^

Р2(Ь) + (Р(а) -^(х1) . (22)

а

V 2

Поскольку а22 > а1 > 0, то при этом х2 е [а,Ь], если х1 е [а,Ь], т.е. определение х2 с помощью (22) корректно.

Поскольку 10 = 1(0 при всех х1 е [а, Ь] и а1 ф 0, то из (20) вытекает, что

РДх1) = с РДх1) (23)

при всех х1 е [а, Ь] и соответствующем с. При этом с ф 0, поскольку Р1 -строго монотонная функция. Поскольку а и - Ь - произвольные числа из связной области определения Рг-, I = 1, 2, то (23) выполнено при всех х1 из области определения, а потому справедливо (17).

Поскольку к сР(х) + ё обратной функцией является Р"1(с"1(х - ё)), то, как легко видеть, из (17) вытекает, что

РТ1^аТ1(х1)] = аТ2(х') .

41<г<и У Ч1£г£и У

Следовательно, осталось показать, что в случае Р1 = из g1(X = g2(X) (при всех X из области определения) вытекает (18). Зафиксируем х , , хп и рассмотрим (19) при х1 = а и х1 = Ь. Вычтя первое равенство из

.3

х

второго и разделив на Р1(Ь) - Р1(а), получим а1 = а2. Прочие равенства в (18) доказываются аналогично. Теорема 8 доказана.

Соглашение. Вследствие теоремы 8 указываем в дальнейшем Р(х) лишь с точностью до линейного преобразования.

Теорема 9. Пусть преобразование р(х) = ах + Ь, а ф 1, допустимо относительно среднего g(x) вида (2). Функция Р дифференцируема, точка х0 = Ь(1 - а)-1 входит в область определения Р, причем Р ' непрерывна в х0 и Р'(х0) ф 0. Тогда Р(х) = х.

Доказательство. По теореме 7 существуют а1 > 0 и Ь такие, что

Га + Ь) = аГ^) + Ь1. Продифференцируем обе части (24) по x:

аГ'а + Ь) = а^'^).

(24)

(25)

Положим x = x0. Поскольку ax0 + Ь = x0 и Г ф 0, то из (25) вытекает, что а = а1 > 0. Значит, для Г ' справедливо функциональное уравнение Г \ax + Ь) = Г \x). Положив = Г ' ^ + x0), перейдем к уравнению

Поскольку Г Т непрерывна в x0, то функция ^) непрерывна при x = 0.

При решении уравнения (26) без ограничения общности можно считать а < 1. Для произвольного x рассмотрим последовательность xn = а^Г, п = 1, 2, ... Для неё xn ® 0 при п , следовательно, /(xn) ® /(0). Однако в силу (26) / (xn) = / (x), значит, / (x) = / (0). В прежних обозначениях

имеем Г ,(x) = Г Т) для любого x из связной области определения функции Г, что с учетом принятого выше соглашения доказывает теорему 9, согласно которой среднее арифметическое характеризуется адекватностью в шкале интервалов.

Отметим, что в соответствии с теоремой 7 преобразования р(x) = ax + Ь являются допустимыми относительно е(Т) вида (2) с Г^) = x, т.е. относительно среднего арифметического.

Теорема 10. Пусть преобразования р(x) = x + с допустимы при любом с относительно е(Т) вида (2) с непрерывно дифференцируемой функцией Г. Тогда Г= ехр{аг} при некотором аФ 0 или Г^) = x. Обратно, если Г имеет указанный вид, то преобразования р( x) = x + с допустимы относительно е(^) при любом с.

Доказательство. По теореме 7 существуют функции а(с) > 0 и Ь(с) такие, что

^) = í(ax).

(26)

+ с) = а(с)Г^) + Ь(с). Продифференцируем обе части (27) по x:

Р '(х + с) = а(с)Р '(х) (28)

Поскольку Р строго монотонна, то существует точка х0 такая, что Р'(х0) ф 0. Из (28) при х = х0 вытекает, что

а(с1 + с2) = а(с1)а(с2) (29)

при любых с1 и с2. Из непрерывности Р' с учетом (28) следует непрерывность а(с) как функции с. Как известно [13, п.75, с.158-159], все непрерывные решения уравнения (29) имеют вид

а(с) = ёс, ё > 0 (30)

(решение а(с) ° 0 несовместимо со строгой монотонностью Р). Из (28) и (30) вытекает, что

Р '(х) = ё х Р '(0) = Р '(0) ехр {х 1пё}. Проинтегрировав, получим (с учетом принятого соглашения) функции Р указанного в заключении теоремы 10 вида. Обратное утверждение теоремы 10 легко проверяется с помощью обратного утверждения теоремы 7 (в (12) достаточно положить Ь = 0). Теорема 10 доказана.

Следствие 1. Пусть преобразование р(х) = ахЬ, х > 0, Ь ф 1, допустимо относительно среднего g(X) вида (2), область определения Р входит в (0,+¥) и содержит точку х0 = ехр{(1-Ь)-11па}, функция Р дифференцируема, Р ' непрерывна в х0 и Р'(х0) ф 0. Тогда Р(х) = 1пх.

Следствие 2. Пусть преобразования ср(х) = ах допустимы при любом а > 0 относительно g(X) вида (2) с непрерывно дифференцируемой функцией Р, область определения которой входит в (0,+^). Тогда Р(х) = х" при некотором аФ 0 или Р(х) = 1пх. Обратно, если Р имеет указанный вид, то преобразования х) = ах допустимы относительно g(X) при любом а > 0.

С помощью замены переменной у = 1пх следствия 1 и 2 сводятся к теремам 9 и 10 соответственно.

Следствие 3. Пусть преобразования <р( х) = хЬ допустимы относительно g(X) вида (2) при всех Ь >0; область определения

непрерывно дифференцируемой функции Г входит в (1,+¥. Тогда Г(x) = (1п x)a при некотором а ф 0 или F(x) = 1п 1п x. Обратно, если Г имеет указанный вид, то преобразования р(x) = xb допустимы относительно е(Т) при любом Ь > 0.

С помощью замены переменной у = 1п 1п x следствие 3 сводятся к теореме 10.

Результаты настоящего раздела позволяют дать рекомендации относительно использования средних величин при обработке данных, измеренных в той или иной шкале. Так, из средних вида (2) в шкале интервалов можно использовать только среднее арифметическое, в шкале отношений - только степенные средние или среднее геометрическое.

Замечание 1. В [14] М. Нагумо также получил характеризацию степенных средних и среднего арифметического среди средних вида (2). Однако он исходил не из условия устойчивости результата сравнения средних для двух совокупностей, а из условий

&аК) = аЕ(Г), g(aX + Ь(1, 1, ..., 1)) = а^ + Ь для любых а > 0 и Ь.

Замечание 2. В теореме 9 рассматривается одно определенное преобразование р(x) = ax + Ь. При этом на Ь не наложено специальных условий, в частности, можно положить Ь = 0. Но тогда р(x) = ax - одно из преобразований, указанных в следствии 2, согласно которому е(Т) -степенные средние. Между тем в теореме 9 утверждается, что -среднее арифметическое. Таким образом, при поверхностном сравнении теорема 9 и следствие 2 противоречат друг другу. Сравним их условия более подробно. При Ь = 0 имеем x0 = 0, однако точка x = 0 не входит в область определения Г согласно следствию 2. Далее, если Г(x) = xa, то Г' (x) = аса-1, а ф 0, следовательно,

0, а> 1, Р'(0) = ] 1, а = 1, ¥, а< 1.

Таким образом, при а< 1 неверно, что Р дифференцируема при х = х0 = 0 и Р ' непрерывна в х0, а при а> 1 неверно, что Р'(х0) ф 0. Остается единственный случай а = 1, соответствующий среднему арифметическому. Таким образом, теорема 9 и следствие 2 не противоречат друг другу.

Замечание 3. Результаты настоящего раздела используются при обсуждении формулировок оптимизационных задач, предназначенных для определения средних величин в пространствах объектов нечисловой природы [6], а также в кластер-анализе [15].

5. Адекватность многочлена в шкале отношений

Задачи типа рассмотренных в разделах 3 и 4 можно решать не только для средних величин. Приведем пример.

Теорема 11. Пусть И(X),Xе Я" - многочлен от п переменных. Пусть р(х) = ах при любом а > 0 допустимо относительно И(Х), Тогда существуют однородный многочлен И0(X), X е Я", и многочлен g(X), х е Я1, такие, что И(X) = g(h0(X)).

Доказательство. Соберем в И^ вместе члены одной и той же степени. Тогда при некотором к

где с0 - свободный член, И(К) - однородные многочлены степени р(г),г = 1,2,. .,к, причем 1 < Ь(1) < Ь(2) <... < Ь(к). Отметим, что

Покажем, что существуют действительные числа с, г = 2, ..., к, такие,

что

И^ = с0 + И^ + И^^ + ... + И^,

(31)

И(X = аьИ (X), г = 1,2,...,к.

(32)

иЬ(1)( X) ° сХ<г\X).

(33)

Для начала заметим, что при a ® 0

h(ax) = ab(1\( X) + O(ab(m). (34)

Из (34) и допустимости j(x) = ax при любом a > 0 относительно h(X) следует, что h(X1) < h(X2) тогда и только тогда, когда h1(X1) < h1(X2). Действительно, пусть h(X1) < h(X2). Тогда h(aX1) < h(aX2) при любом a > 0. Из (34) следует, что в этом случае h1(X1) < h1(X2). Покажем, что имеет место строгое неравенство. Предположим, противное, пусть h1(X1) = h1(X2). Если h(X1) < h(X3) < h(X2), то из (34) и условия устойчивости относительно сравнения следует, что h1(X1) = h1(X3) = h1(X2). В силу непрерывности h(X) существует окрестность B = {X: р(X, X3) <e точки X3 (р - евклидова метрика в Rn) такая, что h(X1) < h(X) < h(X2) для любого X е B, а потому h1(X) = h1(X1) = const для любого X е B . Отсюда следует, что h1(X) = const для всех X е Rn (убедиться в этом можно, например, перенеся центр, в X3 и воспользовавшись выражением коэффициентов многочлена через значения производных в начале координат). Итак, получено противоречие, доказывающее, что h1(X1) < h1(X2).

Докажем обратное утверждение. Пусть h1(X1) < h1(X2). Тогда из (34) следует, что h(aX1) при достаточно малых a меньше h(aX2), а потому в соответствии с допустимостью j относительно h, где j(x) = a~lx, имеем h(X1) < h(X2). Из проведенных рассуждений следует также, что h(X1) = h(X2) тогда и только тогда, когда h1(X1) = h1(X2). Поэтому существует строго возрастающая функция g1 такая, что

h(X) = g1(h1(X)) (35)

при всех X е Rn. Областью определения g1 является область значений однородного многочлена h1(X), т.е. R1, [0,+¥) или (-¥,0].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нетрудно видеть, что при a ® ¥

h(aX) = ab(k )hk (X) + O(ab( k )-1). (36)

Аналогично доказательству (35) получаем, что

h(X) = g2(W)) (37)

для некоторой строго возрастающей функции g2. Следовательно,

hk (X) = g-1 (h( X)) = g-1( gi(hi( X))) = g3(hi(X)), (38)

где g3 - строго возрастающая функция.

Найдем функцию g3. Из (38) следует, что

hk(bX) = g3(M(bX).

Однако h1(bX) = bß(X)hl(X). С другой стороны hk(bX) = bß(k)hk(X) = bß(k)g3(h1(X)). Полагая у = h1(X), bß(1) = с, получаем функциональное уравнение

gbm(cy) = cb(k) g3( y),

откуда

gb(1)(y) = ckyß(k) (39)

при соответствующем ck. Из (38) и (39) следует справедливость (33) при i = k.

Из (35) и (38) следует существование функции g4 такой, что

h1(X) + h2(X) + ... + hk-1(X) = g4(h1(X)). (40)

Как нетрудно показать,

lim aß( k-1) (hj (aX) + h2 (aX) +... + hk (aX)) = hk (X). (41)

Из (40) и (41) следует существование функции g5 такой, что

hk-1(X) = g5(h1(X)). (42)

Именно,

g5(y) = l®m a~ß(k-1) g4(aß(1) y). (43)

Существование предела в (43) следует из существования предела в (41).

Последовательно доказываем, что каждый из многочленов hi(X), i = 2, 3, ..., k - 2, представляется в виде функции от h1(X). Эти функции явно находятся аналогично выводу (39) из (38), а из явного вида этих функций следует справедливость (33) для всех i = 2, 3, ..., k.

Всякий многочлен от n переменных разлагается в произведение неприводимых множителей Это разложение однозначно с точностью до

множителей нулевой степени [16, с.315]. Разложим к^Т)., / = 1, 2, ..., к, на неприводимые множители. Из справедливости (33) следует существование многочлена h0(X) такого, что

к (X) = аХ"^), (44)

где а(/) - натуральные числа, а - действительные числа, I = 1, 2, ..., к. Из (31) и (44) следует заключение теоремы 11. Доказательство закончено, поскольку из (44) следует также однородность h0(X), а из неё -допустимость р(x) = ax относительно полученного многочлена к^К) при любом а > 0.

Сравнивая методы разделов 4 и 5, видим, что для решения задач (I) и (II) раздела 2 в каждом конкретном случае необходимо использовать свой математический аппарат, хотя бы допустимыми были одни и те же преобразования.

6. Адекватность показателей связи

Приведем сводку найденных нами свойств характеристик случайных величин.

1. Для любой случайной величины X и любого строго возрастающего преобразования р медиана р^) есть р(швё(X)).

2. Пусть для любых случайных величин X и У из М(X) < М(У) следует М(р(X)) < М(р(У)), где р - всюду дифференцируемая функция. Тогда р -линейная функция: р(x) = ax + Ь, где а > 0.

3. Пусть для любых случайных величин X и У из 0(3) < О(У) следует, что 0(р(X)) < 0(р(У)), где функция р - строго возрастающая и всюду дифференцируемая. Тогда р - линейная функция.

4. Свойство 3 остается справедливым при замене дисперсии Б(Х) на среднее абсолютное отклонение М^ - М^!).

5. Пусть для любой случайной величины X выполнено одно из равенств

0(X) = 0(р(X)), М(| X -М(X) |) = М(| р(X) -М(р(X)) |), (45)

где р - строго возрастающая функция. Тогда р(x) = x+Ь при некотором Ь. Обратно, равенства (45) выполнены для всех р, допустимых в шкале разностей.

Рассмотрим коэффициент вариации

^) = ЩХ1 М(X) Ф 0.

М (X)

6. Пусть у(X) = у(р(X)) для всех случайных величин X, где р -некоторая строго возрастающая функция. Тогда существует а > 0 такое, что р(x) = ax. Обратно, коэффициент вариации является адекватным в шкале отношений.

Перейдем к рассмотрению показателей связи между случайными величинами. Рассмотрим случайный вектор (X, У), коэффициент ковариации

соу^, У) = М^ - М^ХУ - М(У)) и коэффициент корреляции

г (X, У) = СОУ^.

7. Пусть соу( X ,У) = соу(р( X ),р(У)) для любого случайного вектора (X, У), где р - строго возрастающая функция. Тогда р(x) = x + Ь при некотором Ь. Обратно, коэффициент ковариации является адекватной статистикой в шкале разностей.

8. Пусть г (X ,У) = г (р( X ),р(У)) для любого случайного вектора (X, У), где р - строго возрастающая функция. Тогда р(x) = ак + Ь при некоторых а > 0 и Ь. Обратно, коэффициент корреляции является адекватной характеристикой в шкале интервалов.

Многие встречающиеся в приложениях величины измерены в шкале отношений. Использование для них в качестве показателя связи коэффициента корреляции, адекватного в шкале с более широкой группой допустимых преобразований, может приводить к потере информации. Представляется целесообразным использовать вместо коэффициента корреляции следующий показатель связи:

cos( X, 7 ) = . M (XY) , 4m ( X 2)VM (72)

т.е. косинус угла между случайными величинами X и 7, рассматриваемыми как вектора в линейном пространстве функций на пространстве элементарных событий W со скалярным произведением (X, 7) = M(X7).

9. Пусть cos( X, 7 ) = cos(j( X ), р(7 )) для любого случайного вектора (X, 7), где р - строго возрастающее преобразование. Тогда р(x) = ax при некотором a > 0. Обратно, косинус угла между случайными величинами является адекватной характеристикой в шкале отношений.

Свойства 1 - 9 доказаны элементарными средствами (с привлечением результатов раздела 4) в [5, разд. 3.6]. Косинус угла выбран как показатель связи между промышленными отраслями в [17, с.62]. С позиций теории измерений показатели связи изучались в [17, 18], а расстояния - в [19 - 21]. Поскольку ранговые методы математической статистики адекватны в порядковой шкале, то при анализе измерений в порядковой шкале целесообразно использовать коэффициенты ранговой корреляции Кендалла или Спирмена (см. также [22]).

Развитие работ в рассматриваемой области обсуждается в [23, 24].

Литература

1. Джини К. Средние величины. - М.: Статистика, 1970. -556 с.

2. Kolmogorov, A. N. Sur la notion de la moyenne // Atti Accad. naz. Lincei. Rend., 1930, vol.12, N 9, p. 388-391. Перепечатка: Колмогоров А.Н. Об определении среднего // Колмогоров А.Н. Избранные труды. Математика и механика. - М.: Наука, 1985. - С. 136 - 138.

3. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В. Прохоров. - М.: Большая Российская энциклопедия, 1999. - 911 с.

4. Кузьмин В.Б., Овчинников С.В. Об измерениях в порядковых шкалах // Автоматика и телемеханика. 1974. № 11. С. 106-112.

5. Орлов А.И. Устойчивость в социально-экономических моделях. — М.: Наука, 1979. — 296 с.

6. Орлов А.И. Организационно-экономическое моделирование: : учебник : в 3 ч. Ч.1: Нечисловая статистика. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2009. — 542 с.

7. Орлов А.И. Статистика объектов нечисловой природы // Тезисы докладов Третьей международной Вильнюсской конференции по теории вероятностей и математической статистике. Том 2. - Вильнюс, 1981. - С. 94-95.

8. Орлов А.И. Допустимые средние в некоторых задачах экспертных оценок и агрегирования показателей качества // Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. - С.388-393.

9. Орлов А.И. Допустимые преобразования в задаче сравнения средних: Y -постоянные статистики // Алгоритмы многомерного статистического анализа и их применения. - М.: ЦЭМИ АН СССР, 1975. - С. 121-127.

10. Мешалкин Л.Д. О допустимых агрегированных показателях в экспертных оценках // Статистические методы анализа экспертных оценок. - М.: Наука, 1977. - С. 215-219.

11. Гнеденко Б.В. Курс теории вероятностей. - М.: Наука, 1969. - 400 с.

12. Орлов А.И. Связь между средними величинами и допустимыми преобразованиями шкалы // Математические заметки, 30:4 (1981), С. 561-568; Math. Notes, 30:4 (1981), 774-778.

13. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. Том 1. - М.: Наука, 1966. - 608 с.

14. Nagumo M. Uber eine Klasse der Mittlewerte //Jap. J. Math. 1930. V.7. P. 71-79.

15. Орлов А.И. Математические методы теории классификации // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 95. С. 23 - 45.

16. Курош А.Г. Курс высшей алгебры. - М.: Наука, 1965. - 452 с.

17. Заимских А.Н., Лейбкинд А.Р., Рудник Б.Л. Проблема выбора коэффициентов близости и алгоритмов автоматической классификации в процедурах структуризации. -М.: ЦЭМИ АН СССР, 1970. - 64 с.

18. Высоцкий В.С. Инвариантность коэффициентов связи // Прикладной многомерный статистический анализ. - М.: Наука, 1978. - С.348-351.

19. Толстова Ю.Н. Адекватность функции расстояния в алгоритмах автоматической классификации // Исследования по вероятностно-статистическому моделированию реальных систем. - М.: ЦЭМИ АН СССР, 1977. - С. 168-173.

20. Толстова Ю.Н. Сопоставимость результатов классификации при использовании различных шкал // Социологические исследования. 1978. № 3. С. 178184.

21. Толстова Ю.Н. Корректность функции расстояния относительно типа используемых шкал в социально-экономических задачах // Экономика и математические методы. 1978. ^XIV. №3. С. 598-603.

22. Анализ нечисловой информации / Ю.Н. Тюрин, Б.Г. Литвак, А.И. Орлов, Г.А. Сатаров, Д.С. Шмерлинг. — М.: Научный Совет АН СССР по комплексной проблеме «Кибернетика», 1981. — 80 с.

23. Барский Б. В., Соколов М. В. Средние величины, инвариантные относительно допустимых преобразований шкалы измерения // Заводская лаборатория. Диагностика материалов. 2006. Т.72. №1. С. 59-66.

24. Орлов А. И. Математические методы исследования и теория измерений // Заводская лаборатория. Диагностика материалов. 2006. Т.72. №1. С.67-70.

References

1. Dzhini K. Srednie velichiny. - M.: Statistika, 1970. -556 s.

2. Kolmogorov, A. N. Sur la notion de la moyenne // Atti Accad. naz. Lincei. Rend., 1930, vol.12, N 9, p. 388-391. Perepechatka: Kolmogorov A.N. Ob opredelenii srednego // Kolmogorov A.N. Izbrannye trudy. Matematika i mehanika. - M.: Nauka, 1985. - S. 136 -138.

3. Verojatnost' i matematicheskaja statistika: Jenciklopedija / Gl. red. Ju.V. Prohorov. - M.: Bol'shaja Rossijskaja jenciklopedija, 1999. - 911 s.

4. Kuz'min V.B., Ovchinnikov S.V. Ob izmerenijah v porjadkovyh shkalah // Avtomatika i telemehanika. 1974. № 11. S. 106-112.

5. Orlov A.I. Ustojchivost' v social'no-jekonomicheskih modeljah. — M.: Nauka, 1979. — 296 s.

6. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie: : uchebnik : v 3 ch. Ch.1: Nechislovaja statistika. — M.: Izd-vo MGTU im. N. Je. Baumana, 2009. — 542 s.

7. Orlov A.I. Statistika ob#ektov nechislovoj prirody // Tezisy dokladov Tret'ej mezhdunarodnoj Vil'njusskoj konferencii po teorii verojatnostej i matematicheskoj statistike. Tom 2. - Vil'njus, 1981. - S. 94-95.

8. Orlov A.I. Dopustimye srednie v nekotoryh zadachah jekspertnyh ocenok i agregirovanija pokazatelej kachestva // Mnogomernyj statisticheskij analiz v social'no-jekonomicheskih issledovanijah. - M.: Nauka, 1974. - S.388-393.

9. Orlov A.I. Dopustimye preobrazovanija v zadache sravnenija srednih: -postojannye statistiki // Algoritmy mnogomernogo statisticheskogo analiza i ih primenenija. -M.: CJeMI AN SSSR, 1975. - S. 121-127.

10. Meshalkin L.D. O dopustimyh agregirovannyh pokazateljah v jekspertnyh ocenkah // Statisticheskie metody analiza jekspertnyh ocenok. - M.: Nauka, 1977. - S. 215219.

11. Gnedenko B.V. Kurs teorii verojatnostej. - M.: Nauka, 1969. - 400 s.

12. Orlov A.I. Svjaz' mezhdu srednimi velichinami i dopustimymi preobrazovanijami shkaly // Matematicheskie zametki, 30:4 (1981), S. 561-568; Math. Notes, 30:4 (1981), 774778.

13. Fihtengol'c G.M. Kurs differencial'nogo i integral'nogo ischislenija. Tom 1. - M.: Nauka, 1966. - 608 s.

14. Nagumo M. Uber eine Klasse der Mittlewerte //Jap. J. Math. 1930. V.7. P. 71-79.

15. Orlov A.I. Matematicheskie metody teorii klassifikacii // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta. 2014. № 95. S. 23 - 45.

16. Kurosh A.G. Kurs vysshej algebry. - M.: Nauka, 1965. - 452 s.

17. Zaimskih A.N., Lejbkind A.R., Rudnik B.L. Problema vybora kojefficientov blizosti i algoritmov avtomaticheskoj klassifikacii v procedurah strukturizacii. - M.: CJeMI AN SSSR, 1970. - 64 s.

18. Vysockij V.S. Invariantnost' kojefficientov svjazi // Prikladnoj mnogomernyj statisticheskij analiz. - M.: Nauka, 1978. - S.348-351.

19. То^оуа .Ги.К. Лёекуа1;по81;' Шпкс11 га881о]апуа у а^опШаЬ ауШшайсЬевко] ЫаввШкасп // Ь81еёоуапуа ро уегс^аШовШо^айвйсЬевкоши шоёеНгоуапуи геа1'пуИ ^еш. - М.: С1еМ1 ЛК 888Я, 1977. - Б. 168-173.

20. То^оуа .Ги.К. 8оро81ау1шов1;' ге2и1Ъ1;оу ЫаввШкасп рг1 ^ро^оуапп га211сЬпук вЬка1 // 8ос1о1о§1сЬевк1е ^Ыоуапуа. 1978. № 3. Б. 178-184.

21. ТоЫоуа .Ги.К. Коггек1;по81;' Шпкс11 га881о]апуа оШоБ^еГпо йра ^ро^иешуЬ вЬка1 у востГпо^екопошюЬевкШ 2аёаскаЬ // 1екопош1ка 1 ша1еша11сЬе8к1е ше1юёу. 1978. Т.ХГУ. №3. Б. 598-603.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

22. Лпа^ песЬЫоуо] 1п1х>гшас11 / .Ги.К. Т]иг1п, Б.О. Ькуак, Л.1. Ог1оу, О.Л. Ба1агоу, Б.Б. 8Ьшег11п§. — М.: КаисИпу] Боуе1 ЛК 888Я ро кошр1екБпо] ргоЬ1еше «КЛегпеНка», 1981. — 80 б.

23. Багеку Б. У., Боко1оу М. У. Бгеёше уеНсЫпу, 1пуапап1;пуе оШовкеГпо ёоршйшуЬ ргеоЬга2Оуапу вЬка1у ^шегепуа // 2ауоёвка]а 1аЬога1;огуа. Б1а§по81;1ка ша1ег1а1оу. 2006. Т.72. №1. Б. 59-66.

24. Ог1оу Л. I. Ма1еша11сЬе8к1е ше1юёу ^еёоуапуа 1 1еогуа ^шегепу // 2ауоёвка]а 1аЬога1;огуа. Б1а§по81;1ка ша1ег1а1оу. 2006. Т.72. №1. Б.67-70.

i Надоели баннеры? Вы всегда можете отключить рекламу.