Научная статья на тему 'Устранение метрических нарушений в матрицах парных сравнений'

Устранение метрических нарушений в матрицах парных сравнений Текст научной статьи по специальности «Математика»

CC BY
215
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТРИКА / ДЕТЕРМИНАНТ / СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ / РАССТОЯНИЕ / БЛИЗОСТЬ / СХОДСТВО / РАЗЛИЧИЕ / СОБСТВЕННЫЕ ЧИСЛА / METRICS / DETERMINANT / SCALAR PRODUCT / DISTANCE / SIMILARITY / EIGENVALUES

Аннотация научной статьи по математике, автор научной работы — Двоенко С. Д., Пшеничный Д. О.

Показано, что для математически корректного применения алгоритмов анализа данных матрицы парных сравнений элементов множества должны быть положительно определены, что позволяет считать заданной соответствующую метрику. В противном случае метрические нарушения следует устранить. Рассмотрены случаи нарушения и предложены способы их устранения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE REMOVING OF METRIC VIOLATIONS IN MATRIXES OF PAIR COMPARISONS

To implement data analysis algorithms mathematically correct, matrixes of pair wise comparisons need to be positively definite. In other case, the metrics needs to be recovered. The metric violations are shown and procedures are developed to recover metrics.

Текст научной работы на тему «Устранение метрических нарушений в матрицах парных сравнений»

УДК 004.93

УСТРАНЕНИЕ МЕТРИЧЕСКИХ НАРУШЕНИЙ В МАТРИЦАХ ПАРНЫХ СРАВНЕНИЙ

С.Д. Двоенко, Д.О. Пшеничный

Показано, что для математически корректного применения алгоритмов анализа данных матрицы парных сравнений элементов множества должны быть положительно определены, что позволяет считать заданной соответствующую метрику. В противном случае метрические нарушения следует устранить. Рассмотрены случаи нарушения и предложены способы их устранения.

Ключевые слова: метрика, детерминант, скалярное произведение, расстояние, близость, сходство, различие, собственные числа.

Погружение множества в метрическое пространство. В современных исследованиях экспериментальные данные часто представлены результатами парных сравнений элементов множества между собой в виде квадратной матрицы. Если такая матрица положительно определена, то она имеет положительный детерминант и положительные собственные числа. Это означает, что существует много систем координат с общим началом, которые переводятся друг в друга ортогональным вращением. Элементы множества представлены в координатном пространстве векторами, а сходство или различие между ними представлено скалярными произведениями или расстояниями. На основе теоремы о косинусах для известных скалярных произведений можно вычислить такие расстояния и наоборот.

Тогда, если матрица парных сравнений положительно определена, то элементы множества погружены в неизвестное метрическое пространство, например, евклидово, размерности не более, чем ранг матрицы парных сравнений.

Главная диагональ нормированной матрицы скалярных произведений состоит из единиц. Поэтому элементы множества представлены в ор-тонормированном многомерном пространстве векторами, концы которых расположены на гиперсфере единичного радиуса. Если все скалярные произведения положительны, то векторы расположены в положительном квадранте координатной системы.

Обычно после измерения близостей выполняются стандартные преобразования для получения симметричной и нормализованной матрицы парных сравнений с единичной главной диагональю. В частности, такой является обычная матрица взвешенных скалярных произведений (корреляций), когда элементами множества являются признаки.

В результате таких преобразований матрица парных сравнений может оказаться неположительно определенной и иметь отрицательные соб-

ственные числа. Это означает, что в общем случае после таких преобразований множество элементов не может быть погружено в соответствующее метрическое пространство. Очевидно, что эта проблема должна быть решена до собственно проблемы анализа данных и даже до процесса измерений. В интеллектуальном анализе данных и медицинских приложениях это - известная проблема мультимодальных измерений и регистрации [1, 2].

Пусть после стандартных преобразований получена неположительно определенная матрица парных сравнений. Ее можно привести к положительно определенному виду путем удаления из значений близостей относительных вкладов отрицательных собственных чисел и их собственных векторов [3]. В общем случае такое преобразование достигается, например, снижением размерности признакового пространства на основе дискретного разложения Карунена-Лоэва [4, 5] после удаления до 20 % наименьших собственных чисел, включая и отрицательные.

Отметим следующее. Во-первых, в данном случае невозможно контролировать изменения в отдельных значениях парных близостей и, во-вторых, реально теряется информация. Такой подход считается естественным для выявления признаков в задаче Карунена-Лоэва, но это не так, если элементами множества являются объекты, подлежащие распознаванию. Напротив, нам необходимо распознавать все элементы данного множества и делать это математически корректно, применяя соответствующие алгоритмы [6].

Следовательно, в случае неположительно определенной матрицы парных сравнений необходимо в минимальной степени так ее скорректировать, чтобы устранить метрические нарушения и получить положительную определенность.

Метрические отношения в треугольнике. Пусть дана нормированная с единичной главной диагональю матрица S(n, n) парных сравнений n элементов между собой. Недиагональные элементы данной матрицы находятся в диапазоне 0 < stJ < 1 или -1 < s < 1 в общем случае. Эти величины являются скалярными произведениями между соответствующими векторами единичной длины и представляют косинусы углов между ними. Пусть даны три вектора, обозначенные индексами i, j, k . Близость первого из них с самим собой sn = 1, близости с остальными двумя составляют stJ = cosa и stk = cos^. Возьмем вектор i. Все возможные векторы j со значением близости stj к вектору i образуют гиперконус с вершиной в

начале координат. Все возможные векторы к со значением близости s¿¿ к вектору i образуют другой гиперконус с вершиной в начале координат. Все корректные значения s определяются всеми возможными парами векторов j и к представленных своими гиперконусами.

Максимальная близость с1 = соэ(^ - а) может быть получена между векторами, расположенными на одной линии с одной стороны от вектора /. Минимальная близость с2 = соэ(^ + а) может быть получена между векторами на одной линии по разные стороны от вектора I. Если 0 < £ < 1, то (3 + а<л/ 2. По формулам преобразования косинуса суммы и разности аргументов получим с12 = ± ^/(1—я^).

Метрическое нарушение для трех данных векторов означает нарушение интервала с2 < ^ < с1 и нарушение соотношений сторон и углов в

треугольнике. Следовательно, в треугольной пирамиде сумма углов треугольника в ее основании не равна ж, и углы при вершине пирамиды не соответствуют длинам сторон треугольника в основании. Можно показать, что в этом случае соответствующая матрица близостей имеет отрицательный детерминант и, по меньшей мере, одно отрицательное собственное число.

Тем не менее, может оказаться, что все подматрицы данной матрицы близостей для всех троек элементов будут положительно определены, но одновременно вся матрица близостей будет отрицательно определена.

Метрические отношения на множестве. Пусть в «-мерном пространстве концы векторов расположены на гиперсфере единичного радиуса. Будем последовательно добавлять векторы в данное пространство. Пусть первый вектор направлен вдоль п-й оси и представлен своими координатами (0,...,0,1). Согласно теореме косинусов второй вектор имеет близость ¿*12 с первым и удален от него на расстояние ^12 =^^2—2^12. Все его возможные положения относительно первого вектора формируют п-мерную гиперсферу радиуса d12, а все метрически корректные положения удовлетворяют условиям

X2 +... + х2п = 1, X +... + (Хп -1)2 = 2- 2*12.

Отсюда следует, что хп = *12 и х^ +... + х2ч = 1 -после вычитания второго уравнения из первого.

Таким образом, все положения второго вектора определяют (п -1) -

мерную гиперсферу с центром в начале координат и радиусом - , где «-я координата имеет значение хи = *12. В целом, второй вектор определяется своими координатами (0,...0, - 5*^, *12). Полученное выше равенство

х2 +... + х^_1 = 1 -можно представить в виде х12 +... + х2_1 = Б2/ где Б2 является вторым главным минором матрицы ^(п, п) и = *11 = 1 является ее первым главным минором.

Близость второго и третьего векторов определяет расстояние между ними й2Ъ = ^2 - 25*2з . Метрически правильные положения третьего вектора относительно первых двух определяются равенствами

Хп = ^13 ,

Х1 + ... + Хп-1 = 1 — ^13 ,

Х12 + ... + (Хп—1 — V1 — 4 ) + (Хп — ^2)2 = 2 —

23-

Хп—1 =

После вычитания третьего уравнения из второго следует, что — ^2з—^^ = (Мз)з , где (М3)2 является дополнительным минором мат-

^1—5122 3 3

рицы близостей для трех векторов после исключения из нее второй строки и третьего столбца. После подстановки хлЧ во второе уравнение получим

„2 „2 „2

2 2 1+2 517513573 — Л, —513 —Sn3 2 2 О / О

х +... + х 2 = —12 13 23 212 13 23 и окончательно получим х1 +... + х 2 = *3 / *2,

1 512

где *3 является третьим главным минором и Б2 является вторым главным минором.

Далее для четвертого вектора получим его метрически корректные положения с координатой хи_2 = ^М'^к, где (М4)4 является дополнительным минором матрицы близостей для четырех векторов после удаления третьей строки и четвертого столбца. Все положения этого вектора определяют (п — 3)-мерную гиперсферу х2 +... + х^_3 = *4 /*3.

В итоге метрически правильные положения к-го вектора относительно к — 1 предыдущих векторов определяются выражениями

_ (мк)к—1 и 2 2 _ / О

хп—к+2 = И х1 + + хп—к+1 = *к ' *к—1

*к—2 V *к—1

Легко увидеть, что текущий главный минор оказывается меньше предыдущего после добавления нового элемента. Если в этот момент главный минор становится отрицательным, то возникает метрическое нарушение, так как радиус соответствующей гиперферы становится комплексным. В частности, это означает, что на всем множестве, представленном матрицей 5(п, п), все возможные треугольники оказываются метрически корректными, но некоторые элементы, представленные своими векторами, не лежат на соответствующей гиперсфере относительно зафиксированных положений других векторов. Поэтому матрица близостей оказывается неположительно определенной.

В итоге, если нет метрических нарушений, то значение главного минора (детерминанта) матрицы близостей постепенно уменьшается с увеличением ее размера при добавлении новых элементов, оставаясь положительным. Если возникает метрическое нарушение, то главный минор те-

кущего размера оказывается в общем случае знакопеременным, уменьшаясь по модулю при добавлении новых элементов множества [7].

Устранение метрических нарушений. Принцип восстановления метрики для заданной нормализованной матрицы близостей 5(п, п) заключается в следующем. Пусть данное множество элементов просматривается в некотором порядке. На шаге к уже просмотренное множество представлено главным минором БА = Б (к, к), к = 1,..., п. Пусть в этот момент детерминант соответствующей подматрицы близостей (минор Б) оказался отрицательным. Естественно предположить, что именно этот к-й элемент множества внес метрическое нарушение. Этот элемент представлен парными сравнениями с предыдущими к -1 элементами и определяет к-е строку и столбец главного минора Бк.

Если заменить к-й элемент другим, который «ортогонален» всем предыдущим элементам, то мы получим такой же положительный детерминант Б°г' = Бк _1, что и ранее. Действительно, такой элемент образует нулевые строку и столбец его парных близостей с предыдущими элементами и с единицей на главной диагонали. Поэтому вычисление минора Б°г' по элементам последней строки заключается только в вычислении минора Б-р Фактически, метрическое нарушение уже устранено. Но такой новый элемент множества слишком отличается от исходного, который внес нарушение.

Будем разворачивать ортогональный элемент по направлению к исходному элементу так, чтобы минор Б оказался положительным, а новый элемент был бы максимально похож на исходный по своим парным близостям со всеми предыдущими элементами множества.

Процедура корректировки. Зададим точность б> 0 вычисления детерминанта Б'к в диапазоне изменения от Р1 = Бк < 0 до Р2 = Б°г' > 0.

1. Б'к = (р + Р2)/2.

2. Если Б'к > 0, то Р2 = Б'к. Если Б'к< б , то стоп, иначе перейти к 1.

3. Если Бк < 0, то р = Бк и перейти к 1.

Параметр е управляет диапазоном изменений элементов последней строки и столбца в матрице близостей и определяет общее отклонение минора Бк от минора Б.

В общем случае элементы множества могут просматриваться и в другом порядке.

Поиск наилучшей корректировки. Пусть к-й элемент внес метрическое нарушение.

1. Размещая данный элемент на всех предыдущих местах д = 1,...,к, устранять метрические нарушения процедурой корректировки. В каждом случае найти минор Б'к(я), который наименее отличается от минора .

2. Присвоить Бк = £[(ч) и перейти к шагу к = к +1.

Очевидно, что перестановка элемента, внесшего метрическое нарушение, может вызвать нарушения от других элементов. В общем случае поиск наилучшего положения является комбинаторной проблемой.

Эксперименты. Одной из задач экспериментальной психофизиологии является изучение взаимосвязи между стабильностью центральной нервной системы человека и изменчивостью нейронной активности. В частности, существует т.н. эффект навязывания ритма, заключающийся в том, что при предъявлении звукового или светового раздражителя заданной частоты в ЭЭГ испытуемого резко меняются характеристики составляющей такой же частоты. Этот эффект исследовался, например, российским психологом В.Д. Небылицыным [8-10]. Исследуемое множество состояло из 11 частот, соответствующих основным биоритмам головного мозга, и было разделено изначально на четыре группы: три частоты в — ритмов, две частоты НЧ а —ритмов, две частоты ВЧ а —ритмов и четыре частоты ¡- ритмов. Статистические взаимосвязи между энергетическими характеристиками биоритмов для 11 частот навязанных ритмов были представлены корреляционной матрицей £ (11,11) =

1,000 0,562 0,568 0,152 0,347 0,250 0,264 -0,020 -0,212 -0,086 -0,076

0,562 1,000 0,784 0,057 0,196 0,218 0,009 -0,017 -0,002 0,163 0,284

0,568 0,784 1,000 0,288 0,475 0,264 0,066 0,144 0,114 0,228 0,151

0,152 0,057 0,288 1,000 0,686 0,293 0,034 0,048 -0,069 0,064 0,175

0,347 0,196 0,475 0,686 1,000 0,429 0,070 0,152 0,036 0,028 0,216

0,250 0,218 0,264 0,293 0,429 1,000 0,788 0,197 0,154 0,109 0,035

0,264 0,009 0,066 0,034 0,070 0,788 1,000 0,109 0,054 -0,002 -0,018

-0,020 -0,017 0,144 0,048 0,152 0,197 0,109 1,000 0,807 0,830 0,699

-0,212 -0,002 0,114 -0,069 0,036 0,154 0,054 0,807 1,000 0,904 0,728

-0,086 0,163 0,228 -0,064 0,028 0,109 -0,002 0,830 0,904 1,000 0,768

-0,076 0,284 0,151 0,175 0,216 0,035 -0,018 0,699 0,728 0,768 1,000

и были исследованы позже методами факторного анализа [11].

Детерминант данной корреляционной матрицы отрицателен £п =-0,000057, но предыдущие главные миноры 5'1...5'10 оказались положительными: 1,0; 0,684156; 0,247407; 0,207991; 0,085501; 0,067529; 0,012892; 0,011311; 0,003096 и 0,000352. Следовательно, последний элемент вносит метрическое нарушение. Более того, все ( Ц ) = 165 подматриц, образованных тройками элементов, оказались положительными.

После исправления нарушения с точностью б = 0,1 детерминант оказался положительным, где Б11 = 0,00025, а последняя строка и столбец корреляционной матрицы имеют вид

-0,0380 0,1420 0,0755 0,0875 0,1080 0,0175 -0,0090 0,3495 0,3640 0,3840 1,0000 .

Для поиска наилучшей корректировки нарушающий элемент был

поочередно размещен в позициях q = 1,___,11, для которых были вычислены

соответствующие им суммарные отклонения: 1,688072 для q = 1,...,8; 1,152691 для q = 9; 1,290631 для q = 10 и только 0,670163 для q = 11. При этом возникали нарушения от 9-го, 10-го и 11-го элементов множества для q = 1,...,8; от 9-го и 11-го элементов множества для q = 9; от 10-го и 11-го элементов множества для q = 10 и от 11-го элемента множества для q = 11. В итоге была получена наилучшая корректировка 5,1'1(11) = Б11 = 0,00025.

Очевидно, что такая корректировка является не совсем подходящей, так как процедура корректировки выполнилась за один шаг. Для выполнения большего числа шагов корректировки нужно, чтобы параметр е оказался меньше результирующего минора Б11 = 0,00025. Пусть б = 0,0001. После трех шагов корректировки детерминант оказался положительным Б11 = 0,000039, а последняя строка и столбец корреляционной матрицы имеют вид

-0,0665 0,2485 0,1321 0,1531 0,1890 0,0306 -0,0158 0,6116 0,6370 0,6720 1,0000 .

Снова для поиска наилучшей корректировки нарушающий элемент был поочередно размещен в позициях q = 1,___,11, для которых были вычислены соответствующие суммарные отклонения: 2,005766 для q = 1,...,8; 2,316369 для q = 9; 0,827211 для q = 10 и только 0,167541 для q = 11. При этом снова возникали нарушения от 9-го, 10-го и 11-го элементов множества для q = 1,...,9; от 10-го и 11-го элементов множества для q = 10 и снова от 11-го элемента множества для q = 11. В итоге была получена наилучшая корректировка Б1'1(11) = Б11 = 0,000039.

Следует отметить, что во многих случаях отрицательное значение детерминанта матрицы близостей может оказаться небольшим и сравнимым с точностью вычислений. Поэтому некоторый метод коррекции в общем случае может внести дополнительные искажения. Практические рекомендации в данном случае заключаются в том, чтобы не корректировать данные.

В рассматриваемом случае коррекция всегда будет выполнена. Параметр е регулирует диапазон изменений элементов матрицы близостей.

Это является важным свойством данной процедуры, так как степень доверия исследователя может существенно зависеть от его согласия с проведенной коррекцией. При этом всегда получается математически корректный результат обработки.

Для полноты картины следует заметить, что аналогичная ситуация возникает при экспертном оценивании, когда ранжируют элементы множества. Результаты часто получают в виде парных сравнений, где от экспертов принято не требовать транзитивности их индивидуальных мнений, возлагая исправление нарушений на метод обработки. Ранжирование означает проведение измерений в менее мощных ранговых шкалах. Ограниченность допустимых операций в менее мощных шкалах позволяет ввести достаточно простые условия транзитивности отношений, чтобы, например, для ранговых шкал получить т.н. сверхтранзитивную матрицу, где выполняется условие Льюса [12].

Очевидно, что в результате коррекции может быть получена плохо обусловленная матрица, так как в общем случае принцип корректировки дает близкий к нулю положительный детерминант матрицы близостей. Тем не менее, предложенный подход отличается от сложных методов вычислительной математики, предназначенных для обработки плохо обусловленных матриц. В данном подходе корректируются сами данные, и этот процесс является контролируемым.

Работа частично поддержана грантами РФФИ 11-07-00728, 11-0700634, 13-07-00010.

Список литературы

1. Scholkopf B., Smola A.J. Learning with kernels. Cambridge: MIT Press, 2002.

2. Zollei L., Fisher J., Wells W. A unified statistical and information theoretic framework for multi-modal image registration// Proc. of IPMI Conf., 2003. P. 366-377.

3. Pekalska E., Duin R.P.W. The dissimilarity representation for pattern recognition. Foundations and applications. Singapore: World Scientific, 2005.

4. Tou J.T., Gonzalez R.C. Pattern recognition principles. Reading, Massachusetts: Addison-Wesley, 1974.

5. Duda R.O., Hart P.E., Stork D.G. Pattern classification. N.Y.: Wiley,

2001.

6. Dvoenko S.D. Clustering and separating of a set of members in terms of mutual distances and similarities// Transactions on machine learning and data mining. IBal Publishing, 2009. Vol. 2. No. 2. P. 80-99.

7. Watkins D.S. Fundamentals of matrix computations. N.Y.: Wiley,

8. URL: http://en.wikipedia.org/wiki/Vladimir_Nebylitsyn (дата обращения: 29.12.2012).

9. Небылицын В.Д. Основные свойства нервной системы человека. М.: Просвещение, 1966.

10. Небылицын В.Д. Психофизиологические исследования индивидуальных различий. М.: Наука, 1976.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Lumelskii V.Ya. Parameter grouping on the basis of the square coupling matrix// Automation and Remote Control. Pleiades Publishing, Ltd., 1970, Vol.1. P. 117-127.

12. Luce R.D. Individual choice behaviour. N.Y.: Wiley, 1959.

Двоенко Сергей Данилович, д-р физ.-мат. наук, доцент, профессор, dsdatsu. tula.ru, Россия, Тула, Тульский государственный университет,

Пшеничный Денис Олегович, магистрант, denispshenichny@yandex.ru, Россия, Тула, Тульский государственный университет

THE REMOVING OF METRIC VIOLATIONS IN MATRIXES OF PAIR COMPARISONS

S.D. Dvoenko, D.O. Pshenichny

To implement data analysis algorithms mathematically correct, matrixes of pair-wise comparisons need to be positively definite. In other case, the metrics needs to be recovered. The metric violations are shown and procedures are developed to recover metrics.

Key words: metrics, determinant, scalar product, distance, similarity, eigenvalues.

Dvoenko Sergey Danilovich, doctor of physic-mathematical sciences, docent, professor, dsd@tsu.tula.ru, Russia, Tula, Tula State University,

Pshenichny Denis Olegovich, master student, denispshenichny@yandex.ru, Russia, Tula, Tula State University

i Надоели баннеры? Вы всегда можете отключить рекламу.