Научная статья на тему 'Многомерное шкалирование на базе метода Верле'

Многомерное шкалирование на базе метода Верле Текст научной статьи по специальности «Математика»

CC BY
214
86
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД ВЕРЛЕ / МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ / ФАКТОРНЫЙ АНАЛИЗ

Аннотация научной статьи по математике, автор научной работы — Шовин В.А.

Предложен новый метод факторизации посредством многомерного шкалирования на базе метода Верле. Результаты факторизации корреляционной матрицы с помощью данного метода находятся в соответствии с классическими методами (метод главных компонент, метод минимальных остатков).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многомерное шкалирование на базе метода Верле»

Математические

структуры и моделирование УДК 519.237.07

2015. №4(36). С. 117-122

многомерное шкалирование на базе метода

верле

В.А. Шовин

научный сотрудник, e-mail: v.shovin@mail.ru

Омский филиал Федерального государственного бюджетного учреждения науки Института математики им. С.Л. Соболева Сибирского отделения РАН

Аннотация. Предложен новый метод факторизации посредством многомерного шкалирования на базе метода Верле. Результаты факторизации корреляционной матрицы с помощью данного метода находятся в соответствии с классическими методами (метод главных компонент, метод минимальных остатков).

Ключевые слова: метод Верле, многомерное шкалирование, факторный анализ.

Введение

Многомерное шкалирование позволяет в рамках гипотезы о размерности целевого пространства расположить объекты по их взаимным расстояниям таким образом, чтобы восстанавливаемые расстояния между объектами приближались к эмпирическим.

Метод Верле — это итерационный метод вычисления следующего местоположения точки по текущему и прошлому. Этот метод позволяет учитывать дополнительные ограничения, накладываемые на системы точек, например, расстояния между точками. На базе метода Верле предлагается осуществить многомерное шкалирование, тем самым взаимные расстояния между точками будут учтены с наибольшей точностью.

В качестве матрицы взаимных расстояний будет выступать матрица корреляций. С помощью многомерного шкалирования будет осуществлена факторизация корреляционной матрицы, тем самым будет восстановлена факторная структура данных в факторном пространстве. Чтобы получить интерпретабельное решение, предлагается использовать отдельные методы факторного вращения, применённые к восстановленной факторной структуре.

1. Метод Верле

Алгоритм Верле используется для вычисления следующего положения точки по текущему и прошлому:

118

B.A. Шовин. Многомерное шкалирование на базе метода Берле

xj = xj 1 + Vj,

xj = (xj1, xj2,..., xjm) — вычисляемые координаты /-ой точки на /-ой итерации,

m — размерность пространства,

— —i — 1 — i — 2

Vj = xj — x j — вектор скорости /-ой точки.

На систему точек накладываются ограничения.

Некоторые из точек связаны упругими стержнями заданной длины. Алгоритм работает следующим образом:

1. Вычисляются новые положения точек.

2. Для каждой связи удовлетворяется соответствующее условие.

3. Шаг 2 повторяется s раз.

Например, s = 16.

Процедура релаксации связи описывается следующими формулами:

Если связь представлена точками а и be равновесным расстоянием между ними t, то

а = а 1 + г, bi = bi-1 — г

f

q

г

f • q •

t — |ai-1 — bi-1 la-1 - bi-1|

a

i-1

b

i- 1

>

0.7

1

s

- коэффициент упругости связи,

коэффициент, зависящий от числа s повторений шага 2.

2. Многомерное шкалирование

Многомерное шкалирование (МНШ) - это способ наиболее эффективного размещения объектов, приближённо сохраняющий наблюдаемые между ними расстояния. МНШ размещает объекты в пространстве заданной размерности и проверяет, насколько точно полученная конфигурация сохраняет расстояния между объектами. МНШ использует алгоритм минимизации некоторой функции, оценивающей качество получаемых вариантов отображения.

Мерой, наиболее часто используемой для оценки качества подгонки модели (отображения), измеряемого по степени воспроизведения исходной матрицы сходств, является так называемый стресс. Величина стресса у для текущей конфигурации определяется так:

m

А = S (dij — f (6ij^ .

i=1,j=i+1

Математические структуры и моделирование. 2015. №4(36)

119

Здесь dj — воспроизведённые расстояния в пространстве заданной размерности, a 5ij — исходное расстояние, m — количество объектов. Функция f (6ij) обозначает неметрическое монотонное преобразование исходных данных (расстояний). МНШ воспроизводит не количественные меры сходств объектов, а лишь их относительный порядок. Чем меньше значение стресса, тем лучше матрица исходных расстояний согласуется с матрицей результирующих расстояний.

3. Главные компоненты и факторная модель

Модель главных компонент описывается следующими формулами

Zi = a i pi + a,i2pt + ... + aig pg + diiUi

m — число переменных, g — число факторов, p — исходные переменные, pi — общие факторы, р — специфичные факторы.

Корреляции между исходными переменными могут быть определены как скалярное произведение нормализованных последних с нулевым средним и единичной дисперсией:

1

ij

n + 1

■zi

pj

zj,

n — размерность исходного пространства переменных.

Коэффициенты корреляций между исходными переменными определяют матрицу корреляций, сходную с матрицей взаимных расстояний метода многомерного шкалирования. Поскольку Ближним объектам в факторном пространстве соответствуют большие значения коэффициентов корреляций, то элементы матрицы взаимных расстояний dij получаются из соответствующих элементов матрицы корреляций rij по формуле:

dij = 1 - \r-ij\.

С помощью метода Верле будет восстановлена факторная структура в рамках гипотезы о размерности g факторного пространства.

Факторная структура

Элементы факторной структуры aij могут быть определены как коэффициент корреляции между j-ой факторной осью и i-ой переменной:

aij

si ' fj \si\ • | fj

fi

(6i1, . . . , 6ig)

120

В.А. Шовин. Многомерное шкалирование на базе метода Берле

5%3

,Jj

стве,

h j h c

стве,

M = j,

0,i = j

символ Кронекера,

hj — hc — вектор направления j-ой переменной в факторном простран-

ная переменная в факторном пространстве,

центр масс факторной структуры переменных в факторном простран-

4. Численный эксперимент

В качестве исходных параметров были взяты 15 биофизических показателей для 131 лица с артериальной гипертензией начальной стадии:

1) вес,

2) индекс массы тела (ИМТ),

3) частота дыхания (ЧД),

4) сегментоядерные нейтрофилы (С),

5) лимфоциты (Л),

6) конечно-систолический размер левого желудочка (КСР),

7) конечно-систолический объем левого желудочка (КСО),

8) конечно-диастолический размер левого желудочка (КДР),

9) конечно-диастолический объем левого желудочка (КДО),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10) ударный объем (УО),

11) минутный объем сердца (МОС),

12) общее периферическое сосудистое сопротивление (ОПСС),

13) индекс Хильдебрандта (ИХ),

14) фракция выброса левого желудочка (ФВ),

15) фракция укорочения левого желудочка (ФУ).

Программная реализация

Метод Верле был реализован программно с использованием общедоступной JavaScript библиотеки Verlet,js, которая была усовершенствована для многомерного случая, Web-приложение многомерного шкалирования на базе метода Верле доступно по адресу: http://svlaboratory,org/application/multscal — после регистрации нового пользователя, Приложение позволяет визуализировать процесс сходимости метода Верле в заданной плоскости координат (рис, 1),

Результирующая факторная структура для данных артериальной гипертензии представлена в таблице 1,

Факторное решение после факторного вращения по критерию интерпрета-бельности, предложенное в работе [1], представлено в таблице 2, Данные факторные структуры подтверждаются предыдущими работами [2],

5. Заключение

Метод многомерного шкалирования на базе метода Верле, применённый к корреляционной матрице, является альтернативным методом факторизации,

Математические структуры и моделирование. 2015. №4(36)

121

Таблица 1. Исходное факторное решение (метод Верле)

F1 F2 F3 F4 F5

Вес -0,469 0,442 0,227 -0,667 0,296

имт -0,336 0,172 0,421 -0,748 0,348

чд -0,258 0,239 0,479 0,68 0,429

с -0,854 -0,444 0,034 0,032 -0,265

л -0,766 -0,584 0,093 0,005 -0,254

кср 0,914 0,151 -0,27 -0,155 -0,214

ксо 0,931 0,11 -0,251 -0,176 -0,165

кдр 0,604 0,096 -0,783 -0,105 -0,044

кдо 0,667 0,109 -0,727 -0,121 -0,011

уо 0,334 0,024 -0,931 -0,099 0,104

мос 0,376 0,003 -0,908 0,062 0,175

опсс 0,156 0,248 -0,855 0,4 -0,155

их -0,189 -0,067 0,492 0,592 0,605

фв 0,576 -0,123 0,687 -0,211 -0,37

фу 0,266 0,085 0,679 0,075 -0,674

Таблица 2. Факторная структура по критерию интерпретабельности (косоугольный случай)

F1 F2 F3 F4 F5

Вес -0,274 -0,251 -0,227 0 0,899

имт -0,352 0 0 -0,198 0,902

чд -0,430 -0,203 0,361 0,765 -0,238

с -0,818 -0,118 -0,209 -0,412 -0,197

л -0,822 0 -0,102 -0,515 -0,220

кср 0,889 0,342 -0,061 -0,042 -0,023

ксо 0,885 0,353 0 -0,067 0

кдр 0,940 -0,210 -0,061 -0,076 -0,039

кдо 0,963 -0,163 -0,019 -0,057 -0,009

уо 0,809 -0,487 -0,009 -0,110 0

мос 0,812 -0,507 0,105 0 -0,114

опсс 0,631 -0,531 -0,254 0,281 -0,417

их -0,453 -0,149 0,653 0,548 -0,205

фв 0 0,967 0,003 -0,219 0,002

фу -0,218 0,867 -0,364 0 -0,257

122

B.A. Шовин. Многомерное шкалирование на базе метода Берле

Рис. 1. Визуализация метода Верле в web-приложении

Для 15 биофизических показателей артериальной гипертензии начальной стадии была получена факторная структура на базе данного метода. Полученная факторная структура находится в соответствии с другими методами факторизации.

Литература

1. Шовин В.А., Гольтяпин В.В. Методы вращения факторных структур // Математические структуры и моделирование. 2015. № 2(34). С. 75-83.

2. Гольтяпин В.В., Шовин В.А. Косоугольная факторная модель артериальной гипертензии первой стадии // Вестник Омского университета. 2010. № 4. С. 120-128.

multidimensional scaling based method verlet

V.A. Shovin

Researcher, e-mail: v.shovin@mail.ru

Omsk Branch of the Federal State budget institution Science Institute of Mathematics S.L. Soboleva of Siberian Branch of RAS

Abstract. A new method of factorization through multidimensional scaling based on Verlet method is proposed. The results of the correlation matrix factorization using this method are in accordance with the classical methods (principal component, the minimal residual method).

Keywords: Verlet method, multidimensional scaling, factor analysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.