Научная статья на тему 'Многомерное шкалирование структуры общества'

Многомерное шкалирование структуры общества Текст научной статьи по специальности «Математика»

CC BY
538
55
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Трусова Алла Юрьевна

Данная статья посвящена использованию методов многомерного шкалирования для анализа социального самочувствия населения современной России. Применяя методы метрического и неметрического шкалирования, восемь типогрупп были представлены в двумерном координатном пространстве социального самочувствия.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Трусова Алла Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многомерное шкалирование структуры общества»

УДК 519.237(075.8)

Л 10 Трусова*

МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ СТРУКТУРЫ ОБЩЕСТВА

Данная статья посвящена использованию методов многомерного шкалирования для анализа социального самочувствия населения современной России. Применяя методы метрического и неметрического шкалирования, восемь ти-погрупп были представлены в двумерном координатном пространстве социального самочувствия.

Ключевые слова и фразы: многомерное шкалирование, многомерное пространство, двумерное пространство.

В настоящее время методы многомерного шкалирования (МШ) продолжают бурно развиваться в разделах математики и теории анализа данных и находят самое разнообразное применение в экономике и социальных науках [1]. Методы МШ являются универсальными и многофункциональными [2]. Универсальность объясняется возможностью использования самых различных отношений между изучаемыми признаками и объектами (сходства, предпочтения). Многофункциональность определяется тем, что методы МШ квалифицируются и как методы « визуализации данных», и как методы понижения размерности, и как методы поиска латентных факторов [3].

Общая схема шкалирования

Схема включает ряд последовательных этапов [4]. Первый этап - создание матрицы попарных различий или матрицы субъективных предпочтений. На втором этапе решается формальная задача построения координатного пространства и размещения в нем точек-объектов таким образом, чтобы расстояния между ними, определяемые по введенной метрике, соответствовали исходным различиям. Для построения искомого координатного пространства используется аппарат линейной или нелинейной оптимизации. Вводится критерий качества отображения, называемый стрессом и измеряющий степень рас-

• © Трусова А.Ю., 2008 _I А ¿Ц

Трусова Алла Юрьевна ([email protected]), кафедра математики, информатики и математических методов в экономике Самарского государственного университета, 443011, Россия, г Самара, ул. Акад. Павлова, 1.

хождения между исходными различиями (близостями) и результирующими расстояниями (скалярными произведениями). Отыскивается такая конфигурация точек, которая даёт минимальное значение этого стресса. Значения координат этих точек и являются решением задачи. Далее строится геометрическое представление объектов в пространстве невысокого числа измерений. Объекты, которым в исходной матрице соответствуют большие меры различий, должны находиться далеко друг от друга, а объекты, которым соответствуют малые меры различий, - близко. Формальным критерием адекватности может служить коэффициент корреляции между исходными и результирующими данными, он должен быть достаточно высоким. Третий этап - анализ и интерпретация полученных результатов. Координатные оси теоретического пространства получают смысловое содержание и интерпретируются как факторы, определяющие расхождение между объектами.

Исходные данные, их представление и первичная обработка в МШ

В МШ основным источником данных исходной информации являются эксперты, субъективно воспринимающие и оценивающие относительное расположение объектов наблюдения в реальных условиях, или результаты прямой регистрации сведений о состоянии и поведении объектов. В МШ имеются две возможности для общего представления входной информации:

1. Матрица условных вероятностей, которая определяется относительными данными «по узнаванию стимулов». Строки такой матрицы представляют собой перечень стимулов, предъявляемых для оценки, столбцы - стимулов, распознанных экспертами.

2. Матрица мер различия профилей, в которой строки - это перечень объектов наблюдения, столбцы - характерные признаки.

На начальном этапе исследования решается задача по стандартизации исходных данных, которая снижает вероятность получения вырожденных решений.

Для измерения расстояний между стимулами в МШ используются различные метрики. Обычно в искомом пространстве вводится метрика Минковско-

го, согласно которой расстояния вычисляются по форму-

1

ле: </ * =

/

, где X, - / -я координата у -го объекта, а р - кон-

станта Мииковского. Наиболее часто используемым случаем метрики Мин-ковского является Евклидова метрика, соответствующая значению параметра

1

. Другим частным случаем расстояния Минков-

Р =2: (1}к =

ского является так называемое расстояние сНу-Ыоск, соответствующее значению параметра= 1: = £ \хр-хк \. Метрика сНу-Ыоск подходит для

I

стимулов, которые имеют тенденцию быть анализируемыми вдоль некоторых выделенных направлений, причем субъективно не допускается произвольное вращение этих направлений.

Для построения матрицы различий необходимо рассчитать расстояния между всеми парами наблюдаемых объектов и свести результаты в матрице симметричного вида. После нахождения матрицы различий приступают к выполнению шагов алгоритма многомерного шкалирования.

Метрический и неметрический подходы к МШ

Методы неметрического МШ применяются для обработки ранговых (порядковых) данных. Решающим условием, обеспечивающим адекватность аналитических выводов, становится соответствие монотонных связей эмпирических и теоретических данных, т.е. если реально существует порядковая зависимость 5Ч < 81{, то в определяемом шкальном пространстве соответственно

должно выполняться неравенство с]^ < с!{}. Вид монотонности заранее неизвестен, и методом проб подбирается функция, наилучшим образом описывающая эмпирические данные: линейная, степенная, показательная или логарифмическая.

Метрический подход к МШ

Метод Торгерсона базируется на предположении о том, что различия между объектами равны расстояниям между точками в Евклидовом пространстве.

*

Он начал с построения матрицы А с двойным центрированием, элементы 01}

которой посчитаны непосредственно по матрице данных. Матрица с двойным центрированием - это матрица, у которой среднее значение элементов каждой

строки и каждого столбца равно нулю. Каждый элемент новой матрицы А оп-

ределяется соотношением: гда#-средняя^

характеристик различий в у-х столбцах /-Й строки, возведенных в квадрат: =1у 5; ; 6/ - средняя для характеристик различий в /-х строках у-го

столбца, возведенных в квадрат: % =-]>Х ! " сРедняя В6ЛИЧИНа ДЛЯ

/ »

квадратов характеристик различий матрицы : . По Торгенсо-

V ' 7

ну, для исчисленных значений 8*, если ö.. = d = V (г - г 1

'J V Jk jk)

, имеет

v у

силу равенство: 8*. = > или в матричном виде: Д# = XX', где X - мат-

к

рица координат стимулов размерности 1*К. Определение матрицы X, как видно, тождественно решению задачи поиска собственных векторов, при этом могут использоваться: метод главных компонент, методы факторного анализа.

Неметрический подход к МШ

Существует большое число алгоритмов для выполнения неметрического шкалирования. Основные алгоритмические шаги:

Шаг 1. Получение матрицы различий, содержащей ранговые данные - характеристики непохожести анализируемых объектов.

Шаг 2. Поиск стартовой конфигурации. Эта проблема может быть решена с использованием алгоритма Торгерсона или Краскала.

Шаг 3. Стандартизация расстояний и оценок координат, получение стартовой конфигурации. В начале каждой итерации проводится стандартизация текущих расстояний и оценок координат с целью сохранить пропорции орто-нормированного стимульного пространства и избежать вырожденных решений.

Шаг 4. Неметрический этап. На данном этапе данные о различии и стандартизированные оценки расстояний из предыдущей итерации (или из стартовой конфигурации) используются для получения отклонений. В теоретическом

пространстве шкал Xк монотонность исходных данных может нарушаться. Корректировка теоретических величин расстояний (¡^ производится при неизменных оценках координат стимулов и таким образом, чтобы восстановить общую тенденцию к возрастанию в исходных данных о различиях. Диаграмма Шепарда позволяет наглядно отобразить несоответствие исходных и теоретических ранговых оценок.

Улучшаются оценки расстояний центрированием отклоняющихся от прямой расстояний ^ посредством расчета арифметической средней. Новые центрированные значения закрепляются за двумя парами объектов, в которых возникли нарушения монотонности. С переходом от оценок ^ к уточненным

оценкам Сс+1 - первой итерации) неметрический этап заканчивается.

Шаг Метрический этап. На данном этапе имеющимся исходным и уточненным величинам расстояний ( d(¡j и dcIJ*x) находят уточненные

оценки координат. Для расчетов используют формулу Лингоса - Роскама:

'С*!

(с с \

V х1к ~~ х}к ) . Подобные

1

ik ~ Xik j ¿С

1-

U

V

расчеты прово-

дятся для всех участвующих в анализе объектов, после этого уже по новым оценкам координат (х,у+1) находят расстояния между стимулами в теоретическом пространстве ( dc*x ).

Шаг 6. Оценка соответствий монотонных ранговых эмпирических и теоретических данных. Собственно проверке на монотонность подлежат теоретические данные dv и рассматривается степень их улучшения на предыдущей итерации. Если улучшение существенно, итерация возобновляется после стандартизации полученных на метрическом этапе оценок координат и расстояний. Если же улучшений мало, итерации заканчиваются. Оценивание соответствий теоретических результатов эмпирическим данным осуществляется при помощи специальных стресс - формул Краскала и Юнга

i/o / т

1/2 / л

i

• •

U

Г

I

ij V

\2 ^

dtj - djj

Z 4

\

» w

и

.s2 =

djj - djj

I

• •

ч y

A \

dij-d

\

ss, =

z

A

dl~dl

xlN-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4

Z<

¡J

S S, =

I

47

I M;-'«

I

\2

dl -

/ >

или коэффициента отчуждения Гутмана:

к =(\ —/У2)2, где ц =

У d d

Z-f V ч

л ^

У

ленпя

Применение метода МШ при анализе социального самочувствии пасе-

Социальное самочувствие является интегральным показателем, отражающим ощущения человека, степень его удовлетворенности своим положением в данном обществе и адаптированности к новым социально-экономическим условиям. В этой связи интересным представляется определение местонахождения социальных групп, различающихся между собой по степени наличия в них богатства и власти, в пространстве социального самочувствия и создание их образа средствами МШ. В качестве объекта исследования изучались восемь социальных групп, различающихся между собой по степени наличия в них богатства и власти: бедные-бесправные, бедные-приближенные к власти, благополучные-бесправные, благополучные-приближенные к власти, благополуч-ные-властные, богатые-бесправные, богатые-приближенные к власти, богатые-властные (табл. 1).

В качестве исходных признаков рассматривались: Х| - наличие качеств, необходимых современной России, Х2 -самооценка профессионализма, Хз -опасения потерять работу, Х4 -самооценка общественного признания, Х5 - удовлетворенность материальным положением, Х6 -удовлетворенность жизнью, X^ — беспокойство о « завтрашнем дне», Х§ -способность самостоятельно изменить жизнь к лучшему, Х9 - здоровье. Исходные данные были опубликованы в центральной печати [5].

Таблица 1

Частные ранги социального самочувствия типогрупп.

(1-низшне ранги, 8-высшие ранги)

XI Х2 ХЗ Х4 Х5 Х6 Х7 Х8 Х9

Бедные - бесправные 1 1 1 1 1 1 1 1 1

Бедные-приближенные к власти 4 3 3 3 2 2 2 4 3

Благополучные — бесправные 3 4 4 2 3 3 3 3 2

Благополучные - приближенные к власти 5 5 5 5 4 4 4 5 5

Благополучные - властные 7 6 8 7 5 6 6 8 8

Богатые- бесправные 2 2 2 4 6 5 5 2 4

Богатые-приближенные к власти 8 7 7 6 7 8 8 6 7

Богатые - властные_ 6 8 6 8 8 7 7 7 6

Для построения матрицы различий Д были рассчитаны расстояния между всеми парами наблюдаемых объектов. В качестве меры расстояний была выбрана тривиальная метрика Евклида. Для нахождения матрицы координат стимулов использовался метод главных компонент, были вычислены собст-

венные значения и собственные векторы матрицы Д\ В табл. 2 представлены положительные собственные значения, полученные по данным матрицы д\

Таблица 2

Собственные значения матрицы Д*

а.. Хз

326,746 32,941 8,317 7,637 1,938 0,305 0,112

Каждое собственное значение связано с одной координатной осью. Оно равно сумме квадратов шкальных значений стимулов по этой оси. Для определения размерности теоретического пространства стимулов проводился анализ графиков зависимостей собственных значений от числа координатных осей (рис. 1). С учетом уровня информативности в анализе остаются 2 координатные оси (табл. 3).

Рис. 1. График зависимости собственных значений от числа координатных

осей

Далее, реализуя алгоритм неметрического МШ, была проведена стандартизация оценок координат и расстояний: 2Щ Матрица стандартизи-рованных оценок расстояний представлена в таблице 3.

Таблица 3

Значения координат стимулов

Нестандарти-зированные оценки Стандартизированные оценки Новые координаты стимула после 1 итерации Новые координаты стимула после 2 итерации

Бедные — бесправные -0,580 -0,021 -4,002 -0,147 -2,839 -0,734 -2,962 -0,640

Бедные-приближенные к власти -0,270 -0,356 -1,871 -2,493 -2,154 -6,948 -1,980 -7,479

Благополучные бесправные -0,250 -0,093 -1,733 -0,654 -1,529 -3,310 -1,224 -3,538

Благополучные - приближенные к власти 0,029 -0,220 0,183 -1,538 0,221 -6,121 -0,369 -8,125

Благополучные — властные 0,380 -0,431 2,601 -3,016 1,531 -5,523 1,592 -4,405

Богатые - бесправные -0,159 0,745 -1,108 5,216 -1,571 17,43 1 -1,532 19,273

Богатые-приближенные к власти 0,433 0,143 2,965 1,002 2,671 2,273 2,470 1,798

Богатые- властные 0,433 0,233 2,965 1,631 3,671 2,931 4,005 3,117

На неметрическом этапе, предназначенном для упорядочения оценок расстояний между стимулами, строилась диаграмма Шепарда, которая отражала несоответствие между исходными и теоретическими ранговыми оценками.

На метрическом этапе были найдены уточненные оценки координат (новые координаты стимула). Для расчетов использовалась формула Лингоса - Рос-

кама. После этого уже по новым оценкам координат (1) были найдены расстояния между стимулами в теоретическом пространстве (¿/<ч1), и первая итерация на этом была закончена. Оценивание соответствия теоретических результатов эмпирическим данным было произведено по стресс-формулам Крас-

кала.

После проведения оценки соответствия монотонных ранговых эмпирических и теоретических данных была проведена еще одна итерация. На метрическом этапе использовались оценки расстояний на предыдущей итерации К)

и оценки координат на предыдущей итерации (хЛ) для получения новых оценок координат( 4+1), по которым рассчитывались новые оценки расстоя-

ний() (табл. 3).

После проведения второй итерации существенных улучшений обнаружено не было (таблица 4), поэтому итерации были закончены.

Таблица 4

Уточненные оценки координат стимулов

После 1 итерации После 2 итерации

■у, 0,955113654 0,964428904

1,208835567 1,209120159

Выбранные координатные оси соответствуют субъективным и объективным факторам, влияющим на социальное самочувствие (рис. 2). Полученные результаты имеют адекватную интерпретируемость.

1.00

Богатыс-бесправны^ 0.80 0.60

0.40 Богатые-властные

0.20 ♦

Бедные-бесправные Лгатые-приближен

0.80 -0.& -0,40 -0,20 ♦ 0. СЮ 0.20 0.40 0,60 Благополуч власти

Благополуч -0.20 ные-

ные- ♦ приближен

бссправные ные к

♦ власти

Бедные- -0.40 ♦

прнближеи Благополуч

н ме к ные-

власти -0.60- в;истные

20

Богатые -

бссправнь

с 15-10

Бедные -бесправны 5 Богатыс -приближен ные к ф Богатые -♦ властные

с Г\ власти

-4 $ -2 -1 Благополу чные- + бесправны Бедные - с* I -5- >12 3 Благо полу Благоп^у чные -чные - властные 4 5

ПрнблИЖС!^ ные к ♦ приближен ные к

власти -10- власти

Рис. 3. Графическое представление координат стимулов: а - метрическое МШ, б - неметрическое МШ.

Первая шкала (ось абсцисс) соответствует объективному фактору, влияющему на социальное самочувствие. К нему можно отнести образование, вид трудовой деятельности, материальный достаток и т.д. Вторая шкала (ось ординат) соответствует субъективному фактору, к которому относятся психологический склад личности, его самооценка, удовлетворенность жизнью, характеристики ценностно-мотивационной сферы, личностные амбиции.

Библиографический список:

1. Трусова, АЛО. Математическое моделирование социальных процессов / АЛО. Трусова, И.С. Макарова // Образовательные технологии: межвуз. сб. науч. тр -Воронеж, 2003. - Вып. 10. - С. 87-91

2. Дейвисон, М. Многомерное шкалирование: Методы наглядного представления данных / М. Дейвисон; пер. с англ.- М.: Финансы и статистика, 1988. - 254 с.

3. Дубров, A.M. Многомерные статистические методы: учебник / A.M. Дубров, B.C. Мхитарян, Л.И. Трошин. - М.: Финансы и статистика, 2000. - 352 с.

4. Сошникова, Л.А. Многомерный статистический анализ в экономике: учеб. пособие для вузов / Л.А. Сошникова, B.I1. Тимашевич, Г. Уебе [и др.]; под ред. проф. В.Н. Тимашевича. - М.: ЮНИТИ-ДАНА, 1999. - 598 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Душацкий, Л.Е. Материально-властные ресурсы россиян в самооценке и социальном самочувствии / Л.Е. Душацкий // СОЦИС. - 2004. - №4 - С. 64-71.

A.Yu. Trusova

MULTI-DIMENSIONAL SCALING OF SOCIAL STRUCTURE

The paper is devoted to the studying of multidimensional scaling and to the interpretation of the objects in the multidimensional space. In this article, methods of multi-dimensional scaling are applied to analyze the social mood and conditions of contemporary population of Russia. Applying the methods of metrical and non-metrical scaling eight typical groups were presented in two-dimensional plane. These groups differ from each other with the level of financial position and authority. Social health of definite social group is satisfaction of her position in existent community.

Keywords and phrases: multidimensional scaling, multidimensional space, two-dimensional plane

Статья принята в печать в окончательном варианте 04.12.08 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.