Научная статья на тему 'Методики анализа социологической информации в реализации задач управления'

Методики анализа социологической информации в реализации задач управления Текст научной статьи по специальности «Социологические науки»

CC BY
249
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ / КЛАСТЕРНЫЙ АНАЛИЗ / КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / СОЦИАЛЬНАЯ АДАПТАЦИЯ

Аннотация научной статьи по социологическим наукам, автор научной работы — Алексеёнок А. А.

Статья посвящена применению методов статистического и эвристического анализа результатов социологических опросов для последующего применения при принятии управленческих решений. При этом социологическая информация выступает как управленческий ресурс. В качестве основных аналитических методик рассмотрены кластерный и корреляционный анализы, которые следует отнести к эвристической и статистической методике соответственно. Эмпирическую базу составили результаты социологических опросов мигрантов в 2003, 2005, 2007 гг. Обобщены итоги применения аналитических методик на указанной эмпирической базе. Рассмотренные методики анализа социологической информации позволяют выявить скрытые закономерности развития социальных процессов, что существенно повышает качество управленческих решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методики анализа социологической информации в реализации задач управления»

УДК 303.7:316.444:314.7

Алексеёнок А.А.,

кандидат социологических наук, доцент кафедры социологии и психологии управления ОРАГС

МЕТОДИКИ АНАЛИЗА СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ В РЕАЛИЗАЦИИ ЗАДАЧ УПРАВЛЕНИЯ

Статья посвящена применению методов статистического и эвристического анализа результатов социологических опросов для последующего применения при принятии управленческих решений. При этом социологическая информация выступает как управленческий ресурс. В качестве основных аналитических методик рассмотрены кластерный и корреляционный анализы, которые следует отнести к эвристической и статистической методике соответственно. Эмпирическую базу составили результаты социологических опросов мигрантов в 2003, 2005, 2007 гг. Обобщены итоги применения аналитических методик на указанной эмпирической базе. Рассмотренные методики анализа социологической информации позволяют выявить скрытые закономерности развития социальных процессов, что существенно повышает качество управленческих решений.

Ключевые слова: анализ социологической информации, кластерный анализ, корреляционный анализ, социальная адаптация.

Любые методы обработки данных так или иначе используются для структурирования и анализа существующей информации. Задач по анализу информации много, однако в данном разделе мы рассмотрим методы, которые эффективно применяют для обработки полученной эмпирической информации с большим количеством разнородных параметров.

Например, для анализа состояния процесса социальной адаптации вынужденных мигрантов и его оптимизации мы сегментировали мигрантов на группы по определенным параметрам: пол, возраст, образование и т.д. Для этого существует набор математических методов, позволяющих установить закономерности и упорядочить эмпирическую информацию.

Прежде чем мы остановимся на методах анализа данных более подробно, рассмотрим, какие данные могут быть использованы для анализа и какое количество данных необходимо.

Типы данных

Данные, которые могут быть использованы для анализа, бывают четырех типов1:

1. Численные данные (численность иммигрантов).

2. Интервальные данные (доля вынужденных мигрантов среди общего числа иммигрантов; %).

3. Ранговые данные (социальная привлекательность Орловской области для вынужденных мигрантов).

4. Номинальные данные (профессия вынужденного мигранта: учитель, военный, строитель, инженер)

Все данные, которые подходят под один из этих типов, могут быть проанализированы с помощью формальных методов.

Любой набор данных может быть адекватно представлен комбинацией перечисленных типов.

Количество данных

Для того чтобы работало большинство методов, желательно иметь более 50 опрошенных респондентов (малая выборка)2.

Этого количества респондентов обычно достаточно для получения информации, что в данной выборке наблюдается статистический эффект. Однако для разделения на группы необходимо иметь уже гораздо большее число респондентов — примерно 50, умноженное на число групп.

Так, для получения репрезентативной информации при выделении 3-х групп вынужденных мигрантов необходимо иметь более 150 респондентов. Бесспорно, что чем больше численность опрошенных респондентов, тем достоверней полученная информация, но оптимальное число репон-дентов расчитывается по формуле, где ошибка выборки не превышает 3%.

Кластерный анализ

Термин «кластерный анализ» (впервые ввел Тгуоп в 1939 г.3) в действительности включает в себя набор различных алгоритмов классификации.

Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как разбить данные на группы с близкими значениями параметров. Ответ на него дает кластерный анализ, с помощью которого заданная выборка разбивается на отдельные сегменты — кластеры. Каждый кластер должен состоять из схожих объектов. Объекты же разных кластеров должны существенно отличаться.

Кластерный анализ можно определить как многомерную статистическую процедуру, выполняющую сбор данных, содержащих информацию о выборке объектов, и упорядочивающую объекты в относительно однородные группы — кластеры. Таким образом, кластер представляет собой группу элементов со сходными свойствами, па-

раметрами, характеристиками, схожими объектами в выборке.

С помощью кластерного анализа можно решить следующие задачи:

— разработка типологии и классификации объектов выборочной совокупности;

— исследование концептуальных схем группировки объектов;

— выработка рабочих гипотез на основе анализа эмпирической информации;

— проверка, действительно ли кластеры, выделенные тем или иным способом, присутствуют в эмпирическом материале.

Применение кластерного анализа предполагает следующие взаимосвязанные этапы:

— отбор выборочной совокупности для кластеризации;

— определение ряда переменных, по которым будут определяться объекты в выборке;

— выявление значений степени сходства между объектами выборки;

— создание групп сходных объектов;

— проверка достоверности результатов процедуры кластеризации.

Данные для кластерного анализа должны соответствовать ряду требований:

— показатели не должны коррелировать между собой, то есть переменные должны быть независимы друг от друга при методе к — средних и двушаговом методе (при иерархическом методе это правило соблюдать не обязательно);

— распределение данных должно быть максимально близким к нормальному;

— показатели должны быть «устойчивыми», то есть не подвергаться воздействию случайных факторов;

— выборочная совокупность должна быть однородна.

Рассмотрим применение кластерного метода на примере анализа результатов панельного исследования процесса социальной адаптации вынужденных мигрантов проводимого в 2003, 2005, 2007 гг.

Классификация респондентов позволяет выявить группы вынужденных иммигрантов с различной степенью социальной адаптации.

В качестве метода классификации мы применили иерархический кластерный анализ (метод Уорда, квадрат евклидова расстояния). В кластерный анализ включены следующие переменные: длительность проживания на новом месте, степень адаптации, оценка перспектив адаптации и возраст.

В результате кластерного анализа образованы 3 кластера, половозрастная характеристика которых представлена в таблице 1.

Таблица 1 — Половозрастная характеристика кластеров

К

X ш с ш

§£

с >

е

о х .а

и

X >

г

е

о

ш СО

Б

а. <

о о

о ш ш

Возраст, лет Пол Кластер Всего

1 2 3

16-25 мужской численность, чел. 0 0 36 36

доля в кластере, % 0,0 0,0 27,3 8,6

женский численность, чел. 0 0 61 61

доля в кластере, % 0,0 0,0 46,2 14,6

всего численность, чел. 0 0 97 97

доля в кластере, % 0,0 0,0 73,5 23,2

26-30 мужской численность, чел. 7 0 7 14

доля в кластере, % 4,5 0,0 5,3 3,3

женский численность, чел. 6 0 21 27

доля в кластере, % 3,8 0,0 15,9 6,4

всего численность, чел. 13 0 28 41

доля в кластере, % 8,3 0,0 21,2 9,8

31-40 мужской численность, чел. 17 0 3 20

доля в кластере, % 10,8 0,0 2,3 4,8

женский численность, чел. 27 18 1 46

доля в кластере, % 17,2 13,8 0,8 11,0

всего численность, чел. 44 18 4 66

доля в кластере, % 28,0 13,8 3,0 15,8

41-50 мужской численность, чел. 25 18 1 44

доля в кластере, % 15,9 13,8 0,8 10,5

женский численность, чел. 19 36 2 57

доля в кластере, % 12,1 27,7 1,5 13,6

всего численность, чел. 44 54 3 101

доля в кластере, % 28,0 41,5 2,3 24,1

51-55 мужской численность, чел. 13 0 0 13

доля в кластере, % 8,3 0,0 0,0 3,1

женский численность, чел. 26 9 0 35

доля в кластере, % 16,6 6,9 0,0 8,4

всего численность, чел. 39 9 0 48

доля в кластере, % 24,8 6,9 0,0 11,5

старше 55 мужской численность, чел. 6 22 0 28

доля в кластере, % 3,8 16,9 0,0 6,7

женский численность, чел. 11 27 0 38

доля в кластере, % 7,0 20,8 0,0 9,1

всего численность, чел. 17 49 0 66

доля в кластере, % 10,8 37,7 0,0 15,8

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

всего мужской численность, чел. 68 40 47 155

доля в кластере, % 43,3 30,8 35,6 37,0

женский численность, чел. 89 90 85 264

доля в кластере, % 56,7 69,2 64,4 63,0

всего численность, чел. 157 130 132 419

доля в кластере, % 100,0 100,0 100,0 100,0

среднее значение возраста, лет 41-50 51-55 16-30 31-50

Как видно из таблицы 1, наиболее «молодым» кластером является № 3, в который включены все респонденты в возрасте 16 — 25 лет, большинство в возрасте 26 — 30 лет и ни одного из вынужденных иммигрантов предпенсионного и пенсионного возраста. Большинство пожилых респондентов выделены в кластер № 2.

Кластеры также различаются по уровню образования включенных в них респондентов (таблица 2).

Таблица 2 — Характеристика кластеров по уровню образования

Уровень образования Кластер Всего

1 2 3

начальное доля в уровне образования, % 8,3 12,5 79,2 100,0

доля в кластере, % 1,3 2,3 15,1 5,8

неполное среднее доля в уровне образования, % 25,8 32,3 41,9 100,0

доля в кластере, % 5,1 7,7 10,3 7,5

среднее доля в уровне образования, % 45,2 7,1 47,6 100,0

доля в кластере, % 24,2 4,6 31,7 20,3

среднее специальное доля в уровне образования, % 54,5 26,3 19,2 100,0

доля в кластере, % 34,4 20,0 15,1 24,0

незаконченное высшее доля в уровне образования, % 41,7 0,0 58,3 100,0

доля в кластере, % 3,2 0,0 5,6 2,9

высшее доля в уровне образования, % 35,2 43,0 21,9 100,0

доля в кластере, % 28,7 42,3 22,2 31,0

ученая степень доля в уровне образования, % 14,3 85,7 0,0 100,0

доля в кластере, % 3,2 23,1 0,0 8,5

всего доля в уровне образования, % 38,0 31,5 30,5 100,0

доля в кластере, % 100,0 100,0 100,0 100,0

Как видно из таблицы 2, наивысший образовательный ценз имеют вынужденные иммигранты из кластера № 2. В него включены почти все респонденты с ученой степенью и около половины с высшим образованием. Самый низкий образовательный ценз — у респондентов третьего кластера: почти каждый второй не имеет профессионального образования.

Несмотря на достаточно высокую степень адаптации респондентов на новом месте, выявлены существенные различия между кластерами в самооценке адаптированности (диаграмма 1).

Степень адаптации

Г I (.10,0

50,0

1 — полная адаптация

2 — неполная адаптация

3 — частичная адаптация

4 — незначительная адаптация

5 — полная дезадаптация

Кластер

Диаграмма 1 — Степень адаптации вынужденных иммигрантов, выделенных в различные кластеры

Как видно из диаграммы 1, в наибольшей степени адаптировались к новым условиям респонденты кластера № 2. Доля респондентов, считающих полную адаптацию к новым условиям почти невозможной, в два раза больше в третьем кластере, чем в первом. Респонденты кластера № 2 также с большим оптимизмом смотрят на перспективы полной адаптации, чем вынужденные иммигранты, отнесенные к двум другим кластерам (диаграмма 2).

1 — с надеждой и оптимизмом

2 — спокойно

3 — без особых надежд и иллюзий

4 — с тревогой и неуверенностью

5 — со страхом и отчаянием

Оценка перспектив адаптации

Кластер

Диаграмма 2 — Перспектива адаптации вынужденных иммигрантов, выделенных в различные кластеры

Как видно из диаграммы 2, никто из респондентов не смотрит на перспективу адаптации со страхом и отчаянием, что свидетельствует о социальной привлекательности Орловской области для всех вынужденных мигрантов независимо от адаптационных возможностей.

Почти каждый седьмой респондент третьего кластера смотрит на решение проблем адаптации на новом месте с надеждой и оптимизмом. Респонденты первого кластера более спокойно и взвешенно относятся к возможной в будущем полной социальной адаптации.

Таким образом, кластерный анализ выявил 3 группы вынужденных мигрантов, различающихся по социально-демографическим характеристикам и степени социальной адаптации:

1 кластер — консерваторы. Вынужденные мигранты среднего и предпенсионного возраста с относительно большой долей мужчин, со средним и высшим профессиональным образованием, оценивающие степень адаптации на среднем уровне; средняя продолжительность проживания на новом месте — несколько дольше 2 лет.

2 кластер — активисты. Вынужденные мигранты среднего и пенсионного возраста с наибольшей долей женщин, с высшим профессиональным образованием и ученой степенью, оценивающие процесс социальной адаптации почти завершенным, оптимистично оценивающие решение проблем адаптации; относительно долго проживают в Орловской области — свыше 5 лет.

3 кластер — максималисты. Вынужденные мигранты молодого поколения с преимущественно полным общим и высшим профессиональным образованием, оценивающие степень адаптации на среднем уровне, но перспективы адаптации — на уровне выше среднего; проживают на новом месте свыше 3 лет4.

Для определения степени влияния и взаимовлияния исследуемых переменных используют метод корреляционного анализа.

Корреляционный анализ — метод социологического исследования, выявляющий зависимость между числовыми случайными величинами, не имеющими строгого функционального характера, как правило, рассматривается тогда, когда, по крайней мере,

одна из величин зависит не только от другой, но и от ряда случайных факторов.

При исследовании связей между признаками используют корреляционные таблицы. С их помощью можно охарактеризовать и тесноту связи, описываемую коэффициентами корреляции, и форму ее, описываемую уравнениями регрессии. В случае прямолинейной связи используется парный коэффициент корреляции, в случае криволинейной - корреляционное отношение.

Математической мерой корреляции двух случайных величин служит коэффициент корреляции. Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. При отрицательной корреляции увеличение одной переменной связано с уменьшением другой и, напротив, при положительной корреляции увеличение одной переменной связано с увеличением другой переменной.

Корреляционный анализ заключается в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установ-

ления между ними статистических взаимосвязей. Цель корреляционного анализа - получить информацию об одной переменной с помощью другой переменной. При применении метода корреляционного анализа сравниваются коэффициенты корреляции между одной или множеством пар признаков для установления между ними статистических взаимосвязей или взаимозависимостей.

Тем не менее корреляция отражает лишь линейную зависимость величин, но не отражает их функциональной взаимосвязи.

Применение в социологических исследованиях корреляционного анализа рассмотрим на примере анализа результатов панельного исследования процесса социальной адаптации вынужденных мигрантов, проводимого в 2003, 2005, 2007 гг.

Корреляционный анализ эмпирической базы (таблица 3) показал, что степень адаптации вынужденных мигрантов наиболее тесно связана с категорией семьи по уровню материального обеспечения до переезда, с оценкой своих перспектив, с эмоциональным отношением к решению проблем адаптации и с планами на жительство.

Таблица 3 - Результаты корреляционного анализа степени социальной адаптации

Индикатор Коэффициент корреляции (по Спирману) Значимость обратной гипотезы (двусторонняя)

уровень образования -0,126* 0,011

уровень материальной обеспеченности 0,300* 0,023

оценка жизненных перспектив 0,289* 0,031

оценка перспектив адаптации 0,480** 0,000

устойчивость решения остаться на новом месте жительства 0,515** 0,000

Примечание: * корреляция значима на уровне 0,05 ** корреляция значима на уровне 0,01

Как видно из таблицы 3, в процессе корреляционного анализа по степени адаптации вынужденных мигрантов выявлены следующие статистически значимые зависимости: - обнаружена прямо пропорциональная зависимость между степенью адаптации и материальной обеспеченностью семьи до переезда: чем выше был материальный достаток семьи до миграции, тем выше степень адаптации на новом месте после миграции, однако эта зависимость слабая;

- обнаружена прямо пропорциональная зависимость между степенью адаптации и оценкой собственных перспектив: чем выше мигрант оценивает свои перспективы, тем более полно он адаптируется на новом месте - эта зависимость также слабая;

- обнаружена прямо пропорциональная зависимость между степенью адаптации и взглядом на решение проблем адаптации на новом месте: чем более оптимистичен взгляд на решение проблем адаптации,

тем более успешен процесс адаптации — зависимость средней силы;

— обнаружена прямо пропорциональная зависимость между степенью адаптации и планами на жительство: чем более успешна адаптация, тем более твердо решение остаться на выбранном месте — зависимость выше среднего уровня.

По результатам корреляционного анализа степени адаптации вынужденных мигрантов можно сделать следующий вывод. Наиболее успешно адаптируются вынужденные мигранты с достаточно высоким материальным достатком до переезда, установкой на достижение жизненного успеха, смотрящих на решение проблем адаптации с надеждой и оптимизмом, что приводит к твердому решению остаться на выбранном месте. При этом степень адаптации практически не зависит от типа населенного пункта прежнего проживания,

времени проживания на новом месте, возраста и уровня образования.

Корреляционный анализ эмпирической базы (Таблица 3) показал, что степень адаптации вынужденных мигрантов наиболее тесно связана с категорией семьи по уровню материального обеспечения до переезда, с оценкой своих перспектив, с эмоциональным отношением к решению проблем адаптации и с планами на жительство.

Задачи восстановления зависимостей активно изучаются уже более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В современных социологических исследованиях с этого времени было разработано огромное количество методов и инструментов анализа данных. В данной работе мы описали методы, которые наиболее широко используются в процессе обработки и анализа эмпирической социологической информации.

1 Сухорослов О.В. Обучение современным технологиям обработки больших массивов данных на кластерных системах. М., 2009. 345 с.

2 Шляпентох В.Э. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. М.: ЦСП, 2006.

3 Tryon R.C. Cluster Analysis. NY.: McGraw-Hill, 1939.

4 Алексеенок А.А. Социальная адаптация вынужденных мигрантов в условиях трансформаций современного российского общества. Орел: Издательство ОРАГС, 2009. 184 с.

Alekseenok A.A., candidate of sociology, docent of the department of sociology and management psychology of ORACS, e-mail: [email protected]

METHODS OF ANALYSIS OF SOCIOLOGICAL DATA IN THE IMPLEMENTATION OF MANAGEMENT PROBLEMS

The article deals with the use of statistical and heuristic analysis of the results of opinion polls for subsequent use in making management decisions. Thus the sociological information acts as an administrative resource. The main analytical techniques of cluster and correlation analysis are considered, which should be attributed to the heuristic and statistical methods, respectively. Empirical basis were the results of sociological surveys of migrants in 2003, 2005, 2007. The results of application of analytical techniques on the specified empirical base are generalized. The considered methods of the sociological information analysis allow revealing the latent laws of development of social processes that essentially raises quality of administrative decisions.

i Надоели баннеры? Вы всегда можете отключить рекламу.