Научная статья на тему 'Методика обработки результатов анкетирования с использованием методов многомерной и параметрической статистики'

Методика обработки результатов анкетирования с использованием методов многомерной и параметрической статистики Текст научной статьи по специальности «Социологические науки»

CC BY
16715
1028
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА РЕЗУЛЬТАТОВ / ФАКТОРНЫЙ АНАЛИЗ / КРИТЕРИЙ ХИ-КВАДРАТ / ТАБЛИЦЫ СОПРЯЖЕННОСТИ / АНКЕТИРОВАНИЕ / RESULTS PROCESSING / FACTOR ANALYSIS / CHI-SQUARE TEST / CONTINGENCY TABLES / POLLING

Аннотация научной статьи по социологическим наукам, автор научной работы — Фомина Е.Е., Жиганов Н.К.

Анкетирование является одним из основных методов изучения общественного мнения. Оно нашло широкое применение в разных областях и позволяет узнать мнение респондентов на интересующие темы. Результаты первичной обработки анкет представляют собой, как правило, базы данных большого объема, требующие дальнейшего анализа и интерпретации результатов, более глубокой проработки и поиска взаимосвязей между агрегированными переменными и социально-демографическими характеристиками респондента. Для решения этой проблемы на практике могут быть применены методы многомерной и параметрической статистики. Данная статья посвящена вопросу применения факторного анализа и критерия хи-квадрат для обработки результатов анкетирования. Предложена методика анализа результатов, включающая в себя два этапа: поиск общих факторов, оказывающих влияние на ответы респондентов и установление взаимосвязи между найденными факторами и дополнительными переменными, такими как пол, возраст и доход респондента. Методика проиллюстрирована на примере обработки результатов анкетирования на тему отношения студентов к институту выборов. Применение метода факторного анализа позволило построить двухфакторная модель; на основе расчета критерия хи-квадрат сделаны выводы о взаимосвязи между выделенными факторами и социально-демографическими характеристиками респондента.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по социологическим наукам , автор научной работы — Фомина Е.Е., Жиганов Н.К.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODOLOGY OF SURVEY RESULTS PROCESSING WITH THE USE OF MULTIVARIATE AND PARAMETRIC STATISTICS

The authors of the article call survey the main method of opinion polling. It is widely used in many areas as it allows collecting the data on the respondents’ opinions on the necessary issues. Data preparation results of a poll are generally presented in the form of a database of a large volume. Then it requires further analysis and interpretation of the results, as well as elaborating and defining the correlation between the aggregated variables and social-demographic characteristics of the respondent. The authors suggest applying methods of multivariate and parametric statistics to solve these matters in practice. The article is devoted to the issue of factor analysis and the chi square test application in the polling results processing. It suggests the methodology of poll results analysis, which consists of two stages. The first one is aimed at searching for the common factors that influence the answers of the respondents, while the second one aims at finding a correlation between the factors and the additional variables, such as gender, age and respondent’s income. The proposed methodology is illustrated through the poll results’ analysis on the subject of students’ attitude to the elections institution. The application of factor analysis method allowed developing a two-factor model. Based on the chi square calculations, the authors draw a conclusion on the existing correlation between the selected factors and the respondent’s socio-demographic characteristics.

Текст научной работы на тему «Методика обработки результатов анкетирования с использованием методов многомерной и параметрической статистики»

Б01 10.15593/2224-9354/2017.1.9 УДК 316-047.37

Е.Е. Фомина, Н.К. Жиганов

МЕТОДИКА ОБРАБОТКИ РЕЗУЛЬТАТОВ АНКЕТИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МНОГОМЕРНОЙ И ПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ

Анкетирование является одним из основных методов изучения общественного мнения. Оно нашло широкое применение в разных областях и позволяет узнать мнение респондентов на интересующие темы. Результаты первичной обработки анкет представляют собой, как правило, базы данных большого объема, требующие дальнейшего анализа и интерпретации результатов, более глубокой проработки и поиска взаимосвязей между агрегированными переменными и социально-демографическими характеристиками респондента. Для решения этой проблемы на практике могут быть применены методы многомерной и параметрической статистики. Данная статья посвящена вопросу применения факторного анализа и критерия хи-квадрат для обработки результатов анкетирования. Предложена методика анализа результатов, включающая в себя два этапа: поиск общих факторов, оказывающих влияние на ответы респондентов и установление взаимосвязи между найденными факторами и дополнительными переменными, такими как пол, возраст и доход респондента. Методика проиллюстрирована на примере обработки результатов анкетирования на тему отношения студентов к институту выборов. Применение метода факторного анализа позволило построить двухфакторная модель; на основе расчета критерия хи-квадрат сделаны выводы о взаимосвязи между выделенными факторами и социально-демографическими характеристиками респондента.

Ключевые слова: обработка результатов, факторный анализ, критерий хи-квадрат, таблицы сопряженности, анкетирование.

Введение. Метод анкетирования является очень популярным инструментом изучения состояния общественного мнения. К его помощи прибегают как компании, которые хотят получить отзыв о своей продукции и результатах своей деятельности, так и научные организации, стремясь узнать оценку эффективности своей научной работы. Анкетирование широко применяется в социологии, психологии, педагогике и других науках. Основное его достоинство в том, что исследователь может опросить большое количество респондентов, живущих в разных регионах и получить сопоставимые данные, которые удобно анализировать с использованием методов математической статистики [1].

Среди методов, наиболее часто используемых для обработки результатов анкетирования, можно отметить такие, как расчет показателей описатель-

© Фомина Е.Е., Жиганов Н.К., 2017

Фомина Елена Евгеньевна - канд. техн. наук, доцент кафедры информатики и прикладной математики ФГБОУ ВО «Тверской государственной технический университет», e-mail: f-elena2008@yandex.ru.

Жиганов Николай Константинович - д-р физ.-матем. наук, профессор, заведующий кафедрой информатики и прикладной математики ФГБОУ ВО «Тверской государственной технический университет», e-mail: jiganov2005@yandex.ru.

ной статистики, ранжирование и шкалирование, выявление корреляционной зависимости между отдельными признаками, графическая обработка информации. Однако важную роль играют методы и алгоритмы интерпретации, которые придают смысл результатам анкетирования.

В качестве одного из методов интерпретации можно выделить метод факторного анализа, который позволяет вести поиск скрытой структуры взаимосвязей во множестве переменных, значительно сокращать их объем и выделять факторы, оказывающие влияние на ответы респондентов [2-4]. Еще одно преимущество данного метода заключается в том, что он реализован во многих пакетах обработки данных, в частности, в таких широко известных, как SPSS и STATISTICA [5-10].

Как показывает анализ литературы [2-4, 11-15], в большинстве случаев обработка результатов заканчивается этапом выделения и интерпретации факторов. Тем не менее в ряде задач логика исследования требует более глубокой проработки и поиска взаимосвязей между найденными факторами и социально-демографическими характеристиками респондента, такими как пол, образование, уровень дохода.

В связи с вышесказанным задача разработки эффективных методик анализа результатов анкетирования является актуальной. В статье предлагается методика, которая базируется на методах многомерной и параметрической статистики, в частности на методе факторного анализа и критерии хи-квадрат.

Материалы и методы исследования. Комбинация метода факторного анализа и процедуры проверки гипотезы о независимости признаков с использованием критерия хи-квадрат была применена к изучению общественного мнения на тему «Отношение тверских студентов к институту выборов».

Сбор информации осуществлялся посредством распространения стандартизированных анкет со следующими вопросами:

1. Интересуетесь ли Вы политикой?

1) Да; 2) Нет.

2. Принимаете ли Вы участие в общественной жизни?

1) Да; 2) Нет.

3. Доверяете ли Вы результатам выборов различного уровня, проходящих в нашей стране?

3.1. Выборы Президента.

1) Да; 2) Скорее да; 3) Скорее нет; 4) Нет;

3.2. Выборы в Государственную думу.

1) Да; 2) Скорее да; 3) Скорее нет; 4) Нет;

3.3. Выборы в городскую Думу.

1) Да; 2) Скорее да; 3) Скорее нет; 4) Нет;

3.4. Выборы законодательного собрания.

1) Да; 2) Скорее да; 3) Скорее нет; 4) Нет;

5) Не знаю. 5) Не знаю. 5) Не знаю. 5) Не знаю.

3.5. Выборы мэра города.

1) Да; 2) Скорее да; 3) Скорее нет; 4) Нет; 5) Не знаю.

4. Какой смысл Вы вкладываете в понятие «выборы»?

1) Это - почетное право гражданина, гарантированное конституцией.

2) Это - главный признак демократического государства.

3) Это - возможность граждан влиять на власть.

4) Это - пустая формальность, создающая видимость демократии.

5) Затрудняюсь ответить.

5. Как бы Вы оценили степень развитости в нашей стране института выборов?

1) Институт выборов в нашей стране развит хорошо.

2) Институт выборов в нашей стране еще недостаточно развит.

3) Институт выборов в нашей стране развит слабо.

4) Институт выборов в нашей стране не развит совсем.

5) Мне сложно об этом судить.

6. Участвовали ли Вы в последних выборах в различные властные структуры?

6.1. Выборы Президента. 1) Да; 2) Нет; 3) Не помню.

6.2. Выборы в Государственную думу. 1) Да; 2) Нет; 3) Не помню.

6.3. Выборы в городскую Думу. 1) Да; 2) Нет; 3) Не помню.

6.4. Выборы законодательного собрания. 1) Да; 2) Нет; 3) Не помню.

6.5. Выборы мэра города. 1) Да; 2) Нет; 3) Не помню.

7. Укажите Ваш пол:

1) Мужской; 2) Женский

8. Укажите Вашу специальность_.

9. К какой из перечисленных групп населения по уровню материального положения Вы могли бы себя отнести?

1) Мы едва сводим концы с концами. Денег не хватает даже на питание.

2) На продукты денег хватает, но покупка одежды вызывает затруднения.

3) Денег хватает на продукты и одежду, но покупка вещей длительного пользования (телевизор, холодильник) вызывает затруднения.

4) Мы можем приобретать вещи длительного пользования, но не дорогие покупки (машины).

5) Без труда приобретаем вещи длительного пользования. Можем накопить деньги на недорогую машину, но купить квартиру или коттедж не можем.

6) У нас нет материальных проблем. Можем приобрести недвижимость, дорогой автомобиль, дорогой заграничный тур.

Анкета была разработана на кафедре социологии и социальных технологий Тверского государственного технического университета. В анкетировании приняли участие 100 респондентов. Предлагаемая методика обработки включает в себя два этапа.

На первом этапе к результатам анкетирования применяется метод факторного анализа, позволяющий выделить агрегатные переменные, влияющие на ответы респондентов. В рассматриваемом примере в качестве исходных данных для факторного анализа выступала таблица с данными, включающими в себя ответы на вопросы 1-6.

На втором этапе исследования проводится анализ взаимосвязи выделенных факторов с дополнительными социально-демографическими переменными, позволяющий получить представление о том, какие значения факторных переменных наиболее ярко выражены в той или иной социально-демографической группе, и проверить гипотезу о независимости признаков.

Автоматизированная обработка полученных данных осуществлялась в пакете 8ТАтаТ1СА.

Результаты. Для выявления основных факторов, обусловливающих отношение респондентов к институту выборов, применялся факторный анализ с использованием метода максимального правдоподобия.

Целью первого шага метода было решение вопроса об оптимальном количестве факторов. В итоге выделено два фактора (два собственных числа больше единицы [2, 13]), оказывающих влияние на результаты анкетирования (табл. 1).

Как можно видеть из табл. 1, процент дисперсии, объясняемой первым генеральным фактором, составил 26,40, вторым фактором - 17,86. Общий процент дисперсии, объясняемый всеми факторами, равен 44,26.

Таблица 1

Собственные значения

Значение Собственное Процент общей Кумулятивный

значение дисперсии процент

1 3,69 26,40 26,40

2 2,50 17,86 44,26

Следующим шагом исследования являлся расчет и анализ факторных нагрузок. Для более наглядной интерпретации решения был применен метод вращения Варимакс исходных, позволивший проследить четкую факторную структуру и выделить переменные, отмеченные высокими значениями коэффициентов корреляции с тем или иным фактором. Корреляция считалась сильной, если коэффициент корреляции принимал значение более 0,70. Результаты расчетов представлены в табл. 2. Факторные нагрузки, величина которых менее 0,30, в табл. 2 не указаны.

Анализ табл. 2 показывает, что первый, т.е. генеральный фактор включает в себя пять переменных с положительными значениями коэффициента корреляции: вопросы 3.1-3.5. При ответе на эти вопросы респонденты выра-

жали свое доверие к результатам выборов различного уровня, проходящих в нашей стране. Таким образом, первый фактор можно охарактеризовать как «Доверие». В целом объяснительная «сила» фактора, или факторный вес, -26,40 %. С содержательной точки зрения, полученные результаты не противоречат здравому смыслу, т.е. степень доверия респондентов к результатам выборов в различные властные структуры скоррелирована.

Таблица 2

Факторные нагрузки, полученные с использованием метода максимального правдоподобия и метода вращения Варимакс исходных

Переменная Фактор 1 Фактор 2 Переменная Фактор 1 Фактор 2

Вопрос 1 Вопрос 4 0,30

Вопрос 2 Вопрос 5 0,36

Вопрос 3.1 0,77 Вопрос 6.1 0,75

Вопрос 3.2 0,87 Вопрос 6.2 0,87

Вопрос 3.3 0,92 Вопрос 6.3 0,71

Вопрос 3.4 0,87 Вопрос 6.4 0,70

Вопрос 3.5 0,79 Вопрос 6.5 0,70

Второй фактор тесно связан с вопросами 6.1-6.5, в которых респонденты отмечали свою активность на выборах. Условно фактор можно обозначить как «Активность». Его факторный вес составил 17,86 %.

Помимо вопросов, раскрывающих отношение к выборам, в анкете содержалась дополнительная информация, касающаяся пола, образования и дохода респондента. Следующим шагом анализа было установление взаимосвязи между полученными факторами и дополнительными переменными.

Для решения этой задачи применялись таблицы сопряженности и критерий хи-квадрат, позволяющий проверить гипотезу о независимости признаков. Факторные значения первого и второго факторов были разбиты на четыре группы. В результате разбиения были получены две новые факторные переменные, обозначим их / и /2, содержащие значения от 1 до 4.

Для первого фактора значение 1 соответствует позиции «сильное доверие», значение 2 - позиции «скорее доверяю», значение 3 - позиции «скорее не доверяю», значение 4 - позиции «не знаю».

Для второго фактора значение 1 соответствует позиции «да», значение 2 - позиции «не во всех», значение 3 - позиции «нет», значение 4 - позиции «не помню».

С помощью инструмента таблицы сопряженности программы 8ТЛГП8'ПСЛ было получено совместное распределение таких переменных, как пол - /1, образование -/1, доход -/1, пол -/2, образование -/2, доход -/2. Оно послужило в качестве исходных данных для расчета критерия хи-квадрат и, кроме того, позволило проанализировать, какие значения факторных переменных /1 и / наиболее ярко выражены для каждой социально-демографической группы.

Применение критерия хи-квадрат дало возможность проверить гипотезу о независимости признаков пол - /ь образование - /ь доход - /1, пол - /2, образование -/2, доход -/2.

Для примера в статье приводятся четыре таблицы сопряженности, отражающие распределение переменных пол - / и доход - /ь пол - /2 и доход - /2 (табл. 3-6)*.

Таблица 3

Таблица сопряженности (пол - /)

Пол ^ (Фактор 1) хи-квадрат Пирсона: 4,2; р=0,23, а=0,05 Всего

1 - «сильное доверие» 2 - «скорее доверяю» 3 - «скорее не доверяю» 4 - «не знаю»

1 3 22 20 5 50

2 6 26 11 7 50

Всего 9 48 31 12 100

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 4

Таблица сопряженности (доход - /1)

Доход (Фактор 1) хи-квадрат Пирсона: 9,62; р=0,14, а=0,05 Всего

1 - «сильное доверие» 2 - «скорее доверяю» 3 - «скорее не доверяю» 4 - «не знаю»

3 4 19 11 4 38

4 2 25 11 7 45

5 3 4 9 1 17

Всего 9 48 31 12 100

Анализ табл. 3 и 4 показывает, что в целой выборке наиболее ярко выражено второе значение («скорее доверяю» результатам выборов) факторной переменной/ (48 % респондентов).

Среди респондентов мужского пола наиболее часто присутствуют варианты «скорее доверяю» или «скорее не доверяю». Причем оба они встречаются приблизительно с одинаковой частотой. Среди респондентов женского пола значение «скорее доверяю» выражено ярче (см. табл. 3). Тем не менее тест по критерию хи-квадрат говорит о незначительном различии уровня доверия избирателей в зависимости от пола (р = 0,23 > а = 0,05).

Данные табл. 4 показывают, что в группах респондентов с уровнем дохода из 3-й и 4-й категории наиболее часто встречается «скорее доверяю»

* В табл. 4, 6 присутствует только уровень дохода, соответствующий категориям 3, 4 и 5, так как респондентов с уровнем дохода из 1-й и 6-й категорий в анкетировании не было.

к результатам выборов. Среди респондентов с уровнем дохода из 5-й категории наиболее часто присутствует вариант «скорее не доверяю». Тест по критерию хи-квадрат говорит о незначительном различии уровня доверия избирателей в зависимости от дохода (р=0,14 > а=0,05).

Таблица 5

Таблица сопряженности (пол - /2)

Пол ¥2 (Фактор 2) хи-квадрат Пирсона: 3,2; р=0,36, а=0,05 Всего

1 - «да» 2 - «не во всех» 3 - «нет» 4 - «не знаю»

1 5 20 13 12 50

2 9 21 14 6 50

Всего 14 41 27 18 100

Таблица 6 Таблица сопряженности (доход - /2)

Доход (Фактор 2) хи-квадрат Пирсона: 4,83; р=0,56, а=0,05 Всего

1 - «да» 2 - «не во всех» 3 - «нет» 4 - «не знаю»

3 8 17 7 6 38

4 5 18 14 8 45

5 1 6 6 4 17

Всего 14 41 27 18 100

Анализируя табл. 5 и 6, можно прийти к выводу, что в целой выборке наиболее ярко выражена позиция 2, т.е. большая часть респондентов участвуют не во всех выборах в различные властные структуры (41 % респондентов).

Респонденты мужского пола в большинстве случаев либо принимали участие не во всех выборах, либо не принимали участие вовсе, либо не помнят о своем посещении избирательного участка. Среди респондентов женского пола частичное участие в выборах выражено ярче (см. табл. 5). В свою очередь, тест по критерию хи-квадрат говорит о незначительном различии активности избирателей в зависимости от пола (р = 0,36 > а = 0,05).

В группе респондентов с уровнем дохода из 3-й категории преобладает позиция 2 (участие не во всех выборах), а в группе респондентов с уровнем дохода из 4-й и 5-й категории позиции 2 и 3 встречаются с почти одинаковой частотой (см. табл. 6). Тест по критерию хи-квадрат говорит о незначительном различии активности избирателей в зависимости от уровня дохода (р = 0,56 > а = 0,05).

Выводы. В статье предложена и проиллюстрирована на примере методика обработки результатов анкетирования, основанная на применении методов факторного анализа и критерия хи-квадрат. Методика позволяет вы-

делять из всего объема вопросов общие агрегированные переменные и устанавливать взаимосвязи между этими переменными и дополнительными характеристиками респондента, такими как пол, доход и др. Рассмотрен пример обработки и анализа анкет, разработанных с целью получения общественного мнения на тему «Отношение тверских студентов к институту выборов». Построена двухфакторная модель, на основе применения критерия хи-квадрат сделаны выводы о взаимосвязи между выделенными факторами и социально-демографическими характеристиками респондента.

Список литературы

1. Беседа, интервьюирование и анкетирование [Электронный ресурс]. -URL: http://cito-web.yspu.org/link1/metod/met93/node4.html (дата обращения: 01.09.2016).

2. Буреева Н.Н. Многомерный статистический анализ с использованием ППП «STATISTICA»: учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». - Нижний Новгород, 2007. - 112 с.

3. Самсонова А.В. Факторный анализ. Направления применения и неиспользованные возможности // Вестник Балтийской педагогической академии. -2005. - Вып. 62. - С. 67-75.

4. Бессокирная Г.П. Факторный анализ: традиции использования и новые возможности // Социология: методология, методы, математическое моделирование. - 2000. - № 12. - С. 142-153.

5. Фомина Е.Е. Обзор программных продуктов, используемых при проведении социологических исследований // Социосфера. - 2016. - № 2 - С. 99-102.

6. Statistica [Электронный ресурс]. - URL: https://ru.wikipedia.org/wiki/ Statistica (дата обращения: 15.09.2016).

7. Красильников Д.И. Программное обеспечение эконометрического исследования ECONOMETRIC SOFTWARE // Вестник Нижегородского университета им. Н.И. Лобачевского. - 2011. - № 3 (2). - С. 231-238.

8. Боровиков В.П. STATISTIKA: искусство анализа данных на компьютере. - СПб.: Питер, 2001. - 656 с. - (Для профессионалов).

9. Боровиков В.П. Программа STATISTICA для студентов и инженеров. - 2-е изд. - М.: КомпьютерПресс, 2001. - 301 с.

10. Факторный и дисперсионный анализ в Excel с автоматизацией подсчетов [Электронный ресурс]. - URL: http://exceltable.com/otchety/faktornyy-dispersionnyy-analiz (дата обращения: 10.09.2016).

11. Главные компоненты и факторный анализ [Электронный ресурс]. -URL: http://statsoft.ru/home/textbook/modules/stfacan.html (дата обращения: 11.09.2016).

12. Митина О.В., Михайловская И.Б. Факторный анализ для психологов: учеб.-метод. коллектор «Психология». - М., 2001. - 169 с.

13. Иберла К. Факторный анализ / пер. с нем. В.М. Ивановой. - М.: Статистика, 1980. - 398 с.

14. Толстова Ю.Н. Измерение в социологии: учеб. пособие. - М.: Книжный дом «Университет», 2007. - 288 с.

15. Губанова Н.Ю. Факторный анализ данных и возможности его использования при обработке данных психологического эксперимента // Sochi Journal of Economy. - 2008. - № 3-4. - С. 178-187.

References

1. Beseda, interv'iuirovanie i anketirovanie [Conversation, interviews and questionnaires]. Available at: http://cito-web.yspu.org/link1/metod/met93/node4.html (accessed 01 September 2016).

2. Bureeva N.N. Mnogomernyi statisticheskii analiz s ispol'zovaniem PPP «STATISTICA»: uchebno-metodicheskii material po programme povysheniia kvali-fikatsii «Primenenie programmnykh sredstv v nauchnykh issledovaniiakh i prepoda-vanii matematiki i mekhaniki» [Multivariate statistical analysis of using the application programme package "STATISTICA": educational and methodological material on professional development programme "Application of software tools in research and teaching mathematics and mechanics"]. Nizhnii Novgorod, 2007, 112 p.

3. Samsonova A.V. Faktornyi analiz. Napravleniia primeneniia i neispol'zovan-nye vozmozhnosti [Factor analysis. Areas of application and unimproved opportunities]. VestnikBaltiiskoi Pedagogicheskoi Akademii, 2005, iss. 62, pp. 67-75.

4. Bessokirnaia G.P. Faktornyi analiz: traditsii ispol'zovaniia i novye vozmozhnosti [Factor analysis: the tradition of its use and new opportunities]. Sotsiologiia: metodologiia, metody, matematicheskoe modelirovanie, no. 12, 2000, pp. 142-153.

5. Fomina E.E. Obzor programmnykh produktov, ispol'zuemykh pri prove-denii sotsiologicheskikh issledovanii [Overview of software products used in conducting sociological research]. Sotsiosfera, no. 2, 2016, pp. 99-102.

6. Statistica. Available at: https://ru.wikipedia.org/wiki/Statistica (accessed 15 September 2016).

7. Krasil'nikov D.I. Programmnoe obespechenie ekonometricheskogo issledo-vaniia ECONOMETRIC SOFTWARE [Software for econometric studies ECONOMETRIC SOFTWARE]. Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo, no. 3, vol. 2, 2011, 231-238.

8. Borovikov V.P. STATISTIKA: iskusstvo analiza dannykh na komp'iutere. Dlia professionalov [STATISTIKA: the art of data analysis on computer. For professionals]. Saint-Petersburg, Piter Publ., 2001, 656 p.

9. Borovikov V.P. Programma STATISTICA dlia studentov i inzhenerov [STATISTICA software for students and engineers]. 2nd ed., Moscow, Komp'iuter Press Publ., 2001, 301 p.

10. Faktornyi i dispersionnyi analiz v Excel s avtomatizatsiei podschetov [Component and dispersive analysis in Excel with calculations' automation]. Available at: http://exceltable.com/otchety/faktornyy-dispersionnyy-analiz (accessed 10 September 2016).

11. Glavnye komponenty i faktornyi analiz [The main components and component analysis]. Available at: http://statsoft.ru/home/textbook/modules/stfacan.html (accessed 11 September 2016).

12. Mitina O.V., Mikhailovskaia I.B. Faktornyi analiz dlia psikhologov [Component analysis for psychologists]. Moscow, Psikhologiia Publ., 2001, 169 p.

13. Uberla K. Faktorenanalyse. Springer-Verlag. 1997 (Russ. ed.: Iberla K. Faktornyi analiz. Moscow, Statistika Publ., 1980, 398 p.).

14. Tolstova Iu.N. Izmerenie v sotsiologii: uchebnoe posobie [Measurements in sociology: textbook]. Moscow, KDU Publ., 2007. 288 p.

15. Gubanova N.Iu. Faktornyi analiz dannykh i vozmozhnosti ego is-pol'zovaniia pri obrabotke dannykh psikhologicheskogo eksperimenta [Component analysis of data and its potential use in the psychological experiment data treatment]. Sochi Journal of Economy, no. 3-4, 2008, pp. 178-187.

Получено 04.10.2016

E.E. Fomina, N.K. Zhiganov

METHODOLOGY OF SURVEY RESULTS PROCESSING WITH THE USE OF MULTIVARIATE AND PARAMETRIC STATISTICS

The authors of the article call survey the main method of opinion polling. It is widely used in many areas as it allows collecting the data on the respondents' opinions on the necessary issues. Data preparation results of a poll are generally presented in the form of a database of a large volume. Then it requires further analysis and interpretation of the results, as well as elaborating and defining the correlation between the aggregated variables and social-demographic characteristics of the respondent. The authors suggest applying methods of multivariate and parametric statistics to solve these matters in practice. The article is devoted to the issue of factor analysis and the chi square test application in the polling results processing. It suggests the methodology of poll results analysis, which consists of two stages. The first one is aimed at searching for the common factors that influence the answers of the respondents, while the second one aims at finding a correlation between the factors and the additional variables, such as gender, age and respondent's income. The proposed methodology is illustrated through the poll results' analysis on the subject of students' attitude to the elections institution. The application of factor analysis method allowed developing a two-factor model. Based on the chi square calculations, the authors draw a conclusion on the existing correlation between the selected factors and the respondent's socio-demographic characteristics.

Keywords: results processing, factor analysis, chi-square test, contingency tables, polling.

Elena E. Fomina - Candidate of Technical Sciences, Associate Professor, Dept. of Informatics and Applied Mathematics, Tver State Technical University, e-mail: f-elena2008@yandex.ru.

Nikolay K. Zhiganov - Doctor of Physical and Mathematical Sciences, Professor, Dept. of Informatics and Applied Mathematics, Tver State Technical University, e-mail: jiganov2005@yandex.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.