Многомерный анализ значимости семантических шкал
И.Н. Мощенко, О.А. Мощенко Южный федеральный университет, Ростов-на-Дону
Аннотация: Исследование проведено на большом практическом материале по мониторингу эмоционального восприятия таких социальных явлений как местного и центрального политических порядков, собственного уровня относительной депривации, культурной инфраструктуры и культурной жизни города в целом, собственного эмоционального состояния. Начиная с 2009 г. выполнено анкетирование нескольких тысяч респондентов по данной тематике с использование технологии семантического дифференциала. Цель настоящей работы - ранжирование используемых семантических шкал по уровню значимости для респондентов и отбору их оптимального набора. Что необходимо для увеличения адекватности измерений и уменьшению погрешностей.
Для калибровки семантических шкал в анкете респондентов просили оценить не только реальный объект, но и два идеальных (положительный - полностью устраивающий опрашиваемых, и отрицательный - абсолютно неприемлемый) того же класса. Расстояние между этими образами позволяло оценивать значимость каждой шкалы. Для всех вышеприведенных объектов исследований и каждой используемой семантической шкалы были получены функции распределения уровня значимости по респондентам. Получено, что эти функции сильно размазаны, по всему диапазону значимостей (для нашей нормировки это от нуля до единицы). При этом исследуемые шкалы разбиваются на три совокупности. Группа шкал с хорошей значимостью (к примеру, шкала умный-глупый), для которых нулевую значимость показывают порядка 15% опрашиваемых, а максимальную - примерно в два раза больше. Шкалы средней значимости (к примеру, шкала быстрый-медленный), для которых значимость во всем диапазоне от 0 до 1 более или менее одинакова. И группа плохой значимости (острый-округлый и др.), для которой большая часть респондентов слабо различают соответствующий признак.
В методе семантического дифференциала эмоциональное восприятие объекта определяется не по отдельным семантическим шкалам, а по всему набору показателей, и для отбора оптимальных шкал анализ их индивидуальных значимостей недостаточен. Нужно еще исследование совокупной значимости наборов шкал. Для этих целей на базе пакета многомерного интеллектуального анализа данных Cognos (фирмы IBM) была разработана многомерная модель значимости семантических шкал. Она позволяла исследовать срезы с фиксированной значимостью для различных наборов шкал. На основе проведенного анализа из 20 первоначальных семантических признаков были отобраны 8. Большее по сравнению с минимально-необходимым (четырем) количеством обеспечивало перекрытие не различающих шкал и увеличение совокупной значимости всего набора. Для всех вышеупомянутых объектов исследования (кроме собственного эмоционального состояния респондента) выявленный оптимальный набор шкал обеспечивает
достаточную совокупную значимость.
Анкеты по оценке эмоционального состояния показали, что индивидуальная значимость семантических шкал для них гораздо ниже, чем для других объектов. Здесь наблюдаются только две группы шкал: средняя, с примерно одинаковой долей респондентов по всему диапазону значимости, и плохая, с максимумом функции распределения в низко значимой части. Группы признаков с хорошей значимостью вообще нет. В качестве оптимального можно взять набор, тот же, что и для других
объектов. Но ни он, ни даже полный набор 20 шкал не обеспечат должную совокупную значимость.
При интерпретации данных по эмоциональному состоянию в работе рекомендовано использовать не общепринятое декартово расстояние, а ранее нами опробованную взвешенную метрику городских кварталов (метрику Минковского). С индивидуальной значимостью по каждой шкале в качестве коэффициентов взвешенности. Шкалы с нулевой значимостью при этом автоматически отсеются, повышая этим совокупную значимость набора признаков.
Ключевые слова: метод семантического дифференциала, аффективная составляющая, социальные объекты, семантическая шкала, идеальные конструкты, значимость, функция распределения, совокупная значимость, многомерная модель, срезы, сечения, выбор, оптимальный набор.
Предлагаемая работа выполнено на большом практическом материале. Начиная с 2009 г. и по настоящий момент нами проводились многочисленные экспериментальные исследования с использование технологии семантического дифференциала [1-6]. Этот метод анкетирования относится к проективным технологиям и позволяет выявлять субъективный, эмоциональный смысл, вкладываемый респондентами в то или иное понятие, и вскрывать эмоциональное восприятие различных объектов или явлений [7,8]. Целью наших исследований были мониторинг и моделирование эмоционального восприятия таких социальных явлений как местного и центрального политических порядков [1-3], собственного уровня относительной депривации [4], культурной инфраструктуры и культурной жизни города в целом [5], собственного эмоционального состояния [6]. Опросы выполнялись в основном среди студентов городов Ростова-на-Дону, Грозного, Владикавказа и Карачаевска. А также политически активной части населения Ростова-на-Дону.
В соответствии с технологией семантического дифференциала респондентов просили оценить вышеприведенные объекты по семантическим биполярным шкалам, образованным каждая парой прилагательных - антонимов. При этом мы использовали 20 семибальных шкал (с градацией от -3 до +3), отобранных из работ основоположника метода Ч. Осгуда [7,8]. Эти шкалы показаны в Табл. 1.
Таблица № 1
Набор биполярных шкал использованных в измерениях по методу семантического дифференциала.
слабый -3 -2 0 1 2 3 сильный
мужской -3 -2 0 1 2 3 женский
активный -3 -2 0 1 2 3 пассивный
медленный -3 -2 0 1 2 3 быстрый
обычный -3 -2 0 1 2 3 необычный
ложный -3 -2 0 1 2 3 правдивый
хороший -3 -2 0 1 2 3 плохой
жестокий -3 -2 0 1 2 3 добрый
прямой -3 -2 0 1 2 3 кривой
пунктуальный -3 -2 0 1 2 3 разболтанный
вкусный -3 -2 0 1 2 3 безвкусный
неудачный -3 -2 0 1 2 3 удачный
твердый -3 -2 0 1 2 3 мягкий
глупый -3 -2 0 1 2 3 умный
новый -3 -2 0 1 2 3 старый
важный -3 -2 0 1 2 3 неважный
острый -3 -2 0 1 2 3 округлый
хладнокровный -3 -2 0 1 2 3 восторженный
бесцветный -3 -2 0 1 2 3 красочный
красивый -3 -2 0 1 2 3 некрасивый
Отметим, что оценки по отдельным шкалам не являются статистически независимыми, между ними наблюдается корреляция. Как показал еще Осгуд, они сводятся к небольшому числу независимых латентных факторов. Он в своих работах выделял три таких фактора - «оценки», «силы» и «активности» [7,8]. Во всех последующих исследованиях, связанных с методом семантического дифференциала, эта закономерность
подтверждалась. Правда по своему смыслу латентные параметры чаще всего
не сводились к классическим факторам Осгуда. И выявлялось не всегда три фактора, некоторые авторы выделяли четыре, а иногда и больше.
Как показали наши последние исследования, закономерность, выявленная Ч. Осгудом, не связана со спецификой метода семантического дифференциала, а имеет более общий характер [9]. При проведении любых оценочных измерений существенны психико-физиологические ограничения восприятия респондента. Средний опрашиваемый может одновременно независимо оценить не больше 3-4 факторов. Если анкета содержит много больше шкал, ответы сворачиваются, начинают коррелировать между собой. Что ведет к искажению результатов опроса. Для увеличения адекватности измерений и уменьшению погрешностей необходимо уменьшать количество шкал до оптимального, что и обусловило цель настоящей работы -ранжирование используемых семантических шкал по уровню значимости для респондентов и отбору их оптимального набора.
Методика семантического дифференциала позволяет выявить ассоциативные связи между объектами в сознании и бессознательном человека [9]. В некотором смысле при этом происходит проекция субъективного эмоционального восприятия исследуемого объекта в семантическое пространство. Это пространство является субъективным для каждого респондента. Для задания масштаба и направления в нем мы использовали разновидность технологии семантического дифференциала с калибровкой [1]. Респондентов просили оценить по одним и тем же семантическим шкалам не только реальный объект, но и два идеальных (положительный - полностью устраивающий опрашиваемых, и отрицательный - абсолютно неприемлемый) того же класса. Образы идеальных конструктов задавали в семантическом пространстве масштаб и направление при интерпретации результатов. Кроме того, расстояние между ними позволило оценивать значимость каждой шкалы. Совпадение
идеальных образов говорило об их неразличимости респондентом и нулевой значимости шкалы. Наибольшее расстояние (из возможных), наоборот свидетельствовало о максимальной значимости. Для всех вышеприведенных объектов исследований и каждой используемой семантической шкалы были получены функции распределения уровня значимости по респондентам (показывающим долю опрашиваемых, характеризующимся каждым фиксированным уровнем значимости шкалы).
Получено, что для всех семантических признаков функции распределения сильно размазаны, по всему диапазону значимостей (для нашей нормировки это от нуля до единицы). При этом исследуемые шкалы можно по уровню значимости разбить на три совокупности.
Группа шкал с хорошей значимостью, для которых максимум функции распределения приходится на наибольший уровень значимости. На Рис. 1 для примера показана функция распределения значимости для шкалы «глупый - умный».
Рис. 1. Функция распределения значимости для шкалы «глупый - умный»
(хорошая значимость).
По горизонтальной оси показан уровень значимости, нормированный от 0 до 1. Здесь единичное значение соответствует максимально возможному расстоянию между образами идеальными конструктов (для шкал, изображенных в Табл. 1, это будет 6). По вертикальной оси приведена доля респондентов (в процентах), характеризующихся данным уровнем значимости. Как видно из представленной диаграммы, единичным уровнем значимости характеризуются 35% опрошенных, для остальных 65% уровень размазан по всей шкале. При этом довольно приличная часть аудитории (15%) не различает по этому признаку идеально положительный и отрицательный конструкты. Что говорит о нулевой значимости такой шкалы для них. К группе с хорошей значимостью относятся также шкалы «слабый -сильный», «активный - пассивный», «ложный - правдивый», «хороший -плохой», «пунктуальный - разболтанный» и «неудачный - удачный».
Во вторую совокупность входят шкалы средней значимости, для которых доля респондентов с уровнями во всем диапазоне от 0 до 1 более или менее одинакова. На Рис. 2 показана функция распределения для шкалы такого типа (на примере признака «медленный - быстрый»).
О 0,15 0,35 0,5 0,55 0,85 1
Рис. 2. Функция распределения значимости для шкалы «медленный -
быстрый» (средняя значимость).
Здесь для 13% опрошенных этот признак имеет нулевую значимость, примерно 28% показали очень невысокий уровень (0,15-0,35), для 35% значимость средняя (0,5-0,65) и для 24% - высокая. К этому типу признаков относятся также шкалы «прямой - кривой», «жестокий - добрый», «вкусный -безвкусный», «важный - неважный», «хладнокровный - восторженный» и «красивый - некрасивый».
Последнюю группу составляют шкалы с плохой значимостью. Для них максимум функции распределения приходится на нулевой уровень. На Рис. 3 для примера показана шкала такого типа «острый - округлый».
О 0,15 0,36 0.5 0,65 0.85 1
Рис. 3. Функция распределения значимости для шкалы «острый - округлый»
(плохая значимость).
Здесь для 30% респондентов этот признак совсем не существенен, а для 50% - слабозначим (уровень 0,15-0,35). И только 20% опрошенных показали значимость 0,65 и выше. Примерно такими же функциями распределения характеризуются шкалы «мужской - женский», «обычный - необычный», «твердый - мягкий», «новый - старый» и «бесцветный - красочный».
В методе семантического дифференциала выводы делают не по отдельным семантическим шкалам, а по всему набору показателей, и для
отбора оптимальных шкал анализ их индивидуальных значимостей недостаточен. Нужно еще исследование совокупной значимости наборов шкал. Для этих целей на базе пакета многомерного интеллектуального анализа данных Cognos (фирмы IBM) была разработана многомерная модель значимости семантических шкал. Она позволяла исследовать срезы с фиксированной значимостью для различных наборов шкал. На Рис. 4 показан для примера скриншот одного из моментов многомерного анализа на
программе PowerPlay Cognos.
Рис. 4. Пример многомерного анализа на программе PowerPlay Cognos.
На экран выведена функция распределения по респондентам уровня значимости шкалы «глупый - умный». Исследование проводилось по наиболее критичным срезам - с нулевыми значимостями. Включены фильтры для выбора нулевых срезов по шкалам «слабый - сильный», «обычный -необычный», «ложный - правдивый», «твердый - мягкий» и «неудачный -удачный». Многомерная модель показывает, что для данного набора шкал совместной нулевой значимостью характеризуется всего лишь 1,63%
респондентов, хотя по отдельным шкалам эта доля значительно больше. Аналогичный анализ был проведен и для других наборов, и не только нулевых, но и максимальных и средних срезов. На основе выполненного исследования из 20 первоначальных семантических признаков были отобраны 8, представленные в табл. 2.
Таблица № 2
Оптимальный набор биполярных шкал.
слабый -3 -2 0 1 2 3 сильный
активный -3 -2 0 1 2 3 пассивный
ложный -3 -2 0 1 2 3 правдивый
хороший -3 -2 0 1 2 3 плохой
пунктуальный -3 -2 0 1 2 3 разболтанный
неудачный -3 -2 0 1 2 3 удачный
глупый -3 -2 0 1 2 3 умный
важный -3 -2 0 1 2 3 неважный
Большее по сравнению с минимально-необходимым (четырем) количеством обеспечивало перекрытие не различающих шкал и увеличение совокупной значимости всего набора. Для всех вышеупомянутых объектов исследования (кроме собственного эмоционального состояния респондента) выявленный оптимальный набор шкал обеспечивает достаточную совокупную значимость. В частности, нулевую значимость показали не более 2% респондентов в каждом рассмотренном измерении.
Для оценки собственного эмоционального состояния респондентов по методу семантического дифференциала использовались немного другие семантические шкалы, показанные в Табл. 3. Получено, что индивидуальная значимость семантических шкал для них гораздо ниже, чем для других объектов. Здесь наблюдаются только две группы шкал. Средняя, с примерно одинаковой долей респондентов по всему диапазону значимости. К той группе относятся признаки «безопасный - страшный», «активный -
1К1 Инженерный вестник Дона. №3 (2016) Н| ivdon.ru/ru/magazine/arcliive/n3y2016/3873
пассивный», «счастливый - несчастный», «хороший - плохой», «злой -добрый», «радостный - печальный» и «унылый - восторженный». На Рис. 5 для примера приведена функция распределения для одной из этих шкал.
Таблица № 3
Набор биполярных шкал использованных в измерениях собственного эмоционального состояния респондентов по методу семантического
дифференциала.
Могучий -3 -2 0 1 2 3 хилый
безопасный -3 -2 0 1 2 3 страшный
активный -3 -2 0 1 2 3 пассивный
счастливый -3 -2 0 1 2 3 несчастный
быстрый -3 -2 0 1 2 3 медленный
рассеянный -3 -2 0 1 2 3 внимательный
хороший -3 -2 0 1 2 3 плохой
злой -3 -2 0 1 2 3 добрый
спокойный -3 -2 0 1 2 3 озабоченный
храбрый -3 -2 0 1 2 3 трусливый
горький -3 -2 0 1 2 3 сладкий
радостный -3 -2 0 1 2 3 печальный
тяжелый -3 -2 0 1 2 3 легкий
глупый -3 -2 0 1 2 3 умный
свежий -3 -2 0 1 2 3 изнуренный
унылый -3 -2 0 1 2 3 восторженный
чистый -3 -2 0 1 2 3 грязный
нежный -3 -2 0 1 2 3 грубый
сложный -3 -2 0 1 2 3 простой
красивый -3 -2 0 1 2 3 отталкивающий
Остальные признаки из Табл. 3 характеризуются плохой значимостью. Для них максимум функции распределения наблюдается в низко значимой части. Пример такой функций распределения приведен на Рис. 6. Группы признаков с хорошей значимостью вообще нет.
1К1 Инженерный вестник Дона. №3 (2016) Н| ivdon.ru/ru/magazine/arcliive/n3y2016/3873
Рис. 5. Функция распределения значимости для шкалы «счастливый -несчастный» (средняя значимость).
О 0,15 0,35 0,5 0.65 0,85 1
Рис. 6. Функция распределения значимости для шкалы «рассеянный -внимательный» (плохая значимость).
Для этих объектов исследований также был проведен многомерный анализ совокупной значимости шкал, и в принципе определен оптимальный набор. Но, ни он, ни даже полный набор 20 шкал не обеспечивают должную совокупную значимость.
К примеру, если в качестве оптимального набора использовать семь вышеприведенных признаков со средней значимостью, то по совокупным параметрам 7,6% респондентов не различают эти признаки. И только 0,64%
показывают совокупную максимальную значимость (+1). Немного лучшие результаты дает подгруппу из четырех признаков: «безопасный - страшный», «счастливый - несчастный», «радостный - печальный» и «унылый -восторженный». Здесь уже 3% опрошенных показывают единичную значимость, правда, 8,3% характеризуются нулевым уровнем. Этот набор шкал можно использовать в качестве оптимального. Но и он, как мы уже сказали, не обеспечивает должной совокупной значимости
При интерпретации данных по эмоциональному состоянию необходимо идти другим путем: использовать не общепринятое декартово расстояние, а ранее нами опробованную взвешенную метрику городских кварталов (метрику Минковского) [10]. С индивидуальной значимостью по каждой шкале в качестве коэффициентов взвешенности. Шкалы с нулевой значимостью при этом автоматически отсеются, повышая этим совокупную значимость набора признаков.
В заключении статьи кратко приведем полученные результаты. По экспериментальным данным выполнен анализ индивидуальной и совокупной значимости 20-ти семантических шкал, из них выявлен оптимальный набор признаков (в количестве восьми штук), обеспечивающий достаточную совокупную значимость. В частности, при измерении таких объектов, как эмоциональное восприятие местного и центрального политических порядков, собственного уровня относительной депривации, культурной инфраструктуры и культурной жизни города в целом нулевую значимость показали не более 2% респондентов в каждом рассмотренном измерении.
Анкеты по оценке эмоционального состояния показали, что индивидуальная значимость семантических шкал для них гораздо ниже, чем для других объектов. Здесь наблюдаются только две группы шкал: средняя, с примерно одинаковой долей респондентов по всему диапазону значимости, и плохая, с максимумом функции распределения в низко значимой части.
Группы признаков с хорошей значимостью вообще нет. На основе многомерного анализа и для этого объекта измерений определен оптимальный набор шкал, включающий четыре семантических признака. Но, ни он, ни даже полный набор 20 шкал не обеспечат должную совокупную значимость.
При интерпретации данных по эмоциональному состоянию в работе рекомендовано использовать не общепринятое декартово расстояние, а ранее нами опробованную взвешенную метрику городских кварталов (метрику Минковского), с индивидуальной значимостью по каждой шкале в качестве коэффициентов взвешенности. Шкалы с нулевой значимостью при этом автоматически отсеются, повышая этим совокупную значимость набора признаков.
Работа выполнена по гранту РФФИ № 14-06-00230а.
Литература
1. Розин М.Д., Мощенко И.Н., Джикаев Д.А. Моделирование политической напряженности методами семантического дифференциала и теории катастроф // «Математический форум. (Итоги науки. Юг России)», 2010, Т. 4, С. 341-353.
2. Мощенко И.Н. Иванова М.И. Сравнительный анализ уровня политической напряженности среди студенчества некоторых регионов Северного Кавказа (по результатам психосемантического феноменологического моделирования). Инженерный вестник Дона, 2011, №3 URL: ivdon.ru/ru/magazine/archive/n3y2011/569.
3. Гайрабеков И.Г., Розин М.Д., Мощенко И.Н. Психосемантический анализ отношения студенчества г. Грозного к политическому порядку. Научная мысль Кавказа. Междисциплинарный журнал, 2011, №2. с.116-126.
4. Мощенко И.Н., Алботов А.М. Социально-экономические аспекты депривационных установок студенчества КЧР. Инженерный вестник Дона, 2015, №1 ч.2. URL: ivdon.ru/magazine/archive/n1p2y2015/2939.
5. Мощенко И.Н. Иванова М.И. Методика мониторинга восприятия культурного комплекса. Инженерный вестник Дона, 2014, №3 URL: ivdon.ru/ru/magazine/archive/n3y2014/2592.
6. Розин М.Д., Иванова М.И., Ярошенко А.Н. Анализ эмоциональных состояний студенчества Ростова-на-Дону в конце 2015 гг. Инженерный вестник Дона, 2016, №2 URL: ivdon.ru/ru/magazine/archive/n2y2016/3673.
7. Osgood C.E., Suci G.J., Tannenbaum P.H. The measurement of meaning. Urbana and Chicago: University of Illinois press, 1957. 347 p.
8. Osgood C.E. The nature and measurement of meaning. Psychological Bulletin, Vol. 49, No. 3, May, 1952. P.197 - 327.
9. Розин М.Д., Мощенко И.Н., Свечкарев В.П., Иванова М.И. Обобщение закона факторизации семантического пространства применительно к любым оценочным шкалам. Инженерный вестник Дона, 2016, №3 URL: ivdon.ru/ru/magazine/archive/n3y2016/3867.
10. Мощенко И.Н. Применение метрики Минковского первого порядка в социальных исследованиях. Инженерный вестник Дона, 2015, №3 URL: ivdon.ru/ru/magazine/archive/n3y2015/3413.
References
1. Rozin M.D., Moshchenko I.N., Dzhikaev D.A. «Matematicheskiy forum. (Itogi nauki. Yug Rossii) », 2010, V. 4. Pp. 341-353.
2. Moshchenko I.N., Ivanova M.I. Inzenernyj vestnik Dona (Rus), 2011, №3 URL: ivdon.ru/ru/magazine/archive/n3y2011/569.
3. Gayrabekov I.G., Rozin M.D., Moshchenko I.N. Nauchnaya mysl' Kavkaza. Mezhdistsiplinarnyy zhurnal, 2011, №2. Pp.116-126.
4. Moshchenko I.N., Albotov A.M. Inzenernyj vestnik Dona (Rus), 2015, №1 p.2. URL: ivdon.ru/magazine/archive/n1p2y2015/2939.
5. Moshchenko I.N., Ivanova M.I. Inzenernyj vestnik Dona (Rus), 2014, №3 URL: ivdon.ru/ru/magazine/archive/n3y2014/2592.
6. Rozin M.D., Ivanova M.I., Yaroshenko A.N. Inzenernyj vestnik Dona (Rus), 2016, №2 URL: ivdon.ru/ru/magazine/archive/n2y2016/3673.
7. Osgood C.E., Suci G.J., Tannenbaum P.H. The measurement of meaning. Urbana and Chicago: University of Illinois press, 1957. 347 p.
8. Osgood C.E. The nature and measurement of meaning. Psychological Bulletin, Vol. 49, No. 3, May, 1952. P.197 - 327.
9. Rozin M.D., Moshchenko I.N., Svechkarev V.P., Ivanova M.I. Inzenernyj vestnik Dona (Rus), 2016, №3 URL: ivdon.ru/ru/magazine/archive/n3y2016/3867.
10. Moshchenko I.N. Inzenernyj vestnik Dona (Rus), 2015, №3 URL: ivdon.ru/ru/magazine/archive/n3y2015/3413.