ЯЗЫКИ КУЛЬТУРЫ
УДК 316.776.32 DOI 10.53115/19975996_2023_03_053-063
ББК 60.524.224
К.Ю. Цыганкова, Ю.А. Грибер
ВИЗУАЛИЗАЦИЯ АССОЦИАТИВНЫХ ПРАВИЛ В АНАЛИЗЕ ЦВЕТОВОЙ КОММУНИКАЦИИ*
Представлен опыт экспериментальной реализации на основе современных программных платформ и технологий семи различных способов визуализации данных, полученных методами поиска ассоциативных правил в социально-психологических исследованиях цвета: текстовое описание; таблица; визуализация на основе тепловой карты; диаграммы Эйлера-Венна; график параллельных множеств; точечный график категорий; визуализация, основанная на графах. Материал исследования составили базы данных трех социально-психологических экспериментов, направленных на изучение аффективных реакций на цвет представителей различных культур. Представлены результаты экспертного опроса, в котором приняли участие семь профессиональных психологов и социологов, имеющих опыт эмпирических исследований цвета. Оценка возможностей и ограничений использования различных методов визуализации ассоциативных правил в анализе цветовой коммуникации проводилась методом лейтмотивного интервью. Содержащийся в статье анализ позволит специалистам в области социологии, психологии и прикладной культурологии использовать представленные в статье стратегии в качестве основы для разработки собственных моделей визуального анализа результатов социально-психологического изучения цветовой коммуникации.
Ключевые слова:
ассоциативные правила, визуализация, цвет, социология цвета, цветовая коммуникация.
Цыганкова К.Ю., Грибер Ю.А. Визуализация ассоциативных правил в анализе цветовой коммуникации // Общество. Среда. Развитие. - 2023, № 3. - С. 53-63. - DOI 10.53115/19 975996_202 3_03_053-063
© Цыганкова Карина Юрьевна - магистр, исследователь Лаборатории цвета, Смоленский государственный университет, Смоленск; e-mail: [email protected]
© Грибер Юлия Александровна - доктор культурологии, профессор, директор Лаборатории цвета, Смоленский государственный университет, Смоленск; e-mail: [email protected]
1. Введение
Поиск ассоциативных правил (англ. аssociation rule mining) представляет собой эффективный метод извлечения и анализа информации в базах данных. Иногда задачу поиска правил ассоциаций также называют анализом рыночной корзины (англ. market basket analysis), так как впервые она была предложена для нахождения шаблона покупок, совершаемых в рамках одной транзакции [23].
Суть метода поиска ассоциативных правил в базе данных заключается в том, чтобы установить взаимосвязи между отдельными событиями - найти ассоциативные правила, утверждающие, что наступление
события А влечет за собой наступление события В [5]. Например, в сфере торговли ассоциативные правила помогают специалистам понять, какие продукты посетители магазинов чаще всего покупают вместе, и соответствующим образом разложить продукцию на прилавках [10].
В последние годы в результате стремительного роста объема получаемых и обрабатываемых данных метод поиска ассоциативных правил начал широко применяться не только в решении прикладных задач торговли [9], бизнеса [21], транспорта [15], промышленности [17], но и в научном анализе разного рода социально-демографических данных [8], социальных
* Исследование выполнено в Смоленском государственном университете за счет гранта Российского научного фонда № 22-18-00407, https://rscf.ru/project/22-18-00407/.
см со
О
сетей и коммуникации [16; 18], социальной структуры, социальных институтов и процессов [27-29].
В социологическом изучении цветовой коммуникации метод ассоциативных правил широко используется для поиска повторяющихся последовательностей, оценки вероятностей, выявления исключений и аномалий в развитии связанных с цветом культурных традиций, и в целом - для определения в ответах респондентов новых механизмов и закономерностей. Поиск правил позволяет проверить зависимость выбираемых цветов от типов объектов и со -циально-демографических характеристик участников (их пола, возраста, места проживания) и, таким образом, получить новые данные о цветовых предпочтениях, цветовых ассоциациях и аффективных реакциях на цвет [2] или сравнивать кросс-модальные соответствия представителей различных культур и на этой основе делать новые выводы о природе и механизмах цветовой когниции (см. подробнее: [4]).
Одна из главных сложностей применения метода поиска ассоциаций в социально-психологических исследованиях связана с тем, что извлеченные правила чаще всего исчисляются сотнями. Исследователю приходится разными способами «просеивать» их для того, чтобы найти наиболее интересные, а затем выбрать способ визуализации, понятный для пользователей, не являющихся специалистами в области компьютерных наук и наук о данных [10, 22]. В исследованиях цветовой коммуникации задача осложняется наличием специфических хроматических параметров переменных, которые являются неотъемлемой частью каждого из правил и, как следствие, должны присутствовать в их визуальной модели.
Цели статьи заключаются в том, чтобы: 1) систематизировать стратегии визуализации ассоциативных правил в социологических исследованиях и выделить среди них основные; 2) представить опыт экспериментальной реализации на основе современных программных платформ и технологий различных способов визуализации данных, полученных методами поиска ассоциативных правил в социально-психологических исследованиях цвета; и 3) провести анализ возможностей и ограничений использования этих методов в исследовании цветовой коммуникации.
2. Материалы и методы
Материал исследования составили базы данных трех социально-психологических экспериментов, направленных на изуче-
ние аффективных реакций на цвет представителей различных культур.
Целью Эксперимента 1, в котором приняли участие 48 человек в возрасте от 19 до 21 года [2], являлась экспериментальная проверка гипотезы о том, что различные хроматические характеристики кнопок, которые человек видит на сенсорном экране (их яркость, тон, насыщенность), могут выступать в роли самостоятельных стимулов поведенческих реакций (визуальных триггеров) и оказывать заметное влияние на желание дотронуться до них. Для исключения влияния на результаты возрастных изменений критерием для включения в экспериментальную группу был относительно однородный возраст участников (20 лет ± 1). Чтобы установить возможные гендерные различия, подвыборки мужчин и женщин формировались равными по объему (24 мужчины и 24 женщины).
Цель Эксперимента 2 заключалась в том, чтобы проверить, имеют ли стратегии построения гармоничных цветовых сочетаний кросс-культурную специфику, и установить «геометрические» параметры выявленных различий в цветовом пространстве CIELAB [1]. Для этого участникам показывали на экране компьютера ряд цветовых таблиц, каждая из которых состояла из трех горизонтальных полос разного размера. Цвет верхней и нижней полос был закреплен. Задача участника заключалась в том, чтобы выбрать оттенок, наиболее подходящий для неокрашенной полосы в центре, а затем сравнить каждую из составленных ими цветовых таблиц с соответствующим ей оригиналом - таблицей из «Справочника по цвету» М. Матюшина [3] - и определить, какой из вариантов им нравится больше. В эксперименте приняли участие 508 человек в возрасте от 18 до 76 лет из семи различных стран - Алжир, Беларусь, Мексика, Нигерия, Россия, Саудовская Аравия, Чили.
Эксперимент 3 был направлен на определение кросс-культурных различий цветовых ассоциаций [12]. Участники этого исследования выбирали в предложенной цветовой палитре наиболее подходящие соответствия для пар противоположных по значению антропологически значимых концептов:
(теплый/холодный, грустный/радостный, спокойный/беспокойный, близкий/далекий, молодой/старый, женский/мужской, быстрый/ медленный, сильный/слабый, фальшивый/искренний, дешевый/дорогой, безопасный/опасный, я/другие).
В эксперименте приняли участие 753 жителя 9 различных стран (России, Турции, Ирана, Непала, Саудовской Аравии,
Германии, Уганды, Швеции и Японии) в возрасте от 18 до 76 лет, которые вместе представили 18 072 ответа.
Результаты всех трех экспериментов анализировались методом поиска ассоциативных правил, для реализации которого применялись алгоритмы Apriori, FP-Growth и FP-Max.
Для оценки степени важности полученных ассоциативных правил использовались три основных показателя (см. напр.: [10]):
1) поддержка (англ. support) - параметр, показывающий относительную частоту, с которой условие и следствие встречаются вместе в имеющемся множестве транзакций, его популярность;
2) достоверность (англ. confidence) -вероятность, с которой из А следует В -параметр, который показывает надежность правила;
3) значимость (англ. lift) - параметр, который показывает отношение достоверности ассоциативного правила (A^B) к поддержке следствия (B).
Таким образом, каждое ассоциативное правило имело вид простой импликации вида A^B, где A и B представляли собой непересекающиеся наборы элементов, и сопровождалось набором показателей значимости. Например, при анализе данных Эксперимента 3 ассоциативное правило имело вид:
теплый - желтый => опасный - красный [поддержка = 0,4]
Такая запись означала, что 40 % участников эксперимента, которые выбрали желтый цвет в качестве визуального образа понятия теплый, также выбрали красный для визуализации концепта опасный.
Определение основных стратегий визуализации ассоциативных правил проводилось методом анализа полных текстов опубликованных за последние десять лет исследований, посвященных визуализации ассоциативных правил в научных и прикладных исследованиях. Отбор источников осуществлялся через системы РИНЦ, Google Scholar, Scopus, Web of Science на основе анализа заголовков и аннотаций источников по ключевым словам «ассоциативное правило» (англ. - association rule) и «визуализация» (англ. - visualization). Всего было проанализировано 12 полных текстов статей, опубликованных за последние 15 лет [6, 7, 10, 11, 13, 14, 19, 20, 22, 24-26].
Для экспериментальной реализации стратегий визуализаций ассоциативных правил (раздел 3.2) применялись программные средства Python-библиотек Pandas, Seaborn, Supervenn, Plotly, NetworkX.
Для оценки возможностей и ограничений использования различных методов визуализации ассоциативных правил в исследовании цветовой коммуникации использовался экспертный опрос, в котором приняли участие семь профессиональных психологов и социологов, имеющих опыт эмпирического изучения цвета. Исследование проводилось методом лейтмо-тивного интервью. Экспертам показывали разработанные в ходе экспериментальной апробации способы визуализации вместе с соответствующими им комментариями и просили рассказать, насколько, по их мнению, предлагаемая визуальная репрезентация помогает понять и правильно интерпретировать представленную на ней информацию. В среднем интервью с одним экспертом длилось 10-15 минут. Интервью записывались на аудионосители и впоследствии транскрибировались. После соответствующей обработки всех ответов была составлена группировочная таблица, на основе которой проводился анализ.
3. Результаты и их обсуждение
3.1. Основные стратегии визуализации
ассоциативных правил
Чтобы определить основные стратегии визуализации ассоциативных правил, мы провели анализ полных текстов опубликованных за последние 15 лет исследований, указанных выше. Систематизация документов показала, что наиболее популярными являются семь основных типов представления данных.
(1) Распространенная стратегия обычного текстового описания позволяет использовать лишь простейшие способы визуализации - абзацные отступы, строки и пробелы.
(2) Более сложным способом текстового представления полученных методом поиска ассоциативных правил данных являются таблицы, состоящие из вертикальных столбцов с уникальным именем и горизонтальных строк.
(3) Ассоциативные правила хорошо трансформируются в тепловые карты (англ. heatmap visualization). Этот тип простых матриц позволяет представить две части ассоциативного правила на различных осях и обозначить цветом отдельные показатели значимости.
(4) Для визуализации логических отношений между содержащимися в ассоциативных правилах множествами используются простые матрицы другого типа -диаграммы Эйлера - Венна (англ. Venn and Euler diagrams). Этот тип репрезентации
представляет собой геометрическую схему, в которой простые фигуры (чаще всего -круги) обозначают классы, а их взаимное расположение показывает отношения между множествами.
(5) В отличие от простых матриц сгруппированные матрицы дают возможность показать более сложные отношения между переменными и правилами. Одним из наиболее популярных методов репрезентации многомерных данных этого типа является график параллельных множеств (англ. parallel categories diagram). В этом типе визуализации наборы данных представлены в виде линий, разделенных на подмножества. Ширина каждой линии определяется пропорциональным коэффициентом категории, а разные цвета обозначают траектории потока.
(6) Еще одним распространенным способом визуализации сгруппированных данных является точечный график категорий, или диаграмма рассеяния (англ. scatter plot). Этот график позволяет изобразить двумерный признак на декартовой плоскости в виде точек и таким образом получить визуальную репрезентацию категорий признака. Значения атрибутов, как правило, отображаются по оси абсцисс, а значения их частот или показателей значимости - по оси ординат.
(7) Для репрезентации более сложных связей между данными в исследованиях методом ассоциативных правил обычно используются различные способы визуализации, основанные на графах (англ. graph-based visualization). Этот способ предполагает трансформацию ассоциативного правила в набор графических элементов. В большинстве случаев элементы правила
изображаются в форме узлов, а линии показывают связи. В этом случае график выглядит как сеть, состоящая из множества вершин, которые соединены между собой ребрами.
3.2. Экспериментальная реализация стратегий визуализаций ассоциативных правил на основе современных программных платформ и технологий
Чтобы оценить возможности и ограничения каждой из стратегий в анализе и визуализации данных, связанных с цветом, мы провели их экспериментальную реализацию на основе современных программных платформ и технологий.
3.2.1. Текстовое описание
Применение алгоритма Apriori к данным Эксперимента 1 позволило составить следующее текстовое описание вероятности выбора одного из двух оттенков в паре (рис. 1). В составленных записях абзацные отступы обозначают условную границу для мужчин и женщин, строки позволяют ранжировать записи по значению вероятности; условные обозначения ^у - ахроматические оттенки; V - насыщенные; Ь - яркие, dk - темные, к -светлые) - сократить длину до удобного для чтения размера.
Согласно полученному описанию, выбирая один оттенок из двух, мужчины и женщины во многих случаях используют одинаковые стратегии. Так, из комбинации ахроматического ^у) и хроматического оттенка из группы Ь (яркие оттенки) и мужчины, и женщины практически с одинаковой вероятностью выберут яркий оттенок (Ь) (вероятность 18,84 % и 14,84 % соответственно - строки 3 и 7 рис. 1). Наоборот,
о
Вероятность выбора оттенка группы & из пары \-%у составляет 21.88%. Вероятность выбора оттенка группы V из пары v-gy составляет 21.88%. Вероятность выбора оттенка группы Ъ из пары Ь-&> составляет 14.84%. Вероятность выбора оттенка группы <1к из пары <1ксоставляет 14.84%. Вероятность выбора оттенка группы gy из пары ¿-¿у составляет 10.16%. Вероятность выбора оттенка группы gy из пары с1ксоставляет 10.16%.
Вероятность выбора оттенка группы Ъ из пары составляет 18.84%. Вероятность выбора оттенка группы И из пары //-V составляет 13.41%. Вероятность выбора оттенка группы V из пары у-6 составляет 12.77%. Вероятность выбора оттенка группы ¿к из пары с1к-у составляет 11.59%. Вероятность выбора оттенка группы V из пары составляет 7.88%. Вероятность выбора оттенка группы gy из пары составляет 7.34%. Вероятность выбора оттенка группы из пары (1к^у составляет 4.62%.
Рис. 1. Вероятность выбора оттенка с определенной яркостью и насыщенностью в паре. Текстовое описание, полученное на основе применения алгоритма Apriori
из комбинации ахроматического (gy) и хроматического оттенка из группы dk (темные оттенки) они скорее выберут ахроматический, причем женщины - с гораздо большей вероятностью, чем мужчины (вероятность 10,16 % и 4,62 % соответственно - строки 6 и 13). В комбинации ахроматического (gy) и хроматического оттенка из группы v (насыщенные оттенки) вероятность выбора одного или другого оттенка и у мужчин, и у женщин практически одинаковая (21,88 % у женщин, 7,88 % и 7,34 % - у мужчин - строки 1-2 и 11-12; см. подробнее [2].
3.2.2. Таблица
Таблица, построенная в Pandas после применения метода ассоциативных правил к результатам Эксперимента 2 (рис. 2), позво-ляет сделать выводы о стратегиях выбора гармоничных оттенков жителями Мексики. Цифры в первой графе обозначают номер таблицы из справочника М. Матюшина [3]. Вторая графа содержит записи о расстоянии между выбранной точкой и оттенками заданных верхней (top) и нижней (bottom) полос в цветовом пространстве CIELAB.
Согласно представленным данным, чтобы построить гармоничное сочетание в первой таблице, жители Мексики выбирают оттенок, в цветовом пространстве CIELAB немного ближе расположенный к верхнему цвету, чем к нижнему: расстояние от выбранного оттенка до оттенка верхней полосы составляет от 20 до 29 (20-29 top), цвет нижней полосы при этом находится в диапазоне между 30 и 49 (30-39 bottom, 4049 bottom). Похожая стратегия используется и в пятой таблице (20-29 top, 40-49 bottom, 50-59 bottom). Во второй и третьей таблицах выбранный оттенок иногда распола-
гается ближе к верхней полосе (10-19 top), а треугольник в ряде случаев стремится по форме к равностороннему (20-29 top - 2029 bottom).
3.2.3. Тепловые карты
Тепловая карта, построенная в Python-библиотеке Seaborn с модулем Heatmap после применения метода ассоциативных правил к результатам Эксперимента 3, показывает популярность цветовых ассоциаций россиян (вертикальная ось) с различными антропологически значимыми концептами (горизонтальная ось); поддержка каждой ассоциации закодирована цветом (рис. 3).
Согласно представленным данным, многие понятия (см., напр., близкий/далекий, быстрый/медленный, я/другие) имеют «размытые ассоциации», значение которых не превышает 15 %. Наиболее значимой является связь между розовым цветом (A4) и понятием женский (41,4 %), насыщенным красным (B4) - понятиями беспокойный (35,7 %) и опасный (34,3 %). Понятие радостный коррелирует с насыщенными оранжевым (B3) и желтым (B2) (31,4 % и 30 % соответственно); грустный - с серым (В1).
3.2.4. Диаграммы Эйлера - Венна
Диаграмма Эйлера - Венна использовалась для визуализации логических отношений между множествами, содержащимися в ассоциативных правилах Эксперимента 2. Программное решение библиотеки для Python Supervenn позволило обозначить множества не привычным способом (пересекающимися окружностями), а в виде горизонтальных полос, цвета которых кодируют классы разных стран (рис. 4).
Согласно представленным данным, страны имеют схожее количество множеств (9).
Посылка
1 1
2 2 2 3 3 3 5 5
Следствие
Поддержка Достоверность Значимость
20-29 top -20-29 top-10-19 top -20-29 top-20-29 top -10-19 top -20-29 top -20-29 top -20-29 top -20-29 top-
30-39 bottom 40-49 bottom 20-29 bottom 20-29 bottom 30-39 bottom 20-29 bottom 10-19 bottom 20-29 bottom 40-49 bottom 50-59 bottom
2.14% 10.71% 1.67
3.57% 17.86% 2.78
2.86% 14.29% 2.11
2.86% 14.29% 1.54
2.14% 10.71% 1.67
2.14% 10.71% 1.58
2.50% 12.50% 2.06
2.50% 12.50% 1.35
2.14% 10.71% 1.67
3.93% 19.64% 4.23
Рис. 2. Ассоциативные правила выбора оттенка в заданном контексте жителями Мексики.
Таблица, построенная в Pandas
3
VO
4.3% 4.3% 2.9% 7.1% 4.3% 2.9% 2.9% 8.6% 2.9% 4.3% 11.4% 4.3% 15-7% 5.7% 5.7% 11.4%
7.1% 4.3% 2.9% 5.7% 2.9% 5.7% 29% 2.9% 4.3% 11.4% 4.3% 5.7% 29% 2-9%
2.9% 15.7% 7.1% 8.6% 2.9% 7.1% 7.1% 5.7% 2.9% 5.7%
5.7% 2.9% 5.7% 14.3% 2.9% 11.4% 7.1% 4.3% 4.3%
2.9% 20.0% 5.7% 8.6% 4.3% 14.3% 2.9% 11.4% 7.1% 5.7% 5.7% 5.7%
2.9% 2.9% 10.0% 4.3% 4.3% 5.7% 8.6% 10.0% 2.9% 8.6%
4.3% 10.0% 8.6% 4.3% 2.9% 8.6% 4.3% 2.9% 4.3% 2.9% 5.7%
11.4% 10.0% 2.9% 7.1% 2.9% 8.6% 10.0% 4.3% 5.7% 4.3% 12.9%
2.9% 4.3% 2.9% 4.3% 10.0% 5.7% 10.0% 14.3% 5.7% 4.3% 4.3% 4.3%
10.0% Щ 2.9% 2.9% 4.3% 7.1% 5.7% 5.7% 4.3% 4.3% 11.4% 2.9% 4.3% 2.9%
2.9% 2.9% 7.1% 14.3% 2.9% 4.3% 4.3% 8.6% 5.7%
4.3% 11.4% 5.7% 4.3% 7.1% 2.9% 7.1%
2.9% 2.9% 2.9% 7.1% 2.9% 14.3% 5.7% 11.4% 14.3% 4.3% 5.7% 12.9%
4.3% 12.9% 5.7% 4.3% 71% 2.9% 2.9% 6.6% 5.7% 8.6% 5.7%
2.9% 4.3% 2.9% 11.4% 2.9% 12.9% 5.7% 2.9%
2.9% е.6% 4.3% 5.7% 7.1% 2.9% 2.9% 7.1% 7.1%
2.9% 2.9% 4.3% 7.1% 7.1% 2.9% 7.1% 4.3% 2.9% 6.6%
12.9% 2.9% 2.9% 17.1% 12.9% 2.9% 10.0% 4.3% 5.7% 4.3%
2.9% 10.0% 4.3% е.6% 2.9% 2.9% 18.6% 2.9% 4.3% 15.7% 10.0%
7.1% 4.3% 12.9% 2.9% 4.3% 2.9% 4.3% 4.3% 2.9%
2.9% 2.9% 6.6% 15 7% 2.9% 2.9% 5.7% 2.9% 2.9% 4.3%
2.9% 5.7% 6.6% 4.3% 4.3% 4.3% 5.7%
4.3% 11.4% 11.4% 2.9% 5.7% 4.3% 4.3% 4.3% 2.9% 1,1% 8.6% 5.7% 7.1% 10.0% 2.9% 2.9% 4.3% 7.1% 4.3%
2.9% 4.3% 4.3% 2.9% 7.1% 5.7% 5.7% 29%
4.3% 5.7% 4.3% 2.9% 2.9% 4.3%
10.0% 5.7% 11.4% 8.6% 2.9% 7.1% 5.7% 4.3%
4.3% 2.9% 4.3% 7.1% 4.3% 7.1% 2.9% 2.9%
10.0%
4.3%
4.3% 4.3% 4.3%
4.3% 5.7% 5.7%
2.9% 10.0%
7.1%
4.3% 7.1% 5.7%
2.9% 2.9%
4.3% 7.1% 4.3%
'5 'S ■s 'J i £ & |
I 5 i I
О GO
я s
Рис. 3. Популярность цветовых ассоциаций россиян. Тепловая карта, построенная в Python-библиотеке Seaborn с модулем Heatmap
со
OJ
о
OJ
о
3
\о
Исключение составляют только Мексика и Нигерия, где классов значительно меньше (5 и 6 соответственно). Наибольшее количество множеств пересекается у Беларуси, Саудовской Аравии и Чили (6 центральных вертикальных полос), однако все пересечения при этом имеют небольшой размер (1).
3.2.5. Сгруппированные матрицы
График параллельных множеств, построенный по данным Эксперимента 1 (см. рис. 1) в Python-библиотеке Plotly с использованием функции ParaUel_Categories показывает гендерные различия в стратегиях выбора одного из двух оттенков в паре (рис. 5). Цвета кодируют вероятность выбора; вертикальные оси - пары оттенков (в центре), хроматические характеристики выбранного цвета (слева) и пол (справа).
Выбранная функция позволяет сохранять полученные графики не только в виде двухмерного изображения, но и в html-формате, обеспечивая более удобное взаимодействие пользователя с результатом.
3.2.6. Точечный график категорий
Точечный график категорий, построенный с использованием модуля Scatterplot Python-библиотеки для визуализаций Seaborn для анализа данных Эксперимента 3, показывает вероятность выбора цвета в различных странах (рис. 6). Цвета кодируют сегменты цветового круга, из которого участники выбрали оттенок, чтобы составить гармоничную триаду (I - от 0 до 90 градусов, II - от 91 до 180 градусов, III - от 181 до 270 градусов, IV - от 271 до 360 градусов); знаки различной формы обозначают страны.
<я
ш
Ifl
2 ш 1 3 1 1 1 2 и 4 6 6 6 5 4 * 2 ■ 1 1
Russia 9
1 1 Век i 1 S
Saudi Arabia 1 9
1 1 - и. 1 9
1 1 1 ■1 Algeria 1 9
Mexico «I
■ Мд - 5
111 2 1 2 111111111
ITEMS
Рис. 4. Диаграмма Эйлера - Венна, построенная средствами Python-библиотеки 8ирегуепп; цвета кодируют классы разных стран; цифры справа показывают количество множеств в каждой стране, сверху - сколько множеств принимает участие в формирования каждого пересечения снизу - размер пересечения (количество общих элементов)
Рис. 5. График параллельных множеств, построенный в Python-библиотеке Р1оЩ с использованием функции Parallel_Categories; аббревиатуры обозначают группы оттенков: Ь - яркие, gy - ахроматические, dk - темные, Ы - светлые, V - насыщенные
СС ^
CD
О О
Рис. 6. Вероятность выбора цвета в различных странах. Точечный график категорий, построенный с использованием модуля Scatterplot Python-библиотеки для визуализаций Seaborn
По оси ординат представлены показатели вероятности выбора; по оси абсцисс - различия треугольников, образованных тремя точками цветового сочетания в пространстве CIELAB, по площади.
Согласно представленным данным, россияне чаще участников из других стран выбирают для создания гармоничных цветовых сочетаний сине-фиолетовые оттенки, координаты которых в цветовом пространстве CIELAB достаточно далеко расположены от точек уже заданных полос сверху
и снизу (синий круг на рис. 6). Участники из Саудовской Аравии чаще других выбирают красные цвета, располагая их на небольшом или, наоборот, очень большом расстоянии от имеющихся (красный ромб на рис. 6). Жители Алжира предпочитают создавать в цветовом пространстве очень маленькие по площади треугольники и подбирают собственный оттенок, почти повторяющий хроматические характеристики одного из оттенков контекста (светло-зеленый крест на рис. 6).
Рис. 7. Визуальная репрезентация средствами библиотеки NetworkX цветовых ассоциаций понятия теплый у участников из разных стран
3.2.7. Способы визуализации, основанные
на графах
Построенная средствами Python-библи-отеки NetworkX по данным Эксперимента 3 визуальная репрезентация цветовых ассоциаций понятия теплый (рис. 7) показывает, какие связи доминируют у участников из разных стран, позволяет сравнивать их хроматические характеристики, оценивать степень близости и определять уникальные ассоциации. Цвета кодируют хроматические характеристики оттенков; расстояние между точками показывает близость связи.
Согласно представленным данным, наиболее похожи цветовые ассоциации у участников из Германии и Швеции, Уганды и Ирана. Более специализированные цветовые ассоциации характерны для жителей Турции, Саудовской Аравии и Непала. Ассоциации понятия теплый с яркими и светлыми желтым (A2, B2), оранжевым (A3, B3) и красным (B4) имеют универсальный характер, в то время как связи с сиреневым (A5), фиолетовым (B5) и сине-зелеными оттенками (A7, B7) являются уникальными.
3.3. Экспертная оценка визуальной
репрезентации результатов анализа
аффективных реакций на цвет
По мнению экспертов, текстовое описание, которое считается наиболее простым и доступным способом представления ассоциативных правил, хорошо применимо лишь в том случае, если правил немного, и они имеют простую и понятную структуру. Главный недостаток этой стратегии заключается в том, что описание оставляет за рамками многие значимые параметры полученных данных. Оно не дает практически никакой информации о связях между правилами и значительно снижает возможность сравнительного анализа хроматических характеристик групп.
Большинство экспертов отметило, что таблицы более удобны по сравнению с текстовым описанием, поскольку, наряду с информацией об элементах правила, позволяют включить больше показателей (поддержку, достоверность, значимость). Преимуществом этой формы они назвали также возможность фильтровать и ранжировать полученные данные для решения различных исследовательских задач. Однако эксперты выразили единое мнение о том, что, как и обычный текстовый формат, таблицы сложны для быстрого понимания, ограничены в объеме представляемых данных и не могут показать существующие связи правил между собой и с другими показателями.
Главным преимуществом использования тепловых карт для визуализации результатов социально-психологических экспериментов с цветом эксперты назвали наглядность связей между переменными благодаря цветному градиенту, кодирующему значения от меньшего к большему. Они отметили, что этот метод будет особенно удобен в том случае, если данные собраны в ходе кросс-культурного исследования и предполагают сравнительный анализ одних и тех же показателей, полученных в отдельных странах. При этом диаграммы Эйлера - Венна позволяют эффективнее решить принципиально другой тип исследовательских задач - количественно представить логические отношения между множествами. Квадратная форма репрезентации классов хорошо показывает большое число множеств и значительно упрощает дальнейшую интерпретацию данных, а цифры дают важную информацию о пересекающихся классах. Однако как в случае с тепловыми картами, так и при выборе диаграмм Эйлера - Венна метод простых матриц имеет ограниченные возможности, так как отображает связи только между дискретными или категориальными переменными. Репрезентацию непрерывного значения признака данной тип диаграммы не предполагает.
К недостаткам визуализации данных с помощью графика параллельных множеств эксперты отнесли перекрывающиеся строки, неизбежные при большом количестве правил, а также характерную для него двусмысленность, возникающую из-за того, что несколько правил ассоциации иногда включают один и тот же элемент. Этот недостаток отмечали ранее и другие исследователи, которые использовали график параллельных множеств для визуализации ассоциативных правил (см., напр.: [22]).
Наряду с понятной наглядностью, преимуществами диаграммы рассеяния эксперты назвали возможность разделения категорий по цветам и маркерам. По их мнению, этот график хорошо показывает разброс значений и диапазон, в котором находится исследуемый атрибут. При этом слабой стороной диаграммы рассеяния является недостаточная масштабируемость. Кроме того, из-за очень похожих значений признака точки - маркеры - могут близко располагаться друг к другу, затрудняя чтение графика.
Эксперты сошлись во мнении, что визуализация, основанная на графах, позволяет отчетливо представить целостную картину взаимодействия данных, визуализировать
иерархию элементов и графически выделить среди имеющихся связей наиболее важные. Однако если данных слишком много, то графы достаточно сложно интерпретировать, что является недостатком.
В целом эксперты согласились с тем, что поскольку ассоциативные правила представляют собой абстрактные феномены, которые не имеют какой-то определенной физической формы, их визуализация представляет собой непростую задачу. Некоторые эксперты с сожалением отметили, что хотя современные программные платформы и технологии открывают широкие возможности для визуальной репрезентации, в повседневной практике используется лишь узкий круг достаточно простых способов, которые далеко не всегда позволяют специалистам заметить наиболее интересные, зачастую скрытые закономерности. Вместе с тем, в исследовании цветовой коммуникации визуализация ассоциативных правил позволяет решить целый ряд исследовательских задач, в частности - показать отношения между переменными, определить кластеры и выявить корреляции.
Выводы
Проведенное исследование позволило систематизировать возможные способы визуализации результатов применения метода поиска ассоциативных правил и провести апробацию семи различных стратегий, среди которых - текстовое описание;
таблица; визуализация на основе тепловой карты; диаграммы Эйлера - Венна; график параллельных множеств; точечный график категорий; визуализация, основанная на графах.
Оценка экспертами результатов экспериментальной апробации различных способов визуализации данных исследований в области социологии цвета показала, что текстовое описание и таблицы не дают возможности в понятной форме представить многие значимые параметры полученных данных, не показывают связи между правилами и значительно снижают возможность сравнительного анализа хроматических характеристик групп. График параллельных множеств и точечный график категорий хорошо подходят для отображения вероятности цветовых выборов и визуального анализа связей между ними, в то время как тепловые карты и диаграммы Эйлера - Венна наиболее удачно репрезентируют сходство аффективных реакций на цвет у представителей различных культур и заметно облегчают анализ отношений между несколькими множествами.
Представленный в статье анализ позволит специалистам в области социологии, психологии и прикладной культурологии использовать апробированные стратегии в качестве основы для разработки собственных моделей визуального анализа результатов социально-психологического изучения цветовой коммуникации.
см со
О
Список литературы:
[1] Грибер Ю.А., Аль-Расхид А.С., Гуайх Я., Кордеро Я.Э., Мефо Ф., Одетти Х.В., Самойлова Т.А., Сивова Т.В. «Геометрия» гармоничных цветовых сочетаний в цветовом пространстве CIELAB: результаты он-лайн-эксперимента с жителями России, Беларуси, Алжира, Нигерии, Саудовской Аравии, Чили и Мексики // Ученые записки Российского общества цвета. - 2022, № 4. - С. 17-23.
[2] Грибер Ю.А., Цыганкова К.Ю., Устименко Ю.А. Цвет как триггер: влияние хроматических характеристик сенсорных кнопок на мотивацию прикосновения // Психолог. - 2022, № 6. - С. 73-87.
[3] Матюшин М.В. Справочник по цвету. Закономерность изменяемости цветовых сочетаний. - СПб.: Издатель Д. Аронов, 2007. - 72 с.
[4] Самойлова Т.А., Грибер Ю.А. Интеллектуальный анализ цветовых предпочтений: поиск ассоциативных правил vs. кластерный анализ // Мир науки. Педагогика и психология. - 2020, № 6. - Интернет-ресурс. Режим доступа: https://mir-nauki.com/PDF/107PSMN620.pdf (15.07.2023)
[5] Abdel-Basset M., Mohamed M., Smarandache F., Chang, V. Neutrosophic Association Rule Mining Algorithm for Big Data Analysis // Symmetry. - 2018, № 10(4). - Article ID 106. - Интернет-ресурс. Режим доступа: https://doi.org/10.3390/sym10040106
[6] Alyobi M.A., Jamjoom A.A. A Visualization Framework for Post-processing of Association Rule Mining // Transactions on Machine Learning and Data Mining. - 2020, № 13. - Р. 83-99.
[7] Bekeneva Y., Mochalov V., Shorov A. Approach to Association and Classification Rules Visualization / Kotenko I., Badica C., Desnitsky V., El BazD. & Ivanovic M. [eds.] // Intelligent Distributed Computing XIII. IDC 2019. Studies in Computational Intelligence. Vol. 868. - Springer: Cham, 2020. - P. 541-546. - Интернет-ресурс. Режим доступа: https://doi.org/10.1007/978-3-030-32258-8_63
[8] Borah A., Nath B. Identifying Risk Factors for Adverse Diseases Using Dynamic Rare Association Rule Mining // Expert Systems with Applications. - 2018, № 113. - Р. 233-263. - Интернет-ресурс. Режим доступа: https://doi.org/10.1016/j.eswa.2018.07.010
[9] Dogan O., Kem F.C., Oztaysi B. Fuzzy Association Rule Mining Approach to Identify e-commerce Product Association Considering Sales Amount // Complex & Intelligent Systems. - 2022, № 8. - Р. 1551-1560. -Интернет-ресурс. Режим доступа: https://doi.org/10.1007/s40747-021-00607-3
[10] Fernandez-Basso C., Ruiz M.D., Delgado M., Martín-Bautista M.J. A Comparative Analysis of Tools for Visualizing Association Rules: A Proposal for Visualising Fuzzy Association Rules // Proceedings of the 11th Conference of the European Society for Fuzzy Logic and Technology. - Dordrecht: Atlantis Press, 2019. -P. 520-527. - Интернет-ресурс. Режим доступа: https://doi.org/10.2991/eusflat-19.2019.72
[11] Fister I., Fister I., Fister D., Podgorelec V., Salcedo-Sanz S. A Comprehensive Review of Visualization Methods for Association Rule Mining: Taxonomy, Challenges, Open Problems and Future Ideas // ArXiv. -2023. - abs/2302.12594. - Интернет-ресурс. Режим доступа: https://doi.org/10.48550/arXiv.2302.12594
[12] Griber Y.A., Jung I.L. Colors of Health and Sickness: Sociocultural Research of Associative Connections // Общество. Среда. Развитие. - 2017, № 4. - C. 89-95.
[13] Hahsler M. arulesViz: Interactive Visualization of Association Rules With R // The R Journal. - 2017, № 9(2).
- Р. 163-175. - Интернет-ресурс. Режим доступа: https://doi.org/10.32614/RJ-2017-047
[14] Hahsler M., Karpienko R. Visualizing Association Rules in Hierarchical Groups // Journal of Business Economics. - 2017, № 87. - P. 317-335. - Интернет-ресурс. Режим доступа: https://doi.org/10.1007/s11573-016-0822-8
[15] Hong J., Tamakloe R., Park D. Discovering Insightful Rules Among Truck Crash Characteristics Using Apriori Algorithm // Journal of Advanced Transportation. - 2020. - Article ID 4323816. - Интернет-ресурс. Режим доступа: https://doi.org/10.1155/2020/4323816
[16] Lakshmi N., Krishnamurthy M. Association Rule Mining Based Fuzzy Manta Ray Foraging Optimization Algorithm for Frequent Itemset Generation From Social Media // Concurrency and Computation: Practice and Experience. - 2021, № 34(10). - Article ID e6790. - Интернет-ресурс. Режим доступа: https://doi. org/10.1002/cpe.6790
[17] Li K., Liu L., Wang F., Wang T., Duic N., Shafie-khah M., Catalao J.P.S. Impact Factors Analysis on the Probability Characterized Effects of Time of Use Demand Response Tariffs Using Association Rule Mining Method // Energy Conversion and Management. - 2019, № 197. - Article ID 111891. - Интернет-ресурс. Режим доступа: https://doi.org/10.1016/j.enconman.2019.111891
[18] Matharaarachchi S., Domaratzki M., Katz A. & Muthukumarana S. Discovering Long COVID Symptom Patterns: Association Rule Mining and Sentiment Analysis in Social Media Tweets //JMIR Formative Research.
- 2022, № 6(9). - Article ID e37984. - Интернет-ресурс. Режим доступа: https://doi.org/10.2196/37984
[19] Ounifi M.S., Amdouni H., Elhoussine R.B., Hammoudi S. New 3D Visualization and Validation Tool for Displaying Association Rules and Their Associated Classifiers // 20th International Conference Information Visualisation. - Lisbon: IEEE, 2016. - Р. 152-158. - Интернет-ресурс. Режим доступа: https://doi. org/10.1109/IV.2016.78
[20] Rojas W.A., Vargas C., Villegas C.M. Interactive Visualization of Association Rules Model Using SOM // Interacción'14: Proceedings of the XV International Conference on Human Computer Interaction.
- New York: Machinery, 2014. - Article ID 104. - Интернет-ресурс. Режим доступа: https://doi. org/10.1145/2662253.2691319
[21] Sarno R., Sinaga F., Sungkono K.R. Anomaly Detection in Business Processes Using Process Mining and Fuzzy Association Rule Learning // Journal of Big Data. - 2020, № 7. - Article ID 5. - Интернет-ресурс. Режим доступа: https://doi.org/10.1186/s40537-019-0277-1
[22] Sekhavat Y.A., Hoeber O. Visualizing Association Rules Using Linked Matrix, Graph, and Detail Views // International Journal of Intelligence Science. - 2013, № 3. - P. 34-49. - Интернет-ресурс. Режим доступа: https://doi.org/10.4236/ijis.2013.31A005
[23] Sharmila S., Vijayarani S. Association Rule Mining Using Fuzzy Logic and Whale Optimization Algorithm // Soft Computing. - 2021, № 25. - P. 1431-1446. - Интернет-ресурс. Режим доступа: https://doi.org/10.1007/ s00500-020-05229-4
[24] Varu R., Christino L., Paulovich F.V. ARMatrix: an Interactive Item-to-rule Matrix for Association Rules Visual Analytics // Electronics. - 2022, № 11(9). - Article ID 1344. - Интернет-ресурс. Режим доступа: https://doi.org/10.3390/electronics11091344
[25] VivesQMestres M., Kenett R S., Thió-Henestrosa S., Martín-Fernández J.A. Measurement, Selection, and Visualization of Association Rules: A Compositional Data Perspective: A Compositional Data Perspective on Association Rules // Quality and Reliability Engineering International. - 2022, № 38(3). - P. 1327-1339. -Интернет-ресурс. Режим доступа: https://doi.org/10.1002/qre.2910
[26] Yamamoto C.H., de Oliveira M.F. Rezende S.O. Visualization to Assist the Generation and Exploration of Association Rules // Post-Mining of Association Rules: Techniques for Effective Knowledge Extraction. - IGI Global, 2009. - P. 224-245. - Интернет-ресурс. Режим доступа: https://doi.org/10.4018/978-1-60566-404-0.CH012
[27] Yu Y., Martek I., Hosseini M.R., Chen C. Demographic Variables of Corruption in the Chinese Construction Industry: Association Rule Analysis Of Conviction Records // Science and Engineering Ethics. - 2019, № 25.
- Р. 1147-1165. - Интернет-ресурс. Режим доступа: https://doi.org/10.1007/s11948-018-0024-6
[28] Zhang L., Tan X., Zhang S., Zhang W. Association Rule Mining for Career Choices Among Fresh Graduates // Applied and Computational Mathematics. 2019, № 8(2). - P. 37-43. - Интернет-ресурс. Режим доступа: https://doi.org/10.11648/J.ACM.20190802.13
[29] Zhang Y. The Influence of Ideological and Political Education on Employment Quality of College Students Based on Association Rule Analysis // Journal of Physics: Conference Series. - 2021, № 1744. - Article ID 042169. - Интернет-ресурс. Режим доступа: https://doi.org/10.1088/1742-6596/1744/4/042169