Комплексный критерий применимости средств визуальной аналитики в экспертных системах УДК 004.891:004.92:005.53
КОМПЛЕКСНЫЙ КРИТЕРИЙ ПРИМЕНИМОСТИ
СРЕДСТВ ВИЗУАЛЬНОЙ АНАЛИТИКИ В ЭКСПЕРТНЫХ СИСТЕМАХ
Захарова Алена Александровна
Д.т.н., профессор отделения автоматизации и робототехники, зав. лабораторией «3D моделирования и промышленного дизайна» Вехтер Евгения Викторовна Доцент отделения автоматизации и робототехники Шкляр Алексей Викторович Ст. преподаватель отделения автоматизации и робототехники Институт кибернетики Томского политехнического университета, Россия 634034, г. Томск, ул. Советская 84/3, e-mail: vehter@tpu.ru
Аннотация. В работе представлены результаты исследования применимости средств визуальной аналитики для решения задач практического анализа данных. Предложено и обосновано введение комплексной характеристики функции визуального представления, позволяющей увеличить результативность визуализации при её использовании в экспертных системах
Ключевые слова: визуальная аналитика, результативность визуального анализа, восприятие, комплексная характеристика визуализации.
Цитирование: Захарова А.А., Вехтер Е.В., Шкляр А.В. Комплексный критерий применимости средств визуальной аналитики в экспертных системах // Информационные и математические технологии в науке и управлении. 2018. № 3 (11). С. 37-44. DC)I:10.25729/2413-0133-2018-3-04
Введение. Использование средств визуальной аналитики в качестве основы систем поддержки принятия решений является перспективным направлением анализа данных, в том числе при проведении научных исследований и управлении. Приведенные в работах [4, 5, 7] результаты могут быть обобщены и переформулированы в виде ряда требований и реальных проблем в использовании визуализации. В настоящее время эти проблемы в значительной мере сохраняют свое влияние на разработку и применение средств визуализации в экспертных системах, снижая их значимость и существенно ограничивая перспективы использования потенциала визуальной аналитики.
На основании изучения опыта практического использования визуализации и мнений ряда экспертов [9], многие из существующих трудностей в применении визуализации могут быть разделены на группы, отличающиеся причинами появления указанных трудностей, а также возникающими последствиями. Часть вопросов связана с ошибками и заблуждениями в понимании внутренних закономерностей визуализации, а другая - с трудностью получения количественных характеристик для сравнения различных средств визуализации [1].
1. Информация и визуальная аналитика. Цель визуальной аналитики может быть определена через различные подходы, например, как уменьшение энтропии в понимании исследователем причин появления исследуемых данных. Следовательно, справедливым можно считать утверждение, что для достижения этой цели обязательным условием становится формулирование вопроса, ответ на который может быть найден в исследуемых
данных и который создаст у исследователя представление о взаимосвязи отдельных событий, описываемых этими данными [6]. Достижение этой цели опирается, в том числе, на некоторые специфичные факторы, имеющие отношение к особенностям восприятия и мышления. При этом возникает вопрос о целесообразности использования конкретных приемов визуализации, связанный с определением результативности этих приемов [3].
2. Критерии выбора визуального решения. Сформулированная таким образом задача поиска взаимосвязей между отдельными событиями в исходных данных делает возможной проблему противоположного вида. Речь идет о возможности построения с помощью инструментов визуальной аналитики. Следствием такой возможности становится появление необходимости в выделении из множества предполагаемых взаимосвязей тех вариантов, которые соответствуют критериям общего исследования. Бесспорными и распространенными вариантами критериев, руководящих выбором перспективного решения, являются критерии новизны и, например, содержательности.
Обоснование системы критериев, необходимой для алгоритмизации построения средств визуальной аналитики для исследования данных, становится одной из ключевых целей теории визуализации. Таким образом, одним из важных направлений в развитии визуальной аналитики становится обоснование качественных или количественных критериев визуализации, позволяющих передавать наблюдателю визуальные сообщения с использованием естественных возможностей восприятия для преодоления факторов, затрудняющих анализ и интерпретацию.
3. Использование восприятия. Существуют основания для оценки влияния таких факторов визуального восприятия, как динамические изменения, прогнозирование развития, обусловленное ожидание и некоторые другие [12]. Некоторые из таких факторов могут участвовать в автоматизированных процедурах получения информации посредством анализа отдельных информативных каналов изображений с целью выявления резких изменений в выбранных атрибутах. Изучение возможностей визуального восприятия приводит к необходимости выбора наиболее информативных параметров визуализации, которые могут быть использованы при создании новых или развитии средств визуальной аналитики.
Анализ визуальной информации, целью которого является понимание ее смысла, зависит как от объективных характеристик визуального образа, так и от персональных качеств наблюдателя. Визуальное восприятие, являясь одним из видов восприятия в целом, обладает рядом общих характеристик [14]. Обоснованное управление свойствами создаваемых визуальных образов, учитывающее эти характеристики, позволяет контролировать интерпретируемость визуализации.
• Константность. Константность, как свойство восприятия, является проявлением способности идентифицировать объект, фиксируемый в визуальном образе или его части, независимо от условий наблюдения.
• Целостность восприятия. Принцип целостности выражается в стремлении к мысленному объединению некоторых из частей исследуемого объема визуальной информации, подчиненному какому-либо правилу. Мысленное создание структур, основанное на принципе целостности, становится основанием для формирования предположений, объясняющих особенности системы.
• Обобщенность. При визуализации данных обобщенность восприятия может выполнять роль фактора, содействующего быстрой классификации, распознаванию
образов, а также переносу распознанных признаков на неопределенные детали визуальной модели.
• Движение. Использование движения в качестве самостоятельного информативного атрибута визуальной модели требует правильного понимания принципов, руководящих восприятием и интерпретацией анимированного образа [15].
Дополнительным обстоятельством, усиливающим перспективность использования динамических образов, является возможность интерактивного взаимодействия с компьютерными визуальными моделями [13]. Это обстоятельство привносит в модель новое движение - управляемое изменение, оценка которого дает новые основания для достижения наблюдателем понимания визуализированной информации.
4. Схемы смыслообразования. В ряде исследований [8], посвященных изучению проблемы извлечения человеком смысла из доступных ему данных, сделаны предположения, выделяющие в этом сложном процессе более простые операции. Большинство исследователей выделяют части процесса, характеризующие выполнение действий по сбору информации, представление полученных сведений в форме, способствующей улучшению понимания, а также, возможное манипулирование новым представлением, приводящее к получению нового знания или выполнению необходимого действия.
На основании анализа хронологического разбиения процесса визуализации на этапы, имеющие близкую структуру, представления о прямых и обратных процессах, а также исследования особенностей визуального восприятия информации, авторами сформулирован комплексный подход к пониманию принципов создания и функционирования средств визуальной аналитики [2]. В результате исследований, направленных на улучшение понимания закономерностей, управляющих результативностью средств визуальной аналитики, выделены три составляющие, отличающиеся по своему назначению, характеристикам и степени влияния на общий результат. К ним отнесены семиотическая, функциональная и психоэмоциональная составляющие, управление которыми позволяет изменять когнитивную результативность использования визуализации.
5. Исследование результативности визуального анализа. На основании разработанной авторами методики проведения визуального исследования данных и созданного обоснования применимости различных средств визуальной аналитики с целью увеличения общей результативности визуального исследования, может быть сделан вывод о необходимости формирования собственной характеристики функции визуального представления. В данном случае речь идет об объединении некоторых особенностей функции представления в новую комплексную характеристику, позволяющую на этапе предварительного исследования принимать решение о целесообразности использования функции визуального представления, к которой относится эта характеристика, в условиях, соответствующих цели проводимого анализа данных. В качестве составляющих подобной комплексной характеристики предложено использование величин интервалов времени, соответствующих этапам проведения исследования данных:
Построение визуального образа данных, включающее процедуры чтения данных, фильтрации, представления и управления образом.
Ознакомление пользователя с возможностями и особенностями функции визуального представления, реализованными в форме образа исследуемых данных (обучение пользователя).
• Последовательное формирование и верификация гипотезы ответа на вопрос исследования, представляющий собой условие, определяющее место задачи анализа в предложенной классификации (формирование экспертного мнения).
5.1 Обучение пользователя. По результатам проведенных измерений, в процессе взаимодействия пользователя и визуальной модели возможно выделение интервалов, на протяжении которых время, затрачиваемое пользователем на построение очередной гипотезы, непрерывно сокращается. С точки зрения визуализации данных и целенаправленного использования средств визуального анализа для изучения многомерных данных, подобные интервалы, возникающие на начальных шагах, могут быть интерпретированы как стадии анализа, соответствующие ознакомлению пользователя с использованной функцией визуального представления (рис. 1).
70 60 50 3 40 S.30
ей
20 10 О
О 0,5 1 1,5 2 2,5 3 3,5 4 4,5
Номер шага о процессе анализа, ед.
-»-Тест 1 --•- Тест 2 —«—Тест 3 —»—Тест 4 — -Тест 5 —» -Тест б
Рис. 1. Уменьшение времени формирования гипотезы на первых шагах анализа
5.2 Сомнения и рефлексия. Изменение скорости построения новых гипотез, наблюдаемое на протяжении процесса анализа, носит периодический характер (рис. 2). Значительное снижение скорости анализа, возникающее с периодичностью, различающейся у разных пользователей, может интерпретироваться как потребность пользователя в дополнительной паузе перед построением новой гипотезы. В большинстве измерений, резкое увеличение времени построения новой гипотезы возникает после серии быстрых ошибочных предположений, что говорит об отсутствии у пользователя понимания информации, представленной в визуальном образе.
На основании сделанных наблюдений за ходом решения задач анализа, проводимого различными пользователями, возможно предположение, объясняющее возникающее замедление необходимостью переосмыслить допущенные ошибки. Длительность этапа рефлексии зависит от индивидуальных особенностей исследователя, но завершение этого этапа соответствует увеличению информированности исследователя. Следовательно, увеличение результативности средств визуального анализа, может быть достигнуто в результате совмещения процессов накопления опыта и построения новых гипотез. Одним из возможных решений этой задачи является сохранение в образе исследуемых данных сведений об ошибочных решениях, сделанных ранее. Подобный прием является способом
накопления визуальной информации и его результативность должна исследоваться дополнительно.
10 15
Номер шага, ед
20
25
—•—Пользователь 1 —•— Пользователь 2 Пользователь 3
Рис. 2. Периодическое изменение скорости визуального анализа разных пользователей
5.3 Комплексная характеристика. В результате обобщения результатов тестовых решений для трех функций визуального представления, получены усредненные величины искомых интервалов времени, которые были объединены в комплексные характеристики. Абсолютные величины интервалов построения, обучения и интерпретации представляют
интерес при определении
результативности каждого нового решения задачи анализа, однако, с точки зрения предварительного исследования, в ходе которого делается выбор в пользу одной из известных заранее функций визуального представления, информативным является соотношение интервалов между собой. В результате, полученные комплексные характеристики представлены в виде нормированной диаграммы, позволяющей делать качественные оценки для исследованных функций визуального представления.
Для представленных примеров комплексных характеристик (рис. 3) показательным выводом является
100% ¡¡¡¡¡¡¡ИР
90%
80%
70%
60% 186,216
50%
40%
30%
20%
65,711
10%
0%
I Построение
2 3
: Обучение % Интерпретация
Рис. 3. Комплексные характеристики нескольких функций визуального представления
относительное сокращение времени интерпретации при увеличении времени, затрачиваемом при построении визуального образа исследуемых данных. Это является косвенным подтверждением преимуществ функции представления № 3, т.к. дополнительные ресурсы,
потраченные при создании образа данных, привели к увеличению его интерпретируемости. Подобная зависимость не является обязательной, т.е. увеличение ресурсоемкости этапов получения визуальных образов данных не всегда приводит к увеличению их когнитивного потенциала.
Заключение. После сопоставления ресурсоемкости построения модели данных и результативности интерпретации, на примере полученных комплексных характеристик для экспериментальных функций визуального представления показана возможность получения выводов о соотношении ресурсоемкости построения визуальной модели данных и времени, необходимого пользователю для визуального ознакомления с ее особенностями. Т.к. ресурсоемкость обучения вносит свой вклад в общую результативность визуального исследования, сравнима с длительностью интервалов интерпретации, а также обязана сокращаться при повторном использовании функции визуального представления при решении схожих задач анализа, то определение приемов визуализации, влияющих на этот параметр функций визуального представления, становится важной задачей визуализации данных.
Работа выполнена при финансовой поддержке Российского научного фонда, проект № 18-11-00215.
СПИСОК ЛИТЕРАТУРЫ
1. Манаков Д., Авербух В. Верификация визуализации // Научная визуализация. 2016. Т. 8 . № 1. C. 58-94.
2. Шкляр А.В., Захарова А.А. Динамические знаковые структуры в информативных визуальных высказываниях // Труды 26-ой Международной конференции (GraphiCon2016). Россия, Нижний Новгород. 19-23 сентября 2016 г. Москва. ИПМ РАН. 2016. C. 131-136.
3. Шкляр А.В., Захарова А.А. Структурный подход к визуализации данных // Материалы XX Юбилейной Международной конференции по вычислительной механике и современным прикладным программным системам (ВМСППС'2017). 24-31 мая 2017 г., Алушта. Москва. Издательство МАИ. 2017. C. 609-611.
4. Arora S., Barak B. Computational complexity: a modern approach // Complexity. 2007. № January. P. 489.
5. Chen C. Top 10 unsolved information visualization problems // IEEE Comput. Graph. Appl. 2005. Т. 25. № 4. Pp. 12-16.
6. Chen C.C.C. An Information-Theoretic View of Visual Analytics // IEEE Comput. Graph. Appl. 2008. Т. 28. № February. Pp. 18-23.
7. Globus A. Fourteen Ways to Say Nothing with Scientific Visualization // Computer (Long. Beach. Calif). 1994. Т. 27. № 7. Pp. 86-88.
8. Klein G. А., Phillips J. K., Rall E. L., Peluso D. А. A Data-Frame Theory of Sensemaking // Expert. out Context. 2007. Pp. 113-155.
9. North C. Toward measuring visualization insight // IEEE Comput. Graph. Appl. 2006. Т. 26. № 3. Pp. 6-9.
10. Pirolli P., Card S. The sensemaking process and leverage points for analyst technology as identified through cognitive task analysis // Proc. Int. Conf. Intell. Anal. 2005. Pp. 2 -4.
11. Russell, D.M., Stefik, M.J., Pirolli, P., Card, S.K. The Cost Structure of Sensemaking // Conf. on Hum. Factors in Comp. Sys., Amsterdam, Netherlands. ACM Press, New York. 1993. Pp. 269-276.
12. Shklyar A.V., Zakharova A.A. Visual presentation of different types of data by dynamic sign structures // Scientific Visualization. 2016. T. 8. № 4. Pp. 28-37.
13. Tan D.S., Robertson G.G., Czerwinski M., Exploring 3D Navigation: Combining Speedcoupled Flying with Orbiting // Proceedings of the SIG-CHI Conference on Human Factors in computing Systems. Seattle. 2001. Pp. 418-425.
14. Tremoulet P.D., Feldman J. Perception of animacy from the motion of a single object // Perception. 2000. T. 29. № 8. Pp. 943-951.
15. Tversky B., Morrison J. B., Betrancourt M. Animation: Can it facilitate? // Int. J. Hum. Comput. Stud. 2002. T. 57. № 4. Pp. 247-262.
16. Ware C. Information Visualization: Perception for Design // Second Edition. Morgan Kaufmann. 2004. P. 513.
UDK 004.891:004.92:005.53
COMPREHENSIVE APPLICABILITY CRITERIA OF VISUAL ANALYTICAL MEANS IN EXPERT SYSTEMS
Alena А. Zakharova
Dr., Professor, Department of automation and robotics Evgeniya V. Vekhter Associate professor, Department of automation and robotics Aleksey V. Shklyar Senior teacher, Department of automation and robotics Tomsk Polytechnic University 84/3, Sovetskaya Str., 634034, Tomsk, Russia, e-mail: vehter@tpu.ru
Abstract. In the article, research results of applicability of visual analytics tools for solving problems of practical data analysis are represented. Usage of a complex characteristic of visual representation function was offered and substantiated; it allows to increase effectiveness of visualization while using it in expert systems. Keywords: visual analytics, effectiveness of visual analysis, perception, complex visualization characteristic.
References
1. Manakov D., Averbuh V. Verifikaciya vizualizacii [Visualization verification] // Nauchnaya vizualizaciya = Scientific visualization. 2016. T. 8. № 1. P. 58-94. (in Russian).
2. Shklyar A., Zakharova A.A. Dinamicheskie znakovye struktury v informativnyh vizual'nyh vyskazyvaniyah [Dynamic sign structures in informative visual statements]. Protvino: Izdatel'stvo: Avtonomnaya nekommercheskaya organizaciya «Institut fiziko-tekhnicheskoj informatiki» = Protvino: publishing House: Autonomous non-profit organization " Institute of physical and technical Informatics». 2016. Pp. 131-136. (in Russian).
Захароeа A.A., Вехтер Е.В., A.B.
3. Shklyar A.V., Zakharova A.A. Strukturnyj podhod k vizualizacii dannyh [Structural approach to data visualization]. Izdatel'stvo MAI-Print (Moskva) = MAI-Print publishing house (Moscow). 2017. Pp. 609-611. (in Russian).
4. Arora S., Barak B. Computational complexity: a modern approach // Complexity. 2007. № January. P. 489.
5. Chen C. Top 10 unsolved information visualization problems // IEEE Comput. Graph. Appl. 2005. T. 25. № 4. Pp. 12-16.
6. Chen C.C.C. An Information-Theoretic View of Visual Analytics // IEEE Comput. Graph. Appl. 2008. T. 28. № February. Pp. 18-23.
7. Globus A. Fourteen Ways to Say Nothing with Scientific Visualization // Computer (Long. Beach. Calif). 1994. T. 27. № 7. Pp. 86-88.
8. Klein G. A., Phillips J. K., Rall E. L., Peluso D. A. A Data-Frame Theory of Sensemaking // Expert. out Context. 2007. Pp. 113-155.
9. North C. Toward measuring visualization insight // IEEE Comput. Graph. Appl. 2006. T. 26. № 3. Pp. 6-9.
10. Pirolli P., Card S. The sensemaking process and leverage points for analyst technology as identified through cognitive task analysis // Proc. Int. Conf. Intell. Anal. 2005.. Pp. 2-4.
11. Russell, D.M., Stefik, M.J., Pirolli, P., Card, S.K. The Cost Structure of Sensemaking // Conf. on Hum. Factors in Comp. Sys., Amsterdam, Netherlands. ACM Press, New York. 1993. Pp. 269-276.
12. Shklyar A.V., Zakharova A.A. Visual presentation of different types of data by dynamic sign structures // Scientific Visualization. 2016. T. 8. № 4. Pp. 28-37.
13. Tan D.S., Robertson G.G., Czerwinski M., Exploring 3D Navigation: Combining Speedcoupled Flying with Orbiting // Proceedings of the SIG-CHI Conference on Human Factors in computing Systems. Seattle. 2001. P. 418-425.
14. Tremoulet P.D., Feldman J. Perception of animacy from the motion of a single object // Perception. 2000. T. 29. № 8. Pp. 943-951.
15. Tversky B., Morrison J. B., Betrancourt M. Animation: Can it facilitate? // Int. J. Hum. Comput. Stud. 2002. T. 57. № 4. Pp. 247-262.
16. Ware C. Information Visualization: Perception for Design // Second Edition. Morgan Kaufmann. 2004. P. 513.