Научная статья на тему 'Применение методов инфографического моделирования для представления многомерных данных'

Применение методов инфографического моделирования для представления многомерных данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
387
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОГРАФИКА / ИНФОГРАММА / OLAP / ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ МНОГОМЕРНЫХ ДАННЫХ / INFOGRAPHICS / INFOGRAM / GRAPHICAL REPRESENTATION OF MULTIDIMENSIONAL DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Евсюков Александр Анатольевич, Коробко Анна Владимировна

В работе выполнен обзор существующих подходов и инструментов построения инфографики, определены виды инфограмм, проанализированы предпосылки интеграции методов инфорграфического моделирования и технологии оперативной аналитической обработки данных

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of infographic simulation methods to represent multidimensional data

The paper presents the survey of existing approaches and tools of infographics, the types of infogram. The methods integrating infographic simulation and online analytical processing technology are observed

Текст научной работы на тему «Применение методов инфографического моделирования для представления многомерных данных»

тельном уровне - приемлем без ограничений. Силлогистическая логика используется для обоснования аргументов. С помощью типов высказываний, используемых в силлогизме, можно определить нелогичные выводы и установить их причину [3]. Разницу между аксиоматикой и традиционной «дедуктивностью» разъяснял Г. Фройденталь с помощью терминов «глобальное упорядочение» и «локальное упорядочение» соответственно. По его мнению, учащихся не следует обучать аксиоматике в школе, но следует рассматривать процесс аксиоматизации - то, что так высоко ценит настоящий математик - «локальные упорядочения». В этом случае речь идёт не о полной аксиоматически обоснованной теории упорядочения, не о сложных дедуктивных рассуждениях, а о таком процессе, когда осознаются наглядные, но не всегда сознательно воспринимаемые факты [7]. Примером таких упорядочений является работа с геометрическими понятиями, «открытие» теорем, «открытие» теории параллелограмма и др.

Автор считает, что в данной работе новыми являются следующие результаты: актуализация учителем в процессе обучения математике научных основ школьного курса геометрии способствует достижению планируемых результатов в предметном, метапредметном направлении и в направлении личностного развития.

Литература

1. Боженкова Л.И. Интеллектуальное воспитание учащихся общеобразовательной школы при обучении геометрии: теория и практика. - М., Калуга: КПГУ, 2007. 281 с.

2. ДубновЯ.С. Беседы о преподавании математики. - М.: Просвещение, 1965. 236 с.

3. Виленкин Н.Я., Дуничев К.И. и др. Современные основы школьной математики: Пособие для студентов пед. ин-тов. - М.: Просвещение, 1980. - 236 с.

4. Адлер А. Теория геометрических построений. - Л.: Учпедгиз, 1940. 231 с.

5. Курант Р., Роббинс Г. Что такое математика? - М.: МЦНМО, 2004. 568 с.

6. Болтянский В.Г., Яглом И.М. Векторы в курсе геометрии средней школы. Пособие для учителя. - М.: Учпедгиз, 1962. - 96 с.

7. Фройденталь Г. Математика как педагогическая задача. Ч. 2. / Под ред. Н.Я. Виленки-на. - М.: Просвещение, 1983. 192 с.

Scientific bases of a school course of geometry in training

Lyudmila Ivanovna Bozhenkova, Doctor of Pedagogical Sciences, Professor

Theories and methods of higher geometry are scientific bases of a school course of geometry. This paper considers the problem of updating them in learning geometry. It contributes to the achievement ofplanned results of studying geometry.

Keywords - school geometry course, Federal state educational standards, teaching geometry, planned results.

УДК 007.52:004.81

ПРИМЕНЕНИЕ МЕТОДОВ ИНФОГРАФИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ПРЕДСТАВЛЕНИЯ МНОГОМЕРНЫХ ДАННЫХ

Александр Анатольевич Евсюков, к.т.н. старший научный сотрудник Тел. 89632611921, e-mail:[email protected] Анна Владимировна Коробко, к.т.н. научный сотрудник Тел. 89131715262, e-mail: [email protected] Институт вычислительного моделирования СО РАН http://icm.krasn.ru

В работе выполнен обзор существующих подходов и инструментов построения инфографики, определены виды инфограмм, проанализированы предпосылки интеграции методов инфорграфического моделирования и технологии оперативной аналитической обработки данных.

Ключевые слова: инфографика, инфограмма, OLAP, графическое представление многомерных данных.

Введение

C момента публикации Эдгаром Коддом в 1993 году статьи «12 законов аналитической обработки в реальном времени», технология оперативной аналитической обработки данных OLAP(Online analytical processing) проделала огромный путь развития. Переосмысление механизмов построения структуры кубов и проведения операций над данными привело к многократному увеличению скорости обработки многомерных данных. Одно из немногих направлений при использовании OLAP, в котором могут быть достигнуты значительные результаты, -увеличение наглядности представления результатов аналитической обработки для стимуляции когнитивных (познавательных) возможностей лиц принимающих решения [1; 2; 3].

_ __Традиционно технология OLAP использовала интерак-

■—^тивные инструменты представления результатов, такие как

кросс-таблицы, диаграммы, а в случае пространственного рас-I ( пределения данных - картограммы. Если не рассматривать "Я'ж? V, табличное представление данных (кросс-таблицы), то суще-

ствующие средства графического отображения многомерных Ж ^^ /\\ данных (диаграммы и картограммы) отображают срезы, где /^TV шГ/ V изменяются значения не более двух измерений при фиксации

t ^^Шя^Г значений остальных измерений. Способ представления резуль-f i татов аналитической обработки во многом определяет когни-

А.А. Евсюков тивную эффективность оперативного анализа [4; 5; 6]. Приме-

нение принципов инфографического моделирования [7] для стимулирования творческой активности лица принимающего решения позволит максимально полно использовать аналитический потенциал OLAP-средств. Актуальна задача разработки аналитических инфографических моделей для отображения многомерных результатов оперативного анализа с учетом состава и характера данных.

Коробко

Использование инфографики для представления информации

Инфографика - графический способ представления информации, упрощающий ее восприятие, позволяет воспринять больше информации, интуитивно выявлять закономерности в данных. Инфограмма - это конкретный образец инфографики на любом из носителей информации. В данной работе под инфограммой будем понимать программное (виртуальное) представление инфографики в виде графического контейнера, который может содержать видео, изображения, диаграммы, карты и текст, и соответствует назначению инфографики.

Существуют два противоположных подхода к созданию инфографики, расходящиеся в вопросах значимости эстетической составляющей. Один из них - исследовательский (explorative) подход, берущий начало в традициях оформления научных работ. Основоположником данного направления является Эдвард Тафти, автор множества работ по информационному дизайну [8]. Подход характеризуется минимализмом, при котором всё несущественное для передачи информации должно быть опущено, а сама информация должна быть передана максимально точно. Основной целью этого подхода является стремление к донесению сути информации до целевой аудитории. Такой под-

ход оправдан в технологиях анализа данных, научных исследованиях, бизнес-аналитике.

Другой подход называется сюжетным или повествовательным (narrative). Основоположник подхода Найгел Холмс наиболее известен по иллюстрациям в журнале Time с 1978 по 1994 год, которые он назвал «поясняющие иллюстрации» (explanation graphics). Для этого подхода характерно стремление к созданию выразительных образов, эффектного дизайна и иллюстративности. Способ подачи информации выбирается интуитивно, исходя из опыта и художественного вкуса дизайнера. В результате знакомства с сюжетной инфографикой читатель получает не просто информацию, но и развлечение. Сферой применения этого подхода можно считать журналистику, блоги, маркетинговые и рекламные материалы.

Сравнение двух подходов выявляет следующую важную деталь: исследовательский подход подразумевает извлечение нужной информации самим читателем, тогда как повествовательный уже содержит заключение, к которому читатель должен прийти. Информационно-аналитические системы (в том числе использующие технологию OLAP), как правило, не предлагают готовых заключений, а является лишь аналитическим инструментом для их поиска. Соответственно исследовательский подход больше чем сюжетный подходит для создания инфографики в таких системах.

В основе технологии OLAP лежит многомерное представление данных, где аспекты анализа называются измерениями, а числовые характеристики анализируемого процесса - показателями. Для построения инфограмм необходимо определить размерность отображаемых данных в терминах технологии OLAP, проанализировать способы отображения многомерных данных, выявить основные когнитивные элементы инфограмм. Систематизация разновидностей инфограмм создаст фундамент для разработки аналитических инфографических моделей.

По способу отображения инфограммы разделяются на два вида: статические и динамические. Динамические инфограммы наиболее удобны для отображения многомерных данных. С помощью анимации или встроенных в инфограмму инструментов (списков, фильтров) можно отобразить различные срезы гиперкуба, изменяя фиксированные значения измерений, или выполнить его вращение.

Обзор существующих решений

Существует ряд готовых решений автоматизированных инструментов построения инфографики, в том числе онлайн-сервисы. Среди них можно выделить сервисы, использующие как исследовательский подход, так и сюжетный.

К первой группе относится, например, Piktochart.com, который предлагает пользователю шаблоны страниц и диаграмм. Экспорт данных для диаграмм возможен из таблиц (xls, xlsx, csv), либо после установки динамической связи с данными таблиц GoogleSpreadsheet [9].

Рис. 1. Примеры построения инфограмм в Piktochart.com

В Piktochart.com прослеживается интересная особенность - в зависимости от количества анализируемых показателей сервис изменяет набор доступных видов диаграмм, подходящих для текущей таблицы. На рис. 1 представлены примеры с одним и двумя анализируемыми показателями, левее от построенных гистограмм схематически отображены доступные виды диаграмм. Отметим, что для одного показателя набор способов отображения шире, но в то же время при отображении двух и более показателей появляются новые виды отображений.

Infogr.am - еще один популярный онлайн-сервис, использующий исследовательский подход. Предлагает использование шаблонов страниц и диаграмм, экспорт данных из таблиц. Как и в Piktochart.com возможны импорт из Excel и установка динамических связей с таблицами из облака [10].

Q Температура, С Температура, F

щ

Рис. 2. Пример построения инфограмм в 1п1^г.ат

К явному преимуществу инфограмм, построенных с помощью перечисленных двух сервисов, относится их динамичность. В построенных инфограммах предусмотрена возможность выбора показателя для отображения (рис. 2), выделение показателя (при наведении курсора мыши) для конкретного значения измерения (рис. 3).

XIV Всероссийская конференция «Проблемы информатизации региона» (ПЙР-2015)

Авторы (и соавторы) статей

9

If

| HBMGOFAH{40%) |№ЙГТУ(19%} ■ Томский ПУ(21%> I СФУ(3%) ■ Администрация г.Краснопраа{3%) ■ ЬНС РФ {2%) ООО «Коммунальные нн фор.. {2%) ■ Краевая клиническая больница |7%) ■ Дальневосточный ФУ {2%) ■ ООО "Ингеииум сопкхинс") (2%)

Прочитанные доклады

I ИВМСО FAH{62%) ■Си6ГТУ(14%) ■ Тоьмкий ПУ{10%) ■ СФУ{3%> ■ Администрация (-.Красноярска <3%) ■ МЧС РФ {3%} ■ Краевая клиническая больница (3%)

Рис. 3. Динамические инфограммы, сконструированные с помощью Piktochart.com

На рис. 3 представлен пример анализа накопленной статистики о проведенных научных мероприятиях. Инфограмма состоит из двух диаграмм, отображающих два разных показателя одного многомерного куба данных. Измерениями построенной OLAP-модели являются: год, наименование мероприятия, организация; показателями -количество статей, их авторов и сделанных докладов. Выполнен срез куба, где фиксирован год (2015) и мероприятие (XIV Всероссийская конференция «Проблемы информатизации региона»). Отображены показатели: количество авторов статей, количество прочитанных докладов сотрудниками различных организаций.

Ко второй группе сервисов, использующих сюжетный подход, относится Easel.ly, предлагающий использовать существующие макеты для создания инфографики. Фактически он является графическим редактором. Предусмотрено всего 5 типов диаграмм с минимумом настроек, возможен экспорт из Excel [11].

Сервис Creately.com обладает широким функционалом, специализируется как инструмент для создания схем [12]. При этом динамической привязки внешних данных не

выявлено. В отличие от ЕаБеНу частично соответствует принципам исследовательского подхода (схематичность инфограмм). Внешний вид сервисов представлен на рис. 4.

Рис. 4. Сервисы Easel.ly (слева) и Creately.com (справа)

Набор диаграмм для отображения многомерных данных

Одним из самых востребованных инструментов для графического представления многомерных данных является диаграмма. Причины этого заключаются в простоте построения диаграмм и наглядности представления информации для пользователей. Инфо-граммы могут содержать сразу несколько диаграмм, или состоять из единственной диаграммы. Рассмотрим распространенные виды диаграмм и их возможность использования для отображения многомерных данных с различным числом измерений и показателей.

Гистограмма. Прямой перевод с греческого языка - «писать столбиком». Это своеобразный столбчатый график. Диаграммы такого вида могут быть объемные, плоские, вложенные и т.п. На одной гистограмме одновременно могут быть отображены сразу несколько показателей гиперкуба, при условии, что их значения - числа одного порядка. Также есть возможность не фиксировать одно из измерений. В этом случае гистограмма будет разбита на группы, по количеству значений нефиксированного измерения. На рис. 5 гистограмма построена для четырех показателей (А1, А2, А3, А4) при нефиксированном измерении, принимающем десять значений (от 1 до 10).

Рис. 5.Гистограмма для четырех показателей. Точечная диаграмма. Показывает взаимную связь между числовыми данными

(показателями) и представляет собой набор чисел в виде единственного ряда точек в координатах. Виды диаграмм такого типа необходимы для поиска кластеров данных. Лучше всего использовать для анализа взаимозависимости двух показателей, но можно использовать и для большего числа показателей. Значения измерений для точечной диаграммы фиксированы.

Пузырьковая диаграмма. Одна из разновидностей точечной диаграммы. Подходит для отображения трех показателей. Величина «пузырька», положение которого на координатной плоскости определяется двумя показателями, зависит от величины третьего показателя. Значения измерений для пузырьковой диаграммы фиксированы.

График. Отображает последовательность изменений числовых значений нескольких показателей для значений нефиксированного измерения, например, временного. Для лучшего восприятия значения всех показателей должны быть числами одного порядка.

Диаграммы с областями. Основной целью такой диаграммы является акцент на суммарной величине изменения нескольких показателей для значений выбранного (как правило, временного) измерения. Возможно также отображение доли отдельно взятых значений в общей сумме.

Кольцевая и круговая диаграммы. Данные виды диаграмм весьма схожи по целям. Обе они отображают роль каждого элемента в общей сумме. Их отличие заключается лишь в том, что кольцевая диаграмма может содержать несколько рядов показателей. Каждое вложенное кольцо представляет собой отдельный показатель. Частный случай кольцевой диаграммы - круговая диаграмма строится для одного показателя. Значения измерений для обеих диаграмм фиксированы.

Лепестковая диаграмма. Для данной диаграммы выбирается одно нефиксированное измерение. Каждое его значение представляет индивидуальную координатную ось, исходящую от нулевой точки координат. Затем на каждой такой оси откладываются значения показателей. Данный вид диаграмм позволяет сравнивать значения нескольких показателей.

Мишень. Диаграмма является средством когнитивной графики в виде лепестковой диаграммы (мишени) разбитой на сектора с отображением дополнительных зависимостей. Диаграмма-мишень служит для отображения значений основного показателя в виде секторов мишени и динамики изменения остальных показателей в виде траекторий, отмеченных на секторах мишени. Для каждого объекта может существовать несколько зависимостей: одна для основного показателя и несколько дополнительных, представляющих интерес при анализе того или иного процесса. Каждый сектор мишени соответствует значению выбранного измерения.

Диаграмма на основе 3-симплекс метода. На основе 3-симплекс метода [13] возможно построение когнитивной графики для представления многомерных данных для 4 показателей - по числу граней тетраэдра. Для каждого из них выбирается своя ось, перпендикулярная одной из граней тетраэдра. Значения показателей откладываются на выбранных осях, в результате ячейке многомерного куба ставится в соответствие точка пространства. Преимущество метода заключается в свободе выбора фиксированных и нефиксированных измерений. С помощью 3-симплекс метода визуально решается задача поиска кластеров на множестве анализируемых данных.

Следует понимать, что описание видов диаграмм приведено для создания статических инфограмм для отображения результатов ОЬЛР-анализа. При создании динамических инфограмм можно добавить функцию выбора показателей, или дополнительных измерений для анализа данных.

Создание шаблонов и использование карт для построения инфограмм

Кроме диаграмм инфограмма может содержать видео, изображения, карты и текст. Как правило, данный контент создается не автоматически (за исключением картограмм), а входит в специально подготовленный шаблон с заданной структурой для создания инфограммы. Для графического представления результатов аналитик выбира-

ет подходящий шаблон, куда будут встроены ключевые данные OLAP-анализа.

Визиты О — S Ш А Визиты О ^ 3 Ш Я

| 1 927

■ t

ч ^

Весь мир Россия Украина Беларусь Весь мир Россия

Весь мир Россия Украина Беларусь

Рисунок 6. Картограммы со статистикой посещения сайта конференции

Построение картограмм происходит на основе картографической привязки многомерных данных. Привязка возможна при выделении географического измерения многомерного куба [14]. Одновременно на карте могут отображаться сразу несколько показателей, значения которых передаются с помощью цвета, обозначений или состояния объекта (видимый, невидимый, выделенный, мигающий). Кроме привязки данных к существующим объектам возможно динамическое формирование новых картографических слоев, отображающих многомерные данные [15]. На рис. 6 приведен пример построения картограмм для отображения статистики посещений сайта конференции "IX Сибирский конгресс женщин-математиков".

Заключение

В работе выполнен обзор существующих подходов и инструментов построения инфограмм, определены виды инфограмм, проанализированы предпосылки интеграции методов инфографического моделирования и технологии оперативной аналитической обработки данных.

Актуальной задачей дальнейшего исследования является создание методических основ многомерного когнитивного моделирования и разработка аналитических инфо-графических моделей. Необходимо решить проблему взаимодействия с OLAP-системами, увеличить скорость построения инфограмм при выполнении операций над гиперкубом. Отдельное внимание стоит уделить вопросам восприятия - использованию разных способов графического представления информации при визуализации результатов многомерного анализа данных.

Литература

1. Stacey M., Salvatore J., Jorgensen A. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. - John Wiley & Sons, 2013.

2. Airinei D., Homocianu D. Data visualization in business intelligence // 2010 Proceeding of WSEAS MCBEC2010-Recent Advances In Mathematics And Computers In Business, Economics, Biology & Chemistry. 2010.

3. Pur A. et al. Data Presentation Methods for Monitoring a Public Health-Care System //11th Mediterranean Conference on Medical and Biomedical Engineering and Computing 2007. - Springer Berlin Heidelberg, 2007. P. 708-711.

4. Dance D.R. Mind mapping your way to the right software //Strategic Finance. 1997. Т. 78.

5. Dos Santos F. A. P., das Neves R. C., Filipe J. B. On the Generation of Dynamic Business

№ 10. P. 36.

Indicators // KDIR. 2012. P. 390-394.

6. Brackett K.E., Pal S. Creating high-impact visualisations //Applied Marketing Analytics. -2015. Т. 1. № 4. P. 331-341. "

7. Павлов А. А. Компьютеризация инфографического моделирования // Интернет-журнал Науковедение. - 2012. - №. 2 (11).

8. Tufte, Edward R (2001) [1983], The Visual Display of Quantitative Information (2nd ed.), Cheshire, CT: GraphicsPress, ISBN 0-9613921-4-2.

9. Create Easy Infographics, Reports, Presentations | Piktochart. [Электронный ресурс]. URL: http://piktochart.com (дата обращения: 21.02.2016).

10.Create and share visual ideas online | Easel.ly. [Электронный ресурс]. URL: http://www.easel.ly/ (дата обращения: 21.02.2016).

11. Create online charts &infographics | Infogr.am. [Электронный ресурс]. URL: https://infogr.am (дата обращения: 21.02.2016).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Online Diagram Software to draw Flowcharts, UML & more | Creately [Электронный ресурс]. URL: http://creately.com/ (дата обращения: 21.02.2016).

13. Yankovskaya A., Krivdyuk N. Cognitive Graphics Tool Based on 3-Simplex for Decision-Making and Substantiation of Decisions in Intelligent System // Proceedings of the IA STED International Conference Technology for Education and Learning TEL '2013. Marina del Rey, USA, November 11-13, 2013. P.463-469.

14. Евсюков А.А. Применение технологии OLAP для построения тематических карт / А.А. Евсюков // Сборник научных трудов VIII Международной научно-практической конференции «Современные информационные технологии и ИТ-образование». - Москва: МГУ, 2013. С. 377-384.

15. Евсюков А.А. Динамическое формирование картографических слоев в информационно-аналитических системах / А.А. Евсюков // Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева. 2011. № 1. С. 15-20.

Application of infographic simulation methods to represent multidimensional data

Evsyukov Alexander Anatolyevich, candidate of technical sciences, major scientific researcher

Korobko Anna Vladimirovna, candidate of technical sciences, scientific researcher

Institute of Computational Modeling Siberian Branch of Russian Academy of Sciences

The paper presents the survey of existing approaches and tools of infographics, the types of infogram. The methods integrating infographic simulation and online analytical processing technology are observed.

Keywords: infographics, infogram, OLAP, graphical representation of multidimensional data.

УДК 004

МЕТОДЫ И СРЕДСТВА ОБУЧЕНИЯ ПРОГРАММИРОВАНИЮ В ВУЗЕ

Елена Викторовна Касьянова, к. ф.-м. н, доцент, старший научный сотрудник Тел.: 8 383 330 4047, e-mail: [email protected] Институт систем информатики им. А.П. Ершова СО РАН, Новосибирский государственный университет http://www.iis.nsk.su

Рассматриваются методы и средства обучения программированию, разрабатываемые в лаборатории конструирования и оптимизации программ Института систем информатики им. А.П. Ершова СО РАН и на кафедре программирования Новосибирского государственного университета.

i Надоели баннеры? Вы всегда можете отключить рекламу.