Научная статья на тему 'Инфографика визуализация данных в аналитической деятельности'

Инфографика визуализация данных в аналитической деятельности Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
7704
1148
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИЗУАЛИЗАЦИЯ ЗНАНИЯ / ИНФОГРАФИЯ / ИНФОГРАФИКА / АНАЛИТИЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ / БИБЛИОГРАФИЯ / ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Нефедьева Карина Владимировна

Рассмотрены общенаучные и специальные средства визуализации данных, их использование в библиографии, информационной аналитике. Показан опыт и проблемы применения средств визуализации в аналитической деятельности – специализация под конкретные аналитические задачи, адаптация пользователей к восприятию используемых форм представления данных, освоение аналитиком современных пакетов программ для информационного моделирования объектов. Впервые предложено обозначать формы свертывания семантической информации как целостную область знания – инфография, а средства образно-графического отображения данных инфографика.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Инфографика визуализация данных в аналитической деятельности»

К. В. Нефедьева

Инфографика - визуализация данных в аналитической деятельности

Рассмотрены общенаучные и специальные средства визуализации данных, их использование в библиографии, информационной аналитике. Показан опыт и проблемы применения средств визуализации в аналитической деятельности - специализация под конкретные аналитические задачи, адаптация пользователей к восприятию используемых форм представления данных, освоение аналитиком современных пакетов программ для информационного моделирования объектов. Впервые предложено обозначать формы свертывания семантической информации как целостную область знания - инфография, а средства образно-графического отображения данных - инфографика.

Ключевые слова: Визуализация знания, инфография, инфографика, аналитическая деятельность, библиография, информационное моделирование.

В процессе научной коммуникации возникает проблема возможности предоставления информации, понятной широкому кругу исследователей. В процессе экспоненциального роста документального потока возрастает потребность в свертывании текста, наглядности, целостности отображения смысла высказываний, компактного обобщения данных.

Возможности инфографики. Предлагается обозначать формы свертывания семантической информации как целостную область знания - инфография, в рамках которой рассматривать средства образно-графического отображения данных - инфографику.

Инфографика - новый, эффективный способ, который позволяет донести информацию, данные и знания посредством визуальных образов. Этот инструмент особенно хорошо работает там, где необходимо:

- показать устройство или алгоритм работы чего-либо;

- отобразить соотношение предметов или фактов во времени и пространстве;

- продемонстрировать тенденцию развития объекта;

- компактно раскрыть составные части сложного явления;

- организовать большие объемы информации.

Нередко графические формы дополняют текстовую информацию, шире охватывают тему, содержит некоторые пояснения к авторскому высказыванию.

Стремление представить значимую для потребителей информацию с помощью яркого, запоминающегося образа можно проследить во всей истории земной цивилизации. Исторически первой формой визуализации были наскальные рисунки, затем - планы, схемы, карты. Образной по своему характеру остается иероглифическая письменность. Для ряда отраслей знания (химия, математика, программирование, география и др.) созданы собственные системы условных обозначений, которые понятны всем специалистам и с успехом заменяют длинные текстовые разъяснения.

Профессиональное применение инфографии. В библиографии широко используется система разделительных знаков, позволяющая различать элементы библиографического описания без дополнительных пояснений. Международными являются коды нескольких библиотечно-библиографических классификаций. Аналитик информационных ресурсов свертывает избыточную информацию с помощью сравнительных таблиц, графиков, диаграмм, карт связей между понятиями и анализируемыми явлениями, включая авторов публикаций, организаций-разработчиков, структурных составляющих и др.

Кластеры связей, карты науки, рубрикаторы и онтологии - результат долговременного поиска форм свертывания социальной информации. Все искусственно созданные информационно-поисковые языки сложились в результате их длительного развития в рамках библиографии, затем - информатики. Примером могут служить сводные таблицы, диаграммы и карты Н. М. Лисовского, составленные в 1895-1914 гг. на основе его библиографического указателя, который включал сведения о 2883 журналах и продолжающихся изданиях. Они раскрывали становление русской периодической печати за 200 лет, были представлены на международной книжной выставке и высоко оценивались современниками.

Свою современную и массовую форму инфографика стала обретать, благодаря вытеснению текста в отдельных жанрах публикаций, в частности в периодических изданиях. Так, активное использование рисунков вместо обширных текстов привнесла газета USA Today, выходящая с 1982 г. Новая ежедневная газета стремилась предоставить обобщенный, красочный и быстрый обзор новостей, активно используя элементы визуализации. Согласно проводимым исследованиям, уже тогда читатели начали отдавать предпочтение хорошей инфографике в сочетании с короткими блоками информации, а не обычным глубоким многополосным материалам. Успех издания у читателей благоприятствовал быстрому распространение инфографики в США. С конца 80-х годов инфографические средства стали широко использовать ведущие европейские издания. В начале 90-х возникают специализированные агентства, например, британское Graphic News, а мировые информационные агентства (AP, Reuters, AFP и др.) создают специализированные службы. Сегодня в Европе и Северной Америке большая часть общенациональных изданий и маленьких газет применяют информационные рисунки. В сети Интернет сразу же была заложена динамичная система условных обозначений в виде иконок, условных сокращений, графических символов, которые обозначают даже эмоции и понятны пользователям Интернет-ресурсов.

Помимо СМИ, средства инфографики нашли широкое применение в совершенно разных областях: науке, статистике, бизнесе, аналитике, маркетинге, в системах обучения. Наглядное представление информации, считается оригинальным и привлекательным решением для отчетов компаний и презентаций, учебников и инструкций.

Успех объясняется тем, что визуализация позволяет установить связь чувственного опыта, описывающего реальность в деталях, и теоретических знаний, упорядочивающих сущность. Всплеск интереса к визуализации информации привел к тому, что к теме подключилось огромное число людей, что, в свою очередь, привело к множеству новых проектов и росту свежих новаторских идей в отображении и свертывании информации. В частности, сейчас ежегодно проводится международный конкурс аналитиков по визуализации знания, созданы специализированные сайты по инфографике1. В СПбГУКИ проблема профессиональной визуализации данных разрабатывается с 1991 г.2, студентами был создан первый сайт в русскоязычном Интернете «Визуализация научного знания» на основе работы одноименного семинара аспирантов и студентов в 2000-2005 гг.

Как и в любой развивающейся области, в инфографике сложились различные позиции, которые, как правило, объясняются разными целями визуализации. Так, началось противостояние между авторами, которые ставят на первое место функциональность, и теми, которые предпочитают главным в визуализации красоту и эстетику. В этой связи Мануэль Лим предложил разделить сферу инфографики на визуализацию информации и информационное искусство. Однако, несмотря на явную логику в делении, эти направления взаимопроникаемы, потому что цель и аудитория определяют наполнение изображения. Они же диктуют выбор типа сравнения данных.

Визуализация результатов сравнения данных. Для информационной аналитики важна именно эта область инфографики, так как профессионально аналитик находится в переплетении многоаспектных сравнений данных разного рода.

Любой аспект данных может быть выражен одним из пяти видов сравнения. Наиболее распространенный - временной аспект, показывает развитие объекта (индикатор возрастает, снижается, колеблется или остается неизменным) в определенных хронологических границах.

Покомпонентный аспект позволяет сравнить каждый компонент в процентах от некоего общего целого.

1 Варик К. Выбор диаграммы: шаг 2. Сравнение. [Электронный ресурс]. Электрон. дан. Режим доступа: http://www.vmethods.ru. Загл. с экрана. [Дата просмотра 17 сентября 2012 г.]; Ветров Ю. Визуализация данных: классификация [Электронный ресурс]. Электрон. дан. Режим доступа: http://experiment.ru.

2 Гордукалова Г. Ф. Изображение как новый способ формализации данных о развитии документального потока // Библиотека - информатизация - наука: тез.докл. и сообщ.республ.научн.конф.: 8-10 октября 1991 г., Киев. Ч. II. Киев, 1991. С. 7-9; Гордукалова Г. Ф. Визуализация знания: прошлое и будущее // Мир гуманитарной культуры академика Д. С. Лихачева: Международные Лихачевские научные чтения 2425 мая 2001 г. СПб., 2001. С. 73-76 и др.

Изобразить соотношение данных между собой возможно с помощью позиционного сравнения, а их зависимость между собой - на основе корреляци-оннъх методов. Попадание объектов в определенные интервалы отображается с помощью частотного сравнения.

Средства визуализации данных. Инфографика может быть представлена в разных формах. Это матрицы, карты, иллюстрации, графики и диаграммы. Последние делятся на диаграммы сравнения, структурные, карты визуализации процесса, времени и связей.

Аналитик широко применяет общенаучные формы свертывания данных. В частности, диаграммы сравнения, которые показывают соотношения набора данных. Во многих случаях строятся вокруг осей. Таковыми могут быть столбцовая, круговая, кольцевая, лепестковая, тепловая. К ним относится и сугубо информационные отображения - облако тегов, которое позволяет сравнить ключевые слова или фразы внутри текста, задавая каждому размер шрифта.

Показать структуру набора данных и взаимосвязи между объектами позволяет структурная диаграмма. К этому виду относятся диаграмма Венна-Эйлера, формализованная, а также изображенная в виде дерева или ментальной карты (mind-maps). Последние две показывают иерархию набора данных, где элементы являются родительскими или дочерними по отношению друг к другу. Но первая выстраивается в виде соединенных линиями узлов, как правило, сверху вниз, а вторая имеет центрическое строение - от ключевого понятия отходит один или несколько дочерних элементов. Узел обычно отображается кругом или прямоугольником. Например, карта сайта, связи между цитируемыми и цитирующими авторами по признакам частоты социтирования и библиографического сочетания.

Визуализировать процесс, показать последовательность действий и количество сценариев развития событий помогут циклическая, блок-схемы (формализованные и неформализованные) и диаграмма Сэнки. Шаги процесса, который содержит набор повторяющихся действий, циклическая диаграмма отображает в виде кольца, которое образуют соединенные стрелками шаги. Начало и окончание процесса - входящей и выходящей из круга стрелками. Блок-схемы показывают процесс, в виде связанных друг с другом однонаправленными стрелками блоков. Диаграмма Сэнки показывает ключевые шаги процесса и интенсивность его протекания на каждом из участков, изображается в виде соединяющихся и разветвляющихся линий разной толщины (в зависимости от величины параметра).

Для аналитика блок-схема технологии анализа является основным средством, поскольку разрабатывается или продумывается исполнителем при выполнении любого запроса. Кроме того, блок-схемы процессов аналитик широко применяет при выполнении логистических обследований информационных потоков предприятия. Он отображает с помощью блок-схем реальное движение потока информации, а также проектирует наиболее эффективную схему движения, обработки и использования информации.

Разновидность диаграмм времени представлена временной шкалой и диаграммой Ганта, которая отображает последовательность, длительность, начало и окончание этапов и проекта, в виде одного или нескольких каскадов. Отобразить множество связей внутри набора данных можно с помощью круговых, линейных диаграмм, связей на карте или дендрограмм.

Данные, зависимые от географии или архитектуры некого объекта изображаются в виде карт: географических, фотографических, дорожных, тематических, картограмм или архитектурных планов. Сопоставить между собой значения внутри набора данных в виде таблицы позволяют матрицы.

Неформализованным и самым привлекательным способом передачи информации являются наглядные изображения результатов анализа, когда процесс поэтапно описывается при помощи картинок. Аналитик все чаще прибегает к этой форме визуализации данных, чтобы наглядно подтвердить выявленные тенденции в развитии объекта, а главное - упростить процесс восприятия сложного аналитического текста для потребителя.

Визуализировать информацию возможно и в трехмерном пространстве при помощи 3-Б графики. Можно создать стереоскопическое изображение, создающее иллюзию объемности, и динамическое, которое может быть создано при помощи стереоскопии или анимации.

Таким образом, аналитик информационных ресурсов располагает широким арсеналом общенаучных и специальных средств визуализации выводного знания. Остаются нерешенными проблемы их специализации под конкретные аналитические задачи, адаптации пользователей и освоения аналитиком современных пакетов программ для информационного моделирования объектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.