ПРИМЕНЕНИЕ ВИЗУАЛИЗАЦИИ ДАННЫХ В АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ
Т.Н. Антошина, кандидат педагогических наук; А.А. Кабанов, кандидат юридических наук, доцент. Санкт-Петербургский университет ГПС МЧС России
Рассматривается применение визуализации данных в автоматизированных информационных системах. Раскрыты понятия «визуализация», «пространственная база данных», «визуализация данных». Даны категории визуализации данных, используемые в автоматизированных информационных системах. Перечислены инструменты для визуализации данных в автоматизированных информационных системах.
Ключевые слова: автоматизированная информационная система, база данных, данные, визуализация, визуализация данных, информационная система
APPLICATION OF DATA VISUALIZATION IN AUTOMATED INFORMATION SYSTEMS
T.N. Antoshina; A.A. Kabanov.
Saint-Petersburg university of State fire service of EMERCOM of Russia
The article discusses the application of data visualization in automated information systems. The concepts of «visualization», «spatial database», «data visualization» are disclosed. The categories of data visualization used in automated information systems are given. Tools for data visualization in automated information systems are listed.
Keywords: automated information system, database, data, visualization, data visualization, information system
Мы живём в век инновационных технологий и изобретений. С каждым днём технологии развиваются в геометрической прогрессии, и именно поэтому они играют ключевую роль в жизни общества.
За последнее десятилетие произошло колоссальное увеличение объема цифровых данных, поступающих из различных источников. Системы баз данных позволяют осуществлять массовый сбор данных, которые могут быть использованы для выявления различных проблем и дают возможность прогнозирования путем выявления важных влияющих факторов. Следовательно, можно наблюдать повышенный интерес к использованию этих больших структурированных и неструктурированных наборов данных в целях повышения эффективности принятия обоснованных и аналитических решений.
На сегодняшний момент в мире ежедневно производится 2,5 квинтиллиона байт данных, и 90 % всех данных было создано за последние два года. С таким большим количеством данных становится все труднее управлять и самое главное оперативно принимать решения.
«Обработка колоссального объёма данных невозможна для любого отдельного человека, но автоматизированной информационной системе (АИС) намного проще пробираться через данные, поскольку АИС разрабатывается и внедряется с целью повышения оперативности и обоснованности управленческих решений» [1].
Цель внедрения таких АИС в практику управления состоит в повышении оперативности и обоснованности принимаемых решений за счет более полного
использования информации. Накопление, хранение и выдачу информации для решения задач управления в автоматизированном режиме обеспечивают пространственные базы данных.
«Пространственная база данных - база данных (рис.), оптимизированная для хранения и выполнения запросов к данным о пространственных объектах, представленных некоторыми абстракциями: точка, линия, многоугольник и им подобных» [2].
Рис. Пример пространственной базы данных
Так как пространственные базы данных обладают возможностями работы с целостными пространственными объектами, объединяющими как традиционные виды данных (описательная часть или атрибутивная), так и геометрические (данные о положении объекта в пространстве), то в них должны быть включены инструменты для визуализации данных.
Визуализация (англ. rendering - «Рендеринг») - термин в компьютерной графике, обозначающий процесс получения изображения из модели с помощью компьютерной программы.
«Визуализация данных - это представление данных в виде, который обеспечивает наиболее эффективную работу человека по их изучению» [3].
Визуализация данных относится к методам, используемым для передачи сведений из данных через визуальное представление. Его основная цель состоит в том, чтобы перегонять большие наборы данных в визуальную графику, чтобы обеспечить легкое понимание сложных отношений внутри данных. Она часто используется взаимозаменяемо с такими терминами, как информационная графика, статистическая графика и визуализация информации.
Это один из этапов процесса науки о данных, разработанного Джо Блицштейном, который является основой для решения задач науки о данных. После того, как данные собраны, обработаны и смоделированы, отношения должны быть визуализированы, чтобы можно было сделать вывод.
Это также компонент более широкой дисциплины архитектуры представления данных, которая стремится идентифицировать, находить, манипулировать, форматировать и представлять данные наиболее эффективным способом.
Категории визуализации данных используемые в АИС:
1. Временной - визуализации данных относятся к временной категории, если они удовлетворяют двум условиям: что они линейны и что они одномерны. Временные визуализации - обычно характерные линии, которые либо стоят отдельно, либо перекрываются друг с другом с началом и окончанием времени (точечные графики,
диаграммы полярных областей, последовательности временных рядов, временные сроки, линейный график).
2. Иерархический - визуализации данных, принадлежащих к иерархической категории, упорядочивают группы внутри более крупных групп. Иерархические визуализации лучше всего подходят, если вы хотите отобразить кластеры информации (древовидные диаграммы, кольцевые диаграммы, диаграммы солнечных лучей).
3. Сеть - наборы данных тесно связаны с другими наборами данных. Визуализации сетевых данных показывают, как они связаны друг с другом в сети. Другими словами, демонстрация отношений между наборами данных без многословных объяснений (матричные диаграммы, схемы узловых соединений, аллювиальные диаграммы).
4. Многомерный - многомерные визуализации данных имеют несколько измерений. Это означает, что всегда есть две или более переменных в модели для создания визуализации 3Б-данных (точечные графики, круговая диаграмма, диаграмма Венна, штабелированные гистограммы, гистограммы).
5. Геокосмический - визуализации геопространственных или пространственных данных, относятся к реальным физическим местоположениям, накладывая знакомые карты с различными точками данных (карта потока, карта плотности, картограмма, тепловая карта).
Современные АИС, включающие в свои базы визуализацию данных, расширяются и включают в себя все более новые варианты использования данных таким образом, чтобы максимизировать их ценность. Визуализация данных помогает понимать, анализировать и обмениваться новыми данными в более интерактивной форме. Помогает более точно использовать инструменты визуализации данных и их соответствующие форматы в специализированных АИС.
Выбор правильного инструмента для визуализации данных в АИС часто зависит от типа данных в вопросе и уровня комфорта пользователя с кодированием, так как многие инструменты специализированы для работы с определенными форматами данных. Рассмотрим некоторые из них:
1. Живая картина - Tableau работает с числовыми и категориальными данными для получения расширенной графики.
2. Необработанные графики - RAW Graphs - это онлайн-платформа для визуализации данных. Интерфейс позволяет пользователям выбирать тип графика (например, диаграмму рассеяния, линейчатую диаграмму, дендрограмму и т.д.) на основе типа входных данных (то есть числовых или категориальных).
3. Устройство для захвата данных - Datawrapper - это бесплатная онлайн-платформа для создания PNG-диаграмм и карт без необходимости кодирования.
4. Сюжетное - Plotly - это полностью веб-интерфейс для создания графики. Он не требует каких-либо знаний кодирования, но может взаимодействовать как с R, так и с Python. Сообщество версия plotly является бесплатным для использования.
5. Gephi - это свободное программное обеспечение для визуализации сетей.
6. Voyant - это онлайн-инструмент для точечного анализа текста.
7. ГИС-библиотекарь. Здесь решаются вопросы геопространственных данных.
Инструменты для визуализации данных дают показатели эффективности,
необходимые для принятия более эффективных решений с первого взгляда. Статистика показывает, что эти инструменты могут помочь сэкономить до 40 % времени на создание отчета по принятию решения.
На основании вышеперечисленного можно сделать вывод, что использование визуализации данных в АИС позволяет применить базовую технологию баз данных для географических информационных систем и других приложений, выполнять аналитические запросы, содержащие пространственные операторы для анализа пространственно-логических отношений объектов и дает возможность развития более новому витку в области визуализации данных таких как:
1. Панель мониторинга или дашборды (англ. dashboards) - это механизм отчетности, который отображает показатели и ключевые показатели эффективности (КПЭ), позволяя всем пользователям быстро изучить их перед дальнейшим исследованием с помощью дополнительных инструментов.
2. Дополненная (augmented) аналитика - это использование вспомогательных технологий, таких как машинное обучение и искусственный интеллект, для помощи в подготовке данных.
3. Описательная аналитика - это проверка данных или контента, обычно выполняемая вручную, чтобы ответить на вопрос «Что произошло?» (или что происходит?).
4. Профилирование данных - это технология для выявления и исследования таких проблем качества данных, как дублирование, отсутствие согласованности, недостаточная точность и полнота.
5. Выделение цветом ключевых слов - это технология ускорения восприятия текста посредством подключения подсознательных механизмов восприятия информации [4]. При этом важным является то, что количество выделенного цветом текста должно быть не большим (интуитивно лучше воспринимается до 5 % текста), в противном случае восприятие замедляется. Подсознательно лучше воспринимается выделение жёлтым цветом. Критикуемые фрагменты текста лучше воспринимаются окрашенными серым цветом. Тёмные цвета фона букв - напротив, замедляют восприятие акцентируемых фрагментов.
Литература
1. Иванов А.Ю. Обеспечение выполнения требований к информационным системам МЧС России на основе структурной адаптации распределенных баз данных // Вестник Санкт-Петербургского института ГПС МЧС России. 2005. № 3 (10). С. 41-46.
2. Шекхар Шаши, Чаула Санжей. Основы пространственных баз данных. М.: Кудиц-образ, 2004. 336 с.
3. Паклин Н.Б., Орешков В.И. Визуализация данных // Бизнес-аналитика. От данных к знаниям. 2-е изд. СПб.: Питер, 2013. С. 173-210.
4. Кабанов А.А. Цветной текст как объект авторского права и продукт современных информационных технологий // Credo new Теоретический журнал. 2017. № 4 (92). С.162-177.
References
1. Ivanov A.Yu. Obespechenie vypolneniya trebovanij k informacionnym sistemam MCHS Rossii na osnove strukturnoj adaptacii raspredelennyh baz dannyh // Vestnik Sankt-Peterburgskogo instituta GPS MCHS Rossii. 2005. № 3 (10). S. 41-46.
2. Shekkhar Shashi, Chaula Sanzhej. Osnovy prostranstvennyh baz dannyh. M.: Kudic-obraz, 2004. 336 s.
3. Paklin N.B., Oreshkov V.I. Vizualizaciya dannyh // Biznes-analitika. Ot dannyh k znaniyam. 2-e izd. SPb.: Piter, 2013. S. 173-210.
4. Kabanov А. Color text as an object of copyright and a product of modern information technologies // Credo new Theoretical journal. 2017. № 4 (92). Pp. 162-177.