Захарова А.А., Подвесовский А.Г., Лагерев Д.Г. УДК 004.62
ВИЗУАЛЬНАЯ АНАЛИТИКА И КОГНИТИВНЫЕ МЕТОДЫ ДЛЯ ОБРАБОТКИ И АНАЛИЗА ГЕТЕРОГЕННЫХ ДАННЫХ МУЛЬТИСЕНСОРНЫХ СИСТЕМ:
ПРОБЛЕМЫ И ТЕНДЕНЦИИ Захарова Алёна Александровна
Д.т.н., доцент, старший научный сотрудник, Институт прикладной математики им. М.В. Келдыша Российской академии наук, 125047, Россия, г. Москва, Миусская пл., 4, профессор кафедры «Информатика и программное обеспечение», Брянский государственный технический университет, 241035, Россия, г. Брянск, бул. 50 лет Октября, д. 7, e-mail: [email protected]
ORCID: 0000-0003-4221-7710 Подвесовский Александр Георгиевич К.т.н., доцент, заведующий кафедрой «Информатика и программное обеспечение» Брянский государственный технический университет, 241035, Россия, г. Брянск, бул. 50 лет Октября, д. 7, e-mail: [email protected]
ORCID: 0000-0002-1118-3266 Лагерев Дмитрий Григорьевич К.т.н., доцент, доцент кафедры «Информатика и программное обеспечение» Брянский государственный технический университет, 241035, Россия, г. Брянск, бул. 50 лет Октября, д. 7, e-mail: [email protected]
ORCID: 0000-0002-2702-6492
Аннотация. В статье рассматривается проблематика анализа разнородных многопараметрических данных, получаемых из гетерогенных источников. Описывается структура процесса анализа данных на разных уровнях их представления, и обсуждается роль визуальной аналитики и когнитивного моделирования в качестве основы для реализации его этапов. Дается обзор существующих методов визуальной аналитики и когнитивного моделирования, с выделением актуальных направлений развития указанных подходов. Ключевые слова: анализ данных, гетерогенные данные, мультисенсорные системы, визуализация, визуальная аналитика, когнитивное моделирование.
Цитирование: Захарова А.А., Подвесовский А.Г., Лагерев Д.Г. Визуальная аналитика и когнитивные методы для обработки и анализа гетерогенных данных мультисенсорных систем: проблемы и тенденции // Информационные и математические технологии в науке и управлении. 2019. № 4 (16). С. 60-74. DOI: 10.25729/2413-0133-2019-4-05
Введение. В современном представлении анализ данных - это анализ явлений, для которых еще нет математических моделей. Имеются только наборы экспериментальных данных «входы-выходы» либо даже только «входы», представленные в виде массивов или таблиц. Тем самым, основным предметом внимания современного анализа данных является конструирование моделей и определение параметров этих моделей. При этом задачей исследователя является не только и не столько проверка гипотез о возможных формах
зависимостей, параметрах предполагаемых законов распределений и т.д., сколько поиск и формирование самих гипотез, с привлечением знаний о предметной области, интуиции и эвристик.
Классический подход к анализу данных рассматривает процесс анализа в виде однонаправленной последовательности этапов «данные - модель - анализ - интерпретация». Развитием данного подхода является концепция анализа данных, предложенная в 60-х гг. 20-го века Дж. Тьюки [30], в рамках которой обоснована необходимость различения разведочного анализа данных (exploratory data analysis) и подтверждающего анализа данных (confirmatory data analysis). Кроме того, по Тьюки анализ данных носит циклический, итерационный характер: выдвинутые на первых этапах разведочного анализа гипотезы могут потребовать дополнительных экспериментальных данных или наблюдений, уточнений, что в свою очередь может существенно упростить подбор способов более глубокой обработки данных на этапах подтверждающего анализа.
Почему же в современном мире приходится менять подходы к обработке данных? Для ответа на данный вопрос обратимся к рис. 1, на котором схематически показана связь между развитием науки, технологий и человеческих потребностей. Как известно, фундаментальные научные исследования, с одной стороны, направлены на получение новых знаний, а с другой стороны, определяют тренды развития новых прикладных научных исследований, которые в свою очередь продиктованы потребностями промышленности и общества. Вместе с прикладными исследованиями развиваются технологии, при этом темпы их развития растут поступательно, но асинхронно с человеческими потребностями, и этот рост наблюдается в так называемых точках технологического прорыв, когда появляются принципиально новые технические решения. Именно в этих точках технологического прорыва наблюдается интенсивный рост объемов разнородной, разномасштабной информации, необходимой для обеспечения процессов инженерии возникающих новых систем.
---л Точки технологического
прорыва
f
Технологии
Время
Рис. 1. Динамика развития науки, технологий и человеческих потребностей
Появляются новые типы данных, к которым можно отнести, например, данные с измерительных устройств, события от радиочастотных идентификаторов, потоки сообщений из социальных сетей, данные дистанционного зондирования Земли, данные геолокации, текстовые корпуса, аудио- и видеопотоки и др. При этом источники этих данных, как правило, являются распределенными и разнородными и не всегда согласуются и синхронизируются между собой, а сами данные в большинстве случаев являются слабо формализуемыми и недостаточно структурированными для обработки традиционными методами.
Кроме того, с развитием технологий наблюдается рост масштабности и разноплановости принимаемых решений по управлению новыми типами систем. При этом среди задач принятия решений начинают преобладать такие, которые не решаются с помощью традиционных математических методов, и в которых все большую роль начинает играть собственно процесс постановки задачи. Таким образом, возрастает роль в принятии решений человека как носителя целостного восприятия решаемой проблемы. Наконец, следует отметить увеличение числа междисциплинарных проектов, требующих участия специалистов из различных областей знаний, а также специалистов, способных обобщать знания из нескольких областей, формировать комплексные модели для их получения и использования.
С учетом сказанного, можно сделать вывод, что в настоящее время при решении задач сбора, анализа и интерпретации данных чаще всего приходится иметь дело с разнородностью и гетерогенностью как самих обрабатываемых данных, так и источников их получения. При этом получаемые и обрабатываемые данные не всегда согласуются и синхронизируются, а также носят междисциплинарный характер. Таким образом, для повышения качества и достоверности принимаемых решений технология анализа данных должна предоставлять следующие возможности:
- агрегирование разнородных данных, получаемых из множества источников, с обеспечением согласованности и непротиворечивости результатов агрегирования;
- отображение данных в максимально концентрированном виде, при этом без ущерба для их информативности, и наиболее удобным для восприятия способом;
- наличие механизмов интерпретации данных, поддерживающих интеллектуальный, творческий процесс поиска новых знаний и принятия решений на их основе, а также способствующих активизации использования интуиции и опыта специалистов (экспертов) в процессе принятия решений.
Обработка и анализ гетерогенных данных мультисенсорных систем: общие принципы. Системы, в которых происходит обработка данных, получаемых из гетерогенных источников, будем называть мультисенсорными системами [13], понимая под сенсором любой источник цифровой информации.
В работе [11] авторами была предложена схема работы с мультисенсорными данными (рис. 2), и было показано, что процесс анализа таких данных по своей конфигурации является инвариантным относительно уровня представления данных. Различаются только методы и алгоритмы реализации его этапов. При этом при переходе от уровня к уровню увеличивается степень структурированности данных (табл. 1).
Рис. 2. Схема работы с мультисенсорными данными на разных уровнях представления
(источник: [11])
Таблица 1. Степень структурированности данных на разных уровнях их представления
Уровень представления данных Степень структурированности данных
Уровень измерений Неструктурированные
Концептуальный уровень Слабо структурированные
Аналитический уровень (уровень моделей/гипотез) Структурированные
Уровень знаний Знания (результат обработки данных)
Таким образом, один из ключевых принципов, который должен быть положен в основу технологии обработки, анализа и интерпретации гетерогенных данных мультисенсорных систем - это многоуровевость и итерационность. Другими принципами, на которые следует опираться при реализации указанной технологии, являются распределенность, динамичность и когнитивность. Под распределенностью понимается распределенность как источников накопления данных, так и информационных и инструментальных ресурсов для их обработки и анализа. Принцип динамичности предполагает необходимость учета изменчивости состава и структуры источников данных, а также объектов, описываемых этими данными. При этом указанная изменчивость может проявляться с точки зрения не только времени, но и любых других параметров.
Отдельно следует сказать про принцип когнитивности. В соответствии с этим принципом, основным подходом к обработке данных, находящихся на начальных уровнях формализации (т.е. являющихся неструктурированными либо слабо структурированными), должен являться подход, позволяющий строить модели анализа и интерпретации, опирающиеся на интеллектуальные и когнитивные возможности исследователя и предполагающие их активное использование в данном процессе. Иными словами, модель анализа должна стать средством, позволяющим исследователю самостоятельно обнаруживать новые гипотезы, которые впоследствии будут проверяться с помощью более строгих математических методов.
С учетом перечисленных принципов, можно определить специальные требования к содержанию каждого этапа процесса анализа мультисенсорных данных, а также механизмы реализации данных этапов (табл. 2).
Таблица 2. Механизмы реализации этапов процесса анализа данных _для разных уровней их представления
Этап процесса анализа данных Уровень измерений Концептуальный уровень Аналитический уровень
Предобработка Синхронизация; калибровка Приведение в соответствие с требованиями модели Устранение аномалий, группировка, фильтрация и т.п.
Первичная обработка Визуализация многомерных данных Построение и визуализация когнитивной карты Подготовка данных к анализу, выбор методов и алгоритмов, обеспечение корректности их работы
Анализ Визуальная аналитика Структурно-целевой и сценарный анализ когнитивной карты Статистический анализ; бизнес-аналитика; имитационное моделирование и др.
Постобработка Снижение размерности; отбор признаков и факторов для дальнейшего анализа Формирование и отбор гипотез для дальнейшего анализа Представление и тиражирование знаний
Как видно из табл. 2, ключевую роль в реализации большинства этапов анализа данных играют методы визуализации, визуальной аналитики и когнитивного моделирования. Рассмотрим содержание этих методов и пути их применения подробнее.
Проблематика визуализации и визуальной аналитики данных. Скорость восприятия визуальной информации на порядки превышает скорость восприятия текстовой, а производительность человека, как показали исследования, работающего с визуальной информацией, на 17% выше производительности человека, работающего с текстовыми или цифровыми данными.
Визуализация имеет ряд преимуществ по сравнению с традиционными способами представления информации, такие как: возможность анализа больших объемов данных со сложной структурой, выделение трендов, паттернов поведения и зависимостей, возможность акцентирование на тех или иных аспектах данных.
Помимо классических паттернов визуализации, таких как, например, графики и диаграммы, на сегодняшний день разработано много паттернов визуализации, позволяющих продемонстрировать более сложные структуры данных. Например, различные карты (погодные или демонстрирующие территориальное распределение), таймлайны (демонстрация изменений или событий, происходящих во времени), различные сети (когнитивные карты, деревья и т.д.). Кроме того, активно разрабатываются различные методы визуализации больших данных. Так же перспективным направлением является визуализация больших и слабо формализованных данных в разных научных областях - от медицины до литературы. Активно разрабатываются различные методы визуализации многомерных данных (например, множественные срезы, множественные оси) [25].
Например, визуализация позволяет проводить анализ больших медицинских данных на новом уровне: например, визуализировать близость семейств генов различных видов [29] или жизненный цикл РНК-связывающих белков [26].
В процессе интеллектуального анализа данных до недавнего времени визуализация использовалась, в основном, только для формирования итогового отчета по результатам анализа. Однако, в настоящее время визуализация активно применяется на всех этапах работы с данными (рис. 3).
Рис. 3. Визуализация на различных этапах анализа данных
Кроме того, принято выделять следующие виды визуализации.
1. Визуализация информации: визуализация различных структур данных (графики, деревья и т.д.), когда требуется передать информацию визуально
2. Научная визуализация: визуализация данных, для которых характерна естественная геометрическая структура (например, данные магнитно-резонансной томографии, геологические данные и др.) - осуществляется с целью анализа и исследования информации.
3. Визуальная аналитика - объединение интерактивных визуальных представлений с базовыми аналитическими методами (например, методами статистического и интеллектуального анализа данных), с целью активизации и повышения эффективности когнитивных процессов исследователя (осмысление, рассуждение, принятие решений). В данном случае визуальная модель становится инструментом исследования и формулирования новых гипотез в процессе визуального анализа.
Для поддержки визуализации и визуальной аналитики в настоящее время существует множество программных средств, которые можно условно разделить на два класса: средства, поддерживающие весь цикл анализа и визуализации данных, и средства, поддерживающие только визуализацию данных.
К примерам программных средств, поддерживающих полный цикл подготовки, анализа и визуализации данных, относятся такие программные комплексы как Loginom, продукты Microsoft (Excel, Power BI), Google Data Studio, MATLAB, QlikView и др.
К программным продуктам, поддерживающим только визуализацию данных (рендеринг) можно отнести, например, Autodesk 3ds Max (ранее 3D Studio MAX).
Кроме того, существует немало библиотек, разработанных для языка JavaScript, для поддержки интерактивной и адаптивной визуализации в веб-браузере. Примерами таких библиотек могут служить: D3.js, FusionCharts и т.д. Также существуют различные онлайн -сервисы, предназначенные для визуализации данных, такие как Tableau Public, Google Charts, Datawrapper.
Проведенный анализ работ по визуальной аналитике показывает, что на сегодняшний день существует ряд решений, реализующих построение моделей данных на основе синтеза методов математического моделирования, визуализации и анализа данных для отдельных задач в конкретных предметных областях. Так, известны примеры применения визуальной аналитики в задачах вычислительной механики жидкости и газа, связанных, например, с выделением и трассировкой нестационарных структур (отрывных зон и разрывов) в течениях. Подробный обзор методов и подходов, применяемых для исследования процессов анализа и визуализации вихревых течений, приведен в работе [28]. Достаточно интересным является опыт применения визуальной аналитики для анализа и оптимизации параметров распределенных экспериментов области в физики высоких энергий и ядерной физики [ 7]. Обзор подходов к применению визуальной аналитики в проектировании программного обеспечения можно найти в работе [19].
Анализ и классификация современных методов визуализации многомерных данных приведены в работе [22].
Актуальные проблемы визуализации. В настоящее время отсутствует комплексная методология, позволяющая создавать универсальные, предметно-независимые визуальные модели данных, в том числе многомерных данных, получаемых из гетерогенных источников. Прогресс в области вычислительной техники позволяет достаточно эффективно проводить машинную предобработку данных такого рода. Однако, при визуализации обработанных данных возникает проблема, связанная с выбором из графического представления. Классические методы графического представления данных (столбчатые диаграммы, ящики с усами и т.п.), зачастую применяемые при визуализации, разработаны без учета особенностей и размера современных данных и не позволяют одномоментно представить всю требуемую информацию в нужном объеме, тогда как применение подходов по снижению размерности приводит к потери части информации при ее графическом отображении и визуальном анализе.
Таким образом, несмотря на то, что визуализация является повсеместно инструментом обмена информации и анализа данных, остаются актуальными следующие вопросы: формализация и создание понятийного аппарата процесса визуализации, систематизация существующих подходов, развитие методов визуального представления визуального анализа, создание инструментов визуализации, в том числе как средства междисциплинарного взаимодействия. Последнее особо актуально, поскольку при решении практических задач необходимо взаимодействие специалистов из разных предметных областей, что требует организации взаимодействия между людьми, обобщения разных подходов, совмещения разного понятийного аппарата и т.п.
Решения, направленные на развитие новых подходов к визуализации и визуальной аналитике многомерных гетерогенных данных, в настоящее время создаются. Так в работах [12-14] предлагается комплексный подход к визуализации многомерных данных, когда на основе оригинального алгоритма построения визуальных моделей, в зависимости от решаемых аналитических задач, предлагается выбор метафоры визуализации многомерных гетерогенных данных. Созданы программные инструменты («Аналитический визуализатор данных», «Анализатор визуального представления»), технология когнитивной интерпретации гетерогенных данных. Следует отметить, что данное решение инвариантно относительно структуры и форм представления данных и позволяет совместно использовать
вычислительные и когнитивных ресурсы, кроме того обладает интерактивным интерфейсом для настройки отображения визуальной модели.
Описанный подход использовался при решении ряда задач [10, 12, 13], например:
- представление общей совокупности знаний в предметной области, содержащей экспериментальные сведения;
- реконструкция недостающих данных в описании объектов нефтедобывающей отрасли;
- визуализация экспериментальных медико-биологических данных и др.
Особо следует отметить эффективность применения инструментов визуальной аналитики при поиске новых гипотез.
Роль визуализации оказывается важной при фильтрации множества альтернатив в задачах многокритериального анализа решений, когда источником информации об альтернативах являются мультисенсорные системы. Например, в задачах планирования вычислительного эксперимента такая информация включает в себя параметры моделирования и результаты расчетов, и число альтернатив достигает нескольких сотен, а для их оценки используются десятки критериев. В этом случае, благодаря применению визуальной аналитики, фильтрацию альтернатив можно свести к сравнительному анализу их визуальных образов, т.е. визуальных представлений векторных критериальных оценок. Некоторые результаты применения данного подхода, а также созданный для решения этой задачи программный модуль «AltemativesVisuaHzer» описаны в работе [9].
Когнитивный анализ и моделирование слабоструктурированных систем. Одним из подходов к исследованию слабоструктурированных систем, широко применяемым в настоящее время, является когнитивный подход [1]. В соответствии с определением, приведенным в указанной статье, когнитивный подход ориентирован на разработку формальных моделей и методов, поддерживающих интеллектуальный процесс решения проблем благодаря учету в этих моделях и методах когнитивных возможностей (восприятие, представление, познание, понимание, объяснение) человека при решении управленческих задач. Методы структурно-целевого и имитационного моделирования систем на основе когнитивного подхода принято объединять под общим термином «когнитивное моделирование». В общем виде под когнитивным моделированием понимается исследование структуры системы и процессов ее функционирования и развития путем анализа ее когнитивной модели. В основе когнитивной модели системы лежит когнитивная карта, которая отражает субъективное представление исследователя о ней (индивидуальное или коллективное) в виде множества семантических категорий (называемых факторами или концептами) и набора причинно-следственных связей между ними.
Процесс когнитивного моделирования начинается с построения когнитивной карты исследуемой системы на основе имеющихся данных. На следующем этапе происходит непосредственно моделирование, основными целями которого являются формирование и проверка гипотез о структуре исследуемой системы, позволяющих объяснить ее поведение, а также выработка стратегий поведения в той или иной ситуации с целью достижения заданных целевых состояний.
Имеющийся положительный опыт применения когнитивного подхода для анализа и моделирования слабоструктурированных систем [2, 4, 5, 15, 18] позволяет говорить о
целесообразности его использования в целом для обработки, анализа и интерпретации слабоструктурированных многопараметрических данных.
Для успешной реализации когнитивного подхода для решения указанных выше задач, необходимо создание технологии, которая должна в себя включать:
1) методы и алгоритмы идентификации структуры и параметров когнитивной карты на основе комплексирования и совместного использования разнородных многопараметрических данных об исследуемой системе;
2) методы и алгоритмы структурно-целевого анализа, в задачи которых входит нахождение факторов, оказывающих наиболее значимое влияние на целевые, выявление противоречий между целями и т.д.;
3) методы и алгоритмы сценарного анализа, целью которого является прогнозирование состояния моделируемой системы при различных управляющих воздействиях, а также поиск альтернативных управляющих решений по приведению системы в целевое состояние;
4) методы и алгоритмы визуализации когнитивных моделей.
В качестве математического аппарата, применяемого для представления когнитивных моделей и лежащего в основе методов их анализа, чаще всего используется нечеткая логика. Благодаря этому возник целый класс когнитивных моделей, основанный на различных типах нечетких когнитивных карт (НКК) [6, 23, 24]. Наиболее распространенными типами НКК являются НКК Б. Коско, НКК В.Б. Силова, продукционные и реляционные НКК.
Среди программных средств поддержки когнитивного моделирования можно выделить ряд отечественных и зарубежных разработок, среди которых системы «Канва», «Ситуация», «Strice», «Mental Modeler», «FCMapper», «FCM Expert», «ИГЛА». Обзор этих и некоторых других систем можно найти в работе [17]. Здесь можно отметить, что за годы, прошедшие с момента публикации данной статьи, многие системы практически не получили дальнейшего развития, а некоторые системы наоборот продолжают активно развиваться. Примером такой системы является система «ИГЛА», которая позволяет строить нечеткие когнитивные модели, основанные на НКК Силова, выполнять их структурно-целевой и сценарный анализ, на основе чего осуществлять поиск и моделирование управляющих воздействий для приведения исследуемой системы в желаемое целевое состояние. Система «ИГЛА» была использована при решении ряда практических задач, например:
- анализ и моделирование стратегий управления инновационной деятельностью машиностроительного предприятия [8];
- анализ и моделирование стратегий управления научным потенциалом региона и прогнозирование региональной потребности в кадрах высшей научной квалификации [3];
- управление качеством в сварочном производстве [27];
- автоматизация трудноформализуемых этапов проектирования технологической оснастки [16];
- анализ и планирование программных проектов [20];
- анализ и моделирование стратегий управления комплексным развитием сельских территорий [21].
Заключение. Таким образом, можно отметить, что в современных условиях становится все более актуальным развитие средств визуализации и когнитивного моделирования (создание единого понятийного аппарата, унифицированное описание
методологий и т.п.). При этом возрастает потребность в разработке программно-инструментальных средств для развития «открытых» программных продуктов, и актуальным является развитие методик применения указанных средств с учетом специфики предметной области, где осуществляется анализ данных.
Актуальной задачей является исследование эргономических основ при создании интерфейсов с привлечением средств визуализации и средств визуальной аналитики для усиления когнитивного потенциала исследователя. В данном контексте также требуются формализация и развитие интеллектуальных средств визуального и когнитивного анализа (математический аппарат, алгоритмизация и реализация).
Работа выполнена при финансовой поддержке Российского научного фонда, проект № 18-11-00215.
СПИСОК ЛИТЕРАТУРЫ
1. Авдеева З.К., Коврига С.В., Макаренко Д.И. Когнитивное моделирование для решения задач управления слабоструктурированными системами (ситуациями) // Управление большими системами. 2007. Вып. 16. С. 26-39.
2. Авдеева З.К., Горелова Г.В., Коврига С.В., Панкратова Н.Д. Угрозы безопасности мегаполиса, когнитивное моделирование // Системные исследования и информационные технологии. 2014. №4. С. 10-22.
3. Аверченков В.И., Кожухар В.М., Подвесовский А.Г., Сазонова А.С. Мониторинг и прогнозирование региональной потребности в специалистах высшей научной квалификации: монография. Брянск: БГТУ. 2010. 163 с.
4. Анохина М.Е. Моделирование стратегии управления экономическим ростом сельского хозяйства. Часть 1 // Экономика сельскохозяйственных и перерабатывающих предприятий. 2019. №2. С. 23-34.
5. Анохина М.Е. Моделирование стратегии управления экономическим ростом сельского хозяйства. Часть 2 // Экономика сельскохозяйственных и перерабатывающих предприятий. 2019. № 3. С. 50-53.
6. Борисов В.В., Круглов В.В., Федулов А.С. Нечеткие модели и сети. М.: Горячая линия -Телеком. 2012. 284 с.
7. Галкин Т.П., Григорьева М.А. и др. Применение методов визуальной аналитики для кластеризации и категоризации задач анализа и обработки данных экспериментов в области физики высоких энергий и ядерной физики // Научная визуализация. 2018. Т. 10. № 5. С. 32-44.
8. Ерохин Д.В., Лагерев Д.Г., Ларичева Е.А., Подвесовский А.Г. Стратегическое управление инновационной деятельностью предприятия: монография. Брянск: БГТУ. 2010. 196 с.
9. Захарова А.А., Коростелев Д.А., Федонин О.Н. Алгоритмы визуализации для фильтрации многокритериальных альтернатив // Научная визуализация. 2019. Т. 11. № 4. С. 66-80.
10. Захарова А.А. Пак А.Я., Шкляр А.В., Пак Т.А. Визуально-когнитивный анализ многомерных данных для характеристики металломатричных композитов AL/SIC // Светотехника. 2018. №6. С. 58-65.
11. Захарова А.А., Подвесовский А.Г. Технология анализа слабоформализованных данных мультисенсорных систем с применением методов распределенной экспертизы // Труды Междунар. науч. конф. по физико-технической информатике CPT2018. М.-Протвино: Изд-воИФТИ. 2018. С. 221-229.
12. Захарова А.А., Шкляр А.В. Основные принципы построения визуальных моделей данных на примере интерактивных систем трехмерной визуализации // Научная визуализация. 2014. Т. 6. № 2. С. 62-73.
13. Захарова А.А., Шкляр А.В., Вехтер Е.В. Методика решения задач анализа данных при использовании аналитических визуальных моделей // Научная визуализация. 2017. Т. 9. № 4. С. 78-88.
14. Захарова А.А., Шкляр А.В. Метафоры визуализации // Научная визуализация. 2013. Т. 5.
№2. С. 16-24.
15. Кондрашина О.Н., Анохина М.Е. Использование нечетких когнитивных карт в оценке качества экономического роста отдельной отрасли // Экономика и предпринимательство.
2017. №5-1. С. 896-899.
16. Копелиович Д.И., Подвесовский А.Г., Сафонов А.Л., Вилюха А.В., Исаев Р.А. Применение нечетких когнитивных моделей в автоматизации проектирования технологической оснастки // Вестник компьютерных и информационных технологий.
2018. №3. С. 20-35.
17. Кулинич А.А. Компьютерные системы моделирования когнитивных карт: подходы и методы // Проблемы управления. 2010. №3. С. 2-16.
18. Мельник М.С., Орехов В.Д., Причина О.С. Моделирование тенденций и закономерностей трудовой деятельности в России: когнитивный подход // Проблемы экономики и юридической практики. 2018. №3. С. 94-101.
19. Намиот Д.Е., Романов В.Ю. 3D визуализация архитектуры и метрик программного обеспечения // Научная визуализация. - 2018. - Т. 10. - № 5. - С. 123-139.
20. Подвесовский А.Г., Титарев Д.В., Исаев Р.А. Нечеткие когнитивные модели в задачах анализа и планирования программных проектов // Вестник компьютерных и информационных технологий. - 2019. - № 8. - С. 22-31.
21. Подгорская С.В., Подвесовский А.Г., Исаев Р.А., Тарасов А.С., Бахматова Г.А. Моделирование сценарного развития сельских территорий на основе нечеткой когнитивной модели//Проблемы управления. 2019. №5. С. 49-59.
22. Романова И.К. Современные методы визуализации многомерных данных: анализ, классификация, реализация, приложения в технических системах // Наука и образование: научное издание МГТУ им. Н.Э. Баумана. 2016. № 3. С. 133-167.
23. Силов В.Б. Принятие стратегических решений в нечеткой обстановке. М.: ИНПРО-РЕС. 1995. 228 с.
24. Groumpos P. Why Model Complex Dynamic Systems Using Fuzzy Cognitive Maps? // Robot Autom Eng J, 2017, Vol. 1(3): RAEJ.MS.ID.555563.
25. Dill J. et al. (Eds.) Expanding the Frontiers of Visual Analytics and Visualization // SpringerVerlag London Limited, 2012.
26. OrthoMCL DB: Ortholog Groups of Protein Sequences. Режим доступа: https://orthomcl. org/orthomcl/ (дата обращения 10.11.2019)
27. Podvesovskii A.G., Gulakov K.V., Dergachyov K.V., Korostelyov D.A., Lagerev D.G. The choice of parameters of welding materials on the basis of fuzzy cognitive model with neural network identification of nonlinear dependence // Proceedings of 2015 International Conference on Mechanical Engineering, Automation and Control Systems (MEACS). IEEE Catalog Number: CFP1561Y-ART. Pp. 02-38-NSAP.
28. Tricoche X., Garth C. Topological Methods for Visualizing Vortical Flows // Mathematical Foundations of Scientific Visualization, Computer Graphics, and Massive Data Exploration. Springer-Verlag. 2009. Pp.89-108.
29. TriTryp DB: Kinetoplastid Gemomic Resource. Режим доступа: https://tritrypdb. org/tritrypdb/ (дата обращения 10.11.2019)
30. Tukey J.W. The future of data analysis // Annals of Mathematical Statistics. 1962. Vol. 33. №1. Pp. 1-67.
UDK 004.62
VISUAL ANALYTICS AND COGNITIVE METHODS FOR PROCESSING AND ANALYSIS OF HETEROGENEOUS DATA IN MULTI-SENSOR SYSTEMS: ISSUES AND TRENDS Alena A. Zakharova
Dr. Tech. Sc., Senior Researcher Keldysh Institute of Applied Mathematics, Russian Academy of Sciences 4, Miusskaya sqare, 125047, Moscow, Russia, Professor of Informatics and Software Engineering Department Bryansk State Technical University 7, 50 let Oktyabrya blvd., 241035, Bryansk, Russia, e-mail: [email protected]
ORCID: 0000-0003-4221-7710 Aleksandr G. Podvesovskii Cand. Tech. Sc., Associate Professor Head of Informatics and Software Engineering Department К.т.н., доцент, заведующий кафедрой «Информатика и программное обеспечение»
Bryansk State Technical University 7, 50 let Oktyabrya blvd., 241035, Bryansk, Russia, e-mail: [email protected]
ORCID: 0000-0002-1118-3266 Dmitrii G. Lagerev
Cand. Tech. Sc., Associate Professor of Informatics and Software Engineering Department
Bryansk State Technical University 7, 50 let Oktyabrya blvd., 241035, Bryansk, Russia, e-mail: [email protected]
ORCID: 0000-0002-2702-6492
Abstract. The article deals with problem of heterogeneous multivariate data analysis in multi-sensor systems. The structure of data analysis process in various levels of their representation is described, and the role of visual analytics and cognitive modeling as a basis for its realization is discussed. A review of present methods of visual analytics and
cognitive modeling is provided, and the actual lines of development of these approaches are specified.
Keywords: data analysis, heterogeneous data, multi-sensor systems, visualization, visual analytics, cognitive modeling.
References
1. Avdeeva Z.K., Kovriga S.V., Makarenko D.I. Kognitivnoe modelirovanie dlja reshenija zadach upravlenija slabostrukturirovannymi sistemami (situacijami) [Cognitive Modeling for Solving Problems of Control of Semi-structured Systems (Situations)] // Upravlenie bol'shimi sistemami = Large Systems Control. 2007. Issue 16. Pp. 26-39. (in Russian)
2. Avdeeva Z.K., Gorelova G.V., Kovriga S.V., Pankratova N.D. Ugrozy bezopasnosti me-gapolisa, kognitivnoe modelirovanie [Security Threats of a Megacity] // Sistemnye issledovanija i informacionnye tehnologii = System Researches and Information Technologies. 2014. no. 4. Pp. 10-22. (in Russian)
3. Averchenkov V.I., Kozhukhar V.M., Podvesovskii A.G., Sazonova A.S. Monitoring i prognozirovanie regional'noj potrebnosti v specialistah vysshej nauchnoj kvalifikacii [Monitoring and Forecasting of Regional Demand for Specialists of the Higher Scientific Qualification]: monograph. Bryansk: Bryansk State Technical University. 2010. 163 p. (in Russian)
4. Anokhina M.E. Modelirovanie strategii upravlenija jekonomicheskim rostom sel'skogo hozjajstva [Modeling Strategy for Management of Economic Growth of Agriculture]. Part 1 // Jekonomika sel'skohozjajstvennyh i pererabatyvajushhih predprijatij = Economy of agricultural and processing enterprises. 2019. no. 2. Pp. 23-34. (in Russian).
5. Anokhina M.E. Modelirovanie strategii upravlenija jekonomicheskim rostom sel'skogo hozjajstva [Modeling Strategy for Management of Economic Growth of Agriculture]. Part 2 // Jekonomika sel'skohozjajstvennyh i pererabatyvajushhih predprijatij = Economy of agricultural and processing enterprises. 2019. no. 3. Pp. 50-53. (in Russian)
6. Borisov V.V., Kruglov V.V., Fedulov A.S. Nechetkie modeli i seti [Fuzzy Models and Networks]. Moscow. Goryachaya Liniya - Telekom = Hot Line - Telecom. 2012. 284 p. (in Russian)
7. Galkin T.P., Grigoryeva M.A. (et al.) Primeneniye metodov vizual'noy analitiki dlya klasterizatsii i kategorizatsii zadach analiza i obrabotki dannykh eksperimentov v oblasti fiziki vysokikh energiy i yadernoy fiziki [An Application of Visual Analytics Methods to Cluster and Categorize Data Processing Jobs in High Energy and Nuclear Physics Experiments] // Nauchnaya vizualizatsiya = Scientific Visualization. 2018. Vol. 10 (5). Pp. 32-44. (in Russian)
8. Erokhin D.V., Lagerev D.G., Laricheva E.A., Podvesovskii A.G. Strategicheskoe upravlenie innovacionnoj dejatel'nost'ju predprijatija [Strategic Management of Innovation Activity of Enterprise]: monograph. Bryansk: Bryansk State Technical University. 2010. 196 p. (in Russian)
9. Zakharova A.A., Korostelyov D.A., Fedonin O.N. Algoritmy vizualizatsii dlya fil'tratsii mnogokriterial'nykh al'ternativ [Visualization Algorithms for Multi-criteria Alternatives
Filtering] // Nauchnaya vizualizatsiya = Scientific Visualization. 2019. Vol. 11 (4). Pp. 6680. (in Russian)
10. Zakahrova A.A., Pak A. Ya., Shklyar A.V., Pak T.A. Vizual'no-kognitivnyj analiz mnogomernyh dannyh dlja harakteristiki metallo-matrichnyh kompozitov [Visual and Cognitive Analysis of Multidimensional Data for Description of Metal Matrix Composites AL/SIC] // Svetotekhnika = Light & Engineering. 2018. no 6. Pp. 58-65. (in Russian)
11. Zakahrova A.A., Podvesovskii A.G. Tehnologija analiza slaboformalizovannyh dannyh mul'tisensornyh sistem s primeneniem metodov raspredelennoj jekspertizy [Technology for Analysis of Ill-formalized Data in Multi-sensor Sytems with Application of Distributed Expertise Methods] // Trudy Mezhdunar. nauch. konf. po fiziko-tehnicheskoj informatike CPT2018 = Proceedings of International Scientific Conference on Computing for Physics and Technology CPT2018. Moscow-Protvino. Institute of Computing for Physics and Technology. 2018. Pp. 221-229 (in Russian).
12. Zakharova A.A., Shklyar A.V. Osnovnye principy postroenija vizual'nyh modelej dannyh na primere interak-tivnyh sistem trehmernoj vizualizacii [Basic Principles of Data Visual Models Construction, by the Example of Interactive Systems for 3D Visualization] // Nauchnaya vizualizatsiya = Scientific Visualization. 2014. Vol. 6 (2). Pp. 62-73. (in Russian)
13. Zakharova A.A., Vekhter E.V., Shklyar A.V. Metodika reshenija zadach analiza dannyh pri ispol'zovanii analiticheskih vizual'nyh modelej [Methods of Solving Problems of Data Analysis Using Analytical Visual Models] // Nauchnaya vizualizatsiya = Scientific Visualization. 2017. Vol. 9 (4). Pp. 78-88 (in Russian).
14. Zakharova A.A., Shklyar A.V. Metafory vizualizacii [Visualization Metaphors] // Nauchnaya vizualizatsiya = Scientific Visualization. 2013. Vol. 5 (2). Pp. 16-24. (in Russian)
15. Kondrashina O.N., Anokhina M.E. Ispol'zovanie nechetkih kognitivnyh kart v ocenke kachestva jekonomicheskogo rosta otdel'noj otrasli [Using of Fuzzy Cognitive Maps in Quality Assessment of Economic Growth of Separate Sector] // Jekonomika i predprinimatel'stvo = Journal of Economy and entrepreneurship. 2017. no. 5-1. Pp. 896-899. (in Russian)
16. Kopeliovich D.I., Podvesovskii A.G., Safonov A.L., Vilyukha A.V., Isaev R.A. Primenenie nechetkih kognitivnyh modelej v avtomatizacii proektirovaniya tekhnologicheskoj osnastki [Application of Fuzzy Cognitive Models in Computer-Aided Production Tooling Design] // Vestnik komp'yuternyh i informacionnyh tekhnologij = Herald of Computer and Information Technologies. 2018. no. 3. Pp. 20-35. (in Russian)
17. Kulinich A.A. Komp'yuternyye sistemy modelirovaniya kognitivnykh kart: podkhody i metody [Computer systems for cognitive maps simulation: Approaches and methods] // Problemy upravleniya = Automation and Remote Control. 2012. Vol 73 (9). Pp. 1553-1571. (in Russian)
18. Mel'nik M.S., Orekhov V.D., Prichina O.S. Modelirovanie tendencij i zakonomernostej trudovoj dejatel'nosti v Rossii: kognitivnyj podhod [Simulation of Trends and Legislation of Labor Activities in Russia: Cognitive Approach] // Problemy jekonomiki i juridicheskoj praktiki = Economic problems and legal practice. 2018. no. 3. Pp. 94-101. (in Russian)
19. Namiot D.E., Romanov V.Yu. 3D vizualizatsiya arkhitektury i metrik programmnogo obespecheniya [3D visualization of architecture and software metrics] // Nauchnaya vizualizatsiya = Scientific Visualization. 2018. T. 10. № 5. Pp. 123-139. (in Russian)
20. Podvesovsky A.G., Titarev D.V., Isaev R.A. Nechetkiye kognitivnyye modeli v zadachakh analiza i planirovaniya programmnykh proyektov [Fuzzy cognitive models in the problems of analysis and planning of software projects] // Vestnik komp'yuternyh i informacionnyh tekhnologij = Herald of Computer and Information Technologies. 2019. № 8. Pp. 22-31. (in Russian)
21. Podgorskaya S.V., Podvesovsky A.G., Isaev R.A., Tarasov A.S., Bakhmatova G.A. Modelirovaniye stsenarnogo razvitiya sel'skikh territoriy na osnove nechetkoy kognitivnoy modeli [Modeling the scenario development of rural areas based on a fuzzy cognitive model] // Problemy upravleniya = Automation and Remote Control. 2019. № 5. Pp. 49-59. (in Russian)
22. Romanova I.K. Sovremennyye metody vizualizatsii mnogomernykh dannykh: analiz, klassifikatsiya, realizatsiya, prilozheniya v tekhnicheskikh sistemakh [Modern methods of visualization of multidimensional data: analysis, classification, implementation, applications in technical systems] // Nauka i obrazovaniye: nauchnoye izdaniye MGTU im. N.E. Baumana = Science and Education of Bauman MSTU. 2016. № 3. Pp. 133-167. (in Russian)
23. Silov V.B. Prinyatiye strategicheskikh resheniy v nechetkoy obstanovke [Making strategic decisions in a fuzzy environment]. Moscow. INPRO-RES = Publishing house "INPRO-RES". 1995. 228 p. (in Russian)
24. Groumpos P. Why Model Complex Dynamic Systems Using Fuzzy Cognitive Maps? // Robot Autom Eng J, 2017, Vol. 1(3): RAEJ.MS.ID.555563.
25. Dill J. et al. (Eds.) Expanding the Frontiers of Visual Analytics and Visualization // Springer-Verlag London Limited, 2012.
26. OrthoMCL DB: Ortholog Groups of Protein Sequences. Available at: https://orthomcl.org/orthomcl/ (accessed 10.11.2019)
27. Podvesovskii A.G., Gulakov K.V., Dergachyov K.V., Korostelyov D.A., Lagerev D.G. The choice of parameters of welding materials on the basis of fuzzy cognitive model with neural network identification of nonlinear dependence // Proceedings of 2015 International Conference on Mechanical Engineering, Automation and Control Systems (MEACS). IEEE Catalog Number: CFP1561Y-ART. Pp. 02-38-NSAP.
28. Tricoche X., Garth C. Topological Methods for Visualizing Vortical Flows // Mathematical Foundations of Scientific Visualization, Computer Graphics, and Massive Data Exploration. Springer-Verlag. 2009. Pp.89-108.
29. TriTryp DB: Kinetoplastid Gemomic Resource. Available at: https://tritrypdb.org/tritrypdb/ (accessed 10.11.2019)
30. Tukey J.W. The future of data analysis // Annals of Mathematical Statistics. 1962. Vol. 33.
№ 1. Pp. 1-67.