Научная статья на тему 'Актуализация данных в системах мониторинга сложных объектов с использованием информационных метрик'

Актуализация данных в системах мониторинга сложных объектов с использованием информационных метрик Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
226
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ИНФОРМАЦИИ / DATA ANALYSIS / ИНФОРМАЦИОННЫЙ ФИЛЬТР / INFORMATION FILTER / МОНИТОРИНГ СЛОЖНЫХ ОБЪЕКТОВ / COMPLEX OBJECTS MONITORING / ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ / SIMULATION / ЭНТРОПИЯ / ENTROPY / БОЛЬШИЕ ДАННЫЕ / BIG DATA / СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / DECISION SUPPORT SYSTEM / ВИЗУАЛИЗАЦИЯ / VISUALIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шишкин Юрий Евгеньевич

В статье анализируется проблема выбора стратегии по актуализации матрицы наблюдений при выполнении мониторинга сложного объекта, число наблюдаемых параметров которого достаточно велико и не позволяет учитывать весь объем поступающих данных. Выбор стратегии по учету и накоплению новых, более актуальных наблюдений над изучаемыми объектами рассматривается как функция информационного фильтра, воздействующая на процесс анализа информации субъектами принятия решений, что повышает эффективность и качество управления. Вводится понятие информационного ресурса как необходимого компонента для обеспечения эффективной управленческой деятельности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Актуализация данных в системах мониторинга сложных объектов с использованием информационных метрик»

АКТУАЛИЗАЦИЯ ДАННЫХ В СИСТЕМАХ МОНИТОРИНГА СЛОЖНЫХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ

ИНФОРМАЦИОННЫХ МЕТРИК Шишкин Ю. Е. Email: [email protected]

Шишкин Юрий Евгеньевич — аспирант, кафедра информационных технологий и компьютерных систем, Севастопольский государственный университет, г. Севастополь

Аннотация: в статье анализируется проблема выбора стратегии по актуализации матрицы наблюдений при выполнении мониторинга сложного объекта, число наблюдаемых параметров которого достаточно велико и не позволяет учитывать весь объем поступающих данных. Выбор стратегии по учету и накоплению новых, более актуальных наблюдений над изучаемыми объектами рассматривается как функция информационного фильтра, воздействующая на процесс анализа информации субъектами принятия решений, что повышает эффективность и качество управления. Вводится понятие информационного ресурса как необходимого компонента для обеспечения эффективной управленческой деятельности.

Ключевые слова: анализ информации, информационный фильтр, мониторинг сложных объектов, имитационное моделирование, энтропия, Большие Данные, система поддержки принятия решений, визуализация.

DATA UPDATING IN COMPLEX OBJECT MONITORING SYSTEMS USING INFORMATION METRICS Shishkin Yu. E. Email: [email protected]

Shishkin Yurij Evgenevich — postgraduate, INFORMATION TECHNOLOGY AND COMPUTER SYSTEMS DEPARTMENT, SEVASTOPOL STATE UNIVERSITY, SEVASTOPOL

Abstract: the article analyzes the strategy choosing problem for observation matrix updating when complex object performance monitoring is executed and monitored parameters number is quite large, so it does not allow taking into account the entire volume of the incoming data. Strategy Selection of accounting and the accumulation of new, more recent observations of the object are considered as a function of information filter, acting on information analysis process of decision-making entities, which increases the efficiency and management quality. The concept of information resource had been introduced as a necessary component for the effective management activities.

Keywords: data analysis, information filter, complex objects monitoring, simulation, entropy, Big Data, decision support system, visualization.

УДК 004.6:[004.414.23:007.51] DOI: 10.20861/2304-2338-2017-88-001

На сегодняшний день процесс мониторинга предполагает осуществление систематического сбора информации об интересующих исследователя параметрах исследуемой системы с целью прогнозирования их изменения при воздействии на систему и выявления тенденций изменения и сезонности ключевых параметров. Весь объем информации, хранящийся в базах данных всего мира, можно трактовать как разновидность накапливаемого ресурса, вследствие того, что информация осуществляет нормальное функционирование информационной системы и обеспечивает ее развитие. Весь объем данных накопленный по конкретной предметной области знаний, который является необходимым и достаточным для эффективной работы системы поддержки принятия решений, можно представить в виде ресурса Больших Данных [1-2].

Целью исследования является разработка математической модели и реализующей ее программы, информационного фильтра, алгоритма принятия решений по актуализации матрицы наблюдений сложного объекта как компоненты составляющей актуальный, полный и достоверный информационный ресурс и являющийся принципиально необходимым для функционирования системы принятия решений. Концептуальная схема ключевых компонентов программной системы анализа и поддержки принятия решений представлена на рисунке 1.

Рис. 1. Ключевые компоненты программной системы анализа и поддержки принятия решений

Реализация процесса актуализации матрицы наблюдений может производиться среди предложенных сценариев:

- расширить границы матрицы наблюдений и внести новые данные;

- заменить старый участок матрицы наблюдений на актуальный;

- принять решение игнорировать поступившие данные, так как не было получено ничего нового об объекте мониторинга.

Для достижения цели были поставлены следующие задачи:

- изучить существующие информационные фильтры и подходы к решению задачи;

- построить модели принятия решений по актуализации матрицы наблюдений с целью осуществления последующего выбора наилучшего информационного фильтра на основе экспериментальных исследований.

Выдвигается рабочая гипотеза об эффективности применения информационной меры Кульбака, Колмогорова и энтропии как количественной метрики, определяющей выбор сценария по актуализации данных матрицы наблюдений с целью достижения оптимальной частоты осуществления съема данных и достаточного объема измерений, обоснованно делающей их более информативными. Производится сравнение эффективности используемых критериев при априорно известном поведении изучаемого объекта [3-4]. Под эффективностью критериев понимается факт обнаружения искусственно созданных изменений в параметрах объекта [5-6]. Создается моделирующая программа, с достаточной степенью достоверности отражающая поведение изучаемого объекта, задается тренд и динамика изменения его параметров, делается вывод об оправданности построенной гипотезы [7-8].

Понятие информации как ресурса для функционирования системы принятия решений (системы управления) в общем случае может быть сформулировано как набор сведений об объектах управляемой системы, их параметрах, свойствах и текущем состоянии, которые уменьшают степень неопределенности и неполноты знаний, и как мера структурированности отношения, взаимодействия и связи между наблюдаемыми параметрами, а в случае одностороннего управляющего воздействия характеризуют меру и качество обратной связи между субъектом и объектом управления. Ценность информационного ресурса раскрывается в процессе принятия решения на верхнем уровне системы принятия решений, индивидуальном и профессиональном уровне консультанта, эксперта, лица, принимающего решение [9-10]. Высокая степень информированности ЛПР актуальной, полной и достоверной (истинной) информацией обеспечивает повышение качества принимаемых решений вследствие снижения неопределенности и риска. Понятие истинной информации в терминологии теории информации следует понимать, как метрику качества, надежности, а ложность как форму помех процесса управления.

Ценность информационного ресурса для лица, принимающего решение, определяется потребностями системы принятия решения, параметров объекта управления, внешних неопределенностей и эффективностью для управленческой деятельности [11-12]. Количественные и качественные метрики информационного ресурса определяются его полнотой, актуальностью, достоверностью, охватом всего спектра интересующих проблем, регулярностью сбора с определенной периодичностью и в необходимых объемах [13-14].

Понятие информационного фильтра следует понимать, как метод оптимизации информационного обмена по каналам связи, изолирующий систему принятия решения и лицо,

принимающее решения от избыточной или недостоверной информации обеспечивая оперативное поступление требуемой информации. Процесс введения и оптимизации информационного фильтра ставит конечной целью повышение качества диспетчеризации и обработки данных, поступающих в систему, на основании сопоставления их с заранее сформулированным набором независимых критериев [15-16]. Под оптимальной работой информационного фильтра понимают обеспечение следующих функций:

- оперативная передача значимых данных по каналам связи в матрицу наблюдений;

- корректная диспетчеризация поступающих потоков данных в соответствии с функциональным назначением методов анализа;

- принятие решения по актуализации матрицы наблюдений, обеспечивающее максимизацию показателей метрик качества.

Под некорректной (аномальной) работой информационного фильтра понимают возникновение препятствия нормальному распространению информационных потоков по компонентам системы принятия решений, выражающееся в игнорировании поступающих значимых данных в матрицу наблюдений или внесении в нее значений, вызванных незначимыми стохастическими флуктуациями в наблюдаемой системе, приводящее к неоптимальному протеканию процессов сбора, обработки, накопления, хранения, поиска, распределения и распространения данных в системе принятия решений. Описанное явление работы, функционально противоположное работе информационного фильтра, является информационным барьером. Такие барьеры возникают в процессе передачи данных по каналам связи от источника информации к приемнику. Согласно [17], «передача информации, без которой невозможно использование ее, осуществляется по самым различным каналам связи. Общая схема такой передачи предусматривает источник и передатчик информации - с одной стороны, и, соответственно приемник с адресатом - с другой стороны канала связи, а также источник шума, искажающий в какой-то мере передаваемое сообщение». Используя данную терминологию, опишем аномальную работу информационного фильтра как источник шума, искажающий внешние и внутренние информационные потоки. Под внешними информационными потоками следует понимать процесс передачи данных между объектом управления: системой сбора данных мониторинга, обработки, хранения и поиска информации и управляемой системой. Внутренние потоки требуются для организации внутренней обратной связи, актуализации и редукции матрицы наблюдений используя уже имеющимися в ней данные, что следует понимать как процесс дедупликации и оптимизации матрицы наблюдений, уменьшающий ее размерность, но не приводящий к потерям существенных и значимых для принятия оптимальных решений данных.

Реализация

Концептуально, математическая модель работы рассматриваемой системы может быть проинтерпретирована в виде системы массового обслуживания (СМО), представленной на рисунке 2.

Рассматриваемый процесс включает генерирование, распределение, анализ, обработку и удаление поступающих заявок [17-18].

запуск -

генератор 1

инициализация X]

генератор 2

инициализация Х^ —

генератор 4

инициализация Х4 —

запись в постоянную базу данных

1 V

1 г

очередь уничтожить заявку

J

запись в ВБД игнорировать данные

Рис. 2. Концептуальная схема работы СМО и системы мониторинга

Экспериментальные исследования эффективности рассматриваемых метрик, как меры, определяющей принимаемые решения, производятся на модели, схема которой приведена на рисунке 3.

Рис. 3. Схема модели СМО, построенная в системе моделирования

При запуске модели, пользователь определяет, какой информационной метрикой будет пользоваться система принятия решений при выборе значимых данных и распределении заявок между матрицами наблюдений.

Произведем запуск модели со значениями наблюдаемой случайной величины, имеющими нормальное распределение, коэффициентом сдвига /л = 5 и коэффициентом масштаба а = 5 , процесс моделирования представлен на рисунке 4.

Рис. 4. Графический интерфейс процесса моделирования

При варьировании метрик, базирующихся на информационных мерах Кульбака, Колмогорова и энтропии система принятия решения корректно производила распределение записей поступающих заявок между матрицами значимых и незначимых данных. Для того чтобы произвести более полное сравнение качества рассмотренных метрик необходимо разработать метрики качества более высокого уровня, позволяющие определять факт наличия возмущения в параметрах наблюдаемой многопараметрической сложной системы, выявлять ошибки первого и второго рода.

Заключение

Оптимизация процесса мониторинга сложных многопараметрических систем является крайне трудоемкой задачей, требующей как высокой квалификации осуществляющего ее эксперта, так и значительных вычислительных ресурсов. В случае, когда объект

мониторинга проявляет статичность параметров целесообразно произвести построение информационных метрик, с высокой степенью достоверности выявляющих значимые изменения в векторе наблюдаемых параметров с учетом их динамической изменчивости. В работе предложена модель системы взаимодействия объекта и субъекта мониторинга в виде СМО, с использованием дискретно-событийной имитационной модели и системы метрик, базирующихся на информационных мерах Кульбака, Колмогорова и энтропии. Эффективность рассматриваемых метрик экспериментально подтверждена в разработанной программной системе.

Список литературы / References

1. Скатков А. В., Шишкин Ю. Е., Николаева Ю. П. Имитационная модель взаимодействия триады агентов облачной вычислительной среды «Потребитель - Брокер - Провайдер» // Информационные технологии и управление: сб. науч. тр., 2015. Т. 1. № 1. С. 114-119.

2. Шишкин Ю. Е. Визуальный анализ Больших Данных с применением познавательных паттернов // Проблемы современной науки и образования, 2017. № 2 (84). С. 24-26.

3. Скороход Б. А., Фатеев С.И. Математическое моделирование и прогноз движения цели // Интеллектуальные системы, управление и мехатроника-2016: материалы Всерос. науч.-техн. конфер. молодых ученых, аспирантов и студентов. Севастополь: СевГУ, 2016. С. 264-267.

4. Сергеев Д. А. Энтропийные параметры структурных моделей систем // Наука, техника и образование, 2016. № 3 (21). С. 102-105.

5. Шишкин Ю. Е. Облачные сервисы в системах поддержки принятия решений // Научный журнал, 2017. № 1 (14). С. 19-20.

6. Неменко А. В., Никитин М. М. Оптимизация уравновешивания главного привода стана холодной прокатки труб // Ceteris Paribus, 2015. № 1. С. 26-31.

7. Греков А. Н., Шишкин Ю. Е. Моделирование трехкомпонентного акустического измерителя скорости течения // Системы контроля окружающей среды. Севастополь: ИПТС, 2016. № 6 (26). С. 33-40.

8. Шишкин Ю. Е. Анализ моделей взаимодействия пользователей и провайдеров облачных сервисов // Интеллектуальные системы, управление и мехатроника - 2016: материалы всерос. науч.-техн. конфер. молодых ученых, аспирантов и студентов. Севастополь 19-21 мая 2016 г. Севастополь: СевГУ, 2016. С. 289-293.

9. Гребнева Е. А., Мельников В. В., Пасынков М. А. Программа для обработки и анализа биофизических данных // Системы контроля окружающей среды, 2015. № 2 (22). С. 102-110.

10. Шишкин Ю. Е., Греков Н. А. Исследование систем управления высокоточными измерениями // Интеллектуальные системы, управление и мехатроника-2015: материалы междунар. науч.-техн. конфер. молодых ученых, аспирантов и студентов. Севастополь: СевГУ, 2015. С. 221-225.

11. Shishkin Y. E. Big Data visualization in decision making // Science in Progress: тез. Всерос. науч.-практ. конфер. магистрантов и аспирантов / Новосибирск: НГТУ, 2016. C. 203-205. ISBN 978-5-7782-3094-1.

12. Неменко А В., Никитин М. М.Оценка динамических характеристик грузоподъемной системы // Фундаментальные и прикладные проблемы техники и технологии, 2016. № 3 (317). С. 25-33.

13. Ломовская Е. В., Алешкова Е. Н. Автоматизированное проектирование трехмерных геометрических моделей // Наука, техника и образование, 2015. № 4 (10). С. 69-73.

14. Неменко А. В., Никитин М. М. Оценка вероятности разрушения детали с усталостной трещиной // Фундаментальные и прикладные проблемы техники и технологии, 2016. № 3 (317). С. 34-39.

15. Скатков А. В., Брюховецкий А. А., Шишкин Ю. Е. Сравнительный анализ методов обнаружения изменений состояний сетевого трафика // Автоматизация и приборостроение: проблемы, решения: материалы междунар. науч.-техн. конфер. Севастополь: СевГУ, 2016. С. 14-15.

16. Синегубов С. В. Использование различных моделей для расчета систем массового обслуживания с повторными вызовами // Наука, техника и образование, 2015. № 10 (16). С. 52-55.

17. Шеннон К. Работы по теории информации и кибернетике. М., 1963. С. 245.

18. Шишкин Ю. Е., Скатков А. В. Решение задачи составления расписаний большой размерности с применением технологии Больших Данных // Информационные технологии и информационная безопасность в науке, технике и образовании «ИНФОТЕХ - 2015»: материалы междунар. науч.-техн. конфер. Севастополь: СевГУ, 2015. С. 103-105.

19. Бирюкова М. А., Мельников В. В., Пасынков М. А. Программное обеспечение для хранения и обработки океанологических данных прибора ИСТ-1М // Системы контроля окружающей среды, 2015. № 1 (21). С. 33-39.

i Надоели баннеры? Вы всегда можете отключить рекламу.