Научная статья на тему 'Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов'

Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
647
119
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛИРОВАНИЕ СИСТЕМ / КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ / СИСТЕМА МОНИТОРИНГА / АНАЛИЗ ДАННЫХ / МЧС РОССИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Белоусов Роман Леонидович, Сороковой Никита Константинович, Моторков Антон Александрович

Онлайновые социальные сети помимо выполнения функций поддержки общения, обмена мнениями и получения информации их членами, в последнее время все чаще становятся объектами и средствами информационного управления и ареной информационного противоборства. В недалеком будущем они неизбежно станут существенным инструментом информационного влияния, в том числе в целях манипулирования личностью, социальными группами и обществом в целом, а также, наверное, полем информационных войн [1]. Факторы информационного воздействия на население создают реальную угрозу РФ в сфере информационной безопасности. МЧС России в такой ситуации не является исключением и также подвергается информационному воздействию. В частности, злоумышленники могут искажать реальную ситуацию и последствия чрезвычайных ситуаций, что порождает недоверие к органам власти и ведет к дискредитации деятельности спасателей. Актуальность обеспечения информационной безопасности подтверждается словами Министра МЧС России В.А. Пучкова: "… "малейший вброс" непроверенной информации создает службам, отвечающим за защиту и безопасность, серьезные проблемы" [6]. Подтверждением этих слов может служить чрезвычайная ситуация летом 2012 г. во время катастрофического затопления в г. Крымске, на фоне которой развернулась настоящая "информационная война". Итогом той войны явилось: искажение фактов о чрезвычайной ситуации, так например, по официальным данным количество погибших приближалось к 200 чел. [3], а по отдельным сообщениям от 11 июля 2012 г. со ссылкой на неофициальные источники, число погибших могло достигать 2500 чел. [5, 4]; недоверие населения к действиям спасателей, которых обвиняли в пассивности и др. Таким образом, для обеспечения работы подразделений МЧС России необходимо проводить круглосуточный мониторинг и анализ данных средств массовой информации, данных блогосферы, социальных медиа и других интернет-ресурсов. Для решения подобных задач необходимо создавать информационные системы, предназначенные для выявления в СМИ и социальных медиа в режиме реального времени основных информационных поводов и трендов, информационных атак, аномальную активность по тем или иным темам, выявлять первоисточники распространения информации. Описана проблематика воздействия на население различных информационных интернет-ресурсов. Это служит основной предпосылкой создания системы мониторинга и анализа данных (СМАД) подобных источников информации. Для разработки информационной системы СМАД была построена концептуальная модель системы в операторном виде, где каждый оператор представляет собой черный ящик с заданными входными данными и выходным результатом. Концептуальная модель позволяет получить системное представление об исследуемой системе и вести ее разработку независимыми разработчиками. Последнее свойство концептуальной модели достигается за счет того, что все элементы системы представлены черными ящиками, а связь между ними определяется только входными и выходными данными.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Белоусов Роман Леонидович, Сороковой Никита Константинович, Моторков Антон Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов»

КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ СИСТЕМЫ МОНИТОРИНГА И АНАЛИЗА ДАННЫХ ИНТЕРНЕТ-РЕСУРСОВ

Белоусов Роман Леонидович,

к.т.н., научный сотрудник, ФГБОУ ВПО "Академия гражданской защиты МЧС России", Московская область, г.о. Химки, Россия, romabel-87@mail.ru

Сороковой Никита Константинович,

оператор, ФГБОУ ВПО "Академия гражданской защиты МЧС России", Московская область, г.о. Химки, Россия, nixl@ya.ru

М°т°рк°в Антон Александрович, Ключевые слова: моделирование систем,

оператор, ФГБОУ ВПО "Академия гражданской защиты МЧС концептуальная модель, система мониторинга,

России", Московская область, г.о. Химки, Россия, анализ данных, МЧС России.

ontoshka777@gmail.com

Онлайновые социальные сети помимо выполнения функций поддержки общения, обмена мнениями и получения информации их членами, в последнее время все чаще становятся объектами и средствами информационного управления и ареной информационного противоборства. В недалеком будущем они неизбежно станут существенным инструментом информационного влияния, в том числе в целях манипулирования личностью, социальными группами и обществом в целом, а также, наверное, полем информационных войн [1]. Факторы информационного воздействия на население создают реальную угрозу РФ в сфере информационной безопасности. МЧС России в такой ситуации не является исключением и также подвергается информационному воздействию.

В частности, злоумышленники могут искажать реальную ситуацию и последствия чрезвычайных ситуаций, что порождает недоверие к органам власти и ведет к дискредитации деятельности спасателей. Актуальность обеспечения информационной безопасности подтверждается словами Министра МЧС России В.А. Пучкова: "... "малейший вброс" непроверенной информации создает службам, отвечающим за защиту и безопасность, серьезные проблемы" [6]. Подтверждением этих слов может служить чрезвычайная ситуация летом 2012 г. во время катастрофического затопления в г. Крымске, на фоне которой развернулась настоящая "информационная война". Итогом той войны явилось: искажение фактов о чрезвычайной ситуации, так например, по официальным данным количество погибших приближалось к 200 чел. [3], а по отдельным сообщениям от 11 июля 2012 г. со ссылкой на неофициальные источники, число погибших могло достигать 2500 чел. [5, 4]; недоверие населения к действиям спасателей, которых обвиняли в пассивности и др. Таким образом, для обеспечения работы подразделений МЧС России необходимо проводить круглосуточный мониторинг и анализ данных средств массовой информации, данных блогосферы, социальных медиа и других интернет-ресурсов. Для решения подобных задач необходимо создавать информационные системы, предназначенные для выявления в СМИ и социальных медиа в режиме реального времени основных информационных поводов и трендов, информационных атак, аномальную активность по тем или иным темам, выявлять первоисточники распространения информации. Описана проблематика воздействия на население различных информационных интернет-ресурсов. Это служит основной предпосылкой создания системы мониторинга и анализа данных (СМАД) подобных источников информации. Для разработки информационной системы СМАД была построена концептуальная модель системы в операторном виде, где каждый оператор представляет собой черный ящик с заданными входными данными и выходным результатом. Концептуальная модель позволяет получить системное представление об исследуемой системе и вести ее разработку независимыми разработчиками. Последнее свойство концептуальной модели достигается за счет того, что все элементы системы представлены черными ящиками, а связь между ними определяется только входными и выходными данными.

Для цитирования:

Белоусов РЛ., Сороковой Н.К., Моторков А.А. Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов // T-Comm: Телекоммуникации и транспорт. - 2015. - Том 9. - №10. - С. 50-54

For citation:

Belousov R.L., Sorokovoy N.K., Motorkov A.A. Conceptual model of monitoring system and data analysis of internet resources. T-Comm. 2015. Vol 9. No.10, рр. 50-54. (in Russian).

Из анализа структуры национальной безопасности, в части, касающейся деятельности МЧС России, следует, что целью исследования является создание системы мониторинга и анализа данных интернет-ресурсов (СМАД) для обеспечения деятельности МЧС России.

Для достижения поставленной цели необходимо решить следующие задачи-.

1. Разработка подсистемы сбора, обработки и хранения данных интернет-ресурсов.

2. Разработка подсистемы анализа данных интернет-ресурсов.

3. Разработка советующей системы подготовки официальных сообщений для средств массовой информации.

4. Разработка технологии формирования деловой репутации МЧС России среди пользователей сети Интернет.

Решение перечисленных задач предполагает создание единой ^¿кистемы мониторинга и анализа данных интернет-ресурсов (СМАД).

II. Структура системы мониторинга и анализа

данных интернет-ресурсов

На рис. 2 показан состав основных элементов системы мониторинга и анализа данных-интернет ресурсов.

Структура системы мониторинга и анализа данных интернет-ресурсов (СМАД) включает в себя четыре основных элемента.

1 элемент. Сбор, обработка и хранение данных интернет-ресурсов.

Под данными интернет-ресурсов понимаются текстовые сообщения, графический контент и формальные показатели, сопровождающие эти сообщения. Для социальных медиа также добавляются формальные показатели пользователей. Первый элемент системы представляет собой подсистему сбора, обработки и хранения данных интернет-ресурсов. Данный элемент собирает данные интернет-ресурсов по определенным параметрам и производит оценку различных показателей: оценка тональности, определение тематики сообщения, изображения, различные статистические показатели. Этот элемент заносит все данные в масштабируемое хранилище. Причем, в масштабируемое хранилище попадают не только те данные, которые соответствуют определенным параметрам (МЧС, Пучков, пожары и т.д.), но и данные, которые не соответствуют параметрам отбора (Шарли Эбдо, Брейвиг и т.д.). Такой подход позволит создать ретроспективные данные.

2 элемент. Анализ данных интернет-ресурсов.

Данный элемент предназначен для анализа данных

интернет-ресурсов с целью оценки информационного поля в части, касающейся МЧС России. Оценка информационного поля включает в себя: 1) оценку текущей информационной обстановки (негативная, позитивная, нарастает социальное напряжение, требуется вмешательство органов власти и т.д.) и 2) прогноз развития складывающейся обстановки под воздействием различных факторов.

3 элемент. Формирование сообщения для сети Интернет.

Данный элемент выполняет функцию системы поддержки принятия решений при формировании информационного поля МЧС России. Этот элемент системы выступает как советующая система, которая позволяет лицу, принимающему решения, сформировать информационную кампанию в СМИ и соц. медиа. Т.е. элемент помогает пользователю (оператору) сосредоточить свои усилия на том, что привлекает внимание интернет-сообщества.

4 элемент. Технология формирования информационного поля МЧС России в сети Интернет.

Данный элемент представляет собой комплекс согласованных действий по ведению информационного сообщения, полученного с помощью J-ro элемента системы. Это могут быть новости на телевидении, новости на порталах информационных агентств, ведение официальных аккаунтов социальных сетей и блогов и т.д.

III. Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов

Концептуальная модель представлена на рис. 3 и представляет собой теоретико-множественное описание системы в операторном виде и определяет элементный состав и структуру разрабатываемой системы, причинно-следственные связи ее элементов и взаимосвязи.

Концептуальная модель системы мониторинга и анализа данных интернет-ресурсов представлена в операторном виде и описывается следующим образом:

D: <rss х api х keywords> -4 DIR. - оператор, моделирующий сбор и предварительную обработку данных интернет-ресурсов (DIR), где:

- rss — семейство XML-форматов, предназначенных для описания лент новостей, анонсов статей, изменений в блогах и т. п.;

api - набор готовых классов, процедур, функций, структур и констант, предоставляемых приложением (библиотекой, сервисом) для использования во внешних программных продуктах;

- keywords - ключевые слова, темы, сущности (объекты), используемые для фильтрации сообщений;

- DIR -данные интернет-ресурсов.

S: <DIR х statmet> statistics - оператор, моделирующий обработку данных интернет-ресурсов различными математическими методами (stat.met) и получение различных статистических характеристик (statistics), где:

- stat.met - семейство математических методов для получения различных статистических характеристик исследуемых данных;

- statistics - различные статистические характеристики исследуемых данных.

ML1: <statistics х met.math.Hngl> —> sentanalysis ~ оператор, моделирующий обработку данных интернет-

ресурсов методами математическом лингвистики (met.math.Hngl) для получения оценки тональности текстовых сообщений (sent.anatysis), где:

- met.math.ling 1 — семейство методов математической лингвистики для оценки тональности текстовых сообщений;

- sent.anatysis - оценка тональности текстовых сообщений;

- expert: обучение - способность оператора к обучению (с учителем, без учителя).

ML2: statistics х met.math.Hng2> —* subject- оператор, моделирующий обработку данных интернет-ресурсов методами математической лингвистики (met.math.Hng2) для определения тематики, сущностей (объектов) в текстовых сообщениях (subject), где:

- met.math.Hng2 - семейство методов математической лингвистики для определения тематики, сущностей (объектов) в текстовых сообщениях;

- subject - тематика, сущность (объект) в текстовом сообщении;

- expert: обучение - способность оператора к обучению (с учителем, без учителя).

К: <subject х criteria 1> -*■ keyword- оператор, моделирующий поиск новых ключевых слов (keyword) по заданным критериям (criterial), где:

- criterial - семейство критериев (моделей), позволяющих выделять новые ключевые слова;

- keyword - ключевые слова, получаемые в процессе работы системы.

Т: <subject х criteria2> —► trend - оператор, моделирующий поиск новых информационных трендов, аномальной активности, информационных атак (trend) по заданным критериям (criteria2), где:

- criteria2 — семейство критериев (моделей), позволяющих определять информационные тренды в данных интернет-ресурсов;

- trend — информационные тренды в данных и нтернет-ресурсах.

Заключение

В ходе исследования была разработана концептуальная модель в операторном виде. При проектировании и разработке масштабируемых информационных систем концептуальная модель позволяет представить ИС в виде совокупности черных ящиков. Роль черных

ящиков играют абстрактные операторы, для которых важны входные данные и выходной результат.

Такой подход позволяет независимо вести разработку информационной системы различными разработчиками.

ЧГ

u~__

MU statistics x met math ling! —► sent analysis

rss x apt h eywords -* DIR

S OCR x stotm t -»statistics

fceynortft

expert: fiutms на

•expert обучение ■

HL2 statistics x met moth Iing2 -* subject

expert: обучение ■

К- subject x criterial -+ keyword *_

T: subject x criteria? -* trend

R: statistics x sent analysis x trend -»risk

S' trend x risk x statistics x criteria} -statement

finish -

F: statement x source x technology -

response **

Рис. 3. Концептуальная модель системы Литература

1. Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные сети: модели информационного влияния, управления и противоборства / Под ред. чл.-корр. РАН Д.А. Новикова. - 2-е изд., стереотипное. - М.; Издательство физико-математической литературы: МЦНМО, 2010. - 228 с.

2. http://cybe rten i n ка. ru/artic I e/n/zasch ita - n ase le n iya-s-territo ri у-р ri-chrezvychaynyh-situatsiyah-kak-sostavnaya-chsst-natsionalnoy-bezopasnosti-rossii/ [дата обращения: 02.06.2014].

3. http://ria.ru/danger/20120711/696670410.html [дата обращения: 02.06.2014].

4. h tt р://г u. w ikipedia.org/wiki/На вод иен ие_в_ Краен од а рском^ крае_(2012) [дата обращения: 02.06.2014].

5. http://www.nr2.ru/moskow/394716.html [дата обращения: 11.07.2012].

6. http;//www. security lab, г и/news/431132 .php/ [дата обращения: 02.06.2014].

CONCEPTUAL MODEL OF MONITORING SYSTEM AND DATA ANALYSIS

OF INTERNET RESOURCES

Roman Belousov, research associate, PhD in Technique.,Civil Defence Academy EMERCOM of Russia, Moscow region, Khimki, Russia, romabel-87@mail.ru Nikita Sorokovoy, operator, Civil Defence Academy EMERCOM of Russia, Moscow region, Khimki, Russia,

nixl@ya.ru

Anton Motorkov, operator, Civil Defence Academy EMERCOM of Russia, Moscow region, Khimki,

Russiaontoshka777@gmail.com

Abstract

The article describes the problems of the impact on the population of online resources information. This is the main reason to create system of monitoring and data analysis (SMAD). To develop an information system SMAD was designed a conceptual model of the system in the form of operator-valued, where each operator is a black box with the specified input data and output results. The conceptual model provides a systematic understanding of the system under study and development of its lead independent developers. The latter property of a conceptual model is achieved by the fact that all elements of the system are represented by black boxes and the connection between them is determined only by the input and output data.

Keywords: modeling systems, conceptual model, monitoring system, data analysis, Emercom of Russia. References

1. Gubanov D.A., Novikov D.A., Chhartishvili A.G. Social'nye seti: modeli informaci-onnogo vlijanija, upravlenija i protivoborst-va [Social Networks: Models of information influence, control and confrontation]. 2-e izd. Moscow. Izdatel'stvo fiziko-matematicheskoj literatury: MCNMO, 2010. 228 p. (in Russian)

2. http://cyberleninka.ru/article/n7zaschita-naseleniya-i-territoriy-pri-chrezvychaynyh-situatsiyah-kak-sostavnaya-chast-nat-sionalnoy-bezopasnosti-rossii/, viewed 2 June20l4.

3. http://ria.ru/danger/20l207ll/6966704l0.html, viewed 2 June 2014.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. http://ru.wikipedia.org/wiki/HaBOflHeHMe_B_KpacHOflapcKOM_Kpae_(20l2), viewed 2 June20l4.

5. http://www.nr2.ru/moskow/3947l6.html, viewed ll July 20l2.

6. http://www.securitylab.ru/news/43ll32.php/, viewed 2 June20l4.

Лучшая электроника для российского транспорта!

Электроника ^^щл1 2016

Деловая программа:

о Конференция «Информационные технологии - аффективный инструмент привлечения пассажиров и повышения качества их обслуживания-.

о Конференция для муниципальных администраций, операторов общественного транспорта, операторов платежных систем: "Современные технологии оплаты проезда и учета пассажиропотока".

о Семинар -Контрольно-диагностическое оборудование для обслуживания подвижного состава и транспортной инфраструктуры».

о Конференция «Электронные модули и компоненты для транспортного приборостроения и транспортных систем».

i Надоели баннеры? Вы всегда можете отключить рекламу.