Научная статья на тему 'Концептуальная модель программного комплекса мониторинга средств массовой информации в сети Интернет'

Концептуальная модель программного комплекса мониторинга средств массовой информации в сети Интернет Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
910
164
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОНИТОРИНГ ИНТЕРНЕТ СМИ / СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / СРЕДСТВА ИНФОРМАЦИОННОЙ ИНТЕГРАЦИИ / ОБЛАКО ТЕГОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Губарев И.Д., Курилкин А.В., Змиевский А.Ф.

Развитие средств массовой информации, в том числе основанных на технологии Web 2.0, оказывает существенное влияние на формирование эмоционально-психологического портрета общества. Развитие социальных интернет-сетей, таких как «Вконтакте», «Facebook», «LiveJournal», а также многих других, и их популяризация в последние годы среди населения обуславливает привлечение внимания социальных исследований и их программной поддержки в этой сфере. По этой причине сбор и анализ информации в сети Интернет является одним из видов социологических исследований, позволяющим обратить внимание на наиболее проблемные вопросы современного общества. Статистический материал в виде дополнительной информации, полученной в данных сетях, может быть использован для анализа и регионального развития. В данной статье рассматривается концепция сбора информации в сети Интернет с учетом разнородной структуры возможных источников информации, состав и структура которых подвержена изменениям. Сбор сведений в Интернет осуществляется по ключевым поисковым признакам в целях выявления и анализа наиболее проблемных тематик, а также и организации компенсационных или стимулирующих мер. Обсуждается проблема сбора и обработки информации, предоставляемой современными электронными средствами массовой информации (далее СМИ) и социальными сетями в Интернет. Статья содержит описание концептуальной модели программного комплекса, основной задачей которого является осуществление анализа подобных данных, их сбор и структуризация для последующей обработки системами поддержки принятия управленческих решений. Предоставлены некоторые графические материалы, представляющие общий подход к созданию таких систем и оценки результатов их деятельности. Описаны основные сложности, которые возникают при создании таких систем, и меры борьбы с ними.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Губарев И.Д., Курилкин А.В., Змиевский А.Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Концептуальная модель программного комплекса мониторинга средств массовой информации в сети Интернет»

1. Олейник П.П., программа для ЭВМ "Унифицированная среда быстрой разработки корпоративных информационных систем SharpArchitect RAD Studio", свидетельство о государственной регистрации № 2013618212 от 04 сентября 2013 г.

2. Олейник П.П. Иерархия классов метамодели объектной системы // Объектные системы -2012: материалы VI Международной научно-практической конференции (Ростов-на-Дону, 1012 мая 2012 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ ЮРГТУ (НПИ), 2012. -С. 37-40., http://obiectsvstems.ru/files/2012/Qbiect Systems 2012 Proceedings.pdf

3. Олейник П.П. Иерархия классов представления валидационных правил объектной системы //

Объектные системы - 2013: материалы VII Международной научно-практической

конференции (Ростов-на-Дону, 10-12 мая 2013 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ (ф) ЮРГТУ (НПИ), 2013. - С. 14-17.,

http://obiectsvstems.ru/files/2013/Obiect Systems 2013 Proceedings.pdf

4. Oleynik P.P. Domain-driven design the database structure in terms of metamodel of object system // Proceedings of 11th IEEE East-West Design & Test Symposium (EWDTS'2013), Institute of Electrical and Electronics Engineers (IEEE), Rostov-on-Don, Russia, September 27 - 30, 2013, pp. 469-472.

5. Олейник П.П. Элементы среды разработки программных комплексов на основе организации метамодели объектной системы // Бизнес-информатика. 2013. №4(26). - С. 69-76., http://biioumal.hse.ru/data/2014/01/16/1326593606/1BI%204(26)%202013.pdf

6. Олейник П.П. Предметно-ориентированное проектирование структуры базы данных в понятиях метамодели объектной системы // Объектные системы - 2014: материалы VIII Международной научно-практической конференции (Ростов-на-Дону, 10-12 мая 2014 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ (ф) ЮРГПУ (НПИ) им. М.И. Платова, 2014. - С. 41-46., http://obiectsystems.ru/files/2014/Qbiect Systems 2014 Proceedings.pdf

7. Oleynik P.P. Using metamodel of obiect system for domain-driven design the database structure // Proceedings of 12th IEEE East-West Design & Test Symposium (EWDTS’2014), Kiev, Ukraine, September 26 - 29, 2014, DOI: 10.1109/EWDTS.2014.7027052

8. Олейник П.П., Кураков Ю.И. Концепция создания обслуживающей корпоративной информационной системы экономического производственно-энергетического кластера // Прикладная информатика. 2014. №6. - С. 5-23.

9. Олейник П.П. Унифицированная модель тестирования инструментов разработки объектноориентированных приложений // Объектные системы - 2014 (Зимняя сессия): материалы IX Международной научно-практической конференции (Ростов-на-Дону, 10-12 декабря 2014 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ (ф) ЮРГПУ (НПИ) им. М.И. Платова, 2014. С. 23-32.,

http://obiectsystems.ru/files/2014WS/Obiect Systems 2014 Winter session Proceedings.pdf

УДК 004.42

КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ ПРОГРАММНОГО КОМПЛЕКСА МОНИТОРИНГА СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

Губарев Илья Дмитриевич, программист отдела разработки информационно-аналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-Петербург,

gubarev@iac.spb.ru

Курилкин Алексей Владимирович, начальник сектора отдела разработки информационноаналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-

Петербург, kurilkin@iac. spb. ru

Змиевский Александр Федорович, программист отдела разработки информационно-аналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-Петербург,

zmievskiy@iac. spb. ru

В последние несколько лет в России наблюдается все большее развитие СМИ в сфере Интернет, ввиду широкой доступности и динамичности обновления данных. На данный

114

момент в России зарегистрировано более 6435 СМИ, существенное количество которых обладает собственными официальными сетевыми ресурсами [1]. Стоит отметить, что данный процесс развивается на фоне общего роста популярности Интернет в России. В частности, по данным компании Яндекс, в Санкт-Петербурге за последний год количество Интернет-пользователей увеличилось на 6% и составило более 71% жителей города, а в Москве - 68% с годовым приростом в 4% [2]. Рост популярности не в последнюю очередь связан с бурным развитием социальных сетей [3, 4, 5]. В социальных сетях практически с самого момента их появления намечена тенденция объединения пользователей в виртуальные группы по различным критериям и интересам.

В связи с этим, информация, получаемая из современных Интернет-источников, представляет большой интерес для обработки и анализа с целью выявления проблемных сфер в развитии и состоянии общества, для последующей поддержки принятия управленческих решений и их исправления. На данный момент большинство систем подобного типа построено на обработке статической информации, формируется на основе трех основных источников:

1. Федеральная Служба Государственной Статистики [6];

2. ведомственная статистика Исполнительных Органов Государственной Власти (далее ИОГВ);

3. социологические опросы населения.

Очевидно, что Интернет представляет собой альтернативный источник данных, гораздо более динамичный, нежели перечисленные выше. Стоит отметить, что существующее множество решений для анализа данных социальных сетей и Интернет-СМИ предназначено для проведения маркетинговых исследований и выявления целевых аудиторий, например:

1. «Яндекс.Директ» [7];

2. «Google AdSense» [8];

3. «Bing Ads» [9].

В свою очередь, предварительно проведенный анализ показывает, что предоставляемые подобными системами средства программной интеграции (далее СПИ) могут быть использованы для построения программного комплекса мониторинга СМИ в сети Интернет для поддержки принятия управленческих решений.

Основной целью разработки данного комплекса является перспектива получения результатов анализа Интернет-СМИ и социальных сетей в качестве дополнительного источника информации для систем поддержки принятия управленческих решений руководством регионов России.

Рис. 1 - Совместное использование различных источников данных в системах поддержки принятия

управленческих решений

Для выполнения поставленной задачи необходимо провести следующие шаги:

115

1. подготовить обзорный перечень источников данных, включая поисковые Интернетсистемы и социальные сети, на основе СПИ которых разрабатываемый программный комплекс сможет находить интересующую информацию и получать к ней доступ;

2. разработать логическую и функциональную структуру модуля сбора данных, посредством использования СПИ выбранных источников;

3. разработать логическую и функциональную структуру модуля обработки полученных данных;

4. разработать и подготовить набор алгоритмов, необходимых для обработки полученных данных;

5. разработать логическую и функциональную структуру модуля структурирования и сохранения данных для их последующего использования.

На рисунке 2 приведена структурная схема разрабатываемого программного комплекса.

Рис. 2 - Структурная схема программного комплекса мониторинга СМИ в сети Интернет

В качестве клиента (рисунок 2, блок 1) может выступать как конкретный пользователь, так и другая информационная система. Генератор запросов (рисунок 2, блок 3) вырабатывает строго-типизированные обращения на основе сообщений, переданных клиентом в систему, и посредством диспетчера запросов (рисунок 2, блок 4) направляет их адаптер МСИ (рисунок 2, блок 5). Адаптер МСИ дополняет обращения информацией, полученной из модулей сетевой интеграции (рисунок 2, блок 6), и отправляет их в блок анализа данных (рисунок 2, блок 8). Анализатор, используя хранилище тэгов (рисунок 2, блок 9), вырабатывает утверждения на основе поступающих на вход обращений и передает их в модуль структуризации (рисунок 2, блок 10) для предварительной подготовки обработанных данных перед их сохранением в хранилище данных (рисунок 2, блок 11), включая их классификацию, ранжирование, вычисление агрегированных и базовой

116

статистики. Модуль визуализации (рисунок 2, блок 12) отправляет клиенту отчет, содержащий в себе общее представление упоминаний в Интернет-СМИ тегов заданной тематики. Стоит обратить внимание на то, что модуль анализа связан с генератором запросов, что позволяет ему самостоятельно создавать системные обращения для проведения более детального, вложенного анализа.

Основными сложностями на начальном этапе работы являются:

1. создание устойчивых модулей сетевой интеграции (далее МСИ) для сбора информации из Интернет-СМИ и социальных сетей, способных функционировать с различными средствами программной интеграции;

2. разработка методик анализа полученной информации и интеграции с показателями

социально-экономического развития общества в соответствии с Указом Президента РФ от 21.09.2012 N1199 [10];

3. реализация интегрированных программных компонент, предоставляющих

возможность обработки больших объемов гетерогенных данных.

В связи с увеличивающимся значением сети Интернет в жизни общества, а также со становлением ее в качестве одного из наиболее доступных и предпочитаемых гражданами средств коммуникации, становится очевидно, что для повышения качества принимаемых управленческих решений ИОГВ необходимо учитывать данные из Интернет-источников. Разрабатываемый программный продукт является важной частью в системе поддержки государственных решений, так как позволяет получить актуальный информационный срез на основе проанализированных им Интернет СМИ и социальных сетей. В результате его внедрения руководство регионов с активной интернет-аудиторией получит динамичный источник данных, отражающей информационную составляющую настроений населения.

В качестве результатов работы системы сбора информации предлагается график динамики упоминаний на рисунке 3.

Динамика упоминаний ■ lenta.ru

_____^^_________ ■ VK

Рис. 3 - Динамика упоминаний заданной темы

На нём отображена динамика упоминаний темы сообщений по заданным критериям за год начиная с 01.05.2014 до 01.05.2015 и имеющая агрегацию результатов (кол-во сообщений) за месяц. На графике отображены процентные значения кол-ва публикаций за выбранный период. Использованы три источника: Lenta.ru, ВКонтакте, Google+. Также в качестве результатов работы системы предлагается оценивать сообщения по эмоциональной окраске, и составлять также динамику эмоциональной окраски по заданной теме.

Литература

1. Количество печатных и Интернет средств массовой информации в России, http://www.redom.ru/news/183460

117

2. Развитие интернета в регионах России по данным компании «Яндекс», http://companv.vandex.ru/researches/reports/intemet regions 2012.xml

3. «Однокласники.ру» - социальная сеть для поиска одноклассников, коллег и знакомых в регионах России, СНГ и за рубежом, http://www.odnoklassniki.ru

4. «ВКонтакте» - поиск людей по их увлечениям, месту учебы и работы, персональным данным, http://www.vk.com

5. «Живой Журнал» - блог-платформа для ведения онлайн-дневников, http://www.liveioumal.com

6. Федеральная Служба Государственной Статистики, официальный Интернет ресурс: www.gks.ru

7. «Яндекс.Директ» - Размещение контекстной рекламы с разными видами привязки к поисковой выдаче Яндекса и на сайтах Рекламной сети, http://www.direct.vandex.ru

8. «Google AdSense» - сервис контекстной рекламы от компании Google, http://google.com/adsense

9. «Bing Ads» - сервис контекстной рекламы от компании Microsoft, https://secure.bingads.microsoft.com

10. Указ Президента РФ от 21.09.2012 N 1199 «Об оценке эффективности деятельности органов

исполнительной власти субъектов Российской Федерации»,

http://graph.document.kremlin.ru/page.aspx71623676

УДК 004.42

ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ОРГАНОВ ВЛАСТИ, С ИСПОЛЬЗОВАНИЕМ СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ

Митягин Сергей Александрович, начальник отдела разработки информационно-аналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-Петербург,

mitvagin@,iac.spb.ru

Змиевский Александр Федорович, программист отдела разработки информационно-аналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-Петербург,

zmievskiv@iac. spb. ru

Гарадаглы Ильяс Эльмарзаде, программист отдела разработки информационно-аналитических систем, Санкт-Петербургский Информационно-Аналитический Центр, Россия, Санкт-Петербург,

garadaglv@gmail.com

Необходимость создания и интенсивного использования в органах государственной власти и органов местного самоуправления информационных и аналитических отделов и служб является важной задачей, которая непосредственно связана с созданием и поддержанием инструментов информационной поддержки принятия решений. Стало популярным утверждение, что поток информации не поддается никакой системе учета и контроля. Даже эксперты в своей области столкнулись с невозможностью просмотреть все публикации или выступления по любому вопросу. Мы можем говорить только о некотором приближении к полноте [4]. Это обусловливает субъективность анализа информации, так как один человек не может держать в голове всю информацию, необходимую для принятия решений, необходимых в довольно широком диапазоне проблем. Для удовлетворительных решений этих проблем, как правило, используют «штаб-квартиры» или ситуационные центры.

Ситуационный центр располагает текущей оперативной и статистической информацией, предоставленной аналитическими службами различных ведомств, для решения проблемы управления территорией. Деятельность по управлению характеризуются решениями, принятыми соответствующими руководителями: основой управления является решение управляющего, см. рисунок 1.

118

i Надоели баннеры? Вы всегда можете отключить рекламу.