Научная статья на тему 'Построение глоссариев культурологических канонов кибер-социальных групп в социальных сетях'

Построение глоссариев культурологических канонов кибер-социальных групп в социальных сетях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
127
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЛОССАРИЙ / СОЦИАЛЬНЫЕ СЕТИ / КИБЕР-СОЦИАЛЬНЫЕ ГРУППЫ / АНАЛИТИЧЕСКИЙ МОНИТОРИНГ / ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ / ТЕРРОРИСТИЧЕСКАЯ УГРОЗА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Александров В. В., Кулешов С. В., Зайцева А. А.

В статье рассматривается подход к решению проблемы повышения эффективности противодействия информационным террористическим угрозам в социальных сетях. Предлагается методология определения источников угрозы на основе мониторинга социальных сетей путем построения глоссариев культурологических канонов кибер-социальных групп и их анализа на наличие деструктивных мемов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Построение глоссариев культурологических канонов кибер-социальных групп в социальных сетях»

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №12-2/2016 ISSN 2410-6070_

числовые зависимости, а не лежащие в их основе причинные связи [3]. Итак, для модели прогнозирования толщины стены резервуара в результате проведения множественной регрессии, зависимая переменная № 3 «Толщина стены» представима следующим образом: х3=П,83977+0,197 х1-0,13х2+0,606 х4-1,2х5, где x3 - прогнозируемая толщина стены, мм; x1 - плотность продукта, кг/м3; x2 - уровень взлива; x4 - расчетное сопротивление стали; x5 - время эксплуатации резервуара.

Таким образом, можно констатировать, что физическое объяснение воздействия различных факторов на скорость утонения стенки резервуаров получило количественную оценку влияния каждого фактора. Построение модели для оценки толщины стены резервуара на основе данных производственного мониторинга является весьма актуальной задачей, так как позволяет установить обоснованные сроки проведения технической диагностики, снизить материальные затраты, связанные с простоем резервуаров во время ремонтных работ, оперативно проводить оценку ресурса безопасной эксплуатации резервуаров. Полученная модель может использоваться для оценки скорости коррозии и остаточного ресурса РВС, что обеспечит эффективное управление ресурсом безопасной эксплуатации резервуаров для хранения нефтепродуктов.

Список использованной литературы:

1. Оценочный расчет скорости утонения стенок стальных резервуаров / О. А. Макаренко, В. В. Кравцов, И. А. Лакман и др. // Проблемы сбора, подготовки и транспорта нефти и нефтепродуктов. - 2009. -Выпуск 3(77). - С. 56-62.

2. Байков И.Р., Смородова О.В., Костарева С.Н. Прогностическая модель эмиссии вредных веществ в выхлопных газах ГТУ. Известия высших учебных заведений. Проблемы энергетики. 2004. № 1-2. С. 122-128.

3. Костарева С.Н. Совершенствование методов диагностирования технического состояния газоперекачивающих агрегатов на основе данных производственного мониторинга. Диссертация на соискание ученой степени кандидата технических наук / Уфимский государственный нефтяной технический университет. Уфа, 2004.

© Семенюк Д.Ю., Актуганова А.М., 2016 г.

УДК 004.912:004.02

В.В. Александров, д.т.н., проф. гл.н.с., Санкт-Петербургский институт информатики и автоматизации РАН

г. Санкт-Петербург, РФ С.В. Кулешов, д.т.н.

зав. лаб., Санкт-Петербургский институт информатики и автоматизации РАН

г. Санкт-Петербург, РФ А.А. Зайцева, к.т.н.

с.н.с., Санкт-Петербургский институт информатики и автоматизации РАН

г. Санкт-Петербург, РФ

ПОСТРОЕНИЕ ГЛОССАРИЕВ КУЛЬТУРОЛОГИЧЕСКИХ КАНОНОВ КИБЕР-СОЦИАЛЬНЫХ ГРУПП В СОЦИАЛЬНЫХ СЕТЯХ

Аннотация

В статье рассматривается подход к решению проблемы повышения эффективности противодействия

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №12-2/2016 ISSN 2410-6070_

информационным террористическим угрозам в социальных сетях. Предлагается методология определения источников угрозы на основе мониторинга социальных сетей путем построения глоссариев культурологических канонов кибер-социальных групп и их анализа на наличие деструктивных мемов.

Ключевые слова

Глоссарий, социальные сети, кибер-социальные группы, аналитический мониторинг, информационная безопасность, террористическая угроза

Введение

Проблема информационной безопасности сегодня все еще преподносится в большей степени как инженерно-техническая, структурно-организационная и технологическая дисциплина. Самые совершенные научные и технологические разработки касаются программ криптографии, стеганографии, защиты от несанкционированного пользования. Эта информационная защита не имеет ничего общего с защитой информационного общества от общественно опасных информационных потоков и наоборот, информационных потоков от случайного или намеренного вмешательства некоторых членов общества [14].

Пользователей, которые используют Интернет, чтобы получить доступ к уточняющей информации согласно исследованиям [5] немного, большинство людей верят информации с тех сайтов, с которыми согласны в принципе. Социальные сети - их эхо, динамично и наиболее оперативно отражающие изменения, и эффекты, в общественном мнении. Один из наиболее ярких эффектов, находящихся на стыке психологии общественного сознания и медиатехнологий - распространение теорий заговора. Примером таких эффектов являются потеря значимости или утрата доверия к реальным фактам. Другим эффектом является то, что социальные сети вместо вовлеченности, ведут к изоляции и к новым способам доступа к информации: никто ничего не читает, листают, боковым зрением или за секунды просматривают что-то и переходят на другое [5]. Результатом подобной тенденции является необходимость усиленного (вплоть до агрессивного) мониторинга социальных сетей на предмет выявления разного рода информационных угроз.

Потенциально опасные сведения легко найти на сайтах социальных сетей, микроблогов и сообществ Интернет [6]. Прогресс электронных технологий получения и распространения информации вызывает потребность в создании технологии обеспечения безопасности информационного общества [1-2].

Рост количества доступных в Интернет ресурсов сопровождается появлением в свободном доступе материалов потенциально опасного содержания: призывы к незаконным действиям, пособия «начинающего террориста», изображения порнографического характера и другие нежелательные материалы [4].

Одной из главных задач, решаемых разрабатываемым подходом, является построение кадастра предметной области (структуры данных, заданных в виде графа семантических связей между понятиями предметной области), задающего область интереса в форме, пригодной для дальнейшего мониторинга с целью раннего обнаружения террористических угроз, выявления смены настроений в различных социальных группах, в зависимости от возраста, социального положения, местожительства и т.д [7].

Для этого к контенту, генерируемому пользователями в различных группах и сообществах социальных сетей, применяется ассоциативно-онтологический подход, на основе которого разработан метод автоматического самореферирования в сочетании с использованием аналитической системы мониторинга электронных СМИ применительно к анализу социальных сетей [8-10].

Дополнительно использование мониторинга электронных СМИ позволяет выявлять зависимости между людьми и событиями, а также круг актуальных, по версии общественного мнения, вопросов. Теоретически с увеличением объемов новостных текстов увеличивается точность их семантического анализа и повышается релевантность результатов поиска [10].

Методология оценки террористической угрозы на основе мониторинга социальных сетей

Разрабатываемая методология оценки террористической угрозы на основе мониторинга социальных

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №12-2/2016 ISSN 2410-6070_

сетей основана на двухэтапной итерационной процедуре.

На первом этапе производится автоматическое составление глоссариев кибер-социальных групп («пабликов» и «групп» в социальных сетях). Периодическое сопоставление актуальных глоссариев с заранее выявленными глоссариями, определяющими культурологические каноны, можно выявлять кибер-социальные группы, содержащие потенциально-опасную информационную активность. В качестве дополнительной проверки групп могут быть использованы глоссарии, составленные экспертно, и содержащие понятия, относящиеся к лексике лиц, представляющих террористическую угрозу.

На втором этапе выполняется построение кадастра кластеризации отдельных групп участников выявленных на первом этапе потенциально-опасных кибер-социальных групп на основе анализа показателей их взаимодействия: наличие связей «друг» или «подписчик», наличие общих веток обсуждений (тредов), факты многократной реакции на ответы (посты) конкретных авторов, многократные цитирования и репосты одних и тех же авторов. Представление в виде графа отношений выявленных связей можно считать кадастром кластеризации групп участников, а центры выявленных групп, состоящих из одного или нескольких участников вносить в список лиц, представляющих потенциальную угрозу с дальнейшим агрессивным мониторингом их киберактивности.

Существует группа подходов автоматизированного построения онтологий [11-16], которые базируются на поиске структур по шаблонам в предопределенной структуре.

В отличие от них, в разработанном подходе производится ассоциативное формирование онтологий в процессе работы системы, а также использование в качестве понятийного графа - графа ассоциативных связей, формируемого непосредственно на самих текстах тематической антологии [8].

Мониторинг социальных сетей позволяет оперативно включать в поисковую базу все изменения контента. При этом реализуется возможность при оперативном поиске с использованием заданного запроса также получать список групп по тематикам, ассоциативно связанным с заданной.

Система построения глоссариев культурологических канонов (семантических окружений)

Для разработки системы построения глоссариев культурологических канонов социальных групп используется разработанная в [8] модель динамической визуальной понятийно-терминологической информационной системы

Для экспериментальной проверки разрабатываемой системы проведен обзор существующих популярных социальных сетей, блогов и микроблогов как возможных зон поиска ассоциаций. Выявлено, что большинство пользователей русскоязычных социальных сетей зарегистрированы сразу в нескольких сетях, причем сеть VK.com (ВКонтакте) наиболее популярна (в ней ежедневно присутствует наибольшее количество зарегистрированных пользователей). Таким образом, на первом этапе можно ограничить зону поиска ассоциаций именно этой социальной сетью, как наиболее многочисленной по количеству пользователей и представленных социальных групп. Кроме того, VK.com имеет достаточно большое количество тематических сообществ, что представляет интерес для использования разрабатываемых электронных глоссариев культурологических канонов применительно к поиску и обнаружению разного рода угроз, в том числе террористических. Дополнительным преимуществом является наличие социальных групп, сформированных не только по тематическим, но и по территориальным признакам. Таким образом, можно осуществлять работу по поиску и предотвращению угроз в конкретных мегаполисах.

Функциональная схема разрабатываемой системы представлена на рисунке 1.

Разрабатываемая система построена по модульной архитектуре. В структуре системы необходимыми модулями являются: модуль анализа текста, модуль исключения стоп-слов, модуль морфологического анализа для проверки эквивалентности слов, модуль циклической загрузки документов, модуль чтения формата, модуль базы данных, и модули сторонних библиотек и компонентов, обеспечивающие работоспособность системы.

В результате формирования ассоциативных связей автоматически выделяются тезаурусы и соответствующий им глоссарий, присущий конкретной социальной группе. Тезаурусы обладают свойством отражать наиболее характерные особенности языка участников рассматриваемой социальной группы. Кроме

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №12-2/2016 ISSN 2410-6070

того выделяются ассоциативные отношения.

Рисунок 1 - Функциональная схема системы генерации глоссариев культурологических канонов

Методы автоматической загрузки веб-страниц с динамическим контентом, характерных для современных технологий создания движков социальных сетей, целесообразно совмещать с анализом и разбором формата HTML-страниц и реализовывать на базе ядер стандартных браузеров (в том числе библиотек хедлесс-браузеров). Это позволяет полностью эмулировать все функции обычного браузера и не привлекать внимания владельцев сайтов нестандартным поведением бота-парсера. Кроме того, библиотеки хедлесс-браузеров, используя ядра популярных браузеров, периодически обновляются и поддерживают набор актуальных технологий.

Заключение

В результате выполненных исследований предложены методы автоматической загрузки веб-страниц с динамическим контентом, содержащимся в ряде популярных российских социальных сетей, методы анализа (парсинга) текстового содержания на основе ассоциативно-онтологического подхода, методы хранения и обработки данных ассоциативных глоссариев в виде семантической сети.

Предлагаемое в работе построение глоссариев культурологических канонов и деструктивных мемов предметно-тематических групп социальных сетей отличается использованием динамической визуализации онтологического окружения словаря предметной области.

Методы анализа (парсинга) текстового содержания в предлагаемой системе разработаны на основе ассоциативно-онтологического подхода [17]. Результаты работы парсера сохраняются в виде списка значимых терминов (глоссария) и списка ассоциативных связей между терминами с указанием их веса.

В дальнейшей работе планируется применение методов кластеризации на основе ранговых предпочтений и ассоциативно-категориального поиска в информационно-социальных сетях с целью оценки

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №12-2/2016 ISSN 2410-6070_

степени террористической угрозы.

Исследование выполнено при частичной поддержке РФФИ (проект № 16-29-09482). Список использованной литературы

1. Юсупов Р.М. Наука и национальная безопасность. - СПб, Наука, 2011. - 376 с.

2. Осипов В.Ю. Проблемы противодействия информационному вандализму, криминалу и терроризму / Национальная безопасность/ nota bene, 2009, № 5-6, с. 80-85

3. Osipov V., Ivakin Y. Terrorists: Statistical Profile / Information Fusion and Geographic Information Systems -Proceedings of the 4th International Workshop, "IF and GIS 2009", 2009. pp. 241-250

4. Александров В.В., Кулешов С.В., Куценко С.А., Колесников Р.А. Информационная безопасность мультимедийных технологий // Информационно-измерительные и управляющие системы. 2013, т.11, №9. С.3-16

5. Ханенкова Е. Ноам Хомский о политическом моменте в США // URL: http://ostkraft.ru/ru/articles/1801 (дата обращения: 08.12.2016)

6. С.Ю. Жданова, С.Л. Мишланова, В.Б. Поляков, Е.А. Рабчевский. Особенности репрезентации этнической агрессии в корпусе сообщений Пермского сегмента социальной сети «Вконтакте» (vk.com) // Вектор науки ТГУ. 2012. №4(11). С. 246-248

7. Александров В.В., Зайцева А.А. Разработка подходов к определению культурологических канонов различных социальных групп на основе методов аналитического самореферирования // Материалы юбилейной XV Санкт-Петербургской международной конференции «Региональная информатика - 2016», СПб, 2016, С.283.

8. Кулешов С.В. Разработка автоматизированной системы семантического анализа и построения визуальных динамических глоссариев. // Диссертация на соискание ученой степени кандидата технических наук. Санкт-Петербург. 2005. 100 с.

9. Александров В.В., Воробьев В.И., Кулешов С.В, Левоневский Д.К., Марков В.С., Фаткиева Р.Р., Юсупов Р.М. Формирование и развитие информационной инфраструктуры инновационного развития Санкт-Петербурга / в монографии «Перспективные направления развития науки в Петербурге» / отв. Ред. Ж.И. Алферов, О.В. Белый, Г.В. Двас, Е.А. Иванова. - СПб.: Изд-во ИП Пермяков С.А., 2015. - 543 с. Ю.Александров В.В., Кулешов С.В. Аналитический мониторинг Internet контента. Инфологический подход. // Качество. Инновации. Образование. 2008. № 3. с. 68-70

11.Оробинская Е.А. Метод автоматического построения онтологии предметной области на основе анализа лингвистических характеристик текстового корпуса // Интернет и современное общество (IMS-2012): Труды XV Всероссийской объединенной конференции (Санкт-Петербург, 2012 г.). - Санкт-Петербург, 2012. - С. 209-212

12.A.V. Smirnov, M. Pashkin, N. Chilov, T. Levashovа. Intelligent Manufacturing Cover image Agent-based support of mass customization for corporate knowledge management. // Engineering Applications of Artificial Intelligence. 2003. Vol. 16, Is. 4, pp. 349-364.

13.Smirnov, T. Levashova, N. Shilov. Patterns for context-based knowledge fusion in decision support systems. // Information Fusion. 2015. Vol. 21, pp. 114-129.

14.Xhemal Zenuni, Bujar Raufi, Florije Ismaili, Jaumin Ajdari. State of the Art of Semantic Web for Healthcare. // Procedia — Social and Behavioral Sciences. 2015. V. 195. pp. 1990-1998.

15.Hongjae Kima, Sanggil Kangb, Sangyoon Oha. Ontology-based quantitative similarity metric for event matching in publish/subscribe system // Neurocomputing. 2015. Vol. 152. Pp. 77-84.

16.Sharifullah Khan, Muhammad Safyan. Semantic matching in hierarchical ontologies. // Journal of King Saud University. Computer and Information Sciences. 2014. Vol. 26. Is. 3. pp. 247-257.

17.Кулешов С.В., Зайцева А.А., Марков В.С. Ассоциативно-онтологический подход к обработке текстов на естественном языке // Интеллектуальные технологии на транспорте. 2015. №4.

© Александров В.В. , Зайцева А.А. , Кулешов С.В. , 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.