Научная статья на тему 'СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ В СИСТЕМЕ ОБРАБОТКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ В АРКТИЧЕСКОЙ ЗОНЕ РФ'

СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ В СИСТЕМЕ ОБРАБОТКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ В АРКТИЧЕСКОЙ ЗОНЕ РФ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
19
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ / АНАЛИЗ ДАННЫХ / СОЦИОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ / СЦЕНАРНЫЕ ПРОГНОЗЫ РАЗВИТИЯ / ИНФОРМАЦИОННО-СОЦИОЛОГИЧЕСКИЙ ПОЛИГОН

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Барбаков Олег Михайлович, Шагисултанова Вероника Валерьевна, Конев Юрий Михайлович

Представлены результаты анализа применения семантических технологий для извлечения и обработки неявного знания. В рамках предлагаемой методологии создается информационная база данных, представляющая собой совокупности социальных, экономических и социокультурных показателей, агрегируемых в индексы. Информация из такой базы данных служит основой для расчета максимального уровня социального благополучия Арктической зоны РФ. Семантические технологии служат Big Data, и эта методология дает возможность для построения сценарных прогнозов развития Арктической зоны.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Барбаков Олег Михайлович, Шагисултанова Вероника Валерьевна, Конев Юрий Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEMANTIC TECHNOLOGIES IN THE DATA PROCESSING SYSTEM OF SOCIOLOGICAL RESEARCH IN THE ARCTIC ZONEOF THE RUSSIAN FEDERATION

The article presents the results of the analysis of the application of semantic technologies for retrieving and processing implicit knowledge. The proposed methodology creates a database of information representing the total of social, economic, and socio-cultural indicators, aggregated into indices. Information from such a database serves as the basis for calculating the maximum level of social well-being of the Arctic zone of the Russian Federation. Semantic technologies are the basis of Big Data, and this methodology allows for casting of development of the Arctic zone.

Текст научной работы на тему «СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ В СИСТЕМЕ ОБРАБОТКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ В АРКТИЧЕСКОЙ ЗОНЕ РФ»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНОЕ ПРОСТРАНСТВО

INFORMATION TECHNOLOGY AND VIRTUAL SPACE

УДК 316.023.6

СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ В СИСТЕМЕ ОБРАБОТКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ В АРКТИЧЕСКОЙ ЗОНЕ РФ

SEMANTIC TECHNOLOGIES IN THE DATA PROCESSING SYSTEM OF SOCIOLOGICAL RESEARCH IN THE ARCTIC ZONE

OF THE RUSSIAN FEDERATION

О. М. Барбаков, В. В. Шагисултанова, Ю. М. Конев

O. M. Barbakov, V. V. Shagisultanova, Yu. M. Konev

Key words:

Semantic technologies; data analysis; sociological research; Big Data, scenarios development; information and sociological ground

В современном мире все больший вес приобретает применение семантических технологий для извлечения и обработки неявного знания. Активное развитие семантических технологий началось в 2000-х годах. Рождением семантической сети как основы семантических технологий считается публикация статьи «The Semantic Web» Тима Бернерса Ли в журнале «Scientific American». Сегодня существует достаточное количество разработок, несмотря на большую сложность разработки темы.

Информационные системы, которые в своей основе содержат семантические технологии, обычно имеют две разновидности: большие промышленные системы, стоимость разработки которых очень высока, и научные проекты, и гранты, которые в будущем поддерживаются открытым сообществом пользователей. Но в целом применение семантических технологий для обработки данных носит прикладной характер. Одна из почти не затронутых на данный момент разработок в области семантики предметных областей — обработка программами семантического рабочего стола материалов социологического исследования и поддержка процесса написания статей, монографий, диссертаций по социологическому исследованию.

Спрогнозировать, как будет развиваться Арктическая зона РФ в будущем при изменении субъектно-субъектных взаимодействий, является одной из краеугольных проблем в системе управления. Предполагается, что, если изменять различные сочетания показателей, характеризующих основные параметры объектов системы управления, можно добиться повышения эффективности постановки и принятия управленческих решений, и как следствие, решения социально-экономических проблем [1].

Для того чтобы построить сценарные прогнозы развития территорий, необходимо разработать информационную базу, собрав из существующих источников информации

Ключевые слова:

семантические технологии; анализ данных; социологические исследования; Big Data; сценарные прогнозы развития; информационно-социологический полигон

(структурированной и неструктурированной), описывающих социально-экономические проблемы в системе управления.

Фактически на этапе социодиагностики Арктической зоны РФ создается информационная основа системы социально-экономического управления, хранилищем информации в которой будет являться информационная база. В этой базе формируются образы объектов управления, характеризуемые наборами социальных показателей, которые агрегируются в индексы. Наборы образов объектов и социальных, экономических и социокультурных индексов представляют собой информационно-социологические полигоны исходной информации управления.

На таких полигонах проводятся социальные эксперименты, создается система социально-экономического управления на виртуальном пространстве, что позволяет экспериментировать на информационных моделях, осуществлять постановку и решение управленческих задач при выявлении наиболее эффективных альтернатив развития общества в Арктической зоне РФ.

Итак, информационная база формируется по материалам социологических исследований и материалам государственной статистики. Такие данные разноформатные, часто неструктурированные, и необходимы специальные технологии, которые приведут такую информацию в одинаковый формат. Именно семантические технологии и послужили таким инструментарием при обработке и анализе социологической информации Арктической зоны РФ (рис. 1).

Система социальных показателей качества жиэн и (11 блоко»: вс*га ~ 106 показателей )

[-1

m*i,iïm!m9mn!m ШШТЕШЕЗ^Ш

(7 П4К.1

эдодоаь« (30 пин.)

жилииа? lib пек.|

tOUKiflUMX ttpitK>4KK*U»4 и HioinfibHOtt» IB лак.)

рлпрглглрнт* flûtovw, JioipcSfirmiA if накопления {1Î пек.)

Г"

общественный гшрлдйк и безопасность пои.)

Рис. 1. Комплекс социальных показателей качества жизни в международной системе показателей

Методика прогнозных сценариев развития Арктической зоны следующая. Предлагается все социальные показатели агрегировать в индексы. Создаются сценарные прогнозы на основе авторской методологии, в рамках которой изменяются различные социальные показатели, а соответственно, и агрегированные из них индексы, после чего анализируются тенденции изменения других показателей (индексов). Такой анализ дает возможность обоснования оптимального набора индексов с целью достижения высокого коэффициента благополучия Арктической зоны (при максимизации всех сочетаний индексов и показателей).

Можно выделить четыре этапа прогнозирования. Первый этап предполагает определение социальных показателей (индексов), подлежащих изменению, а сами изменения производятся во время второго этапа. Такие изменения вызывают преобразование других социальных показателей (индексов), на третьем этапе рассчитываются альтернативные коэффициенты социального благополучия Арктической зоны [4].

Четвертый этап прогнозов служит для выявления наиболее оптимальных сценарных прогнозов изменения социальных показателей (индексов) и расчета суммарного коэффициента социального благополучия Арктической зоны.

Таким образом, формируются массивы оптимальных совокупностей социальных показателей (индексов), и на их основе можно определить комплекс мероприятий, обеспечивающих повышение социального благополучия Арктической зоны РФ. Каждый индекс характеризуется набором специфических шкал измерения, совокупностью социальных показателей, границами, тенденциями изменения и т. п. В свою очередь, определенные совокупности индексов создают критерии социального благополучия. В многомерном пространстве показателей в виртуальной реальности формируется множество образов, каждый из которых характеризуется так называемым прямым целевым свойством: коэффициентом социального благополучия, различающимся по уровню от низкого значения до высокого. Это дает возможность рассчитать идеальный уровень социального благополучия Арктической зоны РФ, который определяется набором так называемых косвенных свойств: социальных, экономических, социокультурных показателей.

При постановке и решении управленческой задачи обосновываются связи между совокупностями показателей (индексов) и коэффициента (уровня) социального благополучия Арктической зоны на информационно-социологическом полигоне, что дает возможность спрогнозировать этот уровень социального благополучия по изменяющимся наборам социальных признаков.

В качестве методологии построения сценарных прогнозов предлагается использовать специальную технологию распознавания образов, которая уже успешно уже использовалась при решении аналогичных задач в аналогичных условиях, но в других областях человеческого знания, когда невозможно создать стройную теорию, а представления об объектах и моделях достаточно неопределе ны.

Кроме этого, на информационно-социологическом полигоне применяются методы интеллектуального анализа данных (Data Mining), в том числе нейронные сети и машинное обучение для формирования образов социального благополучия Арктической зоны. Индекс социального благополучия находится как интегральный из трех блоков показателей: социального, экономического и экологического (рис. 2 и 3).

Социальные индексы

Численность ЦИнденс социального рмкнтня

iowww

нулвгур* I беэопэсмскть

ДВМИ№Н

>i»uHH£i:rt^H Пежтупн.хи I Pjjb'Mf

Ь*.эравотицв-

Медицина

ФшиисГ ИЛИ

Рис. 2. Социальный блок показателей

Рис. 3. Экологически блок показателей

Экономическая подсистема в модели представлена в разрезе межотраслевых взаимодействий, что влияет не только на полноту описания экономической подсистемы, но и на описание ее взаимодействия с социальной и экологической подсистемами.

Таки образом, формируется структура информационной базы исходных показателей социально-экономического развития Арктической зоны. При этом используются платформы SQL Server и SAP, программное обеспечение Open source (Python, R и др.)

На информационно-социологических полигонах строятся образы индекса социального благополучия Арктической зоны: от высокого до низкого (рис. 4).

Г|лугши|*чиА noKjUPf/tcA и-|

полигона*

Формирование ÛC|>JI<>B Н-1 полигонах по икдгнч.зм

Г1о< Г роем* йСр,мй* сериального йлакиюлучия

ОСрло^о^+льнагон^де»« в fHj*jij гелей

1

\

LlGllJïbl HHj^c-HLJLÙU.LU- nHijfHj

вмгеОЙЛУНИИ в ДПуИер-О*! Г1рОС Гр-IHC ГВО Иь^Д^СО*.

" I ■ 11 и I MI ■ Éd JnJria:

Рис. 4. Образы индекса социального благополучия Арктической зоны РФ в двумерном пространстве

Была поставлена задача повысить уровень социального благополучия, в частности увеличить социальный, экономический, экологический индексы.

Задача решается при проведении социальных экспериментов на виртуальных информационно-социологических полигонах путем прогнозирования (интеллектуальный анализ данных, нейронные сети, методика распознавания образов) оптимальных сочетаний исходных показателей, из которых формируются соответствующие индексы, для того чтобы достичь максимального уровня социального благополучия на территориях Арктической зоны [2].

В дальнейшем будут сформированы прогнозные сценарии социально-экономического развития Арктической зоны: оптимистический, вероятностный, пессимистический и предложены меры по реализации.

В основе использования результатов социологических исследований лежат семантические технологии.

Стоимость разработки больших приложений, которые так или иначе реализуют семантические технологии, очень высока.

В настоящее время в научном сообществе для исследования получило развитие использование программного обеспечения (ПО) с открытым исходным кодом — Open-Source. Модель OpenSource разработки использования ПО похожа на процесс научных исследований. Автор ПО предоставляет его вместе с исходным кодом в открытый доступ, а другие участники разработки исправляют и дополняют исходный код ПО, чтобы улучшить его работу и расширить его возможности. Поэтому за основу разрабатываемой информационной системы было решено взять готовую информационную среду для управления знаниями NEPOMUK, предоставляемую на основе лицензии OpenSource.

Сетевая среда основанного на онтологиях персонализированного управления едиными знаниями (Network Environment for Personalized, Ontology-based Management of Unified Knowledge, NEPOMUK) — это проект, разработанный консорциумом NEPOMUK, в который входят такие известные малые и большие производственные и научные предприятия, как IBM, DFKI, SAP и др., как комплексное решение для расширения традиционной модели рабочего стола пользователя в среду поддержки управления личной информацией, совместной работы, а также обмена данными. Такая модель называется семантическим социальным рабочим столом (Social Semantic Desktop (SSD)).

Рис. 5. Алгоритм обработки данных в информационной системе Арктической зоны РФ

SSD поддерживает личные аспекты работы со знанием с помощью разработанных инструментов его структуризации и визуализации путем предоставления интерфейсов и структур данных из персонализированного семантического веба, а также поддержку процессов работы пользователя.

Социальный семантический рабочий стол также поддерживает социальные коммуникации помощью инструментов совместной работы, предоставляет решения для распределенного поиска, хранения информации в семантических социальных сетях и обмена знаниями.

Концепция SSD базируется на трех ключевых понятиях: семантическая сеть (Semantic Web), Р2Р-технологии, социальные сети (Social Networking) [3].

Семантические технологии предоставляют возможность данные о социально-экономической ситуации в Арктической зоне РФ, находящиеся в открытом доступе, и результаты социологических исследований, неоднородные по своей структуре, преобразовать в единый приемлемый для информационной системы формат обработки.

Таким образом, разработка информационной системы Арктической зоны РФ потребовала изучения проблем информатизации социологического исследования, которые заключаются в необходимости использования неформализованных данных, оперативного доступа к информации (рис. 5), а также проблему кодификации элементов неструктурированного массива текстовых данных.

Библиографический список_

1. Barbakov O. M., Kiselyov V. G. Methodology of carrying out social experiments in virtual space // Tyumen State University Herald. - 2012. - № 8. - Р. 55-60.

2. Barbakov O. M., Belonozhko M. L., Siteva S. S. Higher Education Quality Management in Virtual Space of a Regional Higher Educational Institution // Mediterranean Journal of Social Sciences MCSER. - 2015. - Vol. 6. - # 3S5 - P. 249-254.

3. OSCAF\NEPOMUK Ontologies // Nepomuk Consortium. - Режим доступа: http://www.semanticdesktop.org/ontologies

4. The Virtual Space Simulation of the Regional Governance System / O. M. Barbakov [et al.] // International Journal of Economics and Financial. - 2016. - Issues 6(S5). - P. 72-79._

Сведения об авторах Барбаков Олег Михайлович, д. социол. н., профессор, заведующий кафедрой бизнес информатики и математики, Тюменский индустриальный университет, г. Тюмень, тел. 89088747513, e-mail: omb@bk.ru

Шагисултанова Вероника Валерьевна, заведующий лабораторией системного анализа и программирования Технополиса, Тюменский индустриальный университет, тел. 89068757490, e-mail: shagisultanovavv@tyuiu.ru Конев Юрий Михайлович, д. социол. н., профессор, депутат Тюменской областной думы, г. Тюмень, тел. 89199534069, e-mail: konew13@mail.ru

Information about the authors

Barbakov O. M., Doctor of Sociology, Professor, Head of the Department of Business Informatics and Mathematics, Industrial University of Tyumen, phone: 89088747513, e-mail: omb@bk.ru

Shagisultanova V. V., Head of the laboratory System Analyze and Programming, of Technopolis, Industrial University of Tyumen, phone: 89068757490, e-mail: shagisultanovavv@tyuiu.ru

Konev Yu. M., Doctor of Sociology, Professor, Deputy of the Tyumen Regional Duma, phone: 89199534069, e-mail: konew13@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.